HC2 – Statistiek in vogelvlucht
description
Transcript of HC2 – Statistiek in vogelvlucht
HC2 – Statistiek in vogelvlucht
PAOG - SPSS cursus 25 augustus & 1 september 2014
PAOG SPSS cursus – afdeling epidemiologie, biostatistiek en HTA
PAOG-SPSS HC2
Menubalk <Analyze> (Analyseren)
•<Descriptive statistics>: beschrijvende statistiekKruistabellen
•<Compare means>: Gemiddelden vergelijken T-testen Enkelvoudige variantieanalyse
•<General Linear Models> Algemene Lineaire Modellen
(Meervoudige) variantieanalyse (Meervoudige) regressieanalyse Covariantie analyse
•<Correlate>: correlatiecoefficienten
•<Regression > (Multiple) lineaire regressie
Logistische regressie
•<Non parametric tests>
•<Survival>
PAOG-SPSS HC2
t-test
t-test voor twee onafhankelijke groepen
•Vergelijkt gemiddelde in twee groepen met elkaar
•Aanname: afhankelijke variabele normaal verdeeld in beide groepen
Gepaarde t-test
•Bekijkt of verschil tussen twee gepaarde waarnemingen afwijkt van 0
•Aanname: verschil is normaal verdeeld.
PAOG-SPSS HC2
T-test (output t-test twee onafh. steekproeven)
Group Statistics
212 102.3491 4.48281 .30788
184 102.3424 4.37793 .32275
Geslachtman
vrouw
Initiele bloeddrukN Mean Std. Deviation
Std. ErrorMean
Independent Samples Test
.637 .425 .015 394 .988 .00667 .44679 -.87173 .88506
.015 388.546 .988 .00667 .44604 -.87030 .88363
Equal variancesassumed
Equal variancesnot assumed
Initiele bloeddrukF Sig.
Levene's Test forEquality of Variances
t df Sig. (2-tailed)Mean
DifferenceStd. ErrorDifference Lower Upper
95% ConfidenceInterval of the
Difference
t-test for Equality of Means
PAOG-SPSS HC2
T-test (output gepaarde t-test)
Paired Samples Statistics
92.1086 396 7.47288 .37553
88.4848 396 4.73792 .23809
Gemiddeldebloeddruk op t1
Gemiddeldebloeddruk op t0
Pair1
Mean N Std. DeviationStd. Error
Mean
Paired Samples Test
3.62374 7.46688 .37522 2.88605 4.36142 9.658 395 .000Gemiddelde bloeddrukop t1 - Gemiddeldebloeddruk op t0
Pair1
Mean Std. DeviationStd. Error
Mean Lower Upper
95% ConfidenceInterval of the
Difference
Paired Differences
t df Sig. (2-tailed)
PAOG-SPSS HC2
Kruistabellen
PAOG-SPSS HC2
Kruistabellen (vervolg 1)
PAOG-SPSS HC2
Kruistabellen (vervolg 2: samenvatting)
Relatie tussen twee nominale variabelen
Toets: Chi-kwadraat
Indien 2x2 tabel: Odds ratio of relatief risico
•Case-control design – OR (benadering RR)
•Cohort design - RR
Enkelvoudige variantieanalyse(Een verklarende variabele)
RookgedragGemiddelde Bloeddruk
(mm Hg)
Roker 76.23
Ex Roker 78.16
Nooit roker 77.85
PAOG-SPSS HC2
PAOG-SPSS HC2
Enkelvoudige variantieanalyse (vervolg 1)
Afhankelijke variabele: continu; normaal verdeeld
Onafhankelijke variabele: nominaal
Eenvoudigste geval: t-test (twee groepen)
Begrippen:
•Percentage verklaarde variantie (R2)
<analyze><compare means><one-way anova> of
<analyze><general linear models><univariate>
Meervoudige Variantieanalyse(Meerdere verklarende variabelen)
PAOG-SPSS HC2
Gemiddelde Bloeddruk (mm Hg)
Rookgedrag
Roker Ex roker Nooit roker
Geslacht
Man 77.85 79.59 79.29
Vrouw 74.98 76.73 76.43
PAOG-SPSS HC2
Meervoudige variantieanalyse (vervolg 1)
Afhankelijke variabele (continu) wordt verklaard uit meerdere onafhankelijke (nominale) variabele.
Onafhankelijke variabele: nominaal
Effect onafhankelijke variabelen voor elkaar gecorrigeerd
<analyze><general linear models><univariate>
PAOG-SPSS HC2
Meervoudige variantieanalyse (vervolg 2)
Tests of Between-Subjects Effects
Dependent Variable: Diastolische bloeddruk (mm Hg)
1204.837a 3 401.612 3.433 .017
2885480.799 1 2885480.799 24666.971 .000
1002.834 1 1002.834 8.573 .004
308.765 2 154.383 1.320 .268
58137.821 497 116.978
3055236.000 501
59342.659 500
SourceCorrected Model
Intercept
v2
v11
Error
Total
Corrected Total
Type III Sumof Squares df Mean Square F Sig.
R Squared = .020 (Adjusted R Squared = .014)a.
V2 = geslacht; v11 = rookgedrag
PAOG-SPSS HC2
Meervoudige variantieanalyse (vervolg 3)
V2 = geslacht; V11 = rookgedrag
Between-Subjects Factors
Vrouw 249
Man 252
Roker 215
Ex roker 132
Nooit roker 154
0
1
Geslacht
1
2
3
Rookgedrag
Value Label N
Parameter Estimates
Dependent Variable: Diastolische bloeddruk (mm Hg)
79.296 1.057 75.028 .000 77.219 81.372
-2.868 .979 -2.928 .004 -4.792 -.943
0a . . . . .
-1.444 1.157 -1.248 .213 -3.718 .829
.298 1.288 .231 .817 -2.233 2.829
0a . . . . .
ParameterIntercept
[v2=0]
[v2=1]
[v11=1]
[v11=2]
[v11=3]
B Std. Error t Sig. Lower Bound Upper Bound
95% Confidence Interval
This parameter is set to zero because it is redundant.a.
PAOG-SPSS HC2
Enkelvoudige Regressieanalyse
<analyze><regression><linear>
Vergelijking (model): Y = aX + b
Y: Afhankelijke variabele: wordt voorspeld (continue variabele: normaal verdeeld)
X: Onafhankelijke (continue) variabele: voorspelt Y
a: richtingscoëfficiënt; b: constante
Belangrijke begrippen:
•Residuele spreiding (fout in voorspelling)
•Percentage verklaarde variantie (R2)
Enkelvoudige regressieanalyse (vervolg 1)(Regressielijn + predictie-interval)
PAOG-SPSS HC2
PAOG-SPSS HC2
Enkelvoudige regressieanalyse (vervolg 2)Model Summary
.198a .039 .037 10.690Model1
R R SquareAdjustedR Square
Std. Error ofthe Estimate
Predictors: (Constant), Leeftijd in jarena.
ANOVAb
2318.121 1 2318.121 20.285 .000a
57024.538 499 114.278
59342.659 500
Regression
Residual
Total
Model1
Sum ofSquares df Mean Square F Sig.
Predictors: (Constant), Leeftijd in jarena.
Dependent Variable: Diastolische bloeddruk (mm Hg)b.
Coefficientsa
66.232 2.510 26.390 .000
.318 .071 .198 4.504 .000
(Constant)
Leeftijd in jaren
Model1
B Std. Error
UnstandardizedCoefficients
Beta
StandardizedCoefficients
t Sig.
Dependent Variable: Diastolische bloeddruk (mm Hg)a.
PAOG-SPSS HC2
Meervoudige (multiple) regressieanalyse
Model: Y = a1x1 + a2x2 + … + anxn + b
Afhankelijke variabele (continu) wordt verklaard uit meerdere onafhankelijke continue variabelen
Effect onafhankelijke variabelen voor elkaar gecorrigeerd
Meerdere voorwaarden, waaronder:
•Residuen normaal verdeeld
PAOG-SPSS HC2
Multiple regressieanalyse (vervolg 1)Model Summary
.349a .122 .119 10.228Model1
R R SquareAdjustedR Square
Std. Error ofthe Estimate
Predictors: (Constant), Quetelet index (Kg/m*m),Leeftijd in jaren
a.
ANOVAb
7243.906 2 3621.953 34.621 .000a
52098.753 498 104.616
59342.659 500
Regression
Residual
Total
Model1
Sum ofSquares df Mean Square F Sig.
Predictors: (Constant), Quetelet index (Kg/m*m), Leeftijd in jarena.
Dependent Variable: Diastolische bloeddruk (mm Hg)b.
Coefficientsa
50.019 3.369 14.848 .000
.228 .069 .142 3.310 .001
.810 .118 .294 6.862 .000
(Constant)
Leeftijd in jaren
Quetelet index (Kg/m*m)
Model1
B Std. Error
UnstandardizedCoefficients
Beta
StandardizedCoefficients
t Sig.
Dependent Variable: Diastolische bloeddruk (mm Hg)a.
PAOG-SPSS HC2
Algemene lineaire modellen(General Linear Models)
Afhankelijke variabele: Continu.
Omvatten:
•(Meervoudige) regressie-analyse
•(Meervoudige) variantie-analyse
•Covariantie-analyse
•Onafhankelijke variabelen nominaal én/of continu
Welke procedures in SPSS
•-General Linear Models, -univariate voor:
•Regressie- variantie- en covariantie-analyse
•-Regression, -linear voor:
•Regressie analyse
•(Ook andere: oa logistische regressie via -binary logistic)
Logistische regressieanalyse
Vraag: wordt kans op uitval in vierdaagse bepaald door:
• Gelopen aantal km (30, 40 of 50) (cat)
• Geslacht (cat)
• Aanwezigheid metabool syndroom (cat)
• Leeftijd (continu)
PAOG-SPSS HC2
PAOG-SPSS HC2
Logistische regressieanalyse (vervolg 1)
Afhankelijke variabele: binair of dichotoom (2 uitkomstmogelijkheden)
Onafhankelijke variabele(n): kan van alles zijn
•indien discrete onafhankelijke variabele(n) = analyse kruistabel (OR)
•Veel (verschillende type) variabelen in model mogelijk (vb confounder correctie)
Voordelen
•Geen voorwaarde t.a.v. de onafhankelijke variabelen
•Regressiecoëfficiënten kunnen geïnterpreteerd worden als OR
Logistische regressieanalyse (Vervolg 2)
PAOG-SPSS HC2
Dependent variable: Completed Four Days MarschesDependent Variable Encoding
Original Value Internal Value
Yes 0
No 1
Categorical Variables Codings
Parameter coding
Frequency (1) (2)
Distance walked (30, 40 or 50 kilometers)
30 369 .000 .000
40 1622 1.000 .000
50 662 .000 1.000
Gender Male 1441 1.000
Female 1212 .000
Metabolic syndrome present No 2570 .000
Yes 83 1.000
Logistische regressieanalyse (Vervolg 3)
PAOG-SPSS HC2
Omnibus Tests of Model Coefficients
Chi-square df Sig.
Step 1 Step 11.604 5 .041
Block 11.604 5 .041
Model 11.604 5 .041
Block 1: Method = Enter
Variables in the Equation
B S.E. Wald df Sig. Exp(B)
Step 1a metabolic(1) .425 .409 1.076 1 .300 1.529
Distance 5.119 2 .077
Distance(1) .473 .281 2.836 1 .092 1.605
Distance(2) .672 .298 5.104 1 .024 1.959
Gender(1) .333 .180 3.419 1 .064 1.395
age .000 .001 .040 1 .842 1.000
Constant -3.373 .293 132.616 1 .000 .034
a. Variable(s) entered on step 1: metabolic, Distance, Gender, age.
Kaplan-Meier overlevingsanalyse(Survival curve = overlevingscurve)
PAOG-SPSS HC2
In SPSS: <analyze><survival><kaplan-meier>
PAOG-SPSS HC2
Belangrijke termen / karakteristieken
“Overleving” kan van alles zijn•Sterfte (mortaliteit)
•Optreden ziekte (morbiditeit)o Afstoting donororgaano Optreden allergische reactie tegen medicijn
Overleving wordt berekend tot optreden “event” of “censurering”Censurering: incomplete follow-up ten gevolge van:
•bereiken afsluitdatum onderzoek
•sterfte tgv andere oorzaak
•verhuizing
•verwijdering uit oz op verzoek patiënt
•… wat dan ook… dan wordt de tijd “at-risk” meegenomen
PAOG-SPSS HC2
Kaplan-Meier analyse
Benodigd voor berekeningen:
•Variabele die tijdstip (dag, week) van “failure ( = event)” of censurering voor elke patiënt aangeeft.
•Variabele die aangeeft of de gebeurtenis is opgetreden, of lost to follow-up.
•Eventueel: Variabele die verschillende strata definieert (indien groepen vergeleken moeten worden)
Berekeningen:
•Kans op “dood” (aantal events/aantal patiënten)
•1- (kans op “dood”)
•Cumulatieve kans op ”niet-dood” (overleving)