HC2 – Statistiek in vogelvlucht

27
HC2 – Statistiek in vogelvlucht PAOG - SPSS cursus 25 augustus & 1 september 2014 PAOG SPSS cursus – afdeling epidemiologie, biostatistiek

description

PAOG - SPSS cursus 25 augustus & 1 september 2014. HC2 – Statistiek in vogelvlucht. PAOG SPSS cursus – afdeling epidemiologie, biostatistiek en HTA. Menubalk (Analyseren). : beschrijvende statistiek Kruistabellen : Gemiddelden vergelijken - PowerPoint PPT Presentation

Transcript of HC2 – Statistiek in vogelvlucht

Page 1: HC2 – Statistiek in vogelvlucht

HC2 – Statistiek in vogelvlucht

PAOG - SPSS cursus 25 augustus & 1 september 2014

PAOG SPSS cursus – afdeling epidemiologie, biostatistiek en HTA

Page 2: HC2 – Statistiek in vogelvlucht

PAOG-SPSS HC2

Menubalk <Analyze> (Analyseren)

•<Descriptive statistics>: beschrijvende statistiekKruistabellen

•<Compare means>: Gemiddelden vergelijken T-testen Enkelvoudige variantieanalyse

•<General Linear Models> Algemene Lineaire Modellen

(Meervoudige) variantieanalyse (Meervoudige) regressieanalyse Covariantie analyse

•<Correlate>: correlatiecoefficienten

•<Regression > (Multiple) lineaire regressie

Logistische regressie

•<Non parametric tests>

•<Survival>

Page 3: HC2 – Statistiek in vogelvlucht

PAOG-SPSS HC2

t-test

t-test voor twee onafhankelijke groepen

•Vergelijkt gemiddelde in twee groepen met elkaar

•Aanname: afhankelijke variabele normaal verdeeld in beide groepen

Gepaarde t-test

•Bekijkt of verschil tussen twee gepaarde waarnemingen afwijkt van 0

•Aanname: verschil is normaal verdeeld.

Page 4: HC2 – Statistiek in vogelvlucht

PAOG-SPSS HC2

T-test (output t-test twee onafh. steekproeven)

Group Statistics

212 102.3491 4.48281 .30788

184 102.3424 4.37793 .32275

Geslachtman

vrouw

Initiele bloeddrukN Mean Std. Deviation

Std. ErrorMean

Independent Samples Test

.637 .425 .015 394 .988 .00667 .44679 -.87173 .88506

.015 388.546 .988 .00667 .44604 -.87030 .88363

Equal variancesassumed

Equal variancesnot assumed

Initiele bloeddrukF Sig.

Levene's Test forEquality of Variances

t df Sig. (2-tailed)Mean

DifferenceStd. ErrorDifference Lower Upper

95% ConfidenceInterval of the

Difference

t-test for Equality of Means

Page 5: HC2 – Statistiek in vogelvlucht

PAOG-SPSS HC2

T-test (output gepaarde t-test)

Paired Samples Statistics

92.1086 396 7.47288 .37553

88.4848 396 4.73792 .23809

Gemiddeldebloeddruk op t1

Gemiddeldebloeddruk op t0

Pair1

Mean N Std. DeviationStd. Error

Mean

Paired Samples Test

3.62374 7.46688 .37522 2.88605 4.36142 9.658 395 .000Gemiddelde bloeddrukop t1 - Gemiddeldebloeddruk op t0

Pair1

Mean Std. DeviationStd. Error

Mean Lower Upper

95% ConfidenceInterval of the

Difference

Paired Differences

t df Sig. (2-tailed)

Page 6: HC2 – Statistiek in vogelvlucht

PAOG-SPSS HC2

Kruistabellen

Page 7: HC2 – Statistiek in vogelvlucht

PAOG-SPSS HC2

Kruistabellen (vervolg 1)

Page 8: HC2 – Statistiek in vogelvlucht

PAOG-SPSS HC2

Kruistabellen (vervolg 2: samenvatting)

Relatie tussen twee nominale variabelen

Toets: Chi-kwadraat

Indien 2x2 tabel: Odds ratio of relatief risico

•Case-control design – OR (benadering RR)

•Cohort design - RR

Page 9: HC2 – Statistiek in vogelvlucht

Enkelvoudige variantieanalyse(Een verklarende variabele)

RookgedragGemiddelde Bloeddruk

(mm Hg)

Roker 76.23

Ex Roker 78.16

Nooit roker 77.85

PAOG-SPSS HC2

Page 10: HC2 – Statistiek in vogelvlucht

PAOG-SPSS HC2

Enkelvoudige variantieanalyse (vervolg 1)

Afhankelijke variabele: continu; normaal verdeeld

Onafhankelijke variabele: nominaal

Eenvoudigste geval: t-test (twee groepen)

Begrippen:

•Percentage verklaarde variantie (R2)

<analyze><compare means><one-way anova> of

<analyze><general linear models><univariate>

Page 11: HC2 – Statistiek in vogelvlucht

Meervoudige Variantieanalyse(Meerdere verklarende variabelen)

PAOG-SPSS HC2

Gemiddelde Bloeddruk (mm Hg)

Rookgedrag

Roker Ex roker Nooit roker

Geslacht

Man 77.85 79.59 79.29

Vrouw 74.98 76.73 76.43

Page 12: HC2 – Statistiek in vogelvlucht

PAOG-SPSS HC2

Meervoudige variantieanalyse (vervolg 1)

Afhankelijke variabele (continu) wordt verklaard uit meerdere onafhankelijke (nominale) variabele.

Onafhankelijke variabele: nominaal

Effect onafhankelijke variabelen voor elkaar gecorrigeerd

<analyze><general linear models><univariate>

Page 13: HC2 – Statistiek in vogelvlucht

PAOG-SPSS HC2

Meervoudige variantieanalyse (vervolg 2)

Tests of Between-Subjects Effects

Dependent Variable: Diastolische bloeddruk (mm Hg)

1204.837a 3 401.612 3.433 .017

2885480.799 1 2885480.799 24666.971 .000

1002.834 1 1002.834 8.573 .004

308.765 2 154.383 1.320 .268

58137.821 497 116.978

3055236.000 501

59342.659 500

SourceCorrected Model

Intercept

v2

v11

Error

Total

Corrected Total

Type III Sumof Squares df Mean Square F Sig.

R Squared = .020 (Adjusted R Squared = .014)a.

V2 = geslacht; v11 = rookgedrag

Page 14: HC2 – Statistiek in vogelvlucht

PAOG-SPSS HC2

Meervoudige variantieanalyse (vervolg 3)

V2 = geslacht; V11 = rookgedrag

Between-Subjects Factors

Vrouw 249

Man 252

Roker 215

Ex roker 132

Nooit roker 154

0

1

Geslacht

1

2

3

Rookgedrag

Value Label N

Parameter Estimates

Dependent Variable: Diastolische bloeddruk (mm Hg)

79.296 1.057 75.028 .000 77.219 81.372

-2.868 .979 -2.928 .004 -4.792 -.943

0a . . . . .

-1.444 1.157 -1.248 .213 -3.718 .829

.298 1.288 .231 .817 -2.233 2.829

0a . . . . .

ParameterIntercept

[v2=0]

[v2=1]

[v11=1]

[v11=2]

[v11=3]

B Std. Error t Sig. Lower Bound Upper Bound

95% Confidence Interval

This parameter is set to zero because it is redundant.a.

Page 15: HC2 – Statistiek in vogelvlucht

PAOG-SPSS HC2

Enkelvoudige Regressieanalyse

<analyze><regression><linear>

Vergelijking (model): Y = aX + b

Y: Afhankelijke variabele: wordt voorspeld (continue variabele: normaal verdeeld)

X: Onafhankelijke (continue) variabele: voorspelt Y

a: richtingscoëfficiënt; b: constante

Belangrijke begrippen:

•Residuele spreiding (fout in voorspelling)

•Percentage verklaarde variantie (R2)

Page 16: HC2 – Statistiek in vogelvlucht

Enkelvoudige regressieanalyse (vervolg 1)(Regressielijn + predictie-interval)

PAOG-SPSS HC2

Page 17: HC2 – Statistiek in vogelvlucht

PAOG-SPSS HC2

Enkelvoudige regressieanalyse (vervolg 2)Model Summary

.198a .039 .037 10.690Model1

R R SquareAdjustedR Square

Std. Error ofthe Estimate

Predictors: (Constant), Leeftijd in jarena.

ANOVAb

2318.121 1 2318.121 20.285 .000a

57024.538 499 114.278

59342.659 500

Regression

Residual

Total

Model1

Sum ofSquares df Mean Square F Sig.

Predictors: (Constant), Leeftijd in jarena.

Dependent Variable: Diastolische bloeddruk (mm Hg)b.

Coefficientsa

66.232 2.510 26.390 .000

.318 .071 .198 4.504 .000

(Constant)

Leeftijd in jaren

Model1

B Std. Error

UnstandardizedCoefficients

Beta

StandardizedCoefficients

t Sig.

Dependent Variable: Diastolische bloeddruk (mm Hg)a.

Page 18: HC2 – Statistiek in vogelvlucht

PAOG-SPSS HC2

Meervoudige (multiple) regressieanalyse

Model: Y = a1x1 + a2x2 + … + anxn + b

Afhankelijke variabele (continu) wordt verklaard uit meerdere onafhankelijke continue variabelen

Effect onafhankelijke variabelen voor elkaar gecorrigeerd

Meerdere voorwaarden, waaronder:

•Residuen normaal verdeeld

Page 19: HC2 – Statistiek in vogelvlucht

PAOG-SPSS HC2

Multiple regressieanalyse (vervolg 1)Model Summary

.349a .122 .119 10.228Model1

R R SquareAdjustedR Square

Std. Error ofthe Estimate

Predictors: (Constant), Quetelet index (Kg/m*m),Leeftijd in jaren

a.

ANOVAb

7243.906 2 3621.953 34.621 .000a

52098.753 498 104.616

59342.659 500

Regression

Residual

Total

Model1

Sum ofSquares df Mean Square F Sig.

Predictors: (Constant), Quetelet index (Kg/m*m), Leeftijd in jarena.

Dependent Variable: Diastolische bloeddruk (mm Hg)b.

Coefficientsa

50.019 3.369 14.848 .000

.228 .069 .142 3.310 .001

.810 .118 .294 6.862 .000

(Constant)

Leeftijd in jaren

Quetelet index (Kg/m*m)

Model1

B Std. Error

UnstandardizedCoefficients

Beta

StandardizedCoefficients

t Sig.

Dependent Variable: Diastolische bloeddruk (mm Hg)a.

Page 20: HC2 – Statistiek in vogelvlucht

PAOG-SPSS HC2

Algemene lineaire modellen(General Linear Models)

Afhankelijke variabele: Continu.

Omvatten:

•(Meervoudige) regressie-analyse

•(Meervoudige) variantie-analyse

•Covariantie-analyse

•Onafhankelijke variabelen nominaal én/of continu

Welke procedures in SPSS

•-General Linear Models, -univariate voor:

•Regressie- variantie- en covariantie-analyse

•-Regression, -linear voor:

•Regressie analyse

•(Ook andere: oa logistische regressie via -binary logistic)

Page 21: HC2 – Statistiek in vogelvlucht

Logistische regressieanalyse

Vraag: wordt kans op uitval in vierdaagse bepaald door:

• Gelopen aantal km (30, 40 of 50) (cat)

• Geslacht (cat)

• Aanwezigheid metabool syndroom (cat)

• Leeftijd (continu)

PAOG-SPSS HC2

Page 22: HC2 – Statistiek in vogelvlucht

PAOG-SPSS HC2

Logistische regressieanalyse (vervolg 1)

Afhankelijke variabele: binair of dichotoom (2 uitkomstmogelijkheden)

Onafhankelijke variabele(n): kan van alles zijn

•indien discrete onafhankelijke variabele(n) = analyse kruistabel (OR)

•Veel (verschillende type) variabelen in model mogelijk (vb confounder correctie)

Voordelen

•Geen voorwaarde t.a.v. de onafhankelijke variabelen

•Regressiecoëfficiënten kunnen geïnterpreteerd worden als OR

Page 23: HC2 – Statistiek in vogelvlucht

Logistische regressieanalyse (Vervolg 2)

PAOG-SPSS HC2

Dependent variable: Completed Four Days MarschesDependent Variable Encoding

Original Value Internal Value

Yes 0

No 1

Categorical Variables Codings

Parameter coding

Frequency (1) (2)

Distance walked (30, 40 or 50 kilometers)

30 369 .000 .000

40 1622 1.000 .000

50 662 .000 1.000

Gender Male 1441 1.000

Female 1212 .000

Metabolic syndrome present No 2570 .000

Yes 83 1.000

Page 24: HC2 – Statistiek in vogelvlucht

Logistische regressieanalyse (Vervolg 3)

PAOG-SPSS HC2

Omnibus Tests of Model Coefficients

Chi-square df Sig.

Step 1 Step 11.604 5 .041

Block 11.604 5 .041

Model 11.604 5 .041

Block 1: Method = Enter

Variables in the Equation

B S.E. Wald df Sig. Exp(B)

Step 1a metabolic(1) .425 .409 1.076 1 .300 1.529

Distance 5.119 2 .077

Distance(1) .473 .281 2.836 1 .092 1.605

Distance(2) .672 .298 5.104 1 .024 1.959

Gender(1) .333 .180 3.419 1 .064 1.395

age .000 .001 .040 1 .842 1.000

Constant -3.373 .293 132.616 1 .000 .034

a. Variable(s) entered on step 1: metabolic, Distance, Gender, age.

Page 25: HC2 – Statistiek in vogelvlucht

Kaplan-Meier overlevingsanalyse(Survival curve = overlevingscurve)

PAOG-SPSS HC2

In SPSS: <analyze><survival><kaplan-meier>

Page 26: HC2 – Statistiek in vogelvlucht

PAOG-SPSS HC2

Belangrijke termen / karakteristieken

“Overleving” kan van alles zijn•Sterfte (mortaliteit)

•Optreden ziekte (morbiditeit)o Afstoting donororgaano Optreden allergische reactie tegen medicijn

Overleving wordt berekend tot optreden “event” of “censurering”Censurering: incomplete follow-up ten gevolge van:

•bereiken afsluitdatum onderzoek

•sterfte tgv andere oorzaak

•verhuizing

•verwijdering uit oz op verzoek patiënt

•… wat dan ook… dan wordt de tijd “at-risk” meegenomen

Page 27: HC2 – Statistiek in vogelvlucht

PAOG-SPSS HC2

Kaplan-Meier analyse

Benodigd voor berekeningen:

•Variabele die tijdstip (dag, week) van “failure ( = event)” of censurering voor elke patiënt aangeeft.

•Variabele die aangeeft of de gebeurtenis is opgetreden, of lost to follow-up.

•Eventueel: Variabele die verschillende strata definieert (indien groepen vergeleken moeten worden)

Berekeningen:

•Kans op “dood” (aantal events/aantal patiënten)

•1- (kans op “dood”)

•Cumulatieve kans op ”niet-dood” (overleving)