1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en...

130
1 Cursus Mei – Juni 2002 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische Kruistabelanalyse & Logistische regressie regressie Frans Tan Methodologie en Statistiek Frans Tan Methodologie en Statistiek

Transcript of 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en...

Page 1: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

1

Cursus Mei – Juni 2002Cursus Mei – Juni 2002Kruistabelanalyse & Logistische regressieKruistabelanalyse & Logistische regressie

Frans Tan Methodologie en StatistiekFrans Tan Methodologie en Statistiek

Page 2: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

2

Programma

1. 06-5

2. 13-5

3. 27-5

4. 03-6

5. 10-6

6. 17-6

• Confounding, standaardisatie, Mantel Haenszel

• Enkelvoudige logistische reg. Dummy variabelen

• Log.reg. Met covariaten en interactie• Bespreking opdrachten• Vergelijking met Ancova• Bespreking opdrachten

Page 3: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

3

VoorkennisVoorkennis

• Toetsingstheorie

• Multipele regressie

OnderwerpenOnderwerpen

• ConfoundingConfounding• Standaardisatie/stratificatie/Mantel-HaenszelStandaardisatie/stratificatie/Mantel-Haenszel• Logistische regressieLogistische regressie

Page 4: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

4

Onderzoekskader: valideringsproblemenOnderzoekskader: valideringsproblemen

• Effect van een bepaalde behandeling op objects (bijv. Personen)

• Ook algemener: (causaal) effect van een grootheid X op een grootheid Y

Page 5: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

5

Onderzoekskader: valideringsproblemenOnderzoekskader: valideringsproblemen

GroepGroep

behandelingbehandeling

Geen behandelingGeen behandeling

discrepantiediscrepantie

Ideale situatie niet haalbaar. Ideale situatie niet haalbaar. Werken met proxy-controle groepWerken met proxy-controle groep

Page 6: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

6

Onderzoekskader: valideringsproblemenOnderzoekskader: valideringsproblemen

• De groepen kunnen van elkaar verschillen door andere factoren (welke op zichzelf gerelateerd zijn aan de afhankelijke variabele) dan de behandeling zelf

• Associatie impliceert niet causale relatie tussen X en Y• Voldoende voor geen confounding is

- een gebalanceerd design- een gerandomiseerde toewijzing in groepen

Confounding (adequacy of the control group)Confounding (adequacy of the control group)

Page 7: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

7

Onderzoekskader: valideringsproblemenOnderzoekskader: valideringsproblemen

• Definitie volgens adequaatheid van de controle groep vaak verward met collapsibility principe

• Collapsibility: er is sprake van confounding als de ruwe (marginale) associatie ongelijk is aan de stratumspecifieke associatie

Page 8: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

8

Illustratie 1. De (fictieve) resultaten van een onderzoek naar de effectiviteit van veiligheidsgordels

Overleven

gecombineerd Lage snelheid Hoge snelheid

nee ja Nee ja nee ja

nee 20 30 2 18 18 12

Gordel

ja 10 40 4 36 6 4

RR (OR) 2 ( 2.67) 1 ( 1) 1 (1)

Snelheid een confounder ?Snelheid een confounder ?

Page 9: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

9

Illustratie 2. Effect leeftijd moeder op sterfte bij geboorte kind

Kindersterfte

gecombineerd ondergewicht Normaal gew.

ja nee ja nee ja nee

oud 100 900 90 540 10 450

Lft.

moeder

jong 10 255 5 30 5 225

RR (OR) 2.65 ( 2.83) 1 ( 1) 1 (1)

Geboortegewicht een confounder ?Geboortegewicht een confounder ?

Page 10: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

10

Illustratie 3. Effect medicijn op genezingeen gebalanceerd design

genezen

gecombineerd lichtzieken zwaarzieken

ja nee ja nee ja nee

Int. 115 85 95 5 20 80

medicijn

Contr. 85 115 80 20 5 95

RR (OR) 1.35 ( 1.83) 1.19 ( 4.75) 4.0 (4.75)

Ernst van de ziekte een confounder ?Ernst van de ziekte een confounder ?

Page 11: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

11

Confounding

1. C is geen causaal gevolg van R (mediator)

2. Geen gerandomiseerd design

3. Geen balanced design

4. Ruwe RR(OR) ongelijk aan de stratum specifieke RR (OR)

Als een factor C een confounder is, danAls een factor C een confounder is, dan

Page 12: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

12

Confounding

• Het negeren van een confounder leidt tot vertekende resultaten (bias)• Een maat voor de invloed van een confounder is bias• Stel de werkelijke (populatie) waarde van een behandelingseffect

en ô een schatter voor

bias (ô) = verwachte waarde (ô) -

waarbij de verwachte waarde gelijk is aan de gemiddelde waarde van alle mogelijke ô ‘s na een groot aantal herhalingen van het onderzoek

Page 13: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

13

Methoden voor bias controle

• Standaardisatie- directe- indirecte

• Stratificatie volgens Mantel Haenszel• Correlationele methoden

Page 14: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

14

Directe standaardisatie

confounder Fractie groep 1

Fractie groep 2

Standaard verdeling

1 p11 p21 fs1

2 p12 p22 fs2

. . . .

J p1J p2J fsJ

Verdeling van de confounder standaardiseren door Verdeling van de confounder standaardiseren door een verdeling van een standaard populatieeen verdeling van een standaard populatie

Relatief risico groep 1 t.o.v groep 2Relatief risico groep 1 t.o.v groep 2

RRp f p f p f

p f p f p fad js s J sJ

s s J sJ

11 1 1 2 2 1

2 1 1 2 2 2 2

. . .

. . .

Page 15: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

15

Indirecte standaardisatie

confounder Fractie groep 1

Standaard verdeling

fs1 pc1

fs2 pc2

. .

fsJ pc2

Overall 1 pv pc

Verdeling van de specifieke fracties standaardiseren Verdeling van de specifieke fracties standaardiseren en vervolgens correctie toepassen m.b.v. SMRen vervolgens correctie toepassen m.b.v. SMR

Als standaard Als standaard populatie de controle populatie de controle groep is, dan is groep is, dan is RrRradjadj = SMR = SMR

SM Rp

p f p f p fv

c s c s cJ sJ

1 1 2 2 . . .

Page 16: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

16

Enkele opmerkingen

• Compacte samenvatting van wat gaande is• Als steekproefaantal per stratum klein of zelfs nul• Als RR constant over strata van de confounder, dan

levert de directe methode veelal een schatting op zonder vertekening

• Indirecte standaardisatie alleen onvertekend als standaard populatie een van de groepen is

• Geen toets voorhanden• Variatie over strata door standaardisatie gemaskeerd

Page 17: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

17

Stratificatie volgens Mantel Haenszel

• Is de associatie consistent over strata, d.w.z. zijn de waargenomen verschillen toe te schrijven aan toeval?

• Stel associatie consistent over strata. Is de overall associatie gecorrigeerd voor confounder statistisch significant?

• Stel overall associatie is statistisch significant. Hoe groot is de standaardfout van de overall schatting?

Page 18: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

18

Stratificatie volgens Mantel Haenszel

• Als associatie niet consistent, dan Mantel Haenszel niet geschikt

• Mogelijk betrouwbaarheidsintervallen te contrueren

• Onder consistentie is de Mantel-Haenszel schatter onvertekend

Page 19: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

19

Logistisch regressiemodelLogistisch regressiemodel

• sgewijze logistische regressie

• lll

Page 20: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

20

Logistisch regressiemodelLogistisch regressiemodel• Beperking lineaire regressiemodelBeperking lineaire regressiemodel

• Specificatie van het model

• Vergelijking met een kruistabelanalyse

• Model met covariaat/interactie

• Toetsen voor het vergelijken tussen modellen

• Stapsgewijze logistische regressie

Page 21: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

21

Logistisch regressiemodelLogistisch regressiemodel• Beperking lineaire regressiemodelBeperking lineaire regressiemodel

• Specificatie van het modelSpecificatie van het model

• Vergelijking met een kruistabelanalyse

• Model met covariaat/interactie

• Toetsen voor het vergelijken tussen modellen

• Stapsgewijze logistische regressie

Page 22: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

22

Logistisch regressiemodelLogistisch regressiemodel• Beperking lineaire regressiemodelBeperking lineaire regressiemodel

• Specificatie van het modelSpecificatie van het model

• Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyse

• Model met covariaat/interactie

• Toetsen voor het vergelijken tussen modellen

• Stapsgewijze logistische regressie

Page 23: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

23

Logistisch regressiemodelLogistisch regressiemodel• Beperking lineaire regressiemodelBeperking lineaire regressiemodel

• Specificatie van het modelSpecificatie van het model

• Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyse

• Model met covariaat/interactieModel met covariaat/interactie

• Toetsen voor het vergelijken tussen modellen

• Stapsgewijze logistische regressie

Page 24: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

24

Logistisch regressiemodelLogistisch regressiemodel• Beperking lineaire regressiemodelBeperking lineaire regressiemodel

• Specificatie van het modelSpecificatie van het model

• Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyse

• Model met covariaat/interactieModel met covariaat/interactie

• Toetsen voor het vergelijken tussen modellenToetsen voor het vergelijken tussen modellen

• Stapsgewijze logistische regressie

Page 25: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

25

Logistisch regressiemodelLogistisch regressiemodel• Beperking lineaire regressiemodelBeperking lineaire regressiemodel

• Specificatie van het modelSpecificatie van het model

• Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyse

• Model met covariaat/interactieModel met covariaat/interactie

• Toetsen voor het vergelijken tussen modellenToetsen voor het vergelijken tussen modellen

Page 26: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

26

Logistisch regressiemodelLogistisch regressiemodelC

I JF

ER

CIJ

FE

R

STUDIETIJDSTUDIETIJD

model:model:

y is continu en x mag discreet zijny is continu en x mag discreet zijn

Y X0 1

Page 27: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

27

Logistisch regressiemodelLogistisch regressiemodelU

ITS

LAG

UIT

SLA

G

STUDIETIJDSTUDIETIJD

wat als y dichotoom is ?wat als y dichotoom is ?

11

00

Page 28: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

28

Logistisch regressiemodelLogistisch regressiemodelU

ITS

LAG

UIT

SLA

G

STUDIETIJDSTUDIETIJD

bepaal het percentage geslaagden per studie-bepaal het percentage geslaagden per studie-tijdsintervaltijdsinterval

11

00

Page 29: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

29

Logistisch regressiemodelLogistisch regressiemodelU

ITS

LAG

UIT

SLA

G

STUDIETIJDSTUDIETIJD

bepaal het percentage geslaagden per studie-bepaal het percentage geslaagden per studie-tijdsintervaltijdsinterval

11

00

Page 30: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

30

Logistisch regressiemodelLogistisch regressiemodelS

LAG

ING

SS

LAG

I NG

SP

ER

CE

NT

AG

EP

ER

CE

NT

AG

E

X = STUDIETIJDX = STUDIETIJD

11

00

EEN MODEL DAT IN VEEL GEVALLEN ZO’N S-VORMIG VERBAND GOED BESCHRIJFTIS

Pe X

1

1 0 1( )

IN PLAATS VAN

NOTEREN WE

e X) ( 0 1

EXP{-( + X)}0 1

Page 31: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

31

Logistisch regressiemodelLogistisch regressiemodelS

LAG

ING

SS

LAG

I NG

SP

ER

CE

NT

AG

EP

ER

CE

NT

AG

E

X = STUDIETIJDX = STUDIETIJD

11

00

een model dat in veel een model dat in veel gevallen zo’n s-vormig gevallen zo’n s-vormig verband goed beschrijftverband goed beschrijftisis P

e X

1

1 0 1( )

IN PLAATS VAN

NOTEREN WE

e X) ( 0 1

EXP{-( + X)}0 1

Page 32: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

32

Logistisch regressiemodelLogistisch regressiemodelS

LAG

ING

SS

LAG

I NG

SP

ER

CE

NT

AG

EP

ER

CE

NT

AG

E

X = STUDIETIJDX = STUDIETIJD

11

00

een model dat in veel een model dat in veel gevallen zo’n s-vormig gevallen zo’n s-vormig verband goed beschrijftverband goed beschrijftisis P

e X

1

1 0 1( )

In plaats van

Noteren we

e X) ( 0 1

EXP{-( + X)}0 1

Page 33: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

33

Logistisch regressiemodelLogistisch regressiemodel• Beperking lineaire regressiemodelBeperking lineaire regressiemodel

• Specificatie van het modelSpecificatie van het model

• Vergelijking met een kruistabelanalyse

• Model met covariaat/interactie

• Toetsen voor het vergelijken tussen modellen

• Stapsgewijze logistische regressie

Page 34: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

34

Specificatie van het modelSpecificatie van het modellogistisch regressiemodellogistisch regressiemodel

Pe X

1

1 0 1( ) Het logistische modelHet logistische model

Kan herschreven worden alsKan herschreven worden als

In plaats van In plaats van noteren we ook noteren we ook

Logit(p)Logit(p) of of ln(odds)ln(odds)

LNP

1 PX

0 1

LNP

1 P

Page 35: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

35

Specificatie van het modelSpecificatie van het modellogistisch regressiemodellogistisch regressiemodel

PP

X = STUDIETIJDX = STUDIETIJD

11

00

Pe X

1

1 0 1( )

Page 36: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

36

Specificatie van het modelSpecificatie van het modellogistisch regressiemodellogistisch regressiemodel

X = STUDIETIJD

11

00

LNP

1 P

LNP

1 PX

0 1

Page 37: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

37

Specificatie van het model• Y = Dropout (wel =1, niet =0)

X = jaarcohort COHORT * DROPOUT Crosstabulation

Count

66 1 67

54 10 64

61 7 68

54 17 71

52 23 75

53 19 72

44 27 71

57 17 74

63 24 87

40 25 65

66 14 80

48 35 83

40 44 84

38 47 85

37 54 91

39 54 93

58 35 93

870 453 1323

74,00

75,00

76,00

77,00

78,00

79,00

80,00

81,00

82,00

83,00

84,00

85,00

86,00

87,00

88,00

89,00

90,00

COHORT

Total

no yes

DROPOUT

Total

Page 38: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

38

Specificatie van het model• Als logistische regressiemodel:

logit (p) = 0 + 1 Cohort

Variables in the Equation

,133 ,013 103,021 1 ,000 1,143

-11,715 1,098 113,814 1 ,000 ,000

COHORT

Constant

Step1

a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: COHORT.a.

Page 39: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

39

Specificatie van het modelgroot steekproefaantal

• Als benadering van logistische regressiemodel:logit (f) = 0 + 1 Cohort +

COHORT

100908070

LO

GIT

1,5

1,0

,5

0,0

-,5

-1,0

Page 40: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

40

Specificatie van het modelgroot steekproefaantal

• Als benadering van logistische regressiemodel:logit (f) = 0 + 1 Cohort +

• Problem: als p=0, dan logit (f) bestaat niet• Oplossing: logit(f + c) met c een klein positief getal bijvoorbeeld 0.01

Coefficientsa

-11,540 1,912 -6,037 ,000

,133 ,023 ,710 5,699 ,000

(Constant)

COHORT

Model1

B Std. Error

UnstandardizedCoefficients

Beta

Standardized

Coefficients

t Sig.

Dependent Variable: LOGITa.

R-square R-square = 0.504= 0.504

Page 41: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

41

Specificatie van het modelgroot steekproefaantal

• Als lineair kansmodel:f = 0 + 1 Cohort +

COHORT

100908070

PE

RC

80

60

40

20

0

-20

Page 42: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

42

Specificatie van het modelgroot steekproefaantal

• Als lineair kansmodel:f = 0 + 1 Cohort +

Coefficientsa

-191,997 39,858 -4,817 ,000

2,758 ,485 ,709 5,684 ,000

(Constant)

COHORT

Model1

B Std. Error

UnstandardizedCoefficients

Beta

Standardized

Coefficients

t Sig.

Dependent Variable: PERCa.

R-square = 0.502R-square = 0.502

Page 43: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

43

Logistisch regressiemodelLogistisch regressiemodel• Beperking lineaire regressiemodelBeperking lineaire regressiemodel

• Specificatie van het modelSpecificatie van het model

• Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyse

• Model met covariaat/interactie

• Toetsen voor het vergelijken tussen modellen

• Stapsgewijze logistische regressie

Page 44: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

44

Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel

Voorbeeld: Voorbeeld: effect van geslacht op toelating effect van geslacht op toelating tot de universiteit berkeley.tot de universiteit berkeley.

STUDIE 1STUDIE 1 AANGENOMENAANGENOMEN

NIETNIET WELWEL

VROUWVROUW 1919 8989

MANMAN 313313 512512

STUDIE 2STUDIE 2 AANGENOMENAANGENOMEN

NIETNIET WELWEL

VROUWVROUW 88 1717

MANMAN 207207 353353

STUDIE 3STUDIE 3 AANGENOMENAANGENOMEN

NIETNIET WELWEL

VROUWVROUW 391391 202202

MANMAN 205205 120120

Page 45: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

45

Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel

IN TERMEN VAN KANSEN

SAMENGEVOEGDSAMENGEVOEGD AANGENOMENAANGENOMEN

NIETNIET WELWEL

VROUWVROUW 418418 308308

MANMAN 725725 985985

PM AN

9 8 5

7 2 5 9 8 55 7 6.

PVR O U W

3 0 8

4 1 8 3 0 84 3 0.

vraag:vraag:hebben mannen meer hebben mannen meer kans toegelaten te kans toegelaten te worden tot de universiteitworden tot de universiteit

RELATIEVE SUCCESKANS (IN LITERATUUR: RELATIEF RISICO (RR))

R RP

PM AN

VR O U W

.

..

5 7 6

4 3 01 3 4

MANNEN WORDEN EERDER TOEGELATEN TOT DE UNIVERSITEIT

Page 46: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

46

Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel

in termen van kansenin termen van kansen

SAMENGEVOEGDSAMENGEVOEGD AANGENOMENAANGENOMEN

NIETNIET WELWEL

VROUWVROUW 418418 308308

MANMAN 725725 985985

PM AN

9 8 5

7 2 5 9 8 55 7 6.

PVR O U W

3 0 8

4 1 8 3 0 84 3 0.

vraag:vraag:hebben mannen meer hebben mannen meer kans toegelaten te kans toegelaten te worden tot de universiteitworden tot de universiteit

Page 47: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

47

Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel

in termen van kansenin termen van kansen

SAMENGEVOEGDSAMENGEVOEGD AANGENOMENAANGENOMEN

NIETNIET WELWEL

VROUWVROUW 418418 308308

MANMAN 725725 985985

PM AN

9 8 5

7 2 5 9 8 55 7 6.

PVR O U W

3 0 8

4 1 8 3 0 84 3 0.

vraag:vraag:hebben mannen meer hebben mannen meer kans toegelaten te kans toegelaten te worden tot de universiteitworden tot de universiteit

relatieve succeskans (in literatuur: relatief risico (rr))relatieve succeskans (in literatuur: relatief risico (rr))R R

P

PM AN

VR O U W

.

..

5 7 6

4 3 01 3 4

mannen worden eerder toegelaten tot de universiteitmannen worden eerder toegelaten tot de universiteit

Page 48: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

48

Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel

in termen van oddsin termen van odds

SAMENGEVOEGDSAMENGEVOEGD AANGENOMENAANGENOMEN

NIETNIET WELWEL

VROUWVROUW 418418 308308

MANMAN 725725 985985

O D D S(M AN )# W EL

# N IET

9 8 5

7 2 51 3 5 9.

RELATIEVE ODDS (IN LITERATUUR: ODDSRATIO(OR))

O RO D D S(M AN )

O D D S(VR O U W )

1 359

7378

.

..1 4

MANNEN WORDEN EERDER TOEGELATEN TOT DE UNIVERSITEIT

O D D S(VR O U W )# W EL

# N IET

3 0 8

4 1 87 3 7.

Page 49: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

49

Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel

in termen van oddsin termen van odds

SAMENGEVOEGDSAMENGEVOEGD AANGENOMENAANGENOMEN

NIETNIET WELWEL

VROUWVROUW 418418 308308

MANMAN 725725 985985

O D D S(M AN )# W EL

# N IET

9 8 5

7 2 51 3 5 9.

relatieve odds (in literatuur: oddsratio(or))relatieve odds (in literatuur: oddsratio(or))

O RO D D S(M AN )

O D D S(VR O U W )

1 359

7378

.

..1 4

mannen worden eerder toegelaten tot de universiteitmannen worden eerder toegelaten tot de universiteit

O D D S(VR O U W )# W EL

# N IET

3 0 8

4 1 87 3 7.

Page 50: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

50

Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel

• Het verschil tussen rr (=1.34) en or (= 1.84) is Het verschil tussen rr (=1.34) en or (= 1.84) is een verschil in schalingeen verschil in schaling

• Belangrijk voor interpretatie:Belangrijk voor interpretatie:als rr > (of <) 1, dan or > (of <) 1als rr > (of <) 1, dan or > (of <) 1

Page 51: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

51

Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel

1.1. Model specificeren en let op de codering Model specificeren en let op de codering van de variabelen van de variabelen

2.2. Schat de regressieparameters met spssSchat de regressieparameters met spss

3.3. Bereken de oddsratio(s) met behulp van Bereken de oddsratio(s) met behulp van rekenregelsrekenregels

Dezelfde analyse met logistische regressieDezelfde analyse met logistische regressie

Te volgen stappen:Te volgen stappen:

Page 52: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

52

Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel

• Model: Model:

let op! Wat geeft p aanlet op! Wat geeft p aan 1 als man 1 als man

• Hoe is gesl. Gecodeerd. Hier: gesl = Hoe is gesl. Gecodeerd. Hier: gesl = 0 als 0 als

vrouwvrouw

Stap 1.Stap 1. Model specificeren en let op de codering Model specificeren en let op de codering van de variabelenvan de variabelen

LNP

1 PG ESL.

0 1

Page 53: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

53

Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel

Het geschatte model:Het geschatte model:

Merk op :Merk op : odds = odds =

i.h.b. Ln(odds(man)) = -.305 + .612 * 1 = .307i.h.b. Ln(odds(man)) = -.305 + .612 * 1 = .307

Ln(odds(vrouw)) = -.305 + .612 * 0 = -.305Ln(odds(vrouw)) = -.305 + .612 * 0 = -.305

Stap 2.Stap 2. Schat de regressieparameters met spss Schat de regressieparameters met spss

LN O D D S G ESL. . .3 0 5 6 1 2

P

1 P

Page 54: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

54

Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel

Stap 3.Stap 3. Bereken de oddsratio(s) met behulp van Bereken de oddsratio(s) met behulp van rekenregels rekenregels

Rekenregels: 1.Rekenregels: 1. 2. 2.

LNA

BLN (A) LN (B

)

LN (X) C X = EXP(C )

Dus: regel 1.

= .307 - -.305 = .612

Regel 2. Ln (or) = .612. Dus or = exp (.612) = 1.84

LN (O R ) = LNO D D S(M AN )

O D D S(VR O U W )LN (O D D S(M A N )) LN (O D D S(VR O U W )

)

Page 55: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

55

Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel

Stap 3.Stap 3. Bereken de oddsratio(s) met behulp van Bereken de oddsratio(s) met behulp van rekenregels rekenregels

Rekenregels: 1.Rekenregels: 1. 2. 2.

LNA

BLN (A) LN (B

)

LN (X) C X = EXP(C )

Dus: Dus: regel 1regel 1..

= .307 - -.305 = .612= .307 - -.305 = .612

Regel 2. Ln (or) = .612. Dus or = exp (.612) = 1.84

LN (O R ) = LNO D D S(M AN )

O D D S(VR O U W )LN (O D D S(M A N )) LN (O D D S(VR O U W )

)

Page 56: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

56

Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel

Stap 3.Stap 3. Bereken de oddsratio(s) met behulp van Bereken de oddsratio(s) met behulp van rekenregels rekenregels

Rekenregels: 1.Rekenregels: 1. 2. 2.

LNA

BLN (A) LN (B

)

LN (X) C X = EXP(C )

Dus: Dus: regel 1regel 1..

= .307 - -.305 = .612= .307 - -.305 = .612

regel 2. Ln (OR) = .612. Dus OR= exp (.612) = 1.84

LN (O R ) = LNO D D S(M AN )

O D D S(VR O U W )LN (O D D S(M A N )) LN (O D D S(VR O U W )

)

Page 57: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

57

Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel

• Model:

= ln (or), mits verschil in codes van variabele

x gelijk is aan 1.

• Als verschil in codes van x gelijk is aan 7 (in dezelfde richting) , dan = * ln (or)

• Verschil in codes voor de y variabele (mits in dezelfde richting heeft geen invloed op de waarden van de betas

Enkele opmerkingenEnkele opmerkingen::LN

P

1 PX.

0 1

1

1

1

7

Page 58: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

58

Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel

• Model:Model:

= ln (or), mits verschil in codes van variabele = ln (or), mits verschil in codes van variabele x gelijk is aan 1.x gelijk is aan 1.

• Als verschil in codes van x gelijk is aan 7 (in dezelfde richting) , dan

= * ln (or)

• Verschil in codes voor de y variabele (mits in dezelfde richting heeft geen invloed op de waarden van de betas

Enkele opmerkingenEnkele opmerkingen::

LNP

1 PX.

0 1

1

1

1

7

Page 59: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

59

Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel

XX

11

00

LNP

1 P

LNP

1 PX

0 1

de hellingde helling is een monotone functie van de is een monotone functie van de oddsratio or oddsratio or

1

Page 60: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

60

Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel

• Model:Model: = ln (or), mits verschil in codes van = ln (or), mits verschil in codes van

variabele x gelijk is aan 1. variabele x gelijk is aan 1.• Als verschil in codes van x gelijk is aan 7 (in dezelfde Als verschil in codes van x gelijk is aan 7 (in dezelfde

richting) , dan = * ln (or)richting) , dan = * ln (or)

rschil in codes voor de y variabele (mits in dezelfde richting heeft geen invloed op de waarden van de betas

Enkele opmerkingenEnkele opmerkingen::LN

P

1 PX.

0 1

1

11

7

Page 61: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

61

Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel

• Model:Model: = ln (or), mits verschil in codes van = ln (or), mits verschil in codes van

variabele x gelijk is aan 1. variabele x gelijk is aan 1.• Als verschil in codes van x gelijk is aan 7 (in dezelfde Als verschil in codes van x gelijk is aan 7 (in dezelfde

richting) , danrichting) , dan = * ln (or) = * ln (or)

• veverschil in codes voor de y variabele (mits in dezelfde richting heeft geen invloed op de waarden van de betas

Enkele opmerkingenEnkele opmerkingen::LN

P

1 PX.

0 1

1

11

7

Page 62: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

62

Logistisch regressiemodelLogistisch regressiemodel• Beperking lineaire regressiemodelBeperking lineaire regressiemodel

• Specificatie van het modelSpecificatie van het model

• Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyse

• Model met covariaat/interactieModel met covariaat/interactie

• Toetsen voor het vergelijken tussen modellen

• Stapsgewijze logistische regressie

Page 63: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

63

Model met covariaat/interactie Model met covariaat/interactie logistisch regressiemodellogistisch regressiemodel

Net als bij ancova kan er sprake zijn van een Net als bij ancova kan er sprake zijn van een storende variabelestorende variabele

Ontstaat bijvoorbeeld doordat Ontstaat bijvoorbeeld doordat

Er studierichtingen zijn met strenge eisen en Er studierichtingen zijn met strenge eisen en overwegend vrouwenoverwegend vrouwen

Er studierichtingen zijn met minder strenge eisen Er studierichtingen zijn met minder strenge eisen en overwegend mannenen overwegend mannen

Page 64: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

64

Model met covariaat/interactieModel met covariaat/interactie

logistisch regressiemodellogistisch regressiemodelSTUDIE 1STUDIE 1 AANGENOMENAANGENOMEN

NIETNIET WELWEL

VROUWVROUW 1919 8989

MANMAN 313313 512512

STUDIE 2STUDIE 2 AANGENOMENAANGENOMEN

NIETNIET WELWEL

VROUWVROUW 88 1717

MANMAN 207207 353353

STUDIE 3STUDIE 3 AANGENOMENAANGENOMEN

NIETNIET WELWEL

VROUWVROUW 391391 202202

MANMAN 205205 120120

strenge eisen en strenge eisen en overwegend vrouwenoverwegend vrouwen

Minder strenge eisen en Minder strenge eisen en overwegend mannenoverwegend mannen

Page 65: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

65

Model met covariaat/interactieModel met covariaat/interactie

logistisch regressiemodellogistisch regressiemodel

GESLACHTGESLACHT

11

00

LNP

1 P

VROUWVROUW MANMAN

STUDIERICHTING 3STUDIERICHTING 3

STUDIERICHTING 1STUDIERICHTING 1

GECOMBINEERDGECOMBINEERD

dit fenomeen heet confounding (vergelijk ancova)dit fenomeen heet confounding (vergelijk ancova)

in model studierichting opnemen als covariaatin model studierichting opnemen als covariaat

Page 66: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

66

Model met covariaat/interactie Model met covariaat/interactie logistisch regressiemodellogistisch regressiemodel

GESLACHTGESLACHT

11

00

LNP

1 P

VROUWVROUW MANMAN

STUDIERICHTING 3STUDIERICHTING 3

STUDIERICHTING 1STUDIERICHTING 1

GECOMBINEERDGECOMBINEERD

dit fenomeen heet interactie(vergelijk ancova).dit fenomeen heet interactie(vergelijk ancova).

in model geslacht * studierichting opnemen als in model geslacht * studierichting opnemen als interactieinteractie

Page 67: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

67

Model met covariaat/interactieModel met covariaat/interactie

logistisch regressiemodellogistisch regressiemodel

GESLACHTGESLACHT

11

00

LNP

1 P

VROUWVROUW MANMAN

STUDIERICHTING 3STUDIERICHTING 3

STUDIERICHTING 1STUDIERICHTING 1

GECOMBINEERDGECOMBINEERD

nb. interactie ook mogelijk indien verdeling nb. interactie ook mogelijk indien verdeling mannen en vrouwen over studierichtingen gelijkmannen en vrouwen over studierichtingen gelijk

Page 68: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

68

Model met covariaat/interactieModel met covariaat/interactie

logistisch regressiemodellogistisch regressiemodelSTUDIE 1STUDIE 1 AANGENOMENAANGENOMEN

NIETNIET WELWEL

VROUWVROUW 1919 8989

MANMAN 313313 512512

STUDIE 2STUDIE 2 AANGENOMENAANGENOMEN

NIETNIET WELWEL

VROUWVROUW 88 1717

MANMAN 207207 353353

STUDIE 3STUDIE 3 AANGENOMENAANGENOMEN

NIETNIET WELWEL

VROUWVROUW 391391 202202

MANMAN 205205 120120

O R STU D IE1 5 1 2

3 1 3

1 9

8 93 4 9.

O R STU D IE2 3 5 3

2 0 7

8

1 78 0 3.

O R STU D IE3 1 2 0

2 0 5

3 9 1

2 0 21 1 3 3.

Page 69: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

69

Model met covariaat/interactie Model met covariaat/interactie logistisch regressiemodellogistisch regressiemodel

Verschillen tussen oddsratios kunnen Verschillen tussen oddsratios kunnen toegeschreven worden aan toeval (hierover toegeschreven worden aan toeval (hierover later)later)

Eerst consequentie voor model en interpretatie alsEerst consequentie voor model en interpretatie als

1.1. Studierichting een covariaat isStudierichting een covariaat is

2.2. Er sprake is van interactie tussen studierichting Er sprake is van interactie tussen studierichting en geslachten geslacht

Page 70: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

70

Model met covariaat/interactieModel met covariaat/interactie

logistisch regressiemodellogistisch regressiemodel

Daar studierichting discreet is, dienen we Daar studierichting discreet is, dienen we dummy variabelen aan te makendummy variabelen aan te maken

11 als studierichting 2als studierichting 2Studie (2) =Studie (2) =

00 andersanders

11 als studierichting 3als studierichting 3Studie (3) =Studie (3) =

00 andersandersStudierichting 1 fungeert als referentiegroepStudierichting 1 fungeert als referentiegroep

Page 71: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

71

Model met covariaat/interactieModel met covariaat/interactie

logistisch regressiemodellogistisch regressiemodelad1. studierichting is een covariaatad1. studierichting is een covariaat

LN (

OD

DS

)LN

(O

DD

S)

GESLACHTGESLACHTVROUWVROUW MANMAN

GECOMBINEERDGECOMBINEERD

alle regressielijnen zijn evenwijdig aan elkaar. dusalle regressielijnen zijn evenwijdig aan elkaar. dusmaar ongelijk aanmaar ongelijk aan

model is: model is:

O R O R O RSTU D IE(1) STU D IE( ) STU D IE( ) 2 3 O R G EC O M

LN (O D D S) G ESL STU D IE(2) STU D IE(3) 0 1 2 3

Page 72: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

72

Model met covariaat/interactieModel met covariaat/interactie

logistisch regressiemodellogistisch regressiemodeluitvoer logistich regressiemodel met covariaatuitvoer logistich regressiemodel met covariaat

Variables in the EquationVariables in the Equation

-,197-,197 ,117,117 2,8292,829 11 ,093,093 ,821,821

139,246139,246 22 ,000,000

-,037-,037 ,110,110 ,110,110 11 ,740,740 ,964,964

-1,315-1,315 ,117,117 126,961126,961 11 ,000,000 ,268,268

,768,768 ,125,125 37,93037,930 11 ,000,000 2,1562,156

GESLACHTGESLACHT

STUDIESTUDIE

STUDIE(STUDIE(22))

STUDIE(STUDIE(33))

ConstantConstant

BB S.E.S.E. WaldWald dfdf Sig.Sig. Exp(B)Exp(B)

dus model is geschat door:dus model is geschat door:

ln (odds) = .768 - .197 geslacht - .037 studie (2) – 1.315 studie (3)ln (odds) = .768 - .197 geslacht - .037 studie (2) – 1.315 studie (3)

en en = exp (-.197) = .821= exp (-.197) = .821 nb! denk aan stappenplannb! denk aan stappenplan

O R adj

Page 73: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

73

MODEL MET COVARIAAT/INTERACTIE MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL

ad2.ad2. ER IS INTERACTIE TUSSEN STUDIERICHTING EN ER IS INTERACTIE TUSSEN STUDIERICHTING EN GESLACHTGESLACHT

LN (

OD

DS

)LN

(O

DD

S)

GESLACHTGESLACHTVROUWVROUW MANMAN

GECOMBINEERDGECOMBINEERD

REGRESSIELIJNEN ZIJN REGRESSIELIJNEN ZIJN NIETNIET EVENWIJDIG. DUS ER GELDT EVENWIJDIG. DUS ER GELDT NIETNIET==

MODEL IS: MODEL IS:

O R O R O RSTU D IE(1) STU D IE( ) STU D IE( ) 2 3 O R G EC O M

LN (O D D S) G ESL STU D IE(2) STU D IE(3)

+ G ESL STU D IE(2) G ESL STU D IE( )4

0 1 2 3

5 3

STUDIE 1STUDIE 1

STUDIE 2STUDIE 2

STUDIE 3STUDIE 3

Page 74: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

74

MODEL MET COVARIAAT/INTERACTIE MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL

UITVOER LOGISTISCH REGRESSIEMODEL MET INTERACTIEUITVOER LOGISTISCH REGRESSIEMODEL MET INTERACTIEVariables in the EquationVariables in the Equation

-1,052-1,052 ,263,263 16,03616,036 11 ,000,000 ,349,349

75,43075,430 22 ,000,000

-,790-,790 ,498,498 2,5222,522 11 ,112,112 ,454,454

-2,205-2,205 ,267,267 68,09468,094 11 ,000,000 ,110,110

15,46215,462 22 ,000,000

,832,832 ,510,510 2,6572,657 11 ,103,103 2,2982,298

1,1771,177 ,300,300 15,43615,436 11 ,000,000 3,2443,244

1,5441,544 ,253,253 37,33337,333 11 ,000,000 4,6844,684

GESLACHTGESLACHT

STUDIESTUDIE

STUDIE(STUDIE(22))

STUDIE(STUDIE(33))

GESLACHT * STUDIEGESLACHT * STUDIE

GESLACHT by STUDIE(GESLACHT by STUDIE(22))

GESLACHT by STUDIE(GESLACHT by STUDIE(33))

ConstantConstant

StepStep11

aa

BB S.E.S.E. WaldWald dfdf Sig.Sig. Exp(B)Exp(B)

. .

DUS MODEL IS GESCHAT DOOR:DUS MODEL IS GESCHAT DOOR:

LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) + .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3)+ .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3)

Page 75: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

75

MODEL MET COVARIAAT/INTERACTIE MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL

LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) + .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3)+ .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3)

OR VOOR STUDIERICHTING 1:LN(ODDS{M,ST1}) = 1.544-1.052

LN(ODDS{V,ST1})= 1.544

OR VOOR STUDIERICHTING 2:LN(ODDS{M,ST2}) = 1.544-1.052 - .79 + .832

LN(ODDS{V,ST2}) = 1.544 - .79

OP DEZELFDE MANIER

LN (O R ) 1.052 O R .349STU D IE1 STU D IE1

LN (O R ) 22 O R .803STU D IE2 STU D IE2

O R STU D IE3 1 1 3 3.

Page 76: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

76

MODEL MET COVARIAAT/INTERACTIE MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL

LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) + .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3)+ .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3)

OR VOOR STUDIERICHTING 1OR VOOR STUDIERICHTING 1::LN(ODDS{M,ST1}) = 1.544-1.052LN(ODDS{M,ST1}) = 1.544-1.052

LN(ODDS{V,ST1})= 1.544LN(ODDS{V,ST1})= 1.544

OR VOOR STUDIERICHTING 2:LN(ODDS{M,ST2}) = 1.544-1.052 - .79 + .832

LN(ODDS{V,ST2}) = 1.544 - .79

OP DEZELFDE MANIER

LN (O R ) 1.052 O R .349STU D IE1 STU D IE1

LN (O R ) 22 O R .803STU D IE2 STU D IE2

O R STU D IE3 1 1 3 3.

Page 77: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

77

MODEL MET COVARIAAT/INTERACTIE MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL

LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) + .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3)+ .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3)

OR VOOR STUDIERICHTING 1OR VOOR STUDIERICHTING 1::LN(ODDS{M,ST1}) = 1.544-1.052LN(ODDS{M,ST1}) = 1.544-1.052

LN(ODDS{V,ST1})= 1.544LN(ODDS{V,ST1})= 1.544

OR VOOR STUDIERICHTING 2OR VOOR STUDIERICHTING 2::LN(ODDS{M,ST2}) = 1.544-1.052 - .79 + .832LN(ODDS{M,ST2}) = 1.544-1.052 - .79 + .832

LN(ODDS{V,ST2}) = 1.544LN(ODDS{V,ST2}) = 1.544 - .79 - .79

OP DEZELFDE MANIER

LN (O R ) 1.052 O R .349STU D IE1 STU D IE1

LN (O R ) 22 O R .803STU D IE2 STU D IE2

O R STU D IE3 1 1 3 3.

Page 78: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

78

MODEL MET COVARIAAT/INTERACTIE MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL

LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) + .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3)+ .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3)

OR VOOR STUDIERICHTING 1OR VOOR STUDIERICHTING 1::LN(ODDS{M,ST1}) = 1.544-1.052LN(ODDS{M,ST1}) = 1.544-1.052

LN(ODDS{V,ST1})= 1.544LN(ODDS{V,ST1})= 1.544

OR VOOR STUDIERICHTING 2OR VOOR STUDIERICHTING 2::LN(ODDS{M,ST2}) = 1.544-1.052 - .79 + .832LN(ODDS{M,ST2}) = 1.544-1.052 - .79 + .832

LN(ODDS{V,ST2}) = 1.544LN(ODDS{V,ST2}) = 1.544 - .79 - .79

OP DEZELFDE MANIER OP DEZELFDE MANIER

LN (O R ) 1.052 O R .349STU D IE1 STU D IE1

LN (O R ) 22 O R .803STU D IE2 STU D IE2

O R STU D IE3 1 1 3 3.

Page 79: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

79

MODEL MET COVARIAAT/INTERACTIE MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL

ENKELE OPMERKINGEN:ENKELE OPMERKINGEN:

OR OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2 TABEL TE BEREKENEN

DE STUDIE-SPECIFIEKE OR’S OP BASIS VAN MODEL

IS OOK OP BASIS VAN EEN 2X2X2 TABEL TE BEREKENEN

DE VOOR STUDIERICHTING GECORRIGEERDE OR OP BASIS VAN MODELIS NIET EENVOUDIG UIT EEN 2X2X2 TABEL TE BEREKENEN

LN O D D S G ESL. 0 1

LN (O D D S) G ESL STU D IE(2) STU D IE(3)

+ G ESL STU D IE(2) G ESL STU D IE(3)4

0 1 2 3

5

LN (O D D S) G ESL STU D IE(2) STU D IE(3) 0 1 2 3

Page 80: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

80

MODEL MET COVARIAAT/INTERACTIE MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL

ENKELE OPMERKINGEN:ENKELE OPMERKINGEN:

OR OP BASIS VAN MODEL OR OP BASIS VAN MODEL IS OOK OP IS OOK OP BASIS VAN EEN 2X2 TABEL TE BEREKENENBASIS VAN EEN 2X2 TABEL TE BEREKENEN

DE STUDIE-SPECIFIEKE OR’S OP BASIS VAN MODEL

IS OOK OP BASIS VAN EEN 2X2X2 TABEL TE BEREKENEN

DE VOOR STUDIERICHTING GECORRIGEERDE OR OP BASIS VAN MODELIS NIET EENVOUDIG UIT EEN 2X2X2 TABEL TE BEREKENEN

LN O D D S G ESL. 0 1

LN (O D D S) G ESL STU D IE(2) STU D IE(3)

+ G ESL STU D IE(2) G ESL STU D IE(3)4

0 1 2 3

5

LN (O D D S) G ESL STU D IE(2) STU D IE(3) 0 1 2 3

Page 81: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

81

MODEL MET COVARIAAT/INTERACTIE MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL

ENKELE OPMERKINGEN:ENKELE OPMERKINGEN:

OR OP BASIS VAN MODEL OR OP BASIS VAN MODEL IS OOK OP IS OOK OP BASIS VAN EEN 2X2 TABEL TE BEREKENENBASIS VAN EEN 2X2 TABEL TE BEREKENEN

DE STUDIE-SPECIFIEKE OR’S OP BASIS VAN MODELDE STUDIE-SPECIFIEKE OR’S OP BASIS VAN MODEL

IS OOK OP IS OOK OP BASIS VAN EEN 2X2X2 TABEL TE BEREKENENBASIS VAN EEN 2X2X2 TABEL TE BEREKENEN

DE VOOR STUDIERICHTING GECORRIGEERDE OR OP BASIS VAN MODELIS NIET EENVOUDIG UIT EEN 2X2X2 TABEL TE BEREKENEN

LN O D D S G ESL. 0 1

LN (O D D S) G ESL STU D IE(2) STU D IE(3)

+ G ESL STU D IE(2) G ESL STU D IE(3)4

0 1 2 3

5

LN (O D D S) G ESL STU D IE(2) STU D IE(3) 0 1 2 3

Page 82: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

82

MODEL MET COVARIAAT/INTERACTIE MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL

ENKELE OPMERKINGEN:ENKELE OPMERKINGEN:

OR OP BASIS VAN MODEL OR OP BASIS VAN MODEL IS OOK OP IS OOK OP BASIS VAN EEN 2X2 TABEL TE BEREKENENBASIS VAN EEN 2X2 TABEL TE BEREKENEN

DE STUDIE-SPECIFIEKE OR’S OP BASIS VAN MODELDE STUDIE-SPECIFIEKE OR’S OP BASIS VAN MODEL

IS OOK OP IS OOK OP BASIS VAN EEN 2X2X2 TABEL TE BEREKENENBASIS VAN EEN 2X2X2 TABEL TE BEREKENEN

DE VOOR STUDIERICHTING GECORRIGEERDE OR OP BASIS DE VOOR STUDIERICHTING GECORRIGEERDE OR OP BASIS VAN MODELVAN MODELIS NIET EENVOUDIG UIT EEN 2X2X2 TABEL TE BEREKENENIS NIET EENVOUDIG UIT EEN 2X2X2 TABEL TE BEREKENEN

LN O D D S G ESL. 0 1

LN (O D D S) G ESL STU D IE(2) STU D IE(3)

+ G ESL STU D IE(2) G ESL STU D IE(3)4

0 1 2 3

5

LN (O D D S) G ESL STU D IE(2) STU D IE(3) 0 1 2 3

Page 83: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

83

LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL

• BEPERKING LINEAIRE REGRESSIEMODELBEPERKING LINEAIRE REGRESSIEMODEL

• SPECIFICATIE VAN HET MODELSPECIFICATIE VAN HET MODEL

• VERGELIJKING MET EEN KRUISTABELANALYSEVERGELIJKING MET EEN KRUISTABELANALYSE

• MODEL MET COVARIAAT/INTERACTIEMODEL MET COVARIAAT/INTERACTIE

• TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLENTOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN

• STAPSGEWIJZE LOGISTISCHE REGRESSIE

Page 84: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

84

TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLENTOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLENLOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL

DRIE MODELLENDRIE MODELLEN

1.1.

2.2.

3.3.

LN O D D S G ESL. 0 1

LN (O D D S) G ESL STU D IE(2) STU D IE(3)

+ G ESL STU D IE(2) G ESL STU D IE(3)4

0 1 2 3

5

LN (O D D S) G ESL STU D IE(2) STU D IE(3) 0 1 2 3

Page 85: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

85

TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL

Dependent Variable Encoding

0

1

Original Valueniet

wel

Internal Value

Categorical Variables Codings

4 ,000 ,000

4 1,000 ,000

4 ,000 1,000

1,00

2,00

3,00

STUDIEFrequency (1) (2)

Parameter coding

Page 86: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

86

TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL

Block 0: Beginning BlockBlock 0: Beginning Block

Variables in the Equation

,123 ,041 9,225 1 ,002 1,131ConstantStep 0B S.E. Wald df Sig. Exp(B)

MODEL ISMODEL IS LN O D D S 0

Page 87: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

87

TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL

Model Summary

3320,596 ,019 ,026Step1

-2 Loglikelihood

Cox & SnellR Square

NagelkerkeR Square

Variables in the Equation

,612 ,090 46,599 1 ,000 1,844

-,305 ,075 16,538 1 ,000 ,737

GESLACHT

Constant

Step1

a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: GESLACHT.a.

Block 1: Method = EnterBlock 1: Method = Enter

MODEL LN O D D S G ESL. 0 1

Omnibus Tests of Model Coefficients

47,175 1 ,000

47,175 1 ,000

47,175 1 ,000

Step

Block

Model

Step 1Chi-square df Sig.

Page 88: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

88

TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL

Block 2: Method = EnterBlock 2: Method = EnterMODELMODEL LN (O D D S) G ESL STU D IE(2) STU D IE(3) 0 1 2 3

Omnibus Tests of Model Coefficients

149,724 2 ,000

149,724 2 ,000

196,898 3 ,000

Step

Block

Model

Step 1Chi-square df Sig.

Variables in the Equation

-,197 ,117 2,829 1 ,093 ,821

139,246 2 ,000

-,037 ,110 ,110 1 ,740 ,964

-1,315 ,117 126,961 1 ,000 ,268

,768 ,125 37,930 1 ,000 2,156

GESLACHT

STUDIE

STUDIE(2)

STUDIE(3)

Constant

Step1

a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: GESLACHT, STUDIE.a.

-2LL = 3320.596 – 149.724 = 3170.872

Page 89: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

89

TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL

Block 3: Method = EnterBlock 3: Method = Enter

LN (O D D S) G ESL STU D IE(2) STU D IE(3)

+ G ESL STU D IE(2) G ESL STU D IE(3)4

0 1 2 3

5

MODELMODEL

-2LL = 3170.872 – 17.197 = 3153.675

Variables in the Equation

-1,052 ,263 16,036 1 ,000 ,349

75,430 2 ,000

-,790 ,498 2,522 1 ,112 ,454

-2,205 ,267 68,094 1 ,000 ,110

15,462 2 ,000

,832 ,510 2,657 1 ,103 2,298

1,177 ,300 15,436 1 ,000 3,244

1,544 ,253 37,333 1 ,000 4,684

GESLACHT

STUDIE

STUDIE(1)

STUDIE(2)

GESLACHT * STUDIE

GESLACHT by STUDIE(1)

GESLACHT by STUDIE(2)

Constant

Step1

a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: GESLACHT, STUDIE, GESLACHT * STUDIE .a.

STEP = 17.197 DF = 2 P-WAARDE = .0002

Page 90: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

90

TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL

WELK MODELWELK MODEL::

OP GROND VAN TOP-DOWN PROCEDUREOP GROND VAN TOP-DOWN PROCEDURE

KEUZE MODEL MET INTERACTIEKEUZE MODEL MET INTERACTIE

DUS INTERPRETEREN DE STUDIE-SPECIFIEKE ODDSRATIOSDUS INTERPRETEREN DE STUDIE-SPECIFIEKE ODDSRATIOS

Page 91: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

91

TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL

LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) + .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3)+ .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3)

OR VOOR STUDIERICHTING 1OR VOOR STUDIERICHTING 1::LN(ODDS{M,ST1} = 1.544-1.052LN(ODDS{M,ST1} = 1.544-1.052

LN(ODDS{V,ST1} = 1.544LN(ODDS{V,ST1} = 1.544

OR VOOR STUDIERICHTING 2OR VOOR STUDIERICHTING 2::LN(ODDS{M,ST2} = 1.544-1.052 - .79 + .832LN(ODDS{M,ST2} = 1.544-1.052 - .79 + .832

LN(ODDS{V,ST2} = 1.544LN(ODDS{V,ST2} = 1.544 - .79 - .79

OP DEZELFDE MANIER OP DEZELFDE MANIER

LN (O R ) 1.052 O R .349STU D IE1 STU D IE1

LN (O R ) 22 O R .803STU D IE2 STU D IE2

O R STU D IE3 1 1 3 3.

Page 92: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

92

TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL

ER IS INTERACTIE TUSSEN STUDIERICHTING EN GESLACHTER IS INTERACTIE TUSSEN STUDIERICHTING EN GESLACHT

LN (

OD

DS

)LN

(O

DD

S)

GESLACHTGESLACHTVROUWVROUW MANMAN

STUDIE 1STUDIE 1

STUDIE 2STUDIE 2

STUDIE 3STUDIE 3

CONCLUSIECONCLUSIE

Page 93: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

93

AncovaAncovacovariantieanalysecovariantieanalyse

groepen met elkaar te vergelijken in aanwezigheid groepen met elkaar te vergelijken in aanwezigheid van covariatenvan covariaten

covariaatcovariaat

een onafhankelijke variabele in het model waarvan een onafhankelijke variabele in het model waarvan het effect niet interessant is voor de het effect niet interessant is voor de onderzoeksvraagonderzoeksvraag

Page 94: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

94

AncovaAncovacovariantieanalysecovariantieanalyse

•VoorbeeldVoorbeeld

•T-toets versus lineaire regressie

•Model met storende variabele

•Welk model verdient de voorkeur

Page 95: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

95

AncovaAncovacovariantieanalysecovariantieanalyse

•VoorbeeldVoorbeeld

•T-toets versus lineaire regressieT-toets versus lineaire regressie

•Model met storende variabele

•Welk model verdient de voorkeur

Page 96: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

96

AncovaAncovacovariantieanalysecovariantieanalyse

•VoorbeeldVoorbeeld

•T-toets versus lineaire regressieT-toets versus lineaire regressie

•Model met storende variabeleModel met storende variabele

•Welk model verdient de voorkeur

Page 97: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

97

AncovaAncovacovariantieanalysecovariantieanalyse

•VoorbeeldVoorbeeld

•T-toets versus lineaire regressieT-toets versus lineaire regressie

•Model met storende variabeleModel met storende variabele

•Welk model verdient de voorkeurWelk model verdient de voorkeur

Page 98: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

98

VoorbeeldVoorbeeldcovariantieanalysecovariantieanalyse

Vergelijken tussen rokers en niet rokers met Vergelijken tussen rokers en niet rokers met Betrekking tot verandering in polsslag na een Betrekking tot verandering in polsslag na een LoopoefeningLoopoefening

PO

LSP

OLS

GEWICHTGEWICHT

ROKERROKER

NIET ROKERNIET ROKER

Page 99: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

99

AncovaAncovacovariantieanalysecovariantieanalyse

•VoorbeeldVoorbeeld

•T-toets versus lineaire regressieT-toets versus lineaire regressie

•Model met storende variabele

•Welk model verdient de voorkeur

Page 100: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

100

T-toets versus lineaire regressieT-toets versus lineaire regressiecovariantieanalysecovariantieanalyse

Twee formuleringen:Twee formuleringen:

1.1. Vergelijken tussen twee onafhankelijke Vergelijken tussen twee onafhankelijke steekproeven. Leidt tot t-toets.steekproeven. Leidt tot t-toets.

2.2. Effect van roken op verandering in polsslag.Effect van roken op verandering in polsslag.Leidt tot lineaire regressieLeidt tot lineaire regressie..

Page 101: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

101

T-toets versus lineaire regressieT-toets versus lineaire regressie

covariantieanalysecovariantieanalyse

Group StatisticsGroup Statistics

SMOKESMOKE NN MeanMean Std. DeviationStd. Deviation Std. ErrorStd. Error

nono 2323 21,347821,3478 16,151616,1516 3,3678 3,3678

POLSPOLS

yesyes 1212 14,250014,2500 11,925011,9250 3,44243,4424

ad 1.ad 1. t-toets voor onafhankelijke steekproevent-toets voor onafhankelijke steekproeven

Independent Samples Test

t-test for Equality of Means

t df Sig. (2-tailed) Mean Difference

Equal variances assumed 1,340 33 ,189 7,0978

Page 102: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

102

T-toets versus lineaire regressieT-toets versus lineaire regressie

covariantieanalysecovariantieanalyse

Group StatisticsGroup Statistics

SMOKESMOKE NN MeanMean Std. DeviationStd. Deviation Std. ErrorStd. Error

nono 2323 21,347821,3478 16,151616,1516 3,3678 3,3678

POLSPOLS

yesyes 1212 14,250014,2500 11,925011,9250 3,44243,4424

ad 1.ad 1. t-toets voor onafhankelijke steekproevent-toets voor onafhankelijke steekproeven

Independent Samples TestIndependent Samples Test

t-test for Equality of Meanst-test for Equality of Means

tt df df Sig. (2-tailed)Sig. (2-tailed) Mean DifferenceMean Difference

Equal variances assumedEqual variances assumed 1,3401,340 3333 ,189,189 7,09787,0978

Page 103: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

103

T-toets versus lineaire regressieT-toets versus lineaire regressiecovariantieanalysecovariantieanalyse

ad 2.ad 2. lineaire regressielineaire regressie

PO

LSP

OLS

ROKENROKEN

ROKERROKER

NIET ROKERNIET ROKER21.421.4

14.314.3

ModelModel PO LS b b R O KEN e0 1 Y Y br nr 1

NIETNIET

(CODE 0)(CODE 0)

WELWEL

(CODE 1)(CODE 1)

Dus een negatieve hellingDus een negatieve helling

Page 104: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

104

T-toets versus lineaire regressieT-toets versus lineaire regressiecovariantieanalysecovariantieanalyse

Unstandardized CoefficientsUnstandardized Coefficients

ModelModel BB Std. Error Std. Error t t Sig.Sig.

(Constant)(Constant) 21,34821,348 3,1023,102 6,8826,882 ,000,000

SMOKESMOKE -7,098-7,098 5,2985,298 -1,340-1,340 ,189,189

uitvoer enkelvoudige regressieanalyseuitvoer enkelvoudige regressieanalyse

dus model isdus model is Y = 21.4 – 7.1 ROKEN + e Y = 21.4 – 7.1 ROKEN + e

Y Y br nr 1 = -7.1

Page 105: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

105

AncovaAncovacovariantieanalysecovariantieanalyse

•VoorbeeldVoorbeeld

•T-toets versus lineaire regressieT-toets versus lineaire regressie

•Model met storende variabeleModel met storende variabele

•Welk model verdient de voorkeur

Page 106: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

106

Model met storende variabeleModel met storende variabeleCOVARIANTIEANALYSECOVARIANTIEANALYSE

lichaamsgewicht is potentiele storende variabelelichaamsgewicht is potentiele storende variabele

er zijn drie mogelijkhedener zijn drie mogelijkheden

PO

LSP

OLS

GEWICHTGEWICHT

ROKERROKER

NIET ROKERNIET ROKER

Page 107: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

107

Model met storende variabeleModel met storende variabelecovariantieanalysecovariantieanalyse

a. gewicht is geen storende variabelea. gewicht is geen storende variabeleP

OL S

PO

L S

ROKENROKEN

ROKERROKER

NIET ROKERNIET ROKER21.421.4

14.314.3

Page 108: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

108

Model met storende variabeleModel met storende variabelecovariantieanalysecovariantieanalyse

b. gewicht is een covariaat(confounder)b. gewicht is een covariaat(confounder)

twee evenwijdige regressielijnentwee evenwijdige regressielijnen

PO

LSP

OLS

GEWICHTGEWICHT

ROKERROKER

NIET ROKERNIET ROKER

Page 109: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

109

Model met storende variabeleModel met storende variabelecovariantieanalysecovariantieanalyse

c. er is een interactie tussen gewicht en rokenc. er is een interactie tussen gewicht en roken

twee niet evenwijdige regressielijnentwee niet evenwijdige regressielijnen

PO

LSP

OLS

GEWICHTGEWICHT

ROKERROKER

NIET ROKERNIET ROKER

Page 110: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

110

Model met storende variabeleModel met storende variabelecovariantieanalysecovariantieanalyse

ad b.ad b. als gewicht een covariaat is, dan als gewicht een covariaat is, dan modelmodel PO LS R O KEN G EW IC H T 0 1 2

POLSPOLS

GEWICHTGEWICHT

21.421.4

14.314.3

Y adj

zonder gewicht:zonder gewicht: Y Y Y 14.3 21.4 7.1r nr

met gewicht als covariaat:met gewicht als covariaat: Y adj 1

Page 111: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

111

Model met storende variabeleModel met storende variabelecovariantieanalysecovariantieanalyse

PO LS R O KEN G EW IC H T 0 1 2

POLSPOLS

GEWICHTGEWICHT

21.421.4

14.314.3

Y adj

Y adj 1

E(Y |R O KER ) G EW IC H T

E(Y |N IET R O KER ) G EW IC H T

0 1 2

0 1 2

1

0

Page 112: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

112

Model met storende variabeleModel met storende variabelecovariantieanalysecovariantieanalyse

Unstandardized CoefficientsUnstandardized Coefficients

ModelModel BB Std. ErrorStd. Error tt Sig.Sig.

(Constant)(Constant) 69,79169,791 15,29915,299 4,5624,562 ,000,000

SMOKESMOKE -4,398-4,398 4,7514,751 -,926-,926 ,362,362

weight in poundsweight in pounds -,325-,325 ,101,101 -3,218-3,218 ,003,003

uitvoer regressiemodel met covariaatuitvoer regressiemodel met covariaat

dus model is:dus model is: Y = 69.2 – 4.4 ROKEN -.3 GEWICHT+e Y = 69.2 – 4.4 ROKEN -.3 GEWICHT+e

Y badj 1 = - 4.4

Page 113: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

113

Model met storende variabeleModel met storende variabelecovariantieanalysecovariantieanalyse

ad c.ad c. als er een interactie is tussen gewicht en als er een interactie is tussen gewicht en roken , dan model:roken , dan model:PO LS R O KEN G EW IC H T R O KEN G EW IC H T 0 1 2 3POLSPOLS

GEWICHTGEWICHT

21.421.4

14.314.3

Y adj

MET INTERACTIETERM:MET INTERACTIETERM: Y G EW IC H Tadj 1 3

R_G

Page 114: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

114

Model met storende variabeleModel met storende variabelecovariantieanalysecovariantieanalyse

PO LS R O KEN G EW IC H T R O KEN G EW IC H T 0 1 2 3

POLSPOLS

GEWICHTGEWICHT

21.421.4

14.314.3

Y adj Y G EW IC H Tadj 1 3

R_GR_G

E(Y |R O KER ) G EW IC H T + 1 G EW IC H T

E(Y |N IET R O KER ) G EW IC H T G EW IC H T3

3

0 1 2

0 1 2

1

0 0

Page 115: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

115

Model met storende variabeleModel met storende variabelecovariantieanalysecovariantieanalyse

Unstandardized CoefficientsUnstandardized Coefficients

ModelModel BB Std. ErrorStd. Error t t Sig. Sig.

(Constant)(Constant) 83,32483,324 19,85519,855 4,1974,197 ,000,000

SMOKESMOKE -37,933-37,933 31,81231,812 -1,192-1,192 ,242,242

weight in poundsweight in pounds -,416-,416 ,132,132 -3,152-3,152 ,004,004

R_GR_G ,218,218 ,205,205 1,0661,066 ,295,295

uitvoer regressiemodel met interactieuitvoer regressiemodel met interactie

dus model isdus model is: Y = 83.3 – 37.9 ROKEN - .4 GEWICHT + .2 R_G + e : Y = 83.3 – 37.9 ROKEN - .4 GEWICHT + .2 R_G + e

Y G EW IC H Tadj 3 7 9 2. .

Page 116: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

116

AncovaAncovacovariantieanalysecovariantieanalyse

•VoorbeeldVoorbeeld

•T-toets versus lineaire regressieT-toets versus lineaire regressie

•Model met storende variabeleModel met storende variabele

•Welk model verdient de voorkeurWelk model verdient de voorkeur

Page 117: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

117

Welk model verdient de voorkeurWelk model verdient de voorkeurcovariantieanalysecovariantieanalyse

Toetsing volgens de top-down principeToetsing volgens de top-down principeHet meest algemene model:Het meest algemene model:

1. Toets op interactieals dan geen interactie

2. Bij een niet significant resultaattoets op de covariaatAls dan is gewicht geen storende variabele

PO LS R O KEN G EW IC H T R O KEN G EW IC H T 0 1 2 3

3 0H

H0 3

3

0

0

:

:

a

2 0H

H0 2

2

0

0

:

:

a

Page 118: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

118

Welk model verdient de voorkeurWelk model verdient de voorkeurcovariantieanalysecovariantieanalyse

Toetsing volgens de top-down principeToetsing volgens de top-down principeHet meest algemene model:Het meest algemene model:

1.1. Toets op interactieToets op interactieals als dan geen interactie dan geen interactie

1. Bij een niet significant resultaattoets op de covariaatAls dan is gewicht geen storende variabele

PO LS R O KEN G EW IC H T R O KEN G EW IC H T 0 1 2 3

3 0

H

H0 3

3

0

0

:

:

a

2 0H

H0 2

2

0

0

:

:

a

Page 119: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

119

Welk model verdient de voorkeurWelk model verdient de voorkeurcovariantieanalysecovariantieanalyse

Toetsing volgens de top-down principeToetsing volgens de top-down principeHet meest algemene model:Het meest algemene model:

1.1. Toets op interactieToets op interactieals als dan geen interactie dan geen interactie

2. Bij een niet significant resultaattoets op de covariaatAls dan is gewicht geen storende variabele

PO LS R O KEN G EW IC H T R O KEN G EW IC H T 0 1 2 3

3 0

H

H0 3

3

0

0

:

:

a

2 0 H

H0 2

2

0

0

:

:

a

Page 120: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

120

AncovaAncovacovariantieanalysecovariantieanalyse

Unstandardized CoefficientsUnstandardized Coefficients

ModelModel BB Std. ErrorStd. Error t t Sig. Sig.

11 (Constant)(Constant) 21,34821,348 3,1023,102 6,882 6,882 ,000,000

SMOKESMOKE -7,098-7,098 5,2985,298 -1,340-1,340 ,189,189

22 (Constant)(Constant) 69,79169,791 15,29915,299 4,5624,562 ,000,000

SMOKESMOKE -4,398-4,398 4,7514,751 -,926-,926 ,362,362

weight in poundsweight in pounds -,325-,325 ,101,101 -3,218-3,218 ,003,003

33 (Constant)(Constant) 83,32483,324 19,85519,855 4,1974,197 ,000,000

SMOKESMOKE -37,933-37,933 31,81231,812 -1,192-1,192 ,242,242

weight in poundsweight in pounds -,416-,416 ,132,132 -3,152-3,152 ,004,004

R_GR_G ,218,218 ,205,205 1,0661,066 ,295,295

Page 121: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

121

Regressie met dummy variabelenRegressie met dummy variabelenmeervoudig lineair regressiemodelmeervoudig lineair regressiemodel

ÉéÉén discrete variabele met twee categorien discrete variabele met twee categorieëënn

1 als IQ hoog1 als IQ hoogIQ = IQ =

0 als IQ laag0 als IQ laag

Indicator voor mensen Indicator voor mensen met een hoog IQmet een hoog IQ

CIJ

FE

RC

IJF

ER

IQIQ00 11

Page 122: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

122

Regressie met dummy variabelenRegressie met dummy variabelenmeervoudig lineair regressiemodelmeervoudig lineair regressiemodel

ÉéÉén discrete variabele met twee categorien discrete variabele met twee categorieëënnCijferCijfer

IQIQ00 11

Model:Model:Y X 0 1

E(Y|X=1)E(Y|X=1)

E(Y|X=0)E(Y|X=0)E(Y | X) X 0 1

UIT FIGUUR:

1

a

b

E(Y | X 1) E(Y | X 0)

1E(Y | X 1) E(Y | X 0)

a

b

Page 123: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

123

Regressie met dummy variabelenRegressie met dummy variabelenmeervoudig lineair regressiemodelmeervoudig lineair regressiemodel

ÉéÉén discrete variabele met twee categorien discrete variabele met twee categorieëënnCijferCijfer

IQIQ00 11

Model:Model:Y X 0 1

E(Y|X=1)E(Y|X=1)

E(Y|X=0)E(Y|X=0)E(Y | X) X 0 1

Uit figuur:

1

a

b

E(Y | X 1) E(Y | X 0)

1E(Y | X 1) E(Y | X 0)

a

b

Page 124: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

124

Regressie met dummy variabelenRegressie met dummy variabelenmeervoudig lineair regressiemodelmeervoudig lineair regressiemodel

ÉéÉén discrete variabele met twee categorien discrete variabele met twee categorieëënnCijferCijfer

IQIQ00 11

E(Y|X=1)E(Y|X=1)

E(Y|X=0)E(Y|X=0)E(Y | X) X 0 1

aa

bbE(Y | X) X 0 1

Door berekening:Door berekening:

E(Y|X=1)=

E(Y|X=0)=

DUS

0 1

0

1 E(Y | X 1) E (Y | X 0)

Page 125: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

125

Regressie met dummy variabelenRegressie met dummy variabelenmeervoudig lineair regressiemodelmeervoudig lineair regressiemodel

ÉéÉén discrete variabele met twee categorien discrete variabele met twee categorieëënnCijferCijfer

IQIQ00 11

E(Y|X=1)E(Y|X=1)

E(Y|X=0)E(Y|X=0)E(Y | X) X 0 1

aa

bbE(Y | X) X 0 1

Door berekening:Door berekening:

E(Y|X=1)=

E(Y|X=0)=

DUS

0 1

0

1 E(Y | X 1) E (Y | X 0)

Page 126: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

126

Regressie met dummy variabelenRegressie met dummy variabelenmeervoudig lineair regressiemodelmeervoudig lineair regressiemodel

ÉéÉén discrete variabele met drie categorien discrete variabele met drie categorieëënn

YY YY

XX XX11 22 33 00 11 55

Model specificatie Model specificatie is fout want is fout want lineairiteit alleen voldaan onder speciale coderinglineairiteit alleen voldaan onder speciale codering

Y IQ 0 1

Page 127: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

127

Regressie met dummy variabelenRegressie met dummy variabelenmeervoudig lineair regressiemodelmeervoudig lineair regressiemodel

Een andere manier om de drie groepen te Een andere manier om de drie groepen te onderscheiden is d.m.v. drie indicatorenonderscheiden is d.m.v. drie indicatoren

D_HOOGD_HOOG 11 0 0

HoogHoog Niet zoNiet zoD_GEMD_GEM

11 0 0

GemidGemid.. Niet zoNiet zo

D_LAAGD_LAAG 11 0 0

LaagLaag Niet zoNiet zo

Page 128: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

128

Regressie met dummy variabelenRegressie met dummy variabelenmeervoudig lineair regressiemodelmeervoudig lineair regressiemodel

Een andere manier om de drie groepen te Een andere manier om de drie groepen te onderscheiden is d.m.v. drie indicatorenonderscheiden is d.m.v. drie indicatoren

D_HOOGD_HOOG 11 0 0

HoogHoog Niet zoNiet zoD_GEMD_GEM

11 0 0

GemidGemid.. Niet zoNiet zo

D_LAAGD_LAAG 11 0 0

LaagLaag Niet zoNiet zo

Twee van de drie indicatoren voldoende om de drieTwee van de drie indicatoren voldoende om de driegroepen te onderscheidengroepen te onderscheiden

Page 129: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

129

Regressie met dummy variabelenRegressie met dummy variabelenmeervoudig lineair regressiemodelmeervoudig lineair regressiemodel

IQIQ D_HOOGD_HOOG D_GEMD_GEM

HOOGHOOG 11 00

HOOGHOOG 11 00

HOOGHOOG 11 00

GEMIDGEMID 00 11

GEMIDGEMID 00 11

GEMIDGEMID 00 11

GEMIDGEMID 00 11

LAAGLAAG 00 00

LAAGLAAG 00 00

LAAGLAAG 00 00

LAAGLAAG 00 00

LAAGLAAG 00 00

VoorbeeldVoorbeeld

Page 130: 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek.

130

Regressie met dummy variabelenRegressie met dummy variabelenmeervoudig lineair regressiemodelmeervoudig lineair regressiemodel

Model specificatie:Model specificatie:

nu is wel aan de lineairiteitseis voldaannu is wel aan de lineairiteitseis voldaan

C IJFER D _ H O O G D _ G EM 0 1 2