1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en...

Post on 08-Jun-2015

217 views 4 download

Transcript of 1 Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en...

1

Cursus Mei – Juni 2002Cursus Mei – Juni 2002Kruistabelanalyse & Logistische regressieKruistabelanalyse & Logistische regressie

Frans Tan Methodologie en StatistiekFrans Tan Methodologie en Statistiek

2

Programma

1. 06-5

2. 13-5

3. 27-5

4. 03-6

5. 10-6

6. 17-6

• Confounding, standaardisatie, Mantel Haenszel

• Enkelvoudige logistische reg. Dummy variabelen

• Log.reg. Met covariaten en interactie• Bespreking opdrachten• Vergelijking met Ancova• Bespreking opdrachten

3

VoorkennisVoorkennis

• Toetsingstheorie

• Multipele regressie

OnderwerpenOnderwerpen

• ConfoundingConfounding• Standaardisatie/stratificatie/Mantel-HaenszelStandaardisatie/stratificatie/Mantel-Haenszel• Logistische regressieLogistische regressie

4

Onderzoekskader: valideringsproblemenOnderzoekskader: valideringsproblemen

• Effect van een bepaalde behandeling op objects (bijv. Personen)

• Ook algemener: (causaal) effect van een grootheid X op een grootheid Y

5

Onderzoekskader: valideringsproblemenOnderzoekskader: valideringsproblemen

GroepGroep

behandelingbehandeling

Geen behandelingGeen behandeling

discrepantiediscrepantie

Ideale situatie niet haalbaar. Ideale situatie niet haalbaar. Werken met proxy-controle groepWerken met proxy-controle groep

6

Onderzoekskader: valideringsproblemenOnderzoekskader: valideringsproblemen

• De groepen kunnen van elkaar verschillen door andere factoren (welke op zichzelf gerelateerd zijn aan de afhankelijke variabele) dan de behandeling zelf

• Associatie impliceert niet causale relatie tussen X en Y• Voldoende voor geen confounding is

- een gebalanceerd design- een gerandomiseerde toewijzing in groepen

Confounding (adequacy of the control group)Confounding (adequacy of the control group)

7

Onderzoekskader: valideringsproblemenOnderzoekskader: valideringsproblemen

• Definitie volgens adequaatheid van de controle groep vaak verward met collapsibility principe

• Collapsibility: er is sprake van confounding als de ruwe (marginale) associatie ongelijk is aan de stratumspecifieke associatie

8

Illustratie 1. De (fictieve) resultaten van een onderzoek naar de effectiviteit van veiligheidsgordels

Overleven

gecombineerd Lage snelheid Hoge snelheid

nee ja Nee ja nee ja

nee 20 30 2 18 18 12

Gordel

ja 10 40 4 36 6 4

RR (OR) 2 ( 2.67) 1 ( 1) 1 (1)

Snelheid een confounder ?Snelheid een confounder ?

9

Illustratie 2. Effect leeftijd moeder op sterfte bij geboorte kind

Kindersterfte

gecombineerd ondergewicht Normaal gew.

ja nee ja nee ja nee

oud 100 900 90 540 10 450

Lft.

moeder

jong 10 255 5 30 5 225

RR (OR) 2.65 ( 2.83) 1 ( 1) 1 (1)

Geboortegewicht een confounder ?Geboortegewicht een confounder ?

10

Illustratie 3. Effect medicijn op genezingeen gebalanceerd design

genezen

gecombineerd lichtzieken zwaarzieken

ja nee ja nee ja nee

Int. 115 85 95 5 20 80

medicijn

Contr. 85 115 80 20 5 95

RR (OR) 1.35 ( 1.83) 1.19 ( 4.75) 4.0 (4.75)

Ernst van de ziekte een confounder ?Ernst van de ziekte een confounder ?

11

Confounding

1. C is geen causaal gevolg van R (mediator)

2. Geen gerandomiseerd design

3. Geen balanced design

4. Ruwe RR(OR) ongelijk aan de stratum specifieke RR (OR)

Als een factor C een confounder is, danAls een factor C een confounder is, dan

12

Confounding

• Het negeren van een confounder leidt tot vertekende resultaten (bias)• Een maat voor de invloed van een confounder is bias• Stel de werkelijke (populatie) waarde van een behandelingseffect

en ô een schatter voor

bias (ô) = verwachte waarde (ô) -

waarbij de verwachte waarde gelijk is aan de gemiddelde waarde van alle mogelijke ô ‘s na een groot aantal herhalingen van het onderzoek

13

Methoden voor bias controle

• Standaardisatie- directe- indirecte

• Stratificatie volgens Mantel Haenszel• Correlationele methoden

14

Directe standaardisatie

confounder Fractie groep 1

Fractie groep 2

Standaard verdeling

1 p11 p21 fs1

2 p12 p22 fs2

. . . .

J p1J p2J fsJ

Verdeling van de confounder standaardiseren door Verdeling van de confounder standaardiseren door een verdeling van een standaard populatieeen verdeling van een standaard populatie

Relatief risico groep 1 t.o.v groep 2Relatief risico groep 1 t.o.v groep 2

RRp f p f p f

p f p f p fad js s J sJ

s s J sJ

11 1 1 2 2 1

2 1 1 2 2 2 2

. . .

. . .

15

Indirecte standaardisatie

confounder Fractie groep 1

Standaard verdeling

fs1 pc1

fs2 pc2

. .

fsJ pc2

Overall 1 pv pc

Verdeling van de specifieke fracties standaardiseren Verdeling van de specifieke fracties standaardiseren en vervolgens correctie toepassen m.b.v. SMRen vervolgens correctie toepassen m.b.v. SMR

Als standaard Als standaard populatie de controle populatie de controle groep is, dan is groep is, dan is RrRradjadj = SMR = SMR

SM Rp

p f p f p fv

c s c s cJ sJ

1 1 2 2 . . .

16

Enkele opmerkingen

• Compacte samenvatting van wat gaande is• Als steekproefaantal per stratum klein of zelfs nul• Als RR constant over strata van de confounder, dan

levert de directe methode veelal een schatting op zonder vertekening

• Indirecte standaardisatie alleen onvertekend als standaard populatie een van de groepen is

• Geen toets voorhanden• Variatie over strata door standaardisatie gemaskeerd

17

Stratificatie volgens Mantel Haenszel

• Is de associatie consistent over strata, d.w.z. zijn de waargenomen verschillen toe te schrijven aan toeval?

• Stel associatie consistent over strata. Is de overall associatie gecorrigeerd voor confounder statistisch significant?

• Stel overall associatie is statistisch significant. Hoe groot is de standaardfout van de overall schatting?

18

Stratificatie volgens Mantel Haenszel

• Als associatie niet consistent, dan Mantel Haenszel niet geschikt

• Mogelijk betrouwbaarheidsintervallen te contrueren

• Onder consistentie is de Mantel-Haenszel schatter onvertekend

19

Logistisch regressiemodelLogistisch regressiemodel

• sgewijze logistische regressie

• lll

20

Logistisch regressiemodelLogistisch regressiemodel• Beperking lineaire regressiemodelBeperking lineaire regressiemodel

• Specificatie van het model

• Vergelijking met een kruistabelanalyse

• Model met covariaat/interactie

• Toetsen voor het vergelijken tussen modellen

• Stapsgewijze logistische regressie

21

Logistisch regressiemodelLogistisch regressiemodel• Beperking lineaire regressiemodelBeperking lineaire regressiemodel

• Specificatie van het modelSpecificatie van het model

• Vergelijking met een kruistabelanalyse

• Model met covariaat/interactie

• Toetsen voor het vergelijken tussen modellen

• Stapsgewijze logistische regressie

22

Logistisch regressiemodelLogistisch regressiemodel• Beperking lineaire regressiemodelBeperking lineaire regressiemodel

• Specificatie van het modelSpecificatie van het model

• Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyse

• Model met covariaat/interactie

• Toetsen voor het vergelijken tussen modellen

• Stapsgewijze logistische regressie

23

Logistisch regressiemodelLogistisch regressiemodel• Beperking lineaire regressiemodelBeperking lineaire regressiemodel

• Specificatie van het modelSpecificatie van het model

• Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyse

• Model met covariaat/interactieModel met covariaat/interactie

• Toetsen voor het vergelijken tussen modellen

• Stapsgewijze logistische regressie

24

Logistisch regressiemodelLogistisch regressiemodel• Beperking lineaire regressiemodelBeperking lineaire regressiemodel

• Specificatie van het modelSpecificatie van het model

• Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyse

• Model met covariaat/interactieModel met covariaat/interactie

• Toetsen voor het vergelijken tussen modellenToetsen voor het vergelijken tussen modellen

• Stapsgewijze logistische regressie

25

Logistisch regressiemodelLogistisch regressiemodel• Beperking lineaire regressiemodelBeperking lineaire regressiemodel

• Specificatie van het modelSpecificatie van het model

• Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyse

• Model met covariaat/interactieModel met covariaat/interactie

• Toetsen voor het vergelijken tussen modellenToetsen voor het vergelijken tussen modellen

26

Logistisch regressiemodelLogistisch regressiemodelC

I JF

ER

CIJ

FE

R

STUDIETIJDSTUDIETIJD

model:model:

y is continu en x mag discreet zijny is continu en x mag discreet zijn

Y X0 1

27

Logistisch regressiemodelLogistisch regressiemodelU

ITS

LAG

UIT

SLA

G

STUDIETIJDSTUDIETIJD

wat als y dichotoom is ?wat als y dichotoom is ?

11

00

28

Logistisch regressiemodelLogistisch regressiemodelU

ITS

LAG

UIT

SLA

G

STUDIETIJDSTUDIETIJD

bepaal het percentage geslaagden per studie-bepaal het percentage geslaagden per studie-tijdsintervaltijdsinterval

11

00

29

Logistisch regressiemodelLogistisch regressiemodelU

ITS

LAG

UIT

SLA

G

STUDIETIJDSTUDIETIJD

bepaal het percentage geslaagden per studie-bepaal het percentage geslaagden per studie-tijdsintervaltijdsinterval

11

00

30

Logistisch regressiemodelLogistisch regressiemodelS

LAG

ING

SS

LAG

I NG

SP

ER

CE

NT

AG

EP

ER

CE

NT

AG

E

X = STUDIETIJDX = STUDIETIJD

11

00

EEN MODEL DAT IN VEEL GEVALLEN ZO’N S-VORMIG VERBAND GOED BESCHRIJFTIS

Pe X

1

1 0 1( )

IN PLAATS VAN

NOTEREN WE

e X) ( 0 1

EXP{-( + X)}0 1

31

Logistisch regressiemodelLogistisch regressiemodelS

LAG

ING

SS

LAG

I NG

SP

ER

CE

NT

AG

EP

ER

CE

NT

AG

E

X = STUDIETIJDX = STUDIETIJD

11

00

een model dat in veel een model dat in veel gevallen zo’n s-vormig gevallen zo’n s-vormig verband goed beschrijftverband goed beschrijftisis P

e X

1

1 0 1( )

IN PLAATS VAN

NOTEREN WE

e X) ( 0 1

EXP{-( + X)}0 1

32

Logistisch regressiemodelLogistisch regressiemodelS

LAG

ING

SS

LAG

I NG

SP

ER

CE

NT

AG

EP

ER

CE

NT

AG

E

X = STUDIETIJDX = STUDIETIJD

11

00

een model dat in veel een model dat in veel gevallen zo’n s-vormig gevallen zo’n s-vormig verband goed beschrijftverband goed beschrijftisis P

e X

1

1 0 1( )

In plaats van

Noteren we

e X) ( 0 1

EXP{-( + X)}0 1

33

Logistisch regressiemodelLogistisch regressiemodel• Beperking lineaire regressiemodelBeperking lineaire regressiemodel

• Specificatie van het modelSpecificatie van het model

• Vergelijking met een kruistabelanalyse

• Model met covariaat/interactie

• Toetsen voor het vergelijken tussen modellen

• Stapsgewijze logistische regressie

34

Specificatie van het modelSpecificatie van het modellogistisch regressiemodellogistisch regressiemodel

Pe X

1

1 0 1( ) Het logistische modelHet logistische model

Kan herschreven worden alsKan herschreven worden als

In plaats van In plaats van noteren we ook noteren we ook

Logit(p)Logit(p) of of ln(odds)ln(odds)

LNP

1 PX

0 1

LNP

1 P

35

Specificatie van het modelSpecificatie van het modellogistisch regressiemodellogistisch regressiemodel

PP

X = STUDIETIJDX = STUDIETIJD

11

00

Pe X

1

1 0 1( )

36

Specificatie van het modelSpecificatie van het modellogistisch regressiemodellogistisch regressiemodel

X = STUDIETIJD

11

00

LNP

1 P

LNP

1 PX

0 1

37

Specificatie van het model• Y = Dropout (wel =1, niet =0)

X = jaarcohort COHORT * DROPOUT Crosstabulation

Count

66 1 67

54 10 64

61 7 68

54 17 71

52 23 75

53 19 72

44 27 71

57 17 74

63 24 87

40 25 65

66 14 80

48 35 83

40 44 84

38 47 85

37 54 91

39 54 93

58 35 93

870 453 1323

74,00

75,00

76,00

77,00

78,00

79,00

80,00

81,00

82,00

83,00

84,00

85,00

86,00

87,00

88,00

89,00

90,00

COHORT

Total

no yes

DROPOUT

Total

38

Specificatie van het model• Als logistische regressiemodel:

logit (p) = 0 + 1 Cohort

Variables in the Equation

,133 ,013 103,021 1 ,000 1,143

-11,715 1,098 113,814 1 ,000 ,000

COHORT

Constant

Step1

a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: COHORT.a.

39

Specificatie van het modelgroot steekproefaantal

• Als benadering van logistische regressiemodel:logit (f) = 0 + 1 Cohort +

COHORT

100908070

LO

GIT

1,5

1,0

,5

0,0

-,5

-1,0

40

Specificatie van het modelgroot steekproefaantal

• Als benadering van logistische regressiemodel:logit (f) = 0 + 1 Cohort +

• Problem: als p=0, dan logit (f) bestaat niet• Oplossing: logit(f + c) met c een klein positief getal bijvoorbeeld 0.01

Coefficientsa

-11,540 1,912 -6,037 ,000

,133 ,023 ,710 5,699 ,000

(Constant)

COHORT

Model1

B Std. Error

UnstandardizedCoefficients

Beta

Standardized

Coefficients

t Sig.

Dependent Variable: LOGITa.

R-square R-square = 0.504= 0.504

41

Specificatie van het modelgroot steekproefaantal

• Als lineair kansmodel:f = 0 + 1 Cohort +

COHORT

100908070

PE

RC

80

60

40

20

0

-20

42

Specificatie van het modelgroot steekproefaantal

• Als lineair kansmodel:f = 0 + 1 Cohort +

Coefficientsa

-191,997 39,858 -4,817 ,000

2,758 ,485 ,709 5,684 ,000

(Constant)

COHORT

Model1

B Std. Error

UnstandardizedCoefficients

Beta

Standardized

Coefficients

t Sig.

Dependent Variable: PERCa.

R-square = 0.502R-square = 0.502

43

Logistisch regressiemodelLogistisch regressiemodel• Beperking lineaire regressiemodelBeperking lineaire regressiemodel

• Specificatie van het modelSpecificatie van het model

• Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyse

• Model met covariaat/interactie

• Toetsen voor het vergelijken tussen modellen

• Stapsgewijze logistische regressie

44

Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel

Voorbeeld: Voorbeeld: effect van geslacht op toelating effect van geslacht op toelating tot de universiteit berkeley.tot de universiteit berkeley.

STUDIE 1STUDIE 1 AANGENOMENAANGENOMEN

NIETNIET WELWEL

VROUWVROUW 1919 8989

MANMAN 313313 512512

STUDIE 2STUDIE 2 AANGENOMENAANGENOMEN

NIETNIET WELWEL

VROUWVROUW 88 1717

MANMAN 207207 353353

STUDIE 3STUDIE 3 AANGENOMENAANGENOMEN

NIETNIET WELWEL

VROUWVROUW 391391 202202

MANMAN 205205 120120

45

Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel

IN TERMEN VAN KANSEN

SAMENGEVOEGDSAMENGEVOEGD AANGENOMENAANGENOMEN

NIETNIET WELWEL

VROUWVROUW 418418 308308

MANMAN 725725 985985

PM AN

9 8 5

7 2 5 9 8 55 7 6.

PVR O U W

3 0 8

4 1 8 3 0 84 3 0.

vraag:vraag:hebben mannen meer hebben mannen meer kans toegelaten te kans toegelaten te worden tot de universiteitworden tot de universiteit

RELATIEVE SUCCESKANS (IN LITERATUUR: RELATIEF RISICO (RR))

R RP

PM AN

VR O U W

.

..

5 7 6

4 3 01 3 4

MANNEN WORDEN EERDER TOEGELATEN TOT DE UNIVERSITEIT

46

Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel

in termen van kansenin termen van kansen

SAMENGEVOEGDSAMENGEVOEGD AANGENOMENAANGENOMEN

NIETNIET WELWEL

VROUWVROUW 418418 308308

MANMAN 725725 985985

PM AN

9 8 5

7 2 5 9 8 55 7 6.

PVR O U W

3 0 8

4 1 8 3 0 84 3 0.

vraag:vraag:hebben mannen meer hebben mannen meer kans toegelaten te kans toegelaten te worden tot de universiteitworden tot de universiteit

47

Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel

in termen van kansenin termen van kansen

SAMENGEVOEGDSAMENGEVOEGD AANGENOMENAANGENOMEN

NIETNIET WELWEL

VROUWVROUW 418418 308308

MANMAN 725725 985985

PM AN

9 8 5

7 2 5 9 8 55 7 6.

PVR O U W

3 0 8

4 1 8 3 0 84 3 0.

vraag:vraag:hebben mannen meer hebben mannen meer kans toegelaten te kans toegelaten te worden tot de universiteitworden tot de universiteit

relatieve succeskans (in literatuur: relatief risico (rr))relatieve succeskans (in literatuur: relatief risico (rr))R R

P

PM AN

VR O U W

.

..

5 7 6

4 3 01 3 4

mannen worden eerder toegelaten tot de universiteitmannen worden eerder toegelaten tot de universiteit

48

Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel

in termen van oddsin termen van odds

SAMENGEVOEGDSAMENGEVOEGD AANGENOMENAANGENOMEN

NIETNIET WELWEL

VROUWVROUW 418418 308308

MANMAN 725725 985985

O D D S(M AN )# W EL

# N IET

9 8 5

7 2 51 3 5 9.

RELATIEVE ODDS (IN LITERATUUR: ODDSRATIO(OR))

O RO D D S(M AN )

O D D S(VR O U W )

1 359

7378

.

..1 4

MANNEN WORDEN EERDER TOEGELATEN TOT DE UNIVERSITEIT

O D D S(VR O U W )# W EL

# N IET

3 0 8

4 1 87 3 7.

49

Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel

in termen van oddsin termen van odds

SAMENGEVOEGDSAMENGEVOEGD AANGENOMENAANGENOMEN

NIETNIET WELWEL

VROUWVROUW 418418 308308

MANMAN 725725 985985

O D D S(M AN )# W EL

# N IET

9 8 5

7 2 51 3 5 9.

relatieve odds (in literatuur: oddsratio(or))relatieve odds (in literatuur: oddsratio(or))

O RO D D S(M AN )

O D D S(VR O U W )

1 359

7378

.

..1 4

mannen worden eerder toegelaten tot de universiteitmannen worden eerder toegelaten tot de universiteit

O D D S(VR O U W )# W EL

# N IET

3 0 8

4 1 87 3 7.

50

Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel

• Het verschil tussen rr (=1.34) en or (= 1.84) is Het verschil tussen rr (=1.34) en or (= 1.84) is een verschil in schalingeen verschil in schaling

• Belangrijk voor interpretatie:Belangrijk voor interpretatie:als rr > (of <) 1, dan or > (of <) 1als rr > (of <) 1, dan or > (of <) 1

51

Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel

1.1. Model specificeren en let op de codering Model specificeren en let op de codering van de variabelen van de variabelen

2.2. Schat de regressieparameters met spssSchat de regressieparameters met spss

3.3. Bereken de oddsratio(s) met behulp van Bereken de oddsratio(s) met behulp van rekenregelsrekenregels

Dezelfde analyse met logistische regressieDezelfde analyse met logistische regressie

Te volgen stappen:Te volgen stappen:

52

Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel

• Model: Model:

let op! Wat geeft p aanlet op! Wat geeft p aan 1 als man 1 als man

• Hoe is gesl. Gecodeerd. Hier: gesl = Hoe is gesl. Gecodeerd. Hier: gesl = 0 als 0 als

vrouwvrouw

Stap 1.Stap 1. Model specificeren en let op de codering Model specificeren en let op de codering van de variabelenvan de variabelen

LNP

1 PG ESL.

0 1

53

Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel

Het geschatte model:Het geschatte model:

Merk op :Merk op : odds = odds =

i.h.b. Ln(odds(man)) = -.305 + .612 * 1 = .307i.h.b. Ln(odds(man)) = -.305 + .612 * 1 = .307

Ln(odds(vrouw)) = -.305 + .612 * 0 = -.305Ln(odds(vrouw)) = -.305 + .612 * 0 = -.305

Stap 2.Stap 2. Schat de regressieparameters met spss Schat de regressieparameters met spss

LN O D D S G ESL. . .3 0 5 6 1 2

P

1 P

54

Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel

Stap 3.Stap 3. Bereken de oddsratio(s) met behulp van Bereken de oddsratio(s) met behulp van rekenregels rekenregels

Rekenregels: 1.Rekenregels: 1. 2. 2.

LNA

BLN (A) LN (B

)

LN (X) C X = EXP(C )

Dus: regel 1.

= .307 - -.305 = .612

Regel 2. Ln (or) = .612. Dus or = exp (.612) = 1.84

LN (O R ) = LNO D D S(M AN )

O D D S(VR O U W )LN (O D D S(M A N )) LN (O D D S(VR O U W )

)

55

Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel

Stap 3.Stap 3. Bereken de oddsratio(s) met behulp van Bereken de oddsratio(s) met behulp van rekenregels rekenregels

Rekenregels: 1.Rekenregels: 1. 2. 2.

LNA

BLN (A) LN (B

)

LN (X) C X = EXP(C )

Dus: Dus: regel 1regel 1..

= .307 - -.305 = .612= .307 - -.305 = .612

Regel 2. Ln (or) = .612. Dus or = exp (.612) = 1.84

LN (O R ) = LNO D D S(M AN )

O D D S(VR O U W )LN (O D D S(M A N )) LN (O D D S(VR O U W )

)

56

Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel

Stap 3.Stap 3. Bereken de oddsratio(s) met behulp van Bereken de oddsratio(s) met behulp van rekenregels rekenregels

Rekenregels: 1.Rekenregels: 1. 2. 2.

LNA

BLN (A) LN (B

)

LN (X) C X = EXP(C )

Dus: Dus: regel 1regel 1..

= .307 - -.305 = .612= .307 - -.305 = .612

regel 2. Ln (OR) = .612. Dus OR= exp (.612) = 1.84

LN (O R ) = LNO D D S(M AN )

O D D S(VR O U W )LN (O D D S(M A N )) LN (O D D S(VR O U W )

)

57

Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel

• Model:

= ln (or), mits verschil in codes van variabele

x gelijk is aan 1.

• Als verschil in codes van x gelijk is aan 7 (in dezelfde richting) , dan = * ln (or)

• Verschil in codes voor de y variabele (mits in dezelfde richting heeft geen invloed op de waarden van de betas

Enkele opmerkingenEnkele opmerkingen::LN

P

1 PX.

0 1

1

1

1

7

58

Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel

• Model:Model:

= ln (or), mits verschil in codes van variabele = ln (or), mits verschil in codes van variabele x gelijk is aan 1.x gelijk is aan 1.

• Als verschil in codes van x gelijk is aan 7 (in dezelfde richting) , dan

= * ln (or)

• Verschil in codes voor de y variabele (mits in dezelfde richting heeft geen invloed op de waarden van de betas

Enkele opmerkingenEnkele opmerkingen::

LNP

1 PX.

0 1

1

1

1

7

59

Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel

XX

11

00

LNP

1 P

LNP

1 PX

0 1

de hellingde helling is een monotone functie van de is een monotone functie van de oddsratio or oddsratio or

1

60

Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel

• Model:Model: = ln (or), mits verschil in codes van = ln (or), mits verschil in codes van

variabele x gelijk is aan 1. variabele x gelijk is aan 1.• Als verschil in codes van x gelijk is aan 7 (in dezelfde Als verschil in codes van x gelijk is aan 7 (in dezelfde

richting) , dan = * ln (or)richting) , dan = * ln (or)

rschil in codes voor de y variabele (mits in dezelfde richting heeft geen invloed op de waarden van de betas

Enkele opmerkingenEnkele opmerkingen::LN

P

1 PX.

0 1

1

11

7

61

Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyselogistisch regressiemodellogistisch regressiemodel

• Model:Model: = ln (or), mits verschil in codes van = ln (or), mits verschil in codes van

variabele x gelijk is aan 1. variabele x gelijk is aan 1.• Als verschil in codes van x gelijk is aan 7 (in dezelfde Als verschil in codes van x gelijk is aan 7 (in dezelfde

richting) , danrichting) , dan = * ln (or) = * ln (or)

• veverschil in codes voor de y variabele (mits in dezelfde richting heeft geen invloed op de waarden van de betas

Enkele opmerkingenEnkele opmerkingen::LN

P

1 PX.

0 1

1

11

7

62

Logistisch regressiemodelLogistisch regressiemodel• Beperking lineaire regressiemodelBeperking lineaire regressiemodel

• Specificatie van het modelSpecificatie van het model

• Vergelijking met een kruistabelanalyseVergelijking met een kruistabelanalyse

• Model met covariaat/interactieModel met covariaat/interactie

• Toetsen voor het vergelijken tussen modellen

• Stapsgewijze logistische regressie

63

Model met covariaat/interactie Model met covariaat/interactie logistisch regressiemodellogistisch regressiemodel

Net als bij ancova kan er sprake zijn van een Net als bij ancova kan er sprake zijn van een storende variabelestorende variabele

Ontstaat bijvoorbeeld doordat Ontstaat bijvoorbeeld doordat

Er studierichtingen zijn met strenge eisen en Er studierichtingen zijn met strenge eisen en overwegend vrouwenoverwegend vrouwen

Er studierichtingen zijn met minder strenge eisen Er studierichtingen zijn met minder strenge eisen en overwegend mannenen overwegend mannen

64

Model met covariaat/interactieModel met covariaat/interactie

logistisch regressiemodellogistisch regressiemodelSTUDIE 1STUDIE 1 AANGENOMENAANGENOMEN

NIETNIET WELWEL

VROUWVROUW 1919 8989

MANMAN 313313 512512

STUDIE 2STUDIE 2 AANGENOMENAANGENOMEN

NIETNIET WELWEL

VROUWVROUW 88 1717

MANMAN 207207 353353

STUDIE 3STUDIE 3 AANGENOMENAANGENOMEN

NIETNIET WELWEL

VROUWVROUW 391391 202202

MANMAN 205205 120120

strenge eisen en strenge eisen en overwegend vrouwenoverwegend vrouwen

Minder strenge eisen en Minder strenge eisen en overwegend mannenoverwegend mannen

65

Model met covariaat/interactieModel met covariaat/interactie

logistisch regressiemodellogistisch regressiemodel

GESLACHTGESLACHT

11

00

LNP

1 P

VROUWVROUW MANMAN

STUDIERICHTING 3STUDIERICHTING 3

STUDIERICHTING 1STUDIERICHTING 1

GECOMBINEERDGECOMBINEERD

dit fenomeen heet confounding (vergelijk ancova)dit fenomeen heet confounding (vergelijk ancova)

in model studierichting opnemen als covariaatin model studierichting opnemen als covariaat

66

Model met covariaat/interactie Model met covariaat/interactie logistisch regressiemodellogistisch regressiemodel

GESLACHTGESLACHT

11

00

LNP

1 P

VROUWVROUW MANMAN

STUDIERICHTING 3STUDIERICHTING 3

STUDIERICHTING 1STUDIERICHTING 1

GECOMBINEERDGECOMBINEERD

dit fenomeen heet interactie(vergelijk ancova).dit fenomeen heet interactie(vergelijk ancova).

in model geslacht * studierichting opnemen als in model geslacht * studierichting opnemen als interactieinteractie

67

Model met covariaat/interactieModel met covariaat/interactie

logistisch regressiemodellogistisch regressiemodel

GESLACHTGESLACHT

11

00

LNP

1 P

VROUWVROUW MANMAN

STUDIERICHTING 3STUDIERICHTING 3

STUDIERICHTING 1STUDIERICHTING 1

GECOMBINEERDGECOMBINEERD

nb. interactie ook mogelijk indien verdeling nb. interactie ook mogelijk indien verdeling mannen en vrouwen over studierichtingen gelijkmannen en vrouwen over studierichtingen gelijk

68

Model met covariaat/interactieModel met covariaat/interactie

logistisch regressiemodellogistisch regressiemodelSTUDIE 1STUDIE 1 AANGENOMENAANGENOMEN

NIETNIET WELWEL

VROUWVROUW 1919 8989

MANMAN 313313 512512

STUDIE 2STUDIE 2 AANGENOMENAANGENOMEN

NIETNIET WELWEL

VROUWVROUW 88 1717

MANMAN 207207 353353

STUDIE 3STUDIE 3 AANGENOMENAANGENOMEN

NIETNIET WELWEL

VROUWVROUW 391391 202202

MANMAN 205205 120120

O R STU D IE1 5 1 2

3 1 3

1 9

8 93 4 9.

O R STU D IE2 3 5 3

2 0 7

8

1 78 0 3.

O R STU D IE3 1 2 0

2 0 5

3 9 1

2 0 21 1 3 3.

69

Model met covariaat/interactie Model met covariaat/interactie logistisch regressiemodellogistisch regressiemodel

Verschillen tussen oddsratios kunnen Verschillen tussen oddsratios kunnen toegeschreven worden aan toeval (hierover toegeschreven worden aan toeval (hierover later)later)

Eerst consequentie voor model en interpretatie alsEerst consequentie voor model en interpretatie als

1.1. Studierichting een covariaat isStudierichting een covariaat is

2.2. Er sprake is van interactie tussen studierichting Er sprake is van interactie tussen studierichting en geslachten geslacht

70

Model met covariaat/interactieModel met covariaat/interactie

logistisch regressiemodellogistisch regressiemodel

Daar studierichting discreet is, dienen we Daar studierichting discreet is, dienen we dummy variabelen aan te makendummy variabelen aan te maken

11 als studierichting 2als studierichting 2Studie (2) =Studie (2) =

00 andersanders

11 als studierichting 3als studierichting 3Studie (3) =Studie (3) =

00 andersandersStudierichting 1 fungeert als referentiegroepStudierichting 1 fungeert als referentiegroep

71

Model met covariaat/interactieModel met covariaat/interactie

logistisch regressiemodellogistisch regressiemodelad1. studierichting is een covariaatad1. studierichting is een covariaat

LN (

OD

DS

)LN

(O

DD

S)

GESLACHTGESLACHTVROUWVROUW MANMAN

GECOMBINEERDGECOMBINEERD

alle regressielijnen zijn evenwijdig aan elkaar. dusalle regressielijnen zijn evenwijdig aan elkaar. dusmaar ongelijk aanmaar ongelijk aan

model is: model is:

O R O R O RSTU D IE(1) STU D IE( ) STU D IE( ) 2 3 O R G EC O M

LN (O D D S) G ESL STU D IE(2) STU D IE(3) 0 1 2 3

72

Model met covariaat/interactieModel met covariaat/interactie

logistisch regressiemodellogistisch regressiemodeluitvoer logistich regressiemodel met covariaatuitvoer logistich regressiemodel met covariaat

Variables in the EquationVariables in the Equation

-,197-,197 ,117,117 2,8292,829 11 ,093,093 ,821,821

139,246139,246 22 ,000,000

-,037-,037 ,110,110 ,110,110 11 ,740,740 ,964,964

-1,315-1,315 ,117,117 126,961126,961 11 ,000,000 ,268,268

,768,768 ,125,125 37,93037,930 11 ,000,000 2,1562,156

GESLACHTGESLACHT

STUDIESTUDIE

STUDIE(STUDIE(22))

STUDIE(STUDIE(33))

ConstantConstant

BB S.E.S.E. WaldWald dfdf Sig.Sig. Exp(B)Exp(B)

dus model is geschat door:dus model is geschat door:

ln (odds) = .768 - .197 geslacht - .037 studie (2) – 1.315 studie (3)ln (odds) = .768 - .197 geslacht - .037 studie (2) – 1.315 studie (3)

en en = exp (-.197) = .821= exp (-.197) = .821 nb! denk aan stappenplannb! denk aan stappenplan

O R adj

73

MODEL MET COVARIAAT/INTERACTIE MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL

ad2.ad2. ER IS INTERACTIE TUSSEN STUDIERICHTING EN ER IS INTERACTIE TUSSEN STUDIERICHTING EN GESLACHTGESLACHT

LN (

OD

DS

)LN

(O

DD

S)

GESLACHTGESLACHTVROUWVROUW MANMAN

GECOMBINEERDGECOMBINEERD

REGRESSIELIJNEN ZIJN REGRESSIELIJNEN ZIJN NIETNIET EVENWIJDIG. DUS ER GELDT EVENWIJDIG. DUS ER GELDT NIETNIET==

MODEL IS: MODEL IS:

O R O R O RSTU D IE(1) STU D IE( ) STU D IE( ) 2 3 O R G EC O M

LN (O D D S) G ESL STU D IE(2) STU D IE(3)

+ G ESL STU D IE(2) G ESL STU D IE( )4

0 1 2 3

5 3

STUDIE 1STUDIE 1

STUDIE 2STUDIE 2

STUDIE 3STUDIE 3

74

MODEL MET COVARIAAT/INTERACTIE MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL

UITVOER LOGISTISCH REGRESSIEMODEL MET INTERACTIEUITVOER LOGISTISCH REGRESSIEMODEL MET INTERACTIEVariables in the EquationVariables in the Equation

-1,052-1,052 ,263,263 16,03616,036 11 ,000,000 ,349,349

75,43075,430 22 ,000,000

-,790-,790 ,498,498 2,5222,522 11 ,112,112 ,454,454

-2,205-2,205 ,267,267 68,09468,094 11 ,000,000 ,110,110

15,46215,462 22 ,000,000

,832,832 ,510,510 2,6572,657 11 ,103,103 2,2982,298

1,1771,177 ,300,300 15,43615,436 11 ,000,000 3,2443,244

1,5441,544 ,253,253 37,33337,333 11 ,000,000 4,6844,684

GESLACHTGESLACHT

STUDIESTUDIE

STUDIE(STUDIE(22))

STUDIE(STUDIE(33))

GESLACHT * STUDIEGESLACHT * STUDIE

GESLACHT by STUDIE(GESLACHT by STUDIE(22))

GESLACHT by STUDIE(GESLACHT by STUDIE(33))

ConstantConstant

StepStep11

aa

BB S.E.S.E. WaldWald dfdf Sig.Sig. Exp(B)Exp(B)

. .

DUS MODEL IS GESCHAT DOOR:DUS MODEL IS GESCHAT DOOR:

LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) + .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3)+ .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3)

75

MODEL MET COVARIAAT/INTERACTIE MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL

LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) + .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3)+ .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3)

OR VOOR STUDIERICHTING 1:LN(ODDS{M,ST1}) = 1.544-1.052

LN(ODDS{V,ST1})= 1.544

OR VOOR STUDIERICHTING 2:LN(ODDS{M,ST2}) = 1.544-1.052 - .79 + .832

LN(ODDS{V,ST2}) = 1.544 - .79

OP DEZELFDE MANIER

LN (O R ) 1.052 O R .349STU D IE1 STU D IE1

LN (O R ) 22 O R .803STU D IE2 STU D IE2

O R STU D IE3 1 1 3 3.

76

MODEL MET COVARIAAT/INTERACTIE MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL

LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) + .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3)+ .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3)

OR VOOR STUDIERICHTING 1OR VOOR STUDIERICHTING 1::LN(ODDS{M,ST1}) = 1.544-1.052LN(ODDS{M,ST1}) = 1.544-1.052

LN(ODDS{V,ST1})= 1.544LN(ODDS{V,ST1})= 1.544

OR VOOR STUDIERICHTING 2:LN(ODDS{M,ST2}) = 1.544-1.052 - .79 + .832

LN(ODDS{V,ST2}) = 1.544 - .79

OP DEZELFDE MANIER

LN (O R ) 1.052 O R .349STU D IE1 STU D IE1

LN (O R ) 22 O R .803STU D IE2 STU D IE2

O R STU D IE3 1 1 3 3.

77

MODEL MET COVARIAAT/INTERACTIE MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL

LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) + .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3)+ .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3)

OR VOOR STUDIERICHTING 1OR VOOR STUDIERICHTING 1::LN(ODDS{M,ST1}) = 1.544-1.052LN(ODDS{M,ST1}) = 1.544-1.052

LN(ODDS{V,ST1})= 1.544LN(ODDS{V,ST1})= 1.544

OR VOOR STUDIERICHTING 2OR VOOR STUDIERICHTING 2::LN(ODDS{M,ST2}) = 1.544-1.052 - .79 + .832LN(ODDS{M,ST2}) = 1.544-1.052 - .79 + .832

LN(ODDS{V,ST2}) = 1.544LN(ODDS{V,ST2}) = 1.544 - .79 - .79

OP DEZELFDE MANIER

LN (O R ) 1.052 O R .349STU D IE1 STU D IE1

LN (O R ) 22 O R .803STU D IE2 STU D IE2

O R STU D IE3 1 1 3 3.

78

MODEL MET COVARIAAT/INTERACTIE MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL

LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) + .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3)+ .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3)

OR VOOR STUDIERICHTING 1OR VOOR STUDIERICHTING 1::LN(ODDS{M,ST1}) = 1.544-1.052LN(ODDS{M,ST1}) = 1.544-1.052

LN(ODDS{V,ST1})= 1.544LN(ODDS{V,ST1})= 1.544

OR VOOR STUDIERICHTING 2OR VOOR STUDIERICHTING 2::LN(ODDS{M,ST2}) = 1.544-1.052 - .79 + .832LN(ODDS{M,ST2}) = 1.544-1.052 - .79 + .832

LN(ODDS{V,ST2}) = 1.544LN(ODDS{V,ST2}) = 1.544 - .79 - .79

OP DEZELFDE MANIER OP DEZELFDE MANIER

LN (O R ) 1.052 O R .349STU D IE1 STU D IE1

LN (O R ) 22 O R .803STU D IE2 STU D IE2

O R STU D IE3 1 1 3 3.

79

MODEL MET COVARIAAT/INTERACTIE MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL

ENKELE OPMERKINGEN:ENKELE OPMERKINGEN:

OR OP BASIS VAN MODEL IS OOK OP BASIS VAN EEN 2X2 TABEL TE BEREKENEN

DE STUDIE-SPECIFIEKE OR’S OP BASIS VAN MODEL

IS OOK OP BASIS VAN EEN 2X2X2 TABEL TE BEREKENEN

DE VOOR STUDIERICHTING GECORRIGEERDE OR OP BASIS VAN MODELIS NIET EENVOUDIG UIT EEN 2X2X2 TABEL TE BEREKENEN

LN O D D S G ESL. 0 1

LN (O D D S) G ESL STU D IE(2) STU D IE(3)

+ G ESL STU D IE(2) G ESL STU D IE(3)4

0 1 2 3

5

LN (O D D S) G ESL STU D IE(2) STU D IE(3) 0 1 2 3

80

MODEL MET COVARIAAT/INTERACTIE MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL

ENKELE OPMERKINGEN:ENKELE OPMERKINGEN:

OR OP BASIS VAN MODEL OR OP BASIS VAN MODEL IS OOK OP IS OOK OP BASIS VAN EEN 2X2 TABEL TE BEREKENENBASIS VAN EEN 2X2 TABEL TE BEREKENEN

DE STUDIE-SPECIFIEKE OR’S OP BASIS VAN MODEL

IS OOK OP BASIS VAN EEN 2X2X2 TABEL TE BEREKENEN

DE VOOR STUDIERICHTING GECORRIGEERDE OR OP BASIS VAN MODELIS NIET EENVOUDIG UIT EEN 2X2X2 TABEL TE BEREKENEN

LN O D D S G ESL. 0 1

LN (O D D S) G ESL STU D IE(2) STU D IE(3)

+ G ESL STU D IE(2) G ESL STU D IE(3)4

0 1 2 3

5

LN (O D D S) G ESL STU D IE(2) STU D IE(3) 0 1 2 3

81

MODEL MET COVARIAAT/INTERACTIE MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL

ENKELE OPMERKINGEN:ENKELE OPMERKINGEN:

OR OP BASIS VAN MODEL OR OP BASIS VAN MODEL IS OOK OP IS OOK OP BASIS VAN EEN 2X2 TABEL TE BEREKENENBASIS VAN EEN 2X2 TABEL TE BEREKENEN

DE STUDIE-SPECIFIEKE OR’S OP BASIS VAN MODELDE STUDIE-SPECIFIEKE OR’S OP BASIS VAN MODEL

IS OOK OP IS OOK OP BASIS VAN EEN 2X2X2 TABEL TE BEREKENENBASIS VAN EEN 2X2X2 TABEL TE BEREKENEN

DE VOOR STUDIERICHTING GECORRIGEERDE OR OP BASIS VAN MODELIS NIET EENVOUDIG UIT EEN 2X2X2 TABEL TE BEREKENEN

LN O D D S G ESL. 0 1

LN (O D D S) G ESL STU D IE(2) STU D IE(3)

+ G ESL STU D IE(2) G ESL STU D IE(3)4

0 1 2 3

5

LN (O D D S) G ESL STU D IE(2) STU D IE(3) 0 1 2 3

82

MODEL MET COVARIAAT/INTERACTIE MODEL MET COVARIAAT/INTERACTIE LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL

ENKELE OPMERKINGEN:ENKELE OPMERKINGEN:

OR OP BASIS VAN MODEL OR OP BASIS VAN MODEL IS OOK OP IS OOK OP BASIS VAN EEN 2X2 TABEL TE BEREKENENBASIS VAN EEN 2X2 TABEL TE BEREKENEN

DE STUDIE-SPECIFIEKE OR’S OP BASIS VAN MODELDE STUDIE-SPECIFIEKE OR’S OP BASIS VAN MODEL

IS OOK OP IS OOK OP BASIS VAN EEN 2X2X2 TABEL TE BEREKENENBASIS VAN EEN 2X2X2 TABEL TE BEREKENEN

DE VOOR STUDIERICHTING GECORRIGEERDE OR OP BASIS DE VOOR STUDIERICHTING GECORRIGEERDE OR OP BASIS VAN MODELVAN MODELIS NIET EENVOUDIG UIT EEN 2X2X2 TABEL TE BEREKENENIS NIET EENVOUDIG UIT EEN 2X2X2 TABEL TE BEREKENEN

LN O D D S G ESL. 0 1

LN (O D D S) G ESL STU D IE(2) STU D IE(3)

+ G ESL STU D IE(2) G ESL STU D IE(3)4

0 1 2 3

5

LN (O D D S) G ESL STU D IE(2) STU D IE(3) 0 1 2 3

83

LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL

• BEPERKING LINEAIRE REGRESSIEMODELBEPERKING LINEAIRE REGRESSIEMODEL

• SPECIFICATIE VAN HET MODELSPECIFICATIE VAN HET MODEL

• VERGELIJKING MET EEN KRUISTABELANALYSEVERGELIJKING MET EEN KRUISTABELANALYSE

• MODEL MET COVARIAAT/INTERACTIEMODEL MET COVARIAAT/INTERACTIE

• TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLENTOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN

• STAPSGEWIJZE LOGISTISCHE REGRESSIE

84

TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLENTOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLENLOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL

DRIE MODELLENDRIE MODELLEN

1.1.

2.2.

3.3.

LN O D D S G ESL. 0 1

LN (O D D S) G ESL STU D IE(2) STU D IE(3)

+ G ESL STU D IE(2) G ESL STU D IE(3)4

0 1 2 3

5

LN (O D D S) G ESL STU D IE(2) STU D IE(3) 0 1 2 3

85

TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL

Dependent Variable Encoding

0

1

Original Valueniet

wel

Internal Value

Categorical Variables Codings

4 ,000 ,000

4 1,000 ,000

4 ,000 1,000

1,00

2,00

3,00

STUDIEFrequency (1) (2)

Parameter coding

86

TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODEL

Block 0: Beginning BlockBlock 0: Beginning Block

Variables in the Equation

,123 ,041 9,225 1 ,002 1,131ConstantStep 0B S.E. Wald df Sig. Exp(B)

MODEL ISMODEL IS LN O D D S 0

87

TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL

Model Summary

3320,596 ,019 ,026Step1

-2 Loglikelihood

Cox & SnellR Square

NagelkerkeR Square

Variables in the Equation

,612 ,090 46,599 1 ,000 1,844

-,305 ,075 16,538 1 ,000 ,737

GESLACHT

Constant

Step1

a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: GESLACHT.a.

Block 1: Method = EnterBlock 1: Method = Enter

MODEL LN O D D S G ESL. 0 1

Omnibus Tests of Model Coefficients

47,175 1 ,000

47,175 1 ,000

47,175 1 ,000

Step

Block

Model

Step 1Chi-square df Sig.

88

TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL

Block 2: Method = EnterBlock 2: Method = EnterMODELMODEL LN (O D D S) G ESL STU D IE(2) STU D IE(3) 0 1 2 3

Omnibus Tests of Model Coefficients

149,724 2 ,000

149,724 2 ,000

196,898 3 ,000

Step

Block

Model

Step 1Chi-square df Sig.

Variables in the Equation

-,197 ,117 2,829 1 ,093 ,821

139,246 2 ,000

-,037 ,110 ,110 1 ,740 ,964

-1,315 ,117 126,961 1 ,000 ,268

,768 ,125 37,930 1 ,000 2,156

GESLACHT

STUDIE

STUDIE(2)

STUDIE(3)

Constant

Step1

a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: GESLACHT, STUDIE.a.

-2LL = 3320.596 – 149.724 = 3170.872

89

TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL

Block 3: Method = EnterBlock 3: Method = Enter

LN (O D D S) G ESL STU D IE(2) STU D IE(3)

+ G ESL STU D IE(2) G ESL STU D IE(3)4

0 1 2 3

5

MODELMODEL

-2LL = 3170.872 – 17.197 = 3153.675

Variables in the Equation

-1,052 ,263 16,036 1 ,000 ,349

75,430 2 ,000

-,790 ,498 2,522 1 ,112 ,454

-2,205 ,267 68,094 1 ,000 ,110

15,462 2 ,000

,832 ,510 2,657 1 ,103 2,298

1,177 ,300 15,436 1 ,000 3,244

1,544 ,253 37,333 1 ,000 4,684

GESLACHT

STUDIE

STUDIE(1)

STUDIE(2)

GESLACHT * STUDIE

GESLACHT by STUDIE(1)

GESLACHT by STUDIE(2)

Constant

Step1

a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: GESLACHT, STUDIE, GESLACHT * STUDIE .a.

STEP = 17.197 DF = 2 P-WAARDE = .0002

90

TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL

WELK MODELWELK MODEL::

OP GROND VAN TOP-DOWN PROCEDUREOP GROND VAN TOP-DOWN PROCEDURE

KEUZE MODEL MET INTERACTIEKEUZE MODEL MET INTERACTIE

DUS INTERPRETEREN DE STUDIE-SPECIFIEKE ODDSRATIOSDUS INTERPRETEREN DE STUDIE-SPECIFIEKE ODDSRATIOS

91

TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL

LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) LN (ODDS) = 1.544 - 1.052 GESLACHT - .79 STUDIE (2) - 2.205 STUDIE (3) + .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3)+ .832 GESLACHT * STUDIE (2) + 1.1177 GESLACHT * STUDIE (3)

OR VOOR STUDIERICHTING 1OR VOOR STUDIERICHTING 1::LN(ODDS{M,ST1} = 1.544-1.052LN(ODDS{M,ST1} = 1.544-1.052

LN(ODDS{V,ST1} = 1.544LN(ODDS{V,ST1} = 1.544

OR VOOR STUDIERICHTING 2OR VOOR STUDIERICHTING 2::LN(ODDS{M,ST2} = 1.544-1.052 - .79 + .832LN(ODDS{M,ST2} = 1.544-1.052 - .79 + .832

LN(ODDS{V,ST2} = 1.544LN(ODDS{V,ST2} = 1.544 - .79 - .79

OP DEZELFDE MANIER OP DEZELFDE MANIER

LN (O R ) 1.052 O R .349STU D IE1 STU D IE1

LN (O R ) 22 O R .803STU D IE2 STU D IE2

O R STU D IE3 1 1 3 3.

92

TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN TOETSEN VOOR HET VERGELIJKEN TUSSEN MODELLEN LOGISTISCH REGRESSIEMODELLOGISTISCH REGRESSIEMODEL

ER IS INTERACTIE TUSSEN STUDIERICHTING EN GESLACHTER IS INTERACTIE TUSSEN STUDIERICHTING EN GESLACHT

LN (

OD

DS

)LN

(O

DD

S)

GESLACHTGESLACHTVROUWVROUW MANMAN

STUDIE 1STUDIE 1

STUDIE 2STUDIE 2

STUDIE 3STUDIE 3

CONCLUSIECONCLUSIE

93

AncovaAncovacovariantieanalysecovariantieanalyse

groepen met elkaar te vergelijken in aanwezigheid groepen met elkaar te vergelijken in aanwezigheid van covariatenvan covariaten

covariaatcovariaat

een onafhankelijke variabele in het model waarvan een onafhankelijke variabele in het model waarvan het effect niet interessant is voor de het effect niet interessant is voor de onderzoeksvraagonderzoeksvraag

94

AncovaAncovacovariantieanalysecovariantieanalyse

•VoorbeeldVoorbeeld

•T-toets versus lineaire regressie

•Model met storende variabele

•Welk model verdient de voorkeur

95

AncovaAncovacovariantieanalysecovariantieanalyse

•VoorbeeldVoorbeeld

•T-toets versus lineaire regressieT-toets versus lineaire regressie

•Model met storende variabele

•Welk model verdient de voorkeur

96

AncovaAncovacovariantieanalysecovariantieanalyse

•VoorbeeldVoorbeeld

•T-toets versus lineaire regressieT-toets versus lineaire regressie

•Model met storende variabeleModel met storende variabele

•Welk model verdient de voorkeur

97

AncovaAncovacovariantieanalysecovariantieanalyse

•VoorbeeldVoorbeeld

•T-toets versus lineaire regressieT-toets versus lineaire regressie

•Model met storende variabeleModel met storende variabele

•Welk model verdient de voorkeurWelk model verdient de voorkeur

98

VoorbeeldVoorbeeldcovariantieanalysecovariantieanalyse

Vergelijken tussen rokers en niet rokers met Vergelijken tussen rokers en niet rokers met Betrekking tot verandering in polsslag na een Betrekking tot verandering in polsslag na een LoopoefeningLoopoefening

PO

LSP

OLS

GEWICHTGEWICHT

ROKERROKER

NIET ROKERNIET ROKER

99

AncovaAncovacovariantieanalysecovariantieanalyse

•VoorbeeldVoorbeeld

•T-toets versus lineaire regressieT-toets versus lineaire regressie

•Model met storende variabele

•Welk model verdient de voorkeur

100

T-toets versus lineaire regressieT-toets versus lineaire regressiecovariantieanalysecovariantieanalyse

Twee formuleringen:Twee formuleringen:

1.1. Vergelijken tussen twee onafhankelijke Vergelijken tussen twee onafhankelijke steekproeven. Leidt tot t-toets.steekproeven. Leidt tot t-toets.

2.2. Effect van roken op verandering in polsslag.Effect van roken op verandering in polsslag.Leidt tot lineaire regressieLeidt tot lineaire regressie..

101

T-toets versus lineaire regressieT-toets versus lineaire regressie

covariantieanalysecovariantieanalyse

Group StatisticsGroup Statistics

SMOKESMOKE NN MeanMean Std. DeviationStd. Deviation Std. ErrorStd. Error

nono 2323 21,347821,3478 16,151616,1516 3,3678 3,3678

POLSPOLS

yesyes 1212 14,250014,2500 11,925011,9250 3,44243,4424

ad 1.ad 1. t-toets voor onafhankelijke steekproevent-toets voor onafhankelijke steekproeven

Independent Samples Test

t-test for Equality of Means

t df Sig. (2-tailed) Mean Difference

Equal variances assumed 1,340 33 ,189 7,0978

102

T-toets versus lineaire regressieT-toets versus lineaire regressie

covariantieanalysecovariantieanalyse

Group StatisticsGroup Statistics

SMOKESMOKE NN MeanMean Std. DeviationStd. Deviation Std. ErrorStd. Error

nono 2323 21,347821,3478 16,151616,1516 3,3678 3,3678

POLSPOLS

yesyes 1212 14,250014,2500 11,925011,9250 3,44243,4424

ad 1.ad 1. t-toets voor onafhankelijke steekproevent-toets voor onafhankelijke steekproeven

Independent Samples TestIndependent Samples Test

t-test for Equality of Meanst-test for Equality of Means

tt df df Sig. (2-tailed)Sig. (2-tailed) Mean DifferenceMean Difference

Equal variances assumedEqual variances assumed 1,3401,340 3333 ,189,189 7,09787,0978

103

T-toets versus lineaire regressieT-toets versus lineaire regressiecovariantieanalysecovariantieanalyse

ad 2.ad 2. lineaire regressielineaire regressie

PO

LSP

OLS

ROKENROKEN

ROKERROKER

NIET ROKERNIET ROKER21.421.4

14.314.3

ModelModel PO LS b b R O KEN e0 1 Y Y br nr 1

NIETNIET

(CODE 0)(CODE 0)

WELWEL

(CODE 1)(CODE 1)

Dus een negatieve hellingDus een negatieve helling

104

T-toets versus lineaire regressieT-toets versus lineaire regressiecovariantieanalysecovariantieanalyse

Unstandardized CoefficientsUnstandardized Coefficients

ModelModel BB Std. Error Std. Error t t Sig.Sig.

(Constant)(Constant) 21,34821,348 3,1023,102 6,8826,882 ,000,000

SMOKESMOKE -7,098-7,098 5,2985,298 -1,340-1,340 ,189,189

uitvoer enkelvoudige regressieanalyseuitvoer enkelvoudige regressieanalyse

dus model isdus model is Y = 21.4 – 7.1 ROKEN + e Y = 21.4 – 7.1 ROKEN + e

Y Y br nr 1 = -7.1

105

AncovaAncovacovariantieanalysecovariantieanalyse

•VoorbeeldVoorbeeld

•T-toets versus lineaire regressieT-toets versus lineaire regressie

•Model met storende variabeleModel met storende variabele

•Welk model verdient de voorkeur

106

Model met storende variabeleModel met storende variabeleCOVARIANTIEANALYSECOVARIANTIEANALYSE

lichaamsgewicht is potentiele storende variabelelichaamsgewicht is potentiele storende variabele

er zijn drie mogelijkhedener zijn drie mogelijkheden

PO

LSP

OLS

GEWICHTGEWICHT

ROKERROKER

NIET ROKERNIET ROKER

107

Model met storende variabeleModel met storende variabelecovariantieanalysecovariantieanalyse

a. gewicht is geen storende variabelea. gewicht is geen storende variabeleP

OL S

PO

L S

ROKENROKEN

ROKERROKER

NIET ROKERNIET ROKER21.421.4

14.314.3

108

Model met storende variabeleModel met storende variabelecovariantieanalysecovariantieanalyse

b. gewicht is een covariaat(confounder)b. gewicht is een covariaat(confounder)

twee evenwijdige regressielijnentwee evenwijdige regressielijnen

PO

LSP

OLS

GEWICHTGEWICHT

ROKERROKER

NIET ROKERNIET ROKER

109

Model met storende variabeleModel met storende variabelecovariantieanalysecovariantieanalyse

c. er is een interactie tussen gewicht en rokenc. er is een interactie tussen gewicht en roken

twee niet evenwijdige regressielijnentwee niet evenwijdige regressielijnen

PO

LSP

OLS

GEWICHTGEWICHT

ROKERROKER

NIET ROKERNIET ROKER

110

Model met storende variabeleModel met storende variabelecovariantieanalysecovariantieanalyse

ad b.ad b. als gewicht een covariaat is, dan als gewicht een covariaat is, dan modelmodel PO LS R O KEN G EW IC H T 0 1 2

POLSPOLS

GEWICHTGEWICHT

21.421.4

14.314.3

Y adj

zonder gewicht:zonder gewicht: Y Y Y 14.3 21.4 7.1r nr

met gewicht als covariaat:met gewicht als covariaat: Y adj 1

111

Model met storende variabeleModel met storende variabelecovariantieanalysecovariantieanalyse

PO LS R O KEN G EW IC H T 0 1 2

POLSPOLS

GEWICHTGEWICHT

21.421.4

14.314.3

Y adj

Y adj 1

E(Y |R O KER ) G EW IC H T

E(Y |N IET R O KER ) G EW IC H T

0 1 2

0 1 2

1

0

112

Model met storende variabeleModel met storende variabelecovariantieanalysecovariantieanalyse

Unstandardized CoefficientsUnstandardized Coefficients

ModelModel BB Std. ErrorStd. Error tt Sig.Sig.

(Constant)(Constant) 69,79169,791 15,29915,299 4,5624,562 ,000,000

SMOKESMOKE -4,398-4,398 4,7514,751 -,926-,926 ,362,362

weight in poundsweight in pounds -,325-,325 ,101,101 -3,218-3,218 ,003,003

uitvoer regressiemodel met covariaatuitvoer regressiemodel met covariaat

dus model is:dus model is: Y = 69.2 – 4.4 ROKEN -.3 GEWICHT+e Y = 69.2 – 4.4 ROKEN -.3 GEWICHT+e

Y badj 1 = - 4.4

113

Model met storende variabeleModel met storende variabelecovariantieanalysecovariantieanalyse

ad c.ad c. als er een interactie is tussen gewicht en als er een interactie is tussen gewicht en roken , dan model:roken , dan model:PO LS R O KEN G EW IC H T R O KEN G EW IC H T 0 1 2 3POLSPOLS

GEWICHTGEWICHT

21.421.4

14.314.3

Y adj

MET INTERACTIETERM:MET INTERACTIETERM: Y G EW IC H Tadj 1 3

R_G

114

Model met storende variabeleModel met storende variabelecovariantieanalysecovariantieanalyse

PO LS R O KEN G EW IC H T R O KEN G EW IC H T 0 1 2 3

POLSPOLS

GEWICHTGEWICHT

21.421.4

14.314.3

Y adj Y G EW IC H Tadj 1 3

R_GR_G

E(Y |R O KER ) G EW IC H T + 1 G EW IC H T

E(Y |N IET R O KER ) G EW IC H T G EW IC H T3

3

0 1 2

0 1 2

1

0 0

115

Model met storende variabeleModel met storende variabelecovariantieanalysecovariantieanalyse

Unstandardized CoefficientsUnstandardized Coefficients

ModelModel BB Std. ErrorStd. Error t t Sig. Sig.

(Constant)(Constant) 83,32483,324 19,85519,855 4,1974,197 ,000,000

SMOKESMOKE -37,933-37,933 31,81231,812 -1,192-1,192 ,242,242

weight in poundsweight in pounds -,416-,416 ,132,132 -3,152-3,152 ,004,004

R_GR_G ,218,218 ,205,205 1,0661,066 ,295,295

uitvoer regressiemodel met interactieuitvoer regressiemodel met interactie

dus model isdus model is: Y = 83.3 – 37.9 ROKEN - .4 GEWICHT + .2 R_G + e : Y = 83.3 – 37.9 ROKEN - .4 GEWICHT + .2 R_G + e

Y G EW IC H Tadj 3 7 9 2. .

116

AncovaAncovacovariantieanalysecovariantieanalyse

•VoorbeeldVoorbeeld

•T-toets versus lineaire regressieT-toets versus lineaire regressie

•Model met storende variabeleModel met storende variabele

•Welk model verdient de voorkeurWelk model verdient de voorkeur

117

Welk model verdient de voorkeurWelk model verdient de voorkeurcovariantieanalysecovariantieanalyse

Toetsing volgens de top-down principeToetsing volgens de top-down principeHet meest algemene model:Het meest algemene model:

1. Toets op interactieals dan geen interactie

2. Bij een niet significant resultaattoets op de covariaatAls dan is gewicht geen storende variabele

PO LS R O KEN G EW IC H T R O KEN G EW IC H T 0 1 2 3

3 0H

H0 3

3

0

0

:

:

a

2 0H

H0 2

2

0

0

:

:

a

118

Welk model verdient de voorkeurWelk model verdient de voorkeurcovariantieanalysecovariantieanalyse

Toetsing volgens de top-down principeToetsing volgens de top-down principeHet meest algemene model:Het meest algemene model:

1.1. Toets op interactieToets op interactieals als dan geen interactie dan geen interactie

1. Bij een niet significant resultaattoets op de covariaatAls dan is gewicht geen storende variabele

PO LS R O KEN G EW IC H T R O KEN G EW IC H T 0 1 2 3

3 0

H

H0 3

3

0

0

:

:

a

2 0H

H0 2

2

0

0

:

:

a

119

Welk model verdient de voorkeurWelk model verdient de voorkeurcovariantieanalysecovariantieanalyse

Toetsing volgens de top-down principeToetsing volgens de top-down principeHet meest algemene model:Het meest algemene model:

1.1. Toets op interactieToets op interactieals als dan geen interactie dan geen interactie

2. Bij een niet significant resultaattoets op de covariaatAls dan is gewicht geen storende variabele

PO LS R O KEN G EW IC H T R O KEN G EW IC H T 0 1 2 3

3 0

H

H0 3

3

0

0

:

:

a

2 0 H

H0 2

2

0

0

:

:

a

120

AncovaAncovacovariantieanalysecovariantieanalyse

Unstandardized CoefficientsUnstandardized Coefficients

ModelModel BB Std. ErrorStd. Error t t Sig. Sig.

11 (Constant)(Constant) 21,34821,348 3,1023,102 6,882 6,882 ,000,000

SMOKESMOKE -7,098-7,098 5,2985,298 -1,340-1,340 ,189,189

22 (Constant)(Constant) 69,79169,791 15,29915,299 4,5624,562 ,000,000

SMOKESMOKE -4,398-4,398 4,7514,751 -,926-,926 ,362,362

weight in poundsweight in pounds -,325-,325 ,101,101 -3,218-3,218 ,003,003

33 (Constant)(Constant) 83,32483,324 19,85519,855 4,1974,197 ,000,000

SMOKESMOKE -37,933-37,933 31,81231,812 -1,192-1,192 ,242,242

weight in poundsweight in pounds -,416-,416 ,132,132 -3,152-3,152 ,004,004

R_GR_G ,218,218 ,205,205 1,0661,066 ,295,295

121

Regressie met dummy variabelenRegressie met dummy variabelenmeervoudig lineair regressiemodelmeervoudig lineair regressiemodel

ÉéÉén discrete variabele met twee categorien discrete variabele met twee categorieëënn

1 als IQ hoog1 als IQ hoogIQ = IQ =

0 als IQ laag0 als IQ laag

Indicator voor mensen Indicator voor mensen met een hoog IQmet een hoog IQ

CIJ

FE

RC

IJF

ER

IQIQ00 11

122

Regressie met dummy variabelenRegressie met dummy variabelenmeervoudig lineair regressiemodelmeervoudig lineair regressiemodel

ÉéÉén discrete variabele met twee categorien discrete variabele met twee categorieëënnCijferCijfer

IQIQ00 11

Model:Model:Y X 0 1

E(Y|X=1)E(Y|X=1)

E(Y|X=0)E(Y|X=0)E(Y | X) X 0 1

UIT FIGUUR:

1

a

b

E(Y | X 1) E(Y | X 0)

1E(Y | X 1) E(Y | X 0)

a

b

123

Regressie met dummy variabelenRegressie met dummy variabelenmeervoudig lineair regressiemodelmeervoudig lineair regressiemodel

ÉéÉén discrete variabele met twee categorien discrete variabele met twee categorieëënnCijferCijfer

IQIQ00 11

Model:Model:Y X 0 1

E(Y|X=1)E(Y|X=1)

E(Y|X=0)E(Y|X=0)E(Y | X) X 0 1

Uit figuur:

1

a

b

E(Y | X 1) E(Y | X 0)

1E(Y | X 1) E(Y | X 0)

a

b

124

Regressie met dummy variabelenRegressie met dummy variabelenmeervoudig lineair regressiemodelmeervoudig lineair regressiemodel

ÉéÉén discrete variabele met twee categorien discrete variabele met twee categorieëënnCijferCijfer

IQIQ00 11

E(Y|X=1)E(Y|X=1)

E(Y|X=0)E(Y|X=0)E(Y | X) X 0 1

aa

bbE(Y | X) X 0 1

Door berekening:Door berekening:

E(Y|X=1)=

E(Y|X=0)=

DUS

0 1

0

1 E(Y | X 1) E (Y | X 0)

125

Regressie met dummy variabelenRegressie met dummy variabelenmeervoudig lineair regressiemodelmeervoudig lineair regressiemodel

ÉéÉén discrete variabele met twee categorien discrete variabele met twee categorieëënnCijferCijfer

IQIQ00 11

E(Y|X=1)E(Y|X=1)

E(Y|X=0)E(Y|X=0)E(Y | X) X 0 1

aa

bbE(Y | X) X 0 1

Door berekening:Door berekening:

E(Y|X=1)=

E(Y|X=0)=

DUS

0 1

0

1 E(Y | X 1) E (Y | X 0)

126

Regressie met dummy variabelenRegressie met dummy variabelenmeervoudig lineair regressiemodelmeervoudig lineair regressiemodel

ÉéÉén discrete variabele met drie categorien discrete variabele met drie categorieëënn

YY YY

XX XX11 22 33 00 11 55

Model specificatie Model specificatie is fout want is fout want lineairiteit alleen voldaan onder speciale coderinglineairiteit alleen voldaan onder speciale codering

Y IQ 0 1

127

Regressie met dummy variabelenRegressie met dummy variabelenmeervoudig lineair regressiemodelmeervoudig lineair regressiemodel

Een andere manier om de drie groepen te Een andere manier om de drie groepen te onderscheiden is d.m.v. drie indicatorenonderscheiden is d.m.v. drie indicatoren

D_HOOGD_HOOG 11 0 0

HoogHoog Niet zoNiet zoD_GEMD_GEM

11 0 0

GemidGemid.. Niet zoNiet zo

D_LAAGD_LAAG 11 0 0

LaagLaag Niet zoNiet zo

128

Regressie met dummy variabelenRegressie met dummy variabelenmeervoudig lineair regressiemodelmeervoudig lineair regressiemodel

Een andere manier om de drie groepen te Een andere manier om de drie groepen te onderscheiden is d.m.v. drie indicatorenonderscheiden is d.m.v. drie indicatoren

D_HOOGD_HOOG 11 0 0

HoogHoog Niet zoNiet zoD_GEMD_GEM

11 0 0

GemidGemid.. Niet zoNiet zo

D_LAAGD_LAAG 11 0 0

LaagLaag Niet zoNiet zo

Twee van de drie indicatoren voldoende om de drieTwee van de drie indicatoren voldoende om de driegroepen te onderscheidengroepen te onderscheiden

129

Regressie met dummy variabelenRegressie met dummy variabelenmeervoudig lineair regressiemodelmeervoudig lineair regressiemodel

IQIQ D_HOOGD_HOOG D_GEMD_GEM

HOOGHOOG 11 00

HOOGHOOG 11 00

HOOGHOOG 11 00

GEMIDGEMID 00 11

GEMIDGEMID 00 11

GEMIDGEMID 00 11

GEMIDGEMID 00 11

LAAGLAAG 00 00

LAAGLAAG 00 00

LAAGLAAG 00 00

LAAGLAAG 00 00

LAAGLAAG 00 00

VoorbeeldVoorbeeld

130

Regressie met dummy variabelenRegressie met dummy variabelenmeervoudig lineair regressiemodelmeervoudig lineair regressiemodel

Model specificatie:Model specificatie:

nu is wel aan de lineairiteitseis voldaannu is wel aan de lineairiteitseis voldaan

C IJFER D _ H O O G D _ G EM 0 1 2