Help! Statistiek!

26
1 Help! Statistiek! Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde woensdag in de maand, 12-13 uur 17 maart Corrigeren voor achtergrondvariabelen: Lord’s paradox causaal ontrafeld 21 april Survival analysis en competing risks 19 mei Lineaire regressie Sprekers: Václav Fidler, Hans Burgerhof, Sacha la Bastide afdeling Epidemiologie Tekst op: www.EpidemiologyGroningen.nl (download area) Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk.

description

Help! Statistiek!. Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde woensdag in de maand, 12-13 uur 17 maartCorrigeren voor achtergrondvariabelen: Lord’s paradox causaal ontrafeld - PowerPoint PPT Presentation

Transcript of Help! Statistiek!

1

Help! Statistiek!

Doel: Informeren over statistiek in klinisch onderzoek.

Tijd: Derde woensdag in de maand, 12-13 uur

17 maart Corrigeren voor achtergrondvariabelen: Lord’s paradox causaal ontrafeld

21 april Survival analysis en competing risks19 mei Lineaire regressie

Sprekers: Václav Fidler, Hans Burgerhof, Sacha la Bastide afdeling Epidemiologie

Tekst op: www.EpidemiologyGroningen.nl (download area)

Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk.

2

Corrigeren voor achtergrondvariabelen:

Lord’s paradox causaal ontrafeld

- Corrigeren voor achtergrond variabelen: Lord’s paradox en Simpson’s paradox (voorbeeld)

- Confounding en causale grafen - De paradox ontrafeld: het effect van

conditioneren

3

Lord’s paradox (en Simpson’s, Berkson’s en andere paradoxen)

Paradox (Van Dale):schijnbare tegenstrijdigheid

Lord’s paradox: het effect van een variabele op een andere in subgroepen verandert van richting ten opzichte van het effect in de hele groep (Simpson’s paradox, suppressie effect, ...)

Of: Na statistische correctie voor een extra achtergrondvariabele verandert het effect van een andere variabele van richting

4

Voorbeeld (Tu et al. 2008)

geboortegewicht (gg) bloeddruk (bd)

? huidig gewicht (hg) ?

normale bd hoge bd totaal

laag gg 354 132 486

hoog gg 328 186 514

totaal 682 318 1000

5

Voorbeeld I (Tu et al. 2008)

geboortegewicht (gg) bloeddruk (bd)

? huidig gewicht (hg) ?

normale bd hoge bd totaal %hoge bd

laag gg 354 132 486 27%

hoog gg 328 186 514 36%

totaal 682 318 1000 32%

→ laag geboortegewicht heeft een risicoverlagend effect op het hebben van hoge bloeddruk

6

Voorbeeld I (vervolg)Onderverdelen in groepen (hg categorisch):

normale bd hoge bd totaal %hoge bd

laag gg 354 132 486 27%laag hg 329 99 428 hoog hg 25 33 58

hoog gg 328 186 514 36%laag hg 221 55 276

hoog hg 107 131 238 totaal 682 318 1000 32%

laag hg 550 154 704 hoog hg 132 164 296

7

Voorbeeld I (vervolg)Onderverdelen in groepen (hg categorisch):

normale bd hoge bd totaal %hoge bd

laag gg 354 132 486 27%laag hg 329 99 428 23%hoog hg 25 33 58 57%

hoog gg 328 186 514 36%laag hg 221 55 276 20%

hoog hg 107 131 238 55%totaal 682 318 1000 31.8%

laag hg 550 154 704 22%hoog hg 132 164 296 55%

→ in beide subgroepen lijkt een laag geboortegewicht nu een risicoverhogend effect op het hebben van hoge bloedddruk te hebben

... hoe kan dit? wat gaat er fout?

8

Voorbeeld I: Simpson’s paradox

9

Voorbeeld IINu: dezelfde data, maar met bd en hg als continue variabelen

Lineaire regressiemodellen:1) Model 1

(onvoorwaardelijk effect van gg op bd)

2) Model 2

(voorwaardelijk effect van gg op bd gegeven hg)

NB: beide regr.coeff. significant

... hoe kan dit? wat gaat er `fout’?

ggbbbd ggc 11

ggbhgbbbd gghgc 222

49,21 ggb

94,22 ggb

10

Voorbeeld II: Lord’s paradox

hui

dig

gew

icht

11

Het probleem in een notendopHet dilemma lijkt te zijn:

Welk resultaat is correct? Welke analyse is de juiste?(hele groep? subgroepen? corrigeren?)

De grote vraag is eigenlijk:Wordt het effect waarin we geïnteresseerd zijn verstoord door andere variabelen? (confounding)… en zo ja, voor welke variabele(n) moeten we corrigeren om dat te verhelpen? (de confounder / verzameling confounders)

De oplossing: Causale grafen helpen (nog voor de analyse plaats vindt!) het probleem te ontleden.

NB: Dit probleem is minder van belang wanneer we een voorspellend model willen bouwen. Het wordt pas een probleem zodra we de relaties tussen de variabelen nader willen verklaren!

12

Confounder – Definitie

Een variabele is een confounder:

- als hij geassocieerd is met de behandeling/blootstelling waarin we

geïnteresseerd zijn

Hier: hg is een confounder als hij geassocieerd is met gg

- als hij onafhankelijk van de behandeling/blootstelling geassocieerd

is met de uitkomst

… als hg (onafhankelijk van gg) geassocieerd is met bd

- als hij niet op het causale pad ligt

… als niet geldt: gg → hg → bd

13

Mogelijke situaties

1) hg is geen confounderhg

bdgg

hg

bdgg

hg

bdgg

Wat moeten we doen in meer complexe situaties? Wanneer is er sprake van confounding?

2) hg is geen confounder

3) hg is geen confounder 4) hg is confounder

? ?

hg

bdgg ??

Is hg confounder?

14

Complexere situatiesIs er sprake van confounding? (u1, u2 ongemeten variabelen)

Zo ja, waarvoor moeten we corrigeren?

→ theorie van causale grafen helpt hierbij!

hg

bdgg ?

hg

bdgg

u1

?

hg

bdgg

u1 u2

?

hg

bdgg

u2

?

15

Causale grafenWat terminologie

X, Y: ouders van Z; Z: kind van X en Y

A: voorouder van Z; Z: afstammeling van A

Z: put (collider): variabele op pad waarbij er vanuit de voorgaande en

volgende variabele pijlen in de richting van de variabele wijzen

Hier: X Z Y

Z

YB X

A

16

Causale grafenStatistische associatie

Twee variabelen zijn alleen dan statistisch geassocieerd in de

gehele populatie als:

OF: de een oorzaak van de ander is

X veroorzaakt Z; A veroorzaakt B

OF: ze een gemeenschappelijke (voor-)ouder delen

B en X hebben beide A als gemeenschappelijke

oorzaak, idem B en Z

Z

YB X

A

17

Causale grafenConditioneren op ouders

Er geldt:

Door op zijn ouders te conditioneren (stratificeren, aangegeven

met omkadering) wordt een variabele X onafhankelijk van alle

variabelen die geen afstammeling van X zijn.

longkanker gele vingers

roken

18

Causale grafenConditioneren op kinderen

Ook geldt: conditioneren (stratificeren) op kinderen

beïnvloedt de associaties tussen de (voor-)ouders van

die variabele.

Voorbeeld:

A: de accu is leeg

B: de benzinetank is leeg

C: de auto start niet

A B

C

19

Causale grafenConditioneren op afstammelingen

Conditioneren (stratificeren) op D veroorzaakt- een associatie tussen A en B (binnen strata van D)- maar kan ook de grootte van de associaties tussen A-C

en B-C veranderen!

A B

C

D

A: de accu is leeg

B: de benzinetank is leeg

C: de auto start niet

D: op de fiets naar het werk

20

Het effect van conditionerenSamenvattend: conditioneren (stratificeren)• kan marginale afhankelijkheden doen verdwijnen• kan (conditionele) afhankelijkheden introduceren die er

eerst nog niet waren• kan de grootte van al bestaande afhankelijkheden

beïnvloeden

Dit is wat er gebeurt in het geval van onze paradoxen!

Terug naar de vraag: wanneer is er sprake van confounding? wanneer moet je conditioneren?

21

Open en gesloten paden

• Een pad is een wandeling over het diagram, niet rekening houdend met de richting van de pijlenbv. A – C – E , maar ook: E – C – A

• Elk pad met een put erop, is een gesloten pad (blocked path)bv. A – C – B (C is een put)

• Elk pad dat niet gesloten is, is een open pad (unblocked path)bv. E – C – D

A B

C

E D

22

Het opsporen van confounding: algemeen stappenplan

1) Teken het causale diagram

2) Verwijder alle effecten vanuit

de behandeling/blootstelling

3) Zijn er open paden van de behandeling naar de uitkomst?

- Ja → confounding (conditioneren/corrigeren)

- Nee → geen confounding

→ Confounding wordt vervolgens opgeheven door die open paden te blokkeren door conditioneren (achterdeurcriterium/d-separatie)

hg

bdgg ?

23

Complexere situaties (vervolg)

3) Geen confounding (per ongeluk wel corrigeren geeft juist

confounding/bias!) 4) Geen confounding (per ongeluk wel corrigeren geeft juist

confounding/bias!)

Wanneer is er sprake van confounding? Toepassen stappenplan:

2) Confounding → corrigeren voor hg (of u1) om deze op te heffen

hg

bdgg

u1

?

1) Geen confounding (per ongeluk wel corrigeren geeft juist confounding/bias!)

hg

bdgg ?

hg

bdgg

u2

?

hg

bdgg

u1 u2

?

24

Samenvattend• De paradoxen zijn slechts symptoom van een groter onderliggend

probleem: het correct vinden en corrigeren voor confounding

• Oplossing kun je niet vinden door het toepassen van een statistische toets!

• Causale grafen kunnen helpen dergelijke problemen te structureren, confounding op te sporen en uit te schakelen om een correcte schatting van het effect te verkrijgen

• `Voor de zekerheid’ corrigeren voor alle covariaten is gevaarlijk en kan juist bias veroorzaken

• Pas wel op: verschillende causale modellen kunnen even plausibel zijn, maar verschillende consequenties voor de analyse hebben

25

Literatuur• Arah, O.A., `The role of causal reasoning in understanding Simpson’s paradox, Lord’s

paradox, and the suppression effect: covariate selection in the analysis of

observational studies’, Emerging Themes in Epidemiology 5 (2008)

• S. Greenland, J. Pearl, J.M. Robins, `Causal diagrams for epidemiologic research’,

Epidemiology 10 (1999), 37-48

• M.A. Hernán, S. Hernández-Diaz, J.M. Robins, `A structural approach to selection

bias’, Epidemiology 15 (2004), 615-625

• J. Pearl, Causality. Models, reasoning and inference (Cambridge 2000)

• Tu, Y-K., Gunnel, D., Gilthorpe, M.S., `Simpson’s paradox, Lord’s paradox, and

Suppression effect are the same phenomenon – the reversal paradox’, Emerging

Themes in Epidemiology 5 (2008)

→ Zie ook de website van Charles Pool voor een programma voor het zoeken van

confounding in een diagram: http://epi.dife.de/dag

26

Volgende maand

Woensdag 21 april 2010

12 – 13 uur

Survival analysis en competing risks