1 Help! Statistiek! Doel:Informeren over statistiek in klinisch onderzoek. Tijd:Derde woensdag in de...

31
1 Help! Statistiek! Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde woensdag in de maand, 12-13 uur 20 februari : Hoe gaan we om met herhaalde metingen? 19 maart : ROC curve en diagnostische nauwkeurigheid 16 april : Hoe moeten we toetsresultaten interpreteren? Sprekers: Vaclav Fidler, Hans Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk.

Transcript of 1 Help! Statistiek! Doel:Informeren over statistiek in klinisch onderzoek. Tijd:Derde woensdag in de...

Page 1: 1 Help! Statistiek! Doel:Informeren over statistiek in klinisch onderzoek. Tijd:Derde woensdag in de maand, 12-13 uur 20 februari : Hoe gaan we om met.

1

Help! Statistiek!

Doel: Informeren over statistiek in klinisch onderzoek.

Tijd: Derde woensdag in de maand, 12-13 uur

20 februari : Hoe gaan we om met herhaalde metingen?19 maart : ROC curve en diagnostische nauwkeurigheid16 april : Hoe moeten we toetsresultaten interpreteren?

Sprekers: Vaclav Fidler, Hans Burgerhof, Wendy PostDG Epidemiologie

Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk.

Page 2: 1 Help! Statistiek! Doel:Informeren over statistiek in klinisch onderzoek. Tijd:Derde woensdag in de maand, 12-13 uur 20 februari : Hoe gaan we om met.

2

Herhaalde metingen

• Wat zijn herhaalde metingen?• Waarom zijn de gebruikelijke methoden niet

geschikt?• Mogelijke benaderingen• De random effects modellen

– Random interceptmodel• Waarom moeten we random effects modellen

gebruiken?

Page 3: 1 Help! Statistiek! Doel:Informeren over statistiek in klinisch onderzoek. Tijd:Derde woensdag in de maand, 12-13 uur 20 februari : Hoe gaan we om met.

3

Herhaalde metingen

Subjecten (personen, patiënten, dieren) van één of meer groepen hebben meerdere metingen op één of meer variabelen.

Wanneer interessant? - Verschillen binnen personen- Verschillen tussen personen

Probleem:

Waarnemingen zijn niet onafhankelijk

Page 4: 1 Help! Statistiek! Doel:Informeren over statistiek in klinisch onderzoek. Tijd:Derde woensdag in de maand, 12-13 uur 20 februari : Hoe gaan we om met.

4

Voorbeelden algemeen

• Voor- en nameting voor 1 groep personen:–within design

• Herhaalde metingen voor 2 verschillende

behandelgroepen: – within en between design

• Uitbreiding naar meerdere within-factoren en

meerdere between factoren: – zoals geslacht en leeftijd en behandeling (between

factoren)– meerdere momenten door verschillende

observers (within factoren)

Page 5: 1 Help! Statistiek! Doel:Informeren over statistiek in klinisch onderzoek. Tijd:Derde woensdag in de maand, 12-13 uur 20 februari : Hoe gaan we om met.

5

Voorbeelden algemeen

• Longitudinale studie: groei-curves

•Cross-over designs

•In duplo of meer uitgevoerde lab-bepalingen

Page 6: 1 Help! Statistiek! Doel:Informeren over statistiek in klinisch onderzoek. Tijd:Derde woensdag in de maand, 12-13 uur 20 februari : Hoe gaan we om met.

6

Voorbeelden algemeen

1. Multi-level benadering: multicenter clinical trials

Patiënten kunnen opgevat worden als herhaalde metingen binnen 1 centrum

2 In meta-analyses: de waarnemingen binnen elke studie zijn de herhaalde waarnemingen

Kortom:

Geclusterde data kunnen opgevat worden

als herhaalde metingen data en andersom.

Page 7: 1 Help! Statistiek! Doel:Informeren over statistiek in klinisch onderzoek. Tijd:Derde woensdag in de maand, 12-13 uur 20 februari : Hoe gaan we om met.

7

Voorbeeld

5 subjecten

4 herhaalde metingen

Stofwisseling- parameter

2 factoren:

Dieet: N en O

Tijd: voor en na

Subject Dieet voor na

maaltijd

1 N 1.47 1.78

O 1.72 2.49

2 N 1.42 1.68

O 1.44 1.87

3 N 1.10 1.26

O 1.11 1.36

4 N 0.84 1.11

O 0.90 1.29

5 N 0.91 1.09

O 1.00 1.25

Page 8: 1 Help! Statistiek! Doel:Informeren over statistiek in klinisch onderzoek. Tijd:Derde woensdag in de maand, 12-13 uur 20 februari : Hoe gaan we om met.

8

Voorbeeld

Drie vragen

1. Is er een dieet effect?

2. Is er een tijdseffect

3. Is er een interactie effect?

Subject Dieet voor na

maaltijd

1 N 1.47 1.78

O 1.72 2.49

2 N 1.42 1.68

O 1.44 1.87

3 N 1.10 1.26

O 1.11 1.36

4 N 0.84 1.11

O 0.90 1.29

5 N 0.91 1.09

O 1.00 1.25

Page 9: 1 Help! Statistiek! Doel:Informeren over statistiek in klinisch onderzoek. Tijd:Derde woensdag in de maand, 12-13 uur 20 februari : Hoe gaan we om met.

9

Voorbeeld

Page 10: 1 Help! Statistiek! Doel:Informeren over statistiek in klinisch onderzoek. Tijd:Derde woensdag in de maand, 12-13 uur 20 februari : Hoe gaan we om met.

10

Voorbeeld

Is er een dieet effect?

Gepaarde t-test per tijdmoment (of gemiddelde)

5 observaties

Subject Dieet voor na

maaltijd

1 N 1.47 1.78

O 1.72 2.49

2 N 1.42 1.68

O 1.44 1.87

3 N 1.10 1.26

O 1.11 1.36

4 N 0.84 1.11

O 0.90 1.29

5 N 0.91 1.09

O 1.00 1.25

Page 11: 1 Help! Statistiek! Doel:Informeren over statistiek in klinisch onderzoek. Tijd:Derde woensdag in de maand, 12-13 uur 20 februari : Hoe gaan we om met.

11

Voorbeeld

Is er een tijds effect?

Gepaarde t-test

per dieet

(of gemiddelde)

5 observaties

Subject Dieet voor na

maaltijd

1 N 1.47 1.78

O 1.72 2.49

2 N 1.42 1.68

O 1.44 1.87

3 N 1.10 1.26

O 1.11 1.36

4 N 0.84 1.11

O 0.90 1.29

5 N 0.91 1.09

O 1.00 1.25

Page 12: 1 Help! Statistiek! Doel:Informeren over statistiek in klinisch onderzoek. Tijd:Derde woensdag in de maand, 12-13 uur 20 februari : Hoe gaan we om met.

12

Voorbeeld

Is er een interactie effect?

Is de verandering overtijd verschillend voor debeide diëten?

Varieert het verschil tussen de diëten overde tijd?

Gepaarde t-test op delta (verandering)

Subject dieet voor achter

maaltijd delta

1 N 1.47 1.78 0.31

O 1.72 2.49 0.77

2 N 1.42 1.68 0.26

O 1.44 1.87 0.43

3 N 1.10 1.26 0.16

O 1.11 1.36 0.25

4 N 0.84 1.11 0.27

O 0.90 1.29 0.39

5 N 0.91 1.09 0.18

O 1.00 1.25 0.25

Page 13: 1 Help! Statistiek! Doel:Informeren over statistiek in klinisch onderzoek. Tijd:Derde woensdag in de maand, 12-13 uur 20 februari : Hoe gaan we om met.

13

Voorbeeld

Als er slechts 2 herhaalde metingen zijn per

factor: gepaarde t-test is een oplossing

Maar wat als er meer herhaalde metingen zijn?

De afhankelijkheden tussen metingen binnen elk

persoon zijn de oorzaak van het feit dat we de

technieken moeten gebruiken die rekening houden

met deze correlaties!

Page 14: 1 Help! Statistiek! Doel:Informeren over statistiek in klinisch onderzoek. Tijd:Derde woensdag in de maand, 12-13 uur 20 februari : Hoe gaan we om met.

14

Mogelijke benaderingen

1. Gebruiken van 1 samengevatte variabele: 1. Verschilscore van na- en voormeting2. Maximum of minimum3. Gemiddelde

Voordeel1. simpel: we hebben weer onafhankelijke

waarnemingen

Nadelen:1. Informatie wordt weggegooid2. Bij missende data is er geen goede samenvatting

Page 15: 1 Help! Statistiek! Doel:Informeren over statistiek in klinisch onderzoek. Tijd:Derde woensdag in de maand, 12-13 uur 20 februari : Hoe gaan we om met.

15

Mogelijke benaderingen

2. Per herhaalde meting de analyse uitvoeren

Voordeel1. simpel: alleen onafhankelijke waarnemingen

Nadelen

1. multiple testing

2. houdt geen rekening met de

afhankelijkheidsstructuur

Page 16: 1 Help! Statistiek! Doel:Informeren over statistiek in klinisch onderzoek. Tijd:Derde woensdag in de maand, 12-13 uur 20 februari : Hoe gaan we om met.

16

Mogelijke benaderingen

3. RM-ANOVAUitbreiding van ANOVA/MANOVA met zelfde terminologie

Voordelen:• Voor mensen die ANOVA-technieken kennen is het

een natuurlijke uitbreiding• Bekend bij velen als enige manier, omdat tot voor een

paar jaar geleden dit de enige manier was om herhaalde metingen in SPSS te analyseren

Nadelen• Alleen continue responsematen• Zeer strenge eisen t.a.v. afhankelijkheidsstructuur van

de data (compound symmetry) • Kan geen missende gegevens aan

Page 17: 1 Help! Statistiek! Doel:Informeren over statistiek in klinisch onderzoek. Tijd:Derde woensdag in de maand, 12-13 uur 20 februari : Hoe gaan we om met.

17

Mogelijke benaderingen

4. Random-effectsmodellenRegressiemodelbenadering met zelfde terminologieOok wel multilevelmodellen, random parametermodellen of mixed models genoemd

Voordelen• Standaard in pakketten als SAS, MLwin, S-plus en R,

en SPSS (sinds versie 12 werkt mixed models redelijk)• Kan missing data aan (MAR)• Flexibiliteit in modelleren van afhankelijkheidsstructuur

Nadeel:Complexe modellen! Vraagt veel van onderzoeker

Page 18: 1 Help! Statistiek! Doel:Informeren over statistiek in klinisch onderzoek. Tijd:Derde woensdag in de maand, 12-13 uur 20 februari : Hoe gaan we om met.

18

Nieuw voorbeeld met 2 factoren: factor tijd (within)

factor dieet (between)

Onderzoeksprobleem: Vergelijken van 2 verschillende diëten t.a.v. effect op gewicht

Experiment: 1. Gerandomiseerde trial2. 2 diëten A and B; 20 personen3. Elk persoon wordt elke 3 maanden gewogen4. Baseline: voor start dieet; laatste meting: 12 maanden na

start dieet: in totaal 5 metingen per persoon

Na randomisatie: 8 personen krijgen dieet A ; 12 personen dieet B

Page 19: 1 Help! Statistiek! Doel:Informeren over statistiek in klinisch onderzoek. Tijd:Derde woensdag in de maand, 12-13 uur 20 februari : Hoe gaan we om met.

19

Nieuw voorbeeld (vervolg): factor tijd en factor dieet

Onderzoeksvraag: Welk dieet heeft meer effect op het gewicht?

Eigenlijk: Zijn er verschillen tussen de 2 diëten voor wat betreft deveranderingen in gewicht over tijd?

Vraag betreft interactie tussen tijd en dieet.

Page 20: 1 Help! Statistiek! Doel:Informeren over statistiek in klinisch onderzoek. Tijd:Derde woensdag in de maand, 12-13 uur 20 februari : Hoe gaan we om met.

20

Random effects model

Twee niveaus:

Niveau 1: (within) Metingen binnen een persoon: veranderingen over de tijd

Niveau 2: (between)Metingen tussen personen: verschillen als gevolg van dieet

Page 21: 1 Help! Statistiek! Doel:Informeren over statistiek in klinisch onderzoek. Tijd:Derde woensdag in de maand, 12-13 uur 20 februari : Hoe gaan we om met.

21

Nieuw voorbeeld (vervolg): factor tijd en factor dieet

Page 22: 1 Help! Statistiek! Doel:Informeren over statistiek in klinisch onderzoek. Tijd:Derde woensdag in de maand, 12-13 uur 20 februari : Hoe gaan we om met.

22

Random effects model: niveau 1

Model voor verandering over tijd

gewichtij = 0i + 1itijdj + (eij)

i = 1,…, 20 personen; j = 1,…5 tijdmomenten

0i = intercept voor persoon i

1i = helling voor persoon i

Elk persoon heeft z’n eigen regressielijn

Page 23: 1 Help! Statistiek! Doel:Informeren over statistiek in klinisch onderzoek. Tijd:Derde woensdag in de maand, 12-13 uur 20 februari : Hoe gaan we om met.

23

Random effects model: niveau 1

Model voor verandering over tijd

gewichtij = 0i + 1itijdj + (eij)

eij = niveau 1 residu: within person fout, meetfout

eij ~ N(0,2e)

Page 24: 1 Help! Statistiek! Doel:Informeren over statistiek in klinisch onderzoek. Tijd:Derde woensdag in de maand, 12-13 uur 20 februari : Hoe gaan we om met.

24

Random effects model: niveau 2

Model voor verschillen tussen personen

Elk persoon heeft eigen intercept en eigen helling

We brengen dus de herhaalde metingen terug totintercept en helling!

1. Zijn er verschillen in intercept en helling?2. Welke predictoren verklaren die verschillen?

Page 25: 1 Help! Statistiek! Doel:Informeren over statistiek in klinisch onderzoek. Tijd:Derde woensdag in de maand, 12-13 uur 20 februari : Hoe gaan we om met.

25

Random effects model: niveau 2

Model voor verschillen tussen personen:

Welke predictoren verklaren verschillen in intercept

en helling ?

0i = γ00 + γ01*dieeti + u0i

1i = γ10 + γ11*dieeti +u1i

γ00 , γ01, γ10 en γ11 : fixed effects

0i , 0i : random effects

u0i en u1i : niveau 2 residuen; tussen-persoons fouten

Page 26: 1 Help! Statistiek! Doel:Informeren over statistiek in klinisch onderzoek. Tijd:Derde woensdag in de maand, 12-13 uur 20 februari : Hoe gaan we om met.

26

Random effects model samengesteld: beide niveaus

samengestelde model

gewichtij = γ00 + γ01*dieeti+ γ10*tijdj +

γ11*dieeti*tijdj +

u0i + u1i*tijdj + eij

Resultaat: regressie model met complex residu

Page 27: 1 Help! Statistiek! Doel:Informeren over statistiek in klinisch onderzoek. Tijd:Derde woensdag in de maand, 12-13 uur 20 februari : Hoe gaan we om met.

27

Random effects model samengesteld: beide niveaus

Residu van samengesteld model u0i + u1i*tijdj + eij

Heteroscedasticiteit:

ongelijke variantie per tijdsmoment

Autocorrelatie:

residuen zijn gecorreleerd

Page 28: 1 Help! Statistiek! Doel:Informeren over statistiek in klinisch onderzoek. Tijd:Derde woensdag in de maand, 12-13 uur 20 februari : Hoe gaan we om met.

28

Random intercept modelniveau 1 en niveau 2

Niveau 1: voor verandering over de tijd

gewichtij = 0i + 1itijdj + (eij) (zelfde als hiervoor)

Niveau 2:

0i = γ00 + γ01*dieeti + u0i

1i = γ10 + γ11*dieeti helling heeft geen fout

Dus alleen random intercept

Page 29: 1 Help! Statistiek! Doel:Informeren over statistiek in klinisch onderzoek. Tijd:Derde woensdag in de maand, 12-13 uur 20 februari : Hoe gaan we om met.

29

Random intercept model: het samengestelde model

gewichtij = γ00 + γ01*dieeti+ γ10*tijdj + γ11*dieeti*tijdj + u0i + eij

Resultaat: regressie model met simpeler residu

eij ~ N(0,2e) , u0i ~ N(0,2

0)

Splitst variantie componenten op in variantietussen personen en variantie binnen personen

Intraclass correlatie: = 20/(2

e+ 20)

Page 30: 1 Help! Statistiek! Doel:Informeren over statistiek in klinisch onderzoek. Tijd:Derde woensdag in de maand, 12-13 uur 20 februari : Hoe gaan we om met.

30

Random intercept model:

Constante variantie en covariantie:

Met: Intraclass correlatie: = 20/(2

e+ 20)

Dit komt neer op de aanname van

compound symmetrie:

Is de aanname van RM-ANOVA

Page 31: 1 Help! Statistiek! Doel:Informeren over statistiek in klinisch onderzoek. Tijd:Derde woensdag in de maand, 12-13 uur 20 februari : Hoe gaan we om met.

31

Waarom randomeffects modellen gebruiken?

1. De correlatie binnen subjecten kan expliciet worden gemodelleerd.

2. Ingewikkelde designs kunnen worden gemodelleerd

3. Ook voor categoriele responsematen

4. Missende data leveren geen problemen op voor random effects modellen, mits de data Missing At Random zijn (MAR).