Wetenschappelijk Onderzoek en Statistiek (deel 2 ... · 2.4.2 Operatieve behandeling Variabele...

422
Wetenschappelijk Onderzoek en Statistiek (deel 2) Statistische Modellen Geert Verbeke Biostatistisch Centrum, K.U.Leuven [email protected] http://perswww.kuleuven.be/geert verbeke Master in de Verpleegkunde en de Vroedkunde

Transcript of Wetenschappelijk Onderzoek en Statistiek (deel 2 ... · 2.4.2 Operatieve behandeling Variabele...

  • Wetenschappelijk Onderzoek en Statistiek (deel 2)

    Statistische Modellen

    Geert Verbeke

    Biostatistisch Centrum, K.U.Leuven

    [email protected]

    http://perswww.kuleuven.be/geert verbeke

    Master in de Verpleegkunde en de Vroedkunde

  • Inhoudstabel

    1 Introductie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

    2 Centrale data set . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

    3 De Pearson correlatie coëfficiënt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

    4 Enkelvoudige lineaire regressie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

    5 Model diagnose . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

    6 Invloedrijke observaties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

    7 De ongepaarde t-test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138

    8 1-weg ANOVA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159

    Wet. Ond. & Stat.: Modellen i

  • 9 Meervoudige lineaire regressie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198

    10 Polynomiale regressie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238

    11 Interactie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251

    12 Meervoudige ANOVA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 274

    13 Analyse van covariantie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 318

    14 Het algemeen lineair model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 348

    15 Enkelvoudige logistische regressie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 370

    16 Meervoudige logistische regressie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 405

    Wet. Ond. & Stat.: Modellen ii

  • Hoofdstuk 1

    Introductie

    . Motivatie

    . Cursusmateriaal

    . Examensysteem

    Wet. Ond. & Stat.: Modellen 1

  • 1.1 Motivatie

    • Master thesis

    • Statistiek in (bio-)medische literatuur

    • Correcte analyse van verzamelde data en correcte interpretatie van de resultaten

    Wet. Ond. & Stat.: Modellen 2

  • 1.2 Cursusmateriaal

    • Kopies van de cursusnota’s: Toledo

    • Datasets die in de cursus geanalyseerd worden: Toledo

    • Statistica software:. Beschikbaar in alle K.U.Leuven PC klassen

    . Verkrijgbaar via LUDIT:

    http://ludit.kuleuven.be/software/

    . . . .

    Wet. Ond. & Stat.: Modellen 3

  • • Vestac JAVA applets. Online:

    http://ucs.kuleuven.be/links/index.htm

    . Lokale installatie:

    http://ucs.kuleuven.be/java/download/download.html

    en volg instructies

    Wet. Ond. & Stat.: Modellen 4

  • 1.3 Examensysteem

    • Take-home groepswerk (4 studenten)

    • Data analyse, opgestart tijdens de practica

    • Mondelinge verdediging van het rapport

    Wet. Ond. & Stat.: Modellen 5

  • Hoofdstuk 2

    Centrale data set

    . Inleiding

    . Probleemstelling

    . Steekproef

    . Verzamelde gegevens

    Wet. Ond. & Stat.: Modellen 6

  • 2.1 Inleiding

    • Deze gegevens vormen de rode draad doorheen de cursus, en zullen het gebruikvan de behandelde statistische technieken en de interpretatie van hun resultatenillustreren.

    • De gegevens werden verzameld door Prof.Dr. Koen Milisen, CZV, K.U.Leuven.

    • De gegevens zijn beschikbaar voor de studenten, maar mogen onder geen enkelevoorwaarde verder verspreid worden of gebruikt worden voor enig ander doel dandeze cursus.

    Wet. Ond. & Stat.: Modellen 7

  • 2.2 Probleemstelling

    • Onderzoek naar post-operatieve variabiliteit in de neuro-cognitieve en functionelestatus bij bejaarde heupfractuur patiënten.

    • Een heelkundige ingreep bij ouderen resulteert vaak in voorbijgaande cognitievestoornissen (= delirium).

    • Delirium verus dementie :. Delirium : → acute start

    → meestal van voorbijgaande aard. Dementie : → geen acute start

    → langzaam voortschrijdend→ irreversibel

    Wet. Ond. & Stat.: Modellen 8

  • • Delirium . . .. geeft aanleiding tot verpleegkundige en medische problemen.

    . is vaak een eerste symptoom van een fysische ziekte of een intoxicatie doorgeneesmiddelen

    . kan leiden tot verhoogde mortaliteit

    . is moeilijk te ontdekken

    • Economische implicaties van delirium :. Extra verpleegkundige zorg

    . Langer ziekenhuisverblijf

    . Hoge graad van institutionalizering

    • Onderzoek toont aan dat, bij oudere heupfractuur patiënten, de verhoogde graadvan afhankelijkheid eerder een gevolg is van delirium, dan wel van de fractuur zelf.

    Wet. Ond. & Stat.: Modellen 9

  • 2.3 Steekproef

    • Longitudinaal proef opzet : Bepaalde variabelen worden herhaaldelijk over de tijdgemeten.

    • Prospectieve (bvb. complicaties) en retrospectieve (bvb. woonsituatie) metingen.

    • Data van 2 traumatologische afdelingen van U.Z. Gasthuisberg, K.U.Leuven.

    • Inclusie-criteria :. ≥ 65 jaar. opgenomen met heupfractuur op de afdeling spoedgevallen

    . toestemming geven tot deelname aan de studie

    . . . .

    Wet. Ond. & Stat.: Modellen 10

  • • Exclusie-criteria :. tijd tussen opname en operatie ≥ 72 uur. meerdere trauma’s

    . . . .

    • Data verzameld tussen 16/9/96 en 28/2/97.

    Wet. Ond. & Stat.: Modellen 11

  • 2.4 Verzamelde gegevens

    • Statistica-file (Kernel release 5.5A): delirium.sta

    • Gegevens over 60 patiënten

    • 78 variabelen

    • Gegevens over elke patiënt van voor, tijdens en na de operatie

    • Longitudinale en afgeleide metingen

    • Vragenlijst studie, ADL score, MMSE en CAM scores

    Wet. Ond. & Stat.: Modellen 12

  • Wet.

    Ond.&

    Stat.:

    Modellen

    13

  • Wet.

    Ond.&

    Stat.:

    Modellen

    14

  • Wet.

    Ond.&

    Stat.:

    Modellen

    15

  • 2.4.1 Pre-operatieve evaluatie

    Variabele Omschrijving Waarden

    nummer patiënt nummer 1–60

    leeftd leeftijd (jaar)

    gesl geslacht 1=man2=vrouw

    opnduur opname duur (dagen)

    burgst burgerlijke stand 1=alleenstaand2=gehuwd3=weduw(e)(naar)4=gescheiden5=kloosterling(e)

    opleid opleiding 1=universiteit/hogeschool2=hoger secundair3=lager secundair4=lager onderwijs

    zijfrc zijde fractuur 1=links2=rechts

    typfrc type fractuur 1=intra-capsulair2=extra-capsulair

    cardio cardiologische pathologie 0=niet1=wel

    vascul vasculaire pathologie 0=niet1=wel

    Wet. Ond. & Stat.: Modellen 16

  • Variabele Omschrijving Waarden

    pulmon pulmonaire pathologie 0=niet1=wel

    urinai urinaire pathologie 0=niet1=wel

    abdom abdominale pathologie 0=niet1=wel

    hyper hypertensie 0=niet1=wel

    zicht gezicht pathologie 0=niet1=wel

    gehoor gehoor pathologie 0=niet1=wel

    malign maligne ziekte 0=niet1=wel

    diabet diabetes 0=niet1=wel

    reumat reumatologische pathologie 0=niet1=wel

    vrop vroegere operaties 0=niet1=wel

    neuro neuro-psychiatrische pathologie 0=niet1=wel

    andere andere pathologie 0=niet1=wel

    Wet. Ond. & Stat.: Modellen 17

  • Variabele Omschrijving Waarden

    woonsi woonsituatie 1=alleen2=met partner/familie/klooster3=RH/RVT4=andere

    gn1 inname medicatie 0=wel1=niet

    dig1 inname digitalis 0=niet1=wel

    diur1 inname diuretica 0=niet1=wel

    bblo1 inname β-blokker 0=niet1=wel

    benz1 inname benzodiazepines 0=niet1=wel

    anti1 inname anticholinergica 0=niet1=wel

    neur1 inname neuroleptica 0=niet1=wel

    depres1 inname antidepressiva 0=niet1=wel

    other1 inname andere medicatie 0=niet1=wel

    Wet. Ond. & Stat.: Modellen 18

  • 2.4.2 Operatieve behandeling

    Variabele Omschrijving Waarden

    opnop verloop opname-operatie 1=als spoedgeval2=

  • 2.4.3 Post-operatieve evaluatie

    Variabele Omschrijving Waarden

    no mechanische complicaties 0=wel1=niet

    luxa luxatie van prothese 0=niet1=wel

    impla implantatie problemen 0=niet1=wel

    anmec andere mechanische problemen 0=niet1=wel

    nolok lokale complicaties 0=wel1=niet

    opper oppervlakkige wondproblemen 0=niet1=wel

    diep diepe infectie 0=niet1=wel

    anlok andere lokale complicaties 0=niet1=wel

    gen algemene complicaties 0=wel1=niet

    doorli doorligwonden 0=niet1=wel

    diephl diepe phlebotrombose 0=niet1=wel

    pulemb pulmonair embool 0=niet1=wel

    Wet. Ond. & Stat.: Modellen 20

  • Variabele Omschrijving Waarden

    urin urinaire complicaties 0=niet1=wel

    ander andere respiratoire problemen 0=niet1=wel

    cardi cardiologische complicaties 0=niet1=wel

    cere cerebrale complicaties 0=niet1=wel

    autre andere algemene complicaties 0=niet1=wel

    gn inname medicatie 0=wel1=niet

    dig inname digitalis 0=niet1=wel

    diur inname diuretica 0=niet1=wel

    bblo inname β-blokker 0=niet1=wel

    benz inname benzodiazepines 0=niet1=wel

    anti inname anticholinergica 0=niet1=wel

    neur inname neuroleptica 0=niet1=wel

    Wet. Ond. & Stat.: Modellen 21

  • Variabele Omschrijving Waarden

    depres02 inname antidepressiva 0=niet1=wel

    other inname andere medicatie 0=niet1=wel

    ontsl ontslag naar 1=thuis2=dochter/zoon3=geriatrishce afdeling4=revalidatie centrum5=psychiatrisch ziekenhuis6=RH/RVT7=klooster8=andere

    dood overleden tijdens hospitalisatie 1=ja2=nee

    Wet. Ond. & Stat.: Modellen 22

  • 2.4.4 Longitudinale en afgeleide metingen

    Variabele Omschrijving Waarden

    sencam CAM resultaat op dag 1 1=delirium; 2=geen delirium

    sencam03 CAM resultaat op dag 3

    sencam05 CAM resultaat op dag 5

    senverw Is CAM resultaat ooit 1 geweest ? 0=nee; 1=ja

    adltot1 ADL score op dag 1 6-24; 6=niet afhankelijk;24=sterk afhankelijk

    adltot5 ADL score op dag 5

    adltot12 ADL score op dag 12

    MMSE1 MMSE score op dag 1 0-30; 0=sterk cognitief gestoord; 30=niet cognitief gestoord

    MMSE3 MMSE score op dag 3

    MMSE5 MMSE score op dag 5

    MMSE8 MMSE score op dag 8

    MMSE12 MMSE score op dag 12

    CAM : Confusion Assessment Method, gemeten op dag 1,3,5,8,12

    ADL : Aktiviteiten van het Dagelijks Leven, gemeten op dag 1,5,12

    MMSE : Mini Mental State Examination, gemeten op dag 1,3,5,8,12

    Wet. Ond. & Stat.: Modellen 23

  • Hoofdstuk 3

    De Pearson correlatie coëfficiënt

    . Voorbeeld

    . Pearson correlatie

    . Eigenschappen en interpretatie

    . Statistische inferentie

    . Berekeningen in Statistica en interpretatie

    Wet. Ond. & Stat.: Modellen 24

  • 3.1 Voorbeeld

    • In de literatuur wordt gesuggereerd dat een gedaalde cognitieve status eenverhoogde afhankelijkheid teweeg brengt bij postoperatieve heup fractuurpatiënten.

    • We onderzoeken daarom het verband tussen MMSE en ADL, 1 dag na de operatie.

    • Voor elke patiënt hebben we dus twee metingen:. De MMSE score : xi voor de ide patiënt

    . De ADL score : yi voor de ide patiënt

    • De gegevens zijn dus koppels (xi, yi)

    Wet. Ond. & Stat.: Modellen 25

  • • Een grafische voorstelling van het verband tussen MMSE en ADL kan bekomenworden via een scatterplot van de yi versus de xi.

    • Statistica menu:

    Wet. Ond. & Stat.: Modellen 26

  • • Statistica output:

    • De figuur suggereert een negatieve relatie tussen MMSE en ADL

    Wet. Ond. & Stat.: Modellen 27

  • 3.2 De Pearson correlatie coëfficiënt

    Het verband tussen twee veranderlijken wordt vaak samengevat met behulp van dePearson correlatie coefficiënt:

    r =∑

    i(xi − x)(yi − y)√∑

    i(xi − x)2√∑

    i(yi − y)2

    waarbij x en y de steekproef gemiddelden van de x-metingen en van de y-metingenzijn:

    x =1

    n

    ixi

    y =1

    n

    iyi

    Wet. Ond. & Stat.: Modellen 28

  • 3.3 Eigenschappen en interpretatie

    r =∑

    i(xi − x)(yi − y)√∑

    i(xi − x)2√∑

    i(yi − y)2

    x

    y

    ••

    ••

    •••

    xi

    yi(+,+)

    (+,–)

    (–,+)

    (–,–)

    Wet. Ond. & Stat.: Modellen 29

  • De correlatie coefficiënt meet het LINEAIR verband tussen X en Y , en heeft devolgende eigenschappen:

    • −1 ≤ r ≤ 1

    • r < 0 : negatief lineair verband tussen de xi en de yi

    • r > 0 : positief lineair verband tussen de xi en de yi

    • r = −1 : de punten xi en yi liggen perfect op een dalende rechte

    • r = 1 : de punten xi en yi liggen perfect op een stijgende rechte

    • r = 0 : er is geen LINEAIR verband tussen de xi en de yi

    Wet. Ond. & Stat.: Modellen 30

  • Wet.

    Ond.&

    Stat.:

    Modellen

    31

  • 3.4 Statistische inferentie

    • De correlatie coefficient wordt berekend op basis van de observaties (xi, yi), en iseen schatter voor de theoretische correlatie ρ in de populatie

    • In de praktijk wenst men te toetsen of er al dan niet een lineair verband bestaattussen de variabelen X en Y , m.a.w. of de correlatie ρ significant verschilt van nul.

    • Formeel wensen we de nulhypotheseH0 : ρ = 0

    te testen versus de alternatieve hypothese

    HA : ρ 6= 0

    • De bijhorende toetsingsprocedure veronderstelt dat de variabelen X en Ygezamenlijk normaal verdeeld zijn.

    Wet. Ond. & Stat.: Modellen 32

  • 3.5 Statistica + interpretatie

    • Statistica menu:

    Wet. Ond. & Stat.: Modellen 33

  • • Statistica output:

    Wet. Ond. & Stat.: Modellen 34

  • • Bijhorende scatterplot matrix:

    Wet. Ond. & Stat.: Modellen 35

  • • Correlatie tussen MMSE en ADL op dag 1 is r = −0.70 en is significantverschillend van nul (p < 0.0001).

    • We kunnen dus besluiten dat er een sterk negatief lineair verband is tussen deMMSE en de ADL, 1 dag na de operatie: Hoe lager de cognitieve status van depatiënt, hoe hoger zijn afhankelijkheid.

    Wet. Ond. & Stat.: Modellen 36

  • Hoofdstuk 4

    Enkelvoudige lineaire regressie

    . Inleiding

    . De kleinste kwadraten methode

    . Berekeningen met Statistica en interpretatie

    . Statistische inferentie

    . Berekeningen met Statistica en interpretatie

    Wet. Ond. & Stat.: Modellen 37

  • 4.1 Inleiding

    • De correlatie coefficiënt r meet het lineair verband tussen twee metingen x en y.Hoe kunnen we dit lineair verband beschrijven ?

    • Een mogelijke manier zou zijn de rechte te zoeken die ‘het beste aansluit’ bij degeobserveerde waarnemingen:

    Wet. Ond. & Stat.: Modellen 38

  • • Een rechte wordt beschreven door een vergelijking van de vormy = β0 + β1x

    • De parameter β0 is het intercept van de rechte. Het is de waarde voor y die webekomen voor x = 0

    • De parameter β1 is de richtingscoefficiënt (slope).

    • Indien β1 > 0 :. Er is een positief verband tussen x en y

    . Hoe groter β1, hoe sneller y stijgt als x stijgt

    • Indien β1 < 0 :. Er is een negatief verband tussen x en y

    . Hoe kleiner β1, hoe sneller y daalt als x stijgt

    Wet. Ond. & Stat.: Modellen 39

  • • Het komt er in de praktijk op neer de parameters β0 en β1 te schatten op basisvan de verzamelde gegevens (xi, yi).

    Wet. Ond. & Stat.: Modellen 40

  • 4.2 De kleinste kwadraten methode

    • Voor het schatten van β0 en β1, moeten we dus eerst bepalen aan welk criterium‘de beste’ rechte moet voldoen

    0

    β0 ................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

    •• •

    •••

    xi

    yi y = β0 + β1x

    yi

    ŷi

    Wet. Ond. & Stat.: Modellen 41

  • • Indien we β0 en β1 zouden kennen, dan kunnen we voor elke observatie in onzedata set, op basis van de x waarde, een voorspelde waarde (predictie) berekenenvoor y:

    ŷi = β0 + β1xi

    • De voorspelling zal goed zijn indien ŷi dicht ligt bij yi en zal slecht zijn indien ŷisterk afwijkt van yi

    • Als de rechte onze gegevens (xi, yi) goed beschrijft, dan verwachten we dat, voorde meeste punten, ŷi dicht bij de juiste waarde yi zal liggen.

    • Een mogelijke maat om uit te drukken hoe goed de gekozen rechte is, isQ =

    i[yi − ŷi]2

    =∑

    i[yi − (β0 + β1xi)]2

    Wet. Ond. & Stat.: Modellen 42

  • • Q is dus een maat voor hoe nauw onze gegevens aansluiten bij de rechtey = β0 + β1x

    • Merk op dat andere rechten (andere β0 en β1) zullen leiden tot andere waardenvoor Q

    • De rechte die het best onze gegevens beschrijft is dus die rechte waarvoor Qminimaal is

    • De kleinste kwadraten methode berekent die waarden voor β0 en β1 waarvoor Qminimaal is

    • Men kan aantonen dat deze waarden gegeven worden door:

    ̂β1 =

    i(xi − x)(yi − y)∑

    i(xi − x)2

    , ̂β0 = y − ̂β1x

    Wet. Ond. & Stat.: Modellen 43

  • • ̂β0 en ̂β1 worden de kleinste kwadraten schatters van β0 en β1 genoemd.

    • De bekomen rechtey = ̂β0 +

    ̂β1x

    wordt de regressie rechte genoemd

    • Eens we de schatters voor β0 en β1 kennen, kunnen we voor elke observatie in dedata set een voorspelling doen van y op basis van x:

    ŷi =̂β0 +

    ̂β1xi

    • Nu kunnen we ook voor elk data punt (xi, yi) in onze data set de fout berekenendie we maken als we yi proberen te voorspellen door ŷi:

    ei = yi − ŷi = yi − (̂β0 + ̂β1xi)

    Wet. Ond. & Stat.: Modellen 44

  • • De termen ei worden residu’s genoemd:. ei > 0 : de geobserveerde yi ligt boven de regressie rechte

    . ei = 0 : de geobserveerde yi ligt op de regressie rechte

    . ei < 0 : de geobserveerde yi ligt onder de regressie rechte

    • Verder kan men aantonen dat∑

    iei = 0

    m.a.w. de punten boven de regressie rechte zijn ‘in evenwicht’ met de puntenonder de regressie rechte.

    Wet. Ond. & Stat.: Modellen 45

  • 4.3 Statistica + interpretatie

    • Binnen Statistica zijn er meerdere modules die toelaten enkelvoudige lineaireregressie uit te voeren. We gebruiken hier de optie ‘Simple regression’ binnen demodule ‘Visual General Linear Model’:

    Wet. Ond. & Stat.: Modellen 46

  • • Het specifiëren van het model, en bijhorend output scherm:

    Wet. Ond. & Stat.: Modellen 47

  • • De output voor de regressie coëfficiënten:

    • De Y veranderlijke wordt respons, of ook afhankelijk variabele (dependent)genoemd

    • De X veranderlijke wordt covariaat, of ook onafhankelijk variabele (independent)genoemd

    • De parameterschatters zijn ̂β0 = 23.65 en ̂β1 = −0.30

    Wet. Ond. & Stat.: Modellen 48

  • • De bijhorende regressie rechte isADL = 23.65 − 0.30 ×MMSE

    • De regressie rechte voorspelt een ADL score van 23.65 als de MMSE gelijk is aannul.

    • Verder is er een negatief lineair verband tussen MMSE en ADL: Hoe hoger MMSEhoe lager ADL, en omgekeerd

    • De regressie rechte voorspelt een daling van 0.30 in ADL, telkens MMSEtoeneemt met één eenheid.

    Wet. Ond. & Stat.: Modellen 49

  • • Dit moet als volgt gëınterpreteerd worden:. Neem twee groepen patiënten

    . Alle patiënten in de eerste groep hebben identieke MMSE (bvb. 20)

    . Alle patiënten in de tweede groep hebben ook gelijke MMSE waarden, maar 1eenheid hoger dan die in de eerste groep (dus 21).

    . Dan verwachten we dat het verschil in gemiddelde ADL score van de tweegroepen gelijk is aan 0.30, met de laagste score voor de groep met de hoogsteMMSE.

    • We mogen dus niet besluiten dat een verhoging van MMSE met 1 bij eenbepaalde patiënt zal leiden tot een daling van 0.30 in ADL. We mogen dus geen‘longitudinale’ besluiten trekken uit ons ‘cross-sectioneel’ experiment.

    Wet. Ond. & Stat.: Modellen 50

  • • Grafische voorstelling:

    Wet. Ond. & Stat.: Modellen 51

  • 4.4 Statistische inferentie

    4.4.1 Inleiding

    • De regressie output bekomen in Statistica was:

    • De vermelde p-waarden testen de hypothesenH0 : β0 = 0 versus HA : β0 6= 0 en H0 : β1 = 0 versus HA : β1 6= 0

    Wet. Ond. & Stat.: Modellen 52

  • • Inderdaad, de kleinste kwadraten methode laat ons toe de rechte te berekenen diehet best onze observaties (xi, yi) beschrijft.

    • Echter, voor een andere steekproef uit dezelfde populatie, zouden we een andereregressielijn

    y = ̂β0 +̂β1x

    bekomen.

    • Illustratie: Vestac Java Applet → regression → regression plots

    Wet. Ond. & Stat.: Modellen 53

  • Wet. Ond. & Stat.: Modellen 54

  • • Statistische inferentie (p-waarden, betrouwbaarheidsintervallen) probeert op basisvan een steekproef, en dus op basis van de bekomen schatters ̂β0 en

    ̂β1, eenuitspraak te doen omtrent de regressie rechte

    y = β0 + β1x

    die het lineair verband beschrijft in de totale populatie.

    • Dit kan echter niet zonder bijkomende assumpties omtrent de verdeling waaruitonze gegevens getrokken werden.

    • De nodige assumpties worden beschreven door het zogenaamde regressie model

    Wet. Ond. & Stat.: Modellen 55

  • 4.4.2 Het enkelvoudig lineair regressie model

    • In reële situaties zullen de punten (xi, yi) nooit een perfecte rechte beschrijven,maar eerder een puntenwolk.

    • Dit betekent dat onze observaties niet kunnen voldoen aanyi = β0 + β1xi

    maar dat ze eerder voldoen aan

    yi = β0 + β1xi + εi

    waarbij εi uitdrukt hoever de observatie yi boven of onder de regressie rechte ligt.

    • De termen εi worden fouten (errors) genoemd, en het lineair regressie modelveronderstelt dat ze verdeeld zijn volgens een normale verdeling met gemiddelde 0en een bepaalde (ongekende) variantie σ2.

    εi ∼ N (0, σ2)

    Wet. Ond. & Stat.: Modellen 56

  • Wet. Ond. & Stat.: Modellen 57

  • • Merk op dat de εi de ‘theoretische versie’ zijn van de residu’s ei

    • Het regressie model veronderstelt dus . . .. . . . lineariteit: voor elke X , het gemiddelde van de bijhorende Y -waarden op de

    regressie lijn ligt

    . . . . normaliteit: voor elke X , de bijhorende Y -waarden symmetrisch liggen rondde regressie lijn

    . . . . constante variantie: de predictie fouten bij kleine X-waarden niet groter ofkleiner zijn dan de fouten bij grote X-waarden

    Wet. Ond. & Stat.: Modellen 58

  • Wet. Ond. & Stat.: Modellen 59

  • Wet. Ond. & Stat.: Modellen 60

  • Wet. Ond. & Stat.: Modellen 61

  • 4.4.3 Significantietesten voor β0 en β1

    • Indien de richtingscoëfficiënt β1 gelijk is aan nul, dan wordt het regressie modelbeschreven door

    yi = β0 + εi

    wat impliceert dat er geen lineair verband is tussen Y en X .

    • Indien we in de praktijk wensen te testen of er een lineair verband is tussen X enY dan moeten we dus de nulhypothese testen:

    H0 : β1 = 0 versus HA : β1 6= 0

    • De waarde die we in onze steekproef hebben geobserveerd is ̂β1 = −0.30

    Wet. Ond. & Stat.: Modellen 62

  • • Deze waarde zou door toeval kunnen bekomen worden, zelfs indien in de totalepopulatie β1 = 0 geldt.

    • Onderzoeksvraag:

    Hoe groot is de kans dat we door toeval ̂β1 = −0.30 observeren,

    zelfs als β1 = 0 ?

    • Illustratie: Vestac Java Applet → regression → histograms of slope and intercept

    Wet. Ond. & Stat.: Modellen 63

  • Wet. Ond. & Stat.: Modellen 64

  • Wet. Ond. & Stat.: Modellen 65

  • • Het is duidelijk dat, indien β1 = 0, het zeer onwaarschijnlijk wordt om tocĥβ1 = −0.30 te observeren.

    • Merk op dat het even onwaarschijnlijk zou zijn om ̂β1 = +0.30 te observeren

    • De kans dat we een schatter zouden vinden waarvoor |̂β1| ≥ 0.30 is p < 0.0001.

    • Gezien deze kans zo klein is, meer specifiek p < α = 0.05 = 5% zullen webesluiten dat wat we geobserveerd hebben (̂β1 = −0.30) voldoende indicatie is omte geloven dat β1 6= 0

    • We verwerpen dus de nulhypothese en we besluiten dat β1 significant verschilt van0, op het 5% significantie niveau

    Wet. Ond. & Stat.: Modellen 66

  • • Het regressiemodel laat ook toe om, naast hypotheses te toetsen, ookbetrouwbaarheidsintervallen te construeren. Een 95% B.I. voor β1 in onsvoorbeeld is [−0.378;−0.218].

    • Gezien dit interval ver van 0 ligt is dit terug een indicatie voor sterke evidentie datβ1 6= 0

    • Analoog kan ook een significantietest opgesteld worden voor het testen vanH0 : β0 = 0 versus HA : β0 6= 0

    • In de praktijk is men meestal primair gëınteresseerd in het toetsen van β1

    • Merk op dat alle testen en betrouwbaarheidsintervallen pas correct zijn indien aande assumpties van het regressie model is voldaan.

    Wet. Ond. & Stat.: Modellen 67

  • 4.4.4 De ANOVA tabel

    • Hoeveel beter kunnen we Y voorspellen als we X kennen ?

    0

    β0

    y

    ..........................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

    • •

    • •

    ••

    xi

    yi y = β0 + β1xyi

    ŷi

    Wet. Ond. & Stat.: Modellen 68

  • • Indien we geen x-waarden zouden hebben, dan is de best-mogelijke predictie voorelke yi-waarde het gemiddelde y in de steekproef

    • Een maat voor de fout die we dan maken is de kwadraten som∑

    i[yi − y]2

    • Merk op dat dit een maat is voor de variabiliteit in de yi

    • Als we de verzamelde xi-waarden wel gebruiken om de y-metingen te voorspellen,dan voorspellen we elke yi door

    ŷi =̂β0 +

    ̂β1xi

    • Een maat voor de fout die we dan maken is de kwadraten som∑

    i[yi − ŷi]2 = ∑

    ie2i

    Wet. Ond. & Stat.: Modellen 69

  • • Omdat het gebruiken van de extra informatie in de xi tot preciezere predictiesleidt, hebben we dat

    i[yi − y]2 ≥ ∑

    i[yi − ŷi]2

    • Men kan aantonen dat∑

    i[yi − y]2

    ︸ ︷︷ ︸

    ↓SSTO

    =∑

    i[yi − ŷi]2

    ︸ ︷︷ ︸

    ↓SSE

    +∑

    i[ŷi − y]2

    ︸ ︷︷ ︸

    ↓SSR

    Wet. Ond. & Stat.: Modellen 70

  • • SSTO : Totale kwadraten somDeze term drukt de totale fout uit die we maken als we de yi voorspellen zonderrekening te houden met de observaties xi

    • SSE : Kwadraten som van de foutenDeze term drukt de totale fout uit die we maken als we de yi voorspellen metbehulp van de observaties xi

    • SSR : Kwadraten som van de regressieDeze term drukt uit hoeveel kleiner de fout is die we maken als we de xi gebruikenom de yi te voorspellen, dan als we de xi niet zouden gebruiken.

    Wet. Ond. & Stat.: Modellen 71

  • • Een maat voor hoe goed onze data punten (xi, yi) aansluiten bij de regressie lijn is

    R2 =SSR

    SSTO

    • R2 heeft de volgende eigenschappen:. 0 ≤ R2 ≤ 1. R2 = 0 impliceert dat SSR = 0 en dus dat alle ŷi gelijk zijn aan y, m.a.w. de

    regressielijn is vlak. Dit is equivalent met ̂β1 = 0

    . R2 = 1 impliceert dat SSE = 0. Dit impliceert dat yi = ŷi voor alle i, en dusdat alle punten (xi, yi) op de regressie rechte liggen.

    • Men zegt dat R2 uitdrukt ‘welke fractie van de variabiliteit in de yi verklaard kanworden door de xi’

    • Men kan aantonen dat R2 gelijk is aan r2, het kwadraat van de correlatie tussende xi en yi waarden.

    Wet. Ond. & Stat.: Modellen 72

  • 4.4.5 Statistica + interpretatie

    • Statistica output voor ANOVA tabel, met SSR en SSE:

    • ‘R-square’ : R2 = 0.4940, de regressie kan dus ongeveer 50% van de totalevariabiliteit in de yi waarden verklaren:

    R2 =SSR

    SSTO=

    351.23

    351.23 + 359.76= 0.4940

    • De Pearson correlatie, eerder gevonden was gelijk aan:

    r = −√

    R2 = −√

    0.4940 = −0.70

    Wet. Ond. & Stat.: Modellen 73

  • Hoofdstuk 5

    Model diagnose

    . Voorbeeld

    . Lineariteit

    . Constante variantie van de fouten

    . Normaliteit van de fouten

    Wet. Ond. & Stat.: Modellen 74

  • 5.1 Voorbeeld

    • We wensen na te gaan of de afhankelijkheid (ADL) van een patiënt één dag na deoperatie kan gebruikt worden om de opnameduur van de patiënt te voorspellen:

    Wet. Ond. & Stat.: Modellen 75

  • • Er lijkt een lichte stijging te zijn van de opnameduur, als functie van de ADLscore. Is dit verband significant ?

    • We fitten daarom het volgende regressie model:Opnameduur = β0 + β1ADL + εi

    • Statistica output:

    Wet. Ond. & Stat.: Modellen 76

  • • De parameter schatters zijn:. ̂β0 = 9.37

    . ̂β1 = 0.29, p-waarde : 0.1173

    • De geschatte regressie rechte is dusOpnameduur = 9.37 + 0.29ADL

    • Merk op dat er dus geen significant verband is tussen de opnameduur en de ADLscore 1 dag na de operatie.

    • Verder volgt uit R2 = 0.0432 dat ADL slechts 4% van de totale variabiliteit in deopnameduur verklaart.

    Wet. Ond. & Stat.: Modellen 77

  • 5.2 Model assumpties

    • De bekomen statistische inferenties voor de regressie parameters zijn slechts geldigals de model assumpties voldaan zijn, m.a.w. als

    yi = β0 + β1xi + εi, εi ∼ N (0, σ2)

    Wet. Ond. & Stat.: Modellen 78

  • • Dit impliceert dat . . .

    • Het regressie model veronderstelt dus . . .. . . . lineariteit: voor elke X , het gemiddelde van de bijhorende Y -waarden op de

    regressie lijn ligt

    . . . . normaliteit: voor elke X , de bijhorende Y -waarden symmetrisch liggen rondde regressie lijn

    . . . . constante variantie: de predictie fouten bij kleine X-waarden niet groter ofkleiner zijn dan de fouten bij grote X-waarden

    • Hoe kunnen we deze assumpties controleren ?

    Wet. Ond. & Stat.: Modellen 79

  • 5.3 De veronderstelling van lineariteit

    Wet. Ond. & Stat.: Modellen 80

  • • Om het effect van niet-lineariteit te illustreren beschouwen we het volgendefictieve voorbeeld:

    Wet. Ond. & Stat.: Modellen 81

  • • Er is een duidelijk positief verband tussen de xi en de yi, maar de relatie tussen dexi en de yi lijkt niet helemaal lineair te zijn.

    • Wat als we hier toch regressie toepassen ?

    • Statistica output:

    Wet. Ond. & Stat.: Modellen 82

  • • R2 = 0.85 : X verklaart 85% van de geobserveerde variabiliteit in Y

    • De regressie rechte wordt gegeven doorY = 1.19 + 2.06X

    • De richtingscoëfficiënt β1 is significant verschillend van nul (p < 0.001)

    • De geobserveerde punten liggen allen dicht bij de geschatte regressie rechte (watde hoge R2 verklaart), maar de rechte beschrijft de relatie tussen de xi en yislecht:

    . Overschatting van de yi voor kleine en grote xi

    . Onderschatting van de yi in het midden

    Wet. Ond. & Stat.: Modellen 83

  • • De figuur suggereert dat niet-lineariteit ontdekt kan worden door de residu’sei = yi − ŷi = yi − (̂β0 + ̂β1xi)

    te bestuderen, en te plotten als functie van x.

    • In Statistica gebeurt dit als volgt:

    Wet. Ond. & Stat.: Modellen 84

  • • Bijhorende Statistica output:

    Wet. Ond. & Stat.: Modellen 85

  • • Indien de veronderstelling van lineariteit voldaan zou zijn dan zou, voor elkewaarde van X , de bijhorende waarden van Y symmetrisch rond de regressie lijnmoeten liggen. De residu’s ei zouden dan dus symmetrisch rond nul moetenliggen, voor alle mogelijke waarden van X .

    • Dit is duidelijk niet voldaan in bovenstaand voorbeeld.

    • Merk op dat de residu’s eigenlijk suggereren dat de relatie tussen de yi en de xieerder een kwadratische functie is. We komen hier later op terug in het onderdeelover polynomiale regressie.

    • Vaak kan de covariaat X getransformeerd worden zodat de yi als functie van degetransformeerde xi wel lineair verondersteld kunnen worden.

    • Frequent gebruikte transformaties zijn ln(X),√

    X, 1/X , exp(X), ln(X + 1),. . .

    Wet. Ond. & Stat.: Modellen 86

  • • Voor ons fictief voorbeeld, proberen we een logaritmische transformatie van degeobserveerde xi:

    xi −→ ln(xi)

    • Statistica menu voor de aanmaak van de getransformeerde veranderlijke:

    Wet. Ond. & Stat.: Modellen 87

  • • Output van de regressie procedure:

    Wet. Ond. & Stat.: Modellen 88

  • • Bijhorende grafiek:

    Wet. Ond. & Stat.: Modellen 89

  • • Residu plot:

    Wet. Ond. & Stat.: Modellen 90

  • • R2 = 0.92 : ons model is dus verbeterd aangezien we nu nog meer van devariabiliteit in de y-waarden kunnen verklaren aan de hand van de x-waarden.

    • De geschatte regressie rechte is nuY = 2.95 + 0.80 ln(X)

    • De transformatie bemoeilijkt dus de interpretatie van de regressie coëfficiënten.Zo is 0.80 de geschatte gemiddelde toename van Y als ln(X) toeneemt met 1eenheid.

    • Anderzijds is de transformatie nodig om de veronderstelling van lineariteit meerrealistisch te maken, waardoor onze statistische inferentie met betrekking tot β0en β1 verbetert.

    Wet. Ond. & Stat.: Modellen 91

  • 5.4 Voorbeeld : Opnameduur versus ADL

    • We controleren nu of de assumptie van lineariteit voldaan is voor het regressiemodel dat we gebruikt hebben om de opnameduur te voorspellen a.d.v. de ADLscore 1 dag na de operatie.

    • De residu plot vertoont geen aanwijzingen van enige systematiek in de residu’s:

    Wet. Ond. & Stat.: Modellen 92

  • 5.5 De veronderstelling van constante variantie

    Wet. Ond. & Stat.: Modellen 93

  • • Ter illustratie bestuderen we het verband tussen de diastolische bloeddruk enleeftijd, op basis van gegevens van 54 gezonde volwassen vrouwen, die tussen 20en 60 jaar oud zijn:

    Wet. Ond. & Stat.: Modellen 94

  • • We voeren een regressie uit van de bloeddruk op de leeftijd:

    • De regressie verklaart meer dan 40% van de variabiliteit in de bloeddruk metingen(R2 = 0.4077); er is een significant (p < 0.0001) lineair verband tussen leeftijd enbloeddruk; de geschatte regressie lijn is:

    Bloeddruk = 56.16 + 0.58 × Leeftijd

    Wet. Ond. & Stat.: Modellen 95

  • • Aangezien de residu’s ei = yi − ŷi gëınterpreteerd kunnen worden als schattingenvoor de theoretische fouten εi, kunnen we de assumptie van constante variantievoor de εi nakijken via een scatterplot van de residu’s:

    • De residu’s zijn ‘evenwichtig’ verspreid rond nul, wat er dus op wijst dat delineariteit voldaan is

    Wet. Ond. & Stat.: Modellen 96

  • • Anderzijds suggereert de residu plot dat de variantie van de εi toeneemt met deleeftijd.

    • Het niet-voldaan zijn van deze assumptie zal leiden tot niet-optimale inferentieomtrent de parameters β0 en β1:

    . De geschatte regressie lijn is wel nog correct

    . De parameters β0 en β1 worden minder nauwkeurig geschat. Dit leidt totgrotere p-waarden en dus mogelijks tot het niet ontdekken van een aanweziglineair verband tussen X en Y

    • Een optimale analyse wordt bekomen door een gewogen kleinste kwadratenanalyse uit te voeren.

    • Anderzijds gaat niet-constante variantie vaak gepaard met niet-normaliteit, enimpliceert het oplossen van de niet-normaliteit ook dat de niet-constante variantieopgelost is.

    Wet. Ond. & Stat.: Modellen 97

  • 5.6 Voorbeeld : Opnameduur versus ADL

    • Om de controleren of de assumptie van constante residuele variantie ook voldaanis voor het regressie model dat we gebruikt hebben om de opnameduur tevoorspellen aan de hand van de ADL score 1 dag na de operatie, bekijken we dusterug de scatterplot van de residu’s die we reeds gemaakt hebben om de lineariteitna te kijken:

    Wet. Ond. & Stat.: Modellen 98

  • • Op de buitenliggende waarde (outlier) in het midden na, zijn er geensystematische trends in de variabiliteit van de residu’s.

    • We mogen dus aannemen dat de gemaakte veronderstelling van constanteresiduele variantie voldaan is.

    Wet. Ond. & Stat.: Modellen 99

  • 5.7 De veronderstelling van normaliteit

    Wet. Ond. & Stat.: Modellen 100

  • • Gezien de residu’s ei = yi − ŷi schatters zijn voor de theoretische fouten εi, ligthet dus voor de hand de assumptie van normaliteit na te gaan met behulp van deresidu’s.

    • In de praktijk gebruikt men hiervoor de combinatie van 2 technieken:. Grafisch: een histogram van de residu’s

    . Een formele test voor normaliteit

    • Beide technieken worden gëıllustreerd aan de hand van de bloeddruk gegevens bij54 vrouwen.

    Wet. Ond. & Stat.: Modellen 101

  • 5.7.1 Een histogram van de residu’s

    • Een eenvoudige grafische manier om de verdeling van de residu’s te bekijken is eenhistogram, samen met de normale verdeling die het best aansluit bij het histogram:

    Wet. Ond. & Stat.: Modellen 102

  • • Uit het histogram volgt:. Er is geen evidentie van asymmetrie in de verdeling van de residu’s

    . De verdeling lijkt niet veel af te wijken van een normale verdeling

    • We besluiten dat er geen grafische evidentie is voor niet-normaliteit van de foutenεi

    Wet. Ond. & Stat.: Modellen 103

  • 5.7.2 De normaliteitstest

    • Statistica laat ook toe een formele test voor normaliteit uit te voeren

    • Men test dan de nulhypotheseH0 : de gegevens zijn normaal verdeeld

    versus de alternatieve hypothese

    HA : de gegevens zijn niet normaal verdeeld

    • Verschillende testprocedures zijn mogelijk, allen resulterend in een p-waarde dieons dan toelaat de nulhypothese te aanvaarden of te verwerpen

    Wet. Ond. & Stat.: Modellen 104

  • • In Statistica, moeten in de module ‘Visual GLM’ de residu’s weggeschrevenworden, om nadien de normaliteitstesten te kunnen uitvoeren in de module ‘BasicStatistics and Tables’:

    Wet. Ond. & Stat.: Modellen 105

  • • Statistica menu voor de normaliteitstesten:

    Wet. Ond. & Stat.: Modellen 106

  • • Statistica output:

    Wet. Ond. & Stat.: Modellen 107

  • • We krijgen dus terug een histogram met normale benadering, maar ook deresultaten van 3 toetsprocedures voor normaliteit: Shapiro-Wilk,Kolmogorov-Smirnov, en Lilliefor. De eerste twee zijn de meest gebruikte.

    • Op basis van elk van de 3 procedures wordt de nulhypothese van normaliteitaanvaard. We besluiten dus dat de residu’s ei en dus ook de fouten εi normaalverdeeld zijn.

    Wet. Ond. & Stat.: Modellen 108

  • 5.7.3 Histogram ←→ normaliteitstest

    • Het histogram is een exploratieve techniek om de verdeling van de residu’s tebestuderen

    • De normaliteitstest is een formele test die ons toelaat te beslissen of deveronderstelling van normaliteit aanvaardbaar is

    • In (zeer) grote steekproeven is het verwerpen van normaliteit op basis van eenstatistische toetsingsprocedure zeer waarschijnlijk: De allerkleinste afwijking vannormaliteit zal dan ontdekt worden.

    • Men stelt vast dat kleine afwijkingen van normaliteit toch nog zullen leiden totcorrecte resultaten, zolang de verdeling van de fouten nog symmetrisch is.

    • Als de niet-normaliteit dus niet te wijten is aan asymmetrie, dan zullen debekomen resultaten toch nog betrouwbaar zijn.

    Wet. Ond. & Stat.: Modellen 109

  • 5.8 Voorbeeld : Opnameduur versus ADL

    • We beschouwen terug de regressie van de opnameduur bij heup fractuur patiëntenop hun ADL score 1 dag na de operatie

    Wet. Ond. & Stat.: Modellen 110

  • • De residu’s zijn dus duidelijke niet normaal verdeeld

    • Uit het histogram blijkt dat de niet-normaliteit te wijten is aan asymmetrie

    • In geval van niet-normaliteit te wijten aan asymmetrie kan men soms de ywaarden transformeren zodat de residu’s in het nieuwe regressie model welnormaal verdeeld zijn

    • Frequent gebruikte transformaties zijn ln(Y ),√

    Y , 1/Y , exp(Y ), ln(Y + 1), . . .

    • In ons voorbeeld zullen we de gegevens (de y-waarden) zó moeten transformerendat de grote residu’s dichter bij het overgrote deel van de residu’s komen te liggen.

    • Een mogelijke transformatie isOpnameduur −→ ln(Opnameduur)

    Wet. Ond. & Stat.: Modellen 111

  • • Merk op dat alle geobserveerde waarden van de opnameduur strikt positief zijn,zodat bovenstaande transformatie mogelijk is.

    • Vooraleer de regressie ouput te interpreteren kijken we na of de verdeling van denieuwe residu’s nu beter benaderd kan worden door een normale verdeling:

    Wet. Ond. & Stat.: Modellen 112

  • • We kunnen dus besluiten dat de fouten in het nieuwe regressie model normaalverdeeld zijn.

    • Nieuwe regressie output:

    Wet. Ond. & Stat.: Modellen 113

  • • Het regressie model is licht verbeterd aangezien de R2 gestegen is van 0.0432 naar0.0670

    • De regressie rechte is:ln(Opnameduur) = 2.23 + 0.02 × ADL

    • Nu vinden we wel een significant verband:p = 0.0497 tegenover p = 0.1173 voor de transformatie

    • Merk op dat het gevonden verband nu niet meer lineair is

    • Dit voorbeeld toont de nood aan de normaliteit van de fouten na te gaan, gezieneventuele niet-normaliteit de resultaten sterk kan verstoren

    Wet. Ond. & Stat.: Modellen 114

  • • Het transformeren van de y-waarden kan de lineariteit terug verstoren, en/of eenniet-constante variantie voor de fouten εi veroorzaken . Daarom is het nuttig natransformatie van de y-waarden terug een scatterplot van de residu’s te maken:

    • Lineariteit en constante variabiliteit blijven voldaan

    Wet. Ond. & Stat.: Modellen 115

  • 5.9 Algemeen besluit

    • Een regressie uitvoeren is gemakkelijk

    • Een regressie model evalueren is moeilijk

    Wet. Ond. & Stat.: Modellen 116

  • Hoofdstuk 6

    Invloedrijke observaties

    . Voorbeeld

    . Cook’s afstand

    . Toepassing

    . Wat met invloedrijke observaties ?

    Wet. Ond. & Stat.: Modellen 117

  • 6.1 Voorbeeld

    • We bekijken terug de regressie van ln(Opnameduur) op de ADL score op de eerstedag na de operatie:

    Wet. Ond. & Stat.: Modellen 118

  • • Patiënt #20 heeft een ADL score van 17, en is 36 dagen opgenomen, watuitzonderlijk lang is in vergelijking met de andere patiënten.

    • Voor subject #20 is het residu ei = yi − ŷi dus zeer groot.

    • Gezien de parameters β0 en β1 geschat worden via de kleinste kwadratenmethode, kunnen we ons de vraag stellen hoe sterk onze resultaten ̂β0 en

    ̂β1 doordit individu bëınvloed zijn.

    • Een subject heeft grote invloed op de resultaten als het weglaten van dit subjectleidt tot sterk verschillende resultaten.

    • Invloedrijke observaties bemoeilijken de interpretatie van de resultaten omdat deconclusies sterk steefproef gebonden zijn: Een andere steekproef zou waarschijnlijktot andere resultaten geleid hebben.

    Wet. Ond. & Stat.: Modellen 119

  • • Om de invloedrijkheid van een subject na te gaan kunnen we dus ̂β0 en ̂β1vergelijken met en zonder het subject.

    • Om de methode te illustreren nemen we subject #20, en we gaan na wat heteffect is als we deze patiënt weglaten, alsmede wat het effect geweest zou zijnindien dit subject niet een ‘gemiddelde’ ADL score gehad zou hebben, maar eerdereen zeer grote (24) of zeer lage (10, 5, 0) ADL.

    Wet. Ond. & Stat.: Modellen 120

  • • Resultaat voor ADL= 17:

    Wet. Ond. & Stat.: Modellen 121

  • • Resultaat voor ADL= 24:

    Wet. Ond. & Stat.: Modellen 122

  • • Resultaat voor ADL= 10:

    Wet. Ond. & Stat.: Modellen 123

  • • Resultaat voor ADL= 5:

    Wet. Ond. & Stat.: Modellen 124

  • • Resultaat voor ADL= 0:

    Wet. Ond. & Stat.: Modellen 125

  • • Samenvatting van de regressieresultaten:

    Met subject #20 Zonder subject #20

    ADL Parameter Schatter (p-waarde) Schatter (p-waarde)

    17 Intercept (β0) 2.233 (

  • • In het algemeen geldt dat een subject invloedrijk zal zijn als de volgende 2voorwaarden voldaan zijn:

    . Het subject is een buitenliggende waarde (outlier), d.w.z. dat de waarde yiuitzonderlijk groot of klein is volgens zijn xi waarde

    . Het subject ligt aan de buitenkant van de X-ruimte, in ons voorbeeld betekentdit een kleine of grote ADL score 1 dag na de operatie.

    Wet. Ond. & Stat.: Modellen 127

  • 6.2 Cook’s afstand

    • Het detecteren van invloedrijke observaties vereist dus de volgende stappen:. Voer de regressie uit voor alle observaties

    . Stap 1 : laat eerste observatie weg en vergelijk de nieuwe resultaten met die opbasis van de volledige data set

    . Stap 2 : laat tweede observatie weg en vergelijk de nieuwe resultaten met dieop basis van de volledige data set

    . Stap 3 : laat derde observatie weg en vergelijk de nieuwe resultaten met die opbasis van de volledige data set

    . . . .

    . Stap n : laat laatste observatie weg en vergelijk de nieuwe resultaten met dieop basis van de volledige data set

    Wet. Ond. & Stat.: Modellen 128

  • • In elke stap moeten we dus de resultaten zonder een bepaalde observatievergelijken met de resultaten op basis van alle gegevens.

    • Dit kan gebeuren met Cook’s afstand die de ‘afstand’ meet tussen de resultatenmet en zonder een observatie.

    • Cook’s afstand voor de ide observatie noteren we met Di

    • Invloedrijke observaties komen overeen met grote Di

    • Weinig-invloedrijke observaties komen overeen met kleine Di

    Wet. Ond. & Stat.: Modellen 129

  • 6.3 Toepassing

    • We passen dit nu toe voor de regressie van ln(Opnameduur) op de ADL score vande eerste dag na de operatie.

    • In Statistica gebeurt dit via de uitgebreide (‘Extended’) lijst van residu’s envoorspelde waarden.

    Wet. Ond. & Stat.: Modellen 130

  • • Statistica menu en deel van output:

    Wet. Ond. & Stat.: Modellen 131

  • • Merk op dat D20 relatief groot is

    • Vooral bij grote datasets kan een indexplot van Cook’s afstanden uiterst nuttigzijn, eventueel na expliciete aanmaak van een variabele met observatienummers:

    Wet. Ond. & Stat.: Modellen 132

  • • Statistica output:

    Wet. Ond. & Stat.: Modellen 133

  • • Naast subject #20 vinden we dat ook subject #45 een relatief grote Di heeft.

    • Het is dan ook nuttig onze analyse te herhalen zonder elk van deze observaties

    • De analyse herhalen zonder observatie #45 kan als volgt:

    Wet. Ond. & Stat.: Modellen 134

  • • De resultaten met alle observaties, zonder observatie #20, en zonder observatie#45, respectievelijk, zijn:

    Wet. Ond. & Stat.: Modellen 135

  • 6.4 Wat met invloedrijke observaties ?

    • Leidt het weglaten van invloedrijke observaties tot kwalitatief andere resultaten ?

    • Zijn de gegevens voor de invloedrijke observaties wel correct ?. Data-entry fouten

    . Omwisselen van dossiers

    . . . .

    • Voldoen de invloedrijke observaties aan de in- en exclusie criteria van de studie ?. Zijn het wel heup-fractuur patiënten ?

    . Hebben ze niet een bijkomende complicatie/ziekte die hun invloedrijk gedragkan verklaren ?

    . . . .

    Wet. Ond. & Stat.: Modellen 136

  • • Indien er geen objectieve criteria zijn moeten de invloedrijke observaties in deanalyse gehouden worden

    • Eventueel kan men het kleinste kwadraten criterium vervangen door een andercriterium dat minder gevoelig is voor individuele observaties.

    =⇒ Robuste regressie technieken

    Wet. Ond. & Stat.: Modellen 137

  • Hoofdstuk 7

    De ongepaarde t-test

    . Voorbeeld

    . De ongepaarde t-test

    . Berekeningen in Statistica

    . Variabiliteit binnen versus tussen groepen

    Wet. Ond. & Stat.: Modellen 138

  • 7.1 Voorbeeld

    • We bestuderen de relatie tussen de ADL score, 1 dag na de operatie, en depre-operatieve neuropsychiatrische toestand van de patiënt, d.w.z. we willen degemiddelde ADL score vergelijken tussen neuro en niet-neuro patiënten.

    • Gemiddelden en standaard deviaties kunnen in Statistica als volgt berekend engrafisch weergegeven worden:

    . Via de toets kunnen tekstwaarden toegevoegd worden aan, bvb. deveranderlijke Neuro:

    Wet. Ond. & Stat.: Modellen 139

  • . Beschrijvende statistiek binnen elke groep afzonderlijk:

    Wet. Ond. & Stat.: Modellen 140

  • . Grafische voorstelling per groep afzonderlijk:

    Wet. Ond. & Stat.: Modellen 141

  • • Bekomen resultaten:

    Wet. Ond. & Stat.: Modellen 142

  • • We merken dus dat, gemiddeld gezien, de neuro patiënten een hogere ADL scorehebben en dus meer afhankelijk zijn.

    • Hoe kunnen we testen of dit verschil aan toeval kan toegeschreven worden, m.a.w.in hoeverre is dit verschil significant ?

    • Immers, zelfs al zou er geen verschil zijn tussen beide neurogroepen (in depopulatie), dan zouden we toch door puur toeval verschillen kunnen observeren inonze steekproef

    • Illustratie: Vestac Java Applet → Anova → Anova plot

    Wet. Ond. & Stat.: Modellen 143

  • Wet. Ond. & Stat.: Modellen 144

  • Wet. Ond. & Stat.: Modellen 145

  • 7.2 De ongepaarde t-test

    • We hebben dus twee onafhankelijke groepen van patiënten, en dus ook twee setsvan ADL metingen:

    . y11, y12, y13, . . . , y1n1 de metingen in de eerste groep

    . y21, y22, y23, . . . , y2n2 de metingen in de tweede groep

    • Beide groepen hebben niet noodzakelijk evenveel observaties: n1 en n2

    • De ongepaarde t-test veronderstelt dat de metingen in beide groepen normaalverdeeld zijn met gelijke spreiding, maar eventueel verschillend gemiddelde:

    Y1j ∼ N (µ1, σ2)

    Y2j ∼ N (µ2, σ2)

    Wet. Ond. & Stat.: Modellen 146

  • • Grafisch:

    ..................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

    .................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

    ........................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

    .......................................................................................................................................................................................................................................................................................................................................................................................................................................................................

    Niet neurotisch Neurotisch

    µ1 µ2

    ADL

    • De nulhypothese die we willen testen isH0 : µ1 = µ2

    versus de alternatieve hypothese

    HA : µ1 6= µ2

    Wet. Ond. & Stat.: Modellen 147

  • • De toetsstatistiek die hiervoor gebruikt wordt is

    T =y2· − y1·

    sp√

    1n1

    + 1n2

    waarbij y1· en y2· de geobserveerde gemiddelden zijn in de eerste en tweede groeprespectievelijk:

    y1· =1

    n1

    n1∑

    i=1y1i y2· =

    1

    n2

    n2∑

    i=1y2i

    en waarbij s2p de ‘gepoolde’ steekproef variantie is, een schatting voor degemeenschappelijke variantie σ2:

    s2p =(n1 − 1)s21 + (n2 − 1)S22

    n1 + n2 − 2

    en dit is dus een gewogen gemiddelde van de steekproef varianties in beidegroepen afzonderlijk.

    Wet. Ond. & Stat.: Modellen 148

  • • Merk op dat de toetsstatistiek T een maat is voor hoever de geobserveerdesteekproeven uit elkaar liggen.

    • In ons voorbeeld is de T -waarde gelijk aan:

    T =20− 17.15

    √(40−1)11.51 + (20−1)9.37

    40+20−2

    √140

    + 120

    = 3.16

    • Onder de nulhypothese, dus als µ1 = µ2, verwachten we dat T klein is.

    • We wensen dus te weten in hoeverre we T = 3.16 kunnen bekomen door puurtoeval.

    Wet. Ond. & Stat.: Modellen 149

  • • We berekenen de kans dat T = 3.16, in het geval de twee populaties werkelijkgelijk zijn, m.a.w., als µ1 = µ2

    • Illustratie: Vestac Java Applet → Tests → Two sample hypothesis test

    Wet. Ond. & Stat.: Modellen 150

  • Wet. Ond. & Stat.: Modellen 151

  • Wet. Ond. & Stat.: Modellen 152

  • • Het is duidelijk dat, indien er geen verschil is tussen de beide populaties, het zeeronwaarschijnlijk is om T = 3.16 of T = −3.16 te observeren.

    • De kans om door puur toeval |T | ≥ 3.16 te observeren is p = 0.002.

    • Gezien deze kans zo klein is, meer specifiek p < α = 0.05 = 5% zullen webesluiten dat wat we geobserveerd hebben (T = 3.16) voldoende indicatie is om tegeloven dat µ1 6= µ2

    • We verwerpen dus de nulhypothese en we besluiten dat µ1 en µ2 significantverschillend zijn, op het 5% significantie niveau

    • We verwerpen dus de nulhypothese dat de gemiddelde ADL gelijk is voor de neuropatiënten als voor de niet-neuro patiënten.

    Wet. Ond. & Stat.: Modellen 153

  • • Merk op dat de berekening van de p-waarde gebruik maakt van de gemaakteveronderstellingen:

    . Normaliteit binnen beide groepen

    . Gelijke variantie voor beide groepen

    • Het nakijken van deze assumpties gebeurt op dezelfde manier als bij 1-wegANOVA, en wordt daarom hier niet verder besproken.

    Wet. Ond. & Stat.: Modellen 154

  • 7.3 Berekeningen in Statistica

    • De ongepaarde t-test kan als volgt uitgevoerd worden in Statistica:

    Wet. Ond. & Stat.: Modellen 155

  • • Resultaten:

    • De ongepaarde t-test veronderstelt dat de variantie dezelfde is in beide groepen.Deze assumptie wordt automatisch getest. Indien de hypothese van gelijkevarianties verworpen zou worden kan er een aangepaste, gecorrigeerde, t-testworden uitgevoerd.

    • De hypothese van gelijke varianties is aanvaard (p = 0.642)

    Wet. Ond. & Stat.: Modellen 156

  • 7.4 Variabiliteit binnen versus tussen de groepen

    • De ongepaarde t-test verwerpt H0 als |T | groot is, wat equivalent is met

    T 2 =(y2· − y1·)2

    s2p(

    1n1

    + 1n2

    )

    groot.

    • De teller van T 2 meet hoever de groepsgemiddelden uiteen liggen, en is dus eenmaat voor de variabiliteit tussen de groepen.

    • De noemer van T 2 bevat s2p, wat een schatter is voor σ2, en dus eigenlijk eenmaat is voor de variabiliteit binnenin de groepen.

    • De ongepaarde t-test verwerpt dus de nulhypothese als de variabiliteit tussen degroepen groot is in vergelijking met de variabiliteit binnen de groepen

    Wet. Ond. & Stat.: Modellen 157

  • • Dit principe wordt in ANOVA toegepast om meer dan 2 groepen met elkaar tevergelijken.

    Wet. Ond. & Stat.: Modellen 158

  • Hoofdstuk 8

    1-weg ANOVA

    . Voorbeeld

    . Paarsgewijze t-testen

    . 1-weg ANOVA

    . Berekeningen in Statistica

    . Model diagnose

    . Invloedrijke observaties

    Wet. Ond. & Stat.: Modellen 159

  • 8.1 Voorbeeld

    • Omdat we vermoeden dat de ADL score na de operatie niet alleen bëınvloed isdoor de operatie en factoren verbonden aan de operatie, maar bvb. ook door hoeafhankelijk de patiënt was voor de operatie, bestuderen we de relatie tussen deADL score en de woonsituatie van de patiënt voor de operatie.

    • We onderscheiden de volgende klassen:. Alleen

    . Met partner / familie / klooster

    . RH (Rust-Huis)/ RVT (Rust- en Verzorgings-Tehuis)

    . Andere

    Wet. Ond. & Stat.: Modellen 160

  • • Beschrijvende statistiek en grafische exploratie:

    Wet. Ond. & Stat.: Modellen 161

  • • De vierde groep bevat slechts 1 subject, en zal daarom vanaf nu niet meer in deanalyses opgenomen worden.

    • Uit de figuur blijkt dat de gemiddelde ADL score bij RH/RVT patiënten hogerlijkt te zijn dan bij de andere twee groepen. Is dit verschil significant ?

    • Zelfs als de drie groepen in de populatie gelijk zijn, dan zouden we toch door puurtoeval verschillen kunnen observeren in onze steekproef.

    • Hoe groot is de kans dat we dan dergelijk grote verschillen zouden observeren ?

    • Illustratie: Vestac Java Applet → Anova → Anova plot

    Wet. Ond. & Stat.: Modellen 162

  • Wet. Ond. & Stat.: Modellen 163

  • Wet. Ond. & Stat.: Modellen 164

  • 8.2 Paarsgewijze t-testen

    • Naar analogie met de ongepaarde t-toets veronderstellen we nu dat we rverschillende sets van metingen hebben (in voorbeeld is r = 3):

    . y11, y12, y13, . . . , y1n1 de metingen in de eerste groep

    . y21, y22, y23, . . . , y2n2 de metingen in de tweede groep

    . . . .

    . yr1, yr2, yr3, . . . , yrnr de metingen in de rde groep

    • Verder veronderstellen we dat de metingen uit de volgende verdelingen getrokkenzijn:

    Y1j ∼ N (µ1, σ2), Y2j ∼ N (µ2, σ2), . . . Yrj ∼ N (µr, σ2)

    Wet. Ond. & Stat.: Modellen 165

  • • De nulhypothese die we willen testen isH0 : µ1 = µ2 = . . . = µr

    versus de alternatieve hypothese

    HA : niet alle µi gelijk

    Wet. Ond. & Stat.: Modellen 166

  • • Indien de bovenstaande nulhypothese niet voldaan is, moeten er minstens tweegemiddelden µi verschillend zijn. We kunnen dus in principe paarsgewijzeongepaarde t-toetsen gebruiken. Voor r = 3 zou dit betekenen dat we de volgendehypothesen testen:

    H0 : µ1 = µ2

    H0 : µ1 = µ3

    H0 : µ2 = µ3

    • Voor ons voorbeeld bekomen we de volgende p-waarden:

    Alleen Partner/familie/klooster RH/RVT

    Alleen — 0.8763 0.0013

    Partner/familie/klooster 0.8763 —

  • • We vinden dus alleen een significant verschil van de RH/RVT patiënten enerzijdst.o.v. de twee andere groepen anderzijds

    • Merk op dat we voor elke uitgevoerde test, een kans van 5% hebben op een type-Ifout (H0 ten onrechte verwerpen).

    • Men kan aantonen dat voor ons voorbeeld geldt dat de totale kans op een type-Ifout voldoet aan:

    P (H0 verwerpen | H0)

    = P (minstens 1 significantie | µ1 = µ2 = µ3)

    ≤ 3 × 5% = 15%zodat de kans op een type-I fout groter kan zijn dan de vereiste 5%.

    Wet. Ond. & Stat.: Modellen 168

  • • In het algemeen geldt dat, bij het uitvoeren van k testen, de totale kans op eentype-I fout kan oplopen tot k × α, en dus zeer groot kan worden als het aantaltesten groot is.

    • Daarom is het nodig een toetsingsprocedure te hebben die ons toelaat denulhypothese

    H0 : µ1 = µ2 = . . . = µr

    te testen zonder alle paarsgewijze t-toetsen te moeten uitvoeren.

    =⇒ ANOVA

    Wet. Ond. & Stat.: Modellen 169

  • 8.3 1-weg ANOVA

    • ANOVA (Analysis of variance) is een uitbreiding van de ongepaarde t-test naar hetvergelijken van meer dan 2 groepen

    • Net als bij de t-test zal de toetsingsprocedure de variabiliteit tussen de groepenvergelijken met de variabiliteit binnen de groepen

    • Volgende vergelijking staat daarbij centraal:

    r∑

    i=1

    ni∑

    j=1[yij − y··]2

    ︸ ︷︷ ︸

    SSTO

    =r∑

    i=1

    ni∑

    j=1[yij − yi·]2

    ︸ ︷︷ ︸

    SSbinnen

    +r∑

    i=1ni[yi· − y··]2

    ︸ ︷︷ ︸

    SStussen

    Wet. Ond. & Stat.: Modellen 170

  • .............................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

    ..........................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

    ......................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

    ..........................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

    ......................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

    ...................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

    Groep 1 Groep i Groep r

    y1j y1· yi· yr·y··

    y1j − y1· y1· − y··

    y1j − y··

    . y·· : globaal gemiddelde (alle groepen samen)

    . yi· : gemiddelde in de ide groep

    . yij : jde meting in de ide groep

    Wet. Ond. & Stat.: Modellen 171

  • • SSTO : Totale kwadraten somDeze term drukt de totale variabiliteit in de gegevens uit

    • SSbinnen : Kwadraten som binnen de groepenDeze term drukt de variabiliteit binnen de groepen uit

    • SStussen : Kwadraten som tussen de groepenDeze term drukt de variabiliteit tussen de groepen uit

    • Bij ANOVA wordt de nulhypothese verworpen als

    F =SStussen/(r − 1)SSbinnen/(N − r)

    groot is. N is hier de totale steekproef grootte, N = ∑i ni

    Wet. Ond. & Stat.: Modellen 172

  • • Merk op dat F een ratio is van variabiliteit tussen de groepen over variabiliteitbinnen de groepen, wat volledig analoog is als bij de ongepaarde t-test. Vandaarde term ANOVA

    • In ons voorbeeld is F = 8.59

    • Onder de nulhypothese verwachten we dat F klein is.

    • We wensen dus te weten in hoeverre we F = 8.59 kunnen bekomen door puurtoeval.

    • We berekenen de kans dat F = 8.59, in het geval alle populaties werkelijk gelijkzijn, m.a.w., als µ1 = µ2 = µ3.

    • Illustratie: Vestac Java Applet → Anova → Histograms of MSR, MSE, F

    Wet. Ond. & Stat.: Modellen 173

  • Wet. Ond. & Stat.: Modellen 174

  • Wet. Ond. & Stat.: Modellen 175

  • • Het is duidelijk dat, indien er geen verschil is tussen de drie populaties, het zeeronwaarschijnlijk is om F = 8.59 te observeren.

    • De kans om door puur toeval F ≥ 8.59 te observeren is p = 0.0006.

    • Gezien deze kans zo klein is, meer specifiek p < α = 0.05 = 5% zullen webesluiten dat wat we geobserveerd hebben (F = 8.59) voldoende indicatie is omte geloven dat µ1, µ2, en µ3 niet gelijk zijn.

    • We verwerpen dus de nulhypothese en we besluiten dat de drie groepen significantverschillend zijn, op het 5% significantie niveau

    Wet. Ond. & Stat.: Modellen 176

  • • Merk op dat de berekening van de p-waarde gebruik maakt van de gemaakteveronderstellingen:

    . Normaliteit binnen alle groepen

    . Gelijke variantie voor alle groepen

    • Net zoals bij lineaire regressie zullen deze assumpties moeten nagekeken worden(zie later).

    Wet. Ond. & Stat.: Modellen 177

  • 8.4 Berekeningen in Statistica

    • Statistica menu:. Selecteren van de 1-weg ANOVA module:

    Wet. Ond. & Stat.: Modellen 178

  • . Specifiëren van het model, en het weglaten van de vierde groep (‘Select cases’):

    Wet. Ond. & Stat.: Modellen 179

  • • Statistica output scherm, en tabel met globale F -test:

    Wet. Ond. & Stat.: Modellen 180

  • • De ‘SS MODEL’ is de SStussen. In de F statistiek moet SStussen gedeeld wordendoor r − 1 = 3− 1. Dit getal wordt het aantal vrijheidsgraden voor SStussengenoemd (df=degrees of freedom).

    • De ‘SS Residual’ is de SSbinnen. In de F statistiek moet SSbinnen gedeeld wordendoor N − r = 54− 3. Dit getal wordt het aantal vrijheidsgraden voor SSbinnengenoemd.

    • De F statistiek is

    F =SStussen/(r − 1)SSbinnen/(N − r)

    =168.60/2

    500.23/51= 8.59

    • De bijhorende p-waarde is p = 0.0006 wat dus duidt op zeer significanteverschillen tussen de drie groepen, wat betreft gemiddelde ADL op dag 1.

    Wet. Ond. & Stat.: Modellen 181

  • • Net als bij regressie kan men een statistiek berekenen die aangeeft welk gedeeltevan de totale variabiliteit in de ADL scores kan verklaard worden door deverschillen in woonsituatie (= variabiliteit tussen de groepen):

    R2 =SStussenSSTO

    =168.60

    168.60 + 500.23= 0.252

    Wet. Ond. & Stat.: Modellen 182

  • 8.5 Model diagnose

    • Bij ANOVA veronderstelt men impliciet dat de gegevens getrokken zijn uit devolgende populaties:

    Y1j ∼ N (µ1, σ2), Y2j ∼ N (µ2, σ2), . . . Yrj ∼ N (µr, σ2)

    • We veronderstellen dus . . .. . . . constante variantie: binnen elke groep is de spreiding even groot

    . . . . normaliteit: binnen elke groep zijn de gegevens normaal verdeeld

    • Het niet voldaan zijn van deze assumpties kan, zoals bij lineaire regressie leidentot verkeerde statistische resultaten (p-waarden, betrouwbaarheids intervallen).

    • Hoe kunnen bovenstaande assumpties nagekeken worden ?

    Wet. Ond. & Stat.: Modellen 183

  • Wet. Ond. & Stat.: Modellen 184

  • 8.5.1 Assumptie van constante variantie

    Wet. Ond. & Stat.: Modellen 185

  • • Beschrijvende statistiek en grafische exploratie:

    Wet. Ond. & Stat.: Modellen 186

  • • Zijn de varianties te verschillend om aan de assumptie van gelijke variantie tetwijfelen ?

    • M.a.w. in hoeverre kunnen de geobserveerde verschillen toegeschreven worden aantoeval ?

    • Men kan binnen Statistica formeel testen of de varianties gelijk zijn. Denulhypothese is dan

    H0 : σ21 = σ

    22 = . . . = σ

    2r

    versus de alternatieve hypothese

    HA : niet alle σ2i gelijk

    Wet. Ond. & Stat.: Modellen 187

  • • Dit gebeurt bvb. met de test van Levene:

    Wet. Ond. & Stat.: Modellen 188

  • • Statistica output:

    • We zien dus dat de varianties in de drie groepen niet significant verschillend zijn(p = 0.0808).

    • Indien er veel groepen zijn, of indien sommige groepen (erg) veel observatiesbevatten zullen kleine verschillen tussen de varianties significant bevonden worden.

    • Anderzijds stelt men vast dat varianties die niet té ongelijk zijn geen probleemstellen.

    Wet. Ond. & Stat.: Modellen 189

  • • Daarom gebruikt men, naast de formele test voor gelijke variantie, ook eenvuistregel die zegt dat indien de varianties niet meer dan een factor 5 verschillen,dit de resultaten slechts marginaal aantast.

    • In ons voorbeeld wordt dit:3.772

    1.822= 4.29

    • In de praktijk gebruikt men de formele test in kombinatie met de vuistregel om tebesluiten of aan de assumptie van gelijke variantie voldaan is.

    Wet. Ond. & Stat.: Modellen 190

  • 8.5.2 Assumptie van normaliteit

    Wet. Ond. & Stat.: Modellen 191

  • • ANOVA veronderstelt dat de gegevens in elke groep normaal verdeeld zijn, metdezelfde variantie. Hierboven werd reeds besproken hoe we de gelijkheid vanvarianties kunnen nakijken. We veronderstellen nu dat de assumptie van gelijkevarianties voldaan is. Hoe kunnen we dan de normaliteit testen ?

    • We herschrijven het ANOVA model als

    Y1j = µ1 + ε1j

    Y2j = µ2 + ε2j

    . . .

    Yrj = µr + εrj

    waarbij de ‘fouten termen’ εij allen komen uit dezelfde normale verdeling metgemiddelde nul en variantie σ2.

    Wet. Ond. & Stat.: Modellen 192

  • • Net als bij regressie zullen we dus de veronderstelling van normaliteit voor de εijnagaan via hun schatters

    eij = yij − µ̂i = yij − yi·

    • Net als bij regressie worden de eij residu’s genoemd: ze representeren de fout diemen maakt als men de geobserveerde waarde yij voor een individu in groep i zouvoorspellen door het groepsgemiddelde yi·.

    • Eens de residu’s eij berekend zijn kunnen we de normaliteit terug nagaan metbehulp van hun histogram, of met behulp van een formele normaliteitstest.

    • Dit gebeurt nu volledig analoog als bij lineaire regressie.

    Wet. Ond. & Stat.: Modellen 193

  • • Statistica output:

    • We mogen hieruit dus besluiten dat de assumptie van normaliteit aanvaardbaar is.

    Wet. Ond. & Stat.: Modellen 194

  • • Net als bij enkelvoudige regressie geldt:. Afwijkingen van normaliteit leiden toch nog tot correcte resultaten zolang de

    verdeling van de fouten symmetrisch is.

    . In geval van asymmetrie kan de respons soms getransformeerd worden, zodatde residu’s in het nieuwe model wel normaal verdeeld zijn.

    . Eventuele transformaties kunnen de constante variantie verstoren, zodat dit naeen transformatie terug bekeken moet worden voor het vernieuwde model.

    Wet. Ond. & Stat.: Modellen 195

  • 8.6 Invloedrijke observaties

    • Niettegenstaande we bij ANOVA strikt genomen geen regressie parameters hebbenkunnen individuele observaties wel grote invloed hebben op het schatten van degroepsgemiddelden µ̂i, en dus op de uiteindelijke ANOVA resultaten.

    • Statistica laat ons toe, net zoals bij regressie, de invloed van elke observatie temeten door de schatters µ̂i = yi· te vergelijken met de schatters die we zoudenbekomen indien die observatie weggelaten zou worden.

    • Dit resulteert terug in de zogenaamde ‘Cooks distance’ die een afstand is tussende schatters met en zonder een bepaalde observatie.

    • Net als bij regressie bekijken we een scatterplot van de Cooks afstanden versus hetsubject nummer.

    Wet. Ond. & Stat.: Modellen 196

  • • De berekeningen gebeuren analoog als bij enkelvoudige lineaire regressie.

    • Statistica output:

    • Er zijn dus geen observaties die uitzonderlijk grote invloed vertonen.

    Wet. Ond. & Stat.: Modellen 197

  • Hoofdstuk 9

    Meervoudige lineaire regressie

    . Voorbeeld

    . Regressie model

    . Berekeningen in Statistica

    . Interpretatie

    . Model diagnose

    . Invloedrijke observaties

    Wet. Ond. & Stat.: Modellen 198

  • 9.1 Voorbeeld

    • We hebben vroeger reeds het verband tussen de ADL score en de MMSE scorebestudeerd, 1 dag na de operatie.

    • We besloten dat er een sterk-significante relatie bestaat tussen de cognitievetoestand van de patiënt en zijn afhankelijkheid.

    • Anderzijds verwachten we ook dat de ADL score leeftijdsgebonden is.

    • Tot slot is er wellicht ook een verband tussen de MMSE score en de leeftijd.

    • We bestuderen deze verbanden met 3 enkelvoudige regressies

    Wet. Ond. & Stat.: Modellen 199

  • • Regressie van ADL op MMSE:

    Wet. Ond. & Stat.: Modellen 200

  • • Regressie van ADL op leeftijd:

    Wet. Ond. & Stat.: Modellen 201

  • • Regressie van MMSE op leeftijd:

    Wet. Ond. & Stat.: Modellen 202

  • • We hebben dus de volgende resultaten:. De afhankelijkheid is hoger naarmate de cognitieve status lager is

    . De afhankelijkheid is hoger naarmate de leeftijd hoger is

    . De cognitieve status is lager naarmate de leeftijd hoger is

    • Het is dus mogelijk dat het verband dat we ontdekten tussen ADL en MMSE eenpuur leeftijdseffect voorstelt, m.a.w. het zou kunnen dat een betere cognitievetoestand overeenkomt met lagere afhankelijkheid omdat dit jongere patiënten zijn.

    • Het komt er dus op neer dat een enkelvoudige regressie niet volstaat om decomplexe relatie tussen ADL enerzijds, en leeftijd en MMSE anderzijds, tebeschrijven.

    =⇒ meervoudige (lineaire) regressie

    Wet. Ond. & Stat.: Modellen 203

  • 9.2 Het meervoudig lineair regressie model

    • We wensen na te gaan hoe de ADL score 1 dag na de operatie bëınvloed wordtdoor de MMSE score en door de leeftijd gezamenlijk.

    • Grafisch kunnen we dit verband voorstellen met een 3-D scatter plot:

    Wet. Ond. & Stat.: Modellen 204

  • • Output (na rotatie):

    Wet. Ond. & Stat.: Modellen 205

  • • Een mogelijke manier om ADL tegelijk te relateren aan MMSE en aan Leeftijd ishet enkelvoudig regressie model

    ADLi = β0 + β1MMSEi + εi

    yi = β0 + β1xi + εi

    dat we gebruikten voor de regressie van ADL op MMSE, uit te breiden tot

    ADLi = β0 + β1MMSEi + β2Leeftijdi + εi

    yi = β0 + β1x1i + β2x2i + εi

    waarmee we expliciet aanduiden dat ADL niet alleen kan afhangen van MMSE,maar eventueel ook van de leeftijd.

    Wet. Ond. & Stat.: Modellen 206

  • • ADL wordt de afhankelijk veranderlijke (of respons) genoemd, terwijl MMSE enLeeftijd de onafhankelijk veranderlijken (of covariaten) genoemd worden.

    • De bovenstaande vergelijking beschrijft een vlak in de 3-D scatterplot, hetzogenaamde regressievlak, als volgt te tekenenen in Statistica:

    Wet. Ond. & Stat.: Modellen 207

  • • Output (twee verschillende rotaties):

    Wet. Ond. & Stat.: Modellen 208

  • • Zoals bij enkelvoudige lineaire regressie moeten de parameters β0, β1 en β2geschat worden op basis van de steekproef.

    • Dit kan terug gebeuren met de kleinste kwadraten methode die die schatters ̂β0,̂β1 en

    ̂β2 zoekt waarvoor de voorspelde ADL scores

    ̂ADLi =̂β0 +

    ̂β1MMSEi +̂β2Leeftijdi

    zo dicht mogelijk bij de oorspronkelijke metingen liggen, d.w.z. waarvoor

    i

    [ADLi − ̂ADLi

    ]2

    minimaal is.

    Wet. Ond. & Stat.: Modellen 209

  • • Zoals bij enkelvoudige regressie wordt verondersteld dat de fouten εi normaalverdeeld zijn met gemiddelde nul en constante variantie σ2.

    • Als bovenstaande assumpties voldaan zijn kan men significantie testen bekomenvoor de regressie parameters β0, β1 en β2.

    • Verder kan men, volledig analoog als bij enkelvoudige regressie, een ANOVA tabelopstellen op basis van de gelijkheid

    i[yi − y]2

    ︸ ︷︷ ︸

    ↓SSTO

    =∑

    i[yi − ŷi]2

    ︸ ︷︷ ︸

    ↓SSE

    +∑

    i[ŷi − y]2

    ︸ ︷︷ ︸

    ↓SSR

    Wet. Ond. & Stat.: Modellen 210

  • • SSTO: Totale kwadraten somDeze term drukt de totale fout uit die we maken als we de yi voorspellen zonderrekening te houden met de observaties x1i en x2i voor de covariaten X1 en X2.

    • SSE: Kwadraten som van de foutenDeze term drukt de totale fout uit die we maken als we de yi voorspellen metbehulp van de observaties x1i en x2i.

    • SSR: Kwadraten som van de regressieDeze term drukt uit hoeveel kleiner de fout is die we maken als we de covariatengebruiken om de yi te voorspellen, dan als we de covariaten niet zouden gebruiken.

    • Een maat voor de ‘kwaliteit’ van onze regressie is

    R2 =SSR

    SSTO

    Wet. Ond. & Stat.: Modellen 211

  • • Zoals bij enkelvoudige regressie heeft R2 de volgende eigenschappen:. 0 ≤ R2 ≤ 1. R2 = 0 impliceert dat SSR = 0 en dus dat alle ŷi gelijk zijn aan y, m.a.w. het

    regressie vlak is horizontaal.

    Dit is equivalent met ̂β1 =̂β2 = 0

    . R2 = 1 impliceert dat SSE = 0. Dit impliceert dat yi = ŷi voor alle i, en dusdat alle observaties op het regressie vlak liggen.

    • Men zegt dat R2 uitdrukt ‘welke fractie van de variabiliteit in de respons (ADL)verklaard kan worden door de covariaten (MMSE en Leeftijd).

    • Bij enkelvoudige regressie hadden we dat R2 gelijk was aan r2, het kwadraat vande correlatie tussen de xi en yi waarden. R

    2 kan dus gezien worden als eenveralgemening van de correlatie coëfficiënt naar een ‘correlatie’ tussen éénveranderlijke enerzijds (de respons), en meerdere veranderlijken anderzijds (decovariaten).

    Wet. Ond. & Stat.: Modellen 212

  • • Indien R2 = 0, dan helpen de covariaten X1 en X2 ons niet bij het voorspellenvan de respons, wat equivalent is met ̂β1 =

    ̂β2 = 0. In de praktijk is het daarombelangrijk na te gaan of de covariaten ons helpen bij het voorspellen van derespons. Dit kan door de nul hypothese

    H0 : β1 = β2 = 0

    te testen versus de alternatieve hypothese

    HA : β1 6= 0 of β2 6= 0

    • In Statistica wordt, bij elke regressie analyse, bovenstaande hypotheseautomatisch getoetst. Dit gebeurt met een F test.

    • Alles wat we besproken hebben voor een regressie analyse met 2 covariaten kandirect uitgebreid worden tot een regressie met meerdere covariaten, waarin meneen bepaalde respons wil voorspellen met behulp van een set van (meer dan twee)covariaten.

    Wet. Ond. & Stat.: Modellen 213

  • 9.3 Berekeningen in Statistica

    • Statstica programma en output:

    Wet. Ond. & Stat.: Modellen 214

  • • Regressie parameters:

    • ANOVA tabel:

    Wet. Ond. & Stat.: Modellen 215

  • • In de ANOVA tabel vinden we SSTO, SSR en SSE

    • De globale F-test in de ANOVA tabel test of de covariaten de voorspelling vanADL significant verbeteren, m.a.w. dit is de test om de hypothese

    H0 : β1 = β2 = 0

    te testen versus de alternatieve hypothese

    HA : β1 6= 0 of β2 6= 0

    • Gezien de hoge significantie (p < 0.0001) besluiten we dat minstens β1 of β2significant verschilt van nul.

    • De R2 is gelijk aan 0.4946. Merk op dat bij de regressie van ADL op MMSE weeen R2 hadden van 0.4940. We zien dus dat de leeftijd weinig extra variabiliteit inADL verklaard bovenop wat reeds verklaard werd door MMSE. Dit suggereert dat,eens we de MMSE score kennen, de leeftijd van de patiënt ons weinig extrainformatie biedt voor het voorspellen van zijn ADL score, 1 dag na de operatie.

    Wet. Ond. & Stat.: Modellen 216

  • • De kleinste kwadraten schatters zijn. ̂β0 = 22.55

    . ̂β1 = −0.29

    . ̂β2 = 0.01

    • Merk op dat dit niet dezelfde waarden zijn als die die we zouden bekomen door 2enkelvoudige regressies te berekenen:

    Covariaten

    MMSE en Leeftijd MMSE Leeftijd

    β0 22.55 23.65 5.93

    β1 -0.29 -0.30 —

    β2 0.01 — 0.15

    Dit suggereert dus dat de parameters een andere betekenis krijgen dan deparameters in de twee enkelvoudige regressie modellen.

    Wet. Ond. & Stat.: Modellen 217

  • • Merk ook op dat de leeftijd in bovenstaand regressie model niet meer significant is(p = 0.7963), wat sterk in contrast was met de significante univariate regressievan ADL op Leeftijd (p = 0.0053). Dit toont terug aan dat de resultaten uit eenmeervoudige regressie analyse anders gëınterpreteerd moeten worden dan deze uitenkelvoudige regressie analyses.

    Wet.