HOOFDSTUK VI NIET-PARAMETRISCHE (VERDELINGSVRIJE) …minf.vub.ac.be/~rbuyl/cursus/H6.pdf ·...

Theorie Statistiek – Lessen 11+12 1

HOOFDSTUK VI NIET-PARAMETRISCHE

(VERDELINGSVRIJE) STATISTIEK


1. INLEIDING Parametrische statistiek: Normale Verdeling Niet-parametrische statistiek: Verdelingsvrij

Keuze tussen de twee benaderingen

I. Normaliteit is uitzonderlijk

II. Voor complexe modellen (regressie, anova) bestaan alleen parametrische methoden

III. Niet-parametrische methoden mogen altijd worden gebruikt

IV. Voor NV zijn parametrische methoden krachtiger (kleinere ß)

V. Parametrische methoden toelaatbaar wanneer men na transformatie NV krijgt (log, vierkantswortel, ...)

VI. Andere strategie in geval verdeling onbekend:

• Pas beide methoden toe

• Indien conclusie identiek: aanvaarden

• Indien verschillende conclusie: zoek outliers, gebruik grafische voorstelling of toets


2. METHODEN VOOR EEN STEEKPROEF

2.1 Schatters en betrouwbaarheidsintervallen voor de mediaan

X1, X2, ...... , Xn hebben dezelfde (onbekende) verdeling

Men wenst de mediaan M van de populatie te schatten.

Schatter: mediaan van de steekproef = ~X


Eénvoudig betrouwbaarheidsinterval voor de mediaan:

[ K1 - G1] met:

K1 = kleinste element van de steekproef,

G1 = grootste element van de steekproef

Bepaling van de onbetrouwbaarheidsdrempel (α):

M behoort niet tot het interval indien alle metingen ofwel groter zijn dan M ofwel allemaal kleiner.

De kans dat een meting groter zou zijn dan de mediaan is 1/2

De kans dat alle metingen groter zijn dan de mediaan is (1/2)ⁿ

De kans dat alle metingen kleiner zijn dan de mediaan is (1/2)ⁿ

De kans dat de mediaan tot het interval behoort is:

1 - α = 1 - 2 . (1/2)ⁿ = 1 - 1 / 2n-1 (zie tabel)


n 1-α

2 0,5000

3 0,7500

4 0,8750

5 0,9375

6 0,9688

7 0,9844

8 0,9922

9 0,9961

10 0,9980

11 0,9990

12 0,9995

Opmerkingen

• De onbetrouwbaarheid α wordt afgeleid uit n, het kan niet worden opgegeven om n te berekenen

• De kans stijgt vlug met stijgende n, waardoor het interval ook groter wordt en waardoor het resultaat minder bruikbaar wordt


Men zoekt een evenwicht tussen de lengte van het interval en α,

door intervallen te beschouwen van de vorm:

[Ke - Ge] met:

Ke = ede kleinste element van de steekproef,

Ge = ede grootste element van de steekproef

Dit zijn de T-intervallen

De kans (1-α) kan berekend worden met de binomiale verdeling

Er bestaan tabellen voor T-intervallen


Voorbeeld

Van 8 toevallig gekozen personen werd de diastolische bloeddruk gemeten. Dit gaf: 77, 89, 85, 74, 75, 80, 70, 83 mmHg

Mediaan = 78,5 mm Hg

Tabel: � interval [K2 - G2] heeft een betrouwbaarheid van 93%

K2 = 74 en G2 = 85.

Dit is een breed interval vermits een steekproef van 8 elementen weinig informatie geeft


Benadering voor grote steekproeven

De tabel voor T-intervallen geeft waarden voor n ≤50.

Voor grotere steekproeven gebruikt men de volgende benadering:

e = (n + 1 - µα√n) / 2

Indien e niet geheel is moet men afronden:

- als men naar beneden afrondt (e wordt kleiner):

- interval wordt groter

- α wordt kleiner

- resultaat meer conservatief

Voorbeeld

n = 100 en α = 0,05:

µα = 1,960 en

e = (101-19,60) / 2 = 40,70

Men neemt e = 40 om een wat groter interval te bekomen (men zou ook lineair kunnen interpoleren).


Betrouwbaarheidsintervallen voor symmetrische variabelen

Het vorig BI is geldig zonder enige veronderstelling aangaande de verdeling van de variabele. Bijkomende informatie laat soms toe een meer accurate methode toe te passen.

Indien de verdeling symmetrisch is (niet noodzakelijk normaal verdeeld), vallen mediaan en symmetrie-as samen. Men kan verwachten dat de steekproef X1, X2, ...... , Xn symmetrisch gelegen is rond M. Dit is dan ook het geval voor de gemiddelden van twee elementen:

Xi Xj+2

(i, j = 1, 2, ... ,n)

Een schatting van M wordt gegeven door de mediaan te berekenen van alle gemiddelden van twee metingen. Een BI wordt gegeven door het ede kleinste en het ede grootste element van deze gemiddelden. Men noemt een dergelijk interval een:

W - interval of interval van Wilcoxon.

Opmerking

Het bepalen van een W-interval vraagt veel berekeningen waarvoor computerprogrammas beschikbaar zijn.


Voorbeeld

Veronderstel dat bloeddrukmetingen symmetrisch verdeeld zijn en beschouw de metingen van het vorig voorbeeld. De gemiddelden van twee metingen zijn:

70 72 72,5 73,5 75 76,5 77,5 79,5

74 74,5 75,5 77 78,5 79,5 81,5

75 76 77,5 79 80 82

77 78,5 80 81 83

80 81,5 82,5 84,5

83 84 86

85 87

89


De schatting van de mediaan wordt gegeven door het gemiddelde te nemen van de twee middenste van deze 36 waarden: 79 en 79,5:

schatting = (79 + 79,5) /2 = 79,25

Volgens de tabel voor W-intervallen wordt een BI met betrouwbaarheid 96,1% begrensd door de 4de kleinste en de 4de grootste waarde: 73,5 en 85.

Dit geeft het interval: [73,5 - 85,0], een beetje groter dan het T-interval met 93% betrouwbaarheid. Dit interval mag slecht gebruikt worden voor een symmetrische populatie.


2.2 Parametertoetsen voor de mediaan

Men wenst de volgende hypothese te toetsen:

H0: M = M0

met als alternatieve hypothese:

H1: M ≠ M0

Hiervoor bestaan er twee toetsen:

1. De tekentoets

2. De Wilcoxon rangtoets


2.2.1 De tekentoets

We beschouwen T-intervallen: [ Ke - Ge].

De hypothetische waarde M0 zal ‘onaanvaardbaar’ zijn wanneer het buiten het interval gelegen is:

a) ofwel kleiner dan Ke � minder dan e waarnemingen < M0

b) ofwel groter dan Ge � minder dan e waarnemingen > M0

Definitie

T- = aantal waarnemingen kleiner dan M0

T+ = aantal waarnemingen groter dan M0

Beslissing

De nulhypothese wordt verworpen indien ofwel T- ofwel T+ kleiner is dan het aantal e overeenkomend met de waarde van α die in de tabel wordt gevonden, m.a.w. indien het minimum kleiner is dan e.

Opmerking

Men spreekt van de tekentoets omdat men nagaat hoeveel (Xi - M0) negatief zijn, en hoeveel positief.


Eénzijdige toets

Met H1: M > M0 als alternatieve hypothese verwacht men:

- weinig waarnemingen kleiner dan M0

- veel waarnemingen groter dan M0

Men gebruikt als toetsveranderlijke T- (aantal kleiner dan M0)

Met H1: M < M0 als alternatieve hypothese:

gebruikt men als toetsveranderlijke T+ (aantal groter dan M0)

BESLISSING: DE NULHYPOTHESE VERWERPEN INDIEN DE TOETSVERANDERLIJKE KLEINER IS DAN DE WAARDE IN DE TABEL

Opmerkingen

1. Voor de éénzijdige toetsen gebruikt men als p-waarde de waarde aangegeven in de tabel onder α/2

2. De tekentoets veronderstelt dat geen enkele waarneming gelijk is aan M0. Deze waarnemingen worden geëlimineerd vóór de toets wordt uitgevoerd (n moet aangepast worden)


Voorbeeld

In de literatuur wordt beweerd dat 50% van de patiënten die aan een bepaalde ziekte lijden na 60 dagen spontaan genezen zijn.

Een arts wenst deze hypothese na te gaan en noteerde de genezingsdatum van 16 patienten:

46 56 77 35 54 41 63 50

60 38 26 59 39 71 52 48

De toets wordt tweezijdig uitgevoerd:

H0: M = M0

H1: M ≠ M0

Eén van de waarnemingen is gelijk aan M0 en wordt geëlimineerd

n wordt dus 15

Men berekent :

T+ = 3 (71, 77, 63) en T- = 12

Min(T+ , T- ) = 3


In de tabel vindt men voor n = 15:

e = 3: 1- α = 0.993 en α = 0,007

e = 4: 1- α = 0.965 en α = 0,035

e = 5: 1- α = 0.882 en α = 0,118

Hieruit volgt:

P( T+ ≤ 3 of T+ ≥ 12) = P( T+ < 4 of T+ > 11) = 0,035

Besluit

H0 verwerpen op het 5% niveau of p = 0,035


2.2.2 De Wilcoxon rangtoets

Deze toets werkt op dezelfde manier als de tekentoets, maar met W- en W+ i.p.v. T-en T+. Men moet hiervoor veronderstellen dat de veranderlijke symmetrisch is.

Het bestaat uit de volgende stappen:

I. Bereken alle verschillen Xi - M0 en hun absolute waarde

II. Rangschik de absolute waarden │Xi - M0│ van klein naar groot

III. Bereken:

W- = som van de rangen van de metingen met negatieve Xi - M0

W+ = som van de rangen van de metingen met positieve Xi - M0

Opmerking

W- + W+ = n(n+1)/2


Voorbeeld

Een machine wordt gebruikt om flessen van 100 ml syroop te vullen. Om na te gaan of de machine goed ingesteld is, wordt de inhoud van 12 flessen gemeten. Dit geeft:

102, 101, 108, 95, 106, 112, 110, 109, 103, 86, 93 en 104 ml

Men wenst de hypothese te toetsen dat de mediaan M = 100 ml t.o.v. de hypothese dat M ≠ 100 ml. Uit vorige experimenten weet men dat de verdeling van de inhoud symmetrisch is. Men berekent W- en W+.


Xi │Xi - 100│ Rang

102 2 2

101 1 1

108 8 8

95 5 5

106 6 6

112 12 11

110 10 10

109 9 9

103 3 3

86 14 12

93 7 7

104 4 4

W- = 5 + 12 + 7 = 24

W+ = (12 x 13) / 2 - 24 = 78 - 24 = 54

min (W-,W+) = 24

Uit de tabel voor W-intervallen volgt dat p > 0,11 zodat de nulhypothese wordt aanvaard.


Opmerkingen

• De metingen gelijk aan M0 worden weggelaten uit de analyse en n wordt aangepast

• Voor gelijke absolute waarden │Xi - M0│ wordt de gemiddelde rang berekend (voorbeeld: rangen 2 en 3 worden beide vervangen door 2.5, rangen 6, 7 en 8 worden vervangen door 7). Deze procedure is conservatief: de ‘echte’ p-waarde is kleiner of gelijk aan de gevonden waarde

• Het is niet toegelaten de twee toetsen te gebruiken (tekentoets en Wilcoxon) en het meest aantrekkelijk resultaat te gebruiken. Men moet de toets gebruiken waarvoor de hypothesen zo goed mogelijk met de realiteit overeenkomen


3. METHODEN VOOR TWEE STEEKPROEVEN

3.1 Gepaarde metingen

Beschouw twee steekproeven van elk n elementen:

X1, X2, ...... , Xn hebben dezelfde (onbekende) verdeling en zijn onafhankelijk

Y1, Y2, ...... , Yn hebben dezelfde (onbekende) verdeling en zijn onafhankelijk

Deze metingen zijn gepaard: met elke X komt een Y overeen (en omgekeerd)

Men wenst na te gaan of de verdeling van de Xi dezelfde is als die van de Yi. Indien deze hypothese waar is dan zijn de verschillen

Di = Xi - Yi

symmetrisch verdeeld rond 0 ⇒ de mediaan = 0.

Men kan deze hypothese nagaan met de tekentoets en met de Wilcoxon rangtoets:


Tekentoets

T- = aantal negatieve Di

T+ = aantal positieve Di

Wilcoxon rangtoets

W- = som van de rangen van de negatieve Di

W+ = som van de rangen van de positieve Di

In geval van gelijke absolute waarden wordt de gemiddelde rang genomen

Metingen waarvoor Xi = Yi worden weggelaten


Voorbeeld

Vergelijken van 2 leesmethoden. Een klas van 20 leerlingen wordt ingedeeld in 10 groepen van 2 (matching)

In elke groep wordt toevallig de leesmethode bepaald (randomizatie)

Op het einde van het jaar leggen de leerlingen een toets af:

Groep 1 2 3 4 5 6 7 8 9 10

x (methode 1) 78 81 69 86 70 66 76 63 62 74

y (methode 2) 68 99 67 97 75 86 92 75 84 66

d 10 -18 2 -11 -5 -20 -16 -12 -22 8

Rang 4 8 1 5 2 9 7 6 10 3


Hypothesen

H0: MD = 0

met als alternatieve hypothese:

H1: MD ≠ 0

waar MD de mediaan is van de verschillen

Tekentoets

T- = 7 en T+ = 3 ⇒ T = 3:

P (T+ ≤3) + P (T+ ≥7) = P (T+ <4) + P (T+ >6)

P (T+ ≤3) = P0 + P1 + P2 + P3

waar Pi = C10i (1/2)10 (binomiale verdeling)

P (T+ ≤3) = 0,001 + 0,010 + 0,044 + 0,117 = 0,172

p = 0,344

Bijgevolg wordt de nulhypothese aanvaard


Wilcoxon rangtoets

W+ = 4 + 1 + 3 = 8

Men vindt in de tabel

P (W+ ≤8) + P (W+ ≥47) = P (W+ <9) + P (W+ >46) = 0,049

Bijgevolg wordt de alternatieve hypothese aanvaard


Opmerkingen

• Met de tekentoets wordt de nulhypothese aanvaard en met de Wilcoxon rangtoets niet. De reden is dat de positieve verschillen meestal veel kleiner zijn (in absolute waarde), dan de negatieve verschillen.

• Wanneer de verschillen niet kunnen worden gerangschikt kan men alleen gebruik maken van de tekentoets:

- indien de xi en yj zelf rangorden zijn

- wanneer men voor elke i alleen kan zeggen welke meting groter is en welke kleiner (ofwel dat ze gelijk zijn), maar niet hoe groot het verschil is

• Wanneer de nulhypothese wordt aanvaard betekent het niet noodzakelijk dat de twee verdelingen identiek zijn, maar dat de gegevens niet toelaten het tegendeel aan te tonen


3.2 Onafhankelijke steekproeven

Meestal zijn de metingen niet gepaard en onafhankelijk. Hiervoor zijn er twee beschikbare toetsen: de mediaan toets en de Wilcoxon-Mann-Whitney toets.

De mediaan toets

Noem M de mediaan van alle x en y metingen samen.

Bepaal het aantal x metingen ≤ M en het aantal > M

Bepaal het aantal y metingen ≤ M en het aantal > M

Dit geeft volgende tabel:

x-metingen y-metingen

≤ M a b a + b (≈ N/2)

> M c d c + d (≈N/2)

n1 = a + c n2 = b + d n1 + n2 = N


Indien de 2 verdelingen dezelfde zijn dan is de positie t.o.v. de mediaan M onhafhankelijk van de steekproef. ⇒ chi-kwadraat toets:

K2 = ( . . ) .. .( ).( )a d b c N

n n a b c d−

+ +

2

1 2

is de toetsveranderlijke. Deze heeft een chi-kwadraat verdeling met één vrijheidsgraad. Deze toets houdt geen rekening met de omvang van de afwijking t.o.v. de mediaan.


De Wilcoxon-Mann-Whitney toets

In deze toets wordt iedere x-waarde vergeleken met iedere y-waarde

Definities

Ux = aantal maal dat een x-waarde groter is dan een y-waarde

Uy = aantal maal dat een y-waarde groter is dan een x-waarde

Om Ux en Uy te berekenen maakt men n1 x n2 vergelijkingen

Uit de definities volgt dat Ux + Uy = n1 x n2

Voorlopig worden gelijke waarden uitgesloten

Indien de x-waarden globaal even groot zijn als de y-waarden, verwacht men ook even grote Ux en Uy

De Wilcoxon-Mann-Whitney toets verwerpt de hypothese dat de X-waarden en de Y-waarden afkomstig zijn uit dezelfde populatie indien het minimum van Ux en Uy kleiner is dan de waarde e die men in de tabel vindt (tweezijdige toets)

In de tabel vindt men waarden van e voor n1 en n2 tussen 3 en 12.


Voorbeeld

Beschouw de resultaten van 2 behandelingen om cholesterol in bloed te verminderen

x = vermindering na behandeling met produkt 1 gedurende 3 maand:

58 46 45 60 47 50 52 48 70 71 (n1 = 10)

y = vermindering na behandeling met produkt 2 gedurende 3 maand:

53 38 42 35 57 44 41 56 (n2 = 8)

Ux = 8 + 5 + 5 + 8 + 5 + 5 + 5 + 5 + 8 + 8 = 62

Uy = 6 + 0 + 0 + 0 + 6 + 0 + 0 + 6 = 18

Min (Ux , Uy) = 18 ⇒ 19 opzoeken in de tabel

H0: de twee verdelingen (medianen) zijn gelijk H1: de twee verdelingen (medianen) zijn verschillend

Conclusie: H0 aanvaarden (p = 0,055)


Normale benadering voor grote steekproeven

Voor steekproeven met meer dan 12 waaarnemingen gebruikt men de volgende benadering:

e is normaal verdeeld met :

gemiddelde = (n1n2 + 1)/2

variantie = n1n2 (n1+n2 + 1)/12

Gelijke metingswaarden

Eén van de hypothesen van de Wilcoxon-Mann-Whitney toets is de kontinuiteit van de verdelingen van de Xi en de Yi, waardoor de kans op gelijke metingswaarden nul is. In de praktijk is deze hypothese zelden waar en komen gelijkheden voor. De gebruikelijke procedure is

In geval van gelijkheid tussen een x-waarde en een y-waarde: tel 1/2 op bij Ux en 1/2 bij Uy

Met deze procedure blijft de gelijkheid Ux + Uy = n1 x n2 gelden

Opmerking (geldig voor alle vergelijkingstoetsen)

Wanneer de twee steekproeven niet even groot zijn vermindert de macht van de toets (β wordt groter). Deze vermindering wordt belangrijk vanaf ongeveer tweemaal meer waarnemingen in de grootste steekproef.


Alternatieve vorm van de Wilcoxon-Mann-Whitney toets

Rangschik de n1 + n2 waarnemingen in stijgende volgorde

Noem Rx de som van de rangen die overeenkomen met x-waarden en Ry de som van de rangen van de y-waarden

Wanneer twee of meer metingswaarden gelijk zijn wordt aan ieder de gemiddelde rang toegekend. Voor de toetsveranderlijken Rx en Ry bestaan tabellen voor betrouwbaarheidsintervallen en om de toets uit te voeren


Voorbeeld

Men beschouwt de vermindering in bloedconcentratie van glucose (mg/100 ml) na behandeling met geneesmiddel A en met geneesmiddel B

BEHANDELING A (x) Patiënt Daling

1 10 2 15 3 -5 4 20 5 25

BEHANDELING B (y) Patiënt Daling

6 10 7 5 8 -5 9 -10


Na rangschikking bekomt men de volgende tabel

Patiënt Meting Behandeling Rang

9 -10 B 13 -5 A 2,5 8 -5 B 2,5 7 5 B 4 1 10 A 5,5 6 10 B 5,5 2 15 A 7 4 20 A 8 5 25 A 9

Rx = 2,5 + 5,5 + 7 + 8 + 9 = 32

Ry = 1 + 2,5 + 4 + 5,5 = 13

R = min (Rx Ry) = 13

Opmerking

Het gebruik van Rx en Ry maakt het mogelijk de Wilcoxon-Mann-Whitney toets te veralgemenen tot meer dan twee groepen (Kruskall-Wallis toets)

HOOFDSTUK VI NIET-PARAMETRISCHE (VERDELINGSVRIJE) …minf.vub.ac.be/~rbuyl/cursus/H6.pdf ·...

Documents

Transcript of HOOFDSTUK VI NIET-PARAMETRISCHE (VERDELINGSVRIJE) …minf.vub.ac.be/~rbuyl/cursus/H6.pdf ·...