Statistische uitspraken over onbekende populatiegemiddelden l Uitspraken over één...

28
Statistische uitspraken over onbekende populatiegemiddelden Uitspraken over één populatiegemiddelde Het vergelijken van twee populatiegemiddelden Gepaarde waarnemingen Het vergelijken van meer dan twee populatiegemiddelden

Transcript of Statistische uitspraken over onbekende populatiegemiddelden l Uitspraken over één...

Page 1: Statistische uitspraken over onbekende populatiegemiddelden l Uitspraken over één populatiegemiddelde l Het vergelijken van twee populatiegemiddelden l.

Statistische uitspraken overonbekende populatiegemiddelden

Uitspraken over één populatiegemiddelde Het vergelijken van twee populatiegemiddelden Gepaarde waarnemingen Het vergelijken van meer dan twee populatiegemiddelden

Page 2: Statistische uitspraken over onbekende populatiegemiddelden l Uitspraken over één populatiegemiddelde l Het vergelijken van twee populatiegemiddelden l.

Toets van de hypothese µ = µ0

Vraag: Is een aselecte steekproef van n elementen met gemiddelde van de meting <x> en spreiding s, afkomstig uit een normaal verdeelde populatie met populatiegemiddelde µ 0 en met onbekende spreiding sigma ?

Toetsing: toets van Student (Gosset)

NB toetsingsgrootheden: gestandaardiseerd verschil NB vrijheidsgraden

Statistische uitspraken overonbekende populatiegemiddelden

Page 3: Statistische uitspraken over onbekende populatiegemiddelden l Uitspraken over één populatiegemiddelde l Het vergelijken van twee populatiegemiddelden l.

Voorbeeld

Vier onafhankelijke bepalingen van haemoglobinegehalte van een standaard bloedmonster.Het gehalte bedraagt 14,0 g%

Resultaten:14,114,414,214,2

Verkrijgt de analyst resultaten die systematisch ( # toeval) van het werkelijke gehalte verschillen ?

Aanname: Meetresultaten normaal verdeeld, dus steekproef van een normaal verdeelde populatie

Statistische uitspraken overonbekende populatiegemiddelden

Page 4: Statistische uitspraken over onbekende populatiegemiddelden l Uitspraken over één populatiegemiddelde l Het vergelijken van twee populatiegemiddelden l.

Uitspraken over één populatiegemiddelde

Statistische uitspraken overonbekende populatiegemiddelden

Geen reden om te veronderstellen dat eventuele niet-toevallige afwijkingen een bepaalde richting zouden uitgaan

tweezijdig toetsen

Nulhypothese: H0 : µ = 14,0 (g%)Alternatieve hypothese: H1 : µ # 14,0 (g%)

Kies onbetrouwbaarheidsdrempel:(meestal) p = 0,05

Toetsingsgrootheid:t = (<x> - 14,0)/ (S/sqrt4) = ...

Vrijheidsgraden:n-1 = 3

Tabel

Page 5: Statistische uitspraken over onbekende populatiegemiddelden l Uitspraken over één populatiegemiddelde l Het vergelijken van twee populatiegemiddelden l.

Uitspraken over één populatiegemiddelde

Meestal is niet gekend en wordt dan geschat als de steekproef-standaarddeviatie

voor toetsting wordt

vervangen door de ‘standard error of the mean’

s n

i 1

(X i X)2

n 1

sd(X)n

se(X)s

n

Statistische uitspraken overonbekende populatiegemiddelden

Page 6: Statistische uitspraken over onbekende populatiegemiddelden l Uitspraken over één populatiegemiddelde l Het vergelijken van twee populatiegemiddelden l.

Uitspraken over één populatiegemiddelde

Dit leidt tot de toetsingsgrootheid

Het 1-alfa betrouwbaarheidsinterval voor µ wordt in het algemeen gegevendoor:

t X µ

0

se(X)X µ

0

s

n

X t .s

n< µ < X t .

s

n

nb. bij df =< 30 is de spreiding van t sterker dan van Z

Statistische uitspraken overonbekende populatiegemiddelden

Page 7: Statistische uitspraken over onbekende populatiegemiddelden l Uitspraken over één populatiegemiddelde l Het vergelijken van twee populatiegemiddelden l.

Het vergelijken van twee populatiegemiddelden

Veronderstel twee populatiegemiddelden die normaal verdeeld zijnµX en µY

X1,….Xn zijnde uitkomsten in een steekproef (grootte n) van de meet-waarden in de eerste populatie

Y1,….Ym zijnde uitkomsten in een steekproef (grootte m) van de meet-waarden in de tweede populatie

Gemiddelden X en Y normaal verdeeld, dan ook X-Y normaal verdeeldmet

sd(X Y) 2

X 2

Y

2X

n

2Y

m

Statistische uitspraken overonbekende populatiegemiddelden

Page 8: Statistische uitspraken over onbekende populatiegemiddelden l Uitspraken over één populatiegemiddelde l Het vergelijken van twee populatiegemiddelden l.

Het vergelijken van twee populatiegemiddelden

Meestal zijn de populatieparameters niet gekend. Als we mogenveronderstellen dat beide ‘s gelijk zijn, dan is

en kan deze geschat worden door

de toetsting gebeurt door

sd(X Y) 1n

1m

se(X Y) s1n

1m

t X Y

se(X Y)

X Y

s1

n

1

m

Statistische uitspraken overonbekende populatiegemiddelden

Page 9: Statistische uitspraken over onbekende populatiegemiddelden l Uitspraken over één populatiegemiddelde l Het vergelijken van twee populatiegemiddelden l.

Het vergelijken van twee populatiegemiddelden

Het 1-alfa betrouwbaarheidsinterval voor het verschil bedraagt:

(X Y) t s1n

1m

< µX µY < (X Y) t s1n

1m

Statistische uitspraken overonbekende populatiegemiddelden

Page 10: Statistische uitspraken over onbekende populatiegemiddelden l Uitspraken over één populatiegemiddelde l Het vergelijken van twee populatiegemiddelden l.

Het vergelijken van twee populatiegemiddelden

Voorbeeld:

Vergelijking van fosfaatexcretie in twee groepen

Statistische uitspraken overonbekende populatiegemiddelden

Group Statistics

24 115,5000 20,39608 4,16333

9 133,0000 21,00000 7,00000

GROEP,00

1,00

FOSFAATN Mean Std. Deviation

Std. ErrorMean

Independent Samples Test

,005 ,942 -2,178 31 ,037 -17,5000 8,03375 -33,88495 -1,11505

-2,149 14,049 ,050 -17,5000 8,14453 -34,96251 -,03749

Equal variancesassumed

Equal variancesnot assumed

FOSFAATF Sig.

Levene's Test forEquality of Variances

t df Sig. (2-tailed)Mean

DifferenceStd. ErrorDifference Lower Upper

95% ConfidenceInterval of the

Difference

t-test for Equality of Means

Page 11: Statistische uitspraken over onbekende populatiegemiddelden l Uitspraken over één populatiegemiddelde l Het vergelijken van twee populatiegemiddelden l.

Het vergelijken van gepaarde populatiegemiddelden

Statistische uitspraken overonbekende populatiegemiddelden

Typisch voorbeeld:

Is Captopril effectief bij de behandeling van hypertensie?

Studieopzet:15 patiënten met hypertensie worden behandeld.Wat ons interesseert is de systolische blooddruk voor en na de behandeling met CAPTOPRIL

Page 12: Statistische uitspraken over onbekende populatiegemiddelden l Uitspraken over één populatiegemiddelde l Het vergelijken van twee populatiegemiddelden l.

Het vergelijken van gepaarde populatiegemiddelden

Statistische uitspraken overonbekende populatiegemiddelden

Is Captopril effectief bij de behandeling van hypertensie?

Dataset:

patient SBPbef DBPbef SBPafter DBPafter1 210 130 201 1252 169 122 165 1213 187 124 166 1214 160 104 157 1065 167 112 147 1016 176 101 145 857 185 121 168 988 206 124 180 1059 173 115 147 103

10 146 102 136 9811 174 98 151 9012 201 119 168 9813 198 106 179 11014 148 107 129 10315 154 100 131 82

Page 13: Statistische uitspraken over onbekende populatiegemiddelden l Uitspraken over één populatiegemiddelde l Het vergelijken van twee populatiegemiddelden l.

Het vergelijken van gepaarde populatiegemiddelden

Statistische uitspraken overonbekende populatiegemiddelden

Systolische bloeddruk

Blo

ed

dru

k (m

m H

g)

120

140

160

180

200

220

voor na

Grafische voorstelling:

Veel variatie in interceptWeinig variatie in slope

Page 14: Statistische uitspraken over onbekende populatiegemiddelden l Uitspraken over één populatiegemiddelde l Het vergelijken van twee populatiegemiddelden l.

Het vergelijken van gepaarde populatiegemiddelden

Voorbeeld voor-na metingen

Cave metingen sterk gecorreleerd (hoog voor hoog na)Stuk van de variantie in de data niet relevant, m.n. de variantie van deeerste meting

Onderzoeksvraag: wat is het verschil tussen de voor- en na- meting?

H0: er is geen verschil m.a.w. meting voor - meting na = 0

Nota bene: het verschil is de richtingscoëfficiënt van de rechte die de voor- en na- meting verbindt. We zijn niet geïnteresseerd in de verklaring van de variantie van de intercepten van die rechten, wel in de beschrijving van de richtingscoëfficiënt (en van de mate waarin het toeval een rol speelt in de grootte van die coëfficiënt)

Statistische uitspraken overonbekende populatiegemiddelden

Page 15: Statistische uitspraken over onbekende populatiegemiddelden l Uitspraken over één populatiegemiddelde l Het vergelijken van twee populatiegemiddelden l.

Systolische bloeddruk

blo

ed

dru

k (m

mH

g)

120

140

160

180

200

220

voor na

Het vergelijken van gepaarde populatiegemiddelden

Statistische uitspraken overonbekende populatiegemiddelden

Grafische voorstelling:

Veel variatie in interceptVeel variatie in slope

Page 16: Statistische uitspraken over onbekende populatiegemiddelden l Uitspraken over één populatiegemiddelde l Het vergelijken van twee populatiegemiddelden l.

Het vergelijken van gepaarde populatiegemiddelden

Voorbeeld voor-na metingen

Meest eenvoudig voorbeeld van longitudinale data

Testing: Bereken voor elk paar het verschil (nieuwe ‘variabele’)Verschil van twee normaal verdeelde kenmerken is ook normaal verdeeldVoer een één steekproef t-test uit met als test waarde 0…Statistische software: doet alles in één keer (black box)

Statistische uitspraken overonbekende populatiegemiddelden

Paired Samples Statistics

176,93 15 20,565 5,310

158,00 15 20,004 5,165

SBPBEF

SBFAFTER

Pair1

Mean N Std. DeviationStd. Error

Mean

Page 17: Statistische uitspraken over onbekende populatiegemiddelden l Uitspraken over één populatiegemiddelde l Het vergelijken van twee populatiegemiddelden l.

Het vergelijken van gepaarde populatiegemiddelden

Voorbeeld voor-na metingen

Statistische uitspraken overonbekende populatiegemiddelden

Paired Samples Correlations

15 ,901 ,000SBPBEF & SBFAFTERPair 1N Correlation Sig.

Paired Samples Test

18,93 9,027 2,331 13,93 23,93 8,123 14 ,000SBPBEF - SBFAFTERPair 1Mean Std. Deviation

Std. ErrorMean Lower Upper

95% ConfidenceInterval of the

Difference

Paired Differences

t df Sig. (2-tailed)

p=0,00000115

Page 18: Statistische uitspraken over onbekende populatiegemiddelden l Uitspraken over één populatiegemiddelde l Het vergelijken van twee populatiegemiddelden l.

Het vergelijken van gepaarde populatiegemiddelden

Voorbeeld voor-na metingen

Wat zouden de resultaten zijn als we i.p.v. een gepaarde t-test een gewone (niet gepaarde) t-test zouden hebben uitgevoerd?

Statistische uitspraken overonbekende populatiegemiddelden

Page 19: Statistische uitspraken over onbekende populatiegemiddelden l Uitspraken over één populatiegemiddelde l Het vergelijken van twee populatiegemiddelden l.

Het vergelijken van gepaarde populatiegemiddelden

Voorbeeld voor-na metingen

Statistische uitspraken overonbekende populatiegemiddelden

GROUP

2,22,01,81,61,41,21,0,8

SB

PB

EF

220

200

180

160

140

120

Group Statistics

15 176,93 20,565 5,310

15 158,00 20,004 5,165

GROUP1

2

SBPBEFN Mean Std. Deviation

Std. ErrorMean

t-test: variatie van beide metingen van belang

nn

YX

YXse

YXt

YX

22)(

Page 20: Statistische uitspraken over onbekende populatiegemiddelden l Uitspraken over één populatiegemiddelde l Het vergelijken van twee populatiegemiddelden l.

Het vergelijken van gepaarde populatiegemiddelden

Voorbeeld voor-na metingen

Statistische uitspraken overonbekende populatiegemiddelden

Independent Samples Test

,021 ,886 2,556 28 ,016 18,93 7,408 3,760 34,107

2,556 27,979 ,016 18,93 7,408 3,759 34,107

Equal variancesassumed

Equal variancesnot assumed

SBPBEFF Sig.

Levene's Test forEquality of Variances

t df Sig. (2-tailed)Mean

DifferenceStd. ErrorDifference Lower Upper

95% ConfidenceInterval of the

Difference

t-test for Equality of Means

p=0,016

Page 21: Statistische uitspraken over onbekende populatiegemiddelden l Uitspraken over één populatiegemiddelde l Het vergelijken van twee populatiegemiddelden l.

Niet-parametrische toetsen

Tot zover: uitgangspunt normaal verdeelde populatiekenmerken

Cave: Deze aanname is net altijd gewettigd

Hoe de gewettigdheid bepalen ?

Hetzij uit eigen data

Hetzij uit eerder onderzoek of uit literatuur

Indien niet gewettigd:

NIET-PARAMETRISCHE METHODEN

Statistische uitspraken overonbekende populatiegemiddelden

Page 22: Statistische uitspraken over onbekende populatiegemiddelden l Uitspraken over één populatiegemiddelde l Het vergelijken van twee populatiegemiddelden l.

Niet-parametrische toetsen

Statistische uitspraken overonbekende populatiegemiddelden

Parametrische methoden en hun niet-parametrische alternatieven

parametrische methode niet-parametrische methode

t-toets voor twee steekproeven Wilcoxon’s twee-steekproeventoetsMann-Whitney

t-toets voor gepaardewaarnemingen

Wilcoxon’s rangtekentoets

Page 23: Statistische uitspraken over onbekende populatiegemiddelden l Uitspraken over één populatiegemiddelde l Het vergelijken van twee populatiegemiddelden l.

Niet-parametrische toetsen

Statistische uitspraken overonbekende populatiegemiddelden

Ranks

24 14,94 358,50

9 22,50 202,50

33

GROEP,00

1,00

Total

FOSFAATN Mean Rank Sum of Ranks

Test Statisticsb

58,500

358,500

-2,001

,045

,044a

Mann-Whitney U

Wilcoxon W

Z

Asymp. Sig. (2-tailed)

Exact Sig. [2*(1-tailedSig.)]

FOSFAAT

Not corrected for ties.a.

Grouping Variable: GROEPb.

t-test: p = 0,037

fosfaat studie

Page 24: Statistische uitspraken over onbekende populatiegemiddelden l Uitspraken over één populatiegemiddelde l Het vergelijken van twee populatiegemiddelden l.

Niet-parametrische toetsen

Statistische uitspraken overonbekende populatiegemiddelden

t-test: p = 0,00000115

Ranks

15a 8,00 120,00

0b ,00 ,00

0c

15

Negative Ranks

Positive Ranks

Ties

Total

SBFAFTER - SBPBEFN Mean Rank Sum of Ranks

SBFAFTER < SBPBEFa.

SBFAFTER > SBPBEFb.

SBPBEF = SBFAFTERc. Test Statisticsb

-3,410a

,001

Z

Asymp. Sig. (2-tailed)

SBFAFTER -SBPBEF

Based on positive ranks.a.

Wilcoxon Signed Ranks Testb.

Captopril studie

Page 25: Statistische uitspraken over onbekende populatiegemiddelden l Uitspraken over één populatiegemiddelde l Het vergelijken van twee populatiegemiddelden l.

Voorbeelden

Statistische uitspraken overonbekende populatiegemiddelden

ExpectedNormal

COUNT

Shapiro-Wilk W=,97032, p<,1493

Upper Boundaries (x <= boundary)

No

of

ob

s

0

5

10

15

20

25

30

35

40

45

-100 0 100 200 300 400 500 600

Page 26: Statistische uitspraken over onbekende populatiegemiddelden l Uitspraken over één populatiegemiddelde l Het vergelijken van twee populatiegemiddelden l.

Voorbeelden

Statistische uitspraken overonbekende populatiegemiddelden

STAT. Grouping: SARCOMA (sarc.sta) BASIC Group 1: G_1:0 STATS Group 2: G_2:1 Mean Mean Valid N Valid N Std.Dev. Variable G_1:0 G_2:1 t-value df p G_1:0 G_2:1 G_1:0 COUNT 239,0385 279,1781 -1,62382 97 ,107660 26 73 135,0432

STAT. Grouping: SARCOMA (sarc.sta)

±1.96*Std. Err.

±1.00*Std. Err.

Mean

Box & Whisker Plot: COUNT

SARCOMA

CO

UN

T

160

180

200

220

240

260

280

300

320

0 1

Page 27: Statistische uitspraken over onbekende populatiegemiddelden l Uitspraken over één populatiegemiddelde l Het vergelijken van twee populatiegemiddelden l.

Voorbeelden

Statistische uitspraken overonbekende populatiegemiddelden

ExpectedNormal

DIAM

Shapiro-Wilk W=,94295, p<,0005

Upper Boundaries (x <= boundary)

No

of

ob

s

0

5

10

15

20

25

30

5,0 5,5 6,0 6,5 7,0 7,5 8,0 8,5 9,0 9,5

Page 28: Statistische uitspraken over onbekende populatiegemiddelden l Uitspraken over één populatiegemiddelde l Het vergelijken van twee populatiegemiddelden l.

Voorbeelden

Statistische uitspraken overonbekende populatiegemiddelden

STAT. Mann-Whitney U Test (sarc.sta) NONPAR By variable SARCOMA STATS Group 1: 0 Group 2: 1 Rank Sum Rank Sum Z variable Group 1 Group 2 U Z p-level adjusted p-level DIAM 919,0000 4031,000 568,0000 -3,02948 ,002452 -3,03011 ,002447

STAT. Mann-Whitney U Test (sarc.sta)

t-test: p = ,004596t-test: p = ,004596

±1.96*Std. Err.

±1.00*Std. Err.

Mean

Box & Whisker Plot: DIAM

SARCOMA

DIA

M

6,3

6,5

6,7

6,9

7,1

7,3

7,5

0 1