introductie one-sample -toets dependent-samples ... · 1 t-verdeling is afhankelijk van het aantal...

18
introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte toetsende statistiek week 1: kansen en random variabelen week 2: de steekproevenverdeling week 3: schatten en toetsen: de z-toets week 4: het toetsen van gemiddelden: de t-toets Moore, McCabe, and Craig. Introduction to the Practice of Statistics Chapter 7: Inference for Distributions 7.1: Inference for the Mean of a Population 7.2: Comparing Two Means week 5: het toetsen van varianties: de F-toets week 6: het toetsen van tellingen: de χ 2 -toets week 7: verdelingsvrije toetsen Frank Busing, Universiteit Leiden 1 / 36 introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte deze week: wat hebben we al geleerd? de one-sample z-toets verschillende alternatieve hypothese vormen: 1- (links of rechts) en 2-zijdig de relatie tussen toetsstatistiek en steekproevenverdeling van een statistiek de criterium waarde voor α (α = 0.05) de relatie tussen z en p tegenover z * en α kennis en begrip van het betrouwbaarheidsinterval de relatie tussen betrouwbaarheidsinterval en 2-zijdig toetsen 2 / 36

Transcript of introductie one-sample -toets dependent-samples ... · 1 t-verdeling is afhankelijk van het aantal...

Page 1: introductie one-sample -toets dependent-samples ... · 1 t-verdeling is afhankelijk van het aantal vrijheidsgraden ( df ) 2 door de dikkere staart (bij kleine df ) is de t-toets convervatiever

introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte

toetsende statistiek

week 1: kansen en random variabelenweek 2: de steekproevenverdelingweek 3: schatten en toetsen: de z-toets

week 4: het toetsen van gemiddelden: de t-toets

Moore, McCabe, and Craig. Introduction to the Practice of Statistics

Chapter 7: Inference for Distributions

7.1: Inference for the Mean of a Population

7.2: Comparing Two Means

week 5: het toetsen van varianties: de F-toetsweek 6: het toetsen van tellingen: de χ2-toetsweek 7: verdelingsvrije toetsen

Frank Busing, Universiteit Leiden1 / 36

introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte

deze week: wat hebben we al geleerd?

de one-sample z-toets

verschillende alternatieve hypothese vormen: 1- (links of rechts) en 2-zijdig

de relatie tussen toetsstatistiek en steekproevenverdeling van een statistiek

de criterium waarde voor α (α = 0.05)

de relatie tussen z en p tegenover z∗ en α

kennis en begrip van het betrouwbaarheidsinterval

de relatie tussen betrouwbaarheidsinterval en 2-zijdig toetsen

2 / 36

Page 2: introductie one-sample -toets dependent-samples ... · 1 t-verdeling is afhankelijk van het aantal vrijheidsgraden ( df ) 2 door de dikkere staart (bij kleine df ) is de t-toets convervatiever

introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte

toetsen van gemiddelde

een tekortkoming van de z-test isdat we de standaarddeviatie van de populatie σ moeten wetenom de standaarddeviatie van de steekproevenverdeling σ/

√n uit te rekenen

echter, in de praktijk is σ meestal onbekend

we kunnen dus geen z =x− µ

σ/√n

uitrekenen, maar wel t =x− µ

s/√n

we schatten de standaarddeviatie van de populatie σ

met de standaarddeviatie van de steekproef sduswe schatten de standaarddeviatie van de steekproevenverdeling van x, σ/

√n

met de standaardfout voor het gemiddelde van de steekproef1

SEx =s√n

de standaardfout wordt doorgaans aangeduid met SE, afkorting voor standard error

3 / 36

introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte

t-verdeling familie

het schatten van de standaarddeviatie van x met de standaardfout SEx = s/√n

gaat beter voor een grotere n (denk aan de wet van de grote getallen)

naarmate n groter wordt, wordt s een betrouwbaardere schatter van σ

tot die tijd gebruiken we een andere steekproevenverdeling van x: de t-verdeling

de t-verdeling is eigenlijk een hele familie van verdelingenelke lid van de familie wordt aangeduid met zijn vrijheidsgraden: df2

voor elke aantal vrijheidsgraden is er een aparte t-verdelinghet aantal vrijheidsgraden hangt af van steekproefgrootte n

df = degrees of freedom4 / 36

Page 3: introductie one-sample -toets dependent-samples ... · 1 t-verdeling is afhankelijk van het aantal vrijheidsgraden ( df ) 2 door de dikkere staart (bij kleine df ) is de t-toets convervatiever

introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte

t-verdeling versus standaard normaal

1 t-verdeling is afhankelijk van het aantal vrijheidsgraden (df)2 door de dikkere staart (bij kleine df) is de t-toets convervatiever3 als df → ∞ dan t(df) → N(0, 1)

5 / 36

introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte

t-tabel

Probability p

t*

Table entry for p and C is

the critical value t* with

probability p lying to its

right and probability C lying

between − t* and t* .

T A B L E D

t distribution critical values

Upper-tail probability p

df .25 .20 .15 .10 .05 .025 .02 .01 .005 .0025 .001 .0005

1 1.000 1.376 1.963 3.078 6.314 12.71 15.89 31.82 63.66 127.3 318.3 636.6

2 0.816 1.061 1.386 1.886 2.920 4.303 4.849 6.965 9.925 14.09 22.33 31.60

3 0.765 0.978 1.250 1.638 2.353 3.182 3.482 4.541 5.841 7.453 10.21 12.92

4 0.741 0.941 1.190 1.533 2.132 2.776 2.999 3.747 4.604 5.598 7.173 8.610

5 0.727 0.920 1.156 1.476 2.015 2.571 2.757 3.365 4.032 4.773 5.893 6.8696 0.718 0.906 1.134 1.440 1.943 2.447 2.612 3.143 3.707 4.317 5.208 5.9597 0.711 0.896 1.119 1.415 1.895 2.365 2.517 2.998 3.499 4.029 4.785 5.408

6 / 36

Page 4: introductie one-sample -toets dependent-samples ... · 1 t-verdeling is afhankelijk van het aantal vrijheidsgraden ( df ) 2 door de dikkere staart (bij kleine df ) is de t-toets convervatiever

introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte

t-tabel

T A B L E D

t distribution critical values

Upper-tail probability p

df .25 .20 .15 .10 .05 .025 .02 .01 .005 .0025 .001 .0005

1 1.000 1.376 1.963 3.078 6.314 12.71 15.89 31.82 63.66 127.3 318.3 636.6

2 0.816 1.061 1.386 1.886 2.920 4.303 4.849 6.965 9.925 14.09 22.33 31.60

3 0.765 0.978 1.250 1.638 2.353 3.182 3.482 4.541 5.841 7.453 10.21 12.92

4 0.741 0.941 1.190 1.533 2.132 2.776 2.999 3.747 4.604 5.598 7.173 8.610

5 0.727 0.920 1.156 1.476 2.015 2.571 2.757 3.365 4.032 4.773 5.893 6.8696 0.718 0.906 1.134 1.440 1.943 2.447 2.612 3.143 3.707 4.317 5.208 5.9597 0.711 0.896 1.119 1.415 1.895 2.365 2.517 2.998 3.499 4.029 4.785 5.408

28 0.683 0.855 1.056 1.313 1.701 2.048 2.154 2.467 2.763 3.047 3.408 3.67429 0.683 0.854 1.055 1.311 1.699 2.045 2.150 2.462 2.756 3.038 3.396 3.65930 0.683 0.854 1.055 1.310 1.697 2.042 2.147 2.457 2.750 3.030 3.385 3.646

40 0.681 0.851 1.050 1.303 1.684 2.021 2.123 2.423 2.704 2.971 3.307 3.551

50 0.679 0.849 1.047 1.299 1.676 2.009 2.109 2.403 2.678 2.937 3.261 3.496

60 0.679 0.848 1.045 1.296 1.671 2.000 2.099 2.390 2.660 2.915 3.232 3.460

80 0.678 0.846 1.043 1.292 1.664 1.990 2.088 2.374 2.639 2.887 3.195 3.416

100 0.677 0.845 1.042 1.290 1.660 1.984 2.081 2.364 2.626 2.871 3.174 3.390

1000 0.675 0.842 1.037 1.282 1.646 1.962 2.056 2.330 2.581 2.813 3.098 3.300

z* 0.674 0.841 1.036 1.282 1.645 1.960 2.054 2.326 2.576 2.807 3.091 3.291

50% 60% 70% 80% 90% 95% 96% 98% 99% 99.5% 99.8% 99.9%

Confidence level C

7 / 36

introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte

de one-sample t-toets

het toetsen van een gemiddelde met de t-toets

andere steekproefgegevens: n = 10, x = 9.45 en s = 0.6996

stappenplan one-sample t-toets:

1 hypothese H0 : µ = 9 en Ha : µ 6= 92 steekproevenverdeling t verdeeld met df = n− 1 = 10− 1 = 93 toetsingsgrootheid t = (x− µ)/(s/

√n) = (9.45− 9)/0.2212 = 2.034

4 verwerpingsgebied α = 0.05,df = 9, t∗ = 2.262 (kolom α = 0.025)5 statistische conclusie t = 2.034 < 2.262 = t∗ en H0 wordt niet verworpen6 inhoudelijke conclusie eekhoorns verzamelen evenveel voedsel na onthouding

merk op dat deze tweezijdige toetsing H0 niet verwerptmaar dat een eenzijdige toetsing dat wel gedaan zou hebbenwant t∗ = 1.833 voor α = 0.05 en t = 2.034 ligt verder van nul

8 / 36

Page 5: introductie one-sample -toets dependent-samples ... · 1 t-verdeling is afhankelijk van het aantal vrijheidsgraden ( df ) 2 door de dikkere staart (bij kleine df ) is de t-toets convervatiever

introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte

SPSS: one-sample t-test results

One-Sample Statistics

N Mean Std. Deviation

Std. Error

Mean

grams 10 9.450 .6996 .2212

One-Sample Test

Test Value = 9

t df Sig. (2-tailed)

Mean

Difference

95% Confidence Interval

of the Difference

Lower Upper

grams 2.034 9 .072 .4500 -.050 .950

(9.450-9)/0.2212

0.6996/√10

“Gemiddeld genomen verzamelen uitgehongerde eekhoorns (M=9.45, SE=.2212)niet meer of minder dan 9 gram voedsel, t(9) = 2.034,p = .072.”

9 / 36

introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte

conclusie one-sample t-toets

de one-sample t-toets is gelijk aan de one-sample z-toets

behalve dat de standaarddeviatie van de populatie σ

geschat wordt met de standaarddeviatie van de steekproef sen de standaarddeviatie van de steekproevenverdeling van x met SEx = s/

√n

en dat daardoor de standaard normaal verdeling N(0, 1)vervangen wordt door de t-verdeling t(df)

10 / 36

Page 6: introductie one-sample -toets dependent-samples ... · 1 t-verdeling is afhankelijk van het aantal vrijheidsgraden ( df ) 2 door de dikkere staart (bij kleine df ) is de t-toets convervatiever

introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte

voorbeeld

– we verzamelen 12 proefpersonen met extreme angst voor spinnen– elke proefpersoon krijgt een echte spin te zien en dezelfde spin op een foto– we meten de angst van de proefpersoon na elke spin (twee momenten)– de onderzoeker verwacht meer angst voor de echte spin dan voor de foto ervan3

uit: William Wallace Denslow (1902). Denslow’s Mother Goose.11 / 36

introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte

verschilscores

twee afhankelijke observaties kunnen worden verkregen

1 per paar, gepaard op bepaalde eigenschappenbijvoorbeeld: medicijn met controle op sexe en leeftijd

2 per persoon, gemeten op verschillende momentenbijvoorbeeld: vooruitgang studenten bij toetsende statistiek

in het spinnen-angst-voorbeeld zijn twee gepaarde observaties:de foto- en de echte spinnenangst van een en dezelfde proefpersoon

het verschil tussen de twee metingen wordt getoetst

er wordt dus eerst een verschilscore bepaald: di = xi1 − xi2 (echt - foto)vervolgens wordt er een one-sample t-toets uitgevoerd op de verschilscores d

de µ onder H0 is (meestal) nul, dus H0 : µ = µ1 − µ2 = 0 ofwel H0 : µ1 = µ2

12 / 36

Page 7: introductie one-sample -toets dependent-samples ... · 1 t-verdeling is afhankelijk van het aantal vrijheidsgraden ( df ) 2 door de dikkere staart (bij kleine df ) is de t-toets convervatiever

introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte

de t-toets voor afhankelijke steekproeven

het toetsen van twee gemiddelden uit twee afhankelijk steekproeven

steekproefgegevens: n = 12, d = 7.0 en s = 9.807

stappenplan paired-samples t-toets:4

1 hypothese H0 : µ = 0 en Ha : µ > 02 steekproevenverdeling t verdeeld met df = n− 1 = 11

3 toetsingsgrootheid t = d/(s/√n) = 7.0/(9.807/3.464) = 2.473

4 verwerpingsgebied α = 0.05,df = 11, t∗ = 2.2015 statistische conclusie t = 2.473 > 2.201 = t∗ en H0 wordt verworpen6 inhoudelijke conclusie er is een verschil:

een echte spin geeft meer angst dan een foto ervan

paired-samples t-toets = dependent-samples t-toets13 / 36

introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte

SPSS: one-sample t-test results

One-Sample Statistics

N Mean Std. Deviation

Std. Error

Mean

diff 12 7.0000 9.80723 2.83110

One-Sample Test

Test Value = 0

t df

Sig. (2-

tailed)

Mean

Difference

95% Confidence

Interval of the

Difference

Lower Upper

diff 2.47 11 .031 7.00000 .7688 13.2312

9.80723/√12

(7.0000-0)/2.83110

merk op dat SPSS de p-waarde geeft voor tweezijdige toetsing: Sig. (2-tailed)voor eenzijdige toetsing deel je deze waarde door 2: 0.031/2 = 0.015

14 / 36

Page 8: introductie one-sample -toets dependent-samples ... · 1 t-verdeling is afhankelijk van het aantal vrijheidsgraden ( df ) 2 door de dikkere staart (bij kleine df ) is de t-toets convervatiever

introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte

SPSS: paired-samples t-test results

Paired Samples Statistics

Mean N Std. Deviation

Std. Error

Mean

Pair 1 real

picture

47.00 12 11.02889 3.18377

40.00 12 9.293 2.683

Paired Samples Test

Paired Differences

t df

Sig. (2-

tailed)Mean

Std.

Deviation

Std.

Error

Mean

95% Confidence

Interval of the

Difference

Lower Upper

Pair 1 real - picture 7.00000 9.80723 2.83110 .76878 13.23 2.473 11 .031

(47.00-40.00)/2.831109.80723/√12

“Gemiddeld genomen ervaren proefpersonen significant meer angstvoor echte spinnen (M = 47.00, SE = 3.18)dan voor foto’s van spinnen (M = 40.00, SE = 2.68), t(11) = 2.473,p = .015.”

15 / 36

introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte

twee onafhankelijke steekproeven

twee situaties waarin twee onafhankelijke steekproeven ontstaan:

1 vanuit 1 populatie (bijvoorbeeld de studenten populatie):

verzamel een aantal proefpersonen

verdeel de proefpersonen at random over twee groepen

geef elke groep zijn eigen interventiemeet het gemiddelde voor elke groep

toets het verschil in gemiddelden

2 vanuit 2 populaties (bijvoorbeeld een mannen en vrouwen populatie):

trek twee random steekproeven, een uit elke populatie

meet het gemiddelde voor elke groep

toets het verschil in gemiddelden

16 / 36

Page 9: introductie one-sample -toets dependent-samples ... · 1 t-verdeling is afhankelijk van het aantal vrijheidsgraden ( df ) 2 door de dikkere staart (bij kleine df ) is de t-toets convervatiever

introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte

two-samples t-toets

de toetsstatistiek voor 2 onafhankelijke steekproeven is

t-toetsstatistiek

t =x1 − x2 − (µ1 − µ2)

standaardfout

het verschil tussen de steekproefgemiddelden x1 − x2wordt vergeleken methet te verwachten verschil tussen de populatiegemiddelden µ1 − µ2 onder H0

de nul hypothese is meestal H0 : µ1 = µ2, zodat (µ1 − µ2) wegvalt

de standaardfout is een verhaal apart

17 / 36

introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte

standaardfout indien σ1 6= σ2

als σ1 en σ2 niet ongeveer gelijk zijn(vuistregel: σ1 6= σ2 als s1 en s2 meer dan factor 2 van elkaar verschillen)dan is de standaardfout van de steekproevenverdeling van x1 − x2

standaardfout indien σ1 6= σ2

SEx1−x2=

s21n1

+s22n2

begrip: de variantie van het verschil

1 tussen 2 observaties is σ21 plus σ2

2

2 tussen de som van n1 plus n2 observaties is n1σ21 plus n2σ

22

3 tussen de gemiddelden is dan σ21/n1 plus σ2

2/n2

het aantal vrijheidsgraden is hier (conservatief) df = min(n1 − 1,n2 − 1)dus de kleinste waarde van n1 − 1 en n2 − 16

SPSS berekent het aantal vrijheidsgraden iets nauwkeuriger (zie MM&C, p.441)18 / 36

Page 10: introductie one-sample -toets dependent-samples ... · 1 t-verdeling is afhankelijk van het aantal vrijheidsgraden ( df ) 2 door de dikkere staart (bij kleine df ) is de t-toets convervatiever

introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte

standaardfout indien σ1 = σ2

als σ1 en σ2 gelijk zijn dan is de t-verdeling exacter is dan een gecombineerde schatter (pooled estimator) voor de variantie

pooled variance estimator

s2p =(n1 − 1)s21 + (n2 − 1)s22

n1 + n2 − 2

de standaardfout van de steekproevenverdeling van x1 − x2 is nu

standaardfout indien σ1 = σ2

SEx1−x2=

s2p

n1+

s2p

n2= sp

1

n1+

1

n2

het aantal vrijheidsgraden is hier df = n1 + n2 − 2

19 / 36

introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte

de t-toets voor onafhankelijke steekproeven

het toetsen van twee gemiddelden uit twee onafhankelijk steekproeven

steekproefgegevens:n1 = 12, x1 = 47, s1 = 11.029n2 = 12, x2 = 40, s2 = 9.293

aanname σ1 6= σ2 geeft

SEx1−x2=

11.0292/12+ 9.2932/12 = 4.163

stappenplan independent-samples t-toets voor σ1 6= σ2:

1 hypothese H0 : µ1 = µ2 en Ha : µ1 > µ2

2 steekproevenverdeling t verdeeld met df = 12− 1 = 113 toetsingsgrootheid t = (x1 − x2)/SE = (47− 40)/4.163 = 1.6814 verwerpingsgebied α = 0.05,df = 11, t∗ = 1.7965 statistische conclusie t = 1.681 < 1.796 = t∗ en H0 wordt niet verworpen6 inhoudelijke conclusie geen verschil tussen echte en foto spinnenangst

20 / 36

Page 11: introductie one-sample -toets dependent-samples ... · 1 t-verdeling is afhankelijk van het aantal vrijheidsgraden ( df ) 2 door de dikkere staart (bij kleine df ) is de t-toets convervatiever

introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte

de t-toets voor onafhankelijke steekproeven

het toetsen van twee gemiddelden uit twee onafhankelijk steekproeven

steekproefgegevens:n1 = 12, x1 = 47, s1 = 11.029n2 = 12, x2 = 40, s2 = 9.293

aanname σ1 = σ2 geeft

s2p = (11× 11.0292 + 11× 9.2932)/22 = 104

SEx1−x2=

√104

1/12+ 1/12 = 4.163

stappenplan independent-samples t-toets voor σ1 = σ2:

1 hypothese H0 : µ1 = µ2 en Ha : µ1 > µ2

2 steekproevenverdeling t verdeeld met df = 12+ 12− 2 = 223 toetsingsgrootheid t = (x1 − x2)/SE = (47− 40)/4.163 = 1.6814 verwerpingsgebied α = 0.05,df = 22, t∗ = 1.7175 statistische conclusie t = 1.681 < 1.717 = t∗ en H0 wordt niet verworpen6 inhoudelijke conclusie geen verschil tussen echte en foto spinnenangst

21 / 36

introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte

SPSS: independent-samples t-test results

Group Statistics

group N Mean Std. Deviation

Std. Error

Mean

anxiety real

picture

12 47.00 11.029 3.184

12 40.00 9.293 2.683

Independent Samples Test

Levene's Test

for Equality of

Variances t-test for Equality of Means

F Sig. t df

Sig. (2-

tailed)

Mean

Difference

Std. Error

Difference

95% Confidence

Interval of the

Difference

Lower Upper

anxiety Equal variances

assumed

Equal variances

not assumed

.782 .386 1.681 22 .107 7.000 4.163 -1.634 15.634

1.681 21.39 .107 7.000 4.163 -1.649 15.649

(47.00-40.00)/4.163

√(11.0292/12+9.293

2/12)

“Gemiddeld genomen ervaren proefpersonen meer angst voor echte spinnen(M = 47.00, SE = 3.18) dan voor foto’s van spinnen (M = 40.00, SE = 2.68).Dit verschil was niet significant t(22) = 1.681,p = .0535.”

22 / 36

Page 12: introductie one-sample -toets dependent-samples ... · 1 t-verdeling is afhankelijk van het aantal vrijheidsgraden ( df ) 2 door de dikkere staart (bij kleine df ) is de t-toets convervatiever

introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte

between- versus within-subject designs

kies voor within-subjects designs (dependent samples of paired-samples)

1 de individuele variabiliteit is verwijderd uit de standaardfout (kleinere s)dus meer power

2 er zijn minder proefpersonen nodig (maar wel wat langer)

kies voor between-subjects designs (independent samples)

1 geen order effects (geen counterbalancing nodig)

2 geen carry-over effect (geen tussentijd nodig)

23 / 36

introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte

afhankelijke versus onafhankelijke t-toets

vergelijking van de twee two-samples t-toetsen op dezelfde gegevens

afhankelijke steekproef (paired-samples t-toets)1 hypothese H0 : µ = 0 en Ha : µ > 02 steekproevenverdeling t verdeeld met df = n− 1 = 11

3 toetsingsgrootheid t = d/(s/√n) = 7.0/2.831 = 2.473

4 verwerpingsgebied α = 0.05,df = 11, t∗ = 2.2015 statistische conclusie t = 2.473 > 2.201 = t∗ en H0 wordt wel verworpen6 inhoudelijke conclusie wel verschil tussen echte en foto spinnenangst

onafhankelijke steekproef (independent samples t-toets)1 hypothese H0 : µ1 = µ2 en Ha : µ1 > µ2

2 steekproevenverdeling t verdeeld met df = 12+ 12− 2 = 223 toetsingsgrootheid t = (x1 − x2)/SE = 7.0/4.163 = 1.6814 verwerpingsgebied α = 0.05,df = 22, t∗ = 1.7175 statistische conclusie t = 1.681 < 1.717 = t∗ en H0 wordt niet verworpen6 inhoudelijke conclusie geen verschil tussen echte en foto spinnenangst

een dependent-samples t-toets heeft meer power door een kleinere standaardfout

24 / 36

Page 13: introductie one-sample -toets dependent-samples ... · 1 t-verdeling is afhankelijk van het aantal vrijheidsgraden ( df ) 2 door de dikkere staart (bij kleine df ) is de t-toets convervatiever

introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte

samenvatting: de t-toets

1 one-sample t-toets: t = (x− µ)/(s/√n)

2 two-samples t-toets:

1 dependent samples t-toets: t = d/(s/√n), waarbij d = x1 − x2

2 independent samples t-toets:

1 unequal variances: t = (x1 − x2)/√

s21/n1 + s22/n2

2 equal variances: t = (x1 − x2)/√

s2p/n1 + s2p/n2

25 / 36

introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte

vorige week

een betrouwbaarheidsinterval zegt iets over de nauwkeurigheid van een schatting

we schatten het populatiegemiddelde met het steekproefgemiddelde

(natuurlijk) is deze schatting niet altijd precies goed, maar beter wanneer

de spreiding in de populatie kleiner is

de steekproef groter is

het betrouwbaarheidsniveau wordt aangegeven met C

een betrouwbaarheidsniveau van C = 0.95 geeft 95% zekerheiddat het gemiddelde van de populatie in het interval ligt

een betrouwbaarheidsniveau van C = 0.50 geeft 50% zekerheiddat het gemiddelde van de populatie in het interval ligt:dit zal een veel kleiner interval zijn

bij herhaald steekproef trekken ligt µ in 100C% van de gevallen in het intervalwe zijn bij een interval dus 100C% zeker dat µ in het interval ligt

26 / 36

Page 14: introductie one-sample -toets dependent-samples ... · 1 t-verdeling is afhankelijk van het aantal vrijheidsgraden ( df ) 2 door de dikkere staart (bij kleine df ) is de t-toets convervatiever

introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte

one-sample betrouwbaarheidsinterval voor µ

betrouwbaarheidinterval indien σ bekend

betrouwbaarheidsinterval = puntschatting ± foutenmarge = x± z∗σ/√n

x is het gemiddelde van de steekproef, de schatting van µ

z∗ wordt bepaald door het betrouwbaarheidsniveau C

σ/√n is de spreiding van de steekproevenverdeling

echter, in de praktijk is σ meestal onbekendwe schatten de standaarddeviatie van de populatie σ

met de standaarddeviatie van de steekproef s

betrouwbaarheidinterval indien σ onbekend

betrouwbaarheidsinterval = puntschatting ± foutenmarge = x± t∗s/√n

er zijn nu een aantal varianten mogelijk . . .

27 / 36

introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte

overzicht betrouwbaarheidsintervallen

betrouwbaarheidsinterval = puntschatting ± foutenmarge

puntschattingone sample x

two samples x1 − x2

“betrouwbaarheidsniveau”one sample two samples

σ1 6= σ2 σ1 = σ2

σ bekend z∗ z∗ z∗

σ onbekend t∗(n− 1) t∗(min(n1 − 1,n2 − 1)) t∗(n1 + n2 − 2)

standaardfoutone sample two samples

σ1 6= σ2 σ1 = σ2

σ bekend σ/√n

σ21/n1 + σ2

2/n2

σ21/n1 + σ2

2/n2

σ onbekend s/√n

s21/n1 + s22/n2

s2p/n1 + s2p/n2

waarbij s2p =[

(n1 − 1)s21 + (n2 − 1)s22]

/(n1 + n2 − 2)

28 / 36

Page 15: introductie one-sample -toets dependent-samples ... · 1 t-verdeling is afhankelijk van het aantal vrijheidsgraden ( df ) 2 door de dikkere staart (bij kleine df ) is de t-toets convervatiever

introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte

voorbeeld

wat is het 95% betrouwbaarheidsinterval voor µvan onze nieuwe uitgehongerde eekhoorns?

steekproefgegevens: n = 10, x = 9.45 en s = 0.6996

1 er is slechts een steekproef

2 σ is niet bekend

3 betrouwbaarheidsniveau C = 0.95 → t∗ = 2.262 (α/2 = 0.025, df = 9)

CIµ = x± t∗ × s√n

= 9.45± 2.262× 0.6996√10

= 9.45± 0.5004

het 95% betrouwbaarheidsinterval voor µ is [8.95, 9.95]

29 / 36

introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte

SPSS: voorbeeld

het 95% betrouwbaarheidsinterval voor µ is [8.95, 9.95]

CIµ = x± t∗ × s√n

= 9.45± 2.262× 0.6996√10

= 9.45± 0.5004

SPSS bepaalt in deze gevallen het betrouwbaarheidsinterval voor µ min testwaarde

CIµ−9.0 = (x− 9.0)± t∗ × s√n

= (9.45− 9.0)± 2.262× 0.6996√10

= 0.45± 0.5004

het 95% betrouwbaarheidsinterval voor µ− 9.0 is [−0.05, 0.95]

30 / 36

Page 16: introductie one-sample -toets dependent-samples ... · 1 t-verdeling is afhankelijk van het aantal vrijheidsgraden ( df ) 2 door de dikkere staart (bij kleine df ) is de t-toets convervatiever

introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte

SPSS: one-sample CI results

CIµ−9.0 = (9.45−9.0)±2.262×0.2212 = 0.45±0.5004 → [−0.05, 0.95]

One-Sample Statistics

N Mean Std. Deviation

Std. Error

Mean

grams 10 9.450 .6996 .2212

One-Sample Test

Test Value = 9

t df Sig. (2-tailed)

Mean

Difference

95% Confidence Interval

of the Difference

Lower Upper

grams 2.034 9 .072 .4500 -.050 .950

9.45-9.0 0.45 + 2.262 x 0.2212

31 / 36

introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte

voorbeeld

wat is het 95% betrouwbaarheidsinterval voor µ1 − µ2

van de foto- en echte angst voor spinnen?

steekproefgegevens:n1 = 12, x1 = 47, s1 = 11.029n2 = 12, x2 = 40, s2 = 9.293

1 er zijn twee steekproeven

2 σ is niet bekend

3 s1 ≈ s2 → s2p =[

(n1 − 1)s21 + (n2 − 1)s22]

/(n1 + n2 − 2) = 103.999

4 betrouwbaarheidsniveau C = 0.95 → t∗ = 2.074 (α/2 = 0.025, df = 22)

CIµ1−µ2= (x1 − x2)± t∗ ×

s2p/n1 + s2p/n2

= (47− 40)± 2.074×√

103.999/12+ 103.999/12 = 7± 8.634

het 95% betrouwbaarheidsinterval voor µ1 − µ2 is [−1.634, 15.634]

32 / 36

Page 17: introductie one-sample -toets dependent-samples ... · 1 t-verdeling is afhankelijk van het aantal vrijheidsgraden ( df ) 2 door de dikkere staart (bij kleine df ) is de t-toets convervatiever

introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte

SPSS: independent-samples CI results

CIµ1−µ2= (47− 40)± 2.074× 4.163 = 7± 8.634 → [−1.634, 15.634]

Group Statistics

group N Mean Std. Deviation

Std. Error

Mean

anxiety real

picture

12 47.00 11.029 3.184

12 40.00 9.293 2.683

Independent Samples Test

Levene's Test

for Equality of

Variances t-test for Equality of Means

F Sig. t df

Sig. (2-

tailed)

Mean

Difference

Std. Error

Difference

95% Confidence

Interval of the

Difference

Lower Upper

anxiety Equal variances

assumed

Equal variances

not assumed

.782 .386 1.681 22 .107 7.000 4.163 -1.634 15.634

1.681 21.39 .107 7.000 4.163 -1.649 15.649

47.00-40.00

7.000-2.074 x 4.163

nul ligt in het interval. wat betekent dat?

33 / 36

introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte

aannamen

we schatten de standaarddeviatie van x met de standaardfout SEx = s/√n

naarmate n groter wordt, wordt s een betere schatter van σ (ongeacht verdeling)

maar hoe groot is groot genoeg?

1 de steekproef komt uit een populatie met een normale verdeling

t is t∗-verdeeld met df = n− 1

bij gelijke n is 2 keer 5 observaties al voldoende

2 de steekproef komt uit een populatie zonder normale verdeling

n < 15: probleemn > 15: symmetrisch en geen uitbijters: t bij benadering t∗-verdeeldn > 40: t bij benadering t∗-verdeeldn groot: t bij benadering normaal verdeeld

conclusie: controleer n en de verdeling van de (verschil)scores (per groep)

34 / 36

Page 18: introductie one-sample -toets dependent-samples ... · 1 t-verdeling is afhankelijk van het aantal vrijheidsgraden ( df ) 2 door de dikkere staart (bij kleine df ) is de t-toets convervatiever

introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte

deze week: wat hebben we geleerd?

de one-sample t-toets

de two-samples t-toets voor on- en afhankelijke steekproeven

het verschil tussen een t-toets voor on- en afhankelijke steekproeven

het begrip gepoolde variantie

de verschillende standaardfouten voor de independent samples t-toets

betrouwbaarheidsinterval voor one- en two-samples z- en t-toets

aannamen voor de t-toets

35 / 36

introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte

deze week: wat moeten we nog leren?

het uitvoeren en beoordelen van een one-sample t-toets

het uitvoeren en beoordelen van een two-samples t-toetsvoor zowel afhankelijke als onafhankelijke steekproeven

het uitvoeren en beoordelen van een two-samples z-toets

het bepalen en beoordelen van een one-sample betrouwbaarheidsintervalen een two-samples betrouwbaarheidsinterval voor bekende en onbekende σ

36 / 36