INDUCTIEVE STATISTIEK -...
Transcript of INDUCTIEVE STATISTIEK -...
Toegepaste hypothesetoetsing met SPSS
Tim Vanhoomissen
INDUCTIEVE STATISTIEK
1 Workshop Inductieve Statistiek
• Hypothesetoetsing − Principe van hypothesetoetsing
− Steekproevenverdeling
− Centrale limiet theorema
− Mogelijke fouten
− Effectgrootte
• SPSS: data invoeren en bewerken
• Toetsen − T-toetsen
− Variantieanalyse, repeated measures
− Regressieanalyse
INHOUD
2 Workshop Inductieve Statistiek
Empirische cyclus
HYPOTHESETOETSING
Theorie
Hypothese
Dataverzameling
Statistiek
3 Workshop Inductieve Statistiek
HYPOTHESETOETSING
Theorie
•Drummers zijn dommer dan gemiddelde personen
Hypothese H1
•Drummers scoren lager op IQ test dan gemiddelde personen
Nulhypothese H0
•Drummers scoren even hoog op IQ-test als anderen
Dataverzameling
•IQ test
•Gemiddelden
Toetsing
•Hypothese verwerpen
•Hypothese niet verwerpen
4 Workshop Inductieve Statistiek
• Dus: nulhypothese (onschuld) wordt verworpen als de kans klein is dat het bewijsmateriaal aanwezig is terwijl de nulhypothese klopt.
In statistiek:
• Nulhypothese wordt verworpen als de kans klein is om een bepaald steekproefgemiddelde te observeren terwijl de nulhypothese klopt.
• Nulhypothese wordt behouden als de kans groot is om een bepaald steekproefgemiddelde te observeren terwijl de nulhypothese klopt.
HYPOTHESETOETSING
5 Workshop Inductieve Statistiek
Kansen zijn dus noodzakelijk om inductieve beslissingen te kunnen nemen
=> kansverdeling van steekproefgemiddelden
=> om te beslissen of onze steekproef uitzonderlijk is of niet
We trokken een steekproef van drummers en vonden een gemiddeld IQ van 96. We weten dat het gemiddelde IQ 100 is.
Hoe groot is nu de kans om een gemiddelde van 96 te vinden terwijl de populatie drummers toch niet afwijkt van de algemene populatie?
Kunnen we afleiden uit de verdeling
van de steekproefgemiddelden:
HYPOTHESETOETSING Theorie
Hypothese
Nulhypothese
Dataverzameling
Toetsing
,00
,05
,10
,15
,20
,25
90 92 94 96 98 100 102 104 106 108 110kan
s
punten statistiek
6 Workshop Inductieve Statistiek
populatie
steekproef
steekproeven-
verdeling
7 Workshop Inductieve Statistiek
Hoe groter de steekproef, hoe meer de normale verdeling benaderd wordt:
(vb: gooien van 1 dobbelsteen)
DE STEEKPROEVENVERDELING
8 Workshop Inductieve Statistiek
Abraham De Moivre, 17E
Vorm van de steekproevenverdeling?
DE STEEKPROEVENVERDELING
9
Hoofdstuk 2: Kansverdelingen en kansberekening
N/
populatie normaal verdeeld?
ja nee nee
steekproefgrootte? / > 30 < 30
steekproevenverdeling normaal verdeeld met verw. waarde μ en
onzeker
Wat is er nu zo cool aan de steekproevenverdeling van het gemiddelde?
Aangezien − we kennen:
µ
en
of
− we weten dat ze normaal verdeeld is (als populatie normaal verdeeld is of als N > 30)
kunnen we z-scores berekenen en kansen
uit de standaardnormaalverdeling halen!
DE STEEKPROEVENVERDELING
10
N
N
s
X
X
xz
Hoofdstuk 2: Kansverdelingen en kansberekening
Terug naar de drummers:
steekproef: N = 36 ; X = 96 ; SX = 13
populatie: µ = 100 en = 15
>> kans berekenen op een gemiddelde van 96 of hoger bij een µ = 100 en = 15
Stap1:
Stap 2: P(z < -1.6) = 0.0548 ?
HYPOTHESETOETSING
6.1
36
15
10096)96(
z
Theorie
Hypothese
Nulhypothese
Dataverzameling
Toetsing
11 Workshop Inductieve Statistiek
Kleine kans / grote kans?
HYPOTHESETOETSING
Sir Ronald Fisher, ernstig nadenkend
over hoe groot een kleine kans is.
12 Workshop Inductieve Statistiek
5% = α
,00
,01
,01
,02
,02
,03
,03
20 40 60 80 100 120 140 160 180
kan
s
IQ
Betekenis 5%
HYPOTHESETOETSING
13
EÉN- OF TWEEZIJDIG?
14
De keuze kan bepalend zijn voor significantie!
Populariteit van docenten statistiek is in populatie normaal verdeeld met µ = 100 en σ = 15.
Onderzoekshypothese:
1. door doorgedreven training en complete restyling kan de populariteitsscore stijgen (= eenzijdig).
of:
2. door doorgedreven training en complete restyling kan de populariteitsscore veranderen (= tweezijdig).
25 docenten worden getraind. Populariteitsscore na training in deze steekproef = 105.
EÉN- OF TWEEZIJDIG?
15
1. Rechtseenzijdig toetsen:
H0: µ ≤ 100
H1: µ > 100
Pr (1.67) = 0.0475 = 0.048
Is 0.048 ≤ 0.05?
-> ja, dus verwerp H0 µ ≤ 100
EÉN- OF TWEEZIJDIG?
16
67.12515
100105
25
15
100105
xz
2. Tweezijdig toetsen:
H0: µ = 100
H1: µ ≠ 100
Pd (1.67)= 2 * Pr (1.67) = 2 * 0.0475 = 0.095
Is 0.095 ≤ 0.05?
-> neen, dus verwerp H0 µ = 100 niet
EÉN- OF TWEEZIJDIG?
17
67.12515
100105
25
15
100105
xz
In SPSS meestal tweezijdige overschrijdingskans!
EÉN- OF TWEEZIJDIG?
18
Independent Samples Test
,109 ,741 -2,342 697 ,019 -,0929 ,03968 -,17082 -,01502
-2,350 687,853 ,019 -,0929 ,03954 -,17056 -,01528
Equal variances
assumed
Equal variances
not assumed
inf o
F Sig.
Lev ene's Test for
Equality of Variances
t df Sig. (2-tailed)
Mean
Dif f erence
Std. Error
Dif f erence Lower Upper
95% Conf idence
Interv al of the
Dif f erence
t-test f or Equality of Means
éénzijdige overschrijdingskans nodig?
=> sig (2-tailed) / 2 en vgl met α
tweezijdige overschrijdingskans nodig?
=> sig (2-tailed) direct vgl met α
Zijn we daar nu helemaal zeker van?
ONZEKERHEDEN
19
Beslissing
H0 verwerpen H0 niet
verwerpen
Realiteit
H0 is waar Type I-fout
= α
Correct
aanvaarden
= 1 - α
H0 is niet waar Correcte
verwerping
= 1 - β
Type II-fout
= β
= sensitivity / power
ONZEKERHEDEN
20
H0 niet waar
H0 waar
“verwerp H0” “verwerp H0” “aanvaard H0”
= .05
.025 .025
ONZEKERHEDEN
21
H0 niet waar
H0 waar
“verwerp H0” “verwerp H0” “aanvaard H0”
= .016
.008 .008
• Effectgrootte = indicatie van de mate waarin de onafhankelijke variabele de variatie in de afhankelijke variabele kan verklaren.
• Kan uitgedrukt worden in uiteenlopende grootheden (r, d, …) maar vaak wordt r gebruikt.
• Interpretatie:
− .10 < r < .30 : klein effect
− .30 < r < .50 : matig effect
− r > .50 : sterk effect
• Dus:
− Significantie: “Is er een effect van seksuele deprivatie op alcoholgebruik?”
− Effectgrootte: “Hoe sterk bepaalt seksuele deprivatie het alcoholgebruik?”
EFFECTGROOTTE
22
De meest gebruikte commando’s om data te ordenen in SPSS.
DATA ORGANISEREN
Workshop Inductieve Statistiek •23
• Interface
• Importeren (*.xls , *.csv , …)
• Recode
• Compute
SPSS
24 Workshop Inductieve Statistiek
De meest gebruikte parametrische en nonparametrische toetsen
TOETSEN
25 Workshop Inductieve Statistiek
*als er meerdere steekproeven zijn
PARAMETRISCH VS. NON-PARAMETRISCH
26
Parametrische toetsen
•variabelen normaal verdeeld in populatie
• (afhankelijke) variabelen gemeten op intervalniveau
• steekproeven hebben gelijke varianties *
Non-parametrische toetsen
•geen normale verdeling vereist
•voordeel: breder inzetbaar wegens minder voorwaarden, ook bij nominale- en ordinale variabelen
•nadeel: minder snel significante resultaten
interval/ ordinaal
nominaal
1
nominaal
> 1
1
one sample t-test / z-test
1
2
> 2
interval/ ordinaal
onafh.
onafh.
onafh.
afh.
afh.
independent t-test / z-test
dependent t-test
one way ANOVA
repeated measures ANOVA
Pearson correlation
nominaal
interval
gemengd
afh.
gemengd
n-way ANOVA
repeated measures ANOVA
mixed design ANOVA
multiple regression
Pearson chi-square
multiple regression
nominaal/ ordinaal
onafh.
type AV? aantal OV? type OV? hoeveel populaties?
categorieën afhankelijk?
parametrisch non-parametrisch
Rank-sum
Signed-ranks
Kruskal-Wallis
Friedman’s ANOVA
Spearman correlation
niet in dit boek chi-square goodness
of fit
1
≥ 2
chi-square goodness of fit
onafh.
≥ 2 gemengd logistic regression
1. Toetsingssituatie
Bij welk soort onderzoeksvragen gebruik je deze toets?
2. Voorwaarden
Wanneer mag je deze toets wel/niet gebruiken?
3. Hypothesen
Hoe zien H0 en H1 eruit wanneer je deze toets gebruikt?
4. Toetsingsgrootheid
Welke grootheid bereken je en wat is de kansverdeling van die grootheid?
5. Beslissingsregels
Wanneer verwerp je H0: via overschrijdingskansen of kritieke waarden?
6. Effectgrootte
Hoe belangrijk is het gevonden effect?
7. Rapporteren
Hoe vermeld je op een juiste manier de resultaten?
STRAMIEN TOETSEN
28 Workshop Inductieve Statistiek
1. Toetsingssituatie
Heeft het gemiddelde van de populatie waaruit de steekproef afkomstig is een bepaalde waarde of niet?
2. Voorwaarden
• σ is niet bekend en populatie is normaal verdeeld en N < 100
• N > 30 en populatie is niet normaal verdeeld
T-TOETS VOOR HET GEMIDDELDE
1 2 3 4 5 6 7 8
σ bekend? J a J a J a N e e N e e J a N e e N e e
p o p u l a t i e N v e r d e e l d ? J a J a N e e j a N e e N e e J a N e e
n ≥ 1 0 0 < 1 0 0 ≥ 1 0 0 ≥ 1 0 0 ≥ 1 0 0 < 1 0 0 < 1 0 0 < 1 0 0
Z ( σ ) Z ( σ ) Z ( σ ) Z ( s ) Z ( s ) - G e e n Z
- W e l t a l s
3 0 < n < 1 0 0
- G e e n t
a l s n < 3 0
- G e e n Z
- W e l t
- G e e n Z
- W e l t a l s
3 0 < n < 1 0 0
- G e e n t a l s
n < 3 0
29 Hoofdstuk 4: Toetsen voor één populatie
• Opmerking: SPSS gaat ervan uit dat σ niet gekend is en voert steeds een t-toets uit (dus ook in situaties waar een Z-toets toegelaten is)
• Maar: de overschrijdingskansen bij een t-toets zijn groter dan bij een z-toets (zie ook dikkere staarten in t-verdeling in vergelijking met z-verdeling)
• Gevolg: H0 zal minder snel verworpen worden bij een t-toets in vergelijking met een z-toets:
1-β (P om H0 terecht te verwerpen - onderscheidingsvermogen) neemt af
• We krijgen dus minder snel een significant resultaat bij een t-toets in vergelijking met een z-toets. Daarom eventueel manuele Z-toets gebruiken als aan de voorwaarden is voldaan.
T-TOETS VOOR HET GEMIDDELDE
30 Hoofdstuk 4: Toetsen voor één populatie
3. Hypothesen
Linkseenzijdig
H0: µ ≥ µ0
H1: µ < µ0
Rechtseenzijdig
H0: µ ≤ µ0
H1: µ > µ0
Tweezijdig
H0: µ = µ0
H1: µ ≠ µ0
µ0 = veronderstelde waarde voor populatiegemiddelde µ
T-TOETS VOOR HET GEMIDDELDE
31 Hoofdstuk 4: Toetsen voor één populatie
4. Toetsingsgrootheid
cfr. Z-toets maar s ipv σ
Kansverdeling: Student t-verdeling
Vrijheidsgraden: df = N-1
T-TOETS VOOR HET GEMIDDELDE
Ns
X
N
s
Xtx
00
32 Hoofdstuk 4: Toetsen voor één populatie
Student t-verdeling
Lijkt sterk op de normale verdeling
- Symmetrisch
- Gemiddelde = 0
- Bij oneindig grote steekproef identiek
Verschillen:
- Iets platter, dikkere staarten
- Bepaald door grootte steekproef
-> Meerdere t-verdelingen: parameter df
T-TOETS VOOR HET GEMIDDELDE
William Gosset, zichtbaar tevreden met het ontdekken van de t-verdeling
33 Hoofdstuk 4: Toetsen voor één populatie
5. Beslissingsregels
a. overschrijdingskansen - H0 verwerpen indien:
Pl (t x) ≤ α? >> linkseenzijdig
Pr (t x) ≤ α? >> rechtseenzijdig
Pd (t x) = 2*Pl (t x) ≤ α? (als X < μ) >> tweezijdig
2*Pr (t x) ≤ α? (als X > μ)
T-TOETS VOOR HET GEMIDDELDE
34 Hoofdstuk 4: Toetsen voor één populatie
• Demo SPSS: metalfans en haarlengte
• Hebben metalfans langere haren dan de gemiddelde volwassene?
• (boek p76)
• Tests voor normaliteit: boek p.237
T-TOETS VOOR HET GEMIDDELDE
35 Hoofdstuk 4: Toetsen voor één populatie
6. Effectgrootte
7. Rapporteren
Om na te gaan of metalfans langere haren hebben dan de algemene bevolking werd een one sample t-test uitgevoerd. Gemiddeld hadden de metalfans uit de steekproef langere haren (M = 9.83, SD = 2.62) dan de referentiewaarde 8.9 uit de populatie, t(59) = 2.739, p = .008, r = .34.
T-TOETS VOOR HET GEMIDDELDE
36 Hoofdstuk 4: Toetsen voor één populatie
Wat als niet voldaan is aan voorwaarden voor parametrisch toetsen bij bestuderen van 1 populatie?
• variabele niet normaal verdeeld in populatie?
• steekproef < 30 ?
• geen intervalvariabele?
χ²-toets voor frequenties
Χ²-TOETS VOOR FREQUENTIES
37 Hoofdstuk 4: Toetsen voor één populatie
1. Toetsingssituatie
Stemmen de geobserveerde frequenties in de steekproef overeen met de verwachte frequenties op basis van normen of eerder onderzoek?
Vb. Stemmen de frequenties leerlingen die lezen op niveau AVI-2, AVI-3, AVI-4 en AVI-5 in het tweede leerjaar van een bepaalde school overeen met de frequenties van deze leesniveaus in de algemene bevolking?
2. Voorwaarden
• de categorieën waarvan de frequenties bestudeerd worden moeten elkaar uitsluiten.
• 20% of minder van de categorieën heeft een verwachte frequentie kleiner dan 5;
• geen enkele categorie heeft een verwachte frequentie van minder dan 1;
• ordinale variabelen worden beschouwd als nominale variabelen.
Χ²-TOETS VOOR FREQUENTIES
38 Hoofdstuk 4: Toetsen voor één populatie
3. Hypothesen
Enkel tweezijdig!
H0: π1 = π2 = … = πk
H1: niet H0
Of
H0: π1 = πA ; π2 = πB ; … ; πk = πK
H1: niet H0
Χ²-TOETS VOOR FREQUENTIES
39 Hoofdstuk 4: Toetsen voor één populatie
4. Toetsingsgrootheid
met df = k – 1
fo = geobserveerde frequenties
fe = verwachte frequenties
k = aantal categorieën
Χ²-TOETS VOOR FREQUENTIES
40 Hoofdstuk 4: Toetsen voor één populatie
5. Beslissingsregels
a. overschrijdingskansen
maar χ²-verdeling afhankelijk van df, dus teveel mogelijkheden om te tabelleren, daarom:
b. kritieke waarden
Χ²-TOETS VOOR FREQUENTIES
41 Hoofdstuk 4: Toetsen voor één populatie
6. Effectgrootte (phi)
(interpreteerbaar zoals r)
7. Rapporteren
Verwachte en geobserveerde proportie, X², df, p-waarde.
Χ²-TOETS VOOR FREQUENTIES
42 Hoofdstuk 4: Toetsen voor één populatie
• Demo SPSS: voorkeur vrijetijdsactiviteit bij senioren.
• Een gemoedelijke Duitse gemeente wil in het kader van de budgettering voor recreatie weten of de senioren in de gemeente een uitgesproken voorkeur hebben voor een bepaalde vrijetijdsactiviteit. Een steekproef van senioren wordt gevraagd een keuze te maken tussen wandelen, fietsen of rotsklimmen.
Χ²-TOETS VOOR FREQUENTIES
43 Hoofdstuk 4: Toetsen voor één populatie
interval/ ordinaal
nominaal
1
nominaal
> 1
1
one sample t-test / z-test
1
2
> 2
interval/ ordinaal
onafh.
onafh.
onafh.
afh.
afh.
independent t-test / z-test
dependent t-test
one way ANOVA
repeated measures ANOVA
Pearson correlation
nominaal
interval
gemengd
afh.
gemengd
n-way ANOVA
repeated measures ANOVA
mixed design ANOVA
multiple regression
Pearson chi-square
multiple regression
nominaal/ ordinaal
onafh.
type AV? aantal OV? type OV? hoeveel populaties?
categorieën afhankelijk?
parametrisch non-parametrisch
Rank-sum
Signed-ranks
Kruskal-Wallis
Friedman’s ANOVA
Spearman correlation
niet in dit boek chi-square goodness
of fit
1
≥ 2
chi-square goodness of fit
onafh.
•44 •Workshop Inductieve Statistiek
1. Toetsingssituatie
Verschilt het gemiddelde in populatie 1 van het gemiddelde in populatie 2 waaruit de steekproeven afkomstig zijn?
Vb. Besteden jongens evenveel tijd aan hun huiswerk dan meisjes in de lagere school?
Belangrijk: onafhankelijke steekproeven
2. Voorwaarden
• σ1 en σ2 zijn niet bekend en populaties zijn normaal verdeeld en n1 < 100 en n2 < 100
• populaties zijn niet normaal verdeeld, 30 < n1 < 100 en 30 < n2 < 100
T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN
45 Hoofdstuk 5: Twee gemiddelden
3. Hypothesen
Linkseenzijdig H0: µ1 ≥ µ2 of H0: µ1 - µ2 ≥ 0
H1: µ1 < µ2 H1: µ1 - µ2 < 0
Rechtseenzijdig H0: µ1 ≤ µ2 H0: µ1 - µ2 ≤ 0
H1: µ1 > µ2 H1: µ1 - µ2 > 0
Tweezijdig H0: µ1 = µ2 H0: µ1 - µ2 = 0
H1: µ1 ≠ µ2 H0: µ1 - µ2 ≠ 0
T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN
1 2 3 4 5 6 7 8
σ1 e n σ 2 b e k e n d ? J a J a J a N e e N e e J a N e e N e e
p o p u l a t i e s N v e r d e e l d ? J a J a N e e J a N e e N e e J a N e e
n 1 e n n 2 ≥ 1 0 0 < 1 0 0 ≥ 1 0 0 ≥ 1 0 0 ≥ 1 0 0 < 1 0 0 < 1 0 0 < 1 0 0
Z ( σ ) Z ( σ ) Z ( σ ) Z ( s ) Z ( s ) - G e e n Z
- W e l t a l s
3 0 < n 1 < 1 0 0 e n
3 0 < n 2 < 1 0 0
- G e e n t a l s n 1
o f n 2 < 3 0
- G e e n Z
- W e l t
- G e e n Z
- W e l t a l s
3 0 < n 1 < 1 0 0 e n
3 0 < n 2 < 1 0 0
- G e e n t a l s n 1
o f n 2 < 3 0
46 Hoofdstuk 5: Twee gemiddelden
2 varianten om de toetsingsgrootheid te berekenen:
• Variant 1: varianties in twee populaties zijn gelijk
• Variant 2: varianties in twee populaties zijn niet gelijk
>> F-toets voor gelijke varianties
wordt in SPSS vaak mee gerapporteerd bij andere toetsen (Levene’s test bij t-test, ANOVA)
T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN
47 Hoofdstuk 5: Twee gemiddelden
1. Toetsingssituatie
Verschillen twee populatievarianties of niet? (als ‘hulptoets’ bij t-toets, of op zichzelf)
2. Voorwaarden
Populaties waaruit steekproeven komen zijn normaal verdeeld
Indien n > 100 is het minder erg als populaties niet normaal verdeeld zijn
In SPSS: Levene’s test for equality of variances (ook F-toets)
3. Hypothesen
Linkseenzijdig H0: σ²1 ≥ σ²2 of H0: σ²1 - σ²2 ≥ 0
H1: σ²1 < σ²2 H1: σ²1 - σ²2 < 0
Rechtseenzijdig H0: σ²1 ≤ σ²2 H0: σ²1 – σ²2 ≤ 0
H1: σ²1 > σ²2 H1: σ²1 - σ²2 > 0
Tweezijdig H0: σ²1 = σ²2 H0: σ²1 – σ²2 = 0
H1: σ²1 ≠ σ²2 H0: σ²1 – σ²2 ≠ 0
F-TOETS VOOR 2 VARIANTIES
48 Hoofdstuk 5: Twee gemiddelden
4. Toetsingsgrootheid
met df1 = n1-1 en df2 = n2-1
opgelet: in teller altijd de grootste s² en in noemer altijd de kleinste s²
F-toets: hoeveel maal is de grootste variantie groter dan de kleinste variantie?
Indien H0 waar is zal F in de buurt van 1 liggen. Hoe groter F wordt, hoe aannemelijker dat de populatievarianties van elkaar verschillen.
Kansverdeling: F-verdeling die bepaald wordt door df1 en df2
F-TOETS VOOR 2 VARIANTIES
2
1
²
²
s
sF
49 Hoofdstuk 5: Twee gemiddelden
F-verdeling die bepaald wordt door df1 en df2
vb: F = 10/9 = 1.11 met df1 = 6 en df2 = 12
Opgelet: niet symmetrisch!
-> daarom altijd grootste S² in teller!
F-TOETS VOOR 2 VARIANTIES
P r (F = 1.11) = 0.41
F=1.11
50 Hoofdstuk 5: Twee gemiddelden
5. Beslissingsregels
a. overschrijdingskansen - H0 verwerpen indien:
Pr (F) ≤ α? >> rechts/links eenzijdig
Pd (F) = 2*Pr (F) ≤ α? >> tweezijdig
b. kritieke waarden : H0 verwerpen indien:
vb. voor α = .05 en df1 = 6 en df2 = 12. (Andere α of df -> andere kritieke waarden!!)
F ≥ 3 >> rechts/links eenzijdig
F ≥ 3.7 >> tweezijdig
F-TOETS VOOR 2 VARIANTIES
51 Hoofdstuk 5: Twee gemiddelden
Variant 1: varianties in twee populaties zijn gelijk
σ²1 = σ²2
Populatievarianties zijn onbekend en worden geschat op basis van de twee steekproefvarianties s²1 en s²2; namelijk een schatting op basis van een gewogen gemiddelde van s²1 en s²2 -> ‘gepoolde’ variantie s²p
T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN
)1()1(
²)1(²)1(²
21
2211
nn
snsns p
52 Hoofdstuk 5: Twee gemiddelden
De standaardafwijking van de steekproevenverdeling van het verschil tussen twee gemiddelden is gebaseerd op de gepoolde variantie s²p
-> t-score voor het verschil in gemiddelden van twee steekproeven uit populaties met gelijke varianties
-> Kansverdeling: Student t-verdeling met df = n1+n2-2
T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN
2121
²²
n
s
n
ss
pp
XX
21
2121
21
2121
21²²
)()()()(
n
s
n
s
µXX
s
XXt
ppxx
xx
meestal 0
53 Hoofdstuk 5: Twee gemiddelden
Variant 2: varianties in twee populaties zijn niet gelijk
We gebruiken geen gepoolde variantie (sp) maar de standaardafwijkingen in elke steekproef (s1 en s2)
Kansverdeling: Student t-verdeling met vrijheidsgraden (schatting):
T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN
2
2
1
1
2121
21
2121
21²²
)()()()(
n
s
n
s
µXX
s
XXt
xx
xx
1
²
1
²
²²
2
2
2
2
1
2
1
1
2
2
2
1
1
n
n
s
n
n
s
n
s
n
s
df
54 Hoofdstuk 5: Twee gemiddelden
5. Beslissingsregels
a. overschrijdingskansen - H0 verwerpen indien:
Pl (tx1-x2) ≤ α? >> linkseenzijdig
Pr (tx1-x2) ≤ α? >> rechtseenzijdig
Pd (tx1-x2) ≤ α? >> tweezijdig
b. kritieke waarden : H0 verwerpen indien:
vb. voor α = .05 en df = 17. (Andere α of df -> andere kritieke waarden!!)
tx1-x2 ≤ -1.74 >> linkseenzijdig
tx1-x2 ≥ 1.74 >> rechtseenzijdig
tx1-x2 ≤ -2.11 of ≥ 2.11 >> tweezijdig
T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN
55 Hoofdstuk 5: Twee gemiddelden
4. Significantie?
kritieke t-waarde opzoeken in tabel
-> df = 11+12-2 = 21 en alpha = 0.05 en 2-zijdig
-> 2.08
5. t-score vergelijken met kritieke t-score
-0.698 > -2.08 dus H0 niet verwerpen
Besluit?
T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN
56 Hoofdstuk 5: Twee gemiddelden
• Demo SPSS – independent samples t-test
• Muziekvoorkeuren
Waarom luisteren we liever naar onze favoriete muziek dan naar andere muziek? Dopamineproductie vergelijken bij luisteren naar favoriete vs niet-favoriete muziek.
T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN IN SPSS
57 Hoofdstuk 5: Twee gemiddelden
6. Effectgrootte
7. Rapporteren
Om na te gaan of er bij het luisteren naar favoriete muziek meer dopamine aanwezig is in de hersenen dan bij het luisteren naar niet-favoriete muziek, werd een independent samples t-test uitgevoerd. Gemiddeld werd er meer dopamine gemeten in de conditie met favoriete muziek (M = 16.03, SD = 2.66) dan in de conditie met niet-favoriete muziek (M = 13.96, SD = 2.94). Dit effect was significant op niveau α = .05, t(58) = 2.86, p = .006, r = .12.
T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN
58 Hoofdstuk 5: Twee gemiddelden
Verschil tussen 2 medianen ipv tussen 2 gemiddelden omdat variabele ook op ordinaal niveau kan gemeten worden
1. Toetsingssituatie
Verschillen de scores in populatie 1 over het algemeen van de scores in populatie 2 waaruit de steekproeven afkomstig zijn?
Vb. Verschillen mannen en vrouwen in opleidingsniveau ( = ordinale variabele)?
= nonparametrische variant van onafhankelijke t-toets
2. Voorwaarden
onafhankelijke steekproeven
minstens ordinaal meetniveau
scores hoeven niet normaal verdeeld te zijn
WILCOXON RANK-SUM / MANN-WHITNEY TOETS
59 Hoofdstuk 5: Twee gemiddelden
3. Hypotheses
WILCOXON RANK-SUM / MANN-WHITNEY TOETS
tweezijdig H0: θ1 = θ2 H1: θ1 ≠ θ2
rechtseenzijdig H0: θ1 ≤ θ2 H1: θ1 > θ2
linkseenzijdig H0: θ1 ≥ θ2 H1: θ1 < θ2
60 Hoofdstuk 5: Twee gemiddelden
4. Toetsingsgrootheid
U bij Mann-Whitney
W bij Wilcoxon
SPSS: Analyze > nonparametric > 2 independent samples
5. Beslissingsregel
Is de gevonden P (Asymp. Sig. 2-tailed) kleiner dan α ?
ja: verwerp H0
nee: verwerp H0 niet
Ter herinnering: SPSS geeft 2-zijdige overschrijdingskans
-> als je éénzijdige overschrijdingskans nodig hebt (omdat je links- of rechtszijdig wil toetsen): overschrijdingskans uit SPSS delen door 2 en kijken of dat getal ≤ α (bv. 0.05)
WILCOXON RANK-SUM / MANN-WHITNEY TOETS
61 Hoofdstuk 5: Twee gemiddelden
2 groepen vergelijken op basis van ordinale schaal
Berekening van W:
a. Scores ordenen en rangen toekennen:
b. Rangensom per groep berekenen:
groep 1: 1 + 3.5 + 7 + 9 + 9 + 12 = 41.5
groep 2: 2 + 3.5 + 5 + 6 + 9 + 11 = 36.5
c. Toetsingsgrootheid = kleinste rangensom:
Ws = 36.5
WILCOXON RANK-SUM / MANN-WHITNEY TOETS
Score Groep Initiële
rang
Defintieve
rang
3 1 1 1
5 2 2 2
6 1 3 3.5
6 2 4 3.5
8 2 5 5
10 2 6 6
14 1 7 7
15 1 8 9
15 2 9 9
15 1 10 9
18 2 11 11
21 1 12 12
62 Hoofdstuk 5: Twee gemiddelden
d. Ws omzetten naar z-score:
wiskundige verwachting:
standaarddeviatie:
z-formule:
overschrijdingskans:
WILCOXON RANK-SUM / MANN-WHITNEY TOETS
63 Hoofdstuk 5: Twee gemiddelden
• Demo SPSS – Mann-Whitney / Wilcoxon Rank-Sum
• Voorkeur voor muziek meten aan de hand van ordinale schaal:
WILCOXON RANK-SUM / MANN-WHITNEY TOETS
Ik studeer nog liever drie dagen
onophoudelijk inductieve
statistiek dan hieraan deel te
nemen
Een documentaire
over het
paargedrag van
de bidsprinkhaan
lijkt me
opwindender dan
dit experiment
Deelname aan dit
experiment maakt
me eigenlijk
warm noch koud
Het evenaart
geen
verjaardagsfeest,
maar komt toch al
in de buurt
Ik heb me sinds mijn kindertijd
niet meer zo gelukkig gevoeld
64 Hoofdstuk 5: Twee gemiddelden
6. Effectgrootte
7. Rapportering
Om na te gaan of het subjectief welbevinden van mensen groter is bij het luisteren naar favoriete muziek in tegenstelling tot niet-favoriete muziek werd een Mann-Whitney toets uitgevoerd. De score voor subjectief welbevinden was hoger in de conditie met favoriete muziek (Mdn = 4) dan in de conditie met niet-favoriete muziek (Mdn = 3). Dit verschil was significant op α = .05-niveau, Ws = 167.5, z = -2.767, p = .006, r = .51.
WILCOXON RANK-SUM / MANN-WHITNEY TOETS
65 Hoofdstuk 5: Twee gemiddelden
interval/ ordinaal
nominaal
1
nominaal
> 1
1
one sample t-test / z-test
1
2
> 2
interval/ ordinaal
onafh.
onafh.
onafh.
afh.
afh.
independent t-test / z-test
dependent t-test
one way ANOVA
repeated measures ANOVA
Pearson correlation
nominaal
interval
gemengd
afh.
gemengd
n-way ANOVA
repeated measures ANOVA
mixed design ANOVA
multiple regression
Pearson chi-square
multiple regression
nominaal/ ordinaal
onafh.
type AV? aantal OV? type OV? hoeveel populaties?
categorieën afhankelijk?
parametrisch non-parametrisch
Rank-sum
Signed-ranks
Kruskal-Wallis
Friedman’s ANOVA
Spearman correlation
niet in dit boek chi-square goodness
of fit
1
≥ 2
chi-square goodness of fit
onafh.
•Workshop Inductieve Statistiek •66
1. Toetsingssituatie
Verschilt het gemiddelde in populatie 1 van het gemiddelde in populatie 2 waaruit de steekproeven afkomstig zijn?
Belangrijk: afhankelijke steekproeven zoals bij herhaalde metingen, gematchte steekproeven
2. Voorwaarden
steekproeven zijn afhankelijk
populaties zijn normaal verdeeld
Indien populaties niet normaal zijn verdeeld moet n1 > 30 en n2 > 30 (dus het aantal paren moet > 30)
T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN, AFH. STEEKPROEVEN
67
Hoofdstuk 6: Twee gemiddelden uit afhankelijke steekproeven
3. Hypothesen
V = verschil per paar (steekproef1 – steekproef2)
Linkseenzijdig H0: µv ≥ 0
H1: µv < 0
Rechtseenzijdig H0: µv ≤ 0
H1: µv > 0
Tweezijdig H0: µv = 0
H1: µv ≠ 0
T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN, AFH. STEEKPROEVEN
1 2 3 4 5 6 7 8
σ 1 e n σ 2 b e k e n d ? J a J a J a N e e N e e J a N e e N e e
p o p u l a t i e s N v e r d e e l d ? J a J a N e e J a N e e N e e J a N e e
n 1 e n n 2 ≥ 1 0 0 < 1 0 0 ≥ 1 0 0 ≥ 1 0 0 ≥ 1 0 0 < 1 0 0 < 1 0 0 < 1 0 0
t t t t t - w e l t a l s n 1
e n n 2 > 3 0
- g e e n t a l s
n 1 e n n 2 <
3 0
t - w e l t a l s n 1
e n n 2 > 3 0
- g e e n t a l s
n 1 e n n 2 <
3 0
68
Hoofdstuk 6: Twee gemiddelden uit afhankelijke steekproeven
4. Toetsingsgrootheid
t-score van het gemiddelde verschil v
aantal paren
standaarddeviatie van de verschilscores
gemiddelde verschil veronderstelde gemiddelde verschil tussen 2 steekproeven populaties
Kansverdeling? Student t-verdeling met df = n-1
T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN, AFH. STEEKPROEVEN
ns
Vt
v
v
v
69
Hoofdstuk 6: Twee gemiddelden uit afhankelijke steekproeven
4. t score berekenen
V = .5569 sv = .6023
T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN, AFH. STEEKPROEVEN
Score op test
P voor na Verschil(voor-na)
1 4.52 4.12 .40
2 3.60 3.44 .16
3 3.88 1.92 1.96
4 4.36 4.08 .28
5 4.52 3.52 1.00
6 3.60 2.44 1.16
7 3.92 3.72 .20
8 3.72 3.33 .39
9 3.52 3.52 .00
10 3.68 3.08 .60
11 3.88 3.88 .00
12 4.52 4.00 .52
13 3.04 2.72 .32
14 3.96 3.28 .68
15 4.32 2.52 1.80
16 4.44 4.44 .00
17 3.96 3.96 .00
8123.31760230.
05569.
t
70
Hoofdstuk 6: Twee gemiddelden uit afhankelijke steekproeven
Voorbeeld: ratten en tinnitus in SPSS
Onderzoeksvraag: kunnen ratten door “herprogrammeren” van neuronen in de auditieve cortex van hun tinnitus verlost worden?
17 ratten worden voor en na het toepassen van de techniek getest. De afhankelijke variabele wordt bepaald door het aantal fouten dat de ratten maken in het onderscheiden van tonen, en wordt gemeten op intervalniveau.
Navzer D. Engineer, Jonathan R. Riley, Jonathan D. Seale, Will A. Vrana, Jai A. Shetake, Sindhu P.
Sudanagunta, Michael S. Borland, Michael P. Kilgard. Reversing pathological neural activity using targeted plasticity.Nature, 2011; DOI: 10.1038/nature09656
T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN, AFH. STEEKPROEVEN
71
Hoofdstuk 6: Twee gemiddelden uit afhankelijke steekproeven
6. Effectgrootte
7. Rapporteren
Om na te gaan of de ratten beter presteerden op de frequentie-test na de behandeling werd een t-test voor afhankelijke steekproeven uitgevoerd. De ratten maakten significant minder fouten na (M = 3.41, SD = .69) dan voor de behandeling (M = 3.97, SD = .43), t(16) = 3.814, p = .002, r = .69 .
T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN, AFH. STEEKPROEVEN
72
Hoofdstuk 6: Twee gemiddelden uit afhankelijke steekproeven
1. Toetsingssituatie
Verschilt het gemiddelde in populatie 1 van het gemiddelde in populatie 2 waaruit de steekproeven afkomstig zijn?
Belangrijk: afhankelijke steekproeven (zie les over steekproeven) zoals bij herhaalde metingen, gematchte steekproeven
= nonparametrische variant van afhankelijke t-toets
2. Voorwaarden
afhankelijke steekproeven
minstens ordinaal meetniveau (achterliggende variabele is continu)
scores hoeven niet normaal verdeeld te zijn
WILCOXON RANGTEKENTOETS
73
Hoofdstuk 6: Twee gemiddelden uit afhankelijke steekproeven
3. Hypotheses
V = verschil binnen elk paar scores
Linkseenzijdig H0: θv ≥ 0
H1: θv < 0
Rechtseenzijdig H0: θv ≤ 0
H1: θv > 0
Tweezijdig H0: θv = 0
H1: θv ≠ 0
concentratiescores hoger op woensdag dan op vrijdag?
H1: woensdag - vrijdag > 0 of θv > 0
H0: woensdag – vrijdag ≤ 0 of θv ≤ 0
WILCOXON RANGTEKENTOETS
74
Hoofdstuk 6: Twee gemiddelden uit afhankelijke steekproeven
4. Toetsingsgrootheid
Toetsingsgrootheid = kleinste rangensom, hier: T- = 1
WILCOXON RANGTEKENTOETS
vrijdag woensdag verschil |verschil| rang Rang + Rang -
15 28 13 13 2.5 2.5
35 35 0 tie
16 35 19 19 6 6
26 22 -4 4 1 1
19 39 20 20 7 7
17 32 15 15 4.5 4.5
27 27 0 tie
16 29 13 13 2.5 2.5
13 36 23 23 8 8
20 35 15 15 4.5 4.5
35 1
75
Hoofdstuk 6: Twee gemiddelden uit afhankelijke steekproeven
5. Beslissingsregel
overschrijdingskansen met z-toets
met:
T = kleinste van rangensommen
n = aantal paren – aantal ties
WILCOXON RANGTEKENTOETS
𝑧𝑇 =𝑇−𝑇
𝑆𝐸=
𝑇−𝑛(𝑛+1)
4
𝑛 𝑛+1 (2𝑛+1)
24
=1−
8(8+1)
4
8 8+1 (16+1)
24
=1−18
7.14=-2.38
76
Hoofdstuk 6: Twee gemiddelden uit afhankelijke steekproeven
Demo SPSS: concentratiescores woensdag versus vrijdag
Berekenen van de medianen via Analyze > Descriptive statistics > Frequencies > Statistics
WILCOXON RANGTEKENTOETS
77
Hoofdstuk 6: Twee gemiddelden uit afhankelijke steekproeven
6. Effectgrootte
Opgelet: N = totaal aantal observaties, niet aantal paren!
7. Rapporteren
Om na te gaan of de concentratiescores variëren in functie van het moment in de week werd een Wilcoxon signed rank toets uitgevoerd. De scores waren significant hoger op vrijdag (Mdn = 33.5) dan op woensdag (Mdn = 18), z = -2.39, p = .017, r = -.53 .
WILCOXON RANGTEKENTOETS
78
Hoofdstuk 6: Twee gemiddelden uit afhankelijke steekproeven
OEFENINGEN
Handboek H4: 3 & 4 H5: 2 & 3 H6: 3
Variantieanalyse: one- en two-way ANOVA
& Kruskal-Wallis
interval/ ordinaal
nominaal
1
nominaal
> 1
1
one sample t-test / z-test
1
2
> 2
interval/ ordinaal
onafh.
onafh.
onafh.
afh.
afh.
independent t-test / z-test
dependent t-test
one way ANOVA
repeated measures ANOVA
Pearson correlation
nominaal
interval
gemengd
afh.
gemengd
n-way ANOVA
repeated measures ANOVA
mixed design ANOVA
multiple regression
Pearson chi-square
multiple regression
nominaal/ ordinaal
onafh.
type AV? aantal OV? type OV? hoeveel populaties?
categorieën afhankelijk?
parametrisch non-parametrisch
Rank-sum
Signed-ranks
Kruskal-Wallis
Friedman’s ANOVA
Spearman correlation
niet in dit boek chi-square goodness
of fit
1
≥ 2
chi-square goodness of fit
onafh.
•Hoofdstuk 7: Variantieanalyse •81
Toetsen voor verschillen tussen meer dan 2 gemiddelden
- is er een verschil in het welbevinden van kinderen met ouders die autoritair, autoritatief of permissief opvoeden?
-> telkens 1 OV (vb. opvoedingsstijl) met telkens meer dan 2 waarden (vb. 3)
-> telkens 1 AV (vb. welbevinden)
eenwegs (‘one way’) variantie-analyse (‘ANOVA’)
Bij twee OV: tweewegs (‘two way’) variantie analyse (zie volgende les)
Bij meer dan één AV: MANOVA (niet in Statistiek II)
VARIANTIEANALYSE
82 Hoofdstuk 7: Variantieanalyse
1. Toetsingssituatie
Is er een verschil in gemiddelde tussen groep a, b, c, … op variabele Y?
of
Is er een effect van variabele X (met niveau’s a, b, c,..) op variabele Y?
en:
Indien er een effect is, tussen welke groepen is er een verschil? (= post hoc toetsing)
VARIANTIEANALYSE
83 Hoofdstuk 7: Variantieanalyse
2. Voorwaarden
• AV is gemeten op intervalniveau
• OV wordt als nominaal beschouwd (ook al is OV soms ordinaal)
• scores van AV zijn in elke populatie normaal verdeeld of aantal deelnemers is in elke populatie groter dan 30
• varianties in populaties zijn gelijk (homogeniteit)
• onafhankelijke steekproeven
Assumptie van normaliteit en homogeniteit minder strikt bij gelijke steekproeven
VARIANTIEANALYSE
84 Hoofdstuk 7: Variantieanalyse
3. Hypothesen
H0: alle populatiegemiddelden zijn aan elkaar gelijk:
µa = µb = µc = … = µj als er J populaties zijn
H1: minstens twee populatiegemiddelden zijn niet gelijk aan elkaar
µj ≠ µj’ voor minstens één paar van j en j’
Dus H1 is NIET µa ≠ µb ≠ µc ≠… ≠ µj
H0 wordt getoetst door gebruik te maken van varianties:
De tussen-groeps-variantie of between-groups variance
mean square between (MSb)
De binnen-groeps-variantie of within-groups variance
mean square within (MSw)
VARIANTIEANALYSE
85 Hoofdstuk 7: Variantieanalyse
VARIANTIEANALYSE
86
Within groups
Hoofdstuk 7: Variantieanalyse
VARIANTIEANALYSE
87
Between groups
Within groups
Hoofdstuk 7: Variantieanalyse
Wanneer de verschillen tussen groepsgemiddelden groter worden en de verschillen binnen elke groep ongeveer hetzelfde blijven wordt de between-groups variantie groter ten opzichte van de within-groups varianties.
Dus: de verhouding between-groups variantie/within-groups variantie zegt iets over het verschil tussen groepsgemiddelden.
VARIANTIEANALYSE
88
Between groups
Within groups
Hoofdstuk 7: Variantieanalyse
VARIANTIEANALYSE
89
Between groups
Within groups
Hoofdstuk 7: Variantieanalyse
MSw = verschillen te wijten aan verschillen tussen personen binnen dezelfde groep
= inter-individuele verschillen die niet te wijten zijn aan het effect van de OV
= foutenvariantie (varfout)
MSb = variantie van groepsgemiddelden + variantie van scores rondom groepsgemiddelden
= variantie van de effecten van OV (vareffect) + foutenvariantie (varfout)
MSw = varfout
MSb = vareffect + varfout
VARIANTIEANALYSE
90 Hoofdstuk 7: Variantieanalyse
MSb = vareffect + varfout
MSw = varfout
-> ALS H0 waar is, dwz. vareffect zeer klein is of gelijk is aan 0
DAN: MSb = MSw of MSb / MSw = 1
-> ALS H0 niet waar is, dwz. vareffect verschilt van 0
DAN: MSb > MSw of MSb / MSw > 1
VARIANTIEANALYSE
91 Hoofdstuk 7: Variantieanalyse
4. Toetsingsgrootheid
Df b = J – 1 (J =aantal groepen)
Df w = N – J (N = totaal aantal waarnemingen; J = aantal groepen)
Kansverdeling: F-verdeling (zie bijlage)
Vb.
Met df b = 3 – 1 = 2 en df w = 27 – 3 = 24
VARIANTIEANALYSE
92
ww
bb
w
b
dfSS
dfSS
MS
MSF
/
/
13.776.2
68.19
24/27.66
2/35.39F
Hoofdstuk 7: Variantieanalyse
5. Beslissingsregels
a. Overschrijdingskansen (niet in tabel)
Is P r (F) ≤ α ?
ja, verwerp H0
neen, verwerp H0 niet
Vb. P r (F = 7.13) = 0.0037 voor df b = 2 , df w= 24
P r (= 0.0037) < 0.05 dus H0 verwerpen
VARIANTIEANALYSE
93 Hoofdstuk 7: Variantieanalyse
b. kritieke waarden
Is F ≥ kritieke F waarde bij
df teller = df b = J – 1 ja, verwerp H0
df noemer = df w = N - J neen, verwerp H0 niet
kritieke F waarde df b = 2 , df w= 24 bij alpha = 0.05 = 3.4 (zie tabel)
F (7.13) > Fkritiek (3.4) dus H0 verwerpen
VARIANTIEANALYSE
94 Hoofdstuk 7: Variantieanalyse
VARIANTIEANALYSE
95
ANOVA
TOETSGEG
39,355 2 19,677 7,126 ,004
66,275 24 2,761
105,630 26
Between Groups
Within Groups
Total
Sum of
Squares df Mean Square F Sig.
Hoofdstuk 7: Variantieanalyse
Wanneer H0 verworpen is weten we dat minstens 2 groepen verschillen mbt. hun gemiddelde
-> welke groepen?
= post-hoc toetsing
We zouden via t-toetsen elk paar van groepen met elkaar kunnen vergelijken (vb. groep 1-2, 2-3, 1-3). Bij elke t-toets gebruiken we een α = 0.05. Probleem: door herhaaldelijk t-toetsen uit te voeren neemt de fout van de 1e soort toe.
Oplossing: bij posthoc toetsing corrigeren voor deze hogere kans op fouten van de 1e soort.
>> Bonferroni correctie: wanneer we drie groepen vergelijken, alleen besluiten dat er een significant verschil is als P ≤ 0.05/3 (ipv. 0.05)
(andere mogelijke correcties: Tukey, Scheffé,...)
VARIANTIEANALYSE
96 Hoofdstuk 7: Variantieanalyse
Post-hoc toetsing in SPSS:
SPSS output houdt al rekening met deze correctie; dus de P waarden zijn al gecorrigeerd.
Als P ≤ 0.05 dan is er een significant verschil tussen beide groepen
vb. enkel significant verschil ts. Groep 1-3
VARIANTIEANALYSE
97
Multiple Comparisons
Dependent Variable: TOETSGEG
Bonferroni
-1,2667 ,76353 ,330 -3,2317 ,6984
-3,0417* ,80747 ,003 -5,1198 -,9635
1,2667 ,76353 ,330 -,6984 3,2317
-1,7750 ,78824 ,101 -3,8037 ,2537
3,0417* ,80747 ,003 ,9635 5,1198
1,7750 ,78824 ,101 -,2537 3,8037
(J) GROEP
2,00
3,00
1,00
3,00
1,00
2,00
(I) GROEP
1,00
2,00
3,00
Mean
Difference
(I-J) Std. Error Sig. Lower Bound Upper Bound
95% Confidence Interval
The mean difference is significant at the .05 level.*.
Hoofdstuk 7: Variantieanalyse
Voorbeeld ANOVA in SPSS: stressreductie door chocolade bij dansers
VARIANTIEANALYSE
98 Hoofdstuk 7: Variantieanalyse
ANOVA
stress
Sum of
Squares
df Mean Square F Sig.
Between Groups 714,490 2 357,245 3,136 ,048
Within Groups 11277,471 99 113,914
Total 11991,961 101
6. Effectgrootte
𝑟 =𝑆𝑆𝑏𝑒𝑡𝑤𝑒𝑒𝑛
𝑆𝑆𝑡𝑜𝑡𝑎𝑙
𝑟 =714.49
11991,961= 0.060 = 0.24
7. Rapportering Er was een significant effect van chocolade op het stressniveau van de dansers, F(2, 99) = 3.14, p = .048, r = .24 . De dansers die geen chocolade aten rapporteerden een hoger stressniveau (M = 65.5, SD = 10.54) dan dansers die twee repen chocolade aten (M = 59.12, SD = 12.27). Het stressniveau van de dansers die één reep chocolade aten (M = 61.32, SD = 8.95) verschilde niet significant van de andere condities.
VARIANTIEANALYSE
99 Hoofdstuk 7: Variantieanalyse
Variantieanalyse: two way ANOVA
interval/ ordinaal
nominaal
1
nominaal
> 1
1
one sample t-test / z-test
1
2
> 2
interval/ ordinaal
onafh.
onafh.
onafh.
afh.
afh.
independent t-test / z-test
dependent t-test
one way ANOVA
repeated measures ANOVA
Pearson correlation
nominaal
interval
gemengd
afh.
gemengd
n-way ANOVA
repeated measures ANOVA
mixed design ANOVA
multiple regression
Pearson chi-square
multiple regression
nominaal/ ordinaal
onafh.
type AV? aantal OV? type OV? hoeveel populaties?
categorieën afhankelijk?
parametrisch non-parametrisch
Rank-sum
Signed-ranks
Kruskal-Wallis
Friedman’s ANOVA
Spearman correlation
niet in dit boek chi-square goodness
of fit
1
≥ 2
chi-square goodness of fit
onafh.
Twee vragen:
1. vraag over hoofdeffect van elke OV op AV
2. vraag over interactie-effect tussen OV1 en OV2 op AV
hoe hebben de twee OV’s samen in combinatie een effect op AV?
is het effect van de ene OV op AV anders naargelang het niveau van de andere OV?
- is het effect van ses op toekomstbeeld anders voor jongens dan voor meisjes?
- is het effect van chocolade op stressreductie anders voor beginners dan voor gevorderden?
TWEEWEGS-VARIANTIEANALYSE
102 Hoofdstuk 7: Variantieanalyse
1. Toetsingssituatie
a. Is er een effect van variabele A (met niveaus a1, a2, …) op variabele Y?
b. Is er een effect van variabele B (met niveaus b1, b2, …) op variabele Y?
= 2 hoofdeffecten
c. Is het effect van variabele A anders naargelang het niveau van variabele B (of omgekeerd)? Wat is het effect van de combinatie van A en B op Y?
= interactie-effect tussen A en B
d. Indien er een hoofdeffect is van A, tussen welke groepen van A is er een verschil?
e. Indien er een hoofdeffect is van B, tussen welke groepen van B is er een verschil?
= post hoc toetsing
TWEEWEGS-VARIANTIEANALYSE
103 Hoofdstuk 7: Variantieanalyse
2. Voorwaarden
• AV is gemeten op intervalniveau
• OV’s worden als nominaal beschouwd (ook al is OV soms ordinaal)
• scores van AV zijn in alle populaties normaal verdeeld
• varianties in populaties zijn gelijk (F-toets of Levene’s toets)
• onafhankelijke steekproeven
TWEEWEGS-VARIANTIEANALYSE
104 Hoofdstuk 7: Variantieanalyse
3. Hypothesen
Wat is het effect van ses en geslacht op de toekomstverwachting van jongeren?
OV1 (A) = ses (laag, midden, hoog)
OV2 (B) = geslacht (jongens, meisje)
AV = toekomstbeeld score ts. -10 en +10
-> 3 x 2 design (dus 6 populaties - zie les 2: waarden van OV bepalen aantal populaties)
a. Is er een hoofdeffect van variabele A (met i niveaus)?
H0: alle populatiegemiddelden van A zijn aan elkaar gelijk
µ1 = µ2 = µ3 = … = µi als er I groepen zijn van A
H1: minstens twee populatiegemiddelden zijn niet gelijk aan elkaar
µi ≠ µi’ voor minstens één paar van i en i’
Of in termen van varianties H0: σ²A = σ²W of σ²A / σ²W = 1
H1: σ²A > σ²W of σ²A / σ²W > 1
TWEEWEGS-VARIANTIEANALYSE
105
0
1
2
3
4
5
6
7
laag midden hoog
To
eko
mstb
eeld
SES
Hoofdstuk 7: Variantieanalyse
b. Is er een hoofdeffect van variabele B (met j niveaus)?
H0: alle populatiegemiddelden van B zijn aan elkaar gelijk
µ1 = µ2 = µ3 = … = µj als er J groepen zijn van B
H1: minstens twee populatiegemiddelden zijn niet gelijk aan elkaar
µj ≠ µj’ voor minstens één paar van j en j’
Of in termen van varianties H0: σ²B = σ²W of σ²B / σ²W = 1
H1: σ²B > σ²W of σ²B / σ²W > 1
TWEEWEGS-VARIANTIEANALYSE
106
0
1
2
3
4
5
6
jongens meisjes
To
eko
mstb
eeld
geslacht
Hoofdstuk 7: Variantieanalyse
c. Is er een interactie-effect van variabele AxB ?
H0: alle populatiegemiddelden van combinatie AxB zijn aan elkaar gelijk: µ11 = µ12 = … = µij als er I x J groepen zijn
H1: minstens twee populatiegemiddelden zijn niet gelijk aan elkaar
µij ≠ µi’j’ voor minstens één paar van ij en i’j’
Of in termen van varianties H0: σ²AxB = σ²W of σ²AXB / σ²W = 1
H1: σ²AXB > σ²W of σ²AXB / σ²W > 1
TWEEWEGS-VARIANTIEANALYSE
107
0
1
2
3
4
5
6
7
8
9
laag midden hoog
To
eko
mstb
eeld
SES
jongens
meisjes
Hoofdstuk 7: Variantieanalyse
4. Toetsingsgrootheid
4.1 F toets voor hoofdeffect van A
met dfA = I – 1 (I = aantal niveaus van A)
met dfW = N – (I x J) (N = totaal aantal )
vb. FA = 10/2.02 = 4.95 met dfA = 2 dfW = 24
4.2 F toets voor hoofdeffect van B
met dfB = J – 1 (J = aantal niveaus van B)
met dfW = N – (I x J) (N = totaal aantal )
vb. FB = 0.53/2.02 = 0.26 met dfB = 1 dfW = 24
4.3 F toets voor interactie-effect van AxB
met dfAxB = (I - 1). (J – 1)
met dfW = N – (I x J) (N = totaal aantal)
vb. FAxB = 30.54/2.02 = 15.12 met dfAxB = 2 dfW = 24
TWEEWEGS-VARIANTIEANALYSE
108
WW
AA
W
AA
dfSS
dfSS
MS
MSF
/
/
WW
BB
W
BB
dfSS
dfSS
MS
MSF
/
/
WW
AxBAxB
W
AxBAxB
dfSS
dfSS
MS
MSF
/
/
Hoofdstuk 7: Variantieanalyse
5. Beslissingsregels
a. Overschrijdingskansen
Is P r (F) ≤ α?
ja, verwerp H0
neen, verwerp H0 niet
>> overschrijdingskans per mogelijk effect (hoofd / interactie) in ANOVA-tabel SPSS
b. Kritieke waarden
Ook mogelijk via tabel met F-waarden.
TWEEWEGS-VARIANTIEANALYSE
109 Hoofdstuk 7: Variantieanalyse
significant hoofdeffect ses: jongens en meisjes samengenomen is er een effect van ses
geen significant hoofdeffect geslacht: 3 ses niveaus samengenomen is er geen significant verschil tussen j en m
een interactie-effect: het verschil ts. j en m is niet hetzelfde voor alle niveaus van ses
>> post-hoc toetsing nodig om te weten tussen welke groepen er een verschil is. (SPSS)
TWEEWEGS-VARIANTIEANALYSE
110 Hoofdstuk 7: Variantieanalyse
interactie-effect: het verschil ts. jongens en meisjes is niet hetzelfde voor alle niveaus van ses (lijnen lopen niet parallel)
TWEEWEGS-VARIANTIEANALYSE
111
0
2
4
6
8
laag midden hoog
To
eko
mstb
eeld
SES
hoofdeffect SES
0
2
4
6
jongens meisjesTo
eko
mstb
eeld
geslacht
geen hoofdeffect geslacht
0
1
2
3
4
5
6
7
8
9
laag midden hoog
To
eko
mstb
eeld
SES
interactie effect
jongens
meisjesses
laag midden hoog
jongens 5,6 5,6 4,2 5,13
meisjes 2,4 4,4 7,8 4,87
4 5 6
Hoofdstuk 7: Variantieanalyse
Post hoc analyse bij two-way ANOVA:
Zie post-hoc bij one-way ANOVA: niveaus binnen 1 OV vergelijken.
(overbodig als er maar 2 niveaus zijn – bv. geslacht. Kijk dan naar gemiddeldentabel)
Om alle cellen paarsgewijs te vergelijken: simple effects – enkel met SPSS syntax (zie boek p. 163)
TWEEWEGS-VARIANTIEANALYSE
112
ses
laag midden hoog
jongens 5,6 5,6 4,2 5,13
meisjes 2,4 4,4 7,8 4,87
4 5 6
ses
laag midden hoog
jongens 5,6 5,6 4,2 5,13
meisjes 2,4 4,4 7,8 4,87
4 5 6
Hoofdstuk 7: Variantieanalyse
6. Effectgrootte
Partial Eta squared: interpreteerbaar
zoals r
te berekenen met SPSS
Via ANOVA-dialoogbox > options >
estimates of effect size aanvinken
TWEEWEGS-VARIANTIEANALYSE
113 Hoofdstuk 7: Variantieanalyse
Demo two-way ANOVA: effect van chocolade én dansniveau op stress?
TWEEWEGS-VARIANTIEANALYSE
114 Hoofdstuk 7: Variantieanalyse
7. Rapportering
Eerst de potentiële hoofdeffecten bespreken (zie one-way ANOVA, inclusief eventuele post-hoc)
gegevens: gemiddelden, SD, F-waarde, p-waarde, r
Daarna potentieel interactie-effect, zelfde gegevens.
Hoofdeffecten zijn niet meer relevant als er een interactie-effect is, maar moeten wel gerapporteerd worden. Interpretatie van de resultaten gaat enkel over interactie-effect.
TWEEWEGS-VARIANTIEANALYSE
115 Hoofdstuk 7: Variantieanalyse
interval/ ordinaal
nominaal
1
nominaal
> 1
1
one sample t-test / z-test
1
2
> 2
interval/ ordinaal
onafh.
onafh.
onafh.
afh.
afh.
independent t-test / z-test
dependent t-test
one way ANOVA
repeated measures ANOVA
Pearson correlation
nominaal
interval
gemengd
afh.
gemengd
n-way ANOVA
repeated measures ANOVA
mixed design ANOVA
multiple regression
Pearson chi-square
multiple regression
nominaal/ ordinaal
onafh.
type AV? aantal OV? type OV? hoeveel populaties?
categorieën afhankelijk?
parametrisch non-parametrisch
Rank-sum
Signed-ranks
Kruskal-Wallis
Friedman’s ANOVA
Spearman correlation
niet in dit boek chi-square goodness
of fit
1
≥ 2
chi-square goodness of fit
onafh.
•Hoofdstuk 7: Variantieanalyse •116
1. Toetsingssituatie
Is er een verschil in gemiddelde tussen groep a, b, c, … op variabele Y?
>> zelfde situatie als eenwegs-variantieanalyse.
2. Voorwaarden
AV is niet normaal verdeeld en/of
AV is van ordinaal meetniveau
Chocolade als afrodisiacum? Gemeten met:
KRUSKAL-WALLIS TOETS VOOR VERSCHIL TUSSEN K POPULATIES
117
Seks is absoluut het allerlaatste
waar ik nu aan kan denken.
Ik ervaar niet meer of
minder zin in seks dan op
een doordeweekse dag.
Ik voel een onwaarschijnlijke lust tot
paren – annuleer de voorstelling!
Hoofdstuk 7: Variantieanalyse
3. Hypothesen
H0: θ1 = θ2 = … = θk
H1= “niet H0”
bij k niveaus van de OV
4. Toetsingsgrootheid
Gebaseerd op rangordening zoals bij Mann-Whitney, grootheid = H
>> analyze > non-parametric > legacy dialogs > k independent samples
(zie boek 7.3.4)
KRUSKAL-WALLIS TOETS VOOR VERSCHIL TUSSEN K POPULATIES
118 Hoofdstuk 7: Variantieanalyse
5. Beslissingsregel
Is de gerapporteerde overschrijdingskans in SPSS kleiner dan α ?
ja > verwerp H0
nee > verwerp H0 niet
Is er een effect? post-hoc toetsen met meerdere Mann-Whitney/Wilcoxon Rank-Sum. Gebruik zo weinig mogelijk tests en hanteer Bonferroni-correctie:
α / aantal tests.
KRUSKAL-WALLIS TOETS VOOR VERSCHIL TUSSEN K POPULATIES
119 Hoofdstuk 7: Variantieanalyse
Demo Kruskal-Wallis: chocolade als afrodisiacum?
OV : 3 niveaus chocolade – geen, één reep, twee repen
AV: ordinale schaal met 3 niveaus
KRUSKAL-WALLIS TOETS VOOR VERSCHIL TUSSEN K POPULATIES
120 Hoofdstuk 7: Variantieanalyse
6. Effectgrootte
• Geen effectgrootte voor K-W test algemeen
• Wel effectgrootte van bijhorende Mann-Whitney tests – zie H5
KRUSKAL-WALLIS TOETS VOOR VERSCHIL TUSSEN K POPULATIES
121
Test Statisticsa
lust
Mann-Whitney U 359,500
Wilcoxon W 954,500
Z -2,976
Asymp. Sig. (2-tailed) ,003
a. Grouping Variable: chocolade
Hoofdstuk 7: Variantieanalyse
7. Rapportering
Een Kruskal-Wallis toets werd uitgevoerd om het effect van het eten van chocolade op de lustgevoelens van dansers na te gaan. Dit effect bleek inderdaad significant, H = 8.71, p = .013. Bijkomend werden de condities zonder chocolade (mean rank = 41), met één reep chocolade (mean rank = 59.91) en twee repen chocolade (mean rank = 53.59) onderling vergeleken door middel van een Wilcoxon rank-sum toets, waarbij een gecorrigeerd significantieniveau van α = .017 werd gehanteerd. Hieruit bleek dat er enkel een significant verschil was tussen de conditie zonder chocolade en de conditie met één reep chocolade (Ws = 954.5, z = -2.976, p = .003, r = -.36). Het verschil tussen de conditie zonder chocolade en de conditie met twee repen chocolade (Ws = 1034.5, z = -1.861, p = .06, r = -.23) noch het verschil tussen de conditie met één reep chocolade en de conditie met twee repen chocolade (Ws = 1105.5, z = -.917, p = .36, r = -.11) waren significant.
KRUSKAL-WALLIS TOETS VOOR VERSCHIL TUSSEN K POPULATIES
122 Hoofdstuk 7: Variantieanalyse
Variantieanalyse bij herhaalde metingen
De motivatie van 17 voetbalspeelsters wordt gemeten op drie momenten in het voetbalseizoen. We willen nagaan of de motivatie eerder stijgt dan wel daalt door de strenge behandeling door de coach.
Jarmila Kratochvilova, in haar eigen glorietijd bij de Tsjechische nationale atletiekploeg.
HERHAALDE METINGEN ANOVA
124
Hoofdstuk 8: Variantieanalyse herhaalde metingen
interval/ ordinaal
nominaal
1
nominaal
> 1
1
one sample t-test / z-test
1
2
> 2
interval/ ordinaal
onafh.
onafh.
onafh.
afh.
afh.
independent t-test / z-test
dependent t-test
one way ANOVA
repeated measures ANOVA
Pearson correlation
nominaal
interval
gemengd
afh.
gemengd
n-way ANOVA
repeated measures ANOVA
mixed design ANOVA
multiple regression
Pearson chi-square
multiple regression
nominaal/ ordinaal
onafh.
type AV? aantal OV? type OV? hoeveel populaties?
categorieën afhankelijk?
parametrisch non-parametrisch
Rank-sum
Signed-ranks
Kruskal-Wallis
Friedman’s ANOVA
Spearman correlation
niet in dit boek chi-square goodness
of fit
1
≥ 2
chi-square goodness of fit
onafh.
•Hoofdstuk 8: Variantieanalyse herhaalde metingen
1. Toetsingssituatie
Is er een verschil in gemiddelde tussen metingen 1, 2, 3, … van variabele Y?
of
Is er een effect van variabele X (metingen 1, 2, 3,..) op variabele Y?
en:
Indien er een effect is, tussen welke metingen is er een verschil? (= post hoc toetsing)
HERHAALDE METINGEN ANOVA
126
Hoofdstuk 8: Variantieanalyse herhaalde metingen
2. Voorwaarden
• AV is gemeten op intervalniveau
• scores van AV zijn in elke populatie normaal verdeeld of aantal deelnemers is in elke steekproef groter dan 30
• OV wordt als nominaal beschouwd (ook al is OV soms ordinaal)
• afhankelijke steekproeven
• voldaan aan sfericiteits-eis
HERHAALDE METINGEN ANOVA
127
Hoofdstuk 8: Variantieanalyse herhaalde metingen
Sfericiteit?
Varianties van verschilscores moeten ongeveer gelijk zijn aan elkaar:
Mauchly’s test + eventuele correctie
HERHAALDE METINGEN ANOVA
128
Meting 1 Meting 2 Meting 3 Verschil
1-2
Verschil
1-3
Verschil
2-3
1 8 12 14 -4 -6 -2
2 12 16 22 -4 -10 -6
3 46 32 38 14 8 -6
4 41 35 45 6 -4 -10
5 12 29 20 -17 -8 9
6 16 24 30 -8 -14 -6
7 53 35 52 18 1 -17
8 45 42 49 3 -4 -7
9 21 28 35 -7 -14 -7
10 26 31 39 -5 -13 -8
Variantie 113.6 49.82 42.67
Hoofdstuk 8: Variantieanalyse herhaalde metingen
3. Hypothesen
H0: alle populatiegemiddelden zijn aan elkaar gelijk:
H1: minstens twee populatiegemiddelden zijn niet gelijk aan elkaar
Dus H1 is NIET µa ≠ µb ≠ µc ≠… ≠ µj
HERHAALDE METINGEN ANOVA
129
tweezijdig H0: μ1 = μ2 = … = μj
H1: μi ≠ μj voor minstens 1 paar van i en j
Hoofdstuk 8: Variantieanalyse herhaalde metingen
4. Prinicipe
Opnieuw vergelijken van effectvariantie met foutenvariantie, maar nu zit de effectvariantie in de within groups variantie!
HERHAALDE METINGEN ANOVA
130
Hoofdstuk 8: Variantieanalyse herhaalde metingen
HERHAALDE METINGEN ANOVA
131
Hoofdstuk 8: Variantieanalyse herhaalde metingen
HERHAALDE METINGEN ANOVA
132
Hoofdstuk 8: Variantieanalyse herhaalde metingen
5. Beslissingsregels
a. Overschrijdingskansen (niet in tabel)
Is P (F) ≤ α ?
ja, verwerp H0
neen, verwerp H0 niet
Vb. P (F = 7.13) = 0.0037 voor dfm = 2 , dferror= 24
P (= 0.0037) < 0.05 dus H0 verwerpen
HERHAALDE METINGEN ANOVA
133
Hoofdstuk 8: Variantieanalyse herhaalde metingen
5. Beslissingsregels
b. kritieke waarden
Is F ≥ kritieke F waarde bij
dfteller = dfm = k – 1 ja, verwerp H0
dfnoemer = dferror = dfw - dfm neen, verwerp H0 niet
kritieke F waarde df b = 2 , df w= 24 bij alpha = 0.05 = 3.4 (zie tabel)
F (7.13) > Fkritiek (3.4) dus H0 verwerpen
HERHAALDE METINGEN ANOVA
134
Hoofdstuk 8: Variantieanalyse herhaalde metingen
HERHAALDE METINGEN ANOVA
135
Tests of Within-Subjects Effects
Measure: motivatie
Source Type III Sum of Squares df Mean Square F Sig. Partial Eta Squared
moment Sphericity Assumed 426,303 2 213,152 5,271 ,009 ,201
Greenhouse-Geisser 426,303 1,692 251,939 5,271 ,013 ,201
Huynh-Feldt 426,303 1,824 233,663 5,271 ,011 ,201
Lower-bound 426,303 1,000 426,303 5,271 ,032 ,201
Error(moment) Sphericity Assumed 1698,364 42 40,437
Greenhouse-Geisser 1698,364 35,534 47,796
Huynh-Feldt 1698,364 38,313 44,329
Lower-bound 1698,364 21,000 80,874
Hoofdstuk 8: Variantieanalyse herhaalde metingen
Wanneer H0 verworpen is weten we dat minstens 2 metingen verschillen mbt. hun gemiddelde
-> welke metingen?
= post-hoc toetsing
Zelfde probleem als bij one-way ANOVA voor herhaalde toetsen, dus opnieuw corrigeren voor verhoogde kans op Type 1-fout.
>> Bonferroni correctie
(wanneer we drie groepen vergelijken, alleen besluiten dat er een significant verschil is als P ≤ 0.05/3)
HERHAALDE METINGEN ANOVA
136
Hoofdstuk 8: Variantieanalyse herhaalde metingen
• SPSS output houdt al rekening met deze correctie; dus de P waarden zijn al gecorrigeerd.
• Als P ≤ 0.05 dan is er een significant verschil tussen beide groepen
• vb. enkel significant verschil ts. Groep 1-3
HERHAALDE METINGEN ANOVA
137
Pairwise Comparisons
Measure: motivatie
(I) moment (J) moment Mean Difference (I-J) Std. Error Sig.b 95% Confidence Interval for Difference
b
Lower Bound Upper Bound
1 2 2,455 2,175 ,815 -3,203 8,112
3 6,182* 2,038 ,019 ,880 11,484
2 1 -2,455 2,175 ,815 -8,112 3,203
3 3,727 1,464 ,056 -,081 7,536
3 1 -6,182* 2,038 ,019 -11,484 -,880
2 -3,727 1,464 ,056 -7,536 ,081
Based on estimated marginal means
*. The mean difference is significant at the ,05 level.
b. Adjustment for multiple comparisons: Bonferroni.
Hoofdstuk 8: Variantieanalyse herhaalde metingen
Voorbeeld ANOVA in SPSS: motivatie van voetbalspeelsters op drie meetmomenten
Aandacht voor correcte invoer van data!
HERHAALDE METINGEN ANOVA
138
Hoofdstuk 8: Variantieanalyse herhaalde metingen
6. Effectgrootte
Partial Eta squared: η²
• interpreteerbaar zoals r
• te berekenen met SPSS
Via ANOVA-dialoogbox > options > estimates of effect size aanvinken
HERHAALDE METINGEN ANOVA
139
Hoofdstuk 8: Variantieanalyse herhaalde metingen
7. Rapportering
Om na te gaan of de coachingmethode een effect heeft op de motivatie van de speelsters werd een repeated measures ANOVA uitgevoerd. Hieruit bleek dat er een significant effect van meetmoment op de motivatie was, F(2, 42) = 5.27, p = .009, η² = .201 . In het begin van het voetbalseizoen was de motivatie van de speelsters hoger (M = 47.64, SD = 6.81) dan op het einde van het seizoen (M = 41.45, SD = 5.40, p = .019). Ook vlak na de winterstop was de motivatie van de speelsters hoger (M = 45.18, SD = 5.15) dan op het einde van het seizoen, maar dit verschil benaderde slechts significantie, p = .056.
HERHAALDE METINGEN ANOVA
140
Hoofdstuk 8: Variantieanalyse herhaalde metingen
1. Toetsingssituatie
Is er een verschil in gemiddelde tussen metingen 1, 2, 3, … van variabele Y?
>> zelfde situatie als herhaalde metingen-variantieanalyse.
2. Voorwaarden
AV is niet normaal verdeeld en/of
AV is van ordinaal meetniveau
Evaluatie van de coach in onderzoek van Evelien:
“Op een schaal van 1 tot 10, hoe sterk wens je de coach op dit moment enkele bijzonder pijnlijke eksterogen toe?”
FRIEDMAN’S ANOVA
141
Hoofdstuk 8: Variantieanalyse herhaalde metingen
interval/ ordinaal
nominaal
1
nominaal
> 1
1
one sample t-test / z-test
1
2
> 2
interval/ ordinaal
onafh.
onafh.
onafh.
afh.
afh.
independent t-test / z-test
dependent t-test
one way ANOVA
repeated measures ANOVA
Pearson correlation
nominaal
interval
gemengd
afh.
gemengd
n-way ANOVA
repeated measures ANOVA
mixed design ANOVA
multiple regression
Pearson chi-square
multiple regression
nominaal/ ordinaal
onafh.
type AV? aantal OV? type OV? hoeveel populaties?
categorieën afhankelijk?
parametrisch non-parametrisch
Rank-sum
Signed-ranks
Kruskal-Wallis
Friedman’s ANOVA
Spearman correlation
niet in dit boek chi-square goodness
of fit
1
≥ 2
chi-square goodness of fit
onafh.
•Hoofdstuk 8: Variantieanalyse herhaalde metingen
3. Hypothesen
H0: θ1 = θ2 = … = θk
H1: θi ≠ θj voor minstens 1 paar van i en j
bij k niveaus van de OV
4. Toetsingsgrootheid
Gebaseerd op rangordening zoals bij Mann-Whitney, grootheid = H
>> analyze > non-parametric > legacy dialogs > k independent samples
(zie boek 7.3.4)
FRIEDMAN’S ANOVA
143
Hoofdstuk 8: Variantieanalyse herhaalde metingen
4. Toetsingsgrootheid
Rangordening zoals bij Kruskal-Wallis, maar ordenen per deelnemer ipv groep
R = de rangensom voor moment/conditie i
N = totale steekproefgrootte
k = aantal meetmomenten/condities
FRIEDMAN’S ANOVA
144
speelster moment 1 moment 2 moment 3 moment 1 moment 2 moment 3
1 4 5 4 1.5 3 1.5 2 5 6 6 1 2.5 2.5 3 2 4 6 1 2 3 4 3 7 7 1 2.5 2.5 5 5 5 5 2 2 2
Ri 6.5 12 11.5
Hoofdstuk 8: Variantieanalyse herhaalde metingen
5. Beslissingsregel
a. Is de gerapporteerde overschrijdingskans in SPSS kleiner dan α ?
ja > verwerp H0
nee > verwerp H0 niet
b. Is Fr groter dan de kritieke X²-waarde? (df = k – 1)
ja > verwerp H0
nee > verwerp H0 niet
Is er een effect? post-hoc toetsen met meerdere Wilcoxon Signed-Rank toetsen. Gebruik zo weinig mogelijk toetsen en hanteer Bonferroni-correctie:
α / aantal tests.
FRIEDMAN’S ANOVA
145
Hoofdstuk 8: Variantieanalyse herhaalde metingen
Demo Friedman’s ANOVA: evaluatie van de coach
OV : meetmoment in het seizoen
AV: haatgevoelens t.o.v. de coach
FRIEDMAN’S ANOVA
146
Hoofdstuk 8: Variantieanalyse herhaalde metingen
6. Effectgrootte
Geen effectgrootte voor Friedman’s toets
Wel effectgrootte voor eventuele Wilcoxon Signed-rank toetsen (zie H6)
FRIEDMAN’S ANOVA
147
Hoofdstuk 8: Variantieanalyse herhaalde metingen
7. Rapportering
Friedman’s ANOVA werd uitgevoerd om het effect van de coachingmethode op de haatgevoelens tegenover de coach na te gaan. Dit effect bleek inderdaad significant, F = 18.87, p < .001. Bijkomend werden paarsgewijze Wilcoxon signed-rank toetsen uitgevoerd om de metingen bij de start van het seizoen (mean rank = 1.34), vlak na de winterstop (mean rank = 2.23) en op het einde van het seizoen (mean rank = 2.43) onderling te vergelijken. Hierbij werd een gecorrigeerd significantieniveau van α = .017 gehanteerd. Uit deze post hoc toetsen bleken significante verschillen tussen de haatgevoelens bij de start van het seizoen en vlak na de winterstop (z = -3.47, p < .001, r = -.52) alsook tussen de haatgevoelens bij de start van het seizoen en op het einde van het seizoen (z = -3.42, p < .001, r = -.51). Er was geen significant verschil tussen de haatgevoelens vlak na de winterstop en op het einde van het seizoen (z = 1.58, p = .11, r = -.24).
FRIEDMAN’S ANOVA
148
Hoofdstuk 8: Variantieanalyse herhaalde metingen
toetsen voor het verband tussen variabelen met gelijk meetniveau
hoofdstuk 9
STATISTIEK II
Wat is een correlatie? (zie Statistiek I)
De samenhang tussen twee variabelen (sterkte + richting van het verband)
-1 als minimumwaarde en +1 als maximumwaarde
r = +0.87 r = +0.99 r = -0.01
PEARSON CORRELATIE
150
20,00 30,00 40,00 50,00 60,00 70,00
X
20,00
30,00
40,00
50,00
60,00
70,00
80,00
Y
20,00 30,00 40,00 50,00 60,00 70,00
X
40,00
60,00
80,00
100,00
120,00
140,00
Y
20,00 30,00 40,00 50,00 60,00 70,00
X
20,00
40,00
60,00
80,00
100,00
120,00
Y
Hoofdstuk 9: Variabelen met gelijk meetniveau
Formule
met N = aantal paren
PEARSON CORRELATIE
151
r = (𝑥𝑖 − 𝑥 )(𝑦𝑖 − 𝑦 )𝑛
𝑖=1
(𝑁 − 1)𝑠𝑥𝑠𝑦
Hoofdstuk 9: Variabelen met gelijk meetniveau
1. Toetsingssituatie
Is er een lineair (rechtlijnig) verband tussen twee variabelen?
Vb. is er een positief verband tussen intelligentie en schoolresultaten?
2. Voorwaarden
X en Y zijn gemeten op intervalniveau
X en Y zijn normaal verdeeld in de populatie of N ≥ 30
X en Y zijn bivariaat normaal verdeeld (voor elke X waarde zijn de Y waarden normaal verdeeld)
Homoscedasticiteit (populatievarianties van Y voor elke waarde van X zijn aan elkaar gelijk)
PEARSON CORRELATIE
152
Hoofdstuk 9: Variabelen met gelijk meetniveau
3. Hypothesen
Linkseenzijdig H0: ρ ≥ 0 H1: ρ < 0
Rechtseenzijdig H0: ρ ≤ 0 H1: ρ > 0
Tweezijdig H0: ρ = 0 H1: ρ ≠ 0
4. Toetsingsgrootheid
met df = N – 2 (N = aantal paren)
Kansverdeling: Student t-verdeling
PEARSON CORRELATIE
153
²1
2.
r
Nrtr
Hoofdstuk 9: Variabelen met gelijk meetniveau
5. Beslissingsregels
Studenten die meer vooraan in de aula zitten halen ook hogere cijfers op het examen.
Tweezijdig H0: ρ = 0 H1: ρ 0
Steekproef: 32 studenten, r(rij, examen) = -.38
Voor df = 30 en alpha = 0.05 is kritieke waarde (tweezijdig) gelijk aan 2.042 (tabel p. 323 ev.)
Is t l (-2.32) < t kritiek (-2.042)? Ja, dus H0 verwerpen
>> studenten die meer vooraan zitten halen inderdaad hogere cijfers!
PEARSON CORRELATIE
154
32.293.0
14.2
²)39.0(1
232.39.0
²1
2.
r
Nrtr
Hoofdstuk 9: Variabelen met gelijk meetniveau
Determinatiecoëficiënt R²
• R² = r²
• wat is het aandeel van variabele X in de variantie van variabele Y? Wat is hun gedeelde variantie?
• ≠ in welke mate is variabele X oorzaak van variabele Y?
− causaliteit kan in twee richtingen lopen
− derde variabele kan verband verklaren partiële correlatie
PEARSON CORRELATIE
155
Hoofdstuk 9: Variabelen met gelijk meetniveau
Partiële correlatie
Wat is de gedeeltelijke gezamenlijke variantie tussen twee variabelen als je controleert voor de invloed van een derde variabele?
PEARSON CORRELATIE
156
rij
motivatie? punten
Hoofdstuk 9: Variabelen met gelijk meetniveau
Demo SPSS: Studenten die meer vooraan in de aula zitten halen ook hogere cijfers op het examen.
PEARSON CORRELATIE
157
Hoofdstuk 9: Variabelen met gelijk meetniveau
6. Effectgrootte
Effectgrootte = r
7. Rapportering
Om na te gaan of er een verband is tussen de plaats in de aula waar studenten zitten en hun cijfers op het examen, werd een correlatie berekend. Dit verband bleek significant, r = -.39 , p = .027, N = 32 . Hoe verder de studenten van de docent zaten, hoe lager de punten op het examen. Nadat gecorrigeerd werd voor de motivatie van de studenten daalde deze correlatie tot r = .005, p = .98, N = 32.
PEARSON CORRELATIE
158
Hoofdstuk 9: Variabelen met gelijk meetniveau
1. Toetsingssituatie
Berekenen van een correlatie tussen twee ordinale variabelen.
(Pearson correlatie = correlatie tussen twee intervalvariabelen)
2. Voorwaarden
Twee variabelen gemeten op ordinaal niveau of
Twee variabelen duidelijk niet normaal verdeeld
3. Hypothesen
Linkseenzijdig H0: ρs ≥ 0 H1: ρs < 0
Rechtseenzijdig H0: ρs ≤ 0 H1: ρs > 0
Tweezijdig H0: ρs = 0 H1: ρs ≠ 0
RANGCORRELATIE VAN SPEARMAN
159
Hoofdstuk 9: Variabelen met gelijk meetniveau
4. Toetsingsgrootheid
De waarden van X en Y afzonderlijk ordenen en correlatie berekenen tussen beide rangordeningen
N = aantal paren
D = verschil in rangordenr per paar
-1 als minimumwaarde en +1 als maximumwaarde
RANGCORRELATIE VAN SPEARMAN
160
NN
Drs
³
²61
Hoofdstuk 9: Variabelen met gelijk meetniveau
Toetsingsgrootheid zoals bij Pearson’s correlatie m.b.v. t-verdeling:
5. Beslissingsregels
Is de gevonden P (Asymp. Sig. 2-tailed) kleiner dan α ?
ja: verwerp H0
nee: verwerp H0 niet
RANGCORRELATIE VAN SPEARMAN
161
Hoofdstuk 9: Variabelen met gelijk meetniveau
6. Effectgrootte
Effectgrootte = rs = ρs
7. Rapportering
(zie Pearson correlatie, maar dan met rs )
RANGCORRELATIE VAN SPEARMAN
162
Hoofdstuk 9: Variabelen met gelijk meetniveau
1. Toetsingssituatie
Zijn twee nominale variabelen afhankelijk van elkaar?
>> Kruistabel met frequenties
Is er een verband tussen de wijze waarop vragenlijsten worden afgenomen en het al of niet willen meedoen met de enquête?
Χ²-TOETS VOOR VERBAND TUSSEN 2 NOMINALE VARIABELEN
163
Schriftelijk Telefonisch Mondeling
Niet meedoen 90 70 25 185
Wel meedoen 110 130 75 315
200 200 100 500
Hoofdstuk 9: Variabelen met gelijk meetniveau
2. Voorwaarden
• Categorieën van elke variabele sluiten elkaar uit
• Alle waarden die in het onderzoek bestudeerd worden kunnen in de categorieën ondergebracht worden
• X² toets mag je gebruiken wanneer minder dan 20% van de cellen een fe < 5 en geen van de cellen een fe < 1
Χ²-TOETS VOOR VERBAND TUSSEN 2 NOMINALE VARIABELEN
164
Hoofdstuk 9: Variabelen met gelijk meetniveau
3. Hypothesen
H0: de variabelen zijn onafhankelijk; er is geen verband
H1: de variabelen zijn afhankelijk; er is wel een verband
Opm. altijd 2-zijdige toetsing
4. Toetsingsgrootheid
Pearson Chi Square:
Χ²-TOETS VOOR VERBAND TUSSEN 2 NOMINALE VARIABELEN
165
Hoofdstuk 9: Variabelen met gelijk meetniveau
5. Beslissingsregels
Overschrijdingskansen
Is de gevonden P (Asymp. Sig. 2-tailed) kleiner dan α ?
ja: verwerp H0
nee: verwerp H0 niet
Χ²-TOETS VOOR VERBAND TUSSEN 2 NOMINALE VARIABELEN
166
Hoofdstuk 9: Variabelen met gelijk meetniveau
fo
fe
aan de voorwaarden is voldaan want 0% van de cellen heeft fe < 5 en minimum fe > 1
Χ²-TOETS VOOR VERBAND TUSSEN 2 NOMINALE VARIABELEN
167
Chi-Square Tests
12,012a 2 ,002
12,254 2 ,002
500
Pearson Chi-Square
Likelihood Ratio
N of Valid Cases
Value df
Asy mp. Sig.
(2-sided)
0 cells (,0%) hav e expected count less than 5. The
minimum expected count is 37,00.
a.
Hoofdstuk 9: Variabelen met gelijk meetniveau
6. Effectgrootte
Verschillende mogelijkheden,
Cramer’s V meest universeel geschikt:
7. Rapportering
Om na te gaan of er een verband bestaat tussen de wijze waarop vragenlijsten worden afgenomen en het al of niet willen meedoen met de enquête werd een X²-toets uitgevoerd, die uitwees dat er inderdaad een eerder zwak verband is tussen beide variabelen, X² = 12.01, p = .002, V = .16)
Χ²-TOETS VOOR VERBAND TUSSEN 2 NOMINALE VARIABELEN
168
Hoofdstuk 9: Variabelen met gelijk meetniveau
OEFENINGEN
Handboek H7: 1 & 3 H8: 1 & 3 H9: 1 & 2
Regressieanalyse
hoofdstuk 10
STATISTIEK II
• Voorspelling maken op basis van correlatie
• Invloed van verschillende OV vergelijken
REGRESSIEANALYSE
171 Workshop Inductieve Statistiek
Voorwaarden
• De criteriumvariabele (= afhankelijke variabele) is gemeten op intervalniveau.
• De observaties van de criteriumvariabele zijn onafhankelijk van elkaar.
• De predictor (= onafhankelijke variabele) is gemeten op intervalniveau of het is een dichotome variabele.
• De fouten (of residuen) van de voorspelling die we maken zijn normaal verdeeld met een gemiddelde van 0.
• De fouten (of residuen) van de voorspelling die we maken zijn ongecorreleerd met elkaar.
REGRESSIEANALYSE
172 Workshop Inductieve Statistiek
y = 2 + 3x
ENKELVOUDIGE REGRESSIE
173 Workshop Inductieve Statistiek
ENKELVOUDIGE REGRESSIE
174 Workshop Inductieve Statistiek
0
2
4
6
8
10
12
14
16
18
20
70 80 90 100 110 120 130 140 150
fuif
sati
sfa
cti
e
alcohol
d = 1.8
d = 2.1
d = 1.2
𝑌𝑖 = 𝑏0 + 𝑏1𝑋𝑖 + 𝜀𝑖
{
ENKELVOUDIGE REGRESSIE
175 Workshop Inductieve Statistiek
0
2
4
6
8
10
12
14
16
18
20
70 80 90 100 110 120 130 140 150
fuif
sati
sfa
cti
e
alcohol
0
2
4
6
8
10
12
14
16
18
20
70 80 90 100 110 120 130 140 150
fuif
sati
sfa
cti
e
alcohol
Wanneer is het model “nuttig”?
𝑅² =𝑆𝑆𝑀
𝑆𝑆𝑇
𝐹 =𝑀𝑆𝑀𝑀𝑆𝑅
ENKELVOUDIGE REGRESSIE
176 Workshop Inductieve Statistiek
SSM SST
Verschil regressiepredictie
vs gemiddelde van Y
Verschil geobserveerde
scores vs gemiddelde van Y
Variantie model
Variantie fouten (residuen)
Wanneer is de predictor “nuttig”?
ENKELVOUDIGE REGRESSIE
177 Workshop Inductieve Statistiek
𝑌𝑖 = 𝑏0 + 𝑏1𝑋𝑖 + 𝜀𝑖
als 𝑏1 > 0
𝑡 =𝑏𝑜𝑏𝑠 − 𝑏𝑒𝑥𝑝
𝑆𝐸𝑏
Normaliteit van residuen?
ENKELVOUDIGE REGRESSIE
178 Workshop Inductieve Statistiek
Autocorrelatie van residuen?
Durbin-Watson toets:
ENKELVOUDIGE REGRESSIE
179 Workshop Inductieve Statistiek
0 1 2 3 4
Outliers?
ENKELVOUDIGE REGRESSIE
180 Workshop Inductieve Statistiek
Outliers? 2 technieken:
1. Cook’s Distance: case > 1 outlier
2. Gestandaardiseerde residuen: |z| > 3 outlier
ENKELVOUDIGE REGRESSIE
181 Workshop Inductieve Statistiek
Voorwaarden
• De criteriumvariabele (= afhankelijke variabele) is gemeten op intervalniveau.
• De observaties van de criteriumvariabele zijn onafhankelijk van elkaar.
• De predictor (= onafhankelijke variabele) is gemeten op intervalniveau of het is een dichotome variabele.
• De fouten (of residuen) van de voorspelling die we maken zijn normaal verdeeld met een gemiddelde van 0.
• De fouten (of residuen) van de voorspelling die we maken zijn ongecorreleerd met elkaar.
• De predictoren zijn lineair onafhankelijk van elkaar: er is geen multicollineariteit.
MEERVOUDIGE REGRESSIE
182 Workshop Inductieve Statistiek
Uitbreiding van enkelvoudige regressie:
𝑌𝑖 = 𝑏0 + 𝑏1𝑋𝑖1 + 𝑏2𝑋𝑖2 + ⋯+ 𝑏𝑛𝑋𝑛 + 𝜀𝑖
Of
𝑓𝑢𝑖𝑓𝑠𝑎𝑡𝑖𝑠𝑓𝑎𝑐𝑡𝑖𝑒𝑖 = 𝑏0 + 𝑏1𝑖 ∗ 𝑎𝑙𝑐 𝑐𝑜𝑛𝑠𝑢𝑚𝑝𝑡𝑖𝑒𝑠𝑖 +𝑏2𝑖 ∗ 𝑎𝑎𝑛𝑡𝑎𝑙 𝑎𝑎𝑛𝑤𝑒𝑧𝑖𝑔𝑒𝑛𝑖 + 𝜀𝑖
MEERVOUDIGE REGRESSIE
183 Workshop Inductieve Statistiek
MEERVOUDIGE REGRESSIE
184 Workshop Inductieve Statistiek
• Onderzoeker kiest
• Bekende predictoren eerst
Hiërarchisch
(enter)
• Computer kiest
• Stepwise, forward: stapsgewijs toevoegen; grootste correlatie eerst
• Backward: stapsgewijs verwijderen
Stapsgewijs
MEERVOUDIGE REGRESSIE
185 Workshop Inductieve Statistiek
MEERVOUDIGE REGRESSIE
186 Workshop Inductieve Statistiek
Multicollineariteit
Lineaire relatie tussen 2 of meer predictoren
2 problemen:
− Onnodige uitbreiding model
− Onbetrouwbare schatting b’s minder snel sign.
MEERVOUDIGE REGRESSIE
187 Workshop Inductieve Statistiek
Detectie multicollineariteit:
Tolerance:
VIF (Variance Inflation factor) = 1 / Tolerance
0 .20 .40 .60 .80 1
0 … 4 5 …
Een meervoudige regressieanalyse werd uitgevoerd met de fuifsatisfactie als criterium en het aantal alcoholische consumpties, het aantal aanwezigen en het aantal vrienden als predictoren (model 1). Dit model bleek significant, met R² = .46, F = 16.11, p < .001. Zoals aangegeven in Tabel 1 was het aantal aanwezigen geen significante predictor. Deze predictor werd daarom niet opgenomen in model 2, dat ook significant bleek met R² = .44, F = 22.09, p < .001. Van de resterende predictoren blijkt het aantal aanwezige vrienden het meeste invloed uit te oefenen op de fuifsatisfactie.
Tabel 1: Resultaten enkelvoudige regressie met fuifsatisfactie als criterium en aantal alcoholische consumpties als predictor.
MEERVOUDIGE REGRESSIE
188 Workshop Inductieve Statistiek
B SE B β t
model 1
constante 11.08 .66 16.69**
*
aantal consumpties -.15 .05 -.30 -3.04**
aantal aanwezigen .01 .00 .17 1.66
aantal vrienden .24 .05 .50 4.93***
model 2
constante 11.63 .59 19.89**
*
aantal consumpties -.15 .05 -.30 -3.03**
aantal vrienden .26 .05 .55 5.43***
**p < .01, ***p < .001
1. Analyseer de opgave − onderzoekseenheden?
− AV? OV?
− meetniveaus?
− populaties?
− afhankelijke steekproeven?
− (non)parametrisch?
− één/tweezijdig?
2. Verken de data
3. Kies de juiste toets
4. Rapporteer (relevante getallen, conclusie in termen van onderzoeksvraag)
STRATEGIE
Hoofdstuk 9: Variabelen met gelijk meetniveau
OEFENINGEN
Handboek
H10: 2 & 3
H11: 8 & 9