INDUCTIEVE STATISTIEK -...

190
Toegepaste hypothesetoetsing met SPSS Tim Vanhoomissen INDUCTIEVE STATISTIEK 1 Workshop Inductieve Statistiek

Transcript of INDUCTIEVE STATISTIEK -...

Page 1: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Toegepaste hypothesetoetsing met SPSS

Tim Vanhoomissen

INDUCTIEVE STATISTIEK

1 Workshop Inductieve Statistiek

Page 2: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

• Hypothesetoetsing − Principe van hypothesetoetsing

− Steekproevenverdeling

− Centrale limiet theorema

− Mogelijke fouten

− Effectgrootte

• SPSS: data invoeren en bewerken

• Toetsen − T-toetsen

− Variantieanalyse, repeated measures

− Regressieanalyse

INHOUD

2 Workshop Inductieve Statistiek

Page 3: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Empirische cyclus

HYPOTHESETOETSING

Theorie

Hypothese

Dataverzameling

Statistiek

3 Workshop Inductieve Statistiek

Page 4: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

HYPOTHESETOETSING

Theorie

•Drummers zijn dommer dan gemiddelde personen

Hypothese H1

•Drummers scoren lager op IQ test dan gemiddelde personen

Nulhypothese H0

•Drummers scoren even hoog op IQ-test als anderen

Dataverzameling

•IQ test

•Gemiddelden

Toetsing

•Hypothese verwerpen

•Hypothese niet verwerpen

4 Workshop Inductieve Statistiek

Page 5: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

• Dus: nulhypothese (onschuld) wordt verworpen als de kans klein is dat het bewijsmateriaal aanwezig is terwijl de nulhypothese klopt.

In statistiek:

• Nulhypothese wordt verworpen als de kans klein is om een bepaald steekproefgemiddelde te observeren terwijl de nulhypothese klopt.

• Nulhypothese wordt behouden als de kans groot is om een bepaald steekproefgemiddelde te observeren terwijl de nulhypothese klopt.

HYPOTHESETOETSING

5 Workshop Inductieve Statistiek

Page 6: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Kansen zijn dus noodzakelijk om inductieve beslissingen te kunnen nemen

=> kansverdeling van steekproefgemiddelden

=> om te beslissen of onze steekproef uitzonderlijk is of niet

We trokken een steekproef van drummers en vonden een gemiddeld IQ van 96. We weten dat het gemiddelde IQ 100 is.

Hoe groot is nu de kans om een gemiddelde van 96 te vinden terwijl de populatie drummers toch niet afwijkt van de algemene populatie?

Kunnen we afleiden uit de verdeling

van de steekproefgemiddelden:

HYPOTHESETOETSING Theorie

Hypothese

Nulhypothese

Dataverzameling

Toetsing

,00

,05

,10

,15

,20

,25

90 92 94 96 98 100 102 104 106 108 110kan

s

punten statistiek

6 Workshop Inductieve Statistiek

Page 7: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

populatie

steekproef

steekproeven-

verdeling

7 Workshop Inductieve Statistiek

Page 8: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Hoe groter de steekproef, hoe meer de normale verdeling benaderd wordt:

(vb: gooien van 1 dobbelsteen)

DE STEEKPROEVENVERDELING

8 Workshop Inductieve Statistiek

Abraham De Moivre, 17E

Page 9: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Vorm van de steekproevenverdeling?

DE STEEKPROEVENVERDELING

9

Hoofdstuk 2: Kansverdelingen en kansberekening

N/

populatie normaal verdeeld?

ja nee nee

steekproefgrootte? / > 30 < 30

steekproevenverdeling normaal verdeeld met verw. waarde μ en

onzeker

Page 10: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Wat is er nu zo cool aan de steekproevenverdeling van het gemiddelde?

Aangezien − we kennen:

µ

en

of

− we weten dat ze normaal verdeeld is (als populatie normaal verdeeld is of als N > 30)

kunnen we z-scores berekenen en kansen

uit de standaardnormaalverdeling halen!

DE STEEKPROEVENVERDELING

10

N

N

s

X

X

xz

Hoofdstuk 2: Kansverdelingen en kansberekening

Page 11: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Terug naar de drummers:

steekproef: N = 36 ; X = 96 ; SX = 13

populatie: µ = 100 en = 15

>> kans berekenen op een gemiddelde van 96 of hoger bij een µ = 100 en = 15

Stap1:

Stap 2: P(z < -1.6) = 0.0548 ?

HYPOTHESETOETSING

6.1

36

15

10096)96(

z

Theorie

Hypothese

Nulhypothese

Dataverzameling

Toetsing

11 Workshop Inductieve Statistiek

Page 12: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Kleine kans / grote kans?

HYPOTHESETOETSING

Sir Ronald Fisher, ernstig nadenkend

over hoe groot een kleine kans is.

12 Workshop Inductieve Statistiek

5% = α

,00

,01

,01

,02

,02

,03

,03

20 40 60 80 100 120 140 160 180

kan

s

IQ

Page 13: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Betekenis 5%

HYPOTHESETOETSING

13

Page 14: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

EÉN- OF TWEEZIJDIG?

14

Page 15: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

De keuze kan bepalend zijn voor significantie!

Populariteit van docenten statistiek is in populatie normaal verdeeld met µ = 100 en σ = 15.

Onderzoekshypothese:

1. door doorgedreven training en complete restyling kan de populariteitsscore stijgen (= eenzijdig).

of:

2. door doorgedreven training en complete restyling kan de populariteitsscore veranderen (= tweezijdig).

25 docenten worden getraind. Populariteitsscore na training in deze steekproef = 105.

EÉN- OF TWEEZIJDIG?

15

Page 16: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

1. Rechtseenzijdig toetsen:

H0: µ ≤ 100

H1: µ > 100

Pr (1.67) = 0.0475 = 0.048

Is 0.048 ≤ 0.05?

-> ja, dus verwerp H0 µ ≤ 100

EÉN- OF TWEEZIJDIG?

16

67.12515

100105

25

15

100105

xz

Page 17: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

2. Tweezijdig toetsen:

H0: µ = 100

H1: µ ≠ 100

Pd (1.67)= 2 * Pr (1.67) = 2 * 0.0475 = 0.095

Is 0.095 ≤ 0.05?

-> neen, dus verwerp H0 µ = 100 niet

EÉN- OF TWEEZIJDIG?

17

67.12515

100105

25

15

100105

xz

Page 18: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

In SPSS meestal tweezijdige overschrijdingskans!

EÉN- OF TWEEZIJDIG?

18

Independent Samples Test

,109 ,741 -2,342 697 ,019 -,0929 ,03968 -,17082 -,01502

-2,350 687,853 ,019 -,0929 ,03954 -,17056 -,01528

Equal variances

assumed

Equal variances

not assumed

inf o

F Sig.

Lev ene's Test for

Equality of Variances

t df Sig. (2-tailed)

Mean

Dif f erence

Std. Error

Dif f erence Lower Upper

95% Conf idence

Interv al of the

Dif f erence

t-test f or Equality of Means

éénzijdige overschrijdingskans nodig?

=> sig (2-tailed) / 2 en vgl met α

tweezijdige overschrijdingskans nodig?

=> sig (2-tailed) direct vgl met α

Page 19: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Zijn we daar nu helemaal zeker van?

ONZEKERHEDEN

19

Beslissing

H0 verwerpen H0 niet

verwerpen

Realiteit

H0 is waar Type I-fout

= α

Correct

aanvaarden

= 1 - α

H0 is niet waar Correcte

verwerping

= 1 - β

Type II-fout

= β

= sensitivity / power

Page 20: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

ONZEKERHEDEN

20

H0 niet waar

H0 waar

“verwerp H0” “verwerp H0” “aanvaard H0”

= .05

.025 .025

Page 21: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

ONZEKERHEDEN

21

H0 niet waar

H0 waar

“verwerp H0” “verwerp H0” “aanvaard H0”

= .016

.008 .008

Page 22: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

• Effectgrootte = indicatie van de mate waarin de onafhankelijke variabele de variatie in de afhankelijke variabele kan verklaren.

• Kan uitgedrukt worden in uiteenlopende grootheden (r, d, …) maar vaak wordt r gebruikt.

• Interpretatie:

− .10 < r < .30 : klein effect

− .30 < r < .50 : matig effect

− r > .50 : sterk effect

• Dus:

− Significantie: “Is er een effect van seksuele deprivatie op alcoholgebruik?”

− Effectgrootte: “Hoe sterk bepaalt seksuele deprivatie het alcoholgebruik?”

EFFECTGROOTTE

22

Page 23: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

De meest gebruikte commando’s om data te ordenen in SPSS.

DATA ORGANISEREN

Workshop Inductieve Statistiek •23

Page 24: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

• Interface

• Importeren (*.xls , *.csv , …)

• Recode

• Compute

SPSS

24 Workshop Inductieve Statistiek

Page 25: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

De meest gebruikte parametrische en nonparametrische toetsen

TOETSEN

25 Workshop Inductieve Statistiek

Page 26: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

*als er meerdere steekproeven zijn

PARAMETRISCH VS. NON-PARAMETRISCH

26

Parametrische toetsen

•variabelen normaal verdeeld in populatie

• (afhankelijke) variabelen gemeten op intervalniveau

• steekproeven hebben gelijke varianties *

Non-parametrische toetsen

•geen normale verdeling vereist

•voordeel: breder inzetbaar wegens minder voorwaarden, ook bij nominale- en ordinale variabelen

•nadeel: minder snel significante resultaten

Page 27: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

interval/ ordinaal

nominaal

1

nominaal

> 1

1

one sample t-test / z-test

1

2

> 2

interval/ ordinaal

onafh.

onafh.

onafh.

afh.

afh.

independent t-test / z-test

dependent t-test

one way ANOVA

repeated measures ANOVA

Pearson correlation

nominaal

interval

gemengd

afh.

gemengd

n-way ANOVA

repeated measures ANOVA

mixed design ANOVA

multiple regression

Pearson chi-square

multiple regression

nominaal/ ordinaal

onafh.

type AV? aantal OV? type OV? hoeveel populaties?

categorieën afhankelijk?

parametrisch non-parametrisch

Rank-sum

Signed-ranks

Kruskal-Wallis

Friedman’s ANOVA

Spearman correlation

niet in dit boek chi-square goodness

of fit

1

≥ 2

chi-square goodness of fit

onafh.

≥ 2 gemengd logistic regression

Page 28: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

1. Toetsingssituatie

Bij welk soort onderzoeksvragen gebruik je deze toets?

2. Voorwaarden

Wanneer mag je deze toets wel/niet gebruiken?

3. Hypothesen

Hoe zien H0 en H1 eruit wanneer je deze toets gebruikt?

4. Toetsingsgrootheid

Welke grootheid bereken je en wat is de kansverdeling van die grootheid?

5. Beslissingsregels

Wanneer verwerp je H0: via overschrijdingskansen of kritieke waarden?

6. Effectgrootte

Hoe belangrijk is het gevonden effect?

7. Rapporteren

Hoe vermeld je op een juiste manier de resultaten?

STRAMIEN TOETSEN

28 Workshop Inductieve Statistiek

Page 29: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

1. Toetsingssituatie

Heeft het gemiddelde van de populatie waaruit de steekproef afkomstig is een bepaalde waarde of niet?

2. Voorwaarden

• σ is niet bekend en populatie is normaal verdeeld en N < 100

• N > 30 en populatie is niet normaal verdeeld

T-TOETS VOOR HET GEMIDDELDE

1 2 3 4 5 6 7 8

σ bekend? J a J a J a N e e N e e J a N e e N e e

p o p u l a t i e N v e r d e e l d ? J a J a N e e j a N e e N e e J a N e e

n ≥ 1 0 0 < 1 0 0 ≥ 1 0 0 ≥ 1 0 0 ≥ 1 0 0 < 1 0 0 < 1 0 0 < 1 0 0

Z ( σ ) Z ( σ ) Z ( σ ) Z ( s ) Z ( s ) - G e e n Z

- W e l t a l s

3 0 < n < 1 0 0

- G e e n t

a l s n < 3 0

- G e e n Z

- W e l t

- G e e n Z

- W e l t a l s

3 0 < n < 1 0 0

- G e e n t a l s

n < 3 0

29 Hoofdstuk 4: Toetsen voor één populatie

Page 30: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

• Opmerking: SPSS gaat ervan uit dat σ niet gekend is en voert steeds een t-toets uit (dus ook in situaties waar een Z-toets toegelaten is)

• Maar: de overschrijdingskansen bij een t-toets zijn groter dan bij een z-toets (zie ook dikkere staarten in t-verdeling in vergelijking met z-verdeling)

• Gevolg: H0 zal minder snel verworpen worden bij een t-toets in vergelijking met een z-toets:

1-β (P om H0 terecht te verwerpen - onderscheidingsvermogen) neemt af

• We krijgen dus minder snel een significant resultaat bij een t-toets in vergelijking met een z-toets. Daarom eventueel manuele Z-toets gebruiken als aan de voorwaarden is voldaan.

T-TOETS VOOR HET GEMIDDELDE

30 Hoofdstuk 4: Toetsen voor één populatie

Page 31: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

3. Hypothesen

Linkseenzijdig

H0: µ ≥ µ0

H1: µ < µ0

Rechtseenzijdig

H0: µ ≤ µ0

H1: µ > µ0

Tweezijdig

H0: µ = µ0

H1: µ ≠ µ0

µ0 = veronderstelde waarde voor populatiegemiddelde µ

T-TOETS VOOR HET GEMIDDELDE

31 Hoofdstuk 4: Toetsen voor één populatie

Page 32: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

4. Toetsingsgrootheid

cfr. Z-toets maar s ipv σ

Kansverdeling: Student t-verdeling

Vrijheidsgraden: df = N-1

T-TOETS VOOR HET GEMIDDELDE

Ns

X

N

s

Xtx

00

32 Hoofdstuk 4: Toetsen voor één populatie

Page 33: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Student t-verdeling

Lijkt sterk op de normale verdeling

- Symmetrisch

- Gemiddelde = 0

- Bij oneindig grote steekproef identiek

Verschillen:

- Iets platter, dikkere staarten

- Bepaald door grootte steekproef

-> Meerdere t-verdelingen: parameter df

T-TOETS VOOR HET GEMIDDELDE

William Gosset, zichtbaar tevreden met het ontdekken van de t-verdeling

33 Hoofdstuk 4: Toetsen voor één populatie

Page 34: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

5. Beslissingsregels

a. overschrijdingskansen - H0 verwerpen indien:

Pl (t x) ≤ α? >> linkseenzijdig

Pr (t x) ≤ α? >> rechtseenzijdig

Pd (t x) = 2*Pl (t x) ≤ α? (als X < μ) >> tweezijdig

2*Pr (t x) ≤ α? (als X > μ)

T-TOETS VOOR HET GEMIDDELDE

34 Hoofdstuk 4: Toetsen voor één populatie

Page 35: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

• Demo SPSS: metalfans en haarlengte

• Hebben metalfans langere haren dan de gemiddelde volwassene?

• (boek p76)

• Tests voor normaliteit: boek p.237

T-TOETS VOOR HET GEMIDDELDE

35 Hoofdstuk 4: Toetsen voor één populatie

Page 36: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

6. Effectgrootte

7. Rapporteren

Om na te gaan of metalfans langere haren hebben dan de algemene bevolking werd een one sample t-test uitgevoerd. Gemiddeld hadden de metalfans uit de steekproef langere haren (M = 9.83, SD = 2.62) dan de referentiewaarde 8.9 uit de populatie, t(59) = 2.739, p = .008, r = .34.

T-TOETS VOOR HET GEMIDDELDE

36 Hoofdstuk 4: Toetsen voor één populatie

Page 37: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Wat als niet voldaan is aan voorwaarden voor parametrisch toetsen bij bestuderen van 1 populatie?

• variabele niet normaal verdeeld in populatie?

• steekproef < 30 ?

• geen intervalvariabele?

χ²-toets voor frequenties

Χ²-TOETS VOOR FREQUENTIES

37 Hoofdstuk 4: Toetsen voor één populatie

Page 38: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

1. Toetsingssituatie

Stemmen de geobserveerde frequenties in de steekproef overeen met de verwachte frequenties op basis van normen of eerder onderzoek?

Vb. Stemmen de frequenties leerlingen die lezen op niveau AVI-2, AVI-3, AVI-4 en AVI-5 in het tweede leerjaar van een bepaalde school overeen met de frequenties van deze leesniveaus in de algemene bevolking?

2. Voorwaarden

• de categorieën waarvan de frequenties bestudeerd worden moeten elkaar uitsluiten.

• 20% of minder van de categorieën heeft een verwachte frequentie kleiner dan 5;

• geen enkele categorie heeft een verwachte frequentie van minder dan 1;

• ordinale variabelen worden beschouwd als nominale variabelen.

Χ²-TOETS VOOR FREQUENTIES

38 Hoofdstuk 4: Toetsen voor één populatie

Page 39: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

3. Hypothesen

Enkel tweezijdig!

H0: π1 = π2 = … = πk

H1: niet H0

Of

H0: π1 = πA ; π2 = πB ; … ; πk = πK

H1: niet H0

Χ²-TOETS VOOR FREQUENTIES

39 Hoofdstuk 4: Toetsen voor één populatie

Page 40: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

4. Toetsingsgrootheid

met df = k – 1

fo = geobserveerde frequenties

fe = verwachte frequenties

k = aantal categorieën

Χ²-TOETS VOOR FREQUENTIES

40 Hoofdstuk 4: Toetsen voor één populatie

Page 41: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

5. Beslissingsregels

a. overschrijdingskansen

maar χ²-verdeling afhankelijk van df, dus teveel mogelijkheden om te tabelleren, daarom:

b. kritieke waarden

Χ²-TOETS VOOR FREQUENTIES

41 Hoofdstuk 4: Toetsen voor één populatie

Page 42: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

6. Effectgrootte (phi)

(interpreteerbaar zoals r)

7. Rapporteren

Verwachte en geobserveerde proportie, X², df, p-waarde.

Χ²-TOETS VOOR FREQUENTIES

42 Hoofdstuk 4: Toetsen voor één populatie

Page 43: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

• Demo SPSS: voorkeur vrijetijdsactiviteit bij senioren.

• Een gemoedelijke Duitse gemeente wil in het kader van de budgettering voor recreatie weten of de senioren in de gemeente een uitgesproken voorkeur hebben voor een bepaalde vrijetijdsactiviteit. Een steekproef van senioren wordt gevraagd een keuze te maken tussen wandelen, fietsen of rotsklimmen.

Χ²-TOETS VOOR FREQUENTIES

43 Hoofdstuk 4: Toetsen voor één populatie

Page 44: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

interval/ ordinaal

nominaal

1

nominaal

> 1

1

one sample t-test / z-test

1

2

> 2

interval/ ordinaal

onafh.

onafh.

onafh.

afh.

afh.

independent t-test / z-test

dependent t-test

one way ANOVA

repeated measures ANOVA

Pearson correlation

nominaal

interval

gemengd

afh.

gemengd

n-way ANOVA

repeated measures ANOVA

mixed design ANOVA

multiple regression

Pearson chi-square

multiple regression

nominaal/ ordinaal

onafh.

type AV? aantal OV? type OV? hoeveel populaties?

categorieën afhankelijk?

parametrisch non-parametrisch

Rank-sum

Signed-ranks

Kruskal-Wallis

Friedman’s ANOVA

Spearman correlation

niet in dit boek chi-square goodness

of fit

1

≥ 2

chi-square goodness of fit

onafh.

•44 •Workshop Inductieve Statistiek

Page 45: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

1. Toetsingssituatie

Verschilt het gemiddelde in populatie 1 van het gemiddelde in populatie 2 waaruit de steekproeven afkomstig zijn?

Vb. Besteden jongens evenveel tijd aan hun huiswerk dan meisjes in de lagere school?

Belangrijk: onafhankelijke steekproeven

2. Voorwaarden

• σ1 en σ2 zijn niet bekend en populaties zijn normaal verdeeld en n1 < 100 en n2 < 100

• populaties zijn niet normaal verdeeld, 30 < n1 < 100 en 30 < n2 < 100

T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN

45 Hoofdstuk 5: Twee gemiddelden

Page 46: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

3. Hypothesen

Linkseenzijdig H0: µ1 ≥ µ2 of H0: µ1 - µ2 ≥ 0

H1: µ1 < µ2 H1: µ1 - µ2 < 0

Rechtseenzijdig H0: µ1 ≤ µ2 H0: µ1 - µ2 ≤ 0

H1: µ1 > µ2 H1: µ1 - µ2 > 0

Tweezijdig H0: µ1 = µ2 H0: µ1 - µ2 = 0

H1: µ1 ≠ µ2 H0: µ1 - µ2 ≠ 0

T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN

1 2 3 4 5 6 7 8

σ1 e n σ 2 b e k e n d ? J a J a J a N e e N e e J a N e e N e e

p o p u l a t i e s N v e r d e e l d ? J a J a N e e J a N e e N e e J a N e e

n 1 e n n 2 ≥ 1 0 0 < 1 0 0 ≥ 1 0 0 ≥ 1 0 0 ≥ 1 0 0 < 1 0 0 < 1 0 0 < 1 0 0

Z ( σ ) Z ( σ ) Z ( σ ) Z ( s ) Z ( s ) - G e e n Z

- W e l t a l s

3 0 < n 1 < 1 0 0 e n

3 0 < n 2 < 1 0 0

- G e e n t a l s n 1

o f n 2 < 3 0

- G e e n Z

- W e l t

- G e e n Z

- W e l t a l s

3 0 < n 1 < 1 0 0 e n

3 0 < n 2 < 1 0 0

- G e e n t a l s n 1

o f n 2 < 3 0

46 Hoofdstuk 5: Twee gemiddelden

Page 47: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

2 varianten om de toetsingsgrootheid te berekenen:

• Variant 1: varianties in twee populaties zijn gelijk

• Variant 2: varianties in twee populaties zijn niet gelijk

>> F-toets voor gelijke varianties

wordt in SPSS vaak mee gerapporteerd bij andere toetsen (Levene’s test bij t-test, ANOVA)

T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN

47 Hoofdstuk 5: Twee gemiddelden

Page 48: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

1. Toetsingssituatie

Verschillen twee populatievarianties of niet? (als ‘hulptoets’ bij t-toets, of op zichzelf)

2. Voorwaarden

Populaties waaruit steekproeven komen zijn normaal verdeeld

Indien n > 100 is het minder erg als populaties niet normaal verdeeld zijn

In SPSS: Levene’s test for equality of variances (ook F-toets)

3. Hypothesen

Linkseenzijdig H0: σ²1 ≥ σ²2 of H0: σ²1 - σ²2 ≥ 0

H1: σ²1 < σ²2 H1: σ²1 - σ²2 < 0

Rechtseenzijdig H0: σ²1 ≤ σ²2 H0: σ²1 – σ²2 ≤ 0

H1: σ²1 > σ²2 H1: σ²1 - σ²2 > 0

Tweezijdig H0: σ²1 = σ²2 H0: σ²1 – σ²2 = 0

H1: σ²1 ≠ σ²2 H0: σ²1 – σ²2 ≠ 0

F-TOETS VOOR 2 VARIANTIES

48 Hoofdstuk 5: Twee gemiddelden

Page 49: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

4. Toetsingsgrootheid

met df1 = n1-1 en df2 = n2-1

opgelet: in teller altijd de grootste s² en in noemer altijd de kleinste s²

F-toets: hoeveel maal is de grootste variantie groter dan de kleinste variantie?

Indien H0 waar is zal F in de buurt van 1 liggen. Hoe groter F wordt, hoe aannemelijker dat de populatievarianties van elkaar verschillen.

Kansverdeling: F-verdeling die bepaald wordt door df1 en df2

F-TOETS VOOR 2 VARIANTIES

2

1

²

²

s

sF

49 Hoofdstuk 5: Twee gemiddelden

Page 50: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

F-verdeling die bepaald wordt door df1 en df2

vb: F = 10/9 = 1.11 met df1 = 6 en df2 = 12

Opgelet: niet symmetrisch!

-> daarom altijd grootste S² in teller!

F-TOETS VOOR 2 VARIANTIES

P r (F = 1.11) = 0.41

F=1.11

50 Hoofdstuk 5: Twee gemiddelden

Page 51: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

5. Beslissingsregels

a. overschrijdingskansen - H0 verwerpen indien:

Pr (F) ≤ α? >> rechts/links eenzijdig

Pd (F) = 2*Pr (F) ≤ α? >> tweezijdig

b. kritieke waarden : H0 verwerpen indien:

vb. voor α = .05 en df1 = 6 en df2 = 12. (Andere α of df -> andere kritieke waarden!!)

F ≥ 3 >> rechts/links eenzijdig

F ≥ 3.7 >> tweezijdig

F-TOETS VOOR 2 VARIANTIES

51 Hoofdstuk 5: Twee gemiddelden

Page 52: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Variant 1: varianties in twee populaties zijn gelijk

σ²1 = σ²2

Populatievarianties zijn onbekend en worden geschat op basis van de twee steekproefvarianties s²1 en s²2; namelijk een schatting op basis van een gewogen gemiddelde van s²1 en s²2 -> ‘gepoolde’ variantie s²p

T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN

)1()1(

²)1(²)1(²

21

2211

nn

snsns p

52 Hoofdstuk 5: Twee gemiddelden

Page 53: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

De standaardafwijking van de steekproevenverdeling van het verschil tussen twee gemiddelden is gebaseerd op de gepoolde variantie s²p

-> t-score voor het verschil in gemiddelden van twee steekproeven uit populaties met gelijke varianties

-> Kansverdeling: Student t-verdeling met df = n1+n2-2

T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN

2121

²²

n

s

n

ss

pp

XX

21

2121

21

2121

21²²

)()()()(

n

s

n

s

µXX

s

XXt

ppxx

xx

meestal 0

53 Hoofdstuk 5: Twee gemiddelden

Page 54: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Variant 2: varianties in twee populaties zijn niet gelijk

We gebruiken geen gepoolde variantie (sp) maar de standaardafwijkingen in elke steekproef (s1 en s2)

Kansverdeling: Student t-verdeling met vrijheidsgraden (schatting):

T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN

2

2

1

1

2121

21

2121

21²²

)()()()(

n

s

n

s

µXX

s

XXt

xx

xx

1

²

1

²

²²

2

2

2

2

1

2

1

1

2

2

2

1

1

n

n

s

n

n

s

n

s

n

s

df

54 Hoofdstuk 5: Twee gemiddelden

Page 55: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

5. Beslissingsregels

a. overschrijdingskansen - H0 verwerpen indien:

Pl (tx1-x2) ≤ α? >> linkseenzijdig

Pr (tx1-x2) ≤ α? >> rechtseenzijdig

Pd (tx1-x2) ≤ α? >> tweezijdig

b. kritieke waarden : H0 verwerpen indien:

vb. voor α = .05 en df = 17. (Andere α of df -> andere kritieke waarden!!)

tx1-x2 ≤ -1.74 >> linkseenzijdig

tx1-x2 ≥ 1.74 >> rechtseenzijdig

tx1-x2 ≤ -2.11 of ≥ 2.11 >> tweezijdig

T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN

55 Hoofdstuk 5: Twee gemiddelden

Page 56: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

4. Significantie?

kritieke t-waarde opzoeken in tabel

-> df = 11+12-2 = 21 en alpha = 0.05 en 2-zijdig

-> 2.08

5. t-score vergelijken met kritieke t-score

-0.698 > -2.08 dus H0 niet verwerpen

Besluit?

T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN

56 Hoofdstuk 5: Twee gemiddelden

Page 57: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

• Demo SPSS – independent samples t-test

• Muziekvoorkeuren

Waarom luisteren we liever naar onze favoriete muziek dan naar andere muziek? Dopamineproductie vergelijken bij luisteren naar favoriete vs niet-favoriete muziek.

T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN IN SPSS

57 Hoofdstuk 5: Twee gemiddelden

Page 58: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

6. Effectgrootte

7. Rapporteren

Om na te gaan of er bij het luisteren naar favoriete muziek meer dopamine aanwezig is in de hersenen dan bij het luisteren naar niet-favoriete muziek, werd een independent samples t-test uitgevoerd. Gemiddeld werd er meer dopamine gemeten in de conditie met favoriete muziek (M = 16.03, SD = 2.66) dan in de conditie met niet-favoriete muziek (M = 13.96, SD = 2.94). Dit effect was significant op niveau α = .05, t(58) = 2.86, p = .006, r = .12.

T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN

58 Hoofdstuk 5: Twee gemiddelden

Page 59: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Verschil tussen 2 medianen ipv tussen 2 gemiddelden omdat variabele ook op ordinaal niveau kan gemeten worden

1. Toetsingssituatie

Verschillen de scores in populatie 1 over het algemeen van de scores in populatie 2 waaruit de steekproeven afkomstig zijn?

Vb. Verschillen mannen en vrouwen in opleidingsniveau ( = ordinale variabele)?

= nonparametrische variant van onafhankelijke t-toets

2. Voorwaarden

onafhankelijke steekproeven

minstens ordinaal meetniveau

scores hoeven niet normaal verdeeld te zijn

WILCOXON RANK-SUM / MANN-WHITNEY TOETS

59 Hoofdstuk 5: Twee gemiddelden

Page 60: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

3. Hypotheses

WILCOXON RANK-SUM / MANN-WHITNEY TOETS

tweezijdig H0: θ1 = θ2 H1: θ1 ≠ θ2

rechtseenzijdig H0: θ1 ≤ θ2 H1: θ1 > θ2

linkseenzijdig H0: θ1 ≥ θ2 H1: θ1 < θ2

60 Hoofdstuk 5: Twee gemiddelden

Page 61: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

4. Toetsingsgrootheid

U bij Mann-Whitney

W bij Wilcoxon

SPSS: Analyze > nonparametric > 2 independent samples

5. Beslissingsregel

Is de gevonden P (Asymp. Sig. 2-tailed) kleiner dan α ?

ja: verwerp H0

nee: verwerp H0 niet

Ter herinnering: SPSS geeft 2-zijdige overschrijdingskans

-> als je éénzijdige overschrijdingskans nodig hebt (omdat je links- of rechtszijdig wil toetsen): overschrijdingskans uit SPSS delen door 2 en kijken of dat getal ≤ α (bv. 0.05)

WILCOXON RANK-SUM / MANN-WHITNEY TOETS

61 Hoofdstuk 5: Twee gemiddelden

Page 62: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

2 groepen vergelijken op basis van ordinale schaal

Berekening van W:

a. Scores ordenen en rangen toekennen:

b. Rangensom per groep berekenen:

groep 1: 1 + 3.5 + 7 + 9 + 9 + 12 = 41.5

groep 2: 2 + 3.5 + 5 + 6 + 9 + 11 = 36.5

c. Toetsingsgrootheid = kleinste rangensom:

Ws = 36.5

WILCOXON RANK-SUM / MANN-WHITNEY TOETS

Score Groep Initiële

rang

Defintieve

rang

3 1 1 1

5 2 2 2

6 1 3 3.5

6 2 4 3.5

8 2 5 5

10 2 6 6

14 1 7 7

15 1 8 9

15 2 9 9

15 1 10 9

18 2 11 11

21 1 12 12

62 Hoofdstuk 5: Twee gemiddelden

Page 63: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

d. Ws omzetten naar z-score:

wiskundige verwachting:

standaarddeviatie:

z-formule:

overschrijdingskans:

WILCOXON RANK-SUM / MANN-WHITNEY TOETS

63 Hoofdstuk 5: Twee gemiddelden

Page 64: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

• Demo SPSS – Mann-Whitney / Wilcoxon Rank-Sum

• Voorkeur voor muziek meten aan de hand van ordinale schaal:

WILCOXON RANK-SUM / MANN-WHITNEY TOETS

Ik studeer nog liever drie dagen

onophoudelijk inductieve

statistiek dan hieraan deel te

nemen

Een documentaire

over het

paargedrag van

de bidsprinkhaan

lijkt me

opwindender dan

dit experiment

Deelname aan dit

experiment maakt

me eigenlijk

warm noch koud

Het evenaart

geen

verjaardagsfeest,

maar komt toch al

in de buurt

Ik heb me sinds mijn kindertijd

niet meer zo gelukkig gevoeld

64 Hoofdstuk 5: Twee gemiddelden

Page 65: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

6. Effectgrootte

7. Rapportering

Om na te gaan of het subjectief welbevinden van mensen groter is bij het luisteren naar favoriete muziek in tegenstelling tot niet-favoriete muziek werd een Mann-Whitney toets uitgevoerd. De score voor subjectief welbevinden was hoger in de conditie met favoriete muziek (Mdn = 4) dan in de conditie met niet-favoriete muziek (Mdn = 3). Dit verschil was significant op α = .05-niveau, Ws = 167.5, z = -2.767, p = .006, r = .51.

WILCOXON RANK-SUM / MANN-WHITNEY TOETS

65 Hoofdstuk 5: Twee gemiddelden

Page 66: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

interval/ ordinaal

nominaal

1

nominaal

> 1

1

one sample t-test / z-test

1

2

> 2

interval/ ordinaal

onafh.

onafh.

onafh.

afh.

afh.

independent t-test / z-test

dependent t-test

one way ANOVA

repeated measures ANOVA

Pearson correlation

nominaal

interval

gemengd

afh.

gemengd

n-way ANOVA

repeated measures ANOVA

mixed design ANOVA

multiple regression

Pearson chi-square

multiple regression

nominaal/ ordinaal

onafh.

type AV? aantal OV? type OV? hoeveel populaties?

categorieën afhankelijk?

parametrisch non-parametrisch

Rank-sum

Signed-ranks

Kruskal-Wallis

Friedman’s ANOVA

Spearman correlation

niet in dit boek chi-square goodness

of fit

1

≥ 2

chi-square goodness of fit

onafh.

•Workshop Inductieve Statistiek •66

Page 67: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

1. Toetsingssituatie

Verschilt het gemiddelde in populatie 1 van het gemiddelde in populatie 2 waaruit de steekproeven afkomstig zijn?

Belangrijk: afhankelijke steekproeven zoals bij herhaalde metingen, gematchte steekproeven

2. Voorwaarden

steekproeven zijn afhankelijk

populaties zijn normaal verdeeld

Indien populaties niet normaal zijn verdeeld moet n1 > 30 en n2 > 30 (dus het aantal paren moet > 30)

T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN, AFH. STEEKPROEVEN

67

Hoofdstuk 6: Twee gemiddelden uit afhankelijke steekproeven

Page 68: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

3. Hypothesen

V = verschil per paar (steekproef1 – steekproef2)

Linkseenzijdig H0: µv ≥ 0

H1: µv < 0

Rechtseenzijdig H0: µv ≤ 0

H1: µv > 0

Tweezijdig H0: µv = 0

H1: µv ≠ 0

T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN, AFH. STEEKPROEVEN

1 2 3 4 5 6 7 8

σ 1 e n σ 2 b e k e n d ? J a J a J a N e e N e e J a N e e N e e

p o p u l a t i e s N v e r d e e l d ? J a J a N e e J a N e e N e e J a N e e

n 1 e n n 2 ≥ 1 0 0 < 1 0 0 ≥ 1 0 0 ≥ 1 0 0 ≥ 1 0 0 < 1 0 0 < 1 0 0 < 1 0 0

t t t t t - w e l t a l s n 1

e n n 2 > 3 0

- g e e n t a l s

n 1 e n n 2 <

3 0

t - w e l t a l s n 1

e n n 2 > 3 0

- g e e n t a l s

n 1 e n n 2 <

3 0

68

Hoofdstuk 6: Twee gemiddelden uit afhankelijke steekproeven

Page 69: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

4. Toetsingsgrootheid

t-score van het gemiddelde verschil v

aantal paren

standaarddeviatie van de verschilscores

gemiddelde verschil veronderstelde gemiddelde verschil tussen 2 steekproeven populaties

Kansverdeling? Student t-verdeling met df = n-1

T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN, AFH. STEEKPROEVEN

ns

Vt

v

v

v

69

Hoofdstuk 6: Twee gemiddelden uit afhankelijke steekproeven

Page 70: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

4. t score berekenen

V = .5569 sv = .6023

T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN, AFH. STEEKPROEVEN

Score op test

P voor na Verschil(voor-na)

1 4.52 4.12 .40

2 3.60 3.44 .16

3 3.88 1.92 1.96

4 4.36 4.08 .28

5 4.52 3.52 1.00

6 3.60 2.44 1.16

7 3.92 3.72 .20

8 3.72 3.33 .39

9 3.52 3.52 .00

10 3.68 3.08 .60

11 3.88 3.88 .00

12 4.52 4.00 .52

13 3.04 2.72 .32

14 3.96 3.28 .68

15 4.32 2.52 1.80

16 4.44 4.44 .00

17 3.96 3.96 .00

8123.31760230.

05569.

t

70

Hoofdstuk 6: Twee gemiddelden uit afhankelijke steekproeven

Page 71: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Voorbeeld: ratten en tinnitus in SPSS

Onderzoeksvraag: kunnen ratten door “herprogrammeren” van neuronen in de auditieve cortex van hun tinnitus verlost worden?

17 ratten worden voor en na het toepassen van de techniek getest. De afhankelijke variabele wordt bepaald door het aantal fouten dat de ratten maken in het onderscheiden van tonen, en wordt gemeten op intervalniveau.

Navzer D. Engineer, Jonathan R. Riley, Jonathan D. Seale, Will A. Vrana, Jai A. Shetake, Sindhu P.

Sudanagunta, Michael S. Borland, Michael P. Kilgard. Reversing pathological neural activity using targeted plasticity.Nature, 2011; DOI: 10.1038/nature09656

T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN, AFH. STEEKPROEVEN

71

Hoofdstuk 6: Twee gemiddelden uit afhankelijke steekproeven

Page 72: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

6. Effectgrootte

7. Rapporteren

Om na te gaan of de ratten beter presteerden op de frequentie-test na de behandeling werd een t-test voor afhankelijke steekproeven uitgevoerd. De ratten maakten significant minder fouten na (M = 3.41, SD = .69) dan voor de behandeling (M = 3.97, SD = .43), t(16) = 3.814, p = .002, r = .69 .

T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN, AFH. STEEKPROEVEN

72

Hoofdstuk 6: Twee gemiddelden uit afhankelijke steekproeven

Page 73: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

1. Toetsingssituatie

Verschilt het gemiddelde in populatie 1 van het gemiddelde in populatie 2 waaruit de steekproeven afkomstig zijn?

Belangrijk: afhankelijke steekproeven (zie les over steekproeven) zoals bij herhaalde metingen, gematchte steekproeven

= nonparametrische variant van afhankelijke t-toets

2. Voorwaarden

afhankelijke steekproeven

minstens ordinaal meetniveau (achterliggende variabele is continu)

scores hoeven niet normaal verdeeld te zijn

WILCOXON RANGTEKENTOETS

73

Hoofdstuk 6: Twee gemiddelden uit afhankelijke steekproeven

Page 74: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

3. Hypotheses

V = verschil binnen elk paar scores

Linkseenzijdig H0: θv ≥ 0

H1: θv < 0

Rechtseenzijdig H0: θv ≤ 0

H1: θv > 0

Tweezijdig H0: θv = 0

H1: θv ≠ 0

concentratiescores hoger op woensdag dan op vrijdag?

H1: woensdag - vrijdag > 0 of θv > 0

H0: woensdag – vrijdag ≤ 0 of θv ≤ 0

WILCOXON RANGTEKENTOETS

74

Hoofdstuk 6: Twee gemiddelden uit afhankelijke steekproeven

Page 75: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

4. Toetsingsgrootheid

Toetsingsgrootheid = kleinste rangensom, hier: T- = 1

WILCOXON RANGTEKENTOETS

vrijdag woensdag verschil |verschil| rang Rang + Rang -

15 28 13 13 2.5 2.5

35 35 0 tie

16 35 19 19 6 6

26 22 -4 4 1 1

19 39 20 20 7 7

17 32 15 15 4.5 4.5

27 27 0 tie

16 29 13 13 2.5 2.5

13 36 23 23 8 8

20 35 15 15 4.5 4.5

35 1

75

Hoofdstuk 6: Twee gemiddelden uit afhankelijke steekproeven

Page 76: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

5. Beslissingsregel

overschrijdingskansen met z-toets

met:

T = kleinste van rangensommen

n = aantal paren – aantal ties

WILCOXON RANGTEKENTOETS

𝑧𝑇 =𝑇−𝑇

𝑆𝐸=

𝑇−𝑛(𝑛+1)

4

𝑛 𝑛+1 (2𝑛+1)

24

=1−

8(8+1)

4

8 8+1 (16+1)

24

=1−18

7.14=-2.38

76

Hoofdstuk 6: Twee gemiddelden uit afhankelijke steekproeven

Page 77: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Demo SPSS: concentratiescores woensdag versus vrijdag

Berekenen van de medianen via Analyze > Descriptive statistics > Frequencies > Statistics

WILCOXON RANGTEKENTOETS

77

Hoofdstuk 6: Twee gemiddelden uit afhankelijke steekproeven

Page 78: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

6. Effectgrootte

Opgelet: N = totaal aantal observaties, niet aantal paren!

7. Rapporteren

Om na te gaan of de concentratiescores variëren in functie van het moment in de week werd een Wilcoxon signed rank toets uitgevoerd. De scores waren significant hoger op vrijdag (Mdn = 33.5) dan op woensdag (Mdn = 18), z = -2.39, p = .017, r = -.53 .

WILCOXON RANGTEKENTOETS

78

Hoofdstuk 6: Twee gemiddelden uit afhankelijke steekproeven

Page 79: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

OEFENINGEN

Handboek H4: 3 & 4 H5: 2 & 3 H6: 3

Page 80: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Variantieanalyse: one- en two-way ANOVA

& Kruskal-Wallis

Page 81: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

interval/ ordinaal

nominaal

1

nominaal

> 1

1

one sample t-test / z-test

1

2

> 2

interval/ ordinaal

onafh.

onafh.

onafh.

afh.

afh.

independent t-test / z-test

dependent t-test

one way ANOVA

repeated measures ANOVA

Pearson correlation

nominaal

interval

gemengd

afh.

gemengd

n-way ANOVA

repeated measures ANOVA

mixed design ANOVA

multiple regression

Pearson chi-square

multiple regression

nominaal/ ordinaal

onafh.

type AV? aantal OV? type OV? hoeveel populaties?

categorieën afhankelijk?

parametrisch non-parametrisch

Rank-sum

Signed-ranks

Kruskal-Wallis

Friedman’s ANOVA

Spearman correlation

niet in dit boek chi-square goodness

of fit

1

≥ 2

chi-square goodness of fit

onafh.

•Hoofdstuk 7: Variantieanalyse •81

Page 82: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Toetsen voor verschillen tussen meer dan 2 gemiddelden

- is er een verschil in het welbevinden van kinderen met ouders die autoritair, autoritatief of permissief opvoeden?

-> telkens 1 OV (vb. opvoedingsstijl) met telkens meer dan 2 waarden (vb. 3)

-> telkens 1 AV (vb. welbevinden)

eenwegs (‘one way’) variantie-analyse (‘ANOVA’)

Bij twee OV: tweewegs (‘two way’) variantie analyse (zie volgende les)

Bij meer dan één AV: MANOVA (niet in Statistiek II)

VARIANTIEANALYSE

82 Hoofdstuk 7: Variantieanalyse

Page 83: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

1. Toetsingssituatie

Is er een verschil in gemiddelde tussen groep a, b, c, … op variabele Y?

of

Is er een effect van variabele X (met niveau’s a, b, c,..) op variabele Y?

en:

Indien er een effect is, tussen welke groepen is er een verschil? (= post hoc toetsing)

VARIANTIEANALYSE

83 Hoofdstuk 7: Variantieanalyse

Page 84: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

2. Voorwaarden

• AV is gemeten op intervalniveau

• OV wordt als nominaal beschouwd (ook al is OV soms ordinaal)

• scores van AV zijn in elke populatie normaal verdeeld of aantal deelnemers is in elke populatie groter dan 30

• varianties in populaties zijn gelijk (homogeniteit)

• onafhankelijke steekproeven

Assumptie van normaliteit en homogeniteit minder strikt bij gelijke steekproeven

VARIANTIEANALYSE

84 Hoofdstuk 7: Variantieanalyse

Page 85: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

3. Hypothesen

H0: alle populatiegemiddelden zijn aan elkaar gelijk:

µa = µb = µc = … = µj als er J populaties zijn

H1: minstens twee populatiegemiddelden zijn niet gelijk aan elkaar

µj ≠ µj’ voor minstens één paar van j en j’

Dus H1 is NIET µa ≠ µb ≠ µc ≠… ≠ µj

H0 wordt getoetst door gebruik te maken van varianties:

De tussen-groeps-variantie of between-groups variance

mean square between (MSb)

De binnen-groeps-variantie of within-groups variance

mean square within (MSw)

VARIANTIEANALYSE

85 Hoofdstuk 7: Variantieanalyse

Page 86: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

VARIANTIEANALYSE

86

Within groups

Hoofdstuk 7: Variantieanalyse

Page 87: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

VARIANTIEANALYSE

87

Between groups

Within groups

Hoofdstuk 7: Variantieanalyse

Page 88: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Wanneer de verschillen tussen groepsgemiddelden groter worden en de verschillen binnen elke groep ongeveer hetzelfde blijven wordt de between-groups variantie groter ten opzichte van de within-groups varianties.

Dus: de verhouding between-groups variantie/within-groups variantie zegt iets over het verschil tussen groepsgemiddelden.

VARIANTIEANALYSE

88

Between groups

Within groups

Hoofdstuk 7: Variantieanalyse

Page 89: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

VARIANTIEANALYSE

89

Between groups

Within groups

Hoofdstuk 7: Variantieanalyse

Page 90: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

MSw = verschillen te wijten aan verschillen tussen personen binnen dezelfde groep

= inter-individuele verschillen die niet te wijten zijn aan het effect van de OV

= foutenvariantie (varfout)

MSb = variantie van groepsgemiddelden + variantie van scores rondom groepsgemiddelden

= variantie van de effecten van OV (vareffect) + foutenvariantie (varfout)

MSw = varfout

MSb = vareffect + varfout

VARIANTIEANALYSE

90 Hoofdstuk 7: Variantieanalyse

Page 91: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

MSb = vareffect + varfout

MSw = varfout

-> ALS H0 waar is, dwz. vareffect zeer klein is of gelijk is aan 0

DAN: MSb = MSw of MSb / MSw = 1

-> ALS H0 niet waar is, dwz. vareffect verschilt van 0

DAN: MSb > MSw of MSb / MSw > 1

VARIANTIEANALYSE

91 Hoofdstuk 7: Variantieanalyse

Page 92: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

4. Toetsingsgrootheid

Df b = J – 1 (J =aantal groepen)

Df w = N – J (N = totaal aantal waarnemingen; J = aantal groepen)

Kansverdeling: F-verdeling (zie bijlage)

Vb.

Met df b = 3 – 1 = 2 en df w = 27 – 3 = 24

VARIANTIEANALYSE

92

ww

bb

w

b

dfSS

dfSS

MS

MSF

/

/

13.776.2

68.19

24/27.66

2/35.39F

Hoofdstuk 7: Variantieanalyse

Page 93: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

5. Beslissingsregels

a. Overschrijdingskansen (niet in tabel)

Is P r (F) ≤ α ?

ja, verwerp H0

neen, verwerp H0 niet

Vb. P r (F = 7.13) = 0.0037 voor df b = 2 , df w= 24

P r (= 0.0037) < 0.05 dus H0 verwerpen

VARIANTIEANALYSE

93 Hoofdstuk 7: Variantieanalyse

Page 94: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

b. kritieke waarden

Is F ≥ kritieke F waarde bij

df teller = df b = J – 1 ja, verwerp H0

df noemer = df w = N - J neen, verwerp H0 niet

kritieke F waarde df b = 2 , df w= 24 bij alpha = 0.05 = 3.4 (zie tabel)

F (7.13) > Fkritiek (3.4) dus H0 verwerpen

VARIANTIEANALYSE

94 Hoofdstuk 7: Variantieanalyse

Page 95: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

VARIANTIEANALYSE

95

ANOVA

TOETSGEG

39,355 2 19,677 7,126 ,004

66,275 24 2,761

105,630 26

Between Groups

Within Groups

Total

Sum of

Squares df Mean Square F Sig.

Hoofdstuk 7: Variantieanalyse

Page 96: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Wanneer H0 verworpen is weten we dat minstens 2 groepen verschillen mbt. hun gemiddelde

-> welke groepen?

= post-hoc toetsing

We zouden via t-toetsen elk paar van groepen met elkaar kunnen vergelijken (vb. groep 1-2, 2-3, 1-3). Bij elke t-toets gebruiken we een α = 0.05. Probleem: door herhaaldelijk t-toetsen uit te voeren neemt de fout van de 1e soort toe.

Oplossing: bij posthoc toetsing corrigeren voor deze hogere kans op fouten van de 1e soort.

>> Bonferroni correctie: wanneer we drie groepen vergelijken, alleen besluiten dat er een significant verschil is als P ≤ 0.05/3 (ipv. 0.05)

(andere mogelijke correcties: Tukey, Scheffé,...)

VARIANTIEANALYSE

96 Hoofdstuk 7: Variantieanalyse

Page 97: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Post-hoc toetsing in SPSS:

SPSS output houdt al rekening met deze correctie; dus de P waarden zijn al gecorrigeerd.

Als P ≤ 0.05 dan is er een significant verschil tussen beide groepen

vb. enkel significant verschil ts. Groep 1-3

VARIANTIEANALYSE

97

Multiple Comparisons

Dependent Variable: TOETSGEG

Bonferroni

-1,2667 ,76353 ,330 -3,2317 ,6984

-3,0417* ,80747 ,003 -5,1198 -,9635

1,2667 ,76353 ,330 -,6984 3,2317

-1,7750 ,78824 ,101 -3,8037 ,2537

3,0417* ,80747 ,003 ,9635 5,1198

1,7750 ,78824 ,101 -,2537 3,8037

(J) GROEP

2,00

3,00

1,00

3,00

1,00

2,00

(I) GROEP

1,00

2,00

3,00

Mean

Difference

(I-J) Std. Error Sig. Lower Bound Upper Bound

95% Confidence Interval

The mean difference is significant at the .05 level.*.

Hoofdstuk 7: Variantieanalyse

Page 98: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Voorbeeld ANOVA in SPSS: stressreductie door chocolade bij dansers

VARIANTIEANALYSE

98 Hoofdstuk 7: Variantieanalyse

Page 99: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

ANOVA

stress

Sum of

Squares

df Mean Square F Sig.

Between Groups 714,490 2 357,245 3,136 ,048

Within Groups 11277,471 99 113,914

Total 11991,961 101

6. Effectgrootte

𝑟 =𝑆𝑆𝑏𝑒𝑡𝑤𝑒𝑒𝑛

𝑆𝑆𝑡𝑜𝑡𝑎𝑙

𝑟 =714.49

11991,961= 0.060 = 0.24

7. Rapportering Er was een significant effect van chocolade op het stressniveau van de dansers, F(2, 99) = 3.14, p = .048, r = .24 . De dansers die geen chocolade aten rapporteerden een hoger stressniveau (M = 65.5, SD = 10.54) dan dansers die twee repen chocolade aten (M = 59.12, SD = 12.27). Het stressniveau van de dansers die één reep chocolade aten (M = 61.32, SD = 8.95) verschilde niet significant van de andere condities.

VARIANTIEANALYSE

99 Hoofdstuk 7: Variantieanalyse

Page 100: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Variantieanalyse: two way ANOVA

Page 101: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

interval/ ordinaal

nominaal

1

nominaal

> 1

1

one sample t-test / z-test

1

2

> 2

interval/ ordinaal

onafh.

onafh.

onafh.

afh.

afh.

independent t-test / z-test

dependent t-test

one way ANOVA

repeated measures ANOVA

Pearson correlation

nominaal

interval

gemengd

afh.

gemengd

n-way ANOVA

repeated measures ANOVA

mixed design ANOVA

multiple regression

Pearson chi-square

multiple regression

nominaal/ ordinaal

onafh.

type AV? aantal OV? type OV? hoeveel populaties?

categorieën afhankelijk?

parametrisch non-parametrisch

Rank-sum

Signed-ranks

Kruskal-Wallis

Friedman’s ANOVA

Spearman correlation

niet in dit boek chi-square goodness

of fit

1

≥ 2

chi-square goodness of fit

onafh.

Page 102: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Twee vragen:

1. vraag over hoofdeffect van elke OV op AV

2. vraag over interactie-effect tussen OV1 en OV2 op AV

hoe hebben de twee OV’s samen in combinatie een effect op AV?

is het effect van de ene OV op AV anders naargelang het niveau van de andere OV?

- is het effect van ses op toekomstbeeld anders voor jongens dan voor meisjes?

- is het effect van chocolade op stressreductie anders voor beginners dan voor gevorderden?

TWEEWEGS-VARIANTIEANALYSE

102 Hoofdstuk 7: Variantieanalyse

Page 103: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

1. Toetsingssituatie

a. Is er een effect van variabele A (met niveaus a1, a2, …) op variabele Y?

b. Is er een effect van variabele B (met niveaus b1, b2, …) op variabele Y?

= 2 hoofdeffecten

c. Is het effect van variabele A anders naargelang het niveau van variabele B (of omgekeerd)? Wat is het effect van de combinatie van A en B op Y?

= interactie-effect tussen A en B

d. Indien er een hoofdeffect is van A, tussen welke groepen van A is er een verschil?

e. Indien er een hoofdeffect is van B, tussen welke groepen van B is er een verschil?

= post hoc toetsing

TWEEWEGS-VARIANTIEANALYSE

103 Hoofdstuk 7: Variantieanalyse

Page 104: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

2. Voorwaarden

• AV is gemeten op intervalniveau

• OV’s worden als nominaal beschouwd (ook al is OV soms ordinaal)

• scores van AV zijn in alle populaties normaal verdeeld

• varianties in populaties zijn gelijk (F-toets of Levene’s toets)

• onafhankelijke steekproeven

TWEEWEGS-VARIANTIEANALYSE

104 Hoofdstuk 7: Variantieanalyse

Page 105: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

3. Hypothesen

Wat is het effect van ses en geslacht op de toekomstverwachting van jongeren?

OV1 (A) = ses (laag, midden, hoog)

OV2 (B) = geslacht (jongens, meisje)

AV = toekomstbeeld score ts. -10 en +10

-> 3 x 2 design (dus 6 populaties - zie les 2: waarden van OV bepalen aantal populaties)

a. Is er een hoofdeffect van variabele A (met i niveaus)?

H0: alle populatiegemiddelden van A zijn aan elkaar gelijk

µ1 = µ2 = µ3 = … = µi als er I groepen zijn van A

H1: minstens twee populatiegemiddelden zijn niet gelijk aan elkaar

µi ≠ µi’ voor minstens één paar van i en i’

Of in termen van varianties H0: σ²A = σ²W of σ²A / σ²W = 1

H1: σ²A > σ²W of σ²A / σ²W > 1

TWEEWEGS-VARIANTIEANALYSE

105

0

1

2

3

4

5

6

7

laag midden hoog

To

eko

mstb

eeld

SES

Hoofdstuk 7: Variantieanalyse

Page 106: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

b. Is er een hoofdeffect van variabele B (met j niveaus)?

H0: alle populatiegemiddelden van B zijn aan elkaar gelijk

µ1 = µ2 = µ3 = … = µj als er J groepen zijn van B

H1: minstens twee populatiegemiddelden zijn niet gelijk aan elkaar

µj ≠ µj’ voor minstens één paar van j en j’

Of in termen van varianties H0: σ²B = σ²W of σ²B / σ²W = 1

H1: σ²B > σ²W of σ²B / σ²W > 1

TWEEWEGS-VARIANTIEANALYSE

106

0

1

2

3

4

5

6

jongens meisjes

To

eko

mstb

eeld

geslacht

Hoofdstuk 7: Variantieanalyse

Page 107: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

c. Is er een interactie-effect van variabele AxB ?

H0: alle populatiegemiddelden van combinatie AxB zijn aan elkaar gelijk: µ11 = µ12 = … = µij als er I x J groepen zijn

H1: minstens twee populatiegemiddelden zijn niet gelijk aan elkaar

µij ≠ µi’j’ voor minstens één paar van ij en i’j’

Of in termen van varianties H0: σ²AxB = σ²W of σ²AXB / σ²W = 1

H1: σ²AXB > σ²W of σ²AXB / σ²W > 1

TWEEWEGS-VARIANTIEANALYSE

107

0

1

2

3

4

5

6

7

8

9

laag midden hoog

To

eko

mstb

eeld

SES

jongens

meisjes

Hoofdstuk 7: Variantieanalyse

Page 108: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

4. Toetsingsgrootheid

4.1 F toets voor hoofdeffect van A

met dfA = I – 1 (I = aantal niveaus van A)

met dfW = N – (I x J) (N = totaal aantal )

vb. FA = 10/2.02 = 4.95 met dfA = 2 dfW = 24

4.2 F toets voor hoofdeffect van B

met dfB = J – 1 (J = aantal niveaus van B)

met dfW = N – (I x J) (N = totaal aantal )

vb. FB = 0.53/2.02 = 0.26 met dfB = 1 dfW = 24

4.3 F toets voor interactie-effect van AxB

met dfAxB = (I - 1). (J – 1)

met dfW = N – (I x J) (N = totaal aantal)

vb. FAxB = 30.54/2.02 = 15.12 met dfAxB = 2 dfW = 24

TWEEWEGS-VARIANTIEANALYSE

108

WW

AA

W

AA

dfSS

dfSS

MS

MSF

/

/

WW

BB

W

BB

dfSS

dfSS

MS

MSF

/

/

WW

AxBAxB

W

AxBAxB

dfSS

dfSS

MS

MSF

/

/

Hoofdstuk 7: Variantieanalyse

Page 109: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

5. Beslissingsregels

a. Overschrijdingskansen

Is P r (F) ≤ α?

ja, verwerp H0

neen, verwerp H0 niet

>> overschrijdingskans per mogelijk effect (hoofd / interactie) in ANOVA-tabel SPSS

b. Kritieke waarden

Ook mogelijk via tabel met F-waarden.

TWEEWEGS-VARIANTIEANALYSE

109 Hoofdstuk 7: Variantieanalyse

Page 110: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

significant hoofdeffect ses: jongens en meisjes samengenomen is er een effect van ses

geen significant hoofdeffect geslacht: 3 ses niveaus samengenomen is er geen significant verschil tussen j en m

een interactie-effect: het verschil ts. j en m is niet hetzelfde voor alle niveaus van ses

>> post-hoc toetsing nodig om te weten tussen welke groepen er een verschil is. (SPSS)

TWEEWEGS-VARIANTIEANALYSE

110 Hoofdstuk 7: Variantieanalyse

Page 111: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

interactie-effect: het verschil ts. jongens en meisjes is niet hetzelfde voor alle niveaus van ses (lijnen lopen niet parallel)

TWEEWEGS-VARIANTIEANALYSE

111

0

2

4

6

8

laag midden hoog

To

eko

mstb

eeld

SES

hoofdeffect SES

0

2

4

6

jongens meisjesTo

eko

mstb

eeld

geslacht

geen hoofdeffect geslacht

0

1

2

3

4

5

6

7

8

9

laag midden hoog

To

eko

mstb

eeld

SES

interactie effect

jongens

meisjesses

laag midden hoog

jongens 5,6 5,6 4,2 5,13

meisjes 2,4 4,4 7,8 4,87

4 5 6

Hoofdstuk 7: Variantieanalyse

Page 112: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Post hoc analyse bij two-way ANOVA:

Zie post-hoc bij one-way ANOVA: niveaus binnen 1 OV vergelijken.

(overbodig als er maar 2 niveaus zijn – bv. geslacht. Kijk dan naar gemiddeldentabel)

Om alle cellen paarsgewijs te vergelijken: simple effects – enkel met SPSS syntax (zie boek p. 163)

TWEEWEGS-VARIANTIEANALYSE

112

ses

laag midden hoog

jongens 5,6 5,6 4,2 5,13

meisjes 2,4 4,4 7,8 4,87

4 5 6

ses

laag midden hoog

jongens 5,6 5,6 4,2 5,13

meisjes 2,4 4,4 7,8 4,87

4 5 6

Hoofdstuk 7: Variantieanalyse

Page 113: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

6. Effectgrootte

Partial Eta squared: interpreteerbaar

zoals r

te berekenen met SPSS

Via ANOVA-dialoogbox > options >

estimates of effect size aanvinken

TWEEWEGS-VARIANTIEANALYSE

113 Hoofdstuk 7: Variantieanalyse

Page 114: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Demo two-way ANOVA: effect van chocolade én dansniveau op stress?

TWEEWEGS-VARIANTIEANALYSE

114 Hoofdstuk 7: Variantieanalyse

Page 115: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

7. Rapportering

Eerst de potentiële hoofdeffecten bespreken (zie one-way ANOVA, inclusief eventuele post-hoc)

gegevens: gemiddelden, SD, F-waarde, p-waarde, r

Daarna potentieel interactie-effect, zelfde gegevens.

Hoofdeffecten zijn niet meer relevant als er een interactie-effect is, maar moeten wel gerapporteerd worden. Interpretatie van de resultaten gaat enkel over interactie-effect.

TWEEWEGS-VARIANTIEANALYSE

115 Hoofdstuk 7: Variantieanalyse

Page 116: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

interval/ ordinaal

nominaal

1

nominaal

> 1

1

one sample t-test / z-test

1

2

> 2

interval/ ordinaal

onafh.

onafh.

onafh.

afh.

afh.

independent t-test / z-test

dependent t-test

one way ANOVA

repeated measures ANOVA

Pearson correlation

nominaal

interval

gemengd

afh.

gemengd

n-way ANOVA

repeated measures ANOVA

mixed design ANOVA

multiple regression

Pearson chi-square

multiple regression

nominaal/ ordinaal

onafh.

type AV? aantal OV? type OV? hoeveel populaties?

categorieën afhankelijk?

parametrisch non-parametrisch

Rank-sum

Signed-ranks

Kruskal-Wallis

Friedman’s ANOVA

Spearman correlation

niet in dit boek chi-square goodness

of fit

1

≥ 2

chi-square goodness of fit

onafh.

•Hoofdstuk 7: Variantieanalyse •116

Page 117: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

1. Toetsingssituatie

Is er een verschil in gemiddelde tussen groep a, b, c, … op variabele Y?

>> zelfde situatie als eenwegs-variantieanalyse.

2. Voorwaarden

AV is niet normaal verdeeld en/of

AV is van ordinaal meetniveau

Chocolade als afrodisiacum? Gemeten met:

KRUSKAL-WALLIS TOETS VOOR VERSCHIL TUSSEN K POPULATIES

117

Seks is absoluut het allerlaatste

waar ik nu aan kan denken.

Ik ervaar niet meer of

minder zin in seks dan op

een doordeweekse dag.

Ik voel een onwaarschijnlijke lust tot

paren – annuleer de voorstelling!

Hoofdstuk 7: Variantieanalyse

Page 118: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

3. Hypothesen

H0: θ1 = θ2 = … = θk

H1= “niet H0”

bij k niveaus van de OV

4. Toetsingsgrootheid

Gebaseerd op rangordening zoals bij Mann-Whitney, grootheid = H

>> analyze > non-parametric > legacy dialogs > k independent samples

(zie boek 7.3.4)

KRUSKAL-WALLIS TOETS VOOR VERSCHIL TUSSEN K POPULATIES

118 Hoofdstuk 7: Variantieanalyse

Page 119: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

5. Beslissingsregel

Is de gerapporteerde overschrijdingskans in SPSS kleiner dan α ?

ja > verwerp H0

nee > verwerp H0 niet

Is er een effect? post-hoc toetsen met meerdere Mann-Whitney/Wilcoxon Rank-Sum. Gebruik zo weinig mogelijk tests en hanteer Bonferroni-correctie:

α / aantal tests.

KRUSKAL-WALLIS TOETS VOOR VERSCHIL TUSSEN K POPULATIES

119 Hoofdstuk 7: Variantieanalyse

Page 120: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Demo Kruskal-Wallis: chocolade als afrodisiacum?

OV : 3 niveaus chocolade – geen, één reep, twee repen

AV: ordinale schaal met 3 niveaus

KRUSKAL-WALLIS TOETS VOOR VERSCHIL TUSSEN K POPULATIES

120 Hoofdstuk 7: Variantieanalyse

Page 121: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

6. Effectgrootte

• Geen effectgrootte voor K-W test algemeen

• Wel effectgrootte van bijhorende Mann-Whitney tests – zie H5

KRUSKAL-WALLIS TOETS VOOR VERSCHIL TUSSEN K POPULATIES

121

Test Statisticsa

lust

Mann-Whitney U 359,500

Wilcoxon W 954,500

Z -2,976

Asymp. Sig. (2-tailed) ,003

a. Grouping Variable: chocolade

Hoofdstuk 7: Variantieanalyse

Page 122: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

7. Rapportering

Een Kruskal-Wallis toets werd uitgevoerd om het effect van het eten van chocolade op de lustgevoelens van dansers na te gaan. Dit effect bleek inderdaad significant, H = 8.71, p = .013. Bijkomend werden de condities zonder chocolade (mean rank = 41), met één reep chocolade (mean rank = 59.91) en twee repen chocolade (mean rank = 53.59) onderling vergeleken door middel van een Wilcoxon rank-sum toets, waarbij een gecorrigeerd significantieniveau van α = .017 werd gehanteerd. Hieruit bleek dat er enkel een significant verschil was tussen de conditie zonder chocolade en de conditie met één reep chocolade (Ws = 954.5, z = -2.976, p = .003, r = -.36). Het verschil tussen de conditie zonder chocolade en de conditie met twee repen chocolade (Ws = 1034.5, z = -1.861, p = .06, r = -.23) noch het verschil tussen de conditie met één reep chocolade en de conditie met twee repen chocolade (Ws = 1105.5, z = -.917, p = .36, r = -.11) waren significant.

KRUSKAL-WALLIS TOETS VOOR VERSCHIL TUSSEN K POPULATIES

122 Hoofdstuk 7: Variantieanalyse

Page 123: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Variantieanalyse bij herhaalde metingen

Page 124: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

De motivatie van 17 voetbalspeelsters wordt gemeten op drie momenten in het voetbalseizoen. We willen nagaan of de motivatie eerder stijgt dan wel daalt door de strenge behandeling door de coach.

Jarmila Kratochvilova, in haar eigen glorietijd bij de Tsjechische nationale atletiekploeg.

HERHAALDE METINGEN ANOVA

124

Hoofdstuk 8: Variantieanalyse herhaalde metingen

Page 125: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

interval/ ordinaal

nominaal

1

nominaal

> 1

1

one sample t-test / z-test

1

2

> 2

interval/ ordinaal

onafh.

onafh.

onafh.

afh.

afh.

independent t-test / z-test

dependent t-test

one way ANOVA

repeated measures ANOVA

Pearson correlation

nominaal

interval

gemengd

afh.

gemengd

n-way ANOVA

repeated measures ANOVA

mixed design ANOVA

multiple regression

Pearson chi-square

multiple regression

nominaal/ ordinaal

onafh.

type AV? aantal OV? type OV? hoeveel populaties?

categorieën afhankelijk?

parametrisch non-parametrisch

Rank-sum

Signed-ranks

Kruskal-Wallis

Friedman’s ANOVA

Spearman correlation

niet in dit boek chi-square goodness

of fit

1

≥ 2

chi-square goodness of fit

onafh.

•Hoofdstuk 8: Variantieanalyse herhaalde metingen

Page 126: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

1. Toetsingssituatie

Is er een verschil in gemiddelde tussen metingen 1, 2, 3, … van variabele Y?

of

Is er een effect van variabele X (metingen 1, 2, 3,..) op variabele Y?

en:

Indien er een effect is, tussen welke metingen is er een verschil? (= post hoc toetsing)

HERHAALDE METINGEN ANOVA

126

Hoofdstuk 8: Variantieanalyse herhaalde metingen

Page 127: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

2. Voorwaarden

• AV is gemeten op intervalniveau

• scores van AV zijn in elke populatie normaal verdeeld of aantal deelnemers is in elke steekproef groter dan 30

• OV wordt als nominaal beschouwd (ook al is OV soms ordinaal)

• afhankelijke steekproeven

• voldaan aan sfericiteits-eis

HERHAALDE METINGEN ANOVA

127

Hoofdstuk 8: Variantieanalyse herhaalde metingen

Page 128: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Sfericiteit?

Varianties van verschilscores moeten ongeveer gelijk zijn aan elkaar:

Mauchly’s test + eventuele correctie

HERHAALDE METINGEN ANOVA

128

Meting 1 Meting 2 Meting 3 Verschil

1-2

Verschil

1-3

Verschil

2-3

1 8 12 14 -4 -6 -2

2 12 16 22 -4 -10 -6

3 46 32 38 14 8 -6

4 41 35 45 6 -4 -10

5 12 29 20 -17 -8 9

6 16 24 30 -8 -14 -6

7 53 35 52 18 1 -17

8 45 42 49 3 -4 -7

9 21 28 35 -7 -14 -7

10 26 31 39 -5 -13 -8

Variantie 113.6 49.82 42.67

Hoofdstuk 8: Variantieanalyse herhaalde metingen

Page 129: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

3. Hypothesen

H0: alle populatiegemiddelden zijn aan elkaar gelijk:

H1: minstens twee populatiegemiddelden zijn niet gelijk aan elkaar

Dus H1 is NIET µa ≠ µb ≠ µc ≠… ≠ µj

HERHAALDE METINGEN ANOVA

129

tweezijdig H0: μ1 = μ2 = … = μj

H1: μi ≠ μj voor minstens 1 paar van i en j

Hoofdstuk 8: Variantieanalyse herhaalde metingen

Page 130: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

4. Prinicipe

Opnieuw vergelijken van effectvariantie met foutenvariantie, maar nu zit de effectvariantie in de within groups variantie!

HERHAALDE METINGEN ANOVA

130

Hoofdstuk 8: Variantieanalyse herhaalde metingen

Page 131: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

HERHAALDE METINGEN ANOVA

131

Hoofdstuk 8: Variantieanalyse herhaalde metingen

Page 132: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

HERHAALDE METINGEN ANOVA

132

Hoofdstuk 8: Variantieanalyse herhaalde metingen

Page 133: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

5. Beslissingsregels

a. Overschrijdingskansen (niet in tabel)

Is P (F) ≤ α ?

ja, verwerp H0

neen, verwerp H0 niet

Vb. P (F = 7.13) = 0.0037 voor dfm = 2 , dferror= 24

P (= 0.0037) < 0.05 dus H0 verwerpen

HERHAALDE METINGEN ANOVA

133

Hoofdstuk 8: Variantieanalyse herhaalde metingen

Page 134: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

5. Beslissingsregels

b. kritieke waarden

Is F ≥ kritieke F waarde bij

dfteller = dfm = k – 1 ja, verwerp H0

dfnoemer = dferror = dfw - dfm neen, verwerp H0 niet

kritieke F waarde df b = 2 , df w= 24 bij alpha = 0.05 = 3.4 (zie tabel)

F (7.13) > Fkritiek (3.4) dus H0 verwerpen

HERHAALDE METINGEN ANOVA

134

Hoofdstuk 8: Variantieanalyse herhaalde metingen

Page 135: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

HERHAALDE METINGEN ANOVA

135

Tests of Within-Subjects Effects

Measure: motivatie

Source Type III Sum of Squares df Mean Square F Sig. Partial Eta Squared

moment Sphericity Assumed 426,303 2 213,152 5,271 ,009 ,201

Greenhouse-Geisser 426,303 1,692 251,939 5,271 ,013 ,201

Huynh-Feldt 426,303 1,824 233,663 5,271 ,011 ,201

Lower-bound 426,303 1,000 426,303 5,271 ,032 ,201

Error(moment) Sphericity Assumed 1698,364 42 40,437

Greenhouse-Geisser 1698,364 35,534 47,796

Huynh-Feldt 1698,364 38,313 44,329

Lower-bound 1698,364 21,000 80,874

Hoofdstuk 8: Variantieanalyse herhaalde metingen

Page 136: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Wanneer H0 verworpen is weten we dat minstens 2 metingen verschillen mbt. hun gemiddelde

-> welke metingen?

= post-hoc toetsing

Zelfde probleem als bij one-way ANOVA voor herhaalde toetsen, dus opnieuw corrigeren voor verhoogde kans op Type 1-fout.

>> Bonferroni correctie

(wanneer we drie groepen vergelijken, alleen besluiten dat er een significant verschil is als P ≤ 0.05/3)

HERHAALDE METINGEN ANOVA

136

Hoofdstuk 8: Variantieanalyse herhaalde metingen

Page 137: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

• SPSS output houdt al rekening met deze correctie; dus de P waarden zijn al gecorrigeerd.

• Als P ≤ 0.05 dan is er een significant verschil tussen beide groepen

• vb. enkel significant verschil ts. Groep 1-3

HERHAALDE METINGEN ANOVA

137

Pairwise Comparisons

Measure: motivatie

(I) moment (J) moment Mean Difference (I-J) Std. Error Sig.b 95% Confidence Interval for Difference

b

Lower Bound Upper Bound

1 2 2,455 2,175 ,815 -3,203 8,112

3 6,182* 2,038 ,019 ,880 11,484

2 1 -2,455 2,175 ,815 -8,112 3,203

3 3,727 1,464 ,056 -,081 7,536

3 1 -6,182* 2,038 ,019 -11,484 -,880

2 -3,727 1,464 ,056 -7,536 ,081

Based on estimated marginal means

*. The mean difference is significant at the ,05 level.

b. Adjustment for multiple comparisons: Bonferroni.

Hoofdstuk 8: Variantieanalyse herhaalde metingen

Page 138: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Voorbeeld ANOVA in SPSS: motivatie van voetbalspeelsters op drie meetmomenten

Aandacht voor correcte invoer van data!

HERHAALDE METINGEN ANOVA

138

Hoofdstuk 8: Variantieanalyse herhaalde metingen

Page 139: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

6. Effectgrootte

Partial Eta squared: η²

• interpreteerbaar zoals r

• te berekenen met SPSS

Via ANOVA-dialoogbox > options > estimates of effect size aanvinken

HERHAALDE METINGEN ANOVA

139

Hoofdstuk 8: Variantieanalyse herhaalde metingen

Page 140: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

7. Rapportering

Om na te gaan of de coachingmethode een effect heeft op de motivatie van de speelsters werd een repeated measures ANOVA uitgevoerd. Hieruit bleek dat er een significant effect van meetmoment op de motivatie was, F(2, 42) = 5.27, p = .009, η² = .201 . In het begin van het voetbalseizoen was de motivatie van de speelsters hoger (M = 47.64, SD = 6.81) dan op het einde van het seizoen (M = 41.45, SD = 5.40, p = .019). Ook vlak na de winterstop was de motivatie van de speelsters hoger (M = 45.18, SD = 5.15) dan op het einde van het seizoen, maar dit verschil benaderde slechts significantie, p = .056.

HERHAALDE METINGEN ANOVA

140

Hoofdstuk 8: Variantieanalyse herhaalde metingen

Page 141: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

1. Toetsingssituatie

Is er een verschil in gemiddelde tussen metingen 1, 2, 3, … van variabele Y?

>> zelfde situatie als herhaalde metingen-variantieanalyse.

2. Voorwaarden

AV is niet normaal verdeeld en/of

AV is van ordinaal meetniveau

Evaluatie van de coach in onderzoek van Evelien:

“Op een schaal van 1 tot 10, hoe sterk wens je de coach op dit moment enkele bijzonder pijnlijke eksterogen toe?”

FRIEDMAN’S ANOVA

141

Hoofdstuk 8: Variantieanalyse herhaalde metingen

Page 142: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

interval/ ordinaal

nominaal

1

nominaal

> 1

1

one sample t-test / z-test

1

2

> 2

interval/ ordinaal

onafh.

onafh.

onafh.

afh.

afh.

independent t-test / z-test

dependent t-test

one way ANOVA

repeated measures ANOVA

Pearson correlation

nominaal

interval

gemengd

afh.

gemengd

n-way ANOVA

repeated measures ANOVA

mixed design ANOVA

multiple regression

Pearson chi-square

multiple regression

nominaal/ ordinaal

onafh.

type AV? aantal OV? type OV? hoeveel populaties?

categorieën afhankelijk?

parametrisch non-parametrisch

Rank-sum

Signed-ranks

Kruskal-Wallis

Friedman’s ANOVA

Spearman correlation

niet in dit boek chi-square goodness

of fit

1

≥ 2

chi-square goodness of fit

onafh.

•Hoofdstuk 8: Variantieanalyse herhaalde metingen

Page 143: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

3. Hypothesen

H0: θ1 = θ2 = … = θk

H1: θi ≠ θj voor minstens 1 paar van i en j

bij k niveaus van de OV

4. Toetsingsgrootheid

Gebaseerd op rangordening zoals bij Mann-Whitney, grootheid = H

>> analyze > non-parametric > legacy dialogs > k independent samples

(zie boek 7.3.4)

FRIEDMAN’S ANOVA

143

Hoofdstuk 8: Variantieanalyse herhaalde metingen

Page 144: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

4. Toetsingsgrootheid

Rangordening zoals bij Kruskal-Wallis, maar ordenen per deelnemer ipv groep

R = de rangensom voor moment/conditie i

N = totale steekproefgrootte

k = aantal meetmomenten/condities

FRIEDMAN’S ANOVA

144

speelster moment 1 moment 2 moment 3 moment 1 moment 2 moment 3

1 4 5 4 1.5 3 1.5 2 5 6 6 1 2.5 2.5 3 2 4 6 1 2 3 4 3 7 7 1 2.5 2.5 5 5 5 5 2 2 2

Ri 6.5 12 11.5

Hoofdstuk 8: Variantieanalyse herhaalde metingen

Page 145: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

5. Beslissingsregel

a. Is de gerapporteerde overschrijdingskans in SPSS kleiner dan α ?

ja > verwerp H0

nee > verwerp H0 niet

b. Is Fr groter dan de kritieke X²-waarde? (df = k – 1)

ja > verwerp H0

nee > verwerp H0 niet

Is er een effect? post-hoc toetsen met meerdere Wilcoxon Signed-Rank toetsen. Gebruik zo weinig mogelijk toetsen en hanteer Bonferroni-correctie:

α / aantal tests.

FRIEDMAN’S ANOVA

145

Hoofdstuk 8: Variantieanalyse herhaalde metingen

Page 146: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Demo Friedman’s ANOVA: evaluatie van de coach

OV : meetmoment in het seizoen

AV: haatgevoelens t.o.v. de coach

FRIEDMAN’S ANOVA

146

Hoofdstuk 8: Variantieanalyse herhaalde metingen

Page 147: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

6. Effectgrootte

Geen effectgrootte voor Friedman’s toets

Wel effectgrootte voor eventuele Wilcoxon Signed-rank toetsen (zie H6)

FRIEDMAN’S ANOVA

147

Hoofdstuk 8: Variantieanalyse herhaalde metingen

Page 148: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

7. Rapportering

Friedman’s ANOVA werd uitgevoerd om het effect van de coachingmethode op de haatgevoelens tegenover de coach na te gaan. Dit effect bleek inderdaad significant, F = 18.87, p < .001. Bijkomend werden paarsgewijze Wilcoxon signed-rank toetsen uitgevoerd om de metingen bij de start van het seizoen (mean rank = 1.34), vlak na de winterstop (mean rank = 2.23) en op het einde van het seizoen (mean rank = 2.43) onderling te vergelijken. Hierbij werd een gecorrigeerd significantieniveau van α = .017 gehanteerd. Uit deze post hoc toetsen bleken significante verschillen tussen de haatgevoelens bij de start van het seizoen en vlak na de winterstop (z = -3.47, p < .001, r = -.52) alsook tussen de haatgevoelens bij de start van het seizoen en op het einde van het seizoen (z = -3.42, p < .001, r = -.51). Er was geen significant verschil tussen de haatgevoelens vlak na de winterstop en op het einde van het seizoen (z = 1.58, p = .11, r = -.24).

FRIEDMAN’S ANOVA

148

Hoofdstuk 8: Variantieanalyse herhaalde metingen

Page 149: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

toetsen voor het verband tussen variabelen met gelijk meetniveau

hoofdstuk 9

STATISTIEK II

Page 150: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Wat is een correlatie? (zie Statistiek I)

De samenhang tussen twee variabelen (sterkte + richting van het verband)

-1 als minimumwaarde en +1 als maximumwaarde

r = +0.87 r = +0.99 r = -0.01

PEARSON CORRELATIE

150

20,00 30,00 40,00 50,00 60,00 70,00

X

20,00

30,00

40,00

50,00

60,00

70,00

80,00

Y

20,00 30,00 40,00 50,00 60,00 70,00

X

40,00

60,00

80,00

100,00

120,00

140,00

Y

20,00 30,00 40,00 50,00 60,00 70,00

X

20,00

40,00

60,00

80,00

100,00

120,00

Y

Hoofdstuk 9: Variabelen met gelijk meetniveau

Page 151: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Formule

met N = aantal paren

PEARSON CORRELATIE

151

r = (𝑥𝑖 − 𝑥 )(𝑦𝑖 − 𝑦 )𝑛

𝑖=1

(𝑁 − 1)𝑠𝑥𝑠𝑦

Hoofdstuk 9: Variabelen met gelijk meetniveau

Page 152: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

1. Toetsingssituatie

Is er een lineair (rechtlijnig) verband tussen twee variabelen?

Vb. is er een positief verband tussen intelligentie en schoolresultaten?

2. Voorwaarden

X en Y zijn gemeten op intervalniveau

X en Y zijn normaal verdeeld in de populatie of N ≥ 30

X en Y zijn bivariaat normaal verdeeld (voor elke X waarde zijn de Y waarden normaal verdeeld)

Homoscedasticiteit (populatievarianties van Y voor elke waarde van X zijn aan elkaar gelijk)

PEARSON CORRELATIE

152

Hoofdstuk 9: Variabelen met gelijk meetniveau

Page 153: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

3. Hypothesen

Linkseenzijdig H0: ρ ≥ 0 H1: ρ < 0

Rechtseenzijdig H0: ρ ≤ 0 H1: ρ > 0

Tweezijdig H0: ρ = 0 H1: ρ ≠ 0

4. Toetsingsgrootheid

met df = N – 2 (N = aantal paren)

Kansverdeling: Student t-verdeling

PEARSON CORRELATIE

153

²1

2.

r

Nrtr

Hoofdstuk 9: Variabelen met gelijk meetniveau

Page 154: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

5. Beslissingsregels

Studenten die meer vooraan in de aula zitten halen ook hogere cijfers op het examen.

Tweezijdig H0: ρ = 0 H1: ρ 0

Steekproef: 32 studenten, r(rij, examen) = -.38

Voor df = 30 en alpha = 0.05 is kritieke waarde (tweezijdig) gelijk aan 2.042 (tabel p. 323 ev.)

Is t l (-2.32) < t kritiek (-2.042)? Ja, dus H0 verwerpen

>> studenten die meer vooraan zitten halen inderdaad hogere cijfers!

PEARSON CORRELATIE

154

32.293.0

14.2

²)39.0(1

232.39.0

²1

2.

r

Nrtr

Hoofdstuk 9: Variabelen met gelijk meetniveau

Page 155: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Determinatiecoëficiënt R²

• R² = r²

• wat is het aandeel van variabele X in de variantie van variabele Y? Wat is hun gedeelde variantie?

• ≠ in welke mate is variabele X oorzaak van variabele Y?

− causaliteit kan in twee richtingen lopen

− derde variabele kan verband verklaren partiële correlatie

PEARSON CORRELATIE

155

Hoofdstuk 9: Variabelen met gelijk meetniveau

Page 156: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Partiële correlatie

Wat is de gedeeltelijke gezamenlijke variantie tussen twee variabelen als je controleert voor de invloed van een derde variabele?

PEARSON CORRELATIE

156

rij

motivatie? punten

Hoofdstuk 9: Variabelen met gelijk meetniveau

Page 157: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Demo SPSS: Studenten die meer vooraan in de aula zitten halen ook hogere cijfers op het examen.

PEARSON CORRELATIE

157

Hoofdstuk 9: Variabelen met gelijk meetniveau

Page 158: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

6. Effectgrootte

Effectgrootte = r

7. Rapportering

Om na te gaan of er een verband is tussen de plaats in de aula waar studenten zitten en hun cijfers op het examen, werd een correlatie berekend. Dit verband bleek significant, r = -.39 , p = .027, N = 32 . Hoe verder de studenten van de docent zaten, hoe lager de punten op het examen. Nadat gecorrigeerd werd voor de motivatie van de studenten daalde deze correlatie tot r = .005, p = .98, N = 32.

PEARSON CORRELATIE

158

Hoofdstuk 9: Variabelen met gelijk meetniveau

Page 159: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

1. Toetsingssituatie

Berekenen van een correlatie tussen twee ordinale variabelen.

(Pearson correlatie = correlatie tussen twee intervalvariabelen)

2. Voorwaarden

Twee variabelen gemeten op ordinaal niveau of

Twee variabelen duidelijk niet normaal verdeeld

3. Hypothesen

Linkseenzijdig H0: ρs ≥ 0 H1: ρs < 0

Rechtseenzijdig H0: ρs ≤ 0 H1: ρs > 0

Tweezijdig H0: ρs = 0 H1: ρs ≠ 0

RANGCORRELATIE VAN SPEARMAN

159

Hoofdstuk 9: Variabelen met gelijk meetniveau

Page 160: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

4. Toetsingsgrootheid

De waarden van X en Y afzonderlijk ordenen en correlatie berekenen tussen beide rangordeningen

N = aantal paren

D = verschil in rangordenr per paar

-1 als minimumwaarde en +1 als maximumwaarde

RANGCORRELATIE VAN SPEARMAN

160

NN

Drs

³

²61

Hoofdstuk 9: Variabelen met gelijk meetniveau

Page 161: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Toetsingsgrootheid zoals bij Pearson’s correlatie m.b.v. t-verdeling:

5. Beslissingsregels

Is de gevonden P (Asymp. Sig. 2-tailed) kleiner dan α ?

ja: verwerp H0

nee: verwerp H0 niet

RANGCORRELATIE VAN SPEARMAN

161

Hoofdstuk 9: Variabelen met gelijk meetniveau

Page 162: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

6. Effectgrootte

Effectgrootte = rs = ρs

7. Rapportering

(zie Pearson correlatie, maar dan met rs )

RANGCORRELATIE VAN SPEARMAN

162

Hoofdstuk 9: Variabelen met gelijk meetniveau

Page 163: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

1. Toetsingssituatie

Zijn twee nominale variabelen afhankelijk van elkaar?

>> Kruistabel met frequenties

Is er een verband tussen de wijze waarop vragenlijsten worden afgenomen en het al of niet willen meedoen met de enquête?

Χ²-TOETS VOOR VERBAND TUSSEN 2 NOMINALE VARIABELEN

163

Schriftelijk Telefonisch Mondeling

Niet meedoen 90 70 25 185

Wel meedoen 110 130 75 315

200 200 100 500

Hoofdstuk 9: Variabelen met gelijk meetniveau

Page 164: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

2. Voorwaarden

• Categorieën van elke variabele sluiten elkaar uit

• Alle waarden die in het onderzoek bestudeerd worden kunnen in de categorieën ondergebracht worden

• X² toets mag je gebruiken wanneer minder dan 20% van de cellen een fe < 5 en geen van de cellen een fe < 1

Χ²-TOETS VOOR VERBAND TUSSEN 2 NOMINALE VARIABELEN

164

Hoofdstuk 9: Variabelen met gelijk meetniveau

Page 165: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

3. Hypothesen

H0: de variabelen zijn onafhankelijk; er is geen verband

H1: de variabelen zijn afhankelijk; er is wel een verband

Opm. altijd 2-zijdige toetsing

4. Toetsingsgrootheid

Pearson Chi Square:

Χ²-TOETS VOOR VERBAND TUSSEN 2 NOMINALE VARIABELEN

165

Hoofdstuk 9: Variabelen met gelijk meetniveau

Page 166: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

5. Beslissingsregels

Overschrijdingskansen

Is de gevonden P (Asymp. Sig. 2-tailed) kleiner dan α ?

ja: verwerp H0

nee: verwerp H0 niet

Χ²-TOETS VOOR VERBAND TUSSEN 2 NOMINALE VARIABELEN

166

Hoofdstuk 9: Variabelen met gelijk meetniveau

Page 167: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

fo

fe

aan de voorwaarden is voldaan want 0% van de cellen heeft fe < 5 en minimum fe > 1

Χ²-TOETS VOOR VERBAND TUSSEN 2 NOMINALE VARIABELEN

167

Chi-Square Tests

12,012a 2 ,002

12,254 2 ,002

500

Pearson Chi-Square

Likelihood Ratio

N of Valid Cases

Value df

Asy mp. Sig.

(2-sided)

0 cells (,0%) hav e expected count less than 5. The

minimum expected count is 37,00.

a.

Hoofdstuk 9: Variabelen met gelijk meetniveau

Page 168: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

6. Effectgrootte

Verschillende mogelijkheden,

Cramer’s V meest universeel geschikt:

7. Rapportering

Om na te gaan of er een verband bestaat tussen de wijze waarop vragenlijsten worden afgenomen en het al of niet willen meedoen met de enquête werd een X²-toets uitgevoerd, die uitwees dat er inderdaad een eerder zwak verband is tussen beide variabelen, X² = 12.01, p = .002, V = .16)

Χ²-TOETS VOOR VERBAND TUSSEN 2 NOMINALE VARIABELEN

168

Hoofdstuk 9: Variabelen met gelijk meetniveau

Page 169: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

OEFENINGEN

Handboek H7: 1 & 3 H8: 1 & 3 H9: 1 & 2

Page 170: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Regressieanalyse

hoofdstuk 10

STATISTIEK II

Page 171: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

• Voorspelling maken op basis van correlatie

• Invloed van verschillende OV vergelijken

REGRESSIEANALYSE

171 Workshop Inductieve Statistiek

Page 172: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Voorwaarden

• De criteriumvariabele (= afhankelijke variabele) is gemeten op intervalniveau.

• De observaties van de criteriumvariabele zijn onafhankelijk van elkaar.

• De predictor (= onafhankelijke variabele) is gemeten op intervalniveau of het is een dichotome variabele.

• De fouten (of residuen) van de voorspelling die we maken zijn normaal verdeeld met een gemiddelde van 0.

• De fouten (of residuen) van de voorspelling die we maken zijn ongecorreleerd met elkaar.

REGRESSIEANALYSE

172 Workshop Inductieve Statistiek

Page 173: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

y = 2 + 3x

ENKELVOUDIGE REGRESSIE

173 Workshop Inductieve Statistiek

Page 174: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

ENKELVOUDIGE REGRESSIE

174 Workshop Inductieve Statistiek

0

2

4

6

8

10

12

14

16

18

20

70 80 90 100 110 120 130 140 150

fuif

sati

sfa

cti

e

alcohol

d = 1.8

d = 2.1

d = 1.2

𝑌𝑖 = 𝑏0 + 𝑏1𝑋𝑖 + 𝜀𝑖

{

Page 175: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

ENKELVOUDIGE REGRESSIE

175 Workshop Inductieve Statistiek

0

2

4

6

8

10

12

14

16

18

20

70 80 90 100 110 120 130 140 150

fuif

sati

sfa

cti

e

alcohol

0

2

4

6

8

10

12

14

16

18

20

70 80 90 100 110 120 130 140 150

fuif

sati

sfa

cti

e

alcohol

Page 176: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Wanneer is het model “nuttig”?

𝑅² =𝑆𝑆𝑀

𝑆𝑆𝑇

𝐹 =𝑀𝑆𝑀𝑀𝑆𝑅

ENKELVOUDIGE REGRESSIE

176 Workshop Inductieve Statistiek

SSM SST

Verschil regressiepredictie

vs gemiddelde van Y

Verschil geobserveerde

scores vs gemiddelde van Y

Variantie model

Variantie fouten (residuen)

Page 177: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Wanneer is de predictor “nuttig”?

ENKELVOUDIGE REGRESSIE

177 Workshop Inductieve Statistiek

𝑌𝑖 = 𝑏0 + 𝑏1𝑋𝑖 + 𝜀𝑖

als 𝑏1 > 0

𝑡 =𝑏𝑜𝑏𝑠 − 𝑏𝑒𝑥𝑝

𝑆𝐸𝑏

Page 178: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Normaliteit van residuen?

ENKELVOUDIGE REGRESSIE

178 Workshop Inductieve Statistiek

Page 179: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Autocorrelatie van residuen?

Durbin-Watson toets:

ENKELVOUDIGE REGRESSIE

179 Workshop Inductieve Statistiek

0 1 2 3 4

Page 180: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Outliers?

ENKELVOUDIGE REGRESSIE

180 Workshop Inductieve Statistiek

Page 181: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Outliers? 2 technieken:

1. Cook’s Distance: case > 1 outlier

2. Gestandaardiseerde residuen: |z| > 3 outlier

ENKELVOUDIGE REGRESSIE

181 Workshop Inductieve Statistiek

Page 182: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Voorwaarden

• De criteriumvariabele (= afhankelijke variabele) is gemeten op intervalniveau.

• De observaties van de criteriumvariabele zijn onafhankelijk van elkaar.

• De predictor (= onafhankelijke variabele) is gemeten op intervalniveau of het is een dichotome variabele.

• De fouten (of residuen) van de voorspelling die we maken zijn normaal verdeeld met een gemiddelde van 0.

• De fouten (of residuen) van de voorspelling die we maken zijn ongecorreleerd met elkaar.

• De predictoren zijn lineair onafhankelijk van elkaar: er is geen multicollineariteit.

MEERVOUDIGE REGRESSIE

182 Workshop Inductieve Statistiek

Page 183: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Uitbreiding van enkelvoudige regressie:

𝑌𝑖 = 𝑏0 + 𝑏1𝑋𝑖1 + 𝑏2𝑋𝑖2 + ⋯+ 𝑏𝑛𝑋𝑛 + 𝜀𝑖

Of

𝑓𝑢𝑖𝑓𝑠𝑎𝑡𝑖𝑠𝑓𝑎𝑐𝑡𝑖𝑒𝑖 = 𝑏0 + 𝑏1𝑖 ∗ 𝑎𝑙𝑐 𝑐𝑜𝑛𝑠𝑢𝑚𝑝𝑡𝑖𝑒𝑠𝑖 +𝑏2𝑖 ∗ 𝑎𝑎𝑛𝑡𝑎𝑙 𝑎𝑎𝑛𝑤𝑒𝑧𝑖𝑔𝑒𝑛𝑖 + 𝜀𝑖

MEERVOUDIGE REGRESSIE

183 Workshop Inductieve Statistiek

Page 184: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

MEERVOUDIGE REGRESSIE

184 Workshop Inductieve Statistiek

Page 185: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

• Onderzoeker kiest

• Bekende predictoren eerst

Hiërarchisch

(enter)

• Computer kiest

• Stepwise, forward: stapsgewijs toevoegen; grootste correlatie eerst

• Backward: stapsgewijs verwijderen

Stapsgewijs

MEERVOUDIGE REGRESSIE

185 Workshop Inductieve Statistiek

Page 186: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

MEERVOUDIGE REGRESSIE

186 Workshop Inductieve Statistiek

Multicollineariteit

Lineaire relatie tussen 2 of meer predictoren

2 problemen:

− Onnodige uitbreiding model

− Onbetrouwbare schatting b’s minder snel sign.

Page 187: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

MEERVOUDIGE REGRESSIE

187 Workshop Inductieve Statistiek

Detectie multicollineariteit:

Tolerance:

VIF (Variance Inflation factor) = 1 / Tolerance

0 .20 .40 .60 .80 1

0 … 4 5 …

Page 188: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

Een meervoudige regressieanalyse werd uitgevoerd met de fuifsatisfactie als criterium en het aantal alcoholische consumpties, het aantal aanwezigen en het aantal vrienden als predictoren (model 1). Dit model bleek significant, met R² = .46, F = 16.11, p < .001. Zoals aangegeven in Tabel 1 was het aantal aanwezigen geen significante predictor. Deze predictor werd daarom niet opgenomen in model 2, dat ook significant bleek met R² = .44, F = 22.09, p < .001. Van de resterende predictoren blijkt het aantal aanwezige vrienden het meeste invloed uit te oefenen op de fuifsatisfactie.

Tabel 1: Resultaten enkelvoudige regressie met fuifsatisfactie als criterium en aantal alcoholische consumpties als predictor.

MEERVOUDIGE REGRESSIE

188 Workshop Inductieve Statistiek

B SE B β t

model 1

constante 11.08 .66 16.69**

*

aantal consumpties -.15 .05 -.30 -3.04**

aantal aanwezigen .01 .00 .17 1.66

aantal vrienden .24 .05 .50 4.93***

model 2

constante 11.63 .59 19.89**

*

aantal consumpties -.15 .05 -.30 -3.03**

aantal vrienden .26 .05 .55 5.43***

**p < .01, ***p < .001

Page 189: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

1. Analyseer de opgave − onderzoekseenheden?

− AV? OV?

− meetniveaus?

− populaties?

− afhankelijke steekproeven?

− (non)parametrisch?

− één/tweezijdig?

2. Verken de data

3. Kies de juiste toets

4. Rapporteer (relevante getallen, conclusie in termen van onderzoeksvraag)

STRATEGIE

Hoofdstuk 9: Variabelen met gelijk meetniveau

Page 190: INDUCTIEVE STATISTIEK - toegepastestatistiek.weebly.comtoegepastestatistiek.weebly.com/uploads/4/3/3/0/4330387/ws_induct... · • Effectgrootte = indicatie van de mate waarin de

OEFENINGEN

Handboek

H10: 2 & 3

H11: 8 & 9