Statistiek

22
Statistiek Hoorcollege 3 Samenhang tussen variabelen

description

Statistiek. Hoorcollege 3 Samenhang tussen variabelen. Stappenplan. Bepaal of het om een frequentievraag, verschilvraag of een vraag naar samenhang gaat Bepaal het meetniveau van de variabelen Bepaal welke toets je nodig hebt Bereken de toetswaarde - PowerPoint PPT Presentation

Transcript of Statistiek

Page 1: Statistiek

StatistiekHoorcollege 3

Samenhang tussen variabelen

Page 2: Statistiek

Stappenplan

1. Bepaal of het om een frequentievraag, verschilvraag of een vraag naar samenhang gaat

2. Bepaal het meetniveau van de variabelen3. Bepaal welke toets je nodig hebt4. Bereken de toetswaarde5. Kijk in de tabel of de uitkomst aanleiding geeft om de H0 aan

te houden, of om deze te verwerpen

Page 3: Statistiek

Voorbeeld Mann-Whitney Een onderzoeker wil weten of de mannelijke diëtisten meer per uur verdienen dan de vrouwelijke.

Toets dit met onderstaande steekproef met α = 5%.

inkomen in € per uur

35 57 23 18 63 43 17 18 27

m m m m m v v v v

Page 4: Statistiek

Stap 1

Het gaat om een verschilvraag, want we willen weten of het inkomen van vrouwen verschilt van dat van mannen.

Specifieker: we willen weten of het inkomen van mannen hoger is dan dat van vrouwen.

Page 5: Statistiek

Stap 2

Het gaat om inkomen per uur, inkomen is hier dan een variabele op scale-niveau.

Page 6: Statistiek

Stap 3

We zouden kunnen kiezen tussen de Χ2-, de Mann-Whitney- en de t-toets.

Het gaat om variabelen op scale-niveau De steekproeven hebben een heel kleine n: nman = 5 en

nvrouw = 5 (de t-toets valt af). Kies daarom voor een non-parametrische toets: de MW-

toets (de Χ2–toets is minder geschikt vanwege het hoge meetniveau).

Page 7: Statistiek

Stap 4

De formule:

Je hebt dus nodig: n1 = 5 n2 = 4 R1 = hiervoor heb je een tabelletje nodig

111

21 R-2

1)+(nn+nn=U

Page 8: Statistiek

Stap 4

In de tabel rangschik je de waarden. De kleinste krijgt een 1.

inkomen per uur

rang 6 8 4 2,5 9 7 1 2,5 5

waarde 35 57 23 18 63 43 17 18 27

geslacht m m m m m v v v v

Page 9: Statistiek

Stap 4

Iets overzichtelijker

man vrouw rang man rang vrouw

35 43 6 7

57 17 8 1

23 18 4 2.5

18 27 2.5 5

63 9 -

R1 = 29,5 R2 = 15,5

Page 10: Statistiek

Stap 4

De formule:

Je hebt dus nodig: n1 = 5 n2 = 4 R1 = 29,5 (de grootste som)

111

21 R-2

1)+(nn+nn=U

5,529,5-2

6*5+20=U =

Page 11: Statistiek

Stap 5

Bijlage 3: waarschijnlijkheidswaarde ≈ 0.175. Let op: neem tabel van n2 = 5.

Dit is groter dan 0,05 (α), dus niet significant, dus H0: er is geen verschil in inkomen tussen mannelijke en vrouwelijke dietisten

Page 12: Statistiek

Samenhang: correlaties

De correlatie geeft de sterkte van de samenhang tussen twee variabelen weer, van -1 (perfect negatief verband) via 0 (geen enkel verband) tot 1 (perfect positief verband).

Page 13: Statistiek

Spearman rangcorrelatie

Is er een samenhang tussen het hoe gezond men eet en hoeveel men sport (toets met α = 5%)?1=gezond2=gezond noch ongezond3=ongezond

1=geregeld2=soms3=bijna nooit

Stap 1: het gaat duidelijk om een samenhangsvraag

eten sporten

1 1

2 2

3 2

1 22 3

3 3

1 1

2 2

3 31 2

2 2

3 2

1 1

2 23 3

   

Page 14: Statistiek

Spearman rangcorrelatie

Stap 2. Het meetniveau is ordinaal, bij beide variabelen.

Stap 3. De Spearman-rangcorrelatie-toets

is dus geschikt:

nnd6

1r 3

2i

s

Page 15: Statistiek

Spearman rangcorrelatie

0,7571515136*61

nnd6

1r

3

3

2i

s

eten sporten RANGetenRANGsporte

n di di^2

1 1 3 2 1.00 1.00

2 2 8 7.5 0.50 0.25

3 2 13 7.5 5.50 30.25

1 2 3 7.5 -4.50 20.25

2 3 8 13.5 -5.50 30.25

3 3 13 13.5 -0.50 0.25

1 1 3 2 1.00 1.00

2 2 8 7.5 0.50 0.25

3 3 13 13.5 -0.50 0.25

1 2 3 7.5 -4.50 20.25

2 2 8 7.5 0.50 0.25

3 2 13 7.5 5.50 30.25

1 1 3 2 1.00 1.00

2 2 8 7.5 0.50 0.25

3 3 13 13.5 -0.50 0.25

          136.00

Page 16: Statistiek

Spearman rangcorrelatie

SPSS geeft al aan dat de uitkomst (0,718) zelfs met een α van 1% significant is (te zien aan de 2 sterretjes).Let op: de waarde 0,178 verschil licht van de met de hand berekende waarde van 0,757

Page 17: Statistiek

Spearman rangcorrelatie Stap 5. Zie bijlage 5: 0,44

De SR-correlatie (0,76) valt in het kritieke gebied: we nemen H1 aan: er is een positieve samenhang tussen hoe gezond men eet en hoe vaak men sport. Anders gezegd: hoe gezonder men eet, hoe vaker men sport.

Page 18: Statistiek

Pearson product-moment-correlatie

Is er een samenhang tussen de leeftijd en de BMI, en zo ja, is deze samenhang positief of negatief (toets met α = 5%)?

Formule:

]Y)(Y][NX)(X[N

Y)X)((XYNr

2222xy

Page 19: Statistiek

Productmoment correlatie

Xlft Ybmi X^2 Y^2 XY

20 30 400 900 600

19 23 361 529 437

47 22.3 2209 497.29 1048.1

21 21.2 441 449.44 445.2

21 21 441 441 441

… … … … …18 20.3 324 412.09 365.4

19 20.4 361 416.16 387.6

19 21 361 441 399

19 24 361 576 456

1869 1801.4 44769 39290.78 40646.4

39,055383,56*267435

47481r

4,180178,39290*84][1869-44769*[84

1801,4*186940646,4*84r

]Y)(Y][NX)(X[N

Y)X)((XYNr

xy

22xy

2222xy

Page 20: Statistiek

Productmoment correlatie

Hieronder de output van SPSS. Ook hier heeft de Pearson correlatie de waarde van 0,39. SPSS zegt alvast dat de correlatie significant is (zelfs met α = 1%).

Page 21: Statistiek

Productmoment correlatie

De correlatiecoëfficiënt van 0,39 valt binnen het kritieke gebied, er is dus een significant positief verband tussen leeftijd en BMI (de correlatiecoëfficiënt is een positief getal).

Page 22: Statistiek

Regressielijn

Verband tussen leeftijd en BMI

18

23

28

33

38

43

0 10 20 30 40 50

leeftijd

BMI

Twee scatterplots, links Excel, rechts SPSS. De best passende lijn is door de puntenwolk getrokken.