Toetsende Statistiek 2011 - Leiden Univ

30
1 Toetsende Statistiek 2011 Volgt op Inleiding M&T. 7 weken college, werkgroep en practicum. NB In week 8 (eind december) SPSS toets + Tentamen. Week topic geen stof 1 Kansen 2 Steekproevenverdeling Weibull distributions 3 Schatten en Toetsen 4 Toetsen van Gemiddelden 5 Power en F toets 6 Frequentieverdelingen Meta analysis 7 Non-Parametrische toetsen (op CD) Eind januari tweede tentamengelegenheid.

Transcript of Toetsende Statistiek 2011 - Leiden Univ

Page 1: Toetsende Statistiek 2011 - Leiden Univ

1

Toetsende Statistiek 2011 Volgt op Inleiding M&T. 7 weken college, werkgroep en practicum. NB In week 8 (eind december) SPSS toets + Tentamen.

Week topic geen stof 1 Kansen 2 Steekproevenverdeling Weibull distributions 3 Schatten en Toetsen

4 Toetsen van Gemiddelden 5 Power en F toets 6 Frequentieverdelingen Meta analysis 7 Non-Parametrische toetsen (op

CD)

Eind januari tweede tentamengelegenheid.

Page 2: Toetsende Statistiek 2011 - Leiden Univ

2

Toetsende Statistiek, Week 1. Kansmodellen & Toevalsvariabelen

Christiaan Huygens 1629-1695 (1)

M,M&C, Ch 4, Probability: Study of …

4.1 Randomness 4.2 Probability Models 4.3 Random Variables 4.4 Mean and Variances of

Random Variables 4.5 General Probability

Rules (1) Clerion 1679 foto Verduin (2) JF Dreux de Radier (1755, deel 5)

Jacob Bernoulli 1654 - 1705 (2)

Al-hoewel in de spelen daer alleen het geval plaets heeft, de uytkomsten onseecker zijn, soo heeft nochtans de kansse die yemandt heeft om te winnen of te verliezen, haer seeckere bepaling.

Van Rekeningh in Spelen van Geluck (1660)

Page 3: Toetsende Statistiek 2011 - Leiden Univ

3

Waarom is Toetsende Statistiek nodig in de Psychologie?

Psychologie wil verder kijken dan het individuele geval: onzekerheid. De toetsende (inferentiële) statistiek probeert zekere conclusies op basis van onzekere informatie te trekken, door af te vragen:

"Hoe vaak geeft deze methode (berekening, gevolgtrekking) een juist antwoord als ik haar heel vaak zou herhalen?"

Deze vraag kan worden beantwoord als er een toevalselement in de methode zit, want we weten hoe het toeval zich gedraagt. random sampling (aselect steekproeven trekken)

Toeval door

randomized experiment (of quasi-experiment)

Men kan grip krijgen op toevalsverschijnselen in persoon & observatie door toeval toe te voegen!

Page 4: Toetsende Statistiek 2011 - Leiden Univ

4

Wat is een Toevalsverschijnsel?

Een toevalsverschijnsel (random phenomenon) heeft uitkomsten die

per keer niet te voorspellen zijn,

maar

bij herhaling een regelmatige verdeling van voorkomen vertonen.

Voorbeeld 1. Verlegenheid: Groep studenten wordt met Stanford

Shyness Survey beoordeeld op verlegenheid. In

willekeurige volgorde:

V N N V V N N N V N V N V N N N V …

Voorbeeld 2. depressie: bepaal de BDI-II score na afloop van de

therapie voor 5 cliënten:

15, 23, 17, 20, 25…

Page 5: Toetsende Statistiek 2011 - Leiden Univ

5

Law of Large Numbers: Wet van de grote getallen.

1 10 100 1000 10000

0.0

0.2

0.4

0.6

0.8

1.0

Aantal worpen (n)

Pro

port

ie s

ucce

s vo

or e

erst

e n

wor

pen

Hoe meer observaties, des te stabieler de conclusie op populatie niveau, ook al zijn individuele uitkomsten onvoorspelbaar. Steekproeven zijn relatief klein ten opzichte van populaties.

Tversky + Kahneman: ‘Law of Small Numbers’, 1971: psychologisch verschijnsel, zonder wiskundige basis.

Page 6: Toetsende Statistiek 2011 - Leiden Univ

6

Wat is een Kans?

De kans op gebeurtenis A = proportie van optreden A in zeer groot aantal herhalingen van het toevalsproces

Dit suggereert dat het om empirisch begrip gaat – is omstreden

Hoe herken je of iets toeval (random) is?

Onvoorspelbaarheid wordt meestal vertaald naar onafhankelijkheid NB:

1 Independent trials (herhaling van dezelfde proef op ander individu uit dezelfde groep): kans op uitkomst van trial A hangt niet af van uitkomst andere trial B.

2 Independent events (onafhankelijke gebeurtenissen): P(gebeurtenis A) hangt niet af van al dan niet optreden van gebeurtenis B.

1 is speciaal geval van 2

Page 7: Toetsende Statistiek 2011 - Leiden Univ

7

Basismodel voor Toevalsprocessen: Kansmodel

Een toevalsproces bestaat uit herhalingen met verschillende uitkomsten (outcomes, O).

Ieder kansmodel is opgebouwd uit drie delen:

1 Uitkomstenruimte (steekproefruimte, sample space, S)

= opsomming van alle mogelijke uitkomsten

2 Gebeurtenis (event, E)

= deelverzameling van de uitkomstenruimte (dus ook

één uitkomst)

3 Kans (waarschijnlijkheid, probability, P)

= getal dat aan uitkomst of gebeurtenis wordt

toegekend en dat aan een aantal regels moet voldoen.

Page 8: Toetsende Statistiek 2011 - Leiden Univ

8

Uitkomstenruimte & Gebeurtenissen: Voorbeeld

Vraag een willekeurige student naar een examencijfer.

S = {1, 2 ... 10}

E1 = {1, 2, 3, 4, 5} complementair E1C = { ? }

E2 = {2, 4, 6, 8, 10} complementair E2C = { ? }

E3 = {6, 8, 10} complementair E3C = { ? }

Voorlopige conclusie: uitkomsten komen overeen met waarden (categorieën, nivo’s) van gemeten variabele, gebeurtenissen met waarden van gehercodeerde variabele.

Page 9: Toetsende Statistiek 2011 - Leiden Univ

9

Regels waaraan Kansen moeten voldoen

Kans op gebeurtenis A is a reëel getal P(A), zodanig dat:

1. 0 ≤ P(A) ≤ 1.

2. P(S) = 1, met S de hele uitkomstenruimte

3. Optellen voor disjuncte gebeurtenissen (events A en B):

P(A OF B) = P(A) + P(B),

4. Complement: ihgv een complementaire gebeurtenis Ac geldt

P(Ac) = 1 – P(A).

5. Produkt voor onafhankelijke gebeurtenissen:

P(A EN B) = P(A) P(B) (ook voor Ac en Bc).

Opgesteld door Kolmogorov (1933).

Page 10: Toetsende Statistiek 2011 - Leiden Univ

10

Regel 3 in meer detail

3* Optellen voor (eindig aantal) uitkomsten (outcomes O1 en O2)

P(O1 OF O2) = P(O1) + P(O2).

3** Optellen voor vereniging van disjuncte gebeurtenissen A, B, C

P(A OF B OF C) = P(A) + P(B) + P(C),

3*** Algemene rekenregel voor vereniging van gebeurtenissen

P(A OF B) = P(A) + P(B) – P(A EN B)

Voorbeeld: ? (zie volgende sheet)

Page 11: Toetsende Statistiek 2011 - Leiden Univ

11

Voorbeeld

Stel: P(A)=0.20, P(B)=0.15.

Wat is P(A OF B) als P(A EN B)=0?

Wat is P(A OF B) als P(A EN B)=0.05?

Page 12: Toetsende Statistiek 2011 - Leiden Univ

12

Regel 5. Produktregel voor onafhankelijke gebeurtenissen:

P(A EN B) = P(A) P(B) (ook voor Ac en Bc).

Toelichting: independent events; de uitkomstenruimte bestaat uit alle combinaties van 2 typen gebeurtenissen: voorbeeld: verlegen A

& niet-verlegen Ac, mannen B & vrouwen Bc.

verlegen

ja nee Totaal

man 0.15 0.10 0.25 vrouw 0.45 0.30 0.75

gesla

cht

Totaal 0.60 0.40 1.00

Dus gebeurtenissen A en B zijn niet disjoint (waarom niet?);

onafhankelijkheid → patroon van proportionaliteit in kansen, alsof je aselekt met teruglegging uit 2 aparte groepen trekt.

Page 13: Toetsende Statistiek 2011 - Leiden Univ

13

Voorwaardelijke Kansen (conditional probabilities)

Voldoen aan eisen van de ‘gewone’ kans, maar het domein wordt verkleind: we kijken naar mensen die aan een voorwaarde voldoen.

Voorbeeld: Screening van neurotische patienten op flauwvallen

Symptoom Neurotic patients Control group Totaal

Nee 10 270 280 Ja 30 90 120 Totaal 40 360 400

P(Symp=Ja) = 120/400 = 0.30

P(Neur) = 40/400 = 0.10

P(Symp=Ja EN Neur) =30/400=0.075

P(Symp=Ja | Neur) = 30/40 = 0.75

• Conclusie: Marginale P <> voorwaardelijke P

=)(

) ( EN

NP

NSP

)(

) ()|(

EN

AP

BAPABP =

Page 14: Toetsende Statistiek 2011 - Leiden Univ

14

Boomdiagrammen verbinden Voorwaardelijke Kansen

Als we de formule omschrijven, krijgen we de produktregel:

P(A EN B) = P(A) ×××× P(B | A)

Deze kansen horen bij de uiteinden van een boomdiagram.

Gehele groep

S

SC

NC

NC

N: P(S EN N) = 0.30 * 0.25 = 0.075

0.70

0.30

0.25

0.75

0.0357

0.9643

N: P(SC EN N) = 0.70 * 0.0357 = 0.025

P(N|S) = 30/120 = .25 P(N|SC)= 10/280 = .0357

Page 15: Toetsende Statistiek 2011 - Leiden Univ

15

Tweede definitie Onafhankelijkheid

Twee variabelen zijn onafhankelijk als P(B | A) = P(B).

Dus wordt P(A EN B) = P(A) ×××× P(B | A) = P(A) ×××× P(B).

Dus: er is onafhankelijkheid als de conditionele

kansen gelijk zijn aan de marginale kansen.

Symptoom Neurotic patients Control group Totaal

Nee .07 .63 .70

Ja .03 .27 .30

Totaal .10 .90 1.00

• Rij- en kolom-marginalen gelijk aan die van data

• Alle rijen en kolommen proportioneel aan elkaar

• P(S | N) = 0.03/0.1 = 0.3 P(SC | N) = 0.07/0.1 = 0.7

Page 16: Toetsende Statistiek 2011 - Leiden Univ

16

De Regel van Bayes (simpel)

De regel van Bayes legt een verband tussen de a priori kans en de a

posteriori kans op een kenmerk.

)(

)()|()|(

BP

APABPBAP

×=

Voorbeeld: Diagnostische waarde van een symptoom (sheet 12).

a priori: P(Neur) = 0.10

a posteriori: P(Neur|Sympt) = P(Sympt | Neur)*P(Neur) / P(Sympt)

= 0.75 * 0.10 / 0.30 = 0.25

NB de a priori kansen eigenlijk niet uit de steekproef nemen,

maar uit de populatie.

Page 17: Toetsende Statistiek 2011 - Leiden Univ

17

Toevalsvariabelen (Random Variables)

Wat is er toevallig aan een toevalsvariabele? Onderzoekssituatie:

Populatie: bijv. gezinnen met kinderen,

trek steekproeven van 5 gezinnen uit populatie

sample samenstelling sample X = # jong./gez.

Y = # meis./gez.

1 {(JJM), (MM), (J), (MJM), (JJMJ)} 1.4 1.2 2 {(JM), (MJM), (JJ), (MMMMJ), (M)} 1.0 1.6 3 {(JJ), (MMJJ), (JM), (JMJM), (JJJJ)} 2.2 1.0 4 … … …

NB. binnen een gezin is # jongens en # meisjes niet toevallig!

Toevalsvariabele: variabele die als waarden numerieke uitkomsten heeft, die zijn verkregen uit een steekproef of een ander toevalsproces

Page 18: Toetsende Statistiek 2011 - Leiden Univ

18

Discrete Toevalsvariabelen: Tellingen of Hoeveelheden (Rates)

Eindig aantal waarden in gegeven interval. Kansverdeling is lijst waarden + bijbehorende kansen.

Twee manieren om een kanshistogram te lezen:

� Waarde Y-as (dichtheid = soortelijke massa = # elem. per unit)

� Oppervlakte (kans = relatieve omvang).

Kansverdeling

Uitkomst 1 2 3 4

kans 0.1 0.3 0.2 0.4

Kans op interval = oppervlakte

onder de “trap” = som van

staven in interval. Bijv. P(X>2)?

Kanshistogram

Uitkomst X

P(X

)

1 2 3 4

0.0

0.1

0.2

0.3

0.4

Page 19: Toetsende Statistiek 2011 - Leiden Univ

19

Continue Toevalsvariabelen: Gemiddelden of andere statistieken

Oneindig veel mogelijke waarden in een bepaald interval (NB. dit is een model). Kansverdeling d.m.v. dichtheidscurve (density).

dichtheid ↑

• Event = interval

• P (interval) = oppervlakte onder dichtheidscurve t.o.v. het totaal.

• Als intervallen niet overlappen kan men kansen optellen.

P(A)

Event A

Onderscheid outcomes/events nu cruciaal!

Page 20: Toetsende Statistiek 2011 - Leiden Univ

20

Verwachte Waarde van een Toevalsvariabele

Zoals kansen geïdealiseerde beschrijving zijn van proporties die op de lange duur worden verkregen, zo is de verwachte waarde (mean) het ‘lange duur’ gemiddelde van een toevalsvariabele.

µX = x1p1 + x2 p2 +L+ xk pk

= xi pii∑

Omdat de p’s meestal ongelijk zijn maar wel optellen tot 1, is µ een gewogen gemiddelde.

Opmerkingen

• µ is een modelmatig equivalent van x , en hoeft niet als data-waarde voor te komen.

• verwachte waarde ≠ modale waarde.

• om µ te bepalen bij continue X is integreren nodig (doen we niet).

Page 21: Toetsende Statistiek 2011 - Leiden Univ

21

Voorbeeld: Verwachte Waarde van Aantal Mannen & Vrouwen

“populatie” van 5 personen: 3 vrouwen (v1, v2, v3) en 2 mannen (m1,

m2). Er zijn 10 mogelijke aselecte steekproeven van 2, zonder

teruglegging, en met gelijke kansen:

uuitkomst v1 v2 v1 v3 v1 m1 v1 m2 v2 v3 v2 m1 v2 m2 v3 m1 v3 m2 m1 m2

#v 2 2 1 1 2 1 1 1 1 0

#m 0 0 1 1 0 1 1 1 1 2

• Wat is verwachte waarde van het # mannen?

• Wat is verwachte waarde van het # vrouwen?

# mannen 0 1 2 kans (#mannen) 0.3 0.6 0.1

Page 22: Toetsende Statistiek 2011 - Leiden Univ

22

Wet van de Grote Getallen, versie 2

Niet alleen proporties, maar ook gemiddelden x stabiliseren bij

grote steekproefgrootte n (voorbeeld hier: gemiddelde lengte jonge

vrouwen in meters):

1 10 100 1000 10000

1.58

1.60

1.62

1.64

1.66

1.68

Aantal obervaties (n)

Gem

idde

lde

over

eer

ste

n ob

serv

atie

s

Page 23: Toetsende Statistiek 2011 - Leiden Univ

23

Verwachte waarde van Getransformeerde Variabelen

Als we een toevalsvariabele X lineair transformeren, dan verandert

de verwachte waarde (het populatie gemiddelde) µX voorspelbaar.

Regel 1: µa+ bX = a + bµX

Regel 2 : µX +Y = µX + µY

a en b zijn vaste getallen (positief of negatief).

In woorden: ?

Page 24: Toetsende Statistiek 2011 - Leiden Univ

26

Voorbeeld: Verwachte waarde en transformaties

Stressbestendigheid Psychologiestudenten. Op 3-puntsschaal

• Bereken de verwachte waarde µ van X

• Bereken de verwachte waarde µ van Y als Y = {3, 5, 7}

• Wat zijn de waarden van a en b? Klopt regel 1?

X P(X) X P(X)

weinig 1 .20 0.20

2 .50 1.00

veel 3 .30 0.90

Som 2.10

Y P(Y) Y P(Y)

weinig 3 .20 0.60

.5 .50 2.50

veel .7 .30 2.10

Som 5.20

Page 25: Toetsende Statistiek 2011 - Leiden Univ

27

Voorbeeld: Verwachte waarde en transformaties

Wat zijn de waarden van a en b?

x

y

0 1 2 3

1

3

5

7

?XY ba µµ ×+=

Page 26: Toetsende Statistiek 2011 - Leiden Univ

28

Variantie van een Toevalsvariabele

Als modelmatig equivalent van s2 hebben we σ2 als maat voor de

variantie in de populatie.

σX2 = x1 −µX( )2

p1 + x2 − µX( )2p2 +L+ xk −µX( )2

pk

= x i −µX( )2pii

σ2 is net als s2 een (gewogen) optelling van gekwadrateerde

afwijkingen tot het gemiddelde.

NB. Bij gelijke kansen voor elke waarde (uniforme verdeling) geldt

dat p = 1/n. NB We delen nu niet door n – 1, maar door n.

Page 27: Toetsende Statistiek 2011 - Leiden Univ

30

Voorbeeld: Stressbestendigheid vervolgd

Stressbestendigheid Psychologiestudenten. Op 3-puntsschaal.

• Bepaal σ2.

X P(X) X P(X) X- µX (X- µX)

2 (X- µX)2P(X)

weinig 1 .20 0.20 -1.1 1.21 0.242

2 .50 1.00 -0.1 0.01 0.005

veel 3 .30 0.90 +0.9 0.81 0.243

Som 2.10 0.49

Page 28: Toetsende Statistiek 2011 - Leiden Univ

31

Varianties van Getransformeerde Variabelen

Als we toevalsvariabelen lineair transformeren of combineren, dan is

de variantie σ2 (en σ) van het resultaat voorspelbaar.

222 :1 Regel XbXa

b σσ =+

Regel 2: als X en Y onafhankelijk zijn dan

22222

)(

2

222

YXYXYXYX

YXYX

σσσσσσ

σσσ

+=+==

+=

−−+−

+

Regel 3: als X en Y niet onafhankelijk zijn dan

yxxyYXYXσσρσσσ ×××++=

+2 222

In woorden: ?

Page 29: Toetsende Statistiek 2011 - Leiden Univ

32

Tot Besluit

1 Toeval: uitkomst onvoorspelbaar op individueel niveau, maar voorspelbaar en stabiel op collectief niveau.

2 Kans: Maat voor het relatief voorkomen van uitkomsten of gebeurtenissen in de uitkomstenruimte. Voldoet aan aantal regels

3 Onafhankelijkheid: trials en events

4 Steekproeffluctuaties: Waarden (bijv. x ) die een steekproef of een gerandomiseerd experiment beschrijven, gedragen zich als toevalsvariabelen. De toetsende statistiek gebruikt dit.

5 Vergelijkbaarheid: Regels voor µ en σ2 van variabelen die lineair getransformeerd zijn, zijn nuttig om resultaten te vergelijken (bijv. bij normeren van test of bij halveren van schaal)

Page 30: Toetsende Statistiek 2011 - Leiden Univ

33

Stof Volgende Week:

Moore, McCabe & Craig, From Probability to Inference

3.3 Towards Statistical Inference

5.1 Sampling Distributions for Counts and Proportions

5.2 The Sampling Distribution of a Sample Mean

SPSS practicum deze week:

• werken met waarden van series variabelen

• rekenen met random variabelen

Kennistoetsjes starten deze week weer