Methodologie & Statistiek I

82
1 Methodologie & Statistiek I Principes van statistisch toetsen 5. 1

description

Methodologie & Statistiek I. Principes van statistisch toetsen. 5.1. U kunt deze presentatie ook op uw eigen PC afspelen!. Gebruikmaken van internet: http://www.unimaas.nl/~stat. Education Health sciences Presentations of lectures. “op dit moment ……. beschikbaar Opening --- - PowerPoint PPT Presentation

Transcript of Methodologie & Statistiek I

Page 1: Methodologie & Statistiek  I

1

Methodologie &

Statistiek I

Principes van statistisch toetsen

5.1

Page 2: Methodologie & Statistiek  I

2

U kunt deze presentatie ook op uw eigen PC afspelen!

Gebruikmaken van internet:http://www.unimaas.nl/~stat

EducationHealth sciences

Presentations of lectures

“op dit moment ……. beschikbaarOpening---Hoofdstuk 5 (Principes van …)---Powerpointviewer downloaden”

Page 3: Methodologie & Statistiek  I

3

Deze diapresentatie werd vervaardigd door Michel Janssenvan de Capaciteitsgroep Methodologie en Statistiek.

De presentatie mag alleen worden gecopieerd voor eigen gebruik door studenten en medewerkers van de Universiteit Limburg in Maastricht.

Met eventuele op- en aanmerkingen kunt u terecht bij:

Universiteit MaastrichtCapaciteitsgroep M&STjaart ImbosPostbus 6166200 MD Maastricht [email protected]

Page 4: Methodologie & Statistiek  I

4

Methodologie &

Statistiek I

Principes van statistisch toetsen

5.1

21 januari 2002

Page 5: Methodologie & Statistiek  I

5

Principes van statistisch toetsen

Noodzakelijk voor een goed begrip vanandere statistische onderwerpen

Page 6: Methodologie & Statistiek  I

6

Kernbegrippen

Statistische toetsingz-toetst-toetsNulhypotheseAlternatieve hypothesep-waardeSignificantie-niveauKritiek gebiedKritieke waardeVerwerpingsgebiedAcceptatiegebiedType I fout ()Type II fout ()Onderscheidend vermogen

Page 7: Methodologie & Statistiek  I

7

Veronderstelde voorkennis

Standaardiseren (hoofdstuk 2 & 4) Normale verdeling (hoofdstuk 4)Gedrag van gemiddelden (hoofdstuk 4)Verdeling van steekproefgemiddelden (hoofdstuk 4)

Page 8: Methodologie & Statistiek  I

8

Bedoeling van verklarende statistiek:

op grond van steekproefgrootheid uitspraak doen omtrentpopulatieparameter

steekproefgrootheid <>populatieparameter

fractiegemiddeldestandaarddeviatiecorrelatiecoefficientregressie-coefficientetc.

Page 9: Methodologie & Statistiek  I

9

Als uit een willekeurige populatie met en 2,steekproeven van omvang n worden getrokken,dan is de verdeling van steekproefgemiddeldenbij benadering normaal verdeeld met gemiddelde= en variantie= 2 /n

de benadering wordt beter bij toenemende n!

Page 10: Methodologie & Statistiek  I

10

voorbeeld

Gegeven:Van 25 personen werd een reactie-tijd gemeten:de gemiddelde, gemeten, waarde = 4.26 Uit de literatuur is bekend dat dit soortreactietijden normaliter exponentieel verdeeld zijn met =3 Opm: Bij een exponentiele verdeling geldt

Gevraagd:Is de steekproef afkomstig uit de genoemdepopulatie?

Page 11: Methodologie & Statistiek  I

11

de steekproef afkomstig is uit de genoemdepopulatie met = = 3

Page 12: Methodologie & Statistiek  I

12

de steekproef afkomstig is uit de genoemdepopulatie met = = 3

is het gevonden gemiddelde(= 4.26) een exemplaar uit de verdeling van gemiddeldenvan steekproeven met n= 25

Page 13: Methodologie & Statistiek  I

13

de steekproef afkomstig is uit de genoemdepopulatie met = = 3

is het gevonden gemiddelde(= 4.26) een exemplaar uit de verdeling van gemiddeldenvan steekproeven met n= 25

en die verdeling is bekend!!!!!!

Page 14: Methodologie & Statistiek  I

14

gemiddelden van steekproeven (n=25)uit een willekeurige populatie met = =3 (2= 9)vormen bij benadering een normale verdeling met = 3 en 2= 9/25 dus = 3/5

= 3

= 0.6

blijft de vraag hoe waarschijnlijkde gevonden waarde (=4.26) is

Page 15: Methodologie & Statistiek  I

15

X-gemiddeld is normaal verdeeld:= 3 en = 3/5= 0.6

P(X-gemiddeld>4.26)= 100 P(X-gemiddeld<4.26)100 P(z<(4.26 3)/0.6)=100 P(z<2.1)=100 98.21= 1.79%

CONCLUSIE???

Page 16: Methodologie & Statistiek  I

16

redenering andersom

Gegeven:Steekproef van 25 stuks met gemiddelde= 4.26

Gevraagd:Welke waarden van (bij een =3) zijn aannemelijk …. kunnen dit gemiddelde opleveren?

10 ? 1? 7?

Page 17: Methodologie & Statistiek  I

17

X-gemiddeld is normaal verdeeld:= 10 en = 3/5= 0.6

P(X-gemiddeld<4.26)=P(z<(4.26 10)/0.6)=P(z< 9.57)= 0.0000

=10 komt dus niet in aanmerking!!

We gaan op zoek naar de kleinste en de grootstewaarden van die een steekproefgemiddelde van 4.26kunnen opleveren

Page 18: Methodologie & Statistiek  I

18

Page 19: Methodologie & Statistiek  I

19

Page 20: Methodologie & Statistiek  I

20

3.08

5.44

Page 21: Methodologie & Statistiek  I

21

3.08

5.44

Page 22: Methodologie & Statistiek  I

22

Zo kan ook het 90% betrouwbaarheidsintervalworden berekenden het 99% betrouwbaarheids intervalen het ……..

Welk bi-interval is breder:het 90% of het 99%

Het 95% betrouwbaarheids-interval is een waardenbereik dat met een waarschijnlijkheidvan 95% de waarde bevat

Page 23: Methodologie & Statistiek  I

23

eerder gebruikt voorbeeld

Gegeven:Van 25 personen werd een reactie-tijd gemeten:de gemiddelde, gemeten, waarde = 4.26 Uit de literatuur is bekend dat dit soortreactietijden normaliter exponentieel verdeeld zijn met =3 Opm: Bij een exponentiele verdeling geldt

Gevraagd:Is de steekproef afkomstig uit de genoemdepopulatie?

Page 24: Methodologie & Statistiek  I

24

bepaal het 95% betrouwbaarheidsinterval

Page 25: Methodologie & Statistiek  I

25

Het 95% betrouwbaarheidsinterval bevatde waarden 3.08 …… 5.44

De waarde van (=3) maakt geen deel uit van dit interval. Het is dus niet waarschijnlijk datde beschouwde steekproef afkomstig is uitde genoemde populatie

Hoe groot is de kans dat deze uitspraakfout is? Anders gezegd:Hoe groot is de kans dat wel in hetinterval ligt?

Page 26: Methodologie & Statistiek  I

26

BENADERINGEN GEZIEN

A uitgaande van een bepaalde (en ) deverdeling van X-gemiddelden berekend envervolgens gekeken hoe extreem hetsteekproefgemiddelde in die verdeling is.

B uitgaande van het steekproefgemiddeldeeen betrouwbaarheidsinterval bepaald engekeken of in dit gebied ligt.

Page 27: Methodologie & Statistiek  I

27

Er is een praktisch probleem!meestal is van de populatie niet bekend

“behelpen” met de standaarddeviatie (=s) van de steekproef: s is schatter van !

s kan als gevolg van het toeval kleiner of groter zijn dan Extra onzekerheid wordt geintroduceerd.

voor X-gemiddeld niet de normale verdeling,maar de t-verdeling gebruiken

daarom…

Page 28: Methodologie & Statistiek  I

28

normale verdeling vst-verdeling met 3 df 95

Page 29: Methodologie & Statistiek  I

29

normale verdeling vst-verdeling met 25 df

95

Page 30: Methodologie & Statistiek  I

B I x zn( ) ( )1 / 2

B I ( )0.95 4 2 6 1 9 6 0 6. . .

95% betrouwbaarheidsinterval

z-interval

t-interval

B I x ts

n( ) ( , )1 df / 2

B I ( )0.95 4 2 6 2 0 6 0 6 5. . .

Page 31: Methodologie & Statistiek  I

31

op basis van : z-intervalop basis van s: t-interval

z-interval smaller/breder dan t-interval?

middelpunt z-interval?middelpunt t-interval?

z-interval is constant qua breedtet-interval ook constant ?

Page 32: Methodologie & Statistiek  I

32

Een docent registreerde jarenlang de resultaten die studenten scoorden op een bepaalde toets. Hij berekende: = 72 en = 12.

De docent beweert dat de huidige lichting van 36studenten (met een gemiddelde van 75.2) niet tot de beschreven populatie behoort, maar tot een populatie met 72.Dus <72 of > 72.

Met zekerheid valt niets te zeggen over die bewering!

Gebruik een onbetrouwbaarheid van 5%.

Page 33: Methodologie & Statistiek  I

33

De docent heeft gelijk: 72: alternatieve hypotheseDe docent heeft ongelijk: 72: nulhypotheseDe nulhypothese (H0) is juist totdat hij niet langer houdbaar is en wordt verworpen ten gunste van dealternatieve hypothese (H1 of HA)

Als: H0 juist is (= 72 met = 12)Dan: is het steekproefgemiddelde

een exemplaar uit de NV(72, 12/6)

95%-bi: ?????????????

Page 34: Methodologie & Statistiek  I

34

De docent heeft gelijk: 72: alternatieve hypotheseDe docent heeft ongelijk: 72: nulhypotheseDe nulhypothese (H0) is juist totdat hij niet langer houdbaar is en wordt verworpen ten gunste van dealternatieve hypothese (H1 of HA)

Als: H0 juist is (= 72 met = 12)Dan: is het steekproefgemiddelde

een exemplaar uit de NV(72, 12/6)

95%-bi: 71.28 … (75.2) … 79.12

CONCLUSIE ?????

Page 35: Methodologie & Statistiek  I

35

De alternatieve hypothese is tweezijdig(het verwerpingsgebied is tweezijdig)

Men spreekt van tweezijdig toetsen.

In zo’n geval wordt aan beide zijden de helft van gebruikt

Uitgangspunt washet steekproefgemiddelde

Page 36: Methodologie & Statistiek  I

36

Het probleem kan ook op een andere manier worden aangepakt…

Daarbij wordt niet uitgegaan van het gevonden steekproef gemiddeldemaar van het veronderstelde (= nulhypothese)populatiegemiddelde.

Kies weer voor = 5%

Page 37: Methodologie & Statistiek  I

37

De verdeling van de gemiddelden van steekproeven met n= 36 uit een populatie met = 72 en = 12 ?

Page 38: Methodologie & Statistiek  I

38

De verdeling van de gemiddelden van steekproeven met n= 36 uit een populatie met = 72 en = 12 ?

Normale verdeling met = 72 en = 12/6= 2

Page 39: Methodologie & Statistiek  I

39

KW _ L 722

1.96

KW _ R 72

21.96

KW-L= 68.08 KW_R= 75.92

Page 40: Methodologie & Statistiek  I

40

KW _ L 722

1.96

KW _ R 72

21.96

KW-L= 68.08 KW_R= 75.92

75.2

Page 41: Methodologie & Statistiek  I

41

Dit was twee-zijdig toetsen

via betrouwbaarheidsintervalvia kritieke gebied

Nu eenzijdig toetsen

alleen via kritieke gebied

Page 42: Methodologie & Statistiek  I

42

Het probleem luidde….

Een docent registreerde jarenlang de resultaten die studenten scoorden op een bepaalde toets. Hij berekende: = 72 en = 12.

De docent beweert dat de huidige lichting van 36studenten (met een gemiddelde van 75.2) niet tot de beschreven populatie behoort, maar tot een populatie met 72.Dus <72 of > 72.

Page 43: Methodologie & Statistiek  I

43

Het nieuwe probleem luidt

Een docent registreerde jarenlang de resultaten die studenten scoorden op een bepaalde toets. Hij berekende: = 72 en = 12.De docent beweert dat de huidige lichting van 36studenten (met een gemiddelde van 75.2) beter is dan de studenten uit de populatie met = 72. M.a.w. de steekproef is getrokken uit een populatie met > 72

Page 44: Methodologie & Statistiek  I

44

De alternatieve hypothese is eenzijdig(het verwerpingsgebied is eenzijdig)(het kritieke gebied ligt aan een kant)

Men spreekt van eenzijdig toetsen.

In zo’n geval wordt de hele aan eenzijde gebruikt.

In dit geval is sprake vanrechtseenzijdig toetsenomdat de waarden van onder HA

rechts van 0 liggen

Page 45: Methodologie & Statistiek  I

45

Ook hier vormt de bewering van de docent de alternatieve hypothese:HA: > 72

Hieruit wordt de nulhypothese afgeleid:H0 : < 72 (samengestelde nulhypothese)

Bij het toetsen kan maar EEN waarde voor0 worden gebruikt.

Welke ?????

Page 46: Methodologie & Statistiek  I

46

Ook hier vormt de bewering van de docent de alternatieve hypothese:HA: > 72

Hieruit wordt de nulhypothese afgeleid:H0 : < 72 (samengestelde nulhypothese)

Bij het toetsen kan maar EEN waarde voor0 worden gebruikt.

De waarde die het dichtst bij A ligt.dus: 0 = 72

Page 47: Methodologie & Statistiek  I

47

Bereken de kritieke waarde

Page 48: Methodologie & Statistiek  I

48

k w 7 22

(1 0 0 ) p ercen tie l

k w 7 22

1 .6 4 5 > > > k w 7 2 3 .2 9 > > > k w 7 5 .2 9

s te

De kritieke waarde (kw) is gelijk aan:

Page 49: Methodologie & Statistiek  I

49

k w 7 22

p ercen tie l

k w 7 22

1 .6 4 5 > > > k w 7 2 3 .2 9 > > > k w 7 5 .2 9

s te

( )1 0 0

De kritieke waarde (kw) is gelijk aan:

Page 50: Methodologie & Statistiek  I

50

De docent vond een steekproefwaarde (gemiddelde van 36 studs) van 75.2.Deze waarde ligt niet in het verwerpingsgebied

Bij een van 5% moetH0 dus niet worden verworpen

Wat zou de conclusie zijn geweest vaneen onderzoeker die werkte met = 10%

Page 51: Methodologie & Statistiek  I

51

gelet op de steekproefgegevens wordt met een vooraf gekozen risico H0 verworpen of niet verworpen.

Ook als H0 juist is zou het gevondenresultaat in de steekproef kunnen leiden tot verwerping van H0

Hoe groot was dat risico in het voorbeeld?

Waarom dat risico dan niet heel klein gekozen?

Page 52: Methodologie & Statistiek  I

52

Page 53: Methodologie & Statistiek  I

53

correct

Page 54: Methodologie & Statistiek  I

54

correct

type Ifout

Page 55: Methodologie & Statistiek  I

55

correct

type Ifout

correct

fouttype II

Page 56: Methodologie & Statistiek  I

56

correct

correct

Page 57: Methodologie & Statistiek  I

57

Page 58: Methodologie & Statistiek  I

58

H0 niet verwerpen

H0 verwerpen

Page 59: Methodologie & Statistiek  I

59

Deel van verdeling onder H0 in kritieke gebied

Deel van verdeling onder HA in acceptatie gebied

Page 60: Methodologie & Statistiek  I

60

Deel van verdeling onder H0 in kritieke gebied

Deel van verdeling onder HA in acceptatie gebied

Page 61: Methodologie & Statistiek  I

61

wanneer wordt gekozenvoor een kleinere ,wordt groter!

hoe kan bij gelijkblijvende wordenverkleind

Page 62: Methodologie & Statistiek  I

62

Page 63: Methodologie & Statistiek  I

63

Page 64: Methodologie & Statistiek  I

64

Deel van verdeling onder H0 in kritieke gebied

Deel van verdeling onder HA in acceptatie gebied

Page 65: Methodologie & Statistiek  I

65

Page 66: Methodologie & Statistiek  I

66

Page 67: Methodologie & Statistiek  I

67

De kritieke waarde (kw) is gelijk aan: 75.29

Bereken en 1-als HA gelijk is aan 77

Z= 0.855 >> = 19.63% >> 1= 80.37%

Page 68: Methodologie & Statistiek  I

68

Z= 0.855 >> = 19.63% >> 1= 80.37%

Als de werkelijke gelijk is aan 77 zal een steekproef uit die populatie met een kansvan 80.37% leiden tot verwerping van H0

deze kans is voor elke waarde van HA uitte rekenen….

Page 69: Methodologie & Statistiek  I

69

A z 1

72 1.645 95.00 5.0073 1.145 87.39 12.6174 0.645 74.05 25.9575 0.145 55.77 44.2376 -0.355 36.63 63.3777 -0.855 19.63 80.3778 -1.355 8.77 91.2379 -1.855 3.18 96.8280 -2.355 0.925 99.07581 -2.855 0.215 99.78582 -3.355 0.004 99.996

In een grafiekA uitzettentegen 1-:

powerfunctie

Page 70: Methodologie & Statistiek  I

70

Page 71: Methodologie & Statistiek  I

71

hoe stijler de helling,hoe ‘scherper’ de toets

hoe is deze helling tebeinvloeden????

Page 72: Methodologie & Statistiek  I

72

twee-zijdigm.b.v. betrouwbaarheidsintervalm.b.v. kritieke gebied

Overzicht van het toetsen tot nu toe:

een-zijdigm.b.v kritieke gebied

Page 73: Methodologie & Statistiek  I

73

twee-zijdigm.b.v. betrouwbaarheidsintervalm.b.v. kritieke gebied

Overzicht van het toetsen tot nu toe:

een-zijdigm.b.v kritieke gebied

In plaats van te kijken naar kritieke waarde kun je ook kijken naarde p-waarde van de toetsingsgrootheid

Page 74: Methodologie & Statistiek  I

74

1. maak gebruik van het kritieke waarde/gebied

a. construeer nulhypothese(eenzijdig/tweezijdig?)

b. bepaal ombetrouwbaarheid c. kies een toetsingsgrootheid T

(gemiddelde? Omvang steekproef)d. bepaal de verdeling van Te. bereken kritieke gebiedf. bereken toetsingsgrootheid T* in de

steekproefg. trek conclusie:

T* ligt in het kritieke gebied (= verwerpen)of niet (= niet verwerpen)

Page 75: Methodologie & Statistiek  I

75

2. Bepaal de p-waarde van de toetsingsgrootheid

a. construeer nulhypothese(eenzijdig/tweezijdig?)

b. bepaal ombetrouwbaarheid c. kies een toetsingsgrootheid T

(gemiddelde? Omvang steekproef)d. Bepaal de verdeling van Te. bereken toetsingsgrootheid T* in de

steekproeff. bepaal de overschrijdingskans p van T*g. trek conclusie:

p < : (= verwerpen)p > : (= niet verwerpen)

Page 76: Methodologie & Statistiek  I

76

De twee manieren gedemonstreerd m.b.v. eeneerder gebruikt voorbeeld

Een docent registreerde jarenlang de resultaten die studenten scoorden op een bepaalde toets. Hij berekende: = 72 en = 12.De docent beweert dat de huidige lichting van 36studenten (met een gemiddelde van 75.2) beter is dan de studenten uit de populatie met = 72. M.a.w. de steekproef is getrokken uit een populatie met > 72

Page 77: Methodologie & Statistiek  I

77

a. Nulhypothese: = 72: rechtseenzijdigb. Onbetrouwbaarheid: = 5%c. Toetsingsgrootheid T: gemiddelden van

steekproef van 36 stuksd. Verdeling van T: NV(72, 2)e. Kritieke gebied: 75.29 en groterf. Bereken T*: 75.2g. Trek conclusie: T* niet in verwerpings-

bied: H0 niet verwerpen

1. Toetsen m.b.v. kritieke gebied

Page 78: Methodologie & Statistiek  I

78

a. Nulhypothese: = 72: rechtseenzijdigb. Onbetrouwbaarheid: = 5%c. Toetsingsgrootheid T: gemiddelden van

steekproef van 36 stuksd. Verdeling van T: NV(72, 2)

e. Bereken T*: 75.2 (>> z= 1.6)f. Bepaal overschrijdingskans: 5.48%g. Trek conclusie: p-waarde van T*

is groter dan : H0 niet verwerpen

2. Toetsen m.b.v. p-waarde

Page 79: Methodologie & Statistiek  I

79

1. Twee toetsen voor een gemiddelde:z-toets () en t-toets (s)

2. Betrouwbaarheidsintervallen (z en t)3. Toetsen: beslissen in onzekerheid

eenzijdig <–>tweezijdigBI <–> kritieke gebiedkritieke gebied <–> p-waarde

4. Fout van de eerste soort: -foutFout van de tweede soort: -fout

5. Hoofdstuk 5: sleutelhoofdstuk6. Hoofdstuk 6: toetsen voor twee

gemiddelden:z-toets en t-toets

Page 80: Methodologie & Statistiek  I

80

Page 81: Methodologie & Statistiek  I

81

Page 82: Methodologie & Statistiek  I

82