pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme...

57
Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018 3.4 Naar statistische inferentie Statistische inferentie = het afleiden van conclusies over de omvangrijkere populatie uit gegevens over geselecteerde elementen Parameter = een getal dat de gehele populatie beschrijft. Het is een vastgesteld getal, maar in praktijk weten we de waarde niet. Steekproefgrootheid = een getal dat een steekproef beschrijft. Deze wordt vaak gebruikt om een onbekende parameter te schatten. 3.4.1 Steekproefvariabiliteit Steekproefvariabiliteit = de waarde van de steekproefgrootheid (bijv. 66% in winkel onderzoek) varieert bij herhaalde aselecte steekproeftrekking. Aselecte steekproeven voorkómen vertekeningen door de manier van steekproeftrekking, maar ze kunnen er nog steeds naast zitten vanwege de variabiliteit van de resultaten bij een aselecte steekproef. Er zijn twee voordelen van aselecte steekproef: 1. aselect kiezen gaat vertekening tegen 2. wanneer we veel steekproeftrekkingen van dezelfde omvang uit dezelfde populatie trekken, de variatie van steekproef tot steekproef een voorspelbaar patroon volgt. Alle statistische inferentie is gebaseerd nagaan hoe betrouwbaar een procedure is door te vragen wat er zou gebeuren als we die vaak zouden herhalen. Het is moeilijk om een bepaalde steekproef heel vaak te herhalen, dus wordt dat nagebootst door toevalscijfers te gebruiken. Simulatie = het nabootsen van steekproeven via tabellen of computersoftware 3.4.2 Steekproefverdelingen Simulatie is een krachtig middel voor het bestuderen van toevalsverschijnselen. Steekproefverdeling (van een steekproefgrootheid) = de verdeling van de waarden die de steekproefgrootheid aanneemt bij alle mogelijke steekproeven van één en dezelfde omvang, getrokken uit één en dezelfde populatie. Een verdeling die verkregen is uit een vast aantal pogingen is slechts een benadering van de steekproefverdeling. Door kansrekening toe te passen kan men tot precieze steekproefverdelingen komen zonder simulatie. De interpretatie van een steekproefverdeling blijft gelijk, of men nu kansrekening of simulatie gebruikt. Er zijn 3 hulpmiddelen voor data-analyse om elke willekeurige verdeling te beschrijven: 1. Vorm: de histogrammen zien er uit als normale verdelingen 2. Centrum: de steekproeffracties variëren van steekproef tot steekproef, maar de waarden zijn gecentreerd rond de 1

Transcript of pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme...

Page 1: pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen:

Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018

3.4 Naar statistische inferentie Statistische inferentie = het afleiden van conclusies over de omvangrijkere populatie uit gegevens over geselecteerde elementen Parameter = een getal dat de gehele populatie beschrijft. Het is een vastgesteld getal, maar in praktijk weten we de waarde niet. Steekproefgrootheid = een getal dat een steekproef beschrijft. Deze wordt vaak gebruikt om een onbekende parameter te schatten.

3.4.1 SteekproefvariabiliteitSteekproefvariabiliteit = de waarde van de steekproefgrootheid (bijv. 66% in winkel onderzoek) varieert bij herhaalde aselecte steekproeftrekking. Aselecte steekproeven voorkómen vertekeningen door de manier van steekproeftrekking, maar ze kunnen er nog steeds naast zitten vanwege de variabiliteit van de resultaten bij een aselecte steekproef. Er zijn twee voordelen van aselecte steekproef:1. aselect kiezen gaat vertekening tegen 2. wanneer we veel steekproeftrekkingen van dezelfde omvang uit dezelfde populatie trekken, de variatie van steekproef tot steekproef een voorspelbaar patroon volgt. Alle statistische inferentie is gebaseerd nagaan hoe betrouwbaar een procedure is door te vragen wat er zou gebeuren als we die vaak zouden herhalen. Het is moeilijk om een bepaalde steekproef heel vaak te herhalen, dus wordt dat nagebootst door toevalscijfers te gebruiken. Simulatie = het nabootsen van steekproeven via tabellen of computersoftware

3.4.2 Steekproefverdelingen Simulatie is een krachtig middel voor het bestuderen van toevalsverschijnselen. Steekproefverdeling (van een steekproefgrootheid) = de verdeling van de waarden die de steekproefgrootheid aanneemt bij alle mogelijke steekproeven van één en dezelfde omvang, getrokken uit één en dezelfde populatie. Een verdeling die verkregen is uit een vast aantal pogingen is slechts een benadering van de steekproefverdeling. Door kansrekening toe te passen kan men tot precieze steekproefverdelingen komen zonder simulatie. De interpretatie van een steekproefverdeling blijft gelijk, of men nu kansrekening of simulatie gebruikt. Er zijn 3 hulpmiddelen voor data-analyse om elke willekeurige verdeling te beschrijven:1. Vorm: de histogrammen zien er uit als normale verdelingen2. Centrum: de steekproeffracties variëren van steekproef tot steekproef, maar de waarden zijn gecentreerd rond de steekproefgrootheid. Wanneer dit het geval is, heeft steekproeffractie p̂ geen vertekening als schatter van p. 3. Spreiding: de waarden van uit steekproeven met een grotere omvang hebben minder spreiding p̂dan die uit steekproeven met een kleinere omvang.

3.4.3 Vertekening en variabiliteitSteekproeven met grote omvangen leveren bijna altijd een geschatte op die de echte waarde van p̂de populatie benadert. Variabiliteit is van even groot belang als vertekening. Vertekening betekent dat de steekproefwaarden zich niet centreren rond de populatiewaarde.→ heeft betrekking op het centrum van de steekproefverdeling. Hoge variabiliteit betekent herhaalde steekproeven geen overeenkomstige resultaten geven, maar verschillen erg onderling.

1

Page 2: pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen:

Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018

→ wordt beschreven door de spreiding van de steekproefverdeling. De spreiding is afhankelijk van de steekproefopzet en de steekproefomgang n. Steekproef grootheden uit grotere aselecte steekproeven hebben een kleinere spreiding. En lage vertekening, maar hoge variabiliteit kunnen samen voorkomen en vice versa. Om de vertekening te verkleinen wordt er gebruik gemaakt van aselecte steekproeven.Om de variabiliteit van een steekproefgrootheid van een EAS te verkleinen, wordt er een grotere steekproef genomen. Grote aselecte steekproeven leveren doorgaans een schatting die de werkelijkheid dicht benadert. De resultaten van een steekproefonderzoek hebben doorgaans een foutenmarge die de omvang van de waarschijnlijke fout begrenst. De foutenmarge weerspiegelt direct de variabiliteit van de steekproefgrootheid (dus kleiner voor grotere steekproeven).

3.4.4 Steekproeven uit grote populaties De variabiliteit van een steekproefgrootheid uit een aselecte steekproef hangt niet af van de omvang

van de populatie, zolang de populatie minstens 100 keer zo groot is als de steekproef.

Hs. 4 Kansrekening: de studie van het toeval4.1 ToevalDe uitkomst van een EAS kan niet worden voorspeld, maar na vele herhalingen komt er wel een regelmatig patroon naar voren → dit vormt de basis van kansberekening.

4.1.1 Vocabulaire van de kansrekeningToevallig = verwijst naar een soort ordening die zich pas op de lange termijn openbaart. Toevalsverschijnsel = verschijnsel waarbij de individuele uitkomsten onzeker zijnKans = fractie keren dat de uitkomst voorkomt in een lange reeks herhalingenHet principe van kansrekening is empirisch, gebaseerd op waarnemingen

4.1.2 Over toevalWiskundige kansrekening is een idealisatie die gebaseerd is op wat er zou gebeuren als er een oneindig aantal pogingen zou worden ondernomen. Beste manier is waarnemingen, maar

2

Samenvatting boek:Een getal dat een populatie beschrijft wordt een parameter genoemd. Een getal dat uit de data kan worden berekend, wordt een steekproefgrootheid genoemd. Gewoonlijk worden steekproefgrootheden gebruikt om uitspraken te doen over onbekende parameters.Een steekproefgrootheid van een kanssteekproef of toevalsexperiment heeft een steekproefverdeling die beschrijft hoe de steekproefgrootheid varieert bij herhaalde steekproeftrekking. De steekproefverdeling beantwoordt de vraag ‘wat zou er gebeuren wanneer we de steekproef of het experiment vele malen zouden herhalen?’ De formele statistische inferentie baseert zich op de steekproefverdelingen van steekproefgrootheden. Een steekproefgrootheid als schatter van een parameter kan te lijden hebben van vertekening of van grote variabiliteit. Vertekening betekent dat het centrum van de steekproefverdeling niet gelijk is aan de werkelijke waarde van de parameter. De variabiliteit van de steekproefgrootheid wordt beschreven door de spreiding van zijn steekproefverdeling. Correct gekozen steekproefgrootheden die verkregen zijn via gerandomiseerde gegevensproductie hebben geen vertekening die voortvloeit uit de wijze waarop de steekproef is gekozen of de wijze

Page 3: pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen:

Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018

computersimulaties zorgen voor veel sneller onderzoek. Bij het bestuderen van toevalsverschijnselen dient men op het volgende te letten:

● Er moeten lange reeksen onafhankelijke pogingen worden genomen.

● Het principe van kansrekening is empirisch

● Computersimulaties zijn erg nuttig omdat er lange reeksen pogingen nodig zijn (computersimulaties zijn niet empirisch)

4.2 KansmodellenKansmodel = een beschrijving van een toevalsverschijnsel Een kansmodel bestaat uit een lijst van de mogelijke uitkomsten en een kans voor elke uitkomst

4.2.1 UitkomstenruimteUitkomstenruimte S = de verzameling van alle mogelijke uitkomsten

4.2.2 Intuïtieve kansGebeurtenis = een verzameling uitkomsten van een toevalsverschijnsel; ofwel: een deelverzameling van de uitkomstenruimte In een kansberekeningsmodel hebben gebeurtenissen een bepaalde kans. Eigenschappen van toekenning van kansen zijn:

1. Elke kans is een getal tussen 0 en 12. Alle mogelijke uitkomsten moeten samen een kans van 1 hebben3. Wanneer twee gebeurtenissen geen gelijke uitkomsten hebben, dan is de kans dat het een of

het ander voorkomt de som van hun individuele kansen. 4. De kans dat een gebeurtenis niet plaatsvindt is 1 min de kans dat de gebeurtenis wel

plaatsvindt

4.2.3 Basisregels voor kansen1. De kans P(A) op een gebeurtenis A voldoet aan 0 ≤ P(A) ≤ 12. Als S de uitkomstenruimte is in een kansmodel, dan is P(S) = 13. Twee gebeurtenissen A en B zijn disjunct als zij geen gezamenlijke uitkomsten hebben en

daardoor nooit tegelijkertijd kunnen optreden: P(A of B) = P(A) + P(B) ← optelregel voor disjuncte gebeurtenissen

4. Als A een gebeurtenis is, dan heet de gebeurtenis dat A niet optreedt het complement van A genoteerd als Ac. De complement regel: P(Ac) = 1 – P(A)

Bij een disjuncte gebeurtenis hoeft niet de hele uitkomstenruimte gevuld te zijn, bij een complementaire gebeurtenis wordt wel de hele uitkomstenruimte gebruikt.

4.2.4 Toekennen van kansen: eindig aantal uitkomstenDoor individuele kansen bij elkaar op te tellen, krijg je de kans van een gebeurtenis.

4.2.5 Toekennen van kansen: even waarschijnlijke uitkomsten

3

Samenvatting boek: Een toevalsverschijnsel heeft uitkomsten die niet te voorspellen zijn maar die niettemin bij heel veel herhalingen een regelmatige verdeling hebben.De kans van een gebeurtenis is de fractie keren dat de gebeurtenis voorkomt in veel herhaalde pogingen van een toevalsverschijnsel.

Page 4: pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen:

Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018

Als een toevalsverschijnsel k mogelijke uitkomsten heeft, die alle even waarschijnlijk zijn, dan heeft elke individuele uitkomst de kans 1/k. De meeste toevalsverschijnselen hebben uitkomsten die niet even waarschijnlijk zijn, zodat de algemene regel voor eindige uitkomstenruimten belangijker is dan de speciale regel voor even waarschijnlijke uitkomsten.

4.2.6 Onafhankelijkheid en productregel5. De gebeurtenissen A en B zijn onafhankelijk als de wetenschap dat A gebeurt niet de kans

verandert dat B gebeurt. Als A en B onafhankelijk zijn, dan geldt: P(A en B) = P(A) * P(B) ← productregel voor onafhankelijke gebeurtenissen

In de praktijk wordt zelden een precieze definitie van onafhankelijkheid gebruikt, omdat de onafhankelijkheid doorgaans als deel van het kansmodel wordt aangenomen. De productregel is enkel geldig als de gebeurtenissen onafhankelijk zijn. De optelregel is enkel geldig als de gebeurtenissen disjunct zijn. Disjuncte gebeurtenissen zijn niet onafhankelijk

4.2.7 Toepassen van kansregelsAls gebeurtenissen A en B onafhankelijk zijn, dan zijn hun complementen Ac en Bc ook onafhankelijk en is Ac ook onafhankelijk van B.

4.3 Stochastische variabelenStochastische variabele = een variabele waarvan de waarde een numerieke uitkomst is van een toevalsverschijnsel (de waarde varieert dus wanneer de steekproef wordt herhaald).

4.3.1 Discrete stochastische variabelen Een discrete variabele X heeft een eindig aantal mogelijke waarden. De kansverdeling van X somt de waarden op en hun kansen:

Waarde van X X1 X2 X3 X4Kans P1 P2 P3 P4

De kansen moeten aan twee eisen voldoen:1. Elke kans is een getal tussen 0 en 1 2. p1+p2+….. +pk=1

4.3.2 Continue stochastische variabelen Je kunt niet aan alle mogelijke waarden een kans vastmaken, omdat er oneindig veel mogelijkheden zijn. Daarom wordt er een andere manier gebruikt om kansen toe te kennen aan gebeurtenissen, namelijk als oppervlaktes onder een kromme. Continue stochast = neemt alle waarden aan in een interval van getallen. De kansverdeling van deze stochast X wordt dan beschreven door een dichtheidskromme. De kans op een gebeurtenis is gelijk aan de oppervlakte onder de dichtheidskromme en boven de waarden van X die de gebeurtenis vormen. In feite kent elke continue kansverdeling aan elke individuele uitkomst de kans 0 toe. De kans op elke interval is gelijk aan zijn breedte.

4.3.3 Normale verdelingen als kansverdelingen

4

Samenvatting boek:Een kansmodel voor een toevalsverschijnsel bestaat uit een uitkomstenruimte S en een toekenning van kansen P.De uitkomstenruime S is de verzameling van alle mogelijke uitkomsten van een toevalsverschijnsel. Verzamelingen van uitkomsten worden gebeurtenissen genoemd. P kent aan een gebeurtenis A het getal

Page 5: pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen:

Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018

De dichtheidskromme die ons het meest vertrouwd zijn, zijn de normale krommen. Dus normale verdelingen zijn kansverdelingen.

4.4 Verwachtingen en variantie van stochastische variabelen4.4.1 De verwachting van een stochastische variabeleDe verwachting van een stochastische variabele X is een soort gemiddelde over de mogelijke waarden van X, teneinde rekening gehouden met het feit dat niet alle uitkomsten even waarschijnlijk zijn (‘gewogen gemiddelde’). De verwachting van een kansverdeling de gemiddelde uitkomst op lange termijn. Verwachting van een kansverdeling = μ. Om de verwachting van X te vinden vermenigvuldigt u elke mogelijke waarde met zijn kans, vervolgens telt u alle producten op.

μx = x1p1 + x2p2 + … +xkpk = Ʃxipi De verwachting bij een discrete stochastische variabele is een gewogen gemiddelde, waarbij elke uitkomst een gewicht krijgt gelijk aan zijn kans. Bij een continue variabele is de verwachting het evenwichtspunt van een verdeling (bij een normale dichtheidskromme is dat dus precies in het midden).

4.4.2 Statistische schatting en de wet van de grote aantallenμ is een parameter en een x̄ steekproefgrootheid. Het lijkt redelijk te gebruiken om μ te schatten. x̄Een EAS moet in grote lijnen de populatie vertegenwoordigen, zodat het gemiddelde van de x̄steekproef in de buurt moet komen van het gemiddelde μ van de populatie. is zuiver en we kunnenx̄ zijn variabiliteit beheersen door de steekproefgrootte te kiezen. Wet van de grote aantallen = als we steeds waarnemingen blijven toevoegen aan onze aselecte steekproef, zal de steekproefgrootheid x̄ gegarandeerd net zo dicht de parameter μ naderen als wij willen. Deze wet geldt voor elke populatie.

4.4.3 Nadenken over de wet van de grote aantallen Volgens de wet van de grote aantallen zullen vele individuele keuzes tot een stabiele uitkomst leiden. Hoe variabeler de uitkomsten zijn, hoe meer pogingen nodig zijn om te garanderen dat de gemiddelde uitkomst dicht bij het gemiddelde van de verdeling μ ligt. x̄

4.4.4 Regels voor verwachtingen 1. Als X een stochastische variabele is en a en b vaste getallen zijn, dan geldt:

μa+bX = a + bμX

2. Als X en Y stochastische variabelen zijn, dan geldt:μX+Y = μX + μY

4.4.5 De variantie van een stochastische variabele De variantie en standaardafwijking zijn de maten voor de spreiding. We geven de variantie van een stochastische variabele het symbool σ 2 i.p.v. s2. De variantie is de gemiddelde waarde van de kwadraten van de afwijkingen van de variabele X tot zijn verwachting μX. Er wordt hier ook gebruikt gemaakt van een gewogen gemiddelde. Voor discrete variabele geldt:

σ 2x = (x1-μX)²p1 + (x2-μX)²p2 + … + (xk-μX)²pk

5

Samenvatting boek:Een stochastische variabele is een variabele die numerieke waarden aanneemt die bepaald worden door de uitkomst van een toevalsverschijnsel. Veel kansmodellen nemen voor S alle mogelijke waarden van een stochastische variabele X en definiëren P uit de kansverdeling van X.

Page 6: pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen:

Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018

= Ʃ(x i-μX)²piDe standaardafwijking σ x van X is de vierkantswortel van de variantie

4.4.6 Regels voor varianties Alhoewel de verwachting van een som van stochastische variabelen altijd gelijk is aan de som van hun verwachtingen, is deze regel niet altijd juist voor varianties. Als stochastische variabelen onafhankelijk zijn, dan kunnen de varianties worden opgeteld. Regels voor varianties:1. Als X een stochastische variabele is en a en b vaste getallen, dan geldt:

σ 2a+bX= b²σ 2x2. Als X en Y onafhankelijke stochastische variabele zijn, dan geldt:

σ 2X+Y = σ 2X + σ 2Yσ 2X−Y = σ 2X + σ 2Y

3. optelregel voor varianties van onafhankelijke stochastische variabelen Als X en Y een correlatie ρ hebben, dan geldt:

σ 2X+Y = σ 2X + σ 2Y + 2 ρσ x σ y

σ 2X−Y = σ 2X + σ 2Y - 2 ρσ x σ y

Merk op dat vermenigvuldiging van X met een constante b de σ 2x vermenigvuldigt met het kwadraat van die constante. De optelregel voor varianties houdt in dat standaardafwijkingen in het algemeen niet mogen worden opgeteld. Standaardafwijkingen worden het gemakkelijkst gecombineerd door de regels voor varianties te gebruiken, niet door aparte regels te geven voor standaardafwijkingen.

4.5 De wetten van kansrekeningRegels van kansrekening:1. 0 ≤ P(A) ≤ 1 voor elke gebeurtenis A2. P(S) = 13. Optelregel: als de gebeurtenissen A en B disjunct zijn, dan geldt P(A of B) = P(A) + P(B) 4. Complementregel: voor elke gebeurtenis A geldt P(Ac) = 1 – P(A)5. Productregel: als de gebeurtenissen A en B onafhankelijk zijn, dan geldt P(A en B) = P(A) * P(B)

4.5.1 Algemene optelregelsVereniging van een willekeurige verzameling gebeurtenissen = de gebeurtenis dat ten minste 1 uit de verzameling optreedt (bij het woordje “of”)De optelregel voor disjuncte gebeurtenissen is uit te breiden naar:

P(A of B of C) = P(A) + P(B) + P(C) Algemene optelregel voor vereniging van twee gebeurtenissen:

P(A of B) = P(A) + P(B) – P(A en B)

4.5.2 Voorwaardelijke kansProductregel:

P(A en B) = P(A)P(B|A)

6

Samenvatting boek: De kansverdeling van een stochastische variabele X heeft, net als de verdeling van gegevens een verwachting en een standaardafwijking .De Wet van de grote aantallen zegt dat het gemiddelde van de waargenomen waarden van X na heel veel pogingen μ benadert.De verwachting μ is het evenwichtspunt van een kashistogram of dichtheidskromme. Als X discreet is met mogelijke waarden met

Page 7: pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen:

Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018

Hier is P(B|A) de voorwaardelijke kans dat B plaatsvindt gegeven het feit dat A ook plaatsvindt. Als P(A) > 0, is de voorwaardelijke kans op B, gegeven A:

P(B|A) = P (A enB)P(A)

4.5.3 Algemene productregelsVaak vormen voorwaardelijke kansen onderdeel van de informatie die ons in een kansmodel is verschaft, en wordt de productregel gebruikt om P(A en B) te bereken. Doorsnede van een willekeurige verzameling gebeurtenissen = de gebeurtenis dat alle gebeurtenissen optreden De productregel is uit te breiden naar de kans dat er verscheidene gebeurtenissen zijn die allemaal optreden. De kans op de doorsnede van drie gebeurtenissen A, B en C is bijvoorbeeld:

P(A en B en C) = P(A) P(B|A) P(C|A en B)

4.5.4 BoomdiagrammenBoomdiagrammen combineren de optel- en productregel. De productregel zegt dat de kans om het eind van een complete tak te bereiken het product is van de kansen op de segmenten.

4.5.5 De regel van BayensVeronderstel dat A1, A2, …, Ak disjuncte gebeurtenissen zijn waarvan de kansen niet 0 zijn en samen 1 zijn. Dat wil zeggen, elke uitkomst is precies één van deze gebeurtenissen. Als dan C een willekeurige andere gebeurtenis is waarvan de kans niet 0 of 1 is, dan geldt:

P(Ai|C) = P ( Ai ) P (A i )

P ( A1 )P ( A1 )+P ( A2 ) P (A2 )+…+P ( Ak )P ( Ak)De teller in de regel van Bayes is altijd een van de termen uit de som die de noemer vormt.

4.5.6 Nogmaals onafhankelijkheidTwee gebeurtenissen A en B die beide een positieve kans hebben, zijn onafhankelijk als:

P(B|A) = P(B)

Hs. 5 SteekproevenverdelingenBij statistische inferentie trekken we op grond van gegevens conclusies over een populatie of een proces. De gegevens worden samengevat door steekproefgrootheden. Het verband tussen waarschijnlijkheid en gegevens bestaat uit de steekproefverdeling van bepaalde statistische grootheden of waarden. Een steekproefverdeling geeft aan hoe een bepaalde grootheid zou variëren bij herhaalde aanlevering van gegevens. Een steekproefgrootheid bij een kanssteekproef of een toevalsexperiment is een stochastische variabele. De kansverdeling van de steekproefgrootheid is zijn steekproefverdeling. Elke grootheid die voor ieder element van de populatie kan worden gemeten, wordt beschreven door de verdeling van zijn waarden voor alle elementen van de populatie. Populatieverdeling = de verdeling van zijn waarden voor alle leden van de populatie. De populatieverdeling is ook de kansverdeling van de variabele wanneer we een willekeurig individu uit de populatie kiezen.

7

Samenvatting boek:Het complement van een gebeurtenis A bevat alle uitkomsten die niet in A voorkomen. De vereniging {A of B} van de gebeurtenissen A en B bevat alle uitkomsten in A, in B of in zowel A als B. De doorsnede {A en B} bevat alle uitkomsten die zowel in A als in B voorkomen, maar niet de uitkomsten die allen in A of alleen in B voorkomen.

Page 8: pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen:

Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018

5.1 Steekproefverdelingen voor aantallen en proporties

Als het aantal waarnemingen n is, dan is de steekproefproportie gelijk aan = p̂ Xn .

5.1.1 De binomiale verdelingen van steekproefaantallenDe binomiale situatie:1. Er is een vast aantal van n waarnemingen 2. De n waarnemingen zijn alle onafhankelijke3. Elke waarneming valt in één van precies twee categorieën, die we voor het gemak aanduiden met “succes” en “mislukking”4. De kans op succes, met als notatie p, is voor elke waarneming hetzelfdeDe verdeling van het aantal successen X in de binomiale situatie heet de binomiale verdeling met parameters n en p. Parameter n is het aantal waarnemingen, en p is de kans op succes bij elke individuele waarneming. De mogelijke waarden X zijn de hele getallen van 0 tot n. Als afkorting zeggen we : X is B(n,p). Binomiale verdelingen vormen een belangrijke klasse van discrete kansverdelingen.

5.1.2 Binomiale verdelingen in steekproevenUit een populatie een EAS trekken is geen zuivere binomiale situatie. Steekproevenverdeling van een aantalIndien de populatie veel groter is dan de steekproef, heeft het aantal successen in een EAS van omvang n bij benadering de B(n,p)-verdeling, waar p de fractie successen in de populatie is.De nauwkeurigheid van deze benadering neemt toe wanneer de omvang van de populatie groter wordt in verhouding tot de steekproefgrootte. Als vuistregel gebruiken we de binomiale verdeling voor aantallen, mits de populatie ten minste 20 maal zo groot is als de steekproef.

5.1.3 Binomiale kansen bepalen: tabellenGebruik tabel C

5.1.4 Verwachting en standaardafwijking van een binomiale verdelingEen binomiale stochastische variabele X telt het aantal successen in n onafhankelijke waarnemingen, die elk dezelfde kans p op succes hebben.

Resultaat

1 0

Kans P 1-p Laat Si de stochastische variabele zijn die aangeeft of de i-de waarneming als dan niet een succes is, door bij succes de waarde Si = 1 te nemen, en voor een mislukking Si = 0. De Si’s zijn onafhankelijk omdat de waarnemingen dat zijn, en alle Si’s hebben dezelfde verdeling:

De definitie van de verwachting van een discrete stochastische variabele zegt ons dat de verwachting voor elke Si is:

μs = (1)(p) + (0)(1-p) = pDe definitie van de variantie laat op overeenkomstige wijze zien dat σ ² s = p(1-p). Omdat elke Si 1 is voor een treffer en 0 voor een misser, is het totale aantal treffers X gewoon de som van de Si’s:

X = S1 + S2 + … + SnPas nu op deze som de optelregels voor verwachtingen en varianties toe. De verwachting voor X is de som van de verwachtingen van de Si’s:

μx = μS 1 + μS 2 + …. + μSn μx = n*μs = n*p

Op analoge wijze is de variantie n maal de variantie van één enkele S, zodat σ ²x = np(1-p).

8

Page 9: pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen:

Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018

De standaarddeviatie σ x is de vierkantswortel uit de variantie.Als X de B(n,p)-verdeling heeft, dan geldt: Verwachting: μx = np

Standaardafwijking: σ x= √❑

5.1.5 Steekproeffracties In de binomiale situatie willen we vaak een schatting van de fractie successen p in de populatie. Onze schatter is de fractie successen in de steekproef:

= p̂ aantal successen∈de steekproefsteekproefomvang =

Xn

Let op dat u onderscheid maakt tussen de proportie en het aantal Xp̂ . In de binomiale situatie heeft X een binomiale verdeling. De proportie hoeft geen binomiale p̂verdeling te hebben. Wij kunnen op echter toch kansberekeningen toepassen, door die te p̂herformuleren in termen van het aantal X, en de binomiale verdeling te gebruiken. Verwachting en standaardafwijking van een steekproeffractie:Stel dat de fractie successen is in een EAS van omvang n, getrokken uit een grote populatie, met dep̂ fractie successen p in de populatie. De verwachting en de standaardafwijking van zijn:p̂

μ p̂ = pσ p̂ = √❑

De formule voor σ p̂ gebruiken we wanneer de populatie op zijn minst 20 maal zo groot is als de steekproef. Het feit dat de verwachting van gelijk is aan p zegt dat de steekproeffractie in een EAS een p̂ p̂zuivere schatter is van de populatiefractie p. De steekproefomvang moet met 4 worden vermenigvuldigd om de standaarddeviatie te kunnen halveren.

5.1.6 Normale benadering van aantallen en fractiesIn feite zijn zowel het aantal X als de steekproefproportie in grote steekproeven vrijwel normaal p̂verdeeld. Normale benadering voor steekproeffracties:Stel dat de steekproeffractie successen is in een EAS van omvang n, getrokken uit een grote p̂populatie, waar p de fractie successen in de populatie is. Als n groot is, dan is de steekproefverdeling van bij benadering normaal met verwachting p en standaardafwijking p̂ √❑

X is bij benadering N (np ,√❑) is bij benadering N P̂ ( p ,√❑)

Omdat het binomiale aantal X precies gelijk is aan een vast getal n maal de fractie, is ook X bij benadering normaal, met verwachting np en standaardafwijking √❑. We zullen daarom de benaderingen gebruiken voor waarden van n en p die voldoen aan np ≥ 10 en n(1-p) ≥ 10. De nauwkeurigheid van normaalbenaderingen wordt beter naarmate de steekproefomvang n toeneemt.

5.1.8 Binomiale formules Binomiaalcoëfficiënt: Het aantal manieren waarop k successen gekozen kunnen worden uit n waarnemingen wordt gegeven door de binomiaalcoëfficiënt

( nk ) = n!

k !(n−k ) !

Voor k = 0; 1; 2; …; n

( nk ) is op je rekenmachine n nCr k.

9

Page 10: pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen:

Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018

Binomiale kans:Als X de binomiale verdeling B(n,p) heeft met n waarnemingen en de kans p op succes bij elke waarneming, zijn de mogelijke waarden van X 0; 1; 2; …; n. Als k een van deze waarden is, wordt de binomiale kans:

P(X = k) = ( nk ) pk (1−p)n−k

5.2 SteekproefgemiddeldenAantallen en fracties zijn discrete stochastische variabelen die kwalitatieve data beschrijven. Steekproefgrootheden zijn continue stochastische variabelen die kwantitatieve data beschrijven. Gemiddelden zijn minder variabel dan afzonderlijke waarnemingen.Gemiddelden zijn meer normaal verdeeld dan afzonderlijke waarnemingen.

5.2.1 Het gemiddelde en de standaarddeviatie van x̄

10

Samenvatting boek:Een aantal X successen heeft in de binomiale situatie de binomiale verdeling B(n,p): er zijn n waarnemingen die alle onafhankelijk zijn, stuk voor stuk resulteren in succes of mislukking, en allemaal dezelfde kans op succes hebben.Binomiale kansen zijn het gemakkelijkst te berekenen met behulp van software. Er bestaat een exacte formule die praktisch is voor berekeningen bij een kleine n. Tabel C bevat binomiale kansen voor bepaalde waarden van n en p. Voor een grote n kunt u de normaalbenadering gebruiken.De binomiale verdeling B(n,p) geeft een goede benadering voor de steekproefverdeling van het aantal successen in een EAS van de omvang n uit een grote populatie met een succesproportie p. Wij gebruiken deze benadering wanneer de populatie op zijn minst 20 maal zo groot is als de steekproef. Verwachting en standaarddeviatie van een binomiaal verdeed aantal X en een steekproefproportie successen p̂ = X/n zijn

= np = p= =

De steekproefproportie p̂ is dus een zuivere schatter van de populatieproportie p. De normaalbenadering van de binomiale verdeling zegt dat als X een aantal is met de verdeling B(n,p), bij een grote n:

X is bij benadering N P̂ is bij benadering N

Wij gebruiken deze benaderingen bij np ≥ 10 en n(1-p) ≥ 10. De exacte binomiale waarschijnlijkheidsformule is:

P(X = k) = Waarin de mogelijke waarden van X zijn k = 0; 1; …; n. De binomiale waarschijnlijkheidsformule gebruikt de binomiale coëfficiënt

= De binomiaalcoëfficiënt telt het aantal manieren waarop k successen kunnen zijn verdeeld over n waarnemingen.

Page 11: pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen:

Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018

Het steekproefgemiddelde is een schatting van het gemiddelde μ van de onderliggende populatie. x̄De steekproefverdeling van wordt bepaald door de steekproefomvang n en de populatieverdeling. x̄Als de populatie t.o.v. de steekproef groot is, mogen we X1 , X2 ,…, Xn beschouwen als n onafhankelijke stochastische variabelen, alle met dezelfde verdeling. Het steekproefgemiddelde van een EAS van omvang n is:

= X̄ 1n (X1 , X2 ,…, Xn)

Als het gemiddelde in de populatie μ is, dan is μ de verwachting voor elke waarneming X i. Volgens de optelregel voor de verwachting van stochastische variabelen geldt derhalve:

μx̄$ = 1n (μX 1 , μX2 ,…,μXn)

= 1n nμ = μ

Dat wil zeggen: de verwachting van is gelijk aan het gemiddelde van de populatiex̄ . Het steekproefgemiddelde is derhalve een zuivere schatter van het onbekende populatiegemiddelde μ.x̄ De waarnemingen zijn onafhankelijk, zodat de optelregel voor varianties ook van toepassing is:

σ ² x ̄$ = ( 1n )² (σ ²X 1 , σ ²X2 ,…,σ ²Xn)

= ( 1n )² nσ² = σ ²n

σ x ̄$ = σ√❑

De variabiliteit van de steekproefverdeling neemt af naarmate de steekproef groter wordt. De standaardafwijking van de steekproefgrootheid neemt evenredig af met de wortel uit de steekproefomvang.

5.2.2 De centrale limietstelling De vorm van de kansverdeling van hangt af van de vorm van de populatieverdeling. x̄Indien een populatie een N(μ,σ)-verdeling heeft, dan heeft het steekproefgemiddelde van n onafhankelijke waarnemingen de N(μ,σ/√❑)-verdeling. Veel populatieverdelingen zijn niet normaal. Naarmate de steekproefomvang toeneemt, komt de verdeling van dichter bij een normaalverdeling. x̄Centrale limietstelling:Neem een EAS van omvang n uit een populatie met verwachting μ en een eindige standaardafwijking σ. Wanneer n groot is, is de steekproefverdeling van het steekproefgemiddelde bij benadering x̄normaal: is bij benadering N(μ,X̄ σ

√❑)

Hoe groot de steekproefomvang n moet zijn om dicht bij normaal te krijgen hangt af van de x̄populatieverdeling.Hs. 6 Inleiding tot inferentie Bij formele inferentie ligt de nadruk op het onderbouwen van onze conclusies met kansberekeningen. De methoden van formele inferentie zijn gebaseerd op steekproefverdelingen. Als u statistische inferentie gebruikt, handelt u alsof de gegeven afkomstig zijn uit een aselecte steekproef of uit een gerandomiseerd experiment. Als dit niet juist is, zijn uw conclusies mogelijk discutabel.

6.1 Schatten met betrouwbaarheidZuiverheid zegt alleen maar dat er geen systematische tendens is om de werkelijke waarde te overschatten of te onderschatten. Het zegt niets over de betrouwbaarheid.

11

Page 12: pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen:

Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018

6.1.1 Statistische betrouwbaarheidWanneer er wordt gezegd dat iets met 95% betrouwbaarheid tussen twee bepaalde punten ligt, dan wordt daarmee bedoelt dat die getallen gevonden zijn volgens een methode die in 95% van de gevallen correcte resultaten geeft.

6.1.2 BetrouwbaarheidsintervallenDe meeste betrouwbaarheidsintervallen hebben de vorm:

Schatting ± foutmargeDe schatting (in dit geval ) is onze geschatte waarde voor de onbekende parameter. De x̄ foutmarge laat zien hoeveel nauwkeurigheid wij onze schatting toekennen, gebaseerd op de variabiliteit van de schatting. Het betrouwbaarheidsniveau laat zien hoeveel vertrouwen wij erin hebben dat het interval de werkelijke populatieverwachting μ zal bevatten. 2 belangrijke dingen over betrouwbaarheidsintervallen:

1. Het is een interval van de vorm (a, b), waarbij a en b getallen zijn die vanuit de data zijn berekend.2. Het interval heeft een eigenschap, een zogenoemd betrouwbaarheidsniveau, dat de waarschijnlijkheid oplevert dat het interval de parameter bevat.

6.1.3 Betrouwbaarheidsinterval voor een populatiegemiddeldeDe constructie van een betrouwbaarheidsinterval van niveau C voor het populatiegemiddelde μ, als de data een EAS van omvang n vormen, berust op de steekproefverdeling van het

steekproefgemiddelde . Die verdeling is een exacte N(μ,x̄ σ√❑

)-verdeling, indien de populatie een

N(μ,σ)-verdeling heeft. Om een betrouwbaarheidsinterval van niveau C te construeren, zoeken we eerst de centrale oppervlakte C onder een normale kromme. Dat wil zeggen, we moeten het getal z* zoeken, zodanig dat elke normale verdeling met kans C binnen ±z* standaardafwijkingen van zijn verwachting ligt. Z* zijn te vinden in tabel D. Het steekproefgemiddelde heeft de normale verdeling met verwachting μ en standaardafwijkingx̄ σ

√❑ Daarom is de kans dat ligt tussenx̄

μ – z* σ√❑

en μ + z* σ√❑

gelijk aan C. Dat is precies hetzelfde als zeggen dat het onbekende populatiegemiddelde μ ligt tussen

- z* x̄ σ√❑

en + z* x̄ σ√❑

Dat wil zeggen: er is een kans C dat het interval ± z* x̄ σ√❑

het gemiddelde μ bevat. Dat is ons

betrouwbaarheidsinterval. De schatting van de onbekende μ is en de foutmarge is z*x̄ σ√❑

Betrouwbaarheidsinterval voor een populatiegemiddeld:Trek een EAS van omvang n uit een populatie met een onbekend gemiddelde μ en een bekende standaardafwijking σ. De foutmarge voor een betrouwbaarheidsinterval van niveau C voor μ is:

m = z* σ√❑

Hierbij is z* de waarde voor de standaardnormale curve met oppervlakte C tussen de kritieke punten –z* en z*. Het niveau C betrouwbaarheidsinterval voor μ is:

± m X̄Dit interval is exact correct als de populatieverdeling normaal is en is in andere gevallen voor grote n bij benadering correct.

6.1.4 Het gedrag van betrouwbaarheidsintervallen

12

Page 13: pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen:

Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018

De gebruiker kiest het betrouwbaarheidsniveau, en de foutmarge volgt uit deze keuze. Mogelijkheden om de foutmarge kleiner te maken:

● Gebruik een lager betrouwbaarheidsniveau (kleiner dan C):o Als n en σ onveranderd blijven, voert een kleinere z* tot een kleinere foutmarge.

● Vergroot de steekproefgrootte (groter dan n)o De wortel in de formule houdt in dat we het aantal waarnemingen met 4 moeten

vermenigvuldigen om de foutmarge te halveren

● Verminder σo Dat kan soms door op een nauwkeurige manier de wijze van metingen te controleren

of door onze aandacht alleen te richten op een deel van een grote populatie.

6.1.5 Het bepalen van de steekproefomvang Steekproefomvang bij een gewenste foutmarge:Het betrouwbaarheidsinterval voor een populatiegemiddelde zal een gespecificeerde foutmarge m hebben als de steekproefomvang gelijk is aan:

n = ( z∗σm )2

Bij het bepalen van n is het altijd veilig om omhoog af te ronden naar het eerste hogere gehele getal, omdat de foutmarge hierdoor afneemt. Het doel van deze berekening is het bepalen van een steekproefomvang die zo groot is dat hij nuttige resultaten oplevert, maar het bepalen wat nuttig is, is een kwestie van smaak. Helaas is het feitelijk aantal bruikbare waarnemingen vaak kleiner dan wat we aan het begin van een onderzoek hadden gepland.

6.1.6 Enkele waarschuwingenElke formule voor inferentie is slechts in specifieke omstandigheden correct.

Waarschuwingen bij de formule ± z* x̄ σ√❑

:

● De gegevens moeten een EAS uit de populatie vormen.

● De formule is niet correct voor kanssteekproefontwerpen die ingewikkelder zijn dan een EAS.

● Er bestaat geen correcte methode voor inferentie uit data die in het wilde we zijn verzameld met een vertekening van onbekende omvang.

● Omdat niet resistent is, kunnen uitschieters een groot effect hebben op het x̄betrouwbaarheidsinterval.

● Als een steekproefomvang klein is en de populatie niet normaal, zal het werkelijke betrouwbaarheidsniveau verschillen van de waarde C die voor de berekening is gebruikt.

● Men moet σ, de standaardafwijking van de populatie, kennen. De foutmarge in een betrouwbaarheidsinterval betreft alleen maar fouten in aselecte steekproeftrekkingen. Praktische moeilijkheden zoals onvolledige dekking en non-respons in een steekproefonderzoek veroorzaken extra fouten.

13

Page 14: pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen:

Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018

6.2 Significantietoetsen6.2.1 De redenering bij significantietoetsenEen significantietoets is een formele procedure om waargenomen data te vergelijken met een hypothese waarvan we willen beoordelen of hij waar is. De hypothese is een bewering over de parameters in een populatie of model. De uitkomsten van een toets worden uitgedrukt in termen van een kans die aangeeft hoe goed de gegevens en de hypothese met elkaar overeenkomen.

6.2.2 Formuleren van hypothesenDe eerste stap bij een significantietoets is het formuleren van een bewering waartegen wij bewijsmateriaal proberen te vinden. De bewering die in een significantietoets wordt getoetst, heeft de nulhypothese. De significantietoets is ontworpen om de sterkte van het bewijs tegen de nulhypothese vast te stellen. Gewoonlijk is de nulhypothese een bewering van de vorm ‘geen effect’ of ‘geen verschil’. De term wordt afgekort tot H 0. Het is een uitspraak over een populatie, uitgedrukt in één of meer parameters. Het is handig ook een naam te geven aan de bewering waarvan wij hopen of vermoeden dat die juist is in plaats van H 0. Die wordt de alternatieve hypothese genoemd en afgekort tot H a.Hypothesen verwijzen altijd naar een of andere populatie of model, niet naar een speciale uitkomst. Om die reden moeten we H 0 en H a formuleren in termen van populatieparameters. Het is niet altijd duidelijk of H a eenzijdig of tweezijdig moet zijn; dit heeft betrekking op de vraag of een parameter verschilt van zijn waarde in de nulhypothese in een specifieke richting of in beide richtingen. Het is bedrog om eerst naar de gegevens te kijken en dan H a zo op te stellen dat deze past bij wat uit de gegevens blijkt. Als u van tevoren geen specifieke richting in gedachten hebt, dient u een tweezijdig alternatief te kiezen.

6.2.3 ToetsingsgrootheidEnkele principes die op de meeste toetsen van toepassing zijn en die helpen de vorm van de toetsen te begrijpen:

● De toets is gebaseerd op een grootheid die een in de hypothese voorkomende parameter schat.

● Waarden van de schatter die ver van de in H 0 gespecifieerde parameterwaarde liggen,

vormen een bewijs tegen H 0.

● Standaardiseer de schatter om te bepalen hoe ver de schatter van de parameter af ligt. In veel voorkomende situaties heeft de toetsingsgrootheid de volgende vorm:

z = schatter−hypothetishewaarde

standaardafwijking vande schatter

Een toetsingsgrootheid is een maat voor de mate waarin de nulhypothese en de gegevens op elkaar aansluiten. We gebruiken deze voor de waarschijnlijkheidsberekening die we nodig hebben voor de significantietoets. Het gaat om een stochastische variabele met een bekende verdeling.

14

Samenvatting boek: Het doel van een betrouwbaarheidsinterval is een schatting te geven van een onbekende parameter, met een indicatie van de mate van nauwkeurigheid van de schatting en van de mate van vertrouwen die men in de correctheid van het resultaat mag hebben. Elk betrouwbaarheidsinterval heeft twee delen: een uit de data

Page 15: pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen:

Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018

6.2.4 OverschrijdingskansenEen significantietoets meet de kans dat een resultaat wordt verkregen dat even extreem is as of meer extreem dan het feitelijk waargenomen resultaat. ‘Extreem’ betekent ver af van wat we zouden verwachten als H 0 juist zou zijn. Overschrijdingskans:De kans, berekend onder de aanname dat H 0 waar is, dat de toetsingsgrootheid een waarde zou aannemen die even extreem is als of nog extremer is dan de feitelijk waargenomen uitkomst, wordt de overschrijdingskans (of p-waarde) van de toets genoemd. Hoe kleiner de overschrijdingskans, hoe sterker het door de data tegen H 0 geleverde bewijs. Om de overschrijdingskans te berekenen, moet men de steekproefverdeling van de toetsingsgrootheid kennen.

6.2.5 Statistische significantieWe kunnen de berekende overschrijdingskans vergelijken met een vaste waarde die we als beslissend beschouwen. Dit komt erop neer dat we tevoren aankondigen hoeveel bewijs tegen H 0 we nodig hebben om H 0 te verwerpen. De beslissende waarde van P wordt het significantieniveau genoemd. Hij wordt aangegeven door α. Als we α = 0,05 kiezen, eisen we dat de gegevens een zo sterk bewijs tegen H 0 leveren dat dit maximaal in 5% van de gevallen zou optreden wanneer H 0 juist is. Als de overschrijdingskans kleiner dan of gelijk is aan α, zeggen we dat de data statistisch significant zijn op niveau α. De overschrijdingskans is informatiever dan een uitspraak over significantie, omdat we dan de significantie op elk gekozen niveau kunnen onderzoeken.

De vier stappen bij alle significantietoetsen zijn:

● Formuleer de nulhypothese H 0 en de alternatieve hypothese H a.

● Bereken de waarde van de toetsingsgrootheid waarop de toets zal worden gebaseerd.

● Bereken de overschrijdingskans voor de waargenomen gegevens.

● Formuleer een conclusie.

6.2.6 Toetsen voor een populatiegemiddelde Voor een toets van een populatiegemiddelde is de nulhypothese:

H 0 : μ = μ0Waarbij μ0 de gespecifieerde waarde van μ is die we willen onderzoeken. De toets is gebaseerd op gegevens die worden samengevat als een schatting van de parameter. Voor een populatiegemiddelde is dit het steekproefgemiddelde . Onze toetsingsgrootheid meet het x̄verschil tussen de steekproefschatting en de hypothetische parameter in termen van standaardafwijkingen van de toetsingsgrootheid:

z = schatter−hypothetishewaarde

standaardafwijking vande schatter

z = x̄−μ0σ

√❑

Wanneer de alternatieve hypothese stelt dat de ware μ onder de hypothetische μ0 ligt (eenzijdig), dan is de overschrijdingskans de kans dat een standaardnormale stochastische variabele Z een

15

Page 16: pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen:

Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018

waarde aanneemt die even groot is of groter is dan de waargenomen z. Als H a stelt dat μ eenvoudig ongelijk is aan μ0 (tweezijdig), tellen waarden van z ongelijk aan nul in beide richtingen tegen de nulhypothese. De overschrijdingskans is de kans dat een standaardnormale Z ten minste even ver van nul af ligt als de waargenomen z. z-Toets voor een populatiegemiddelde:Om de hypothese H 0 : μ = μ0 te toetsen, gebaseerd op een EAS van omvang n uit een populatie met een onbekende verwachting μ en een bekende standaardafwijking σ, berekent men de uitkomst van z van toetsingsgrootheid:

z = x̄−μ0σ

√❑In termen van een standaardnormale stochastische variabele Z geldt voor de overschrijdingskans van een toets van H 0 versus

H a : μ > μ0 is P(Z ≥ z) → gekleurde oppervlakte aan de rechterkant van de grafiekH a : μ < μ0 is P(Z ≤ z) → gekleurde oppervlakte aan de linkerkant van de grafiekH a : μ ≠ μ0 is 2P(Z ≥ |z|) → gekleurde oppervlakte aan de beide kanten van de grafiek

Deze overschrijdingskansen zijn exact als de populatieverdeling normaal is, en ze zijn in andere gevallen voor grote n bij benadering correct.

6.2.7 Tweezijdige significantietoetsen en betrouwbaarheidsintervallenBij een tweezijdige significantietoets op niveau α wordt een hypothese H 0 : μ = μ0 precies dan verworpen als de waarde μ0 buiten het betrouwbaarheidsinterval van niveau 1 – α voor μ ligt.

6.2.8 Overschrijdingskansen versus vast niveau αDe overschrijdingskans geeft een betere indicatie van de sterkte van het bewijs. De overschrijdingskans is het kleinste niveau α waarbij de data significant zijn. De significantie bij een vast niveau α bepalen is gemakkelijker, omdat er geen kansberekening nodig is. Men behoeft slechts een kritieke waarde in een tabel op te zoeken.

6.3 Gebruik en misbruik van toetsenElke toets is slechts onder bepaalde omstandigheden geldig, waarbij het bijzonder belangrijk is dat de data correct zijn verkregen.

6.3.1 Het kiezen van een significantieniveauEr is geen scherpe scheidingslijn tussen ‘significant’ en ‘insignificant’, maar slechts een in sterkte toenemend bewijs als de overschrijdingskans afneemt.

6.3.2 Wat statistische significantie niet betekent

16

Samenvatting boek: Een significantietoets beoordeelt het door de data aangedragen bewijsmateriaal tegen een nulhypothese , ten gunste van een alternatieve hypothese De hypothesen worden geformuleerd in termen van populatieparameters. Gewoonlijk is een uitspraak dat er geen effect

Page 17: pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen:

Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018

Als grote steekproeven beschikbaar zijn, zullen zelfs kleine afwijkingen van de nulhypothese significant zijn. Statistische significantie is niet hetzelfde als praktische significantie.

6.3.3 Negeer het ontbreken van significantie niet De neiging bestaat af te leiden dat er geen effect bestaat telkens wanneer een overschrijdingskans niet het gebruikelijke vaste niveau van 5% haalt. Op bepaalde onderzoeksterreinen kunnen kleine effecten die alleen met zeer grote steekproefgrootten kunnen worden gedetecteerd, van groot praktisch belang zijn. Een ander belangrijk aspect van het opzetten van een onderzoek is te controleren dat de toets die u van plan bent te gaan gebruiken, een grote kans heeft een effect te detecteren van de omvang die u hoopt te vinden. Deze kans is het onderscheidingsvermogen van de toets.

6.3.4 Statistische inferentie is niet voor alle gegevensverzamelingen geldigDe formele statistische inferentie kan fundamentele gebreken in het ontwerp niet herstellen. Significantietoetsen en betrouwbaarheidsintervallen zijn gebaseerd op de wetten van de kansrekening. Randomisatie in steekproeftrekkingen en experimenten garandeert dat deze wetten toepasbaar zijn. Maar wet moeten dikwijls data analyseren die niet afkomstig zijn van gerandomiseerde steekproeven of experimenten. Om op dergelijke gegevens de statistische inferentie toe te passen, moeten we vertrouwen hebben in een kansmodel voor data.

6.3.5 Ga niet zoeken naar significantieDe redenering die ten grondslag ligt aan de statistische inferentie werkt correct als men besluit naar welk effect zal worden gezocht, daarvoor een experiment of steekproef ontwerpt, en een significantietoets gebruikt om het verkregen bewijsmateriaal te wegen. De gebruikelijke redenering van de statistische inferentie is niet van toepassing als het zoeken naar een patroon succes heeft. Het is niet juist een hypothese te toetsen op dezelfde data die eerst die hypothese suggereerde.

6.4 Onderscheidingsvermogen en inferentie bij beslissingsproblemen6.4.1 OnderscheidingsvermogenSignificantietoetsen met een vast niveau α zijn nauw gerelateerd aan betrouwbaarheidsintervallen. De significantietoets vertelt namelijk ook hoe betrouwbaar de methode is bij herhaald gebruik. De kans dat bij een significantietoets H 0 zal worden verworpen als een bepaalde alternatieve parameterwaarde waar is, heet het onderscheidingsvermogen van de toets ten aanzien van dat alternatief. De berekening bestaat uit 3 stappen:1) Formuleer H 0, H a, het specifieke alternatief dat we willen opsporen en vermeld het significantie niveau α2) Bepaal de waarden van waarbij we x̄ H 0 moeten verwerpen3) Bereken de kans deze waarden van waar te nemen wanneer de alternatieve hypothese juist is x̄Een groot onderscheidingsvermogen is wenselijk. In combinatie met 95%-betrouwbaarheidsinterval en 5%-significantietoetsen, is een onderscheidingsvermogen van 80% de standaard aan het worden.

6.4.2 Het onderscheidingsvermogen vergroten4 mogelijkheden om het onderscheidingsvermogen te vergroten:

17

Samenvatting boek: Overschrijdingskansen zijn informatiever dan het resultaat ‘wel/niet verwerpen’ van een toets met vast niveau α. Men moet ervoor oppassen te veel waarde te hechten aan traditionele waarden van α, zoals α = 0,05Heel kleine effecten kunnen zeer significant zijn (kleine

Page 18: pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen:

Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018

● Vergroot α.

● Neem een bepaald alternatief dat verder weg ligt dan μ0.

● Vergroot de steekproefomvang.

● Verklein σ. Berekeningen van het onderscheidingsvermogen zijn belangrijk bij het opzetten van een onderzoek. Het gebruik van een significantietoets met gering onderscheidingsvermogen maakt het onwaarschijnlijk dat er een significant effect wordt gevonden, zelfs indien de werkelijke waarde ver weg ligt van de nulhypothese. Een nulhypothese die in feite onwaar is, kan door velen worden geaccepteerd, indien herhaalde pogingen om hem te verwerpen mislukken wegens gering onderscheidingsvermogen.

6.4.3 Inferentie als beslissingBij acceptatie-steekproeftrekking zijn we er in geïnteresseerd een beslissing te nemen of een handelwijze te kiezen op basis van onze beoordeling van de gegevens. Bijvoorbeeld een steekproeftrekken uit producten waarin je geïnteresseerd bent om ze te kopen. Als het een positief resultaat geeft, koop je ze, zo niet dan koop je ze niet.

6.4.4 Twee soorten foutenIn het probleem van acceptatie-steekproeftrekking moeten we, op grond van de steekproef van kogellagers, beslissen tussen:

● H 0: de zending kogellagers voldoet aan de eisen

● H a: de zending voldoet niet aan de eisenWe hopen dat onze beslissing correct zal zijn, maar soms zal hij foutief zijn. Er zijn twee soorten foute beslissingen:

● Fout van de eerste soort = als we H 0 verwerpen (H a accepteren) terwijl H 0 in feite juist is

● Fout van de tweede soort = als we H 0 accepteren (H a verwerpen) terwijl in feite H a juist is

6.4.5 Kansen op foutenWe kunnen niet garanderen dat er nooit een fout van de eerste of tweede soort zal worden gemaakt. Maar met aselecte stekproeftrekking en de wetten van de kansrekening kunnen we zeggen wat de kans is op elk van de twee soorten fouten. Significantie en fouten van de eerste soort:Het significantieniveau α van elke toets met vast niveau is de kans op een fout van de eerste soort. Dat wil zeggen: α is de kans dat de toets de nulhypothese H 0 zal verwerpen, terwijl H 0 in feite juist is. Onderscheidingsvermogen en fouten van de tweede soort: Het onderscheidingsvermogen van een significantietoets bij een vast niveau ten aanzien van een speciaal alternatief is 1 min de kans op een fout van de tweede soort voor dat alternatief. De twee soorten fouten en hun kansen geven een andere interpretatie aan significantieniveau en onderscheidingsvermogen van een toets. Het onderscheid tussen significantietoetsen en toetsen als regels voor het beslissen tussen twee hypothesen, ligt niet in de berekeningen, maar is de redenering die de berekeningen motiveert. In een significantietoets richten we ons op één enkele hypothese (H 0) en één enkele kans (de overschrijdingskans). Het doel is de sterkte van het steekproefbewijs tegen H0 te meten. Berekeningen van het onderscheidingsvermogen worden gedaan om de gevoeligheid van de toets na te gaan. Als we H 0 niet kunnen verwerpen, concluderen we alleen maar dat er niet genoeg bewijs tegen H 0 is, niet dat H 0 feitelijk waar is. Als hetzelfde probleem als een

18

Page 19: pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen:

Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018

beslissingsvraagstuk wordt beschouwd, richten we ons op twee hypothesen en geven een regel om op grond van het steekproefbewijs tussen die twee te kiezen. We moeten daarom gelijkelijk aan twee kansen aandacht schenken, de kansen op de twee soorten fouten. We moeten de ene of de andere hypothese kiezen en mogen niet wegens onvoldoende bewijs daarvan afzien.

6.4.6 De praktijk van het toetsen van hypothesenIn de praktijk lopen de twee benaderingswijzen vaak door elkaar. We hebben in een beslissingsprobleem de ene hypothese H 0 genoemd. De gangbare praktijk van het toetsen van hypothesen vermengt de redeneringen van significantietoetsen en beslissingsregels als volgt:1) Formuleer H 0 en H a als in significantietoetsen2) Beschouw het probleem als een beslissingsprobleem. Zodat de kansen op fouten van de eerste en tweede soort relevant zijn 3) Wegens stap 1 zijn fouten van de eerste soort ernstiger: Kies dus een α (significantieniveau) en αbeschouw alleen toetsen waarbij de kans op een fout van de eerste soort niet groter is dan α4) Kies uit die toetsen een toets waarbij de kans op een fout van de tweede soort zo klein mogelijk wordt (dat wil zeggen, met een zo groot mogelijke onderscheidingsvermogen). Als die kans te groot

is, moet u een grotere steekproef nemen om aldus de kans op een fout te verkleinen.

Hs. 7 Inferentie voor verdelingenTwee belangrijke aspecten van een verdeling zijn het centrum en de spreiding. We krijgen te maken met betrouwbaarheidsintervallen en significantietoetsen voor inferentie over een populatiegemiddelde μ en voor het vergelijken van de gemiddelden van twee populaties. De nadruk ligt op de praktische statistiek en we nemen dus niet langer aan dat de populatiestandaardafwijkingen bekend zijn. De t-procedures voor inferentie over gemiddelden behoren tot de meest gangbare statistische methoden.

7.1 Inferentie voor het gemiddelde van een populatieZowel betrouwbaarheidsintervallen als significantietoetsen voor het gemiddelde μ van een normale populatie zijn gebaseerd op het steekproefgemiddelde , dat de onbekende μ schat. De x̄steekproefverdeling van hangt van σ af. Dit veroorzaakt geen problemen als σ bekend is. Als σ x̄echter niet bekend is, moeten we σ schatten, hoewel we voornamelijk geïnteresseerd zijn in μ. De standaardafwijking s van de steekproef wordt gebruikt om de standaardafwijking σ van de populatie te schatten.

7.1.1 De t-procedures voor een enkelvoudige steekproefVeronderstel dat we een EAS van omvang n hebben uit een normaal verdeelde populatie, met gemiddelde μ en standaardafwijking σ. Het steekproefgemiddelde heeft dan de normale verdelung x̄met gemiddelde μ en standaardafwijking σ/√❑. Indien σ niet bekend is, schatten we de standaardafwijking van door s/x̄ √❑. Deze grootheid heet: de standaardfout van het steekproefgemiddelde . x̄Standaardfout:Als de standaardafwijking van een steekproefgrootheid uit de gegevens wordt geschat, wordt het resultaat de standaardfout van de steekproefgrootheid genoemd. De formule ziet er zo uit:

19

Samenvatting boek: Het onderscheidingsvermogen van een toets meet diens vermogen om de juistheid van een alternatieve hypothese aan te tonen. Het onderscheidingsvermogen bij een specifiek alternatief is de kans dat wordt verworpen als het alternatief waar is. De berekening hiervan vereist kennis van de steekproefverdeling van de toetsingsgrootheid

Page 20: pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen:

Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018

SEx ̄$ = s√❑

Het gestandaardiseerde steekproefgemiddelde

z = x̄−μσ /√❑

vormt de basis voor z-procedures voor inferentie omtrent μ, als σ onbekend is. Deze

steekproefgrootheid heeft de standaardnormale verdeling N(0,1). Als we de standaardfout s√❑

substitueren voor de standaardafwijking σ /√❑ van , heeft de steekproefgrootheid x̄ niet een normale verdeling. Hij heeft een t-verdeling. De t-verdelingen: Veronderstel dat er een EAS van grootte n is getrokken uit een N(μ,σ) populatie. Dan heeft de t-toetsingsgrootheid

t = x̄−μs /√❑

de t-verdeling met n – 1 vrijheidsgraden. Voor elke steekproefomvang is er een andere t-verdeling. Een specifieke t-verdeling wordt gespecifieerd door het aantal vrijheidsgraden op te geven. Het aantal vrijheidsgraden van deze t-steekproefgrootheid is afkomstig van de steekproef-standaardafwijking s in de noemer van t. Het aantal vrijheidsgraden van s is gelijk aan n – 1. De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen: ze zijn symmetrisch rondom 0 en klokvormig. De spreiding van de t-verdelingen is ietwat groter dan die van de standaardnormale verdeling. Dat is te wijten aan de extra variabiliteit die veroorzaakt wordt door de substitutie van de stochastische variabele s voor de vaste parameter σ. Bij toename van het aantal vrijheidsgraden k nadert de dichtheidskromme van t(k) steeds dichter tot de N(0,1)-kromme. Dit weerspiegelt het feit dat s bij toenemende steekproefomvang nadert tot σ. Tabel D geeft de kritieke waarden voor de t-verdelingen.

7.1.2 Het betrouwbaarheidsinterval bij de één-steekproef t-toets Het betrouwbaarheidsinterval voor een enkelvoudige steekproef:Veronderstel dat er een EAS is getrokken uit een populatie met onbekend gemiddelde μ. Een betrouwbaarheidsinterval van niveau C voor μ is:

± t* x̄ s√❑

waar t* de waarde is voor de t(n-1)-verdeling waarbij er een oppervlak C ligt tussen –t* en t*. De grootheid

t* s√❑

is de foutmarge. Dit interval is exact correct als de populatieverdeling normaal is en in andere gevallen voor grote n bij benadering correct.

7.1.3 De één-steekproef t-toetsDe t-toets voor een enkelvoudige steekproef: Veronderstel dat een EAS met omvang n is getrokken uit een populatie met onbekende verwachting μ. Om de hypothese H 0 : μ = μ0 te toetsen op basis van een EAS met omvang n, berekenen we de toetsingsgrootheid t voor een enkelvoudige steekproef.

t = x̄−μ0s /√❑

In termen van een stochastische variabele T die de t(n-1)-verdeling heeft, geldt voor de overschrijdingskans bij een toets van H 0 tegen

H a : μ > μ0 is P(T ≥ t) → gekleurde oppervlakte aan de rechterkant van de grafiek

20

Page 21: pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen:

Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018

H a : μ < μ0 is P(T ≤ t) → gekleurde oppervlakte aan de linkerkant van de grafiekH a : μ ≠ μ0 is 2P(T ≥ |t|) → gekleurde oppervlakte aan de beide kanten van de grafiek

Deze overschrijdingskansen zijn exact als de populatieverdeling normaal is, en zijn in andere gevallen voor grote n bij benadering exact. Indien men twijfelt, moet er tweezijdig worden getoetst.

7.1.4 t-procedures voor gekoppelde parenBij een opzet met gekoppelde paren worden proefpersonen in paren ingedeeld en de uitkomsten worden per gekoppeld paar vergeleken. De volgende belangrijke pinten dienen in gedachten te worden gehouden met betrekking tot gekoppelde paren:1) Een analyse van gekoppelde paren is nodig wanneer er van elk element twee metingen of waarnemingen zijn en we het verschillen willen onderzoeken2) Gebruik voor elk element het verschil tussen de twee metingen als gegevens voor uw analyse3) Gebruik het één-steekproef betrouwbaarheidsinterval en procedures voor significantietoetsen die we in deze paragraaf hebben geleerd. Bij een analyse van gekoppelde paren nemen we aan dat de verschillen normaal zijn verdeeld, omdat de t-procedures op de verschillen worden toegepast.

7.1.5 Robuustheid van t-procedures Een statistische inferentieprocedure wordt robuust genoemd als de vereiste kansberekeningen ongevoelig zijn voor afwijkingen van de gemaakte veronderstellingen. De aanname dat de populatie normaal is, sluit uitschieters uit, de aanwezigheid van uitschieters laat dus zien dat die aanname niet geldig is. De t-procedures zijn niet robuust tegenover uitschieters (dus gevoelig), omdat en s niet resistent zijn tegen uitschieters.x̄ In het algemeen dienen we heel voorzichtig te zijn met het uitsluiten van mogelijke uitschieters, vooral wanneer deze een belangrijk deel van de gegevens vormen. Gelukkig zijn de t-procedures heel robuust ten aanzien van niet-normaliteit van de populatie, behalve in het geval van uitschieters of sterke scheefheid. Grotere steekproeven verhogen de nauwkeurigheid van overschrijdingskansen en kritieke waarden uit t-verdelingen, wanneer de populatie niet-normaal verdeeld is. Dit is om twee redenen het geval:1) de steekproefverdeling van het steekproefgemiddelde van een grote steekproef is vrijwel x̄normaal. 2) Als de steekproefomvang n toeneemt, nadert de standaardafwijking s tot de standaardafwijking σ van de populatie. Voor de meeste doeleinden kunnen t-procedures voor een enkelvoudige steekproef veilig worden gebruikt als n ≥ 15, tenzij er een uitschieter is of duidelijke scheefheid. Behalve in het geval van kleie steekproeven, is de veronderstelling dat de steekproef een EAS vormt uit de beschouwde populatie, van crucialer belang dan de veronderstelling dat de populatieverdeling normaal is. Hier volgen praktische richtlijnen voor inferentie over één enkel gemiddelde:

● De steekproefomvang is kleiner dan 15: gebruik t-procedures als de gegevens bij benadering normaal verdeeld zijn. Gebruik t-procedures niet als de gegevens duidelijk niet normaal zijn of als er uitschieters zijn

● De steekproefomvang is minstens 15: de t-procedures kunnen worden gebruikt, behalve in het geval van uitschieters of sterke scheefheid

21

Page 22: pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen:

Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018

● Grote steekproeven: de t-procedures kunnen gebruikt worden, zelfs voor duidelijk scheve verdelingen als de steekproef groot is, ruwweg als n ≥ 40

7.1.7 Inferentie voor niet-normale populaties Drie algemene strategieën voor statistische procedures voor het gemiddelde van een duidelijk niet-normale verdeling:1) In sommige gevallen zal een andere dan een normale verdeling de gegevens goed beschrijven. 2) Omdat scheefheid het voornaamste obstakel vormt voor het toepassen van de t-procedures op gegevens zonder uitschieters, kan men proberen de scheve gegevens zó te transformeren dat de verdeling symmetrisch wordt en zo dicht mogelijk bij een normale verdeling komt. 3) Gebruik maken van een verdelingsvrije inferentieprocedure. Bij dergelijke procedures wordt niet verondersteld dat de populatieverdeling enige specifieke vorm heeft. Verdelingsvrije procedures worden vaak niet-parametrische procedures genoemd. Elk van deze procedures kan effectief zijn, maar vereist geavanceerde statistische technieken. We leggen de nadruk op procedures die berusten op normale verdelingen, omdat die in de praktijk het meest voorkomen, omdat hun robuustheid ze vaak inzetbaar maakt, en omdat we in de eerste plaats zijn geïnteresseerd in het begrijpen van de principes van inferentie. Gegevens transformeren: Als de verdeling van een variabele scheef is, gebeurt het vaak dat een simpele transformatie een variabele levert die symmetrisch en zelfs bij benadering normaal is. De meest gangbare transformatie is de logaritme. De logaritme heeft de neiging de rechterstaart van een verdeling naar binnen te trekken. In plaats van de gegevens voor de oorspronkelijke variabele X te analyseren, berekenen we eerst de logaritmen en analyseren we de waarden van logX. De tekentoets: Verdelingsvrije toetsen hebben twee nadelen:1) ze zijn in het algemeen minder krachtig (ze hebben een geringer onderscheidingsvermogen) dan toetsen die in combinatie met een specifieke verdeling worden gebruikt2) we moeten de formulering van de hypothesen vaak bijstellen teneinde een verdelingsvrije toets te kunnen toepassen. De eenvoudigste verdelingsvrije toets en één van de meest bruikbare is de tekentoets. Er zijn vele variaties op de tekentoets, die allemaal op aantallen en op binomiale verdeling zijn gebaseerd. De tekentoets voor gekoppelde paren is het meest bruikbaar. De nulhypothese van ‘geen effect’ is dan steeds H 0 : p = 1/2. De alternatieve hypothese kan linkseenzijdig of rechtseenzijdig zijn, of tweezijdig, afhankelijk van het soort verandering waarnaar we op zoek zijn. De toets heeft zijn naam te danken aan het feit dat we slechts kijken naar het teken van de verschillen, niet naar hun feitelijke waarden. De tekentoets voor gekoppelde paren: Laat de paren met verschil 0 weg; het aantal pogingen n is het aantal resterende paren. De toetsingsgrootheid is het aantal paren X met een positief verschil. Overschrijdingskansen voor X zijn gebaseerd op de binomiale B(n,1/2)-verdeling. Omdat de tekentoets zo weinig van de beschikbare informatie gebruikt, is hij veel minder krachtig (meer onderscheidingsvermogen) dan de t-toets, wanneer de populatie bij benadering normaal verdeeld is. Het is beter een krachtige toets te gebruiken als we denken dat onze aannames bij benadering bevredigd worden, dan een minder krachtige toets met minder aannames.

22

Samenvatting boek:Significantietoetsen en betrouwbaarheidsintervallen voor het gemiddelde μ van een normale populatie zijn gebaseerd op het steekproefgemiddelde x̄ van een EAS. Wegens de centrale limietstelling zijn de resulterende procedures voor andere verdelingen bij benadering correct als de steekproef groot is.

Page 23: pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen:

Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018

7.2 Vergelijking van twee gemiddeldenTwee-steekproevenproblemen:

● Het doel van de inferentie is de reacties in twee groepen te vergelijken

● Elke groep wordt beschouwd als een aselecte steekproef uit een bepaalde populatie

● De reacties in de ene groep zijn onafhankelijk van die in de andere groepEen twee-steekproevenprobleem kan ontstaan uit een vergelijkend toevalsexperiment waarbij de proefobjecten aselect over twee groepen worden verdeeld en de twee groepen een verschillende behandeling ondergaan. Het vergelijken van aselecte steekproeven die afzonderlijk uit twee populaties zijn getrokken, is eveneens een twee steekproevenprobleem. Er bestaat geen koppeling tussen de elementen van de twee steekproeven en ze kunnen bovendien in omvang verschillen. Als beide populatieverdelingen symmetrisch zijn, en in het bijzonder als ze bij benadering normaal zijn, is een vergelijking van de gemiddelde reacties in de twee populaties meestal het doel van de inferentie. We hebben twee onafhankelijke steekproeven, uit twee onderscheiden populaties. Voor beide steekproeven wordt dezelfde variabele gemeten. We noemen de variabele in de ene populatie x1 en in de andere x2, omdat de variabele in elke populatie een andere verdeling kan hebben. We willen de twee populatiegemiddelden vergelijken, hetzij door een betrouwbaarheidsinterval te geven voor μ1 - μ2, hetzij door toetsing van de hypothese ‘geen verschil’, H 0 : μ1 = μ2.

7.2.1 De twee-steekproevengrootheid zDe natuurlijke schatter voor het verschil μ1 - μ2 is het verschil tussen de steekproefgemiddelden x $̄ 1 - x $̄ 2. Als we de inferentie op deze steekproefgrootheid baseren, moeten we zijn steekproefverdeling kennen. Ten eerste is de verwachting het verschil x̄$ 1 - x̄$ 2 gelijk aan het verschil μ1 - μ2. Omdat de steekproeven onafhankelijk zijn, zijn hun steekproefgemiddelden x $̄ 1 en x̄$ 2 onafhankelijke stochastische variabelen. De optelregel voor varianties zegt dat de variantie van het verschil x $̄ 1 - x $̄ 2 gelijk is aan de som van de varianties, wat gelijk is aan:

σ ²1n1

+ σ ²2n2

Als de twee populatieverdelingen beide normaal zijn, is de verdeling van x $̄ 1 - x $̄ 2 eveneens normaal. Twee-steekproevengrootheid z:Veronderstel dat x̄$ 1 het gemiddelde is van een EAS van omvang n1, getrokken uit een N(μ1,σ 1)-populatie en dat x $̄ 2 het gemiddelde is van een onafhankelijke EAS van omvang n2, getrokken uit een N(μ2,σ 2)-populatie. Dan heeft de twee-steekproevengrootheid

z = ( x̄1− x̄2 )−(μ1−μ2)√❑

de standaardnormale steekproefverdeling N(0,1). In het onwaarschijnlijke geval dat de standaardafwijkingen van beide populaties bekend zijn, vormt de twee-steekproevengrootheid z de basis voor inferentie omtrent μ1 - μ2. Exacte z-procedures worden bijna nooit gebruikt, aangezien σ 1 en σ 2 zelden bekend zijn.

7.2.2 De t-procedures voor twee onafhankelijke steekproevenDe twee-steekproevengrootheid t:

t = ( x̄1− x̄2 )−(μ1−μ2)√❑

We kunnen de verdeling van de twee-steekproefgrootheid t benaderen door de t(k)-verdeling toe te passen met een benadering voor het aantal vrijheidsgraden k. We gebruiken deze benaderingen om

23

Page 24: pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen:

Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018

geschatte waarden voor t* te vinden voor betrouwbaarheidsintervallen en om geschatte overschrijdingskansen te vinden voor significantietoetsen. Hier volgen twee benaderingen: 1) Gebruik een waarde voor k die vanuit de gegevens is berekend. In het algemeen zal dit geen geheel getal zijn.2) Gebruik een k die gelijk is aan de kleinste waarde van n1 – 1 en n2 – 1. Foutmarges voor betrouwbaarheidsintervallen zijn iets groter dan nodig is, dus het werkelijke betrouwbaarheidsniveau is groter dan C. Voor significantietoetsen zijn de werkelijke overschrijdingskansen iets kleiner dan de kansen die we bij de schattingen verkrijgen; voor toetsen bij een vast significantieniveau is de kans iets kleiner dat H 0 moet worden verworpen wanneer deze juist is.

7.2.3 De t-toets voor twee onafhankelijke steekproevenVeronderstel dat een EAS van omvang n1 uit een normale populatie met onbekend gemiddelde μ1 is getrokken en dat een onafhankelijke EAS van omvang n2 uit een normale populatie met onbekend gemiddelde μ2 is getrokken. Om de hypothese H 0 : μ1 = μ2 te toetsen, berekenen we de twee-steekproef toetsingsgrootheid t

t = ( x̄1− x̄2 )−(μ1−μ2)√❑

en gebruiken we overschrijdingskansen of kritieke waarden voor de t(k)-verdeling, waarbij het aantal vrijheidsgraden k ofwel door software wordt benaderd, of de kleinste waarde is van n1 – 1 en n2 – 1.

7.2.4 Het twee-steekproeven t-betrouwbaarheidsintervalVeronderstel dat een EAS van omvang n1 is getrokken uit een normale populatie met onbekende gemiddelde μ1, en dat een onafhankelijke EAS van omvang n2 is getrokken uit een normale populatie met onbekende gemiddelde μ2. Het betrouwbaarheidsinterval voor μ1 - μ2 wordt gegeven door:

(x $̄ 1−x $̄ 2) ± t*√❑Dit heeft een betrouwbaarheidsniveau dat ten minste gelijk is aan C, wat de standaardafwijkingen van de populaties ook mogen zijn. Hier is t* de waarde voor de t(k)-dichtheidskromme met een oppervlak C tussen –t* en t*. De waarde van het aantal vrijheidsgraden k wordt ofwel benaderd met behulp van software ofwel door gebruik te maken van het minimum van n1 – 1 en n2 – 1.

7.2.5 Robuustheid van de twee-steekproefprocedures De twee-steekproef t-procedures zijn robuuster dan de t-methoden voor enkelvoudige steekproeven. Wanneer de twee steekproeven een gelijke omvang hebben en de verdelingen van de twee populaties die worden vergeleken, een verwante vorm hebben, zijn de kansen vanuit de t-tabel tamelijk nauwkeurig voor een brede reeks verdelingen wanneer de steekproefomvang zo klein is als n1 = n2 = 5. Als de twee populatieverdelingen een verschillende vorm hebben, zijn grotere steekproeven nodig. Bij het opzetten van een twee-steekproef onderzoek, kiest u wanneer dit mogelijk is, een gelijke steekproefomvang. De twee-steekproef t-procedures zijn het meest robuust tegen niet-normaalheid in dit geval en de conservatieve kanswaarden zijn het meest nauwkeurig.

7.2.6 Inferentie voor kleine steekproevenKleine steekproeven vereisen speciale aandacht. We hebben niet genoeg waarnemingen om de vorm van de verdeling te onderzoeken en alleen extreme uitschieters springen eruit. Het onderscheidingsvermogen van significantietoetsen is meestal laag en meestal zijn de foutmarges van betrouwbaarheidsintervallen groot. Ondanks deze moeilijkheden kunnen we vaak belangrijke conclusies trekken uit onderzoeken met kleine steekproefomvang.

7.2.7 Softwarebenadering voor het aantal vrijheidsgraden

24

Page 25: pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen:

Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018

De twee-steekproevengrootheid t heeft geen exacte t-verdeling. Bovendien verandert de verdeling als de twee onbekende standaardafwijkingen σ 1 en σ 2 van de populaties veranderen. De verdeling kan echter worden benaderd door een t-verdeling waarvan het aantal vrijheidsgraden df wordt gegeven door:

df = ( s ²1n1 +

s ²2n2 )

2

1n1−1 (

s ²1n1 )

2

+ 1n2−1 ( s ²2n2 )

2

Dit is de benadering die door de meeste statistische software wordt gebruikt. Deze is heel nauwkeurig als de twee steekproefgroottes n1 en n2 groter dan of gelijk aan 5 zijn. Het getal df dat in vorenstaande benadering wordt gegeven is steeds ten minste zo groot als het minimum van n1 – 1 en n2 – 1. Aan de andere kant is df nooit groter dan de som n1 + n2 – 2 van de twee individuele vrijheidsgraden. Het aantal vrijheidsgraden df is in het algemeen geen geheel getal. Er is voor elk positief getal aan vrijheidsgraden een t-verdeling. Als df klein is en niet geheeltallig, kan er interpolatie tussen de waarden van tabel D nodig zijn om een nauwkeurige kritieke waarde of overschrijdingskans te verkrijgen. 7.2.8 De samengestelde t-procedures voor twee onafhankelijke steekproevenDe enige situatie waarbij een t-grootheid voor het vergelijken van twee gemiddelden exact een t-verdeling heeft, is wanneer twee normale populatieverdelingen dezelfde standaardafwijking hebben. In dat geval hoeven we slechts één enkele standaardafwijking in een z-grootheid te substitueren, en de resulterende t-grootheid heeft dan een t-verdeling. Beide steekproefvarianties s ²1 en s ²2 zijn schatters voor σ². De beste manier om deze twee schattingen te combineren is een gewogen gemiddelde te vormen met de vrijheidsgraden als de gewichten. Daardoor krijgt de informatie uit de grotere steekproef meer gewicht. De resulterende schatter van σ² is:

s ²p = (n1−1 ) s ²1+(n2−1 ) s ²2

n1+n2−2Dit wordt de samengestelde schatter van σ² genoemd, omdat hij de informatie uit beide steekproeven combineert. Als beide populaties de variantie σ² hebben, zegt de optelregel voor varianties dat de variantie van x $̄ 1 - x $̄ 2 gelijk is aan de som van de individuele varianties, en die is:

σ ²1n1

+σ ²2n2

= σ² ( 1n1+ 1n2 )

Het gestandaardiseerde verschil tussen de gemiddelden is in dit geval van gelijke varianties dus:

z = ( x̄1− x̄2 )−(μ1−μ2)√❑

Dit is een speciale twee-steekproevengrootheid z voor het geval dat de twee populaties dezelfde σ hebben. Vervanging van de onbekende σ door de schatter sp geeft een t-steekproefgrootheid. Het aantal vrijheidsgraden bedraagt n1 + n2 – 2. Deze grootheid vormt de basis van de samengestelde t-procedures voor twee onafhankelijke steekproeven voor inferentie. De samengestelde t-procedures voor twee onafhankelijke steekproeven: Veronderstel dat een EAS van n1 is getrokken uit een normale populatie met onbekende gemiddelde μ1, en dat een onafhankelijke EAS van omvang n2 is getrokken uit een normale populatie met onbekende gemiddelde μ2. Veronderstel tevens dat de twee populaties dezelfde standaardafwijking hebben. Een betrouwbaarheidsinterval van niveau C voor μ1 - μ2is:

( x̄1− x̄2 ) ± t* sp √❑ Hier is t* waarde voor de t(n1 + n2 – 2)-verdeling waarbij een oppervlak C tussen –t* en t* ligt.

25

Page 26: pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen:

Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018

Om de hypothese H 0 : μ1 = μ2 te toetsen, berekent men de samengestelde twee-steekproevengrootheid t:

t = x̄1− x̄2sp√❑

In termen van een stochastische variabele T met de t(n1 + n2 – 2)-verdeling, geldt voor de overschrijdingskans van een toets van H 0 tegen

H a : μ1> μ2 ; de overschrijdingskans is P(T ≥ t) H a : μ1 < μ2 ; de overschrijdingskans is P(T ≤ t)H a : μ1 ≠ μ2 ; de overschrijdingskans is 2P(T ≥ |t|)

De steekproefomvang heeft grote invloed op de overschrijdingskans van een toets. Een effect van dat in een kleine steekproef bij een gespecifieerd niveau α niet significant is, kan in een grotere steekproef wel significant zijn. Een voorwaarde voor de samengestelde t-procedure is dat de onbekende standaardafwijkingen van de twee populaties gelijk moeten zijn. Dit is echter moeilijk te controleren. De samengestelde t-procedure voor twee onafhankelijke steekproeven is daarom enigszins riskant. Wanneer de steekproeven vrijwel gelijke omvang hebben, is de procedure redelijk robuust zowel tegen niet-normale verdelingen als tegen ongelijke standaardafwijkingen. Als de steekproeven sterk in omvang verschillen, worden de samengestelde t-procedures gevoelig voor ongelijke standaardafwijkingen en dienen ze met zorgvuldigheid te worden toegepast, tenzij de steekproeven heel groot zijn.

7.3 Facultatieve onderwerpen bij het vergelijken van verdelingen7.3.1 Inferentie voor populatiespreidingInferentie omtrent de standaardafwijking van een normale populatie. We zullen de F-toets beschrijven voor het vergelijken van de spreiding van twee normale populaties. In tegenstelling tot de t-procedures voor gemiddelden zijn de F-toets en andere procedures voor standaardafwijkingen buitengewoon gevoelig voor niet-normale verdelingen. Dit gebrek aan robuustheid vermindert niet bij grote steekproeven. Het is in de praktijk moeilijk vast te stellen of een significante F-waarde bewijst dat de populaties ongelijke spreidingen hebben of dat zo’n waarde eenvoudigweg bewijst dat de populaties niet normaal verdeeld zijn.

7.3.2 De F-toets voor gelijkheid van spreidingVeronderstel dat we onafhankelijke EAS-en hebben uit twee normale populaties, een steekproef van omvang n1 uit N(μ1,σ 1) en een steekproef van omvang n2 uit N(μ2,σ 2). De populatieverwachting en standaardafwijking zijn alle onbekend. De hypothese van gelijke spreiding

H 0 : σ 1 = σ 2H a : σ 1 ≠ σ 2

26

Samenvatting boek:Significantietoetsen en betrouwbaarheidsintervallen voor het verschil tussen de gemiddelden en van twee normale populaties zijn gebaseerd op het verschil van de steekproefgemiddelden van twee onafhankelijke EAS-en. Wegens de centrale limietstelling zijn de resulterende procedures bij grote steekproeven bij benadering correct

Page 27: pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen:

Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018

wordt getoetst met een simpele grootheid, de verhouding van de steekproefvarianties. De F-grootheid en de F-verdelingenIndien s ²1 en s ²2 de steekproefvarianties zijn van onafhankelijke EAS-en van omvang n1 respectievelijk n2, getrokken uit normale populaties, dan heeft de F-grootheid

F = s ²1s ²2

de F-verdeling met n1 – 1 en n2 – 1 vrijheidsgraden als H 0 : σ 1 = σ 2 waar is. De F-verdelingen vormen een familie verdelingen met twee parameters: de aantallen vrijheidsgraden van de steekproefvarianties in de teller en in de noemer van de F-grootheid. Het aantal vrijheidsgraden van de teller wordt altijd het eerst genoemd. Verwisseling van de volgorde van de aantallen vrijheidsgraden wijzigt de verdeling, daarom is de volgorde belangrijk. Onze verkorte notatie zal zijn: F(j,k) voor de F-verdeling met j vrijheidsgraden in de teller en k vrijheidsgraden in de noemer. De F-verdelingen zijn niet symmetrisch, maar rechtsscheef. De scheefheid van de F-verdelingen veroorzaakt extra moeilijkheden. In de symmetrische normale en t-verdelingen is het punt met links daarvan de kans 0,05, precies het tegengestelde van het punt met rechts ervan de kans 0,05. Dit is onjuist voor de F-verdelingen. We hebben ofwel tabellen nodig met zowel de bovenste als de onderste staarten, ofwel middelen om de noodzaak voor onderste kritieke waarden te elimineren. Uitvoering van de F-toets:

1) Neem als toetsingsgrootheid : F = grotere s ²kleinere s ²

Dit komt neer op een herbenoeming van de populatie, zodanig dat s ²1 de grootste van de waargenomen steekproefvarianties wordt.

2) Vergelijk de waarde van F met de kritieke waarden in tabel E. Verdubbel vervolgens de significantieniveaus van de tabel om het significantieniveau voor de tweezijdige F-toets te verkrijgen. Het idee is dat we de kans in de bovenste staart berekenen en verdubbelen om de kans te krijgen van alle verhoudingen, aan beide kanten van 1, die minstens zo onwaarschijnlijk zijn als de waargenomen verhouding. Men moet bedenken dat de volgorde van de aantallen vrijheidsgraden bij het gebruik van tabel E belangrijk is.

7.3.3 Robuustheid van normale inferentieproceduresWe hebben het volgende beweerd:

● De t-procedures voor inferentie omtrent gemiddelden zijn redelijk robuust tegen niet-normale populatieverdelingen. Deze procedures zijn met name robuust als de populatieverdelingen symmetrisch zijn en (voor twee-steekproevengeval) als de twee steekproeven even groot zijn.

● De F-toets en andere inferentieprocedures voor varianties tonen een dusdanig gebrek aan robuustheid dat ze in de praktijk weinig nut hebben.

De robuustheid van de t-toets voor twee onafhankelijke steekproeven is opmerkelijk. Het is feitelijke significantieniveau blijft voor het gehele scala van bestudeerde populaties tussen ongeveer 4% en 6%. De t-toets en het overeenkomstige betrouwbaarheidsinterval behoren tot de meest betrouwbare instrumenten uit de statistiek. Men moet echter bedenken dat uitschieters de t-procedures ernstig kunnen verstoren en minder robuust zijn als de steekproefgroottes uiteenlopen. Het gebrek aan robuustheid bij de variantietoetsen is even opmerkelijk. Als de populatieverdeling afwijkt van normaal, verwijderen de feitelijke niveaus zich snel van de nagestreefde 5%. De tweezijdige F-toets, uitgevoerd met 5% kritieke waarden, kan een feitelijk niveau hebben van minder dan 1% of groter dan 11%, zelfs in symmetrische verdelingen zonder uitschieters.

27

Samenvatting boek:Inferentieprocedures voor het vergelijken van de standaardafwijkingen van twee normale populaties zijn gebaseerd op de F-grootheid, die gelijk is aan de verhouding van de steekproefvarianties:

F = Als een EAS van omvang wordt getrokken uit de populatie, en een

Page 28: pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen:

Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018

Hs. 8 Inferentie voor fracties8.1 Inferentie voor een enkele fractieWe willen een schatting van de fractie p van elementen met een of ander kenmerk onder de elementen van een grote populatie. We kiezen een EAS van omvang n uit de populatie en noteren het aantal ‘successen’ X (de aanduiding voor hetgeen dat ons interesseert). De steekproeffractie successen = X/n schat de onbekende populatiefractie p. Als de populatie veel groter is dan de p̂steekproef (bijv. ten minste 10 keer), dan zijn de individuele reacties vrijwel onafhankelijk en heeft het aantal X bij benadering de binomiale verdeling B(n,p). Als de steekproefomvang klein is, moeten we toetsen en betrouwbaarheidsintervallen voor p baseren op de binomiale verdelingen. We weten dat als de steekproef groot is, zowel het aantal X als de steekproeffractie bij benadering normaal verdeeld zijn. p̂

8.1.1 Betrouwbaarheidsinterval voor een enkele fractieAls de steekproefomvang n voldoende groot is, heeft de grootheid bij benadering de normale p̂verdeling met verwachting μ p̂ = p en standaardafwijking σ p̂ = √❑. Dit betekent dat ongeveer 95% van de tijd binnen 2p̂ √❑ van de onbekende populatiefractie p ligt.

Betrouwbaarheidsinterval van een grote steekproef voor een populatiefractieTrek een EAS van omvang n uit een grote populatie met een onbekende succesfractie p. De steekproeffractie is

= p̂ Xn

waar X het aantal successen vertegenwoordigt. De standaardfout van p̂ is SE p̂ = √❑

En de foutmarge voor betrouwbaarheidsniveau C ism = z*SE p̂

Waar z* de waarde is voor de standaard dichtheidskromme met een oppervlak C tussen –z* en z*. Het betrouwbaarheidsinterval voor niveau C voor p is bij benadering

± mp̂Gebruik dit interval voor de 90%, 95% of 99% betrouwbaarheid wanneer er sprake is van minstens 15 successen en minstens 15 mislukkingen. Men moet bedenken dat de foutmarge in dit betrouwbaarheidsinterval alleen fouten van de aselecte steekproeftrekking weergeeft. Er zijn andere bronnen van fouten waarmee geen rekening is gehouden. Bijvoorbeeld niet eerlijk antwoorden of het probleem van nonrespons.

8.1.3 Significantietoets voor één fractieWanneer we een significantietoets uitvoeren, bepaalt de nulhypothese de waarde voor p, en wij veronderstellen dat dit de werkelijke waarde is wanneer we de overschrijdingskans berekenen. Wanneer we H 0 : p = p0 toetsen, substitueren we deze p0 in de uitdrukking voor σ p̂ en standaardiseren vervolgens . p̂Significantietoets voor een populatiefractie op basis van een grote steekproefTrek een EAS van omvang n uit een grote populatie met onbekende succesfractie p. Om de hypothese H 0 : p = p0 te toetsen, berekent men de z-grootheid:

z = p̂−p0√❑

In termen van een standaardnormale stochastische variabele Z geldt voor de benaderende overschrijdingskans van een toets van H 0 versus

28

Page 29: pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen:

Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018

H a : p > p0 is P(Z ≥ z) → gekleurde oppervlakte aan de rechterkant van de grafiekH a : p < p0 is P(Z ≤ z) → gekleurde oppervlakte aan de linkerkant van de grafiekH a : p ≠ p0 is 2P(Z ≥ |z|) → gekleurde oppervlakte aan de beide kanten van de grafiek

We raden aan de grote steekproef z significantietoets te gebruiken als het verwachte aantal successen (np0) en het verwachte aantal missers (n(1-p0)) beide groter zijn dan 10. Als aan deze vuistregel niet is voldaan, of als de populatie minder dan 10 maal zo groot is als de steekproef, zouden andere procedures moeten worden gebruikt. Onze conclusie hangt niet af van de keuze van succes en mislukking. Als we deze verwisselen, verandert alleen het teken van de toetsingsgrootheid z. De overschrijdingskans blijft hetzelfde.

8.1.4 Betrouwbaarheidsintervallen geven aanvullende informatieOm te zien welke andere waarden van p met de steekproefresultaten in overeenstemming zijn, berekenen we een betrouwbaarheidsinterval. De overschrijdingskans die uit een betrouwbaarheidsinterval komt is dezelfde als die uit een significantietoets. Merk op dat de standaardfout die gebruikt wordt in een betrouwbaarheidsinterval een geschatte waarde is uit de data, terwijl de noemer in de toetsingsgrootheid z gebaseerd is op de aangenomen waarde in de nulhypothese. Een consequentie hiervan is dat de overeenkomst tussen de significantietoets en betrouwbaarheidsinterval niet langer exact is. Een andere sterke overeenkomst is dat het betrouwbaarheidsinterval resulteert in een reeks van p0’s die niet verworpen zou worden bij een toets op het α = 0,05 significantieniveau.

8.1.5 Het bepalen van de steekproefomvang De foutmarge voor een betrouwbaarheidsinterval van niveau C voor p is:

m = z*SE p̂

De kritieke waarde z* hangt af van de betrouwbaarheid C en de standaardfout hangt af van de waarde van en de steekproefomvang n:p̂

SE p̂ = √❑Omdat we de waarde van pas kennen nadat we de gegevens hebben verzameld, moeten we een p̂waarde schatten om in onze berekeningen te gebruiken, we noemen deze waarde p*.Er zijn twee manieren om p* te verkrijgen:1) Maak gebruik van de steekproefschatter van een proefonderzoek of van in het verleden gedane soortgelijk onderzoek2) De foutmarge in het betrouwbaarheidsinterval is het grootst als gelijk is aan 0,5. Een p̂conservatieve aanpak van het probleem gebruikt daarom de waarde p* = 0,5 als veronderstelde waarde. Deze keuze levert een steekproefomvang op die iets groter is dan dei welke we nodig hebben gezien het gekozen betrouwbaarheidsniveau. Het is een veilige keuze, wat de data later ook mogen tonen. Als m de gewenste foutmarge is, stellen we

m = z* √❑en lossen hieruit n op om de gewenste steekproefomvang te verkrijgen. Steekproefomvang voor gewenste foutmargeVoor de fractie p zal het betrouwbaarheidsinterval van niveau C een foutmarge hebben die bij benadering gelijk is aan een gespecifieerde waarde m, als de steekproefomvang gelijk is aan

n = ¿¿p*(1-p*)Hier is z* de kritieke waarde voor betrouwbaarheidsniveau C, en p* is de geschatte waarde voor de fractie succes in de toekomstige steekproefomvang.De foutmarge zal kleiner dan of gelijk zijn aan m als p* = 0,5 wordt gekozen. Dat geeft:

n = ¿¿De volgens deze methode voor n verkregen waarde is niet bijzonder gevoelig voor de keuze van p*, als p* tamelijk dicht bij 0,5 ligt. Indien echter de waarde van p kleiner is dan ongeveer 0,3 of groter is dan ongeveer 0,7, kan het gebruik van p*=0,5 leiden tot een steekproefomvang die veel groter is dan nodig.

29

Page 30: pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen:

Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018

De foutmarges voor en 1- zullen altijd aan elkaar gelijk zijn. Dit is een direct gevolg van de vorm p̂ p̂van het betrouwbaarheidsinterval. De foutmarge zal relatief weinig variëren voor waarden van p̂tussen 0,3 en 0,7. Het is daarom bij het opzetten van een onderzoek niet nodig om een heel precieze veronderstelling te formuleren voor . Als p*=0,5 wordt gebruikt en de waargenomen ligt tussen p̂ p̂0,3 en 0,7, dan zal het feitelijke interval een beetje korter zijn dan nodig is, maar het verschil zal gering zijn. Het is belangrijk om te benadrukken dat berekeningen enkel de effecten van steekproef

veranderlijkheid die gekwantificeerd zijn in de foutmarge in acht nemen.

8.2 Vergelijken van twee fractiesWe noemen de twee te vergelijken groepen populatie 1 en populatie 2, en de twee populatiefracties ‘successen’ p1 en p2. De gegevens bestaan uit twee onafhankelijke EAS-en, van omvang n1 en omvang n2. De fractie successen in elke steekproef schat de overeenkomstige populatiefractie. Om twee populaties te vergelijken, gebruiken we het verschil tussen de twee steekproeffracties.

D = p̂1 - p̂2 Als beide steekproefgroottes voldoende groot zijn, is de steekproefverdeling van het verschil D bij benadering normaal.Inferentieprocedures voor het verggelijken van fracties zijn z-procedures, gebaseerd op de normale verdeling en het gestandaardiseerde verschil D. De eerste stap is de verwachting en de

30

Samenvatting boek:Inferentie omtrent een populatiefractie p uit een EAS van omvang n is gebaseerd op de steekproeffractie p̂ = X/n. Als n groot is, heeft p̂ bij benadering de normale verdeling met verwachting p en standaardafwijking .Voor grote steekproeven is de foutmarge voor betrouwbaarheidsniveau C

m = z*waar z* de waarde is waarvoor het oppervlak onder de standaardnormale dichtheidscurve tussen –z* en z* gelijk is aan C en

= is de standaardfout.Het betrouwbaarheidsinterval voor niveau C is

p̂ ± mOnze aanbeveling is om de 90%, 95% en 99% betrouwbaarheidsniveaus te hanteren voor deze analyse als zowel het aantal successen als het aantal mislukkingen minstens 15 is. De steekproefomvang die vereist is om voor een fractie een betrouwbaarheidsinterval met benaderde foutmarge m te verkrijgen is

n = p*(1-p*)waar p* een geschatte waarde voor de fractie is, en z* de normale kritieke waarde voor het gewenste betrouwbaarheidsniveau. Om te garanderen dat de foutmarge kleiner dan of gelijk is aan m, wat p̂ ook moge zijn, gebruikt men:

n = Toetsen voor : p = zijn gebaseerd op de z-toets

z = met P-waarden berekend uit de N(0,1) verdeling. Gebruik deze procedure wanneer het verwachte aantal treffers n en het verwachte aantal missers, n(1-), beide groter zijn dan 10.

Page 31: pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen:

Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018

standaardafwijking van D te bepalen. Volgens de optelregel voor verwachtingen is de verwachting van D gelijk aan het verschil van de verwachtingen:

μD = μ p̂1 - μ p̂2 = p1 - p2 Dat wil zeggen, het verschil D = p̂1 - p̂2 tussen de steekproeffracties is een zuivere schatter van het populatieverschil p1 - p2. Analoog vertelt de optelregel voor varianties ons dat de variantie van D gelijk is aan de som van de varianties:

σ ²D = σ ² p̂1 - σ ² p̂2

= p1(1−p1)

n1 +

p2(1−p2)n2

Voor grote n1 en n2 is D dus bij benadering normaal met verwachting μD = p1 - p2 en standaardafwijking.

σ D = √❑

8.2.1 Grote steekproef betrouwbaarheidsinterval voor een verschil in fractiesBetrouwbaarheidsintervallen voor vergelijking van twee fractiesTrek een EAS van omvang n1 uit een grote populatie met een fractie successen p1, en een onafhankelijke EAS van omvang n2 uit een andere populatie met een fractie successen p2. De schatting van het verschil in populatiefracties is

D = p̂1 - p̂2De standaardfout van D is

SED = √❑En de foutmarge voor betrouwbaarheidsniveau C is

m = z* SED

en waarbij z* de waarde is waarvoor het oppervlak tussen –z* en z* onder de standaardnormale curve gelijk is aan C. Het betrouwbaarheidsinterval voor niveau C voor p1 - p2 is bij benadering

D ± mGebruik deze methode voor 90%, 95% of 99% betrouwbaarheid als het aantal successen en het aantal mislukkingen in beide steekproeven minstens 10 is.

8.2.3 Significantietoetsen voor een verschil in fracties Soms is het nuttig de nulhypothese te toetsen dat de twee fracties gelijk zijn. We standaardiseren D = p̂1 - p̂2 door haar gemiddelde p1 - p2 af te trekken en daarna te delen door de standaardafwijking

σ D = √❑ Als n1 en n2 groot zijn, is het gestandaardiseerde verschil bij benadering N(0,1). Bij het gebruik van een toets, gebruiken we hier een schatting van σ D die berust op het feit dat de nulhypothese stelt dat p1 = p2. Als deze twee fracties gelijk zijn, dan kunnen we alle data beschouwen als afkomstig uit één enkele populatie. Als p de gemeenschappelijke waarde van p1 en p2 is; dan is de standaardafwijking van D = p̂1 - p̂2 gelijk aan:

σ D = √❑ = √❑ We schatten de gemeenschappelijke waarde p door de totale fractie successen in beide steekproeven:

= p̂ aantal successen∈beide steekproevenaantalwaarnemingen∈beide steekproeven =

X1+X2n1+n2

Deze schatting van p heet de samengestelde schatting van p omdat hij informatie uit beide steekproeven combineert.

31

Page 32: pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen:

Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018

Om σ D onder de nulhypothese te schatten, substitueren we in de uitdrukking voor σ D, in plaats p̂van p. Het resultaat is een standaardfout voor D die uitgaat van de juistheid van H 0 : p1 = p2 :

SED p = √❑

De index bij SED p herinnert ons eraan dat we data uit de twee steekproeven hebben samengesteld

om de schatting te construeren. Deze z-toets berust op de normale benadering van de binomiale verdeling. Als algemene regel zullen we deze toets gebruiken als de aantallen successen en mislukkingen in beide steekproeven minstens 5 zijn.

Significantietoetsen voor de vergelijking van twee fractiesOm de hypothese

H 0 : p1 = p2Te toetsen, berekenen we de toetsingsgrootheid z

z = p̂1− p̂2SED p

waarin de samengestelde standaardfout is:SED p

= √❑ En

= p̂X1+X2n1+n2

In termen van een standaardnormale stochastische variable Z geldt voor de overschrijdingskans van een toets van H 0 versus

H a : p1 > p2 is P(Z ≥ z) → gekleurde oppervlakte aan de rechterkant van de grafiekH a : p1 < p2 is P(Z ≤ z) → gekleurde oppervlakte aan de linkerkant van de grafiekH a : p1 ≠ p2 is 2P(Z ≥ |z|) → gekleurde oppervlakte aan de beide kanten van de grafiek

Hs. 9 Analyse van kruistabellenWe zullen hier twee of meer populaties bestuderen wanneer de te verklaren variabele twee of meer mogelijke waarden heeft en nagaan hoe de onafhankelijkheid van twee kwalitatieve variabelen wordt getoetst.

9.1 Gegevensanalyse voor kruistabellen9.1.1 De kruistabelWe presenteren de aantallen voor alle resultaten in een kruistabel. Beide variabelen zijn kwalitatief. Voor de beschrijving van kwalitatieve gegevens werken we met aantallen (frequenties) of percentages (relatieve frequenties) van elementen die tot bepaalde categorieën behoren.

32

Samenvatting boek:De grote steekproefschatting van het verschil in twee populatiefracties is

D = - Waar en de steekproefproporties zijn.

= en =

Page 33: pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen:

Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018

Horizontaal zijn de rijvariabele en verticaal zijn de kolomvariabele. Elke combinatie van waarden voor deze twee variabelen wordt een cel genoemd. Voor elke cel berekenen we een proportie door het getal in die cel te delen door de totale steekproefgrootte. De verzameling van deze proporties is de gezamenlijke verdeling van de twee kwalitatieve variabelen.

9.1.2 Marginale verdelingenBij onderzoek naar de verdeling van één variabele in een kruistabel kijken we naar de marginale verdeling. We hebben te maken met twee marginale verdelingen: een voor elke kwalitatieve variabele in de 2 x 2 tabel. Vaak werken we liever met percentages dan met proporties.

9.1.3 Beschrijving van verbanden in kruistabellenVerbanden tussen kwalitatieve variabelen worden beschreven door berekening van de bijbehorende percentages van de opgegeven aantallen.

9.1.4 Voorwaardelijke verdelingenWanneer we de ene variabele als voorwaarde nemen en daarna de verdeling van de andere variabele berekenen, krijgen we een voorwaardelijke verdeling. Geen enkele grafiek geeft een beeld van de vorm van het verband tussen kwalitatieve variabelen, en geen enkele numerieke maatstaaf geeft aan hoe sterk dat verband is. Een kruistabel bevat een grote hoeveelheid informatie in compacte vorm. Om die informatie duidelijk te maken moeten we bijna altijd percentages berekenen. Je moet besluiten welke percentages je nodig hebt.

9.1.5 De Simpson-paradoxVerborgen variabelen kunnen een grote invloed uitoefenen op het verband tussen twee kwalitatieve variabelen. Simpson-paradoxEen verband of vergelijking die voor elke groep uit een verzameling opgaat, kan van richting veranderen wanneer de gegevens tot één enkele groep worden gecombineerd. Deze omkering wordt de Simpson-paradox genoemd. De verborgen variabelen in de Simpson-paradox zijn kwalitatief. Ze splitsen de waarnemingen op in groepen. De Simpson-paradox is een extreme vorm van het feit, dat waargenomen verbanden misleidend kunnen zijn wanneer er verborgen variabelen op de loer liggen.

9.1.6 De gevaren van samenvoegingEr wordt van samenvoeging van gegevens gesproken wanneer men de oorspronkelijke tweedimensionale tabellen verkrijgt door optelling van bijbehorende gegevens uit een driedimensionale tabel. Samenvoeging heeft als gevolg dat de derde kwalitatieve variabele buiten beschouwing blijft en daardoor een verborgen variabele wordt. Conclusies die alleen naar samengevoegde gegevens te kijken voor de had schijnen te liggen, worden discutabel wanneer we nader ingaan op verborgen variabelen.

33

Page 34: pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen:

Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018

9.2 Inferentie voor kruistabellen9.2.1 De hypothese: geen verbandDe nulhypothese waar het in een tweedimensionale tabel om gaat is: er bestaat geen verband tussen de rijvariabele en de kolomvariabele. De alternatieve hypothese is, dat tussen deze beide variabelen wel verband bestaat. De alternatieve hypothese geeft geen richting van het verband aan. Voor tweedimensionale tabellen waarin de kolommen corresponderen met onafhankelijke steekproeven van aparte populaties, bestaan k (van kolom) verdelingen voor de rijvariabele, één voor elke populatie. De nulhypothese luidt dan, dat de k verdelingen van de rijvariabele identiek zijn. De alternatieve hypothese luidt dan dat de verdelingen niet allemaal gelijk zijn.

9.2.2 Verwachte celaantallenVoor toetsing van de nulhypothese in de r x k tabellen vergelijken we de waargenomen celaantallen met de verwachte celaantalllen, berekend onder de aanname dat de nulhypothese waar is. Een getalsmatig overzicht van de vergelijking wordt onze toetsingsgrootheid. Het verwachte celaantal is het product van de rij- en kolomtotalen, gedeeld door het totaal van de tabel.

Verwachte celaantal = rijtotaal×kolomtotaal

n

9.2.3 De chi-kwadraattoetsVoor toetsing van H 0 dat er geen verband bestaat tussen de rij- en de kolomclassificaties, gebruiken we een steekproefgrootheid die de volledige verzameling waargenomen aantallen vergelijkt met de verzameling verwachte aantallen. Begin met het verschil tussen elk waargenomen aantal en het daarmee overeenkomende verwachte aantal, en kwadrateer deze waarden, zodat alle uitkomsten 0 of positief zijn. Een groot verschil heeft minder betekenis als het afkomstig is van een el met een groot verwacht aantal, dus delen we elk gekwadrateerd verschil door het verwachte aantal. Tel ten slotte alle cellen bij elkaar op. Het resultaat wordt de chi-kwadraat toetsingsgrootheid X² genoemd. De chi-kwadraattoetsDe chi-kwadraattoets is een maatstaf voor het verschil tussen de waargenomen celaantallen en de verwachte celaantallen. De formule hiervoor is

X² = ∑❑

❑ (waargenomenaantallen−verwachte aantallen)2

verwachteaantallenDe som omvat alle r × k cellen in de tabel.Als de verwachte aantallen en de waargenomen aantallen er verschillen, zal er een grote waarde van X² ontstaan. Grote waarden van X² leveren dus bewijs tegen de nulhypothese. Om voor de toets een overschrijdingskans te verkrijgen, hebben we de steekproefverdeling van X² nodig, onder de aanname dat H 0 waar is. We gebruiken een benadering die verwant is met de normale benadering van de binomiale verdeling. Het resultaat is een nieuwe verdeling, de chi-kwadratenverdeling, die we noteren met χ². χ²-verdelingen worden door één parameter beschreven, vrijheidsgraden. We gebruiken χ²(df) om een speciaal lid van deze familie aan te duiden. Chi-kwadraatverdelingen nemen slechts positieve waarden aan en zijn rechtsscheef. Tabel F geeft bovenste kritieke waarden voor de χ²-verdelingen.

34

Samenvatting boek:Een kruistabel van aantallen beschrijft het verband tussen twee kwalitatieve variabelen. Waarden van de rijvariabelen zijn horizontaal, en die van de kolomvariabelen verticaal in de tabel opgenomen. Dergelijke kruistabellen worden vaak gebruikt om grote hoeveelheden gegevens samen te vatten door de resultaten ervan onder te brengen

Page 35: pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen:

Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018

Chi-kwadraattoets voor kruistabllenDe nulhypothese voor een kruistabel stelt dat er geen samenhang bestaat tussen de rijvariabele en de kolomvariabele. Het alternatief stelt dat er een verband is tussen die variabelen.Als H 0 waar is, dan heeft de toetsingsgrootheid X² bij benadering een χ²-verdeling met (r-1)(k-1) vrijheidsgraden. De overschrijdingskans voor de chi-kwadraattoets is:

P(χ² ≥ X²) → gekleurde oppervlakte aan de rechterkant van de grafiekHier is χ² een stochastische variabele met de χ²(df)-verdeling, waarbij df = (r-1)(k-1). De chi-kwadraattoets gebruikt altijd de rechter staart van de χ²-verdeling, omdat elke afwijking van de nulhypothese de steekproefgrootheid groter maakt. De benadering van de verdeling van X² door χ² wordt nauwkeuriger naarmate de celaantallen groter worden. Bovendien is hij nauwkeuriger voor tabellen groter dan 2 × 2 tabellen. Voor alle tabellen groter dan 2 × 2 zullen we deze benadering gebruiken zodra het gemiddelde van de verwachte aantallen groter dan of gelijk is aan 5, en het kleinste verwachte aantal 1 of meer bedraagt. Voor 2 × 2 tabellen eisen we dat alle vier verwachte celaantallen gelijk zijn aan 5 of meer. De toets zegt niets over de aard van het verband.

9.2.4 De chi-kwadraattoets en de z-toetsWe kunnen twee populatiefracties vergelijken met de chi-kwadraattoets óf met de twee-steekproeventoets z van paragraaf 8.2. In feite geven deze toetsen altijd precies hetzelfde resultaat, omdat de toetsingsgrootheid X² gelijk is aan het kwadraat van de z-waarde, en χ²(1) kritieke waarde gelijk zijn aan de kwadraten van de overeenkomstige N(0,1) kritieke waarden.

9.3 Formules en modellen voor kruistabellen9.3.1 berekeningen1) Bereken de beschrijvende steekproefgrootheden die de belangrijke informatie uit de tabel overbrengen. Gewoonlijk zijn dat rij- of kolompercentages2) Bepaal de verwachte aantallen en gebruik die om de toetsingsgrootheid X² te berekenen3) Gebruik tabel F om de benaderende overschrijdingskans te vinden4) Trek een conclusie omtrent de samenhang tussen de rij- en kolomvariabelen.

9.3.2 Berekeningen van voorwaardelijke verdelingenDe duidelijkste manier om een verband aan te tonen is doorgaans, de voorwaardelijke verdelingen van de responsvariabele af te zetten tegen elke waarde van de verklarende variabele. De som van de percentages in elke kolom moet 100 zijn, afgezien van enkele mogelijke kleine afrondingsfouten.

35

Samenvatting boek:De nulhypothese voor r k tabellen van telgegevens stelt dat er geen verband bestaat tussen de rijvariabele en de kolomvariabele.De verwachte aantallen worden onder de nulhypothese berekend met de formule:

Verwacht aantal =

Page 36: pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen:

Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018

Met de chi-kwadraattoets ga je na of de samenhang statistisch significant is. De toets bevestigt uitsluitend dat er een zeker verband bestaat. De chi-kwadraattoets vertelt op zichzelf niet welke populatie door onze conclusies wordt beschreven.

9.3.3 Berekeningen van de verwachte celaantallen

Verwacht aantal = rijtotaal×kolomtotaal

n

9.3.4 De X²-toetsingsgrootheid en de bijbehorende P-waardeVoor de vergelijking van de waargenomen aantallen met de verwachte aantallen gebruiken we de toetsingsgrootheid X². Deze gaan we berekenen met de behulp van de chi-kwadraattoets. Als we de X² hebben berekend, moeten we de vrijheidsgraden berekenen. Vervolgens kunnen we onze P-waarde aflezen uit tabel F.

9.3.5 Modellen voor kruistabellenDe chi-kwadraattoets voor de aanwezigheid van een verband tussen de twee richtingen in een kruistabel is geldig voor gegevens die afkomstig zijn van uiteenlopende onderzoeksmodellen. De exacte formulering van de nulhypothese ‘geen verband’ in termen van populatieparameters luidt voor verschillende modellen anders. Een essentieel vereiste is, dat iedere experimentele eenheid of proefpersoon slechts eenmaal in de gegevenstabel mag worden opgenomen. Vergelijking van uiteenlopende populatie: het eerste model. Kies uit elk van de k populaties onafhankelijke EAS-en van de groottes n1, n2,…, nk. Classificeer elk element in een steekproef volgens een kwalitatieve responsvariabele met r mogelijke waarden. Er zijn nog k mogelijke waarschijnlijkheidsverdelingen, voor elke populatie één.De nulhypothese luidt, dat de verdelingen van de responsvariabelen in alle k populaties gelijk zijn. De alternatieve hypothese is dat deze k verdelingen niet allemaal gelijk zijn. Toetsing van onafhankelijkheid: het tweede model. Neem uit één populatie een EAS en leg de waarden vast van twee kwalitatieve variabelen, de ene met r mogelijke waarden en de andere met k mogelijke waarden. De gegevens worden samengevat door telling van de aantallen elementen voor elke mogelijke combinatie van uitkomsten voor de beide kansvariabelen. Dit leidt tot een r × k tabel van aantallen. Elk van deze r × k mogelijke uitkomsten heeft haar eigen kans- of waarschijnlijkheidswaarde. De waarschijnlijkheden geven de gezamenlijke verdeling van de beide kwalitatieve variabelen.Elk van de beide kwalitatieve kansvariabelen heeft een verdeling. Dit zijn de marginale verdelingen, omdat ze bestaan uit de sommeringen van de populatieproporties in de rijen en kolommen. De nulhypothese ‘geen verband’ luidt nu dat de rij- en kolomvariabelen onafhankelijk zijn. De vermenigvuldigingsregel voor onafhankelijke gebeurtenissen luidt, dat de gezamenlijke waarschijnlijkheden de producten zijn van de marginale waarschijnlijkheden.

9.3.6 SlotopmerkingenDe twee modellen zijn te onderscheiden door bestudering van het ontwerp van het onderzoek. In het onafhankelijkheidsmodel is er maar één steekproef. De kolomtotalen en rijtotalen zijn stochastische variabelen. De totale steekproefomvang n wordt door de onderzoeker vastgesteld en de rij- en kolomtotalen zijn pas bekend als de data wordt verzameld. Aan de andere kant is er in het model ter vergelijking van populaties voor elk van twee of meer populaties een steekproef. De kolomsommen zijn de steekproefgroottes die ten tijde van het ontwerpen van het onderzoek werden vastgesteld. In beide modellen zegt de nulhypothese dat er geen samenhang bestaat tussen de kolomvariabele en de rijvariabele. De precieze formulering van de hypothese hangt af van het steekproefontwerp, en kan variëren. Gelukkig is de toets voor het niet bestaan van samenhang voor beide modellen dezelfde; het is de chi-kwadraattoets.

36

Samenvatting boek:Bij kruistabellen berekenen we eerst de percentages of fracties die het verband waarin we op dat moment geïnteresseerd zijn, beschrijven. Daarna berekenen we verwachte aantallen, de statistische grootheid X² en de overschrijdingskans of P-waarde.Twee verschillende modellen voor het generen van r k tabellen leiden

Page 37: pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen:

Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018

9.4 Goodness of fitWordt gebruikt wanneer een bekende verdeling met een hypothetische verdeling wordt vergeleken (bijv. vergelijken met uitkomsten uit vorige onderzoeken, literatuur).De chi-kwadraattoets voor Goodness of fitGegevens over n waarnemingen met k mogelijke uitkomsten worden samengevat als waargenomen aantallen n1, n2,…, nk in k cellen. Een nulhypothese specifieert de waarschijnlijkheden p1, p2,…, pk voor de mogelijke resultaten.Vermenigvuldig voor elke cel het totale aantal waarnemingen n met de gespecifieerde waarschijnlijkheid om de verwachte uitkomst te berekenen:

Verwachte aantal = npi De chi-kwadraatgrootheid meet in welke mate waargenomen celaantallen verschillen van de verwachte celaantallen. De formule voor de steekproefgrootheid is

X² = ∑❑

❑ (waargenomenaantallen−verwachte aantallen)2

verwachteaantallenDe vrijheidsgraden zijn k-1, en de P-waarden (overschrijdingskansen) worden berekend uit de chi-kwadraatverdeling.

Hs. 14 Bootstrap methoden en permutatietoetsen

14. 1 Het bootstrap concept

14.2 De eerste stappen in het gebruik van de bootstrap

37

Samenvatting boek:Bootstrapdistributie bootsen de vorm, spreiding en vertekening van de steekproef distributies naDe bootstrapstandaardfout van een grootheid is de standaardafwijking van de bootstrap-distributie er van. Het geeft aan hoeveel een grootheid varieert bij aselecte steekproeven.

Samenvatting boek:Om een grootheid zoals het steekproefgemiddelde te bootstrappen, trek honderden hersteekproeven met teruglegging uit één enkele oorspronkelijke steekproef, bereken de steekproefgrootheid voor elke hersteekproef, en controleer de bootstrapdistributie van de hersteekproefgrootheden.

Page 38: pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen:

Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018

14.3 Hoe nauwkeurig is een bootstrapdistributie?

14.4 Bootstrap-betrouwbaarheidsintervallen

14.5 Significantietoetsing met permutatietoetsenHs. 15 Niet-parametrische toetsen15.1 De Wilcoxon-rangsomtoets15.1.1 De rangtransformatieRangnummersOm waarnemingen van een rangnummer te voorzien, moeten deze eerst naar opklimmende grootte gerangschikt worden. Het rangnummer van elke waarneming is de positie ervan in deze geordende lijst, beginnend bij rang 1 voor de kleinste waarneming. De omzetting van de oorspronkelijke waarnemingen naar de respectievelijke rangnummers is een gegevenstransformatie. Bij rangnummertransformatie blijft alleen de rangorde van de waarneming behouden en wordt er verder geen gebruik gemaakt van de numerieke waarden. Door het werken met rangen wordt het gebruik van specifieke aannames over de vorm van de verdeling, zoals normaliteit, overbodig.

15.1.2 De rangsomtoets van WilcoxonTrek een EAS met omvang n1 uit een populatie en trek een onafhankelijke EAS met omvang n2 uit een andere populatie. Er zijn in totaal N waarnemingen, waarbij N = n1 + n2. Rangschik alle N waarnemingen. De som W van de rangnummers van de eerste steekproef is de steekproefgrootheid van de rangsom van Wilcoxon. Als de twee populaties dezelfde continue verdeling hebben, dan heeft W de verwachting

μW = n1(N+1)

2 en de standaardafwijking σW = √❑

De rangsomtoets van Wilcoxon verwerpt de hypothese dat de twee populaties identieke verdelingen hebben als de rangsom W ver verwijderd is van zijn verwachting.

15.1.3 De normale benaderingDe rangsom-toetsingsgrootheid W wordt bij benadering normaal als de twee steekproefgroottes toenemen. We kunnen dan nog een andere z-toetsingsgrootheid krijgen door standaardisering van W:

38

Samenvatting boek:Permutatietoetsen zijn significantietoetsen die op permutatie-hersteekproef gebaseerd zijn die aselect uit de oorspronkelijke data getrokken zijn. Permutatie-hersteekproeven worden getrokken zonder teruglegging, in tegenstelling tot bootstrap steekproeven die met teruglegging getrokken worden.

Samenvatting boek:Bootstrap t en (als ze bestaan) traditionele z en t betrouwbaarheidsintervallen hebben de randvoorwaarde dat de vertekening van de grootheden klein is, en dat de steekproefdistributies dicht bij normaal liggen. We kunnen dit nagaan door de bootstrapdistributie op vertekening en gebrek aan normaliteit

Samenvatting boek:De onderlinge variatie tussen de bootstrapdistributies van een grootheid wordt bijna altijd veroorzaakt door de keuze van de oorspronkelijke steekproef uit de populatie. Hersteekproeftrekking introduceert weinig additionele variatie.Bootstrapdistributies die op kleine steekproeven gebaseerd zijn

Page 39: pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen:

Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018

z = W−μWσW

= W−n1(N+1)

2√❑

Gebruik altijd normale kansberekeningen om de overschrijdingskans te vinden voor deze toetsingsgrootheid. Aangezien W alleen in gehele getallen wordt uitgedrukt, zal de continuïteitscorrectie de nauwkeurigheid van de benadering verbeteren.

15.1.4 Welke hypotheses toetst de Wilcoxon-toets?Als we aannemen dat de variabelen normaal verdeeld zij, of als we redelijk grote steekproeven hebben, gebruiken we de twee-steekproeven t-toets voor verwachtingen. Onze hypothesen zijn dan

H 0 : μ1 = μ2H a : μ1 > μ2

Als de verdelingen mogelijk niet normaal zijn, dan drukken we de hypothesen uit in termen van populatiemedianen in plaats van verwachtingen:

H 0 : mediaan1 = mediaan2H a : mediaan1 > mediaan2

De rangsomtoets van Wilcoxon biedt weliswaar een significantietoets voor deze hypothesen, maar alleen indien is voldaan aan een aanvullende aanname: beide populaties moeten een continue verdeling hebben van dezelfde vorm. De aanname voor gelijkvormigheid is te streng om in de praktijk gebruikt te kunnen worden. Gelukkig kan de Wilcoxon-toets ook voor veel algemener en praktischer toepassingen gebruikt worden. Hij toetst hypotheses die we op de volgende wijze kunnen uitdrukken

H 0 : twee verdelingen zijn gelijkH a : één verdeling heeft waarden die systematisch groter zijn

Deze exacte bewering van de hypotheses die we toetsen is niet erg praktisch. De hypotheses zijn echt ‘parametervrij’ omdat er geen specifieke parameter aan verbonden is, zoals de verwachting of de mediaan. Als twee verdelingen dezelfde vorm hebben, zullen de algemene hypotheses zich beperken tot het vergelijken van medianen. Het is aangeraden om de hypotheses in woorden uit te drukken in plaats van in symbolen.

15.1.5 KnopenDe exacte verdeling van de Wilcoxon-rangsom wordt verkregen door aan te nemen dat alle waarnemingen in beide steekproeven verschillende waarden aannemen. Dit biedt ons de mogelijkheid ze allemaal te rangschikken. In de praktijk hebben we echter vaak te maken met waarnemingen die dezelfde waarde opleveren. Gewoonlijk wordt aan alle waarnemingen met dezelfde waarde het gemiddelde toegekend van de rangnummers die zij innemen. De waarnemingen met dezelfde waarden worden knopen genoemd. De exacte verdeling van de Wilcoxon-rangsom is alleen van toepassing op gegevens zonder knopen. Bovendien moet de standaardafwijking aangepast worden als er sprake is van knopen. De normale benadering kan gebruikt worden nadat de standaardafwijking is aangepast. Het kan soms nuttig zijn rangtoetsen uit te voeren op gegevens die heel veel knopen hebben omdat de schaal van de meting slechts enkele waarden heeft.

15.1.6 Rangordetoetsen, t-toetsen en permutatietoetsenDe twee t-toetsen vormen de gebruikelijkste methode voor een vergelijking van de middens van twee populaties, gebaseerd op aselecte steekproeven uit elk van deze beide populaties. De

39

Page 40: pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen:

Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018

Wilcoxon-rangsomtoets is een daarmee concurrerende procedure, die niet de voorwaarde van een normaalverdeling kent. Ook voor permutatietoetsen is normaliteit geen voorwaarde. Rangtoetsen versus de traditionele, op een normaalverdeling gebaseerde toetsen:

● Door van hun feitelijke waarde van gegevens over te schakelen op hun rangnummer, krijgen wij een exacte steekproefverdeling voor rangsteekproefgrootheden zoals de Wilcoxon rangsom W wanneer de nulhypothese waar is. Zijn de steekproeven klein, zijn ze echt aselect uit de populatie getrokken en vertonen ze niet-normale verdelingen met dezelfde vorm, dan is de Wilcoxon-toets betrouwbaarder dan de twee-steekproeven t-toets.

● Normaliteitstoetsen vergelijken gemiddelden en werken met eenvoudige betrouwbaarheidsintervallen voor gemiddelden en verschillen tussen gemiddelden. Bij gebruik van rangtoetsen voor vergelijkingen tussen medianen, kunnen we ook betrouwbaarheidsintervallen voor medianen aangeven. De bruikbaarheid van rangtoetsen is echter het duidelijkst zichtbaar bij onderzoeksmodellen waar het niet simpelweg gaat om vergelijkingen tussen medianen.

● Inferentie op grond van rangorde blijft grotendeels beperkt tot eenvoudige modellen. Inferentie aan de hand van normaalverdelingen strekt zich ook tot het gebruikt van complexe experimentele modellen en meervoudige regressie; bij non-parametrische toetsing ontbreken die.

Rangtoetsen versus permutatietoetsen:

● Rangtoetsen en permutatietoetsen zijn non-parametrisch. Ze vereisen geen aannames over de vorm van de populatieverdeling. Een permutatietoets met twee steekproeven kent dezelfde nulhypothese als de Wilcoxon-rangsomtoets: de beide populatieverdelingen zijn aan elkaar gelijk. De berekeningen van de steekproefverdeling onder de nulhypothese is voor beide toetsen dezelfde, maar is voor de rangtoetsen eenvoudiger omdat ze in het laatste geval uitsluitend berust op de grootte van de omvang van de steekproeven.

● Permutatietoetsen hebben het voordeel dat ze flexibel zijn. Ze bieden een ruime keus uit steekproefgrootheden voor de vergelijking tussen twee steekproeven, wat een voordeel is ten opzichte van t- en Wilcoxon-toetsen. We zouden in feite permutatietoetsing kunnen gebruiken voor zowel steekproefgemiddelden (een imitatie van t) of voor rangsommen (een imitatie van Wilcoxon), als voor andere steekproefgrootheden zoals het getrimde gemiddelde. Permutatietoetsen zijn in bepaalde modellen, zoals toetsing van hypothesen over een enkele populatie, niet beschikbaar, al kunnen in zulke situaties bootstrap-betrouwbaarheidsintervallen wel toetsing van herhaald steekproefneming mogelijk maken. Permutatietoetsen zijn beschikbaar voor meervoudige regressie en voor andere, zeer complexe onderzoeksmodellen.

● Een belangrijk voordeel van methoden met herhaalde steekproefneming vergeleken met normaliteit- en rangprocedures is, dat wij voor de betreffende parameter bootstrap-betrouwbaarheidsintervallen kunnen krijgen die overeenkomen met ongeacht welke steekproefgrootheid die wij voor de permutatietoets kiezen. Zijn de steekproeven echter zeer klein, dan kunnen de bootstrap-betrouwbaarheidsintervallen onbetrouwbaar worden; de steekproeven vertegenwoordigen de populatie dan onvoldoende om een goede basis voor de bootstrap-methode te zijn.

Algemeen gesteld zijn zowel op de normaalverdeling gebaseerde methoden als methoden met herhaalde steekproefneming nuttiger dan rangtoetsen.

40

Page 41: pedagogischekringleuven.files.wordpress.com€¦  · Web view2020. 9. 23. · De dichtheidskromme van de t(k)-verdelingen lijken in vorm op de standaardnormale kromme. Dat wil zeggen:

Statistiek in de praktijk Theorieboek Lisa de Jong januari 2018

15.2 De Wilcoxon-rangtekentoetsDe rangtekentoets van Wilcoxon voor gekoppelde parenTrek een EAS van grootte n uit een populatie voor een onderzoek over gekoppelde paren en bepaal de verschillen van de reacties binnen de paren. Rangschik de absolute waarden van deze verschillen. De som W +¿ ¿ van de rangnummers voor de positieve verschillen is de rangteken-toetsingsgrootheid van Wilcoxon. Als de reacties een continue verdeling hebben die niet beïnvloed wordt door verschillende behandelingen binnen de paren, heeft W +¿ ¿ de verwachting

μW +¿ ¿= n(n+1)4

en de standaardafwijking σW +¿ ¿ = √❑

De Wilcoxon-rangtekentoets verwerpt de hypothese dat er geen systematische verschillen zijn binnen de paren als de rangsom W+¿ ¿ ver verwijderd is van zijn verwachting. 15.2.1 De benadering volgens de normaalverdelingWanneer de nulhypothese (geen verschil) waar is, benadert de verdeling van de rangteken-steekproefgrootheid steeds meer de normale verdeling naarmate de omvang van de steekproef groter wordt. We kunnen dan normale kansberekeningen toepassen (met continuïteitscorrectie) om de benaderende overschrijdingskansen voor W+¿ ¿ te verkrijgen.15.2.2 KnopenAan knopen die onder de absolute verschillen voorkomen worden gemiddelde rangnummers toegekend. Een knoop binnen een paar veroorzaakt een verschil van nul. Omdat deze positief nog negatief zijn, sluiten wij dergelijke paren van onze steekproef uit. Dit komt erop neer, dat wij waarnemingen weglaten die de nulhypothese (geen verschil) ondersteunen. Komen er veel knopen voor, dan kan de toets een systematische voorkeur vertonen voor de alternatieve hypothese. Evenals bij de Wilcoxon-rangsomtoets bemoeilijken knopen het bepalen van een P-waarde.

41

Samenvatting boek:De Rangtekentoets van Wilcoxon is van toepassing op onderzoeken met gekoppelde paren. Hij toetst de dat er geen systematisch verschil is binnen de paren tegen het alternatief dat er wel een systematisch verschil is (ofwel eenzijdig, ofwel tweezijdig).De toets is gebaseerd op de Wilcoxon ranteken-steekproefgrootheid .

Samenvatting boek:Non-parametrische toetsen vereisen geen specifieke vorm van de verdeling van de populatie waaruit onze steekproeven zijn getrokken.Rangtoetsen zijn non-parametrische toetsen gebaseerd op de rangnummers van de waarnemingen, geordend van kleinst (rangnummer 1) naar grootst. Bij knopen kennen wij het gemiddelde