Statistiek i i6e2

44
STATISTIEK & KANSREKENING I A. van Hoegee en R.J. van Aalst versie 6.2 (12 april 2011) Changerecord: versie datum publicatie Veranderingen t.o.v. vorige versie 5.3 26 april 2010 GR instructies toegevoegd 6 28 mei 2010 H5 Normaalverdeling herschreven en H6 Binomiaalverdeling uitgebreid eea in overeenstemming met de behandelde stof op het hoorcollege 6.1 29 mei 2010 7.4 toegevoegd 6.2 12 april 2011 H1 enkele voorbeelden aangepast, o.a bepaling mediaan

description

Statistiek Hogeschool van Amsterdam

Transcript of Statistiek i i6e2

Page 1: Statistiek i i6e2

STATISTIEK

&

KANSREKENING I

A. van Hoegee en R.J. van Aalst

versie 6.2 (12 april 2011) Changerecord: versie datum publicatie Veranderingen t.o.v. vorige versie 5.3 26 april 2010 GR instructies toegevoegd 6 28 mei 2010 H5 Normaalverdeling herschreven en H6 Binomiaalverdeling uitgebreid eea

in overeenstemming met de behandelde stof op het hoorcollege 6.1 29 mei 2010 7.4 toegevoegd 6.2 12 april 2011 H1 enkele voorbeelden aangepast, o.a bepaling mediaan

Page 2: Statistiek i i6e2

2

Inhoudsopgave 1   INLEIDING  IN  DE  STATISTIEK  ........................................................................................................................  3  

1.1   DE  FREQUENTIETABEL  EN  HET  HISTOGRAM  .................................................................................................................  3  1.2   HET  GEMIDDELDE  ..................................................................................................................................................  4  1.3   DE  MODUS  ..........................................................................................................................................................  6  1.4   DE  MEDIAAN  ........................................................................................................................................................  7  1.5   SPREIDING  ...........................................................................................................................................................  8  1.6   GEBRUIK  GR  ......................................................................................................................................................  10  

2   PERMUTATIES,  COMBINATIES,  VARIATIES  ..................................................................................................  11  

2.1   PERMUTATIES  ....................................................................................................................................................  11  2.2   VARIATIES  .........................................................................................................................................................  11  2.3   COMBINATIES  .....................................................................................................................................................  12  2.4   GEBRUIK  GR  ......................................................................................................................................................  12  

3   ELEMENTAIRE  KANSREKENING  ...................................................................................................................  13  

3.1   HET  BEGRIP  KANS  ................................................................................................................................................  13  3.2   SOM-­‐  EN  PRODUCTREGELS  ....................................................................................................................................  13  3.3   VOORWAARDELIJKE  KANS  .....................................................................................................................................  14  3.4   KANSEN  BIJ  TREKKINGEN  MET  EN  ZONDER  TERUGLEGGING  ...........................................................................................  15  

4   KANSFUNCTIES  ..........................................................................................................................................  18  

4.1   KANSVARIABELEN  ................................................................................................................................................  18  4.2   KANSFUNCTIE  EN  VERDELINGSFUNCTIE  ....................................................................................................................  18  4.3   VERWACHTINGSWAARDE  EN  VARIANTIE  ...................................................................................................................  20  4.4   REKENREGELS  .....................................................................................................................................................  21  

5   DE  NORMALE  VERDELING  ..........................................................................................................................  23  

5.1   INTRODUCTIE  NORMALE  VERDELING  .......................................................................................................................  23  5.2   DE  STANDAARDNORMAAL  VERDELING  .....................................................................................................................  23  5.3   WISKUNDE  VAN  DE  NORMAALVERDELING  .................................................................................................................  24  5.4   KANSREKENING  MET  EEN  NORMAALVERDELING  .........................................................................................................  25  5.5   BETROUWBAARHEIDSINTERVALLEN  .........................................................................................................................  26  5.6   COMBINATIES  VAN  NORMALE  VERDELINGEN  ..............................................................................................................  27  5.7   DE  VERDELING  VAN  HET  GEMIDDELDE  VAN  EEN  STEEKPROEF  .........................................................................................  28  

6   DE  BINOMIALE  VERDELING  ........................................................................................................................  30  

6.1   BINOMIALE  KANSFORMULE  ...................................................................................................................................  30  6.2   KANSREKENING  MET  DE  BINOMIALE  VERDELING  ........................................................................................................  31  6.3   DE  NORMALE  BENADERING  VAN  DE  BINOMIALE  VERDELING  .........................................................................................  32  

7   DE  POISSONVERDELING  .............................................................................................................................  35  

7.1   FORMULE  VAN  DE  POISSONVERDELING  ....................................................................................................................  35  7.2   KANSREKENING  MET  DE  POISSONVERDELING  ............................................................................................................  36  7.3   DE  NORMALE  BENADERING  VAN  DE  POISSONVERDELING  .............................................................................................  37  7.4   BINOM  à  NORMAAL;  BINOMà  POISSON;  POISSON  à  NORMAAL  .............................................................................  37  

8   FORMULEBLAD  ..........................................................................................................................................  38  

9   APPENDIX  A:  TABEL  VAN  DE  STANDAARD  NORMAAL  VERDELING  ..............................................................  41  

10   APPENDIX  B:  TABEL  VAN  DE  POISSON  VERDELING  .....................................................................................  42  

11   APPENDIX  C:    TABEL  VAN  DE  BINOMIALE  VERDELING  .................................................................................  43  

Page 3: Statistiek i i6e2

3

1 INLEIDING  IN  DE  STATISTIEK  Statistiek is een wetenschap, die zich bezig houdt met het verzamelen, ordenen, presenteren en analyseren van gegevens; hierbij gaat het dan om resultaten van experimenten of waarnemingen die niet eenduidig zijn; denk hierbij aan het meten van weerstand, treksterkte, maar ook het gewicht van mensen, etc. Net als op vele andere terreinen ook in de techniek van onschatbare waarde. We zullen ons in dit hoofdstuk hoofdzakelijk het ordenen, presenteren en analyseren beschrijven. Op de manier hoe gegevens verzameld worden gaan we hier niet in.

1.1 De  frequentietabel  en  het  histogram  Een brei aan meetwaarden geeft geen enkel inzicht; pas als we de meetwaarden rangschikken en ordenen en dit resultaat grafisch weergeven kunnen we allerlei patronen ontdekken. Numerieke ordening. Afhankelijk van het type gegeven vindt deze ordening plaats op volgorde van getallen, alfabetische volgorde, op kleur of iets dergelijks. Om de gegevens in een geordende vorm te presenteren hebben we een flink aantal mogelijkheden: We kunnen de gegevens zonder meer in bijvoorbeeld oplopende volgorde opschrijven. Maar bij grote aantallen meetwaarden is dit nog steeds erg onoverzichtelijk. Als een aantal gegevens vaker dan één keer voorkomt, kunnen we per gegeven ook aangeven met welke frequentie dit gegeven voorkomt. In een dergelijk geval spreken we van een frequentietabel. We onderscheiden een absolute frequentietabel (hierin staan de absolute aantallen van waarneming) en de relatieve frequentietabel (met de percentuele frequenties)

Als voorbeeld geven we hieronder een frequentietabel, waarin het aantal kinderen per gezin wordt weergegeven in een bepaald dorp.

Aantal kinderen frequentie 0 20 1 100 2 50 3 21 4 8 5 2 6 0 7 1

In dit geval krijgen we een redelijk overzichtelijke tabel, waarin we een aardig idee krijgen over het aantal kinderen in een willekeurig gezin. Merk op dat de meetwaarden in dit voorbeeld discreet van aard zijn en niet continu: je hebt 1 kind of 2 kinderen, maar nooit 1,5

Als veel van de gegevens slechts één keer voorkomen, heeft deze methode niet zoveel zin. De tabel wordt dan veel te lang. In een dergelijk geval voegen we een aantal gegevens, dat min of meer dichtbij elkaar liggen samen tot 1 groep (meestal klasse genoemd) en tellen hoeveel van die elementen er dan in dezelfde klasse liggen. Een dergelijke verdeling noemen we dan een klassenindeling.

Als volgend voorbeeld geven we de uitkomst van een lichaamsgewichtbepaling onder in totaal 112 eerstejaars aviation studenten. Je ziet hieronder een absolute frequentietabel , gebaseerd op een klassenindeling. Merk op dat je het hier hebt over een continue variabele, nl. het gewicht: iemand kan 57,3852194 kg wegen en valt dan dus in klasse 2: de klasse van 55-60 kg.

Page 4: Statistiek i i6e2

4

Grafische weergave We kunnen de gegevens ook grafisch weergeven. Met Excel kun je vele grafiekjes en staafdiagrammen maken. Een Staafdiagram is de grafische weergave van de frequentieverdeling van data, afkomstig uit een discontinue verdeling, zoals bijvoorbeeld in geval het voorkomen van typen/stijlen/soorten. Maken we een diagram van een continue verdeling, zoals in het voorbeeld hierboven, dan spreken we van een Histogram of kolommendiagram. Een histogram is de tegenhanger van een staafdiagram bij discontinue verdelingen. Overigens zien beide typen diagrammen er hetzelfde uit, alleen de x-as indeling verschilt. Hieronder staat een histogram van de cijferverdeling in het laatste voorbeeld hierboven:

Dit diagram toont kolommen met oppervlakte ter grootte van de (relatieve) frequenties opgericht boven de klassen.

1.2 Het  gemiddelde  Heel vaak verzamelen we gegevens om iets te kunnen zeggen over een doorsnee waarde van deze gegevens. Eén van de meest bekende waarde is het gemiddelde. Helaas bedoelt niet iedereen hetzelfde met het woord gemiddelde. In deze paragraaf behandelen we de drie meest voorkomende vormen van gemiddelde

gewicht Frequentie 50-55 7 55-60 7 60-65 20 65-70 22 70-75 23 75-80 15 80-85 11 85-90 5 90-95 2

Page 5: Statistiek i i6e2

5

1.2.1 Het  rekenkundig  gemiddelde  De meest voorkomende vorm van gemiddelde is het rekenkundige gemiddelde. Het rekenkundig gemiddelde is een waarde, die zodanig gekozen wordt, dat als elk getal uit de gegevensverzameling vervangen wordt door dit rekenkundige gemiddelde, we hetzelfde resultaat krijgen indien we alle getallen bij elkaar optellen of als we het rekenkundig gemiddelde vermenigvuldigen met het aantal elementen in die verzameling. Dit klinkt ingewikkeld. We geven een voorbeeld.Veronderstel: in een verzameling komen 4 getallen voor, namelijk 5, 7, 9 en 11 Als we deze getallen optellen krijgen we: 3211975 =+++ . Neem nu het getal 8. Indien we 8 vermenigvuldigen met 4 ( het aantal elementen uit de verzameling) dan krijgen we ook 32. In dit geval zeggen we dat het gemiddelde van de getallen 5, 7, 9 en 11 gelijk is aan 8. We kregen dit door 32 te delen door 4. In zijn algemeenheid kunnen we dus zeggen, dat het rekenkundig gemiddelde verkregen wordt door de som van de elementen te delen door het aantal elementen. In formule ziet dat er als volgt uit:

N

xx

N

ii∑

== 1

Hierin staat x voor het rekenkundig gemiddelde

ix is een willekeurig getal uit de verzameling.

∑=

N

iix

1

staat voor de som van alle elementen uit de verzameling.

N is het aantal elementen in de verzameling. Als een aantal getallen vaker dan één keer voorkomt, en er dus een frequentietabel gemaakt kan worden, wordt de formule iets gewijzigd. We krijgen dan:

=

== n

ii

n

iii

f

fxx

1

1

Hierin staat x weer voor het rekenkundig gemiddelde.

if staat voor de frequentie waarmee ix voorkomt

n is het aantal verschillende elementen ix in de gehele verzameling.

Dit betekent dus dat: Nfn

ii =∑

=1

Het bovenstaande geldt zolang we van elk element precies de waarde weten. Op het moment dat we te maken hebben met een klassenindeling, weten we niet precies meer wat de waarde van elk element afzonderlijk is. In dit geval gaan we ervan uit dat de element homogeen over de klasse verdeeld zijn. We nemen dan het klassemidden (Dit is de gemiddelde waarde van de ondergrens van de klasse en de bovengrens van de klasse) als representant van de klasse en vermenigvuldigen dat met de frequentie. De formule voor het berekenen van het rekenkundig gemiddelde verandert dus niet, alleen staat ix nu voor het klassenmidden.

Page 6: Statistiek i i6e2

6

1.2.2 Het  meetkundig  gemiddelde  In sommige gevallen krijgen we niet het juiste antwoord bij het toepassen van het rekenkundig gemiddelde. Een voorbeeld hiervan is het berekenen van de gemiddelde rente over een kapitaal. Veronderstel dat we een kapitaal hebben van € 10.000,- Over dit kapitaal krijgen we het eerste jaar 2% rente, in het tweede jaar 3%, in het derde jaar 1% en in het vierde jaar 4%. De rente wordt elk jaar over de al betaalde rente uitgekeerd. Als we nu het rekenkundig gemiddelde nemen van de rente ( )( )5,24/4321 =+++= en we passen dit rentepercentage 4 jaar achter elkaar toe, zien we dat dit niet exact hetzelfde oplevert. In het eerste geval levert dit op: €11035,50. In het geval van 4 jaar 2,5% krijgen we: € 11038,1 Kennelijk zit er een klein foutje in het systeem. De afwijking is echter te groot om het te wijten aan afrondfouten. We passen de formule enigszins aan en krijgen: 02494,104,1*01,1*03,1*02,14 ==x Als we dit percentage 4 jaar uitrekenen krijgen we wel het juiste antwoord. In dit geval bij het gebruik van de hierboven beschreven methode spreken we van het meetkundig gemiddelde. De algemene formule wordt dan:

NN

iixx ∏

=

=1

Hierin is N het aantal elementen in de verzameling.

∏=

N

iix

1

staat voor het product voor alleN elementen uit de verzameling.

1.2.3 Het  harmonisch  gemiddelde  Het volgende voorbeeld geeft een nog weer iets andere vorm van het berekenen van het gemiddelde. Van werknemer A is bekend, dat hij een bepaald karwei kan afmaken in 4 dagen. Van werknemer B is bekend, dat hij voor hetzelfde karwei 6 dagen nodig heeft. Veronderstel nu, dat het mogelijk is, dat deze 2 werknemers samen aan een karwei beginnen, en dat ze elkaar niet in de weg lopen. Hoeveel tijd zal het voltooien van het karwei dan gemiddeld in beslag nemen? Bij het gebruik van het rekenkundig gemiddelde zouden we uitkomen op 5 werkdagen ( Voor 2 werknemers betekent dit in totaal 2,5 dagen). Als we echter nog wat nauwkeuriger rekenen, vinden we dat werknemer A 4

1 van het karwei in 1 dag

doet. Werknemer B doet in 1 dag 61 deel van het karwei.

Samen doen ze dus op 1 dag 125

122

123

61

41 =+=+ deel van het karwei. In totaal zijn ze dus 5

12 dag bezig. Het totaal aantal werkdagen komt dan op 4,8. Dit gemiddelde noemen we het harmonisch gemiddelde.

In formule:

∑=

= n

i ii xf

x

1

1*

1

1.3  De  modus  Als we te maken hebben met een frequentietabel, kunnen we het element opzoeken,dat de hoogste frequentie heeft. In het geval dat er maar één element de grootste frequentie heeft, spreken we van de

Page 7: Statistiek i i6e2

7

modus. Dit is een snelle manier van het bepalen van een doorsnee waarde van de verzameling, maar doorgaans ook niet zo heel erg betrouwbaar. Als de frequenties van een aantal elementen elkaar niet zo heel erg veel ontloopt is het gebruik van de modus niet erg betrouwbaar. Ook bij een klassenverdeling komen we een dergelijk begrip tegen. Nu spreken we echter van een modale klasse. Hierbij treden echter een paar probleempjes op. In eerste instantie moeten we er op letten of de klassen elk dezelfde breedte hebben. Indien dit het geval is, is de klasse met de hoogste frequentie inderdaad de modale klasse. In het geval dat de klassenbreedte varieert, hoeft de klasse met de hoogste frequentie niet noodzakelijk de modale klasse te zijn. We moeten dan de frequentiedichtheid berekenen. Deze frequentie dichtheid kunnen we berekenen, door de frequentie te delen door de lengte van het interval. De modale klasse wordt dan de klasse met de hoogste frequentiedichtheid. Als bij een bepaalde klassenverdeling het zo uitkomt dat er een aantal klassen zijn met ongeveer gelijke frequentie, dan kan het zijn dat we de omvang van de klassen verkeerd gekozen hebben. (De klassen zijn misschien te groot of te klein) Een verandering van de klassenbreedte kan dan leiden tot een beter resultaat.

1.4  De  mediaan    Een andere manier om een doorsnee waarde te geven van een verzameling, is het bekijken van de middelste waarde. Hiertoe moeten we de gegevens uit de verzameling eerst ordenen in aflopende of oplopende volgorde. We kunnen dus alleen met een mediaan werken, als de gegevens te ordenen zijn in oplopende of aflopende volgorde. Alleen bij een oneven aantal elementen hebben we een middelste element. Bij een even aantal elementen nemen we voor de mediaan het gemiddelde van de twee elementen, die het dichtst bij het midden liggen.

Het bepalen van de mediaan wordt iets lastiger op het moment, dat we met een klassenindeling te maken hebben. Het is dan immers niet duidelijk welke waarde precies de middelste is, omdat we van elke klasse alleen maar weten hoeveel elementen er in zitten. Om toch een redelijke schatting van de mediaan te kunnen maken bepalen we eerst in welke klasse de mediaan ligt. Vervolgens gaan we er van uit, dat de elementen gelijkelijk over de hele klasse zijn verdeeld en onderling op gelijke afstand van elkaar liggen. Op deze manier kunnen we de mediaan uitrekenen. Deze berekening zal dus in veel gevallen een iets andere uitkomst opleveren, dan in het geval, dat we alle waarden exact kennen. Voor de berekening van de mediaan gebruiken we de volgende formule;

msnrnlnlLx *+

+=∧

; In deze formule is:

x de mediaan L de ondergrens van de klasse, waarin de mediaan ligt. nl het aantal elementen links van de mediaan in de klasse, waarin de mediaan ligt nr het aantal elementen rechts van de mediaan in de klasse, waarin de mediaan ligt

ms de klassenbreedte van de klasse waarin de mediaan gelegen is. Voorbeeld1. stel dat we het aantal kinderen per gezin in een buurt met 15 gezinnen inventariseren en stel dat we de frequentietabel hiernaast als uitkomst vinden: Van deze 15 meetwaarden is (in opklimmende volgorde) de achtste de mediaan. De achtste meetwaarde is een 4, en wel de tweede 4 in de klasse van 4 kinderen per gezin. Voeren we deze waarden in in de GR dan lezen we af: x-gem=3,8 en de mediaan = 4 Voorbeeld 2: Maar stel, dat we nu een buurtonderzoek uitvoeren en de leeftijd van alle jonge kinderen onder de 10 jaar inventariseren en dat we nu als uitkomst dezelfde tabel vinden: dwz xi staat nu voor de leeftijd van een kind en fi weer voor het aantal kinderen

xi   fi  1   1  2   2  3   3  4   4  5   3  

6   2  

Page 8: Statistiek i i6e2

8

dat die leeftijd heeft. Maar nu is de verwerking anders: nu is er sprake van een continue variabele, want als een kind 1 jaar is, dan is hij minimaal 1 en nog geen 2 jaar, bijv 1 jaar, 3 maanden, 5 dagen en 7 uur. Dus moeten we concluderen dat de eerste klasse alle kinderen bevat die ouder zijn dan 1 maar jonger dan 2 etc.

We moeten de frequentietabel van zonet aanpassen tot de tweede frequentietabel hiernaast. En ook moeten we nu andere waarden voor xi nemen, want xi stelt nu het klassemidden voor: xi voor de klasse van 1 jarigen wordt dus nu niet 1 maar 1,5 etc. Voeren we nu weer xi en fi in de GR in, dan lezen we af: x-gem=4,3 en med=4,5; we hebben de calculator immers gezegd dat er in de klasse van 4-5 jarigen vier waarden van 4,5 zijn. In deze situatie heeft de GR echter geen gelijk, omdat bij een continue variabele gaat de bepaling van de mediaan anders verloopt.

Die vier waarden van de klasse van 4 tot 5 jaar smeren we gelijkmatig uit over de gehele klassebreedte, dwz de eerste waarde ligt op de 4 en de laatste waarden pinnen we op de vijf. Aldus zien we dat de tweede meetwaarde in deze klasse (die tevens de middelste meetwaarde van de gehele verzameling is) nu op 4,3 ligt, zoals we ook vinden als we de bovenstaande formule voor de mediaan gebruiken.

1.5 Spreiding   Met alleen maar de waarde van het gemiddelde of de mediaan of de meest voorkomende meetwaarde hebben we een idee omtrent de centrale ligging van een verzameling, maar hebben we nog geen beeld omtrent de ligging van de verschillende elementen van de verzameling ten opzichte van elkaar. We verkrijgen andere belangrijke informatie over de verzameling indien we weten hoeveel de elementen uit de verzameling afwijken van het gemiddelde. Er is een aantal methodes om deze afwijking uit te rekenen. Elke methode levert een ander resultaat op en het ene resultaat is beter bruikbaar dan het andere. In deze paragraaf zullen we enkele methodes bespreken voor het bepalen van de spreiding van een verzameling.

1.5.1 De  Gemiddelde  Absolute  Afwijking    Bij een verdeling, waar we van ieder element van de verzameling de waarde kennen, kunnen we het rekenkundig gemiddelde uitrekenen en vervolgens voor ieder element uitrekenen wat het verschil is met dat gemiddelde. Als we al deze verschillen optellen, zal de som precies 0 opleveren. Immers het gemiddelde was het getal, dat als vervanger van alle elementen uit de verzameling kon worden beschouwd. Hier kunnen we dus niets mee. Als we echter bij het bepalen van het verschil het eventuele minteken weglaten, krijgen we alleen positieve waardes. Als we deze positieve (absolute) verschillen optellen en daarna delen door het aantal aanwezige elementen in de verzameling krijgen we een waarde voor de gemiddelde absolute afwijking. In formule:

=

=

−= n

ii

n

iii

f

xxfGAA

1

1*

Hierin is GAA de gemiddelde absolute afwijking. x het rekenkundig gemiddelde van de verzameling Deze formule kunnen we ook gebruiken in het geval van een klassenverdeling. In dat geval staat ix voor het klassenmidden.

x-­‐min x-­‐max xi fi1 2 1,5 12 3 2,5 23 4 3,5 34 5 4,5 45 6 5,5 36 7 6,5 2

Page 9: Statistiek i i6e2

9

In de praktijk wordt GAA niet zo heel vaak gebruikt. Het voordeel is dat het erg simpel uit te rekenen is, het nadeel is, dat we niet erg nauwkeurig een uitspraak kunnen doen over de elementen van de verzameling als we het rekenkundig gemiddelde weten en de GAA .

1.5.2 Het  Bereik  Het Bereik (eng: Range R) van een verzameling getallen is gedefinieerd als het grootste getal minus het kleinste getal. In formulevorm: minmax xxR −= . Het Bereik wordt wel gebruikt bij het monitoren van productieprocessen, zie Statistiek II (TWi-8)

1.5.3 Variantie  en  Standaardafwijking  Twee heel belangrijke begrippen in de statistiek zijn de variantie en –daarvan afgeleid- de Standaardafwijking. Bij de Variantie nemen we niet het absolute verschil tussen de gemiddelde waarde en de waarde van een element uit de verzameling, maar het kwadraat daarvan. Daar een kwadraat altijd positief of nul is, zal de som van al deze kwadraten ook een positief getal zijn. We noemen deze som de Variantie. Als we vervolgens weer de wortel uit deze som trekken dan krijgen we de standaardafwijking σ . De definitie van variantie en standaardafwijking in formulevorm wordt dan:

( )

=

=

−= n

ii

n

iii

f

xxfiantie

1

1

2*

var ( )

=

=

−=== n

ii

n

iii

f

xxfiantiekingdaardafwijs

1

1

2*

vartanσ

Hierin is : if de frequentie van ix of de frequentie van de klasse.

ix een willekeurig element uit de verzameling, of het klassenmidden van een klasse.

x het rekenkundig gemiddelde. n het aantal verschillende elementen in de verzameling of het aantal klassen in de verzameling Het is nu nog lastig om uit te leggen, wat de voordelen zijn van het gebruik van de standaardafwijking ten opzichte van het gebruik van de gemiddelde absolute afwijking. In het hoofdstuk van de normale verdeling bij de kansrekening ( Hoofdstuk 6) komen we hier op terug. Het blijkt dan dat we een uitspraak kunnen doen over het percentage van het aantal elementen dat ligt binnen het interval dat loopt van het gemiddelde minus de standaardafwijking tot het gemiddelde plus de standaardafwijking. ( Dit is ongeveer 67%) Ook zullen we bij de kansrekening te maken krijgen met de variantie. Dit is het kwadraat van de standaardafwijking. Een ander woord voor standaardafwijking is standaarddeviatie.

1.5.4 De  kwartiele  afwijking   De mediaan geeft de waarde van het middelste element. Dit zegt dus niets over de overige waarden van de elementen uit de verzameling. We bepalen nu de waarde van een element uit de verzameling, dat op een kwart van het interval ligt en de waarde van een element dat op driekwart van het interval ligt. Deze elementen noemen we achtereenvolgens het eerste kwartiel ( )1Q en het derde kwartiel ( )3Q

De kwartiele afwijking wordt vervolgens gedefinieerd door: ( )1321 QQ −

Page 10: Statistiek i i6e2

10

De formules voor het berekenen van 1Q en 3Q lijken erg veel op de berekening van de mediaan.

1

1

*141

1 QQ

sf

fNQ ∑−=

3

3

*143

3 QQ

sf

fNQ ∑−=

1.6 Gebruik  GR  

TI-83 plus Casio Invoer van een frequentietabel Kies: stat

Kies: edit zet de waarden voor Xi in bijv. L1 zet de waarden voor fi in bijv. L2

Kies: stat scherm Zet de waarden van xi in list 1 en de waarden van fi in list 2

Uitrekenen van gemiddelde en standaarddeviatie

Kies: stat Kies: calc Kies: 1-varstats Voer in: 1-varstats L1,L2

Kies: stat scherm Kies: calc (2e tabblad) Zorg dat onder SET(tabblad rechts) je 1varX op List 1 hebt staan en 1varF op List 2 Kies: 1Var

Page 11: Statistiek i i6e2

11

2 PERMUTATIES,  COMBINATIES,  VARIATIES  Bij de kansrekening is de manier waarin acties in een bepaalde volgorde kunnen voorkomen erg belangrijk. In dit hoofdstuk gaan we in op de diverse vormen van in volgorde plaatsen en de daarbij behorende formules.

2.1 Permutaties  Veronderstel we hebben een verzameling van een van te voren bekend aantal allemaal van elkaar verschillende elementen. We kunnen ons dan afvragen op hoeveel manieren we deze elementen kunnen noteren. We beginnen met 1 element. Dit is eenvoudig. We kunnen dit slechts op 1 manier doen. Bekijken we 2 elementen, dan zien we dat er 2 mogelijkheden zijn. Veronderstel dat deze elementen a, b zijn, dan kunnen we schrijven: a b en b a Bij 3 elementen wordt het iets ingewikkelder. Kijken we naar het eerste rijtje, dan kunnen we het derde element er voor zetten, er tussenin en er achter. We krijgen dan dus c a b a c b a b c Ook voor de combinatie b a hebben we 3 mogelijkheden. Bij elkaar dus 2*3=6 mogelijkheden Bij 4 elementen a b c d kunnen we d dus op 4 verschillende plaatsen neerzetten in het rijtje a b c namelijk: a b c d a b d c a d b c d a b c Dit geldt voor al de 6 mogelijkheden van een rijtje van 3. In totaal dus 6*4=24 mogelijkheden Eigenlijk 1*2*3*4 mogelijkheden Alle mogelijke rijtjes die we uit een aantal elementen kunnen vormen noemen we de permutaties van die elementen. Het aantal permutaties van bijvoorbeeld 3 elementen is 6 (=1*2*3) We kunnen dit ook schrijven als !3 . Dit spreken we uit als 3 faculteit. Als resultaat krijgen we dus:

∏=

==

==

==

==

==

=

n

i

nin1

*........*3*2*1!

1205*4*3*2*1!5244*3*2*1!4

63*2*1!322*1!2

1!1

Uit allerlei praktische overwegingen en om formules op het gebied van statistiek meer algemeen te maken is besloten om 0! te definiëren als 1. Realiseer je wel dat !n zeer snel groeit. Dat betekent dat op een gewone rekenmachine het maximum meestal 69! is, omdat het grootste getal, dat de rekenmachine aankan 10010 is. Grafische rekenmachines kunnen meestal iets grotere getallen aan, maar bij ongeveer 150! Houdt het meestal op.

2.2 Variaties  In de vorige paragraaf waren alle elementen verschillend. De vraag is nu wat er verandert als een aantal elementen dezelfde waarde hebben. Bekijk bijvoorbeeld de letters van het woord KAAL. Als de 4 letters verschillend geweest zouden zijn, dan hadden we 4!=24 mogelijkheden gehad. Schrijven we nu alle mogelijkheden op dan krijgen we: AAKL AKAL AKLA KAAL KALA KLAA AALK ALAK ALKA LAAK LAKA LKAA

Page 12: Statistiek i i6e2

12

Dit zijn slechts 12 mogelijkheden. We kunnen dit als volgt verklaren: In dit woord komt 2 keer de letter A voor. Tussen deze 2 A’s kunnen we geen verschil zien. Wanneer we de beide A’s zouden vervangen door 1A en 2A dan krijgen we wel 24 mogelijkheden Bijvoorbeeld: KALA 21 en KALA 12 . Zonder de indices staat hier twee keer dezelfde combinatie. Voor elke mogelijkheid verliezen we dus de helft. Elke voorkomende vorm noemen we een variatie. Het aantal variaties dat we kunnen maken van een verzameling met n elementen, waarvan er m hetzelfde

zijn is dus: !!mn

.

Komen meerdere elementen in een hogere frequentie voor, deel je steeds door het aantal faculteit. Bekijk bijvoorbeeld het woordje ANANAS. Hierin zitten 3 A’s en 2 N’s

Het aantal variaties wordt dan: 602*6

720!2!*3!6

== In dit geval is 6 het totale aantal letters in het woord.

2.3 Combinaties  In het speciale geval, waarin een verzameling bestaat uit 2 verschillende elementen, die elk een paar keer voorkomen, dan spreken we over combinaties. Bijvoorbeeld: We gooien een munt 10 keer op. De mogelijke uitkomsten zijn K(ruis) of M(unt) Een mogelijke uitkomst is 6*K en 4*M. In een volgend hoofdstuk zullen we een formule gaan bedenken over de kans dat deze situatie zich voordoet. Nu bepalen we eerst op hoeveel manieren we 6*K en 4*M kunnen krijgen. In dit geval zal dit zijn: (zie ook de vorige paragraaf):

2104*3*2*110*9*8*7

4*3*2*1!*610*9*8*7!*6

!4!*6!10

===

Dit resultaat had je ook kunnen krijgen, door alle mogelijkheden op te schrijven en dan te tellen hoeveel er zijn. Het is niet aan te raden om dit te doen, omdat 210 erg veel is, en er een grote kans bestaat dat je één vergeet of dubbel telt. Het speciale geval van de combinatie komt zo vaak voor, dat we er een eigen notatie voor bedacht hebben. In boven beschreven situatie zullen we schrijven:

Het aantal is: !4!*6!10

610

=⎟⎟⎠

⎞⎜⎜⎝

⎛ ; We spreken dit uit als 10 over 6.

In het algemeen schrijven we: ( )!!*!nmn

mnm

−=⎟⎟

⎞⎜⎜⎝

2.4 Gebruik  GR  berekening TI-83 plus Casio 7! Toets in: 7

Kies: MATH Kies: PRB Kies 4: ! ENTER

Toets in: 7 Kies: OPTN Kies: Prob Kies: x!

⎟⎟⎠

⎞⎜⎜⎝

610

Toets in: 10 Kies: MATH Kies: PRB Kies 3: NCR Toets in: 6 ENTER

Toets in 10 Kies: OPTN Kies: Prob Kies: nCr

Page 13: Statistiek i i6e2

13

3 ELEMENTAIRE  KANSREKENING   In dit hoofdstuk gaan we in op het begrip kansrekening. Allereerst geven we een definitie van het begrip kansrekening en daarna zullen we enkele regels uit de elementaire kansrekening beschouwen. In hoofdstuk 4 pakken we de kansrekening enigszins formeler aan. In de daarop volgende hoofdstukken komen een paar specifieke kansverdelingen aan de orde. In het laatste hoofdstuk komt het toetsen van uitspraken aan de orde.

3.1 Het  begrip  kans   Voor het begrip kans zijn meer dan een definitie in omloop, afhankelijk van de benadering van de kanstheorie. De eerste definitie is gebaseerd op practische kansrekening: we voeren hierbij een experiment een heel groot aantal malen uit en turven het aantal keer dat een gewenste uitkomst optreedt. Tenslotte delen we die twee getallen op elkaar om de kans op die gewenste uitkomst af te leiden. Bijvoorbeeld: Bij een eerlijke munt is de kans dat kop boven komt naar verwachting even groot als de kans dat munt boven komt. Als dit zo is, dan komt in 50% van alle keren dat we een eerlijke munt opgooien kop boven en in 50% van de gevallen munt. Als we dit bijvoorbeeld 50 keer doen, zullen we constateren dat we meestal niet exact 25 keer kop en 25 keer munt gooien, maar hoe vaker we de munt opgooien, des te dichter de percentages naar 50% kruipen. Dit laatste verschijnsel noemt de wet van de grote getallen. We concluderen hieruit dat de kans op “kop” inderdaad 0,5 is. Een tweede , meer theoretische, mogelijkheid om de kans op een bepaalde uitkomst te berekenen, is door het aantal verschillende mogelijkheden, dat tot die bepaalde uitkomst leidt te delen op alle mogelijkhede uitkomsten. We geven weer een voorbeeld: Gooi met twee eerlijke dobbelstenen. Probeer uit te rekenen wat de kans is op bij elkaar 4 ogen. Het aantal goede mogelijkheden is 3, namelijk de eerste dobbelsteen is 1 en de tweede dobbelsteen is 3, beide dobbelstenen geven de waarde 2 of de eerste dobbelsteen is 3 en de tweede is 1. In het totaal zijn er 6*6=36 verschillende mogelijkheden.

Dit betekent dat de kans op 4 ogen met 2 dobbelstenen is gelijk aan: 083,0121

363)4( ===P

Ook wordt wel geschreven: %3,8)4( =P

3.2 Som-­‐  en  productregels  In de vorige paragraaf hebben we een voorbeeld van een kansberekening gezien, waarin we een enkelvoudige eis stelden aan een bepaalde situatie. Er waren twee dobbelstenen, en de enkelvoudige eis was 4 ogen. Op het moment, dat we de eis iets ingewikkelder maken, wordt de berekening ook gelijk ingewikkelder. Veronderstel dat de eis was: of 4 ogen, of 6 ogen. In deze situatie kijken we hoeveel goede mogelijkheden er zijn om achtereenvolgens 4 of 6 ogen te krijgen. Voor 4 ogen weten we dit al, 3 mogelijkheden, namelijk 1,3 2,2 3,1. Voor 6 ogen zijn dar er 5 namelijk, 1,5 2,4 3,3 4,2 5,1. In het totaal zijn er dus 8 mogelijkheden. De kans wordt dan

2222,092

368)64( ===ofP

Page 14: Statistiek i i6e2

14

In feite is de kans op 4 ogen of 6 ogen gelijk aan de kans op 4 ogen plus de kans op 6 ogen. Het lijkt er dus op, dat we bij een of situatie de kansen gewoon kunnen optellen. Dit is echter niet helemaal juist. Bekijk het volgende voorbeeld: Gegeven is een spel kaarten met 52 kaarten (13 maal ruiten, 13 maal schoppen, 13 maal klaveren en 13 maal harten) Iemand trekt willekeurig een kaart uit dit spel. Wat is de kans, dat deze kaart een aas of een klaveren kaart is? Als we de goede mogelijkheden tellen, krijgen we klaver aas, klaver heer, klaver vrouw, klaver boer, klaver tien, klaver negen, klaver acht, klaver zeven, klaver zes, klaver vijf, klaver vier, klaver drie, klaver 2, ruiten aas, schoppen aas en harten aas. Als we dit goed tellen komen we uit op 16 mogelijkheden. Dit betekent, dat de kans op een klaver of een aas is gelijk aan: 52

16)( =aasofklaverP

Er zijn 13 klaverkaarten in het spel en 4 azen. Dit betekent 5213)( =klaverP en 52

4)( =aasP

Als we deze twee kansen optellen krijgen we 5217 . In dit geval kunnen we de kansen niet optellen.

Dit wordt veroorzaakt, door het feit, dat klaver aas, zowel meetelt bij de klaveren, als bij de azen. Deze kaart tellen we dubbel, terwijl deze in werkelijkheid slechts een maal voorkomt. In dit geval is de doorsnede van de verzameling van de klaveren met de verzameling van de azen niet leeg. In het geval van de twee dobbelstenen met 4 ogen of 6 ogen is deze doorsnede wel leeg. We krijgen de volgende regel (optelregel);

)()()( BPAPBAP +=∪ mits =∩ BA Ø en anders : )()()()( BAPBPAPBAP ∩−+=∪

Veranderen we de eis enigszins, en vragen we nu de kans op klaver aas, dan vragen we eigenlijk naar de kans op klaver en aas. We weten al, dat er maar één kaart in het spel is, dat aan deze eis voldoet. We krijgen dus: 52

1)( =klaveraasP . We weten ook: 41

5213)( ==klaverP en 13

1524)( ==aasP .

Vermenigvuldigen we deze twee laatste kansen met elkaar, dan krijgen we het resultaat van de eerste immers 52

1131

41 * =

We krijgen de volgende regel (vermenigvuldigregel): )(*)()( BPAPBAP =∩ Deze regel geldt zolang de beide kansen onafhankelijk van elkaar zijn, dat wil zeggen, dat de kans op het trekken van een aas niet beïnvloed wordt door de kans op het trekken van een klaveren kaart.

3.3 Voorwaardelijke  kans   Tot nu toe hebben we steeds naar kansen gekeken, die over de gehele verzameling gaan. Soms is het echter zo, dat we al informatie hebben over een deel van de verzameling, zodat de berekening van de kans verandert. Een voorbeeld: We gooien een dobbelsteen en zijn geïnteresseerd in de uitkomst 6. Zonder verdere informatie, kunnen we er vanuit gaan, dat 6

1)6( ==xP , omdat er 6 verschillende mogelijke uitkomsten zijn met elk een gelijke kans op voorkomen. Als we echter als informatie meegeven, dat op voorhand al vaststaat, dat de uitkomst even is (bijvoorbeeld, omdat er steeds twee zijvlakken zijn met 2 ogen, 4 ogen en 6 ogen. Er geldt nu 3

1)6( ==xP Er zijn nu immers nog maar 3 verschillende mogelijke uitkomsten met gelijke kans op voorkomen. Voor dit soort kansen gebruiken we een speciale notatie: )6( evenxP = . Dit betekent: de kans dat de uitkomst van de worp met een dobbelsteen gelijk is aan 6 onder voorwaarde dat al bekend is, dat de uitkomst even zal zijn.

Page 15: Statistiek i i6e2

15

In formule kunnen we zeggen: )()()(

APBAPABP ∩

=

Hieruit kunnen we concluderen: ( )BPBAPBAP *)()( =∩

Indien A en B onafhankelijk van elkaar zijn, dan geldt: ( ) ( )APBAP =

De te trekken conclusie is dan: ( ) ( ) ( )BPAPBAP *=∩ Deze regel zijn we in een vorige paragraaf al tegengekomen als algemene productregel.

3.4 Kansen  bij  trekkingen  met  en  zonder  teruglegging   Neem een bak met in totaal 50 knikkers. 10 knikkers zijn wit, 15 knikkers zijn zwart en 25 knikkers zijn rood. We kunnen ons nu bijvoorbeeld afvragen, wat de kans is, dat we als we twee knikkers uit deze bak pakken, dat de twee knikkers allebei rood zijn. Daarbij is het van belang om af te srpeken hoe we te werk gaan. Allereerst gaan we er van uit, dat het pakken uit de bak gebeurt op een volstrekt willekeurige manier. Je kunt niet in de bak kijken. Het is niet mogelijk om het verschil tussen de diverse knikkers te voelen. Verder is het van belang, dat we afspreken hoe we de knikkers uit de bak pakken: in principe zijn er twee mogelijkheden. trekking met teruglegging: we pakken 1 knikker, kijken welke kleur de knikker heeft en gooien de knikker weer terug in de bak. Vervolgens hutselen we de knikkers door elkaar en pakken opnieuw een knikker. trekking zonder teruglegging We pakken 1 knikker, kijken welke kleur deze heeft en laten hem naast de bak liggen. Vervolgens trekken we een nieuwe knikker uit de bak.

3.4.1 Trekking  met  teruglegging  Als eerste bekijken we het systeem met teruglegging. De kans dat de eerste keer een rode knikker getrokken wordt is 2

15025)( ==roodP

Aangezien de getrokken knikker weer teruggegooid wordt in de bak en de inhoud van de bak flink door elkaar geschud wordt, is de situatie voor het trekken van de tweede knikker volkomen identiek aan de sitatie bij het trekken van de eerste knikker. De kans is dus wederom 2

15025)( ==roodP

De kans op het trekken van twee rode knikkers wordt dan: 41

21

21 *)*2( ==roodP

Bij de tweede situatie (het trekken zonder teruglegging), is het iets ingewikkelder. Voor het trekken van de eerste knikker maakt het niets uit. 2

15025)( ==roodP

Bij de tweede knikker is de situatie veranderd. In de bak zitten nu slechts 49 knikkers, waarvan er 10 wit, 15 zwart en 24 rood zijn. We zijn op zoek naar de kans op het trekken van 2 rode knikkers. Wil de actie succesvol zijn, dan moeten we er vanuit gaan, dat de eerste trekking een rode bal opgeleverd heeft. Dit is dus een voorbeeld van een voorwaardelijke kans uit de vorige paragraaf. De kans dat de tweede knikker rood is wordt: 49

24)( =roodP

In deze situatie wordt de kans op twee rode knikkers: 4912

4924

21 *)*2( ==roodP

Stel nu dat we niet de kans op twee rode knikkers hadden willen uitrekenen, maar de kans op een witte knikker en een zwarte knikker.

Page 16: Statistiek i i6e2

16

De volgorde waarin we de knikkers trekken is kennelijk niet van belang, want er is geen eis gesteld aan de volgorde. Zowel eerst een witte knikker en dan zwarte knikker is goed, als eerst een zwarte knikker en dan een witte. In de situatie waarin we de getrokken knikker weer terug leggen, zijn beide kansen gelijk. Immers, de kans op eerst een witte knikker en daarna een zwarte knikker is: 50

32500150

5015

5010 *)( ===wzP

De kans op eerst een zwarte en daarna een witte knikker is: 503

2500150

5010

5015 *)( ===zwP

De kans op een witte en een zwarte knikker in willekeurige volgorde is:

253

503

503)()()11( =+=+= zwPwzPzwartenwitP

Veronderstel, dat we het probleem nog wat groter maken, door te vragen naar de kans op 3 witte en 5 zwarte knikkers. Zouden we de knikkers na trekking weer teruggegooid hebben in de bak, dan moet er ook vermenigvuldigd worden met het aantal mogelijkheden, waarop we 3 witte en 5 zwarte knikkers kunnen ordenen, alleen de kans per trekking van 8 knikkers veranderd. Deze kans wordt: 000019,0*)( 5

50153

5010 ==wwwzzzzzP

Als de volgorde er niet toe doet, dan krijgen we 00109,0)(*38

)*5*3( =⎟⎟⎠

⎞⎜⎜⎝

⎛=+ wwwzzzzzPzwP .

Algemeen geldt voor een trekking met teruglegging: knk ppkn

kP −−⎟⎟⎠

⎞⎜⎜⎝

⎛= )1(**)( . Deze formule staat

ook wel bekend als de kansfunctie voor de Binomiaal verdeling en komt in H6 verder aan bod.

3.4.2 Trekking  zonder  teruglegging:  Hypergeometrische  trekking  We gaan weer even terug naar het probleem van trekking van 2 knikkers en de kans op 1 witte en 1 zwarte. In de situatie, waarin we de getrokken knikker niet terugleggen geldt het volgende:

493

2450150

4915

5010 *)( ===wzP

493

2450150

4910

5015 *)( ===zwP

Ook hier zien we weer, dat beide kansen gelijk zijn. In eerste instantie lijkt dit toeval, omdat de breuken, die met elkaar vermenigvuldigd worden van elkaar verschillen, maar bij nadere analyse blijkt, dat het product in de teller uit dezelfde factoren bestaat. De noemers zijn zelfs identiek. Hier zal dan ook gelden: 49

6493*2)()()11( ==+= zwPwzPzwartenwitP

De factor 2 , waarmee in beide gevallen wordt vermenigvuldigd, staat voor het aantal mogelijkheden, dat bestaat om een witte knikker en een zwarte knikker te ordenen. Veronderstel, dat we het probleem nog wat groter maken, door te vragen naar de kans op 3 witte en 5 zwarte knikkers. Veronderstel, dat we dit doen zonder teruglegging. In zo’n geval kiezen we een correcte combinatie. Bijvoorbeeld wit,wit,wit,zwart,zwart,zwart,zwart,zwart. Vervolgens vermenigvuldigen we deze kans met het aantal mogelijkheden, die we kennen om 3 witte en 5 zwarte knikkers te ordenen. In het vorige hoofdstuk hebben we gezien, dat dit aantal te verkrijgen is door

de formule 563*2*18*7*6

!5!*3!8

38

===⎟⎟⎠

⎞⎜⎜⎝

⎛=n

00067,0********38

)*5*3( 4311

4412

4513

4614

4715

488

499

5010 =⎟⎟

⎞⎜⎜⎝

⎛=zenwP

Deze methode van berekening noemen we “bottom-up”.

Page 17: Statistiek i i6e2

17

Je kunt de kans bij trekking zonder teruglegging ook “Top down” berekenen. Als je wil berekenen wat de kans is op 3 witte en 5 zwarte, dan gebruik je de volgende definitie voor kans: P(3w5z)=(aantal verschillende manieren waarop ik 3 witte en 5 zwarte kan trekken) / (totaal aantal manieren waarop ik 8 knikkers kan trekken) . Bedenk: het aantal manieren waarop ik 3 witte uit die in totaal 10 witte kan

trekken is ⎟⎟⎠

⎞⎜⎜⎝

310

; het aantal manieren waarop ik 5 zwarte uit die in totaal 15 zwarte kan trekken is ⎟⎟⎠

⎞⎜⎜⎝

515

;

en tenslotte het aantal manieren waarop ik 8 knikkers uit de bak van 50 kan trekken is ⎟⎟⎠

⎞⎜⎜⎝

850

; Dus geldt:

de kans dat ik 3 witte en 5 zwarte uit die 50 trek is dan: 00067,0

850515

*310

)5,3( =

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

⎛⎟⎟⎠

⎞⎜⎜⎝

=zwP : gelukkig,

er komt hetzelfde uit…

Page 18: Statistiek i i6e2

18

4 KANSFUNCTIES  

In het vorige hoofdstuk hebben we op een intuïtieve manier aan kansrekening gedaan. Om er iets meer structuur in aan te brengen gaan we van af nu met zogenoemde kansvariabelen en kansfuncties werken. In dit hoofdstuk wordt uitgelegd wat er onder een kansvariabele en een kansfunctie wordt verstaan en wat voor soort kansvariabelen we tegen kunnen komen

4.1 Kansvariabelen  In het vorige hoofdstuk hebben we kennisgemaakt met het begrip kans. Om goed aan kansente kunnen rekenen, moeten we werken met variabelen, die goed te kwantificeren zijn. Dus bijvoorbeeld het aantal auto’s dat een kruising passeert, of het gemiddeld aantal auto’s dat het kruispunt per uur passeert. Als we bijvoorbeeld de merken registreren, die de kruising passeren, kunnen we wel spreken over het aantal merken, dat in 1 uur de kruising passeert, of het gemiddeld aantal auto’s per merk, maar niet het gemiddelde merk. We zullen nu een kansvariabele als volgt definiëren.

• Een kansvariabele is een functie, die aan de uitkomst van een kansexperiment een reëel getal toevoegt.

Een kansvariabele noemen we officieel ook wel een stochastische variabele genoemd, of kortweg een stochast. We onderscheiden twee types kansvariabelen:

• discrete kansvariabelen • continue kansvariabelen

Bij discrete variabelen hebben we te maken met uitkomsten, die van elkaar te onderscheiden zijn. Als voorbeeld kunnen we denken aan het aantal kinderen in een gezin. (Dit zijn er altijd 0, 1, 2, 3 enz en nooit 1,5 of 1,3) of het aantal ogen dat met een dobbelsteen geworpen kan worden. Heel vaak geven we discrete kansvariabelen aan met k en de uitkomst van de kansvariabele met k Als we dus schrijven: ( )kkP = dan bedoelen we de kans, dat de uitkomst van kansvariabele k gelijk is aan k . Bij een dobbelsteen zouden we bijvoorbeeld kunnen uitrekenen: ( )3=kP . Dit is dus de kans, dat bij een dobbelsteen met 1 worp 3 ogen worden geworpen. Bij continue kansvariabelen, is er geen ruimte tussen twee opeenvolgende gebeurtenissen. Als voorbeeld van een continue kansvariabele geldt bijvoorbeeld de tijd die verstrijkt tussen twee elkaar opvolgende gebeurtenissen. In feite kan dit elk willekeurig getal zijn. Bij continue kansvariabelen hebben we ook altijd te maken met oneindig veel variabelen, terwijl dat bij discrete kansvariabelen niet perse noodzakelijk is. Bij het aantal ogen, dat je met 1 dobbelsteen kan gooien, hebben we maar te maken met 6 kansvariabelen (maximaal). Veelal geven we continue kansvariabelen aan met x

4.2 Kansfunctie  en  verdelingsfunctie  In deze paragraaf houden we ons bezig met het beschrijven van een kansvariabele. Zowel bij discrete variabelen k als bij continue variabelen x hebben we een uitkomstenverzameling, die bestaat uit reële getallen. Bij de getallen uit deze verzameling behoren kansen. Deze kansen voldoen

Page 19: Statistiek i i6e2

19

uiteraard aan de kansregels. De beschrijving van deze kansen noemen we de kansfunctie ( )kf bij een discrete kansvariabele en de kansdichtheidsfunctie ( )xf bij een continue kansvariabele.

4.2.1 kansfunctie  met  discrete  kansvariabelen  Bij een discrete variabele k kan de kansfunctie )(kf worden beschouwd als een rijtje kansen, die uit het experiment verkregen zijn. Als voorbeeld nemen we de kansfunctie bij het tegelijk werpen van twee dobbelstenen: De mogelijke uitkomsten zijn 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 We berekenen achtereenvolgens:

( ) 361

61

612)2( =∗=== kPf (Dit is de kans dat beide dobbelstenen een 1 opleveren.

( ) 181

3623)3( ==== kPf

( ) 121

3634)4( ==== kPf

( ) 91

3645)5( ==== kPf

( ) 3656)6( === kPf

( ) 61

3667)7( ==== kPf

( ) 3658)8( === kPf

( ) 91

3649)9( ==== kPf

( ) 121

36310)10( ==== kPf

( ) 181

36211)11( ==== kPf

( ) 36112)12( === kPf

Een kansfunctie moet aan twee eisen voldoen. - De functiewaarde is voor iedere k positief of 0. - De som van alle functiewaarden moet samen 1 zijn. Bij controle blijkt dat deze lijst met functiewaarden aan beide eisen voldoet.

4.2.2 Kansdichtheidsfunctie  met  continue  kansvariabelen.      Bij continue kansvariabele kunnen we niet langer de functiewaarde in een bepaald punt geven. Hier zal per definitie immers altijd 0 uitkomen. Wel kunnen we de kansfunctie geven voor een bepaald interval. Als je bijvoorbeeld een groot aantal zakken met aardappels hebben, waarvan we weten, dat het gewicht per zak kan variëren en het gemiddelde gewicht 20 kg is, dan kunnen we wel aangeven wat de kans is dat het gewicht van een willekeurige zak ligt tussen 19,81 en 19,83. Voor deze kans zal gelden:

( ) ∫=<<83,19

81,19

)(83,1981,19 dxxfxP

Voor )(xf moet dan weer wel gelden: - 0)( ≥xf voor elke x

- ∫∞

∞−

= 1)( dxxf

Page 20: Statistiek i i6e2

20

4.2.3 Kansverdelingsfunctie  Een begrip dat direct in verband te brengen is met de kansfunctie, is de verdelingsfunctie )(kF . Onder bepaalde omstandigheden kan het nuttig zijn om te rekenen met cumulatieve kansen. We bekijken dan niet de kansen )(kf van diverse losse punten, maar we werken met ( )kkPkF ≤=)( . De functie )(kF geeft de kans aan dat de variabele k een waarde aanneemt kleiner of gelijk aan een bepaalde grenswaarde k . Voor )(kF gelden de volgende eigenschappen: - )(kF is niet dalend - 0)( =kF voor )min(kk <

- 1)( =kF voor )max kk >

- ∑ ==k

kkkPkF

)min()()(

Indien )(xf een continue verdeling is, geldt voor de laatste bewering:

- ∫∞−

=x

dxxfxF )()(

4.3 Verwachtingswaarde  en  variantie    Zoals we in hoofdstuk 1 gezien hebben, kunnen we van een verzameling de gemiddelde waarde uitrekenen. De betekenis van het gemiddelde was, dat als we elk element uit de verzameling zouden vervangen door de gemiddelde waarde, de uitkomst van de som van alle elementen gelijk zou zijn aan het aantal elementen maal de gemiddelde waarde. Als we nu de kans op een bepaalde gebeurtenis opvatten als een gestandaardiseerde frequentie, waarmee deze gebeurtenis optreedt, kunnen we ook hiervan de gemiddelde waarde berekenen. Deze gemiddelde waarde geven we in de kansrekening aan met de verwachting of de verwachtingswaarde. Deze wordt meestal aangegeven met ( )kE of µ Indien we met een discrete kansverdeling te maken hebben geldt:

E =( )

( )∑

∑=

=

=

kalle

kalle

kkP

kkPk *µ

Omdat we in het begin van dit hoofdstuk al geconcludeerd hebben, dat ( ) 1==∑kalle

kkP kunnen we dit

ook schrijven als: E = ( )∑ ==kalle

kkPk *µ

Voorbeeld: Bereken de verwachting van het gooien met een dobbelsteen. In feite wordt hier dus gevraagd naar de gemiddelde uitkomst bij het gooien van een dobbelsteen. We gaan ervan uit dat de kans op 1, 2, 3, 4, 5 of 6 even groot is. In dit geval betekent dit: ( ) ( ) ( ) ( ) ( ) ( ) 6

1654321 =========== xPxPxPxPxPxP

We krijgen: 21

621

61

61

61

61

61

61 36*5*4*3*2*1* ==+++++=µ

Page 21: Statistiek i i6e2

21

Bij een continue kansverdeling wordt het sommatieteken vervangen door een integraalteken. We krijgen

dan: ( )

( )∫

∫∞

∞−

∞−=

dxxP

dxxxPµ Hier geldt ook weer: ( )∫

∞−

= 1dxxP

De formule wordt dan: ( )∫∞

∞−

= dxxxPµ

Bij het bepalen van het gemiddelde hebben we ook gekeken of we iets kunnen zeggen over een maat om te kunnen constateren hoeveel een willekeurige uitkomst afwijkt van het gemiddelde. Een standaardmaat was daar de standaardafwijking. Ook bij de kansrekening gebruiken we de standaardafwijking σ . Ook komt vaak het begrip variantie voor. ( ) 2σ=xVar . Voor de formule van de standaardafwijking gebruiken we een formule, die analoog is aan de formule in de statistiek. Voor een discrete verdeling krijgen we voor de variantie: ( ) ( ) ( )22 * µσ −=== ∑ kkkPkVar

kalle

en voor de standaardafwijking: ( ) ( )∑ −==kalle

kkkP 2* µσ

Voor de continue verdeling geldt: ( )( ) ( )

( )∫

∫∞

∞−

∞−

=

dxxP

dxxxPxVar

2* µ en ( ) ( ) dxxxP

2

*∫∞

∞−

−= µσ

4.4  Rekenregels  In de praktijk komt het vaak voor, dat een bepaalde kansvariabele wordt omgebouwd naar een andere kansvariabele: stel dat bij een bepaald bedrijf gegeven is, dat het gemiddelde bruto maandsalaris gelijk is aan € 2000,- Door een salarismaatregel krijgt iedere werknemer 5% meer salaris. Wat zal nu het gemiddelde bruto maandsalaris worden? Veronderstel, dat de diverse salarissen weergegeven worden door ix en de frequentie, waarin deze

salarissen voorkomen gelijk is aan if . In dit geval geldt dat het gemiddelde ∑

∑=

iallei

ialleii

f

xfx .

De nieuwe salarissen worden allemaal 5% hoger. Dat wil zeggen ix*05.1 . Voor het gemiddelde zal dan

gelden: xf

fx

f

fxx

iallei

ialleii

iallei

ialleii

nieuw *05,1*

*05,1**05,1

===∑

In het algemeen zal gelden, dat als we elk element uit een verzameling met α vermenigvuldigen, wordt ook het gemiddelde met α wordt vermenigvuldigd.

Page 22: Statistiek i i6e2

22

Kijken we nu naar de variantie, dan geldt: ( )( )

∑ −

=

iallei

ialleii

f

fxxxVar

*2

.

De formule voor de variantie na vermenigvuldiging met α wordt dan:

( )( ) ( )

( )xVarf

fxx

f

fxxxVar

iallei

ialleii

iallei

iialle

i2

222*****

α

ααα

α =

=

=∗∑

We krijgen dus als regel: Als we elk element uit een verzameling met α vermenigvuldigen, wordt de variantie met 2α vermenigvuldigd. Voor de standaardafwijking geldt dat dit de wortel uit de variantie is. In dit geval betekent dit dat de standaardafwijking met α vermenigvuldigd wordt. Het maakt dus niet uit of α positief of negatief is. In beide gevallen neemt de standaardafwijking met een factor α toe. Op dezelfde manier kunnen we aantonen, dat als we bij ieder element uit de verzameling een getal α optellen, dan zal ook het gemiddelde met α toenemen. Als we nu echter naar de variantie kijken, zullen we zien, dat het verschil tussen het nieuwe gemiddelde en de nieuwe elementen niet verandert, immers beide nemen met dezelfde waarde toe. Er zal dus gelden: ( ) ( )xVarxVar =+α Voor de standaardafwijking geldt hetzelfde. Deze zal dus ook niet veranderen, als bij elk element uit de verzameling een zelfde getal wordt opgeteld. Op vrijwel identieke manier kunnen we afleiden, dat als we twee verschillende verzamelingen hebben, de ene met een verwachtingswaarde 1µ en de andere met een verwachtingswaarde 2µ , dat de totale verwachtingswaarde wordt 21 µµ + . Voor de variantie geldt dan: ( ) ( ) ( )yxVaryVarxVar +=+ Overigens geldt ook: ( ) ( ) ( )yVarxVaryxVar +=− We geven tot slot nog een samenvatting van bovenstaande regels: ( ) ( )kEkE αα = ( ) ( )kVarkVar 2αα = kk σασα =

( ) ( ) αα +=+ kEkE ( ) ( )kVarkVar =+α

( ) ( ) ( )2121 kEkEkkE +=+ ( ) ( ) ( )2121 kVarkVarkkVar +=+ 222121 kkkk σσσ +=+

( ) ( ) ( )2121 kEkEkkE −=− ( ) ( ) ( )2121 kVarkVarkkVar +=− 222121 kkkk σσσ +=−

NB: Tel NOOIT de sigma’s bij elkaar op, de varianties mogen WEL bij elkaar worden opgeteld!!!

Page 23: Statistiek i i6e2

23

5 DE  NORMALE  VERDELING  In het vorige hoofdstuk is de kansdichtheidsfunctie en de kansfunctie besproken. In de hoofdstukken 5, 6 en 7 komen de drie belangrijkste kans(dichtheids)functies aan bos In dit hoofdstuk wordt een continue kansfunctie besproken, namelijk de normale verdeling. In de twee volgende hoofdstukken worden twee discrete kansfuncties besproken: de binomiale verdeling en de Poissonverdeling.

5.1 Introductie  Normale  Verdeling  Als ik een inventarisatie zou maken van het gewicht van alle -mannelijke- eerstejaars studenten in Nederland en ik zou deze gewichten uitzetten in een frequentietabel en ik zou de aantallen met elkaar verbinden door een vloeiende lijn dan zou ik een figuur krijgen die er uitziet als in onderstaande figuur:

Maar het bijzondere is dat we een dergelijke “klok-vorm” ook tegenkomen als we de lengte van studenten, of de gewichten van appels uit een bepaalde boomgaard, of de lengte van voeten van een bepaalde leeftijdscategorie inventariseren en grafisch uitzetten. Overal om ons heen duikt een dergelijke frequentiegrafiek op en hieraan dankt deze verdeling dan ook zijn naam Normale Verdeling of Normaalverdeling. Blijkbaar zit achter iedere Normale verdeling eenzelfde kansdichtheidsverdeling verscholen, maar daarovcer meer in de volgende paragraaf. Eerst noemen we nog even de drie aspecten op waardoor elke Normaalverdeling wordt gekenmerkt:

• de symmetrische klokvorm, en dat is wat het een Normaalverdeling maakt, • de ligging van het midden, de waarde ook die de hoogste kans heeft. We duiden die aan met

verwachtingswaarde E of µ, • de halve breedte op halve hoogte, die we aanduiden met standaarddeviatie σ.

Een willekeurige Normaalverdeling wordt aangeduid als N(µ, var) of ook wel N(µ, σ2).

5.2 de  Standaardnormaal  verdeling  Als we nu een willekeurige Normaalverdeling bezien, bijvoorbeeld die van de gewichten, en we trekken van alle gemeten gewichtswaarden het gemiddelde gewicht (µ) af, dan krijgen we een verdeling die rond de 0 slingert. Als we verder de x-as herschalen door de x-waarden te delen door de waarde van σ, dan

σ

µ

Page 24: Statistiek i i6e2

24

blijken we een kansdichtheidsfunctie te krijgen die bij een waarde van ± 4 is uitgedoofd (0 is geworden). En als we dit proces bij alle andere normaalverdelingen herhalen, blijken alle normaalverdelingen na deze transformatie over elkaar heen te vallen, mits we ze ook nog even allemaal in verticale richting normeren.

Alle willekeurige normaalverdelingen zijn dus via de transformatie σµ−

=xz te reduceren tot een en

dezelfde kansdichtheidsfunctie: de Standaard Normaal verdeling, een Normaalverdeling met µ=0 en σ=1.

Deze functie wordt beschreven door de formule: 2

21

21)( zezf −

en ziet er als in onderstaande figuur:

-­‐

0.05  

0.10  

0.15  

0.20  

0.25  

0.30  

0.35  

0.40  

0.45  

-­‐4 -­‐3 -­‐2 -­‐1 0 1 2 3 4

5.3 wiskunde  van  de  Normaalverdeling  De formule van de normale verdeling wordt gegeven door:

2

21

21)(

⎟⎠

⎞⎜⎝

⎛ −−

= σµ

πσ

x

exf ; Hierin is σ de standaardafwijking en µ het gemiddelde.

Om aan te tonen, dat )(xf een echte kansverdelingis, moeten we aantonen, dat 0)( >xf voor alle x . Dit is eenvoudig want een exponentiele functie is altijd overal positief.

Verder moet gelden: 1)( =∫∞

∞−

dxxf . Dit is een stuk lastiger om te bewijzen. We zullen het bewijs hier

achterwege laten. Om nu uit te rekenen wat de kans is dat x tussen x1 en x2 ligt, kunnen we de volgende integraal opschrijven:

dxedxxfxxxPx

x

xx

x∫∫

⎟⎠

⎞⎜⎝

⎛ −−

==<<2

1

2

1

2

21

21)()21( σ

µ

πσ

maar gelukkig hebben we de GR of desnoods tabellen om deze integraal uit te rekenen.

Page 25: Statistiek i i6e2

25

5.4 Kansrekening  met  een  normaalverdeling  

5.4.1 De  normale  verdeling  berekenen  met  de  GR  Vb1. De GR heeft de beschikking over een aantakl voorgeprogrammeerde kans(dichtheids)functies. Stel je hebt een verdeling met een gemiddelde van 273 en een standaarddeviatie van 35 en je wil uitrekenen wat in deze verdeling de kans is op producten tussen de 270 en 280. Vb2. Stel dat je wil weten beneden welke grens er nog maar 5% van de producten is

berekening TI-83 plus Casio Vb1: P(270<x<280)

Kies: [second] VARS (=DISTR) Kies: 2: NORMALCDF Voer in: NORMALCDF( og, bg, µ, σ) NORMALCDF(270,280,273,35)=0,1134

Kies: Stat scherm Kies: DIST (5e tabblad) Kies: NORM (1e tabblad) Kies: Ncd Voer in: lower: 270 upper: 280 σ: 35 µ: 273

Vb2: P(x<?)=0.05

Kies: [second] VARS (=DISTR) Kies: 3: INVNORM Voer in: INVNORM( p, µ, σ) INVNORM( 0.05,273,35)=215.43

Kies: Stat scherm Kies: DIST (5e tabblad) Kies: NORM (1e tabblad) Kies: InvN Voer in: area: 0.05 σ: 35 µ: 273

5.4.2 De  tabel  van  de  normale  verdeling.  Toen er nog geen rekenmachines waren met voorgeprogrammeerde kansfuncties, zoals de GR van vandaag, werd kansberekening gedaan aan de hand van tabellen. Voor de volledigheid leggen we dat maar even hier uit, de tabellen zijn voor de volledigheid als Annex bijgevoegd. Zoals we in de vorige paragraaf zagen, stuiten we bij de normale verdeling op een bepaalde interaal, die lastig is uit te rekenen. Gebleken is, dat deze integraal wel uit te rekenen is langs numerieke weg. De uitkomst van deze integraal kunnen we dan via een tabel weergeven. Het probleem hierbij is echter dat we te maken hebben met steeds andere waarden voor het gemiddelde en de standaardafwijking. Als we echter in de formule van de integraal de x vervangen door een variabele z , die gedefiniëerd wordt

doorσµ−

=xz , dan blijkt dat we alle problemen terug kunnen brengen naar een gestandaardiseerde

integraal. De uitkomsten van deze integraal kunnen we in een tabel weergeven, die slechts 1 bladzijde in beslag neemt. (Zie Appendix A, op blz. 25 ). Als we naar de grafiek van de normale verdeling kijken, zien we, dat deze symmetrisch is ten opzichte van de gemiddelde waarde. Dit betekent, dat we in een tabel alleen maar de waarde hoeven op te geven voor de waarden groter dan de gemiddelde waarde. Voor de variabele z hoeven we dus alleen maar een tabel te maken voorzover deze waarde groter is dan of gelijk aan 0. Verder blijkt uit de tabel, dat de overschrijdingswaarde van de kans bij 0,4>z zeer dicht bij 0 ligt. We hebben een tabel nodig waarin z loopt van 0 tot 4,0. In Appendix A vindt je een tabel, waarin z loopt van 0 tot 3,99. In de eerste kolom vindt je de waarde van z in 1 decimaal. In de rest van de kolommen staat de kans, die gegeven wordt door ( )zxP <<0 , waarin z de waarde is, die in de eerste kolom staat, gevolgd door een tweede decimaal, die boven al de overige kolommen staat. Dus als 23,1=z , dan kijken we in een rij, waarin in de eerste kolom staat 1,2 en kijken vervolgens naar de waarde in dezelfde rij, maar dan in de kolom waar helemaal bovenaan staat 3. De waarde, die we aflezen is de kans, dat de uitkomst van z ligt tussen 0 en 1,23. We geven een voorbeeld. In een koelhuis staan een groot aantal kisten gevuld met appels. Het gemiddelde gewicht van een kist met appels is 20 kg met een standaardafwijking van 0,2 kg. Gevraagd wordt om de kans te bepalen, dat een willekeurige kist, die we uit het koelhuis pakken een gewicht heeft van meer dan 20,3 kg.

Page 26: Statistiek i i6e2

26

Eerst gaan we z berekenen. In dit voorbeeld is de grenswaarde x gelijk aan 20,3 kg. µ is het gemiddelde, in dit geval 20 kg en σ is de standaardafwijking, hier is σ gelijk aan 0,2 kg.

5,12,0203,20

=−

=−

=σµxz

In de tabel van de normale verdeling zoeken we in de linker kolom de waarde 1,5. In de kolom ernaast, vinden we op dezelfde regel de waarde voor 0< z < 1,50. Deze waarde is: 0,4332. De kans, dat 50,1>z is in dit geval: 0668,04332,05000,0 =− Veronderstel, dat we de kans willen bepalen om een kist appels te pakken, die een gewicht heeft tussen 19,9 en 20,2 kg, dan moeten we het volgende berekenen.

Allereerst berekenen we de waarde van z . Voor 9,19=x krijgen we: 5,02,0209,19

−=−

=z

Voor 2,20=x krijgen we: 12,0202,20

=−

=z

We moeten dus bepalen, wat de kans is dat 15,0 <<− z Hiertoe verdelen we het interval in twee stukken, namelijk 05,0 <<− z en 10 << z Voor het tweede gedeelte kunnen we de kans rechtstreeks uit de tabel aflezen. We vinden: ( ) 3413,010 =<< zP . De tabel voorziet echter niet in negatieve waarden van z . We hebben echter al eerder opgemerkt, dat de grafiek van de normale verdeling symmetrisch is. Dit betekent dat ( ) ( )5,0005,0 <<=<<− zPzP . De kans in het rechterlid van de vergelijking kunnen we weer rechtstreeks uit de tabel van de normale verdeling aflezen. Deze kans is 1915,0

Hieruit volgt, dat ( ) ( ) ( ) =+=<<+<<−=<<− 1915,03413,01005,015,0 zPzPzP

5328,0

5.5 Betrouwbaarheidsintervallen  Bij Normaalverdelingen is het handig gebruik te maken van zgn. betrouwbaarheidsintervallen, oftewel intervallen waarbinnen een bepaald percentage van de verzameling voorkomende waarden zich bevindt. Zo ligt 95% van alle waarden van een Normaalverdeling N(µ, σ2) tussen µ-1,96*σ en µ+1,96*σ. We spreken dan ook wel van een 95% betrouwbaarheidsinterval: µ-1,96*σ < x < µ+1,96*σ. Je kan het ook zo begrijpen: de uitspraak “alle waarden liggen tussen µ-1,96*σ en µ+1,96*σ” is slechts in 95% van alle gevallen waar en is dus voor 95% betrouwbaar. Dat getal 1,96 vinden we als volgt: als ik met mn GR ( mbv de inversenormaal functie) voor de Standaardnormaalfunctie wil berekenen beneden welke z-waarde ik nog maar 2,5% kans vind, dan krijg ik z= -1,96 als uitkomst. En als ik wil weten boven welke z waarde nog maar 2,5% kans ligt, dan vindt ik

z= +1,96. Pakken we vervolgens de transformatie formule σµ−

=xz en vullen we voor z in ± 1,96 dan

krijgen we σµ−

=±x96,1 oftewel: µσ −=∗± x96,1 en dus vinden we: x=∗± σµ 96,1

De meeste betrouwbaarheidsintervallen zijn: 90%: µ-1, 456*σ < x < µ+1,645*σ 95%: µ-1,960*σ < x < µ+1,960*σ 99%: µ-2,575*σ < x < µ+2,575*σ

Page 27: Statistiek i i6e2

27

5.6 combinaties  van  normale  verdelingen  Een belangrijke stelling in de statistiek van Normaalverdelingen is de volgende: Elke willekeurige combinatie van Normaalverdeelde variabelen is zelf ook weer Normaalverdeeld. Deze stelling maakt het o.a. mogelijk om een kansberekening te doen voor bijvoorbeeld het gewicht van een aantal passagiers samen, als ik de verdeling van het gewicht van de individuele passagier weet. Maar vele andere nuttige toepassingen bestaan hiervan. We noemen enkele voorbeelden. voorbeeld 1: het gewicht van 4 passagiers samen Stel dat we weten dat de lichaamsgewichten x van volwassen passagiers Normaal verdeeld zijn, met µ = 75 kg en σ = 12. We schrijven dan: )12;75()144;75( 2NofxNx ∈∈ Bereken nu de kans dat 4 passagiers samen meer weken dan 250 kg. We hebben nu niet variabele x, waar het om gaat, maar we hebben een nieuwe variabele

)144;75(;4321 Nxnwaarbijxxxx ∈+++ . Om te kunnen rekenen moeten we eerst van deze nieuwe variabele de verwachtingswaarde en de variantie uitrekenen. Mbv de rekenregels uit het vorige hoofdstuk vinden we: 300)4()3()2()1()4321( =+++=+++ xExExExExxxxE en:

576)4var()3var()2var()1var()4321var( =+++=+++ xxxxxxxx en dus:

24576)4321( ==+++ xxxxsigma Nu kunnen we berekenen met de GR: P(x1+x2+c3+x4>250)=normalcdf(250, 10000, 300, 24)=..... Voorbeeld 2: het Passingsprobleem We bekijken het volgende probleem: Op een bouwplaats staan 2 kisten, waarvan de ene gevuld is met moeren, waarvan de opening een wijdte heeft van 11 mm met een standaardafwijking van 0,5 mm. In de andere kist zitten bouten, met een steeldikte van 10,9 mm en een standaardafwijking van 0,3 mm. Een werknemer pakt uit de beide kisten een bout en een moer. Wat is de kans, dat deze bout en moer passend zijn? (Hierbij veronderstellen we dat een bout en een moer passend zijn, als de steeldikte van de bout 0,1mm of minder kleiner is dan de wijdte van de opening van de moer. ) Dit probleem lijkt op het eerste gezicht een lastig probleem, omdat het lijkt, dat deze kans erg afhankelijk is van de bout of de moer, die we als eerste pakken. Als we dit probleem echter iets nauwkeuriger bekijken, kunnen we iets zeggen over het gemiddelde verschil van de wijdte van de opening van de moer en de steeldikte van de bout. Ook kunnen we iets zeggen over de standaardafwijking van dit verschil. Laten we eerst eens kijken naar het gemiddelde verschil. Voor de wijdte van de opening van de moer geldt: 0,11=moerµ Voor de gemiddelde steeldikte geldt: 9,10=boutµ

De verwachte waarde voor het verschil zal zijn: 1,09,1011 =−=−= boutmoer µµµ

Voor de standaardafwijking geldt: 5,0=moerσ en 3,0=boutσ

In het vorige hoofdstuk hebben we al gezien, dat zal gelden: 22boutmoerverschil σσσ +=

Pas op! Ook al kijken we hier naar het verschil van twee verzamelingen, voor de standaardafwijking geldt dat de twee kwadraten moeten worden opgeteld.

We krijgen dus: 583,034,03,05,0 22 ==+=verschilσ

Page 28: Statistiek i i6e2

28

berekening TI-83 plus Casio P(0.0<v<0.1) Kies: [second] VARS (=DISTR)

Kies: 2: NORMALCDF Voer in: NORMALCDF( og, bg, µ, σ) NORMALCDF(0.0, 0.1, 0.1, 0,583)= =0,0681

Kies: Stat scherm Kies: DIST (5e tabblad) Kies: NORM (1e tabblad) Kies: Ncd Voer in: lower: 0.0 upper: 0.1 σ: 0.583 µ: 0.1

Conclusie: De kans op een passende bout en moer is dus slechts 6,81%

5.7 de  verdeling  van  het  gemiddelde  van  een  steekproef  Stel dat we alle eerstejaars van nederland een tentamen statistiek laten doen. We weten dan zeker dat de cijfers uiteen zullen lopen van 1 tot 10. Maar nu gaan we al die eerste willekeurig bij elkaar zetten in klassen van –zeg- 20 studenten. En van al die klassen van 20 studenten bereken we het gemiddelde cijfer dat de studenten van een klas voor hun tentamen statistiek hebben gehaald. Zouden de klassegemiddelden ook uiteen lopen van 1 tot 10? Ik denk het niet: want er is nooit een klas waarbij –toevallig- alle 20 studenten een 1 hebben gehaald, net zomin als er een klas zal zijn waarbij alle studenten – weer heel toevallig- een 10 hebben gescoord. Nee, je gevoel zegt je dat die klassegemiddelden zullen varieren tussen

de 3,5 en de 7,5. Je gevoel is juist en dat kun je ook eenvoudig bewijzen: bedenk: n

xx

n

ii

n

∑== 1

Een gemiddelde is niets anders dan een combinatie van afzonderlijke variabelen x. Dus als voor de waarden van x geldt dat ze normaal verdeeld zijn, dan geldt dus ook dat de gemiddelden normaal verdeeld moeten zijn. Maw: als );( 2

xNx σµ∈ dan geldt: );( 2xxNx σµ∈

Maar de verwachtingswaarde van het gemiddelde is natuurlijk dezelfde als de verwachtingswaarde van alle waarden x apart. En voor de variantie van het gemiddelde geldt:

( ) ( )nx

xnn

xnn

xx i

i

n

ii

n

ii

nvar

var1var1var)var( 21

21 =∗=⎟

⎞⎜⎝

⎛=

⎟⎟⎟⎟

⎜⎜⎜⎜

= ∑∑

=

= ; en dus geldt: nx

σ = !!!

Dit bepaalt het verschil in de verdeling van de individuele waarden en die van de gemiddelden:

De zwarte grafiek geeft de ligging van de individuele waarden x weer en de blauwe lijn die van de gemiddelden nx van een steekproef van n individuele waarden.

Page 29: Statistiek i i6e2

29

5.7.1 betrouwbaarheidsintervallen  voor  het  gemiddelde  van  een  steekproef  Als het gemiddelde nx ook normaalverdeeld is, dan kunnen we natuurlijk ook betrouwbaarheidsintervallen geven voor de ligging van het gemiddelde van een steekproef van n waarden. Het 90% betrouwbaarheidsinterval voor nx is gegeven door:

xx x σµσµ ∗+<<∗− 645,1645,1 oftewel:

nx

nxx σ

µσ

µ ∗+<<∗− 645,1645,1

Het 95% betrouwbaarheidsinterval voor nx is gegeven door:

xx x σµσµ ∗+<<∗− 960,1960,1 oftewel:

nx

nxx σ

µσ

µ ∗+<<∗− 960,1960,1

En het 99% betrouwbaarheidsinterval voor nx is gegeven door:

xx x σµσµ ∗+<<∗− 575,2575,2 oftewel:

nx

nxx σ

µσ

µ ∗+<<∗− 575,2575,2

Page 30: Statistiek i i6e2

30

6 DE  BINOMIALE  VERDELING   In het vorige hoofdstuk hebben we kennis gemaakt met een continue verdeling. In dit hoofdstuk en het volgende hoofdstuk bekijken we discrete verdelingen. In dit hoofdstuk bekijken we een eindige discrete verdeling. In het volgende een onbegrensde discrete verdeling.

6.1  Binomiale  kansformule  De binomiale verdeling is een verdeling waarbij maar twee mogelijke uitkomsten mogelijk zijn. Als voorbeelden noemen we de uitkomsten van een multiple choice test. (Antwoorden zijn goed of fout.), het gooien van een munt (Kop of munt), het schieten met pijl en boog (roos of niet) en het gooien met een dobbelsteen (je gooit een zes, of je gooit geen zes). Het is bovendien een trekking waarbij de kans op succes een vaste waarde heeft. Eigenlijk is een ander woord voor een binomiale kansverdeling ook wel de verdeling voor een trekking met teruglegging (zie hoofdstuk 3) We geven nog een paar voorbeelden. Voorbeeld 1. Tossen met een munt Iemand gooit een eerlijke munt 5 maal op. Bereken de kans, dat in deze serie 4 maal kop en eenmaal munt voorkomt. Oplossing: De kans op kop is 0,5 en de kans op munt is ook 0,5. De kans op achtereenvolgens kop,kop,kop,kop en munt is: ( ) 32

1214

21 * ==kkkkmP

Daar we bij deze opgave niet gezegd hebben, dat 4 maal kop en eenmaal munt perse in deze volgorde moet optreden, is elke combinatie van 4 maal kop en eenmaal munt correct. In Hfst 2 hebben we gezien, dat het aantal mogelijkheden om 4 maal kop en eenmaal munt in willekeurige volgorde te gooien gelijk is

aan: 5!4!*1!5

15

==⎟⎟⎠

⎞⎜⎜⎝

In dit geval krijgen we dus: ( ) 325

214

21 **

15

*4 =⎟⎟⎠

⎞⎜⎜⎝

⎛=kopP

Voorbeeld 2 Iemand moet voor een test 6 multiple choice vragen beantwoorden. Er zijn 4 keuzes per vraag. De testkandidaat heeft geen flauw idee welk antwoord correct is en kies dus blind. Wat is nu de kans, dat hij op deze manier 4 vragen goed beantwoord. Oplossing: In dit geval is de kans op succes per vraag 0,25 en de kans op fout 0,75. Het aantal mogelijke volgordes van 4 goede vragen in een reeks van 6 is gelijk aan:

15!4*26*5!*4

!4!*2!6

26

===⎟⎟⎠

⎞⎜⎜⎝

In dit geval krijgen we: ( ) 0330,0**26

4 40961352

434

41 ==⎟⎟

⎞⎜⎜⎝

⎛=goedP

Voorbeeld 3 Zelfde voorbeeld als bij voorbeeld 2, maar nu met de vraag: Wat is de kans, dat er ten minste 4 vragen goed beantwoord worden. Oplossing: ( ) ( ) ( ) ( )=++=≥ goedPgoedPgoedPantwoordgoedP 6544

Page 31: Statistiek i i6e2

31

0376,0*06

**16

**26 6

41

435

412

434

41 =⎟⎟

⎞⎜⎜⎝

⎛+⎟⎟

⎞⎜⎜⎝

⎛+⎟⎟

⎞⎜⎜⎝

Voorbeeld 4 Zelfde voorbeeld als bij voorbeeld 2, maar nu met de vraag: Wat is de kans, dat er ten minste 2 vragen goed beantwoord worden. Oplossing: In feite kunnen we hetzelfde antwoord geven als in het vorige voorbeeld. We krijgen dan: ( ) ( ) ( ) ( ) ( ) ( )goedPgoedPgoedPgoedPgoedPantwoordgoedP 654322 ++++=≥

Dit wordt wel erg veel werk. Slimmer is om te bedenken, dat ten minste 2 goede antwoorden het tegengestelde is van hoogstens 1 goed antwoord. Dit betekent: ( ) ( ) ( ) ( )=−−=≤−=≥ goedPgoedPantwoordgoedPantwoordgoedP 101112

4661,0**16

*06

1 543

416

43 =⎟⎟

⎞⎜⎜⎝

⎛−⎟⎟

⎞⎜⎜⎝

⎛−

Algemeen kunnen we dus het volgende stellen: Voer ik een trekking n maal uit, waarbij de kans op “succes” gelijk is aan p, dan geeft de volgende formule de kans weer op k maal succes bij n trekkingen:

knk ppkn

kP −−⎟⎟⎠

⎞⎜⎜⎝

⎛= )1(**)(

6.2 Kansrekening  met  de  Binomiale  verdeling  

6.2.1 Binomiale  verdeling  met  de  GR  berekening TI-83 plus Casio P(k≥2)=1 - P(k≤1) Kies: [second] VARS (=DISTR)

Kies: A: BINOMCDF Voer in: BINOMCDF(n, p, kmax) = BINOMCDF(6, 0.25, 1)=0,534 Bereken 1-0,534=0,466

Kies: Stat scherm Kies: DIST (5e tabblad) Kies: BINM (5e tabblad) Kies: Bcd Kies: Var (2e tabblad) Voer in: data: x: 1 Numtrial: 6 p: 0.25

P(k=4) Kies: [second] VARS (=DISTR) Kies: 0: BINOMPDF Voer in: BINOMPDF(6, 0.25, 4)=0,0330

Kies: Stat scherm Kies: DIST (5e tabblad) Kies: BINM (5e tabblad) Kies: Bpd Kies: Var (2e tabblad) Voer in: Data x: 4 Numtrial: 6 p: 0.25

Aan de basis van een binomiale verdeling ligt een experiment waarbij de kans op een bepaalde uitkomst gegeven wordt door een vast getal p. Jacob Bernoulli (1654 –1705), een van de vele prominente wiskundigen uit de Bernoulli familie, is degene die zo’n experiment voor het eerst wiskundig heeft beschreven in zijn boek Ars Conjectandi (vertaald met: de Kunst van het Gissen)

Page 32: Statistiek i i6e2

32

6.2.2 Tabel  van  de  binomiale  verdeling  Toen er nog geen geavenceerde rekenmachines waren maakte men gebruik van tabellen. Voor de volledigheid hebben we in Annex C tabellen van de binomiale verdeling opgenomen. in Appendix C een tabel, waarin n loopt van 2 tot en met 10. Verder vinden we waarden voor n=12, 15 en 20. Verder is de tabel gemaakt voor p (=kans op succes) van 0,05 tot 0,50. Het is niet nodig om ook een tabel voor p (=kans op succes) te maken van 0,55 tot 0,95, omdat we dan ook kunnen kijken naar q (= kans op falen). Als p loopt van 0,55 tot o,95 dan loopt q van 0,5 tot 0,45. ( Immers 1=+ qp ) Boven de tabel staat, dat de uitkomst cumulatief is. Dat betekent, dat steeds aangegeven wordt de kans op hoogstens k maal succes bij n acties. We kijken nogmaals naar de voorbeelden uit de vorige paragraaf en we beginnen met voorbeeld 4. Daarin vermeldden we al, dat het handiger was om eerst de kans op hoogstens 1 goed antwoord uit te rekenen. In dit geval is de kans op succes gelijk aan 0,25. We pakken de tabel uit Appendix C erbij. Het ging om 6 vragen. Dit betekent dat n=6. Het aantal goed beantwoorde vragen was hoogstens 1. In dit geval is k dus gelijk aan 1. In de tabel zoeken we nu de rij op, waarvoor geldt: n=6 en k=1. Vervolgens gaan we naar links, naar de kolom waarboven staat 25,0=p . We vinden in de tabel: 0,5339. We kunnen dus de conclusie

trekken: ( ) 5339,01 =≤antwoordgoedP Als oplossing van het probleem van voorbeeld 4 vinden we dan: ( ) ( ) 4661,05339,01112 =−=≤−=≥ antwoordgoedPantwoordgoedP De oplossing voor voorbeeld 3 loopt op identieke wijze. We kunnen de tabel echter ook gebruiken voor het oplossen van de voorbeelden 1 en 2. Als we naar voorbeeld 2 kijken, wordt er gevraagd om te bepalen wat de kans is op 4 goed beantwoorde vragen. Uit de tabel kunnen we alleen maar afleiden, wat de kans is op hoogstens 4 goed beantwoorde vragen en de kans op hoogstens 3 goed beantwoorde vragen. Als we deze twee kansen echter van elkaar aftrekken, krijgen we precies de kans op 4 goed beantwoorde vragen. We krijgen: ( ) ( ) ( ) 0330,09624,09954,0344 =−=≤−≤= antwoordgoedPantwoordGoedPgoedP

6.2.3 Grenzen  aan  het  rekenen  met  de  binomiaalformule  Er zijn twee situaties waarbij de standaard hulpmiddelen je in de steek (kunnen) laten en waarbij je dus naar andere middelen moet grijpen om een binomiaal probleem op te lossen:

1. Je hebt te maken met een binomiaal probleem met kleine kans p (p<0,05) : in dit geval pas je de Poissonverdeling toe (H7)

2. De GR kan je opgave niet uitrekenen of de tabel is niet toereikend voor jouw situatie: in dit geval pas je de Normale benadering van de Binomiaal verdeling toe (6.3)

6.3 De  Normale  benadering  van  de  Binomiale  verdeling   Stel dat je met je GR wil berekenen wat de kans is op k maal een kop bij, zeg 100 maal gooien met een eerlijke munt, waarbij je k laat lopen van 0 tot 100. En stel dat je al die waarden zou uitzetten in een grafiek. Je krijgt dan onderstaande grafiek te zien: We merken direct enkele belangrijke zaken op:

• De vorm is precies die van een normale verdeling • De verwachtingswaarde ligt bij 50, zijnde het product van n en p

We zien dus dat onder bepaalde voorwaarden de kansverdeling van het aantal malen succes zich gedraagt als een normaalverdeling. We spreken dan ook van: de Normale benadering van een binomiaalverdeling.

Page 33: Statistiek i i6e2

33

0

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

0.09

0 10 20 30 40 50 60 70 80 90 100

Series1

Zou je n nu langzaam minder laten worden, dan zul je zien dat op een gegeven moment de grafiek scheef begint te trekken. Als vuistregel geldt dat deze benadering goed opgaat als:

• n= 25 of hoger, én • np > 5 én n(1-p) > 5

Om te kunnen rekenen met een normaalbenadering moeten we nog wel de formules hebben voor het gemiddelde en de variantie. Zonder afleiding of bewijs geven we de volgende formules: De verwachting pN *=µ ; de variantie qpN **var = en standaardafwijking qpN **=σ In deze twee formules geldt:

=N aantal elementen in de verzameling. =p kans op succes.

pq −= 1 kans op falen. MAAR!!! Er is één belangrijke truc bij het toepassen van deze benadering en dat is de keuze van de juiste grenswaarde: Een binomiaalverdeling is een discontinue kansverdeling: ik kan 23 maal kop gooien of 24 maal, maar niet 23,5. Maar in de Normale benadering ga ik nu over naar een continue verdeling. Als ik bijvoorbeeld de kans wil uitrekenen op 24 maal kop of meer, dan valt 24 in mijn uit te rekenen kansgebied maar 23 erbuiten. In de normale benadering kies ik dan voor 23,5! LET OP: Als je deze truc met de grenswaarde niet goed toepast wordt het antwoord fout gerekend! Voorbeeld 1 We tossen een eerlijke munt 100 keer. Wat is de kans, dat we meer dan 60 keer kop gooien. Oplossing:

This approximation, known as de Moivre–Laplace theorem, is a huge time-saver (exact calculations with large n are very onerous); historically, it was the first use of the normal distribution, introduced in Abraham de Moivre's book The Doctrine of Chances in 1738.

Page 34: Statistiek i i6e2

34

Bij een eerlijke munt is de kans op kop gelijk aan de kans op munt. Dit betekent dat 5,0=p en 5,0=q Verder geldt dat 100=N . Daar 100 veel groter is dan 30 passen we in plaats van de binomiale verdeling de normale verdeling toe. In dit geval geldt: 505,0*100* === pNµ

5255,0*5,0*100** ==== qpNσ We moeten uitrekenen de kans op meer dan 60 maal kop, dus 60 doet niet mee maar 61 wel, we kiezen dus nu als grenswaarde voor de normale benadering 60,5. Rekenen we met de binomiaalverdeling, dan vinden we met de GR: berekening TI-83 plus Casio Binomiaal:*) P(k>60)=1 - P(k≤60)

Kies: [second] VARS (=DISTR) Kies: A: BINOMCDF Voer in: BINOMCDF(100, 0.5, 60)=0,9824 Bereken 1-0,9824=0,0176

Kies: Stat scherm Kies: DIST (5e tabblad) Kies: BINM (5e tabblad) Kies: Bcd Kies: Var (2e tabblad) Voer in: Data x: 60; Numtrial: 100; p: 0.5 Bereken 1-0,9824=0,0176

Normale benadering: P(k>60)

Kies: [second] VARS (=DISTR) Kies: 2: NORMALCDF Voer in: NORMALCDF(60.5, 1000, 50, 5)=0,0179 **)

Kies: Stat scherm Kies: DIST (5e tabblad) Kies: NORM (1e tabblad) Kies: Ncd Voer in: lower: 60.5; upper: 1000; σ: 5; µ: 50

6.3.1 Betrouwbaarheidsintervallen  met  de  Normale  benadering  van  de  Binomiale  verdeling  

We weten dat het 95% betrouwbaarheidsinterval van een normale verdeling gegeven wordt door: 95%: µ-1,960*σ < x < µ+1,960*σ

Vullen we nu de waarde voor µ en σ hierin in, dan kunnen we het 95% betrouwbaarheidsinterval in de normale benadering van de binomiale verdeling ook schrijven als:

)1(96,1)1(96,1 ppnpnkppnpn −∗∗∗+∗<<−∗∗∗−∗

En als we deze hele vergelijking delen door n, en vervangen we fdoornk dan krijgen we voor

het 95% betrouwbaarheidsinterval voor de fractie f van een steekproef met omvang n:

npppf

nppp )1(96,1)1(96,1 −∗

∗+<<−∗

∗−

Page 35: Statistiek i i6e2

35

7 DE  POISSONVERDELING  

In het vorige hoofdstuk hebben we kennis gemaakt met een discrete verdeling. Ook in dit hoofdstuk bekijken we een discrete verdeling: de Poissonverdeling of ook wel aangeduid met de term Negatief-Exponentiële verdeling. Deze verdeling mag in twee omstandigheden toegepast worden: .

• Er is niet zozeer sprake van een binomiale trekking met een bepaalde kans, maar wel van een verwacht aantal gebeurtenissen. Voorbeelden zijn: Het aantal vliegtuigen, dat in een uur landt op een bepaald vliegveld. Het aantal auto’s, dat op een bepaalde dag een zeker kruispunt passeert. Het aantal wachtenden in een rij, het aantal paketten met gevaarlijke stoffen dat per dag in een magazijn binnenkomt, of ook het aantal weeffouten in een lap stof per meter. In al deze voorbeelden is n onbekend en p ook onbekend, maar n*p is het verwachte aantal vliegtuigen, auto’s, pakjes met gevaarlijke stoffen etc. In de genoemde voorbeelden, gaat het dus heel vaak over een aantal gebeurtenissen per tijdseenheid, maar het kan dus ook om een gebeurtenis per andere eenheid gaan, zoals in het laatste voorbeeld per lengte geweven stof

• Er is wél sprake van een binomiale verdeling, maar de kans op een gebeurtenis is te klein en het aantal experimenten te groot (nà∞) om de kans met behulp van de Binomiaalformule naukeurig te kunnen uitrekenen.

7.1 Formule  van  de  Poissonverdeling   De Poissonverdeling is een verbijzondering van de Binomiaalverdeling voor kleine p en grote n. Voeren we een experiment, met kans p op succes n maal uit, dan wordt de kans op k maal succes gegeven door:

=

⎥⎥⎥⎥⎥

⎢⎢⎢⎢⎢

⎟⎠

⎞⎜⎝

⎛ −

∗−

∗⎟⎠

⎞⎜⎝

⎛ −∗=⎟⎠

⎞⎜⎝

⎛ −∗⎟⎠

⎞⎜⎝

⎛∗−

=−

kk

nkknk

nmn

knn

nm

km

nm

nm

knknkP

1

1!)(

!1!

1!)(!

!)(

( ) mk

kk

nk

ekm

nmn

knnnnnm

km −∗≈

⎥⎥⎥⎥⎥

⎢⎢⎢⎢⎢

⎟⎠

⎞⎜⎝

⎛ −

+−−−∗⎟

⎞⎜⎝

⎛ −∗=!

1

)1)......2)(1(1!

als nà∞

hierin hebben we ingevuld voor p: npmnmp ∗== ;

De Poissonverdeling wordt als volgt gedefinieerd: ( )!kekkPk µµ −

== ; np ∗=µ

Hierin is k het aantal dat beschouwd wordt en µ het verwachte aantal per tijdseenheid. De Poissonverdeling als benadering van de binomiaalverdeling gaat het beste op als n>50 en n*p <5

De Poissonverdeling is genoemd naar Siméon Poisson die deze kansverdeling ontdekte en samen met zijn statistische theorie in 1838 publiceerde in zijn werk Recherches sur la probabilité des jugements en matières criminelles et matière civile.

Page 36: Statistiek i i6e2

36

Voorbeeld 1 Het aantal schepen dat per dag de haven van Amsterdam binnenloopt is 5 per dag. Bereken de kans, dat er op een bepaalde dag geen enkel schip deze haven binnenloopt.

Oplossing: Volgens de formule geldt: ( ) 0067,0*!050 50

=== −ekP

Voorbeeld 2 De gemiddelde tijd, die verstrijkt tussen de aankomst van twee verschillende klanten in een wachtrij is 3 minuten. Bereken de kans, dat in een bepaald kwartier er minder dan 4 klanten binnen komen. Oplossing: Dat de tijd, die gemiddeld verstrijkt tussen de aankomst van twee klanten gelijk is aan 3 minuten, betekent dat er gemiddeld 5 klanten per kwartier arriveren. In dit geval betekent dat 5=µ ( ) ( ) ( ) ( ) ( )32104 =+=+=+==< kPkPkPkPkP

Dit betekent: ( ) =+++=<−−−−

!35

!25

!15

!054

53525150 eeeekP

2650,01404,00842,00337,00067,0 =+++

7.2 Kansrekening  met  de  Poissonverdeling  

7.2.1 Poissonverdeling  met  de  GR  Berekening (vb2) TI-83 plus Casio P(k<4)= P(k≤3) Kies: [second] VARS (=DISTR)

Kies: C: POISSONCDF Voer in: POISSONCDF (µ, kmax) = POISSONCDF (5, 3) = 0,2650

Kies: Stat scherm Kies: DIST (5e tabblad) Kies: POISN (6e tabblad) Kies: Pcd Kies: Var (2e tabblad) Voer in: Data x: 3; µ: 5

P(k=3) Kies: [second] VARS (=DISTR) Kies: B: POISSONPDF Voer in: POISSONPDF (5,3)=0,1404

Kies: Stat scherm Kies: DIST (5e tabblad) Kies: POISN (6e tabblad) Kies: Ppd Kies: Var (2e tabblad) Voer in: Data x: 3; µ: 5

7.2.2 Tabel  van  de  Poissonverdeling  Zowel in het eerste als in het tweede voorbeeld zien we, dat de kans niet of nauwelijks uit te rekenen is zonder rekenmachine. In het tweede voorbeeld is het zelfs met een rekenmachine tamelijk veel werk. Daarom is ook van de Poissonverdeling een tabel gemaakt. In dit dictaat vind je een tabel voor de Poissonverdeling in Appendix B. De tabel werkt vrij simpel. In de kop staan een aantal waarden van µ gegeven. De waarde van k loopt tot 19. Veronderstel dat we voorbeeld 1 uit de vorige paragraaf hadden willen oplossen met de tabel. We hadden daar 5=µ en k=0. In de tabel kijken we op de regel 0=k en in de kolom met kop 5=µ en vinden dan: ( ) 0067,00 ==kP Daar de tabel geen cumulatieve waarden geeft, zoeken we bij voorbeeld 2 de waarden voor achtereenvolgens 2,1,0 === kkk en 3=k op en tellen deze resultaten op. Ook dan krijgen we weer precies hetzelfde antwoord. Door afrondfouten, zou het laatste cijfer 1 kleiner of groter kunnen zijn.

Page 37: Statistiek i i6e2

37

7.3 De  normale  benadering  van  de  Poissonverdeling  << dit onderwerp hoort niet bij de tentamenstof voor TWi-4>> Bij de binomiale verdeling zagen we dat de tabel op een gegeven moment te kort schoot. Ook bij de Poisson verdeling is dit het geval. In dit dictaat loopt de waarde van µ niet verder dan 8,0. Zoals ook bij de binomiale verdeling het geval is, kunnen we de Poisson verdeling opvatten als een normale verdeling, als µ voldoende groot is. We gaan er in dit geval vanuit, dat als 8>µ dit inderdaad het geval is. Voor de normale verdeling hebben we de verwachting µ en de standaardafwijking σ nodig. In het geval van de Poissonverdeling is µ al bekend, zoals in voorbeeld 1 van paragraaf 7.1, of eenvoudig te berekenen, zoals in voorbeeld 2 van paragraaf 7.1. Voor σ geven we zonder bewijs, dat geldt: µσ =2 . Dit betekent: µσ = Verder moeten we op dezelfde manier als bij de binomiale verdeling rekening houden met de integercorrectie. We geven een voorbeeld: Veronderstel, dat er op Schiphol gemiddeld 3 vliegtuigen landen per 2 minuten. Bereken de kans, dat er in 1 uur meer dan 95 vliegtuigen landen. Oplossing: In dit geval geldt dat de verwachting van het aantal gelande vliegtuigen in 1 uur gelijk is aan

9030*3 = Dit betekent: 90=µ en 49,990 ==σ De grenswaarde 95 wordt door integercorrectie 95,5. Met de GR berekenen we: ( ) => 95xP normalcdf(95.5, 1000, 90, 9.49)=0.1357

Met de tabel wordt dit: ( ) 1357,03643,05,01,15905,95)95( =−=>=⎟⎠

⎞⎜⎝

⎛ −>=> zPzPxP

7.4 Binom  à  Normaal;  Binomà  Poisson;  Poisson  à  Normaal  << dit onderwerp hoort niet bij de tentamenstof voor TWi-4>> Hier vatten we alle regels samen over het benaderen van de ene verdeling met een andere:

1. Binomiaal vraagstuk, maar p (of 1-p)<0,05? • Y: Ga verder bij 3: behandelen als Poissonvraagstuk met µ=n*p (let op de grenzen

voor µ voor toepassing van Poissonformules!!) • N: ga verder bij 2

2. Binomiaal vraagstuk, maar n> 25 én np > 5 (of n(1-p) > 5)?

• Y: Dan benaderen als een Normaalverdeling, met µ=n*p; var=n*p*(1-p) • N: bereken als Binomiaal vraagstuk

3. Poisson vraagstuk, maar µ>10?

• Y: Dan benaderen als een Normaalverdeling met µ= µ; var= µ • N: bereken als Poissonvraagstuk

Page 38: Statistiek i i6e2

38

8 Formuleblad  

8.1 Definitie:  gemiddelde,  variantie  en  standaardafwijking,  mediaan  

Verzameling meetwaarden: gemiddelde: N

xx

N

ii∑

== 1; variantie:

( )N

xxN

ii∑

=

−= 1

2

var

frequentietabel: gemiddelde

=

== n

ii

n

iii

f

fxx

1

1 ; variantie=( )

=

=

−= n

ii

n

iii

f

xxf

1

1

2*

var

standaardafwijking of standaarddeviatie: variantie=σ

de Mediaan ∧

x van een klasse-indeling is te bepalen via de formule: msnrnlnlLx *+

+=∧

, met:

L is de ondergrens van de klasse, waarin de mediaan ligt. nl is het aantal elementen links van de mediaan in de klasse, waarin de mediaan ligt nr is het aantal elementen rechts van de mediaan in de klasse, waarin de mediaan ligt ms is de klassenbreedte van de klasse waarin de mediaan gelegen is.

8.2  Definitie:  kans,  kansfunctie,  verwachtingswaarde,  variantie  en  standaardafwijking  

kans = aantal gewenste uitkomsten gedeeld door totaal aantal uitgevoerde experimenten kans = totaal aantal van alle mogelijke, verschillende gewenste uitkomsten, gedeeld door het totaal aantal van alle mogelijke, verschillende uitkomsten.

discrete kansfunctie P(k): continue kansfunctie P(x):

verwachtingswaarde: E(k) =( )

( )∑

∑=

=

=

kalle

kalle

kkP

kkPk *µ E(x)=

( )

( )∫

∫∞

∞−

∞−=

dxxP

dxxxPµ

variantie: ( )( )

∑ −

=

iallei

ialleii

f

fxxxVar

*2

` ( )( ) ( )

( )∫

∫∞

∞−

∞−

=

dxxP

dxxxPxVar

2* µ

standaardafwijking of standaarddeviatie: variantie=σ

Page 39: Statistiek i i6e2

39

8.3  rekenregels  verwachtingswaarde,  variantie  en  standaardafwijking  ( ) ( )kEkE αα = ; ( ) ( )kVarkVar 2αα = ; kk σασα =

( ) ( ) αα +=+ kEkE ; ( ) ( )kVarkVar =+α

( ) ( ) ( )2121 kEkEkkE +=+ ; ( ) ( ) ( )2121 kVarkVarkkVar +=+ ; 222121 kkkk σσσ +=+

( ) ( ) ( )2121 kEkEkkE −=− ; ( ) ( ) ( )2121 kVarkVarkkVar +=− ; 222121 kkkk σσσ +=−

voor totalen van N onafhankelijk van elkaar tot stand gekomen uitkomsten geldt: ( ) )(* xENxE =∑ ; )(*)( xVarNxVar =∑ ; )(*)( xNx σσ =∑

voor gemiddelden van N onafhankelijk van elkaar tot stand gekomen uitkomsten geldt:

( ) )(xExE = ; NxVar

NxVarN

N

xVarxVar

N

ii )()(*)()( 2

1 ===∑= ;

Nxx )()( σ

σ =

8.4 variaties,  rangschikkingen  n onderling verschillende voorwerpen kunnen op n! verschillende manieren gerangschikt worden. n voorwerpen, waarvan er m tot de ene soort en n-m tot de andere soort behoren, kunnen op

⎟⎟⎠

⎞⎜⎜⎝

⎛=

− mn

mnmn

)!!*(! verschillende manieren gerangschikt worden.

8.5  hypergeometrische  trekking  (trekking  zonder  teruglegging):    Bij n voorwerpen in totaal, waarvan k succes betekenen, geldt voor de kans p op m succes uit l trekkingen:

p(m succes bij l trekkingen)

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

−⎟⎟⎠

⎞⎜⎜⎝

=

ln

mlkn

mk*

8.6  Normale  verdeling  Normale verdeling wordt aangeduid door var),(µN of N(µ, σ2), standaardnormaalverdeling is de kansfunctie achter elke normaalverdeling; standaardnormaalverdeling: N (0,1) Als x behoort tot de Normaalverdeling var),(µN en z de variabekle is van de

standaardnormaalverdeling )1,0(N , dan geldt: σµ−

=xz ; oftewel: σµ *zx +=

8.6.1 combinaties  van  normale  verdelingen  een combinaltie van variabelen die elk afzonderlijk behoren tot een normale verdeling vormen samen weer een normale verdeling.

Page 40: Statistiek i i6e2

40

8.6.2 betrouwbaarheidsintervallen  van  een  normale  verdeling  voor een normale verdeling geldt: 90% van de waarden ligt tussen µ-1,645*σ en µ+1,645*σ 95% van de waarden ligt tussen µ-1,96 * σ en µ+1,96 * σ 99% van de waarden ligt tussen µ-2,575*σ en µ+2,575*σ

8.7  Binomiale  verdeling  (trekking  met  vaste  kans  op  succes,  dus  met  teruglegging)  

Bij n onafhankelijke trekkingen, met elk afzonderlijk kans p op succes, dan geldt:

de kans op k maal succes uit n trekkingen: P(k uit n) knk ppkn −−⎟⎟⎠

⎞⎜⎜⎝

⎛= )1(**

8.7.1 normale  benadering  van  een  Binomiale  verdeling  een binomiale verdeling mag onder bepaalde omstandigheden benaderd worden door een normale verdeling, waarbij voor de normale benadering geldt dat de verwachtingswaarde pN *=µ ; en de variantie qpN **var = ; qpN **=σ ; In deze formules geldt:

=N aantal elementen in de verzameling. =p kans op succes. =q 1-p = kans op falen.

Deze benadering mag alleen worden toegepast als de variantie minimaal 10 is

8.7.2 betrouwbaarheidsintervallen  van  de  normale  benadering  van  een  binomiale  verdeling  

voor een normale benadering van een binomiale verdeling geldt dus: 90% van de waarden ligt tussen qpNpN ***645,1* − en qpNpN ***645,1* +

95% van de waarden ligt tussen qpNpN ***96,1* − en qpNpN ***96,1* +

99% van de waarden ligt tussen qpNpN ***575,2* − en qpNpN ***575,2* +

8.8  Poissonverdeling  indien p heel klein en n heel groot is kan de binomiale verdeling worden benaderd door de

poisson formule: ( )!kekkPk µµ −

==

hierbij is µ zowel de verwachtingswaarde als ook de variantie.

Page 41: Statistiek i i6e2

41

9 Appendix  A:  tabel  van  de  Standaard  Normaal  verdeling   OPPERVLAKTE ONDER DE GRAFIEK VAN DE STANDARD NORMALE VERDELING VAN 0 TOT z z | 0 1 2 3 4 5 6 7 8 9 -----+--------------------------------------------------------------------------------------------------------- 0.0 | .0000 .0040 .0080 .0120 .0160 .0190 .0239 .0279 .0319 .0359 0.1 | .0398 .0438 .0478 .0517 .0557 .0596 .0636 .0675 .0714 .0754 0.2 | .0793 .0832 .0871 .0910 .0948 .0987 .1026 .1064 .1103 .1141 0.3 | .1179 .1217 .1255 .1293 .1331 .1368 .1406 .1443 .1480 .1517 0.4 | .1554 .1591 .1628 .1664 .1700 .1736 .1772 .1808 .1844 .1879 | 0.5 | .1915 .1950 .1985 .2019 .2054 .2088 .2123 .2157 .2190 .2224 0.6 | .2258 .2291 .2324 .2357 .2389 .2422 .2454 .2486 .2518 .2549 0.7 | .2580 .2612 .2642 .2673 .2704 .2734 .2764 .2794 .2823 .2852 0.8 | .2881 .2910 .2939 .2967 .2996 .3023 .3051 .3078 .3106 .3133 0.9 | .3159 .3186 .3212 .3288 .3264 .3289 .3315 .3340 .3565 .3389 | 1.0 | .3413 .3438 .3461 .3485 .3508 .3531 .3554 .3577 .3599 .3621 1.1 | .3643 .3665 .3686 .3708 .3729 .3749 .3770 .3790 .3810 .3830 1.2 | .3849 .3869 .3888 .3907 .3925 .3944 .3962 .3980 .3997 .4015 1.3 | .4032 .4049 .4066 .4082 .4099 .4115 .4131 .4147 .4162 .4177 1.4 | .4192 .4207 .4222 .4236 .4251 .4265 .4279 .4292 .4306 .4319 1.5 | .4332 .4345 .4357 .4370 .4382 .4394 .4406 .4418 .4429 .4441 1.6 | .4452 .4463 .4474 .4484 .4495 .4505 .4515 .4525 .4535 .4545 1.7 | .4554 .4564 .4573 .4582 .4591 .4599 .4608 .4616 .4625 .4633 1.8 | .4641 .4649 .4656 .4664 .4671 .4678 .4686 .4693 .4699 .4706 1.9 | .4713 .4719 .4726 .4732 .4738 .4744 .4750 .4756 .4761 .4767 | 2.0 | .4772 .4778 .4783 .4788 .4793 .4798 .4803 .4808 .4812 .4817 2.1 | .4821 .4826 .4830 .4834 .4838 .4842 .4846 .4850 .4854 .4857 2.2 | .4861 .4864 .4868 .4871 .4875 .4878 .4881 .4884 .4887 .4890 2.3 | .4893 .4896 .4898 .4901 .4904 .4906 .4909 .4911 .4913 .4916 2.4 | .4918 .4920 .4922 .4925 .4927 .4929 .4931 .4932 .4934 .4936 | 2.5 | .4938 .4940 .4941 .4943 .4945 .4946 .4948 .4949 .4951 .4952 2.6 | .4953 .4955 .4956 .4957 .4959 .4960 .4961 .4962 .4963 .4964 2.7 | .4965 .4966 .4967 .4968 .4969 .4970 .4971 .4972 .4973 .4974 2.8 | .4974 .4975 .4976 .4977 .4977 .4978 .4979 .4979 .4980 .4981 2.9 | .4981 .4982 .4982 .4983 .4984 .4984 .4985 .4985 .4986 .4986 | 3.0 | .4987 .4987 .4987 .4988 .4988 .4989 .4989 .4989 .4990 .4990 3.1 | .4990 .4991 .4991 .4991 .4992 .4992 .4992 .4992 .4993 .4993 3.2 | .4993 .4993 .4994 .4994 .4994 .4994 .4994 .4995 .4995 .4995 3.3 | .4995 .4995 .4995 .4996 .4996 .4996 .4996 .4996 .4996 .4997 3.4 | .4997 .4997 .4997 .4997 .4997 .4997 .4997 .4997 .4997 .4998 | 3.5 | .4998 .4998 .4998 .4998 .4998 .4998 .4998 .4998 .4998 .4998 3.6 | .4998 .4998 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999 3.7 | .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999 3.8 | .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999 3.9 | .5000 .5000 .5000 .5000 .5000 .5000 .5000 .5000 .5000 .5000

Page 42: Statistiek i i6e2

42

10   APPENDIX  B:  Tabel  van  de  Poisson  verdeling   ----------------------------------------------------------------------------------------------------------------------------------------------- µ 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.5 2.0 3.0 4.0 5.0 6.0 7.0 8.0 k ----------------------------------------------------------------------------------------------------------------------------------------------- 0 9048 8187 7408 6703 6065 5488 4966 4493 4066 3679 2231 1353 0498 0183 0067 0025 0009 0003 1 0905 1637 2222 2681 3033 3293 3476 3595 3659 3679 3347 2707 1494 0733 0337 0149 0064 0027

2 0045 .0164 0333 0536 0758 0988 1217 1438 1647 1839 2510 2707 2240 1465 0842 0446 0223 0107

3 0002 0011 0033 0072 0126 0198 0284 0383 0494 0613 1255 1804 2240 1954 1404 0892 0521 0286

4 0000 0001 0003 0007 0016 0030 0050 0077 0111 0153 0471 0902 1680 1954 1755 1339 0912 0573

5 0000 0000 0000 0001 0002 0004 0007 0012 0020 0031 0141 0361 1008 1563 1755 1606 1277 0916

6 0000 0000 0000 0000 0000 0000 0001 0002 0003 0005 0035 0120 0504 1042 1462 1606 1490 1221

7 0000 0000 0000 0000 0000 0000 0000 0000 0000 0001 0008 0034 0216 0595 1044 1377 1490 1396

8 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0001 0009 0081 0298 0653 1033 1304 1396

9 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0002 0027 0132 0363 0688 1014 1241

10 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0001 0008 0053 0181 0413 0710 0993

11 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0002 0019 0082 0225 0452 0722

12 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0001 0006 0034 0113 0263 0481

13 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0002 0013 0052 0142 0296

14 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0001 0005 0022 0071 0169

15 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0002 0009 0033 0090

16 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0003 0014 0045

17 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0001 0006 0021

18 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0002 0009

19 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0001 0007

Page 43: Statistiek i i6e2

43

11 APPENDIX  C:    Tabel  van  de  Binomiale  Verdeling   n k 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 -------------------------------------------------------------------------------------------------------------------------------------- 2 0 0,9025 0,8100 0,7225 0,6400 0,5625 0,4900 0,4225 0,3600 0,3025 0,2500

2 1 0,9975 0,9900 0,9775 0,9600 0,9375 0,9100 0,8775 0,8400 0,7975 0,7500 3 0 0,8574 0,7290 0,6141 0,5120 0,4219 0,3430 0,2746 0,2160 0,1664 0,1250 3 1 0,9928 0,9720 0,9392 0,8960 0,8338 0,7840 0,7182 0,6480 0,5748 0,5000 3 2 0,9999 0,9990 0,9966 0,9920 0,9844 0,9730 0,9571 0,9360 0,9089 0,8750 4 0 0,8145 0,6561 0,5220 0,4096 0,3164 0,2401 0,1785 0,1296 0,0915 0,0625 4 1 0,9860 0,9477 0,8905 0,8192 0,7383 0,6517 0,5630 0,4752 0,3910 0,3125 4 2 0,9995 0,9963 0,9880 0,9728 0,9492 0,9163 0,8735 0,8208 0,7585 0,6875 4 3 1,0000 0,9999 0,9995 0,9984 0,9961 0,9919 0,9850 0,9744 0,9590 0,9375 5 0 0,7738 0,5905 0,4437 0,3277 0,2373 0,1681 0,1160 0,0778 0,0503 0,0312 5 1 0,9774 0,9185 0,8352 0,7373 0,6328 0,5282 0,4284 0,3370 0,2562 0,1875 5 2 0,9988 0,9914 0,9734 0,9421 0,8965 0,8369 0,7648 0,6826 0,5931 0,5000 5 3 1,0000 0,9995 0,9978 0,9933 0,9844 0,9692 0,9460 0,9130 0,8688 0,8125 5 4 1,0000 1,0000 0,9999 0,9997 0,9990 0,9976 0,9947 0,9898 0,9815 0,9688 6 0 0,7351 0,5314 0,3771 0,2621 0,1780 0,1176 0,0754 0,0647 0,0277 0,0156 6 1 0,9672 0,8857 0,7765 0,6554 0,5339 0,4202 0,3191 0,2333 0,1636 0,1094 6 2 0,9978 0,9842 0,9527 0,9011 0,8306 0,7443 0,6471 0,5443 0,4415 0,3438 6 3 0,9999 0,9987 0,9941 0,9830 0,9624 0,9295 0,8826 0,8208 0,7447 0,6562 6 4 1,0000 0,9999 0,9996 0,9984 0,9954 0,9891 0,9777 0,9590 0,9308 0,8906 6 5 1,0000 1,0000 1,0000 0,9999 0,9998 0,9993 0,9982 0,9959 0,9917 0,9844 7 0 0,6983 0,4783 0,3206 0,2097 0,1335 0,0824 0,0490 0,0280 0,0152 0,0078 7 1 0,9556 0,8503 0,7166 0,5767 0,4449 0,3294 0,2338 0,1586 0,1024 0,0625 7 2 0,9962 0,9743 0,9262 0,8250 0,7564 0,6471 0,5323 0,4199 0,3164 0,2266 7 3 0,9998 0,9973 0,9879 0,9667 0,9294 0,8740 0,8002 0,7102 0,6083 0,5000 7 4 1,0000 0,9998 0,9988 0,9953 0,9871 0,9712 0,9444 0,9037 0,8471 0,7734 7 5 1,0000 1,0000 0,9999 0,9996 0,9987 0,9962 0,9910 0,9812 0,9643 0,9375 7 6 1,0000 1,0000 1,0000 1,0000 0,9999 0,9998 0,9994 0,9984 0,9963 0,9922 8 0 0,6634 0,4305 0,2725 0,1678 0,1001 0,0567 0,0319 0,0168 0,0084 0,0039 8 1 0,9428 0,8131 0,6572 0,5033 0,3671 0,2553 0,1691 0,1064 0,0632 0,0352 8 2 0,9942 0,9619 0,8948 0,7969 0,6785 0,5518 0,4278 0,3154 0,2201 0,1445 8 3 0,9996 0,9950 0,9786 0,9437 0,8862 0,8059 0,7064 0,5941 0,4770 0,3633 8 4 1,0000 0,9996 0,9971 0,9896 0,9727 0,9420 0,8939 0,8263 0,7396 0,6367 8 5 1,0000 1,0000 0,9998 0,9988 0,9958 0,9887 0,9747 0,9502 0,9115 0,8555 8 6 1,0000 1,0000 1,0000 0,9999 0,9996 0,9987 0,9964 0,9915 0,9819 0,9648 8 7 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9998 0,9993 0,9983 0,9961 9 0 0,6302 0,3874 0,2316 0,1342 0,0751 0,0404 0,0207 0,0101 0,0046 0,0020 9 1 0,9288 0,7748 0,5995 0,4362 0,3003 0,1960 0,1211 0,0705 0,0385 0,0195 9 2 0,9916 0,9470 0,8591 0,73382 0,6007 0,4628 0,3373 0,2318 0,1495 0,0898 9 3 0,9994 0,9917 0,9661 0,9144 0,8343 0,7297 0,6089 0,4826 0,3614 0,2539 9 4 1,0000 0,9991 0,9944 0,9804 0,9511 0,9012 0,8283 0,7334 0,6214 0,5000 9 5 1,0000 0,9999 0,9994 0,9969 0,9900 0,9747 0,9464 0,9006 0,8342 0,7461 9 6 1,0000 1,0000 1,0000 0,9997 0,9987 0,9957 0,9888 0,9750 0,9502 0,9102 9 7 1,0000 1,0000 1,0000 1,0000 0,9999 0,9996 0,9986 0,9962 0,9909 0,9805 9 8 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9997 0,9992 0,9980

Page 44: Statistiek i i6e2

44

Tabel van de Binomiale Verdeling – vervolg n k 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 --------------------------------------------------------------------------------------------------------------------------------------

10 0 0,5987 0,3487 0,1969 0,1074 0,0563 0,0282 0,0135 0,0060 0,0025 0,0010 10 1 0,9139 0,7361 0,5443 0,3758 0,2440 0,1493 0,0860 0,0464 0,0232 0,0107 10 2 0,9885 0,9298 0,8202 0,6778 0,5256 0,3828 0,2616 0,1673 0,0996 0,0547 10 3 0,9990 0,9872 0,9500 0,8791 0,7759 0,6496 0,5138 0,3823 0,2660 0,1719 10 4 0,9999 0,9984 0,9901 0,9672 0,9219 0,8497 0,7515 0,6331 0,5044 0,3770 10 5 1,0000 0,9999 0,9986 0,9936 0,9803 0,9527 0,9051 0,8338 0,7384 0,6230 10 6 1,0000 1,0000 0,9999 0,9991 0,9965 0,9894 0,9740 0,9452 0,8980 0,8281 10 7 1,0000 1,0000 1,0000 0,9999 0,9996 0,9984 0,9952 0,9877 0,9726 0,9453 10 8 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9995 0,9983 0,9955 0,9893 10 9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9997 0,9990 12 0 0,5404 0,2824 0,1422 0,0687 0,0317 0,0138 0,0057 0,0022 0,0008 0,0002 12 1 0,8816 0,6590 0,4435 0,2749 0,1584 0,0850 0,0424 0,0196 0,0083 0,0032 12 2 0,9804 0,8891 0,7358 0,5583 0,3907 0,2528 0,1513 0,0834 0,0421 0,0193 12 3 0,9978 0,9744 0,9078 0,7946 0,6488 0,4925 0,3467 0,2253 0,1345 0,0730 12 4 0,9998 0,9957 0,9761 0,9274 0,8424 0,7237 0,5833 0,4382 0,3044 0,1938 12 5 1,0000 0,9995 0,9954 0,9806 0,9456 0,8822 0,7873 0,6652 0,5269 0,3872 12 6 1,0000 0,9999 0,9993 0,9961 0,9857 0,9614 0,9154 0,8418 0,7393 0,6128 12 7 1,0000 1,0000 0,9999 0,9994 0,9972 0,9905 0,9745 0,9427 0,8883 0,8062 12 8 1,0000 1,0000 1,0000 0,9999 0,9996 0,9983 0,9944 0,9847 0,9644 0,9270 12 9 1,0000 1,0000 1,0000 1,0000 1,0000 0,9998 0,9992 0,9972 0,9921 0,9807 12 10 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9997 0,9989 0,9968 12 11 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9998 15 0 0,4633 0,2059 0,0874 0,0352 0,0134 0,0047 0,0016 0,0005 0,0001 0,0000 15 1 0,8290 0,5490 0,3186 0,1671 0,0802 0,0353 0,0142 0,0052 0,0017 0,0005 15 2 0,9638 0,8159 0,6042 0,3980 0,2361 0,1268 0,0617 0,0271 0,0107 0,0037 15 3 0,9945 0,9444 0,8227 0,6482 0,4613 0,2969 0,1727 0,0905 0,0424 0,0176 15 4 0,9994 0,9873 0,9383 0,8358 0,6865 0,5155 0,3519 0,2173 0,1204 0,0592 15 5 0,9999 0,9978 0,9832 0,9389 0,8516 0,7216 0,5643 0,4032 0,2608 0,1509 15 6 1,0000 0,9997 0,9964 0,9819 0,9434 0,8689 0,7548 0,6098 0,4522 0,3036 15 7 1,0000 1,0000 0,9996 0,9958 0,9827 0,9500 0,8868 0,7869 0,6535 0,5000 15 8 1,0000 1,0000 0,9999 0,9992 0,9958 0,9848 0,9578 0,9050 0,8182 0,6964 15 9 1,0000 1,0000 1,0000 0,9999 0,9992 0,9963 0,9876 0,9662 0,9231 0,8491 15 10 1,0000 1,0000 1,0000 1,0000 0,9999 0,9993 0,9972 0,9907 0,9745 0,9408 15 11 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9995 0,9981 0,9937 0,9824 15 12 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9997 0,9989 0,9963 15 13 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9995 15 14 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 20 0 0,3585 0,1216 0,0388 0,0115 0,0032 0,0008 0,0002 0,0000 0,0000 0,0000 20 1 0,7358 0,3917 0,1756 0,0692 0,0243 0,0076 0,0021 0,0005 0,0001 0,0000 20 2 0,9245 0,6769 0,4049 0,2061 0,0913 0,0355 0,0121 0,0036 0,0009 0,0002 20 3 0,9841 0,8670 0,6477 0,4114 0,2252 0,1071 0,0444 0,0160 0,0049 0,0013 20 4 0,9974 0,9568 0,8298 0,6296 0,4148 0,2375 0,1182 0,0510 0,0189 0,0059 20 5 0,9997 0,9887 0,9327 0,8042 0,6172 0,4164 0,2454 0,1256 0,0553 0,0207 20 6 1,0000 0,9976 0,9781 0,9133 0,7858 0,6080 0,4166 0,2500 0,1299 0,0577 20 7 1,0000 0,9996 0,9941 0,9679 0,8982 0,7723 0,6010 0,4159 0,2520 0,1316 20 8 1,0000 0,9999 0,9987 0,9900 0,9591 0,8867 0,7624 0,5956 0,4143 0,2517 20 9 1,0000 1,0000 0,9998 0,9974 0,9861 0,9520 0,8782 0,7553 0,5914 0,4119 20 10 1,0000 1,0000 1,0000 0,9994 0,9961 0,9829 0,9468 0,8725 0,7507 0,5881 20 11 1,0000 1,0000 1,0000 0,9999 0,9991 0,9949 0,9804 0,9435 0,8692 0,7483 20 12 1,0000 1,0000 1,0000 1,0000 0,9998 0,9987 0,9940 0,9790 0,9420 0,8684 20 13 1,0000 1,0000 1,0000 1,0000 1,0000 0,9997 0,9985 0,9935 0,9786 0,9423 20 14 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9997 0,9984 0,9936 0,9793 20 15 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9997 0,9985 0,9941 20 16 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9997 0,9987 20 17 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9998 20 18 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 20 19 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000