Praktische Opdracht hypothesetoetsen in 5/6 VWO
Transcript of Praktische Opdracht hypothesetoetsen in 5/6 VWO
Praktische Opdracht hypothesetoetsen in 5/6 VWO
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
2
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
3
Inhoudsopgave
Achtergrondinformatie ........................................................................................................................... 4
Praktisch opdracht hypothese toetsen…................................................................................................ 7
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
4
Achtergrondinformatie
Auteur: Hanneke Abbenhuis; e-‐mail: [email protected]
Met dank voor ondersteuning en feedback aan:
Tim Verheijen; e-‐mail [email protected]
Brigitte Smits; e-‐mail [email protected]
Andre Zegers; e-‐mail [email protected]
Marina van Sluisveld; e-‐mail [email protected]
Wouter van Orsouw; e-‐mail [email protected]
Doelgroep: Vwo 5 of 6 wiskunde A of D.
Voorkennis: De leerlingen hebben basiskennis van de normale verdeling (nog geen wortel-‐n wet) en binomiale verdeling. Deze praktische opdracht/ keuzeonderwerp is uitgetest in enkele 5 VWO wiskunde A groepen, nadat de hoofdstukken 9 en 11, 10e editie Getal en Ruimte behandeld waren.
Waaruit bestaat het materiaal? Het materiaal bevat lesmateriaal voor een keuzeonderwerp over hypothese toetsen voor 5 VWO wa aangevuld met een praktische opdracht. Er wordt gebruik gemaakt van het programma VuStat. Het materiaal is ook geschikt voor wd-‐groepen.
De paragrafen 1 t/m 7 bestaan uit theorie en opgaven en paragraaf 8 bestaat uit theorie over het doen van een onderzoek en de opdracht zelf een klein onderzoek op te zetten. Als de theorie over hypothesetoetsen al behandeld is, dan kan er voor gekozen worden om paragrafen 1 t/m 7 weg te laten. Paragraaf 0 en de bijlage C en D geven de beoordelingscriteria. Paragraaf 4 behandelt fouten van de eerste en tweede soort, deze paragraaf is met name geschikt voor wd leerlingen. Er zijn opgaven toegevoegd waarbij VuStat gebruikt wordt, de begrippen overschrijdingskans en kritieke gebied zijn zo visueel duidelijk te maken. De opdrachten met VuStat zijn bedoeld als reflectieopgaven. Het programma VuStat is te vinden op de site http://www.fi.uu.nl/nwd/ bij handouts 2014 statistiek zonder kansen van Carel van der Giessen digiboek, software, vrij beschikbaar tot 2015.
De leerlingen hebben kennis van de binomiale verdeling en alleen basiskennis van de normale verdeling (nog geen wortel-‐n wet). Daarom is ervoor gekozen om alleen binomiale en tekentoetsen te behandelen in de po. De leerlingen werken het materiaal in groepjes van 2 of 3 zelfstandig in ongeveer 12 lessen door.
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
5
Via de site is de versie 2013-‐2014 beschikbaar. Deze versie maakt geen gebruik van VuStat. De antwoorden en suggesties voor controle/toets opgaven bij deze versie zijn toegevoegd. Deze versie is dit jaar uitgetest. Tevens zijn enkele door leerlingen gemaakte werkstukken toegevoegd.
Wat was de aanleiding om dit te ontwerpen? Hypothese toetsen worden meestal pas in klas 6 VWO behandeld. Het is voor de leerlingen een lastig onderwerp. Door de leerlingen in een eerder stadium al kennis te laten maken hiermee, middels een praktische opdracht, hopen we dit te verhelpen. Er is voor gekozen om het begrip overschrijdingskans voorafgaand aan de begrippen kritieke gebied en significantieniveau te behandelen. Na een eerste intuïtieve kennismaking met het begrip toetsen gaat het begrip overschrijdingskans een cruciale rol spelen. Na berekening van de overschrijdingskans kan een beslissing worden genomen. Het begrip significantieniveau wordt geïntroduceerd en hierna wordt met behulp van het significantieniveau gekeken of we grenzen kunnen bepalen van het gebied waar we H0 verwerpen, het begrip kritieke gebied wordt dan geïntroduceerd.
Wat zijn de ervaringen met dit materiaal? De ervaringen van leerlingen zijn positief. Enkele leerlingen noemden het materiaal filosofisch. De opdrachten waren binnen 10 lessen goed te maken, incidenteel was hulp van de docent nodig. Enkele voorbeeld werkstukken zijn toegevoegd. Er is gekozen voor het laten maken in de klas van twee/drie controle opgaven per groepje, nadat de leerlingen de theorie in eigen tempo hadden doorgenomen. Ze mochten zelf bepalen wanneer, wel voor de deadline. Deze opgaven moesten aan het eind van de les ingeleverd worden en telden mee in de beoordeling. De discussies die tijdens het maken van deze opgaven ontstonden gaven goed inzicht in hoeverre de stof door de leerlingen begrepen was en gaven ook inzicht in de inzet van de individuele leerlingen binnen de groep. VuStat werd zonder veel problemen door de leerlingen gebruikt.
Wat zijn de aanbevelingen voor verdere ontwerpen? Het is mogelijk dit materiaal verder uit te werken tot samenhangend leerlingenmateriaal waarbij ook de normale verdelingstoets is opgenomen. Hierbij kan het pilot materiaal van ctwo vwo wa statistiek en kansrekening gebruikt worden.
Eventueel kan nog een handleiding voor het gebruik van Excel (zie materiaal Zwolle) worden toegevoegd.
Verantwoording. Er is gebruik gemaakt van het ctwo pilot materiaal statistiek vwo de hoofdstukken toetsen en onderzoek en voor bijlage A van Getal en Ruimte samenvatting beschrijvende statistiek H9. Ik heb een paragraaf over overschrijdingskansen toegevoegd aan het pilot materiaal statistiek vwo de hoofdstukken toetsen, voorafgaand aan de paragraaf over het kritieke gebied. Uit dit materiaal heb ik opgaven en theorie over normale verdeling verwijderd. In de paragraaf over overschrijdingskansen heb ik gebruik gemaakt van materiaal van de leergang wiskunde over hypothese toetsen uit Utrecht.
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
6
Tips voor docenten. Het programma VuStat is te vinden op de site http://www.fi.uu.nl/nwd/ bij handouts 2014 statistiek zonder kansen van Carel van der Giessen digiboek, software, vrij beschikbaar tot 2015. In het hoofdmenu vind je een rubriek profiel, hierin zijn allerlei opties mogelijk om het programma voor de leerlingen toegankelijk te maken
Ik heb in paragraaf 8 in het materiaal geen voorgestelde onderzoeksvragen opgenomen. Suggesties voor onderzoek heb ik tijdens de les gegeven. Voorbeelden:
o Zit er in een voorverpakte zak met appels meer (of minder) dan de vermelde 2 kilo. Idem met sinaasappels, wortels etc.
o Zitten er in de zakken M&M’s meer bruine dan gele. o Zitten er in de zakken smarties, gummiebeertjes meer of minder dan ..% gele. o Ajax-‐ Feyenoord wie is er sterker. o Onderzoek muziekvoorkeur. Geef maar twee mogelijkheden (kop/munt). (Dit zijn eigenlijk te
weinig mogelijkheden, wat te doen met mensen die niet kunnen kiezen, weglaten?) Bijvoorbeeld Anouk –Ilse de Lange, Stones – Beatles, Justin Bieber – One direction
Ik heb gekozen voor het laten maken in de klas van twee controle opgaven nadat ze de theorie hebben doorgenomen Ze mogen zelf bepalen wanneer, wel voor de deadline. Deze opgaven moeten aan het eind van de les ingeleverd worden en tellen mee in de beoordeling. Dit zorgt ervoor dat de leerlingen het materiaal serieus doornemen voor ze aan hun eigen onderzoek beginnen.
De leerlingen moeten hun onderzoeksvraag ter goedkeuring voorleggen aan de docent. Er moet benadrukt worden dat ze in hun onderzoek verplicht gebruik maken van een binomiale of tekentoets.
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
7
Praktische Opdracht
VWO 5 – Wiskunde A
2014-‐2015
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
8
Inhoudsopgave 0. Inleiding 9
1. Wie geef je gelijk? 10
2. Overschrijdingskans 13
3. Kritiek gebied 18
4. Foute beslissingen 22
5. Een of tweezijdige toetsen 24
6. Toetsen met de binomiale verdeling 29
7. De tekentoets 31
8. Onderzoek 33
Bijlage A – Samenvatting Beschrijvende Statistiek H9 36
Bijlage B – Aan de slag met VUstat 39
Bijlage C – Beoordeling 41
Bijlage D – Beoordelingsformulier 42
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
9
0. Inleiding Dit is een praktische opdracht (voorts: PO) voor het vak Wiskunde A. Deze opdracht zal worden uitgevoerd in 5-‐vwo en zal zowel meetellen voor het overgangsrapport (10%) als voor het schoolexamen (5%, code 1SP). De PO zal in tweetallen worden gemaakt. Bij een oneven aantal leerlingen zal de docent besluiten of er een leerling individueel zal moeten werken of dat er een drietal gevormd zal worden. Dit document bestaat uit acht paragrafen en twee bijlagen. De eerste zeven paragrafen bestaan uit theorie en opgaven en paragraaf 8 bestaat uit een onderzoek. Bij het laatstgenoemde deel ga je de geleerde theorie toepassen in de praktijk door zelf een onderzoek op te zetten. Je start met het doornemen van de theorie (de eerste zeven paragrafen, inclusief opgaven). Denk je de theorie voldoende te begrijpen, dan vraag je aan je docent aan het begin van een lesuur twee controleopdrachten. Deze opdrachten werk je volledig uit in de klas (op proefwerkpapier) en lever je na afloop van dat lesuur (of eerder) in. Elk antwoord zal moeten worden voorzien van een berekening en/of toelichting. Deze opgaven tellen mee bij de beoordeling van de PO. In paragraaf 8 start je een eigen onderzoek. Vermeld op de titelpagina van je PO je onderzoeksvraag. Maak een planning, houd een logboek bij en voeg dit toe aan je PO. De PO (het onderzoek) lever je dus als één geheel in. Voor deze PO zullen (ongeveer) 10 lesuren worden ingepland. Tijdens deze lesuren dient er aan de PO gewerkt te worden. Vermoedelijk zal dit echter niet voldoende tijd zijn om de PO (af) te kunnen maken, dus er zal ook buiten schooltijd aan de PO gewerkt moeten worden. Je mag tijdens de reguliere wiskundelessen aan een computer werken, mits je je bij aanvang en aan het eind van de les bij je docent meldt. Het resultaat zal uiteindelijk een getypt verslag (van je onderzoek, paragraaf 8) zijn dat zowel digitaal als op papier ingeleverd dient te worden. Gebruik voor het typen van wiskundige symbolen de Vergelijkingseditor 3.0 (Microsoft Word 2003) of Invoegen → Vergelijking (Microsoft 2007 en 2010). Zie eventueel de volgende link voor meer toelichting: http://computertotaal.nl/software/21366-‐wiskundige-‐symbolen-‐in-‐word.html. Lees, voordat je meteen begint, deze PO vluchtig volledig door, zodat je niet voor verrassingen komt te staan (zoals het maken en toevoegen van een planning en een logboek!). Let vooral ook op de punten waarop zal worden gelet bij de beoordeling van de PO; zie bijlage C op pagina 37 voor deze criteria en de inleverdatum.
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
10
1. Wie geef je gelijk? Reden tot ongerustheid?
In het dorpje Weurt bij Nijmegen heerst grote onrust over een volgens de bevolking onrustbarend hoog aantal gevallen van kanker onder de 2600 inwoners. Een op verzoek van de bewoners gehouden onderzoek van de GGD regio Nijmegen heeft de onrust alleen maar aangewakkerd. De GGD constateerde dat in de periode 1989-‐1992 bij mannen in Weurt 50 procent meer gevallen van kanker voorkwamen dan het landelijk gemiddelde. Er waren 33 gevallen van kanker bij mannen geconstateerd, terwijl op basis van het landelijk gemiddelde 22 gevallen te verwachten waren. Weurt (gemeente Beuningen) is aan drie kanten omgeven door industrieterreinen, waar een vuilverbrandingsoven, een ijzergieterij en andere zware industrie dagelijks hun afvalstoffen lozen. Volgens de bewoners zijn de fabrieken verantwoordelijk voor de kankergevallen en steeds meer voorkomende neus, keel-‐ en oogklachten.
1. Lees bovenstaand artikel uit NRC-‐Handelsblad van 19 januari 1995 (ingekort). Je mag aannemen dat de helft van Weurts bevolking mannelijk is.
a. Lijkt jou het aantal keer dat kanker voorkomt in Weurt significant hoger dan in de rest van het land of is er sprake van toeval?
b. Lijkt jou dat de aangrenzende fabrieksterreinen de oorzaak zijn van het verhoogde aantal kankergevallen in Weurt of is dat een te voorbarige conclusie?
In deze paragraaf zullen we een methode behandelen om te beslissen of de inwoners van Weurt een verhoogd risico hebben op kanker. (Het alternatief is dat het hogere aantal kankergevallen op toeval berust.)
c. Leg uit dat je uit het artikel kunt afleiden dat onder normale omstandigheden het percentage
kankergevallen onder mannen ongeveer 1,7% is.
Stel dat in Weurt de kans op kanker even groot is als in de rest van Nederland, dus 0,017 per persoon. Je kunt de mannelijke bevolking van Weurt dan beschouwen als een groep van 1300 willekeurige mannen. Het aantal kankergevallen in zo'n groep noemen we X. X is binomiaal verdeeld. (Vraag jezelf af waarom!)
d. Wat is het “aantal herhalingen n”, wat is de “succeskans p” en wat is de verwachtingswaarde van X?
e. Wat is de kans dat X niet meer dan 5 van 22 afwijkt? Met andere woorden: wat is P(17 ≤ X ≤ 27)? Wat is de kans dat X niet meer dan 10 van 22 afwijkt?
f. Vind jij, gezien de kansen in het vorige onderdeel, een aantal van 33 uitzonderlijk hoog? Heeft de bevolking van Weurt volgens jou reden tot ongerustheid?
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
11
De vraag die hier centraal staat is: bij welke aantallen kankerpatiënten verwerp je de mogelijkheid dat zo’n aantal door toeval tot stand is gekomen.
De conclusie zal zijn dat de mannen in Weurt een duidelijk hoger risico op kanker hebben. Wat de oorzaak hiervan is, is een heel ander verhaal. Uit een rapport van het Universitair Medisch Centrum St. Radboud, uit april 2004:
De resultaten van de huidige studie laten zien dat, over een periode van 13 jaar, de longkankerincidentie bij mannen in Weurt is verhoogd met circa 35 (SMR= Standardised Mortality Rate: 1,35). Ook over deze lange periode blijft de nauwkeurigheid van deze schatting echter beperkt. De schatting is gebaseerd op 27 gevallen van longkanker, terwijl er 20 werden verwacht. In het verleden leek de longkankerincidentie bij mannen sterker verhoogd. De huidige berekeningen wijzen erop dat tenminste een deel van die verhoging door toeval is veroorzaakt.
De resultaten zeggen niets over mogelijke oorzaken van longkanker. Aangezien roken de belangrijkste oorzaak is voor het ontstaan van longkanker, zou op zijn minst informatie bekend moeten zijn over het aantal rokers in Weurt in de afgelopen decennia. Hiernaast kunnen ook beroepsexposities een rol hebben gespeeld. De rol van milieufactoren lijkt ondergeschikt daar alleen bij mannen en niet bij vrouwen een verhoging in de longkankerincidentie is gevonden.
We gaan nu enkele situaties bekijken, waar je ook op grond van een statistisch gegeven een conclusie moet trekken. Het is de bedoeling is dat je de vragen op gevoel beantwoordt en toelicht; je hoeft je antwoorden dus niet wiskundig te verantwoorden. Hoe je verantwoord conclusies kunt trekken, komt later in deze PO aan de orde.
2. In tien worpen valt een munt zeven keer op kop. Iemand beweert daarom dat de munt vals is. a. Geef je hem gelijk?
Zeg dat het aantal keer (van de tien) dat de munt op kop valt niet zeven is, maar n. b. Bij welke waarden van n geef je iemand gelijk als hij zegt dat de munt vals is?
We vergroten het aantal met een factor 100. In duizend worpen valt een munt 700 keer op kop. c. Denk je dat de munt vals is?
Zeg dat het aantal keer (van de duizend) dat de munt op kop valt niet 700 is, maar n. d. Bij welke waarden van n concludeer je dat de munt vals is?
3. “Ik had graag een stuk Edammer van een pond.” De kaasboer snijdt op het oog een stuk kaas voor de klant. In acht van de tien keer blijkt het meer dan 500 gram te zijn. Een klant beweert dat de kaasboer systematisch teveel snijdt.
a. Geef je hem gelijk?
Zeg dat het aantal keer (van de tien) dat de kaasboer te veel afsnijdt niet acht is, maar n. b. Bij welke waarden van n geef je de klant gelijk?
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
12
4. De consumentenbond neemt een steekproef en weegt twintig 5-‐kilogramzakken aardappelen (zo staat het op de zakken) van een zekere groothandel. Ze blijken in totaal 97 kg te bevatten.
a. Lijkt jou de conclusie gerechtvaardigd dat 5-‐kilogramzakken van de groothandel minder dan 5 kg bevatten?
b. Wat zou je nog meer willen weten, om met meer zekerheid een oordeel te kunnen vellen?
5. Op de website nos.nl werd op 21 juni 2011 het volgende (enigszins ingekorte) bericht geplaatst:
Onder de 47 patiënten die op de Intensive Care van het Maasstad Ziekenhuis in Rotterdam een multiresistente bacterie hebben opgelopen, zijn 21 doden gevallen. Dat blijkt uit het onderzoek van het ziekenhuis zelf. Wetenschappers van het RIVM zijn nu bezig die onderzoeksresultaten te controleren. Het aantal besmettingen en ook doden zou dus nog kunnen oplopen. Het is heel moeilijk om te zeggen hoeveel doden daadwerkelijk het gevolg zijn van een infectie veroorzaakt door de multiresistente bacterie. Patiënten op een IC zijn altijd ernstig ziek en verzwakt. De artsen op de intensive care van het Maasstad Ziekenhuis gaan ervan uit dat alle patiënten zijn overleden aan hun eigenlijke kwaal, zegt arts microbioloog Tjaco Ossenwaarde van het Maasstad Ziekenhuis.
a. Lijkt je de conclusie gerechtvaardigd dat alle 21 patiënten zijn overleden aan hun eigenlijke kwaal
en niet mede aan de besmetting met de multiresistente bacterie? b. Wat zou je nog meer willen weten, om met meer zekerheid een oordeel te kunnen vellen?
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
13
2. Overschrijdingskans
6. De wiskunde A-‐docent Jan Stoer zag het examen met vertrouwen tegemoet. Zijn klas had goed gewerkt, dus verwachtte hij dat het vwo wiskunde A-‐examen wel goed zou gaan. En dat bleek ook het geval te zijn: de 25 leerlingen scoorden de volgende cijfers:
7,6 8,7 8,0 7,8 6,1 8,5 6,8 6,9 8,3 9,9 5,6 6,8 8,0 3,4 5,3 9,4 8,6 5,7 4,1 6,9 6,8 8,5 7,6 7,1 8,0
Jan maakte bij de cijfers een frequentiehistogram met klassenbreedte 1. De cijfers 4,5 tot en met 5,4 komen in de klasse “5”, enzovoort.
a. Wat was de mediaan van de cijfers?
Voor alle leerlingen in Nederland die het wiskunde A-‐examen in 2010 hebben gemaakt was de mediaan 6,7.
b. Hoeveel procent van de klas van Jan Stoer scoorde boven de landelijke mediaan?
Geen wonder dat Jan Stoer trots was op zijn klas (en op zichzelf). Henk Modaal, zijn collega Frans, is niet zo onder de indruk van de prestaties van Jans klas. Hij redeneert: als je een munt 25 keer opgooit, kan die best 19 of meer keer op kop vallen. De kans op P(X > 19)?noemen we de overschrijdingskans.
c. Hoe groot is die kans P(X > 19)?
Twee meningen, die van Jan en van zijn collega staan tegenover elkaar: Jan: “De klas heeft buitengewoon goed gepresteerd.” Henk: “Dit kan best toeval zijn.” Als Henk gelijk heeft, is de kans p dat een leerling bovenmodaal (hoger dan de landelijke mediaan)
scoort gelijk aan 21. Dat noemen we de nulhypothese H0.
Als Jan gelijk heeft, is de kans p dat een leerling bovenmodaal scoort groter dan 21; dat is de
alternatieve hypothese H1.
Kortom: H0 (Henk gelijk): p = 21 en H1 (Jan gelijk): p >
21.
H1 zegt niet hoe groot de kans p precies is; alleen maar dat hij groter is dan 21.
10
8
6
4
2
3 4 5 6 7 8 9 10
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
14
Het steekproefresultaat in het voorbeeld met Jans klas is 19 (19 leerlingen scoorden hoger dan de landelijke mediaan). De overschrijdingskans is de kans op dit steekproefresultaat (19) of een nog extremer resultaat
(dus meer dan 19), onder de aanname dat H0 waar is (p = 21), dus als je ervan uitgaat dat Henk
gelijk heeft. In dit voorbeeld is de overschrijdingskans dus de kans P(X > 19) met n = 25 en p = 21
Kun je nu op grond van dit steekproefresultaat H0 verwerpen en dus Henk gelijk geven? Nee, dat kan niet zomaar. Het blijft mogelijk dat het steekproefresultaat toevallig zo hoog is, of zelfs nog hoger. De overschrijdingskans geeft je de grootte van de kans op dit resultaat of een nog extremer afwijkend resultaat. Deze kans is klein, maar niet gelijk aan 0. Je moet daarom van tevoren beslissen wanneer je de overschrijdingskans zo klein vindt dat je H0 gaat verwerpen en dus H1 aanneemt. Veelgebruikte waarden voor dit significantieniveau (α ) zijn 10%, 5% en 1%. Als de overschrijdingskans kleiner of gelijk is aan deze gekozen α, dan verwerp je H0. In opgave 6c heb je berekend dat de overschrijdingskans P(X > 19) ≈ 0,007 is. Als er van tevoren voor een significantieniveau van 10% zou zijn gekozen, dan zou je H0 verwerpen, want dan zou gelden: P(X > 19) ≤ α (namelijk 0,007 < 0,10). Kortom: bij α = 10% verwerp je H0 en dus geef je Henk ongelijk en neem je aan dat Jan gelijk heeft: de goede resultaten van zijn leerlingen zijn zeer waarschijnlijk geen toeval. Als het steekproefresultaat niet 19 was geweest, maar 15, dan zou de overschrijdingskans P(X > 15) ≈ 0,115 dus groter zijn dan α = 0,10. In dit geval zou H0 niet worden verworpen, want de overschrijdingskans is nu groter dan het significantieniveau. Je zou in dit geval dus Henk gelijk geven: de goede resultaten van Jans klas berusten naar alle waarschijnlijkheid op toeval. We gaan deze begrippen in een ander voorbeeld nogmaals bekijken.
7. Het is weer zover: de buurkinderen zijn weer “gezellig” een potje Mens-‐Erger-‐Je-‐Niet aan het spelen: HIJ: “Nou ja, zeg! Alwéér geen zes! En jij gooit stééds zessen!” ZIJ: “Ach ja, je kunt het of je kunt het niet...” HIJ: “Maar dit is geen toeval meer. Ik wil ook met die dobbelsteen gooien!!” ZIJ: “Nou ja, zeg, je wilt toch niet beweren dat ik vals speel? Dit is gewoon mijn geluksdobbelsteen” Om een einde te maken aan de impasse besluiten ze na lang geruzie om “wetenschappelijk” te bewijzen of de dobbelsteen nou vaker dan normaal 6 gooit of niet. Ze gaan de steen 300 keer gooien en het aantal zessen tellen. Als de dobbelsteen zuiver (niet vals) is, zal dat in de buurt van de 50 moeten uitkomen (dat is wat ZIJ beweert). Als HIJ gelijk heeft, dan zal het aantal zessen groter dan 50 zijn.
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
15
Wiskundig gezien hebben we te maken met twee beweringen. ZIJ zegt dat de kans op een zes gelijk
is aan !! en HIJ zegt dat die kans groter is dan !
!:
H0: p = !! (ZIJ)
H1: p > !! (HIJ)
Ze gooien 300 keer en het aantal zessen blijkt gelijk te zijn aan 57. En tja, dan begint het gekibbel weer: HIJ: “Zie je wel! Méér dan 50 zessen!”
ZIJ: “Maar dat is toeval, ook als de kans per keer precies !! is, dan kan het best voorkomen dat er 57
zessen in 300 keer gooien komen. Het wordt tijd om de zaak wat wiskundiger te bekijken.
De kans op precies 57 zessen is binompdf(300, !!, 57) = 0,033.
Maar de kans op precies 50 zessen is binompdf(300, !!, 50) = 0,062 en dat is ook niet erg groot.
Is het nu wel of geen eerlijke dobbelsteen? Dat gaan we onderzoeken met de volgende hypothesetoets.
• De nulhypothese is H0: p =
!!.
• De alternatieve hypothese is H1: p > !!.
• De toetsingsgrootheid X is het aantal keer dat we 6 ogen gooien. X is in dit voorbeeld binomiaal verdeeld met n = 300 en p = !
!.
• Het significantieniveau kiezen we α = 0,05.
a. Bereken de overschrijdingskans P(X ≥ 57). b. Welke conclusie kun je trekken als je de overschrijdingskans vergelijkt met de gekozen α? c. Bekijk de figuur op de volgende pagina. Wat zou worden bedoeld met een rechtszijdige toets?
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
16
d. Welke bewering zou horen bij een linkszijdige toets? Wat is dan de alternatieve hypothese? e. De buren zijn het nog steeds niet eens en besluiten nogmaals 300 keer te gooien. Het resultaat is nu 58 keer een 6. Hoe groot is nu de overschrijdingskans? f. Het proces herhaalt zich. Ze blijven het oneens en gooien nog maar eens 300 keer met de
dobbelsteen. Maak een tabel met overschrijdingskansen voor (minimaal acht) verschillende uitkomsten van hun experiment.
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
17
In deze paragraaf hebben we steeds na berekening van de overschrijdingskans een beslissing genomen. Als de overschrijdingskans gelijk of kleiner was dan het gekozen significantieniveau, dan besloten we om H0 te verwerpen. We kunnen deze conclusie ook op een andere manier trekken. Met behulp van het significantieniveau kunnen we grenzen bepalen van het gebied waar we H0 verwerpen. We hoeven dan niet steeds opnieuw de overschrijdingskans te berekenen, zoals in opgave 7f, maar berekenen één keer de grenswaarde. Dit gaan we in de volgende paragraaf bekijken Wil je zelf een valse dobbelsteen maken? Bekijk dan de handleiding voor het maken van valse dobbelstenen: http://alternativetechnologies.wordpress.com/2012/08/26/vals-‐spelen-‐met-‐dobbelstenen/
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
18
3. Kritiek gebied
We benaderen het probleem van Jan en Henk uit opgave 6 nu algemener (en vergeten even dat er 19 leerlingen boven de landelijke mediaan scoorden).
• Stel dat in Jan Stoers klas alle 25 leerlingen boven de landelijke mediaan zouden hebben gescoord. Dan zou het wel heel toevallig zijn dat dat resultaat door toeval tot stand is gekomen. Het is dan veel waarschijnlijker dat Jan een hele goede docent is. In dat geval zal elk weldenkend mens Henks hypothese, dat het toeval was dat Jans klas zo goed gepresteerd heeft, verwerpen.
• Stel dat in Jans Stoers klas maar 14 leerlingen boven de landelijke mediaan zouden hebben gescoord. Dat is een heel gewoon resultaat (toeval). Dan zal een weldenkend mens Henks hypothese niet verwerpen. De vraag is nu: bij welk aantallen leerlingen die boven de mediaan scoren verwerp je Henks hypothese (oftewel: wanneer is het geen toeval meer?) en bij welke aantallen niet (oftewel: wanneer is het wél toeval?)? Met andere woorden: waar trek je de grens?
Hierboven staan de mogelijke aantallen leerlingen die boven de landelijke mediaan scoren; de aantallen lager dan 12 zijn weggelaten. Stel dat we de grens tussen 16 en 17 trekken:
De kans dat door louter toeval (zoals Henk beweerde) het aantal in het linker stuk terecht komt is
P(X ≤ 16) = binomcdf(25,21,16) ≈ 0,946. De kans dat hij in het rechter stuk terecht komt is dus P(X
≥ 17) = 1 – P(X ≤ 16) = 1 – 0,946… ≈ 0,054. Het aantal leerlingen boven de mediaan in Jans klas was 19. Dat zit in het rechter stuk. Omdat de kans om daarin terecht te komen slechts 0,054 is, is de prestatie van Jans klas waarschijnlijk geen toeval (want de kans dat het toeval is is erg klein).
We hadden de grens ook tussen 17 en 18 kunnen trekken:
De kans op het rechter stuk is nu zelfs maar P(X ≥ 18) = 1 – P(X ≤ 17) = 1 – 0,978… ≈ 0,022. Omdat het aantal in Jans klas (19) in dat gebied valt, is de conclusie gerechtvaardigd dat het geen toeval was (de kans op toeval is immers erg klein). Jan had dus een goede klas. Er zit iets willekeurigs in de aanpak. Wat vind je een kleine kans? Dat bepaalt waar je de grens gaat trekken. En dat bepaalt weer of je Henk gelijk geeft of niet.
12 13 14 15 16 17 18 19 20 21 22
12 13 14 15 16 17 18 19 20 21 22
12 13 14 15 16 17 18 19 20 21 22
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
19
De beslissingsprocedure is als volgt:
• We letten op het aantal leerlingen dat boven de landelijke mediaan scoort: dat is de toetsingsgrootheid X.
• We spreken af wanneer we een kans klein noemen. Dit α getal (of percentage) is vooraf afgesproken. Voor α neemt men vaak 0,05 (5%), 0,01 of zelfs 0,005, afhankelijk van hoe zwaarwegend de beslissing is.
• De mogelijke waarden worden opgesplitst in twee stukken, zo dat – als H0 waar is – de kans dat X een waarde binnen het ene (in dit geval rechter) stuk aanneemt kleiner is dan α.
• Als X dan tóch een waarde in dat stuk aan blijkt te nemen, zal men H0 verwerpen.
Dat stuk heet het kritieke gebied. “Kritiek”, omdat dan wel eens een verkeerde beslissing genomen kan worden. (Het blijft kansrekening; we kunnen het nooit zeker weten of Jans klas uitzonderlijk goed presteerde of dat het toeval was.) Het kritieke gebied hangt af van de waarde van het significantieniveau α . Vaak wordt α = 0,05 genomen, maar ook α = 0,10 of α = 0,01 komt geregeld voor.
8. Het bovenstaande zullen we in deze opgave verhelderen, nog altijd de discussie tussen Henk en Jan in ons achterhoofd. We gaan op zoek naar een grenswaarde g, zodanig dat P(X ≥ g) < α, waarbij α gegeven is. Dit kunnen we ook anders opschrijven: P(X ≥ g) = 1 – P(X ≤ g – 1) < α.
(Let er op dat g verandert in g – 1, want we hebben te maken met een binomiale verdeling!) Als α dus bekend is, kunnen we de grenswaarde g, die het kritieke gebied bepaalt, berekenen. (Zie Getal en Ruimte 10e editie, deel A4 H11 paragraaf 6)
a. Wat is het kritieke gebied in het voorbeeld van Jans klas bij α = 0,05? (Bereken dus eerst de
grenswaarde g! Neem Y1= 1-‐ binomcdf(25,21,X) )
b. En wat is het kritieke gebied bij α = 0,02? 9. Iemand zegt helderziende te zijn. Hij kan zeggen welke “kleur” een speelkaart heeft, klaveren,
ruiten, harten of schoppen – zonder de kaart te zien natuurlijk. Hem worden twintig kaarten voorgelegd, waarvan hij de kleur (klaveren, ruiten, harten of schoppen) gaat voorspellen. X is het aantal goede voorspellingen dat hij gaat doen.
a. Welke waarden kan X aannemen?
Stel H0 : De “helderziende” is een bedrieger en heeft geen talent om kaarten te voorspellen. Het is toeval als hij de kleur van een kaart goed heeft.
b. Wat is dan de kans per kaart dat hij hem goed voorspelt? c. Wat is dan de verwachtingswaarde van X? d. Wat is het kritieke gebied als α = 0,05? En als α = 0,1? En als α = 0,02?
10. Een atleet zegt tegen een journalist dat hij de 100 meter loopt in 11,0 seconden en dat hij 80% van zijn sprints loopt binnen de 11,3 seconden. Neem aan dat zijn 100-‐metertijd normaal verdeeld is.
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
20
a. Welke standaardafwijking volgt uit de beweringen van de atleet? Geef je antwoord in drie decimalen nauwkeurig.
De atleet gaat de 100 meter lopen. De tijd in seconden die hij gaat realiseren noemen we T. Veronderstel dat de atleet gelijk heeft. We splitsen de verzameling mogelijke waarden van T in twee stukken: -‐ waarden boven of gelijk aan een zekere grenswaarde g; dat is het kritieke gebied, -‐ waarden onder die grenswaarde g. Dat doen we zo, dat – als de atleet gelijk heeft – een resultaat in het kritieke gebied kleiner dan α is.
b. Wat is het kritieke gebied als α = 0,1? c. Bepaal ook het kritieke gebied als α = 0,05.
De journalist gelooft de atleet niet als T een waarde boven of gelijk aan g aanneemt; anders wel. De atleet realiseert een tijd van 11,48 seconden.
d. Wat is bij elk van de waarden van α (zie opgaven b en c) de conclusie van de journalist? Samengevat: Iemand doet een bewering die we gaan onderzoeken. Aan de juistheid van deze bewering wordt getwijfeld. Een hypothesetoets is een methode om te beslissen bij zo’n meningsverschil.
• De twee meningen die tegenover elkaar staan zijn: de alternatieve hypothese H1 en de nulhypothese H0
• Er is een toetsingsgrootheid ; dat is het aantal X dat geteld wordt (of een gewicht dat gemeten wordt of ...)
• De hypotheses handelen over de kans-‐parameter p van een binomiale verdeling (of de gemiddelde-‐parameter μ van een normale verdeling zoals bij opgave 10).
• Als je uitgaat van een onbevooroordeelde, kritische waarnemer, is de inhoud van H0: er is niets bijzonders aan de hand; wat er gebeurt, is zuiver toeval. H0 wordt zo geformuleerd dat p of μ onder H0 een vaste waarde hebben (bijv. p = 0,25), terwijl bij H1 een heel gebied van mogelijkheden is (bijv. H1: p < 0,25).
• De alternatieve hypothese hangt af van de bewering die onderzocht wordt en deze bewering bepaald de richting waarin je toetst: linkszijdig of rechtszijdig (of tweezijdig zie paragraaf 5).
• Het significantieniveau α . Deze α is vooraf afgesproken en wordt als getal of als percentage gegeven. Voor α neemt men vaak 0,05 (5%), 0,01 of zelfs 0,005, afhankelijk van hoe zwaarwegend de beslissing is.
Na het opstellen van de hypothesetoets volgt het nemen van een steekproef. Op grond van de waarde die X aanneemt bij deze steekproef, wordt H0 verworpen of niet. Als H0 juist is, zal het steekproefresultaat in de buurt van E(X) zitten. Als het steekproefresultaat daar sterk van afwijkt, zal H0 worden verworpen.
• De overschrijdingskans is de kans op het steekproefresultaat of een nog extremer resultaat, onder de aanname dat H0 waar is. Wat extreem is, de richting van extreem (links of rechts), wordt bepaald door de alternatieve hypothese.
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
21
Als het steekproefresultaat niet bekend is kun je een beslissingsregel opstellen. Dit is een criterium dat zegt bij welke waarden van X je het steekproefresultaat zo extreem vindt afwijken dat je de nulhypothese gaat verwerpen en de alternatieve hypothese gaat aannemen.
• Deze waarden vormen het zogenaamde kritieke gebied. Het kritieke gebied wordt zo bepaald dat – als H0 waar is – de kans dat X een waarde aanneemt in het kritieke gebied kleiner is dan de vooraf afgesproken α , het significantieniveau.
Schematisch: • H0 : …
H1 : … • X = … • α = … • kritiek gebied: …
Voorbeeld (opgave 6): • H0 : Henk heeft gelijk
H1 : Jan heeft gelijk • X = het aantal leerlingen dat hoger dan de landelijke mediaan scoort X is binomiaal verdeeld met n = 25 en succeskans p
• H0 : p = 21
H1 : p > 21
• α = 0,05 • kritiek gebied: 17, 18, … , 25 (hier hoort vanzelfsprekend een berekening bij)
11. Noteer de opgaven 9 en 10 net zoals in het voorbeeld hierboven.
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
22
4. Foute beslissingen
Na het opstellen van de hypothesetoets volgt een experiment. (Let op de juiste volgorde. Je moet eerst de toets opstellen en daarna pas het experiment uitvoeren.) Daarin neemt X een waarde aan.
• Als X in het kritieke gebied zit, wordt H0 verworpen (en dus H1 geaccepteerd). Waarschijnlijk gebeurt dat terecht, maar helemaal zeker is dat niet. Het is dus mogelijk dat een verkeerde beslissing wordt genomen. Vandaar de term kritiek gebied. Als H0 ten onrechte wordt verworpen, spreekt men van de fout van de eerste soort.
• Als X niet in het kritieke gebied zit, wordt H0 niet verworpen. Er is een redelijke kans dat dit onterecht gebeurt. Men spreekt dan van de fout van de tweede soort.
Opmerkingen: • Een fout van de tweede soort wordt meestal minder erg gevonden dan een fout van de eerste
soort. • Het significatieniveau α is de maximale fout van de eerste soort die je bereid bent toe te
staan. • als H0 niet verworpen wordt, omdat het resultaat niet significant is, kan er toch (veel) twijfel
bestaan of H0 wel juist is. Vergelijk dit met de rechtspraak: als een verdachte bij gebrek aan bewijs niet wordt veroordeeld, betekent dat nog niet dat hij onschuldig is.
12. We gaan terug naar het probleem van de docenten Henk en Jan uit opgave 6. Ter herinnering:
X is het aantal leerlingen dat hoger scoort dan de landelijke mediaan. X is binomiaal verdeeld met n=25
H0 (Henk gelijk): p = 21 en H1 (Jan gelijk): p >
21
a. Bereken de kans op de fout van de eerste soort als X=19. Hoe zou je deze kans in normaal taalgebruik formuleren?
b. Beredeneer waarom je de kans op een fout van de tweede soort niet kunt berekenen.
werkelijkheid
conclusie
na
expe
rimen
t
H0 is waar H1 is waar
H0 is waar correct fout tweede soort
H1 is waar fout eerste soort correct
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
23
c. Jan, de docent wiskunde stelt zijn bewering bij. Hij beweert nu dat 60% van zijn leerlingen boven het landelijk gemiddelde scoort. We krijgen nu een toets met twee alternatieven. H0 (Henk gelijk): p =0,5 en H1 (Jan gelijk): p =0,6 Kun je nu de kans op een fout van de tweede soort berekenen?
d. Bereken de kans op een foute beslissing (de som van de fout van de eerste soort en de fout van de tweede soort ) als X=19.
13. We gaan nu aan de slag met het programma VUstat (zie bijlage B). Open de rubriek Hypothesetoetsen en vervolgens de rubriek Test met twee alternatieven.
a. Neem p0 = 0,5 en p1 = 0,6 en vergelijk de toets bij verschillende aantallen van n, bijvoorbeeld n = 100 en n = 1000. Wat valt je op? b. Herhaal vraag a, maar nu met ander waarden voor p0 en p1. Neem bijvoorbeeld p0 = 0,4 en p1 = 0,7. Wat valt je op? c. Omschrijf wat er aan de hand is als je een fout van de eerste soort maakt.
d. Idem voor een fout van de tweede soort. e. Hoe kun je de fout van de eerste soort verkleinen? f. Wat is hiervan het gevolg voor het verwerpen van de nulhypothese? g. Hoe kun je de fout van de tweede soort verkleinen?
h. Bij welke waarde van X is de kans op een foute beslissing (de som van de fout van de eerste soort en de fout van de tweede soort ) het kleinst
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
24
5. Een-‐ of tweezijdige toetsen
14. In het begin van een voetbalwedstrijd moet de speelrichting van de teams worden bepaald en wie mag aftrappen. De scheidsrechter doet dit door “tossen”: hij gooit een muntstuk op. Als het op kop valt kiest het team dat kop koos de speelrichting en de andere partij doet de aftrap. (Voor de tweede helft is het omgekeerd.) Men gaat er bij de toss vanuit dat het muntstuk met evenveel kans op kop als op munt valt. Als in plaats van een muntstuk een kroonkurk wordt gekozen, is dat niet zo zeker.
De kans dat een kroonkurk met de holle kant naar boven valt, noemen we p. We zetten twee meningen tegenover elkaar:
H0 : p = 21 en H1 : p ≠
21
Omdat p volgens de alternatieve hypothese zowel groter als kleiner dan 0,5 kan zijn, hebben we hier te maken met een tweezijdige toets.
X is het aantal keer dat de holle kant boven komt, in een serie van vijftig worpen. H0 zal worden verworpen als de waarde van X sterk afwijkt van het verwachte aantal 25, naar beneden of naar boven. Het kritieke gebied bestaat dus uit twee stukken, namelijk de erg lage aantallen en de erg hoge aantallen. Beide
stukken moeten een kans hebben van hoogstens 21α. Met andere woorden: we moeten op zoek
naar een g1 zodanig dat P(X ≤ g1) < 21α en een g2 zodanig dat P(X ≥ g2) = 1 – P(X ≤ g2 – 1) <
21α.
(Let weer op de g2 – 1!) Deze twee grenswaarden bepalen het uit twee stukken bestaande kritieke gebied.
a. Bepaal het kritieke gebied bij α = 0,1.
X blijkt de waarde 37 aan te nemen. b. Is de kroonkurk bruikbaar om te tossen?
15. Sanne en Harm toepen regelmatig samen. Toepen is een kaartspel waarbij de spelers elk vier kaarten krijgen uit een spel van 32 kaarten: B, V, H, A, 7, 8, 9, 10 van elke kleur (harten, klaveren, schoppen en ruiten). De 10 is de hoogste, de boer de laagste kaart. Het is dus gunstig om 10-‐en te krijgen. De kans dat een speler minstens één 10 krijgt is 0,43.
a. Reken dat na.
Die kans is 0,43, tenminste als er eerlijk gedeeld wordt. Harm is argwanend en denkt dat Sanne de kaarten “steekt” als ze de kaarten deelt. Hij denkt dat Sanne – als ze zelf deelt – veel vaker ten minste één 10 heeft dan in 43% van de gevallen. We gaan dit vermoeden toetsen, in twintig keer dat Sanne deelt.
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
25
b. Formuleer H0 en H1. c. Leg uit dat je hier niet met een tweezijdige toets te maken hebt.
We spreken hier van een eenzijdige toets. d. Wat is de toetsingsgrootheid? e. Bepaal het kritieke gebied bij α = 0,1.
Harm telt dat Sanne dertien keer een of meer 10-‐en had toen zij deelde. f. Wat gaat Harm concluderen bij α = 0,1?
16. Binnenkort wordt er een proefwerk gegeven in een klas van 28 leerlingen.
a. De docent heeft er weinig vertrouwen in en beweert dat minder dan de helft van de klas een voldoende gaat halen. Welke H0-‐ en H1-‐hypothese, neem je? Wat was zijn toetsingsgrootheid? Wat is het kritieke gebied bij α = 0,05?
b. De klas bestaat uit 28 pubers die de neiging hebben zichzelf te overschatten. Zij beweren dat meer dan de helft van de klas een voldoende gaat halen. Welke H0-‐ en H1-‐hypothese, neem je? Wat was hun toetsingsgrootheid? Wat is het kritieke gebied bij α = 0,05?
c. Er is sprake van een linkszijdige en een rechtszijdige toets. Verklaar hiermee het verschil in het kritieke gebied tussen vraag a en b.
We gaan nu aan de slag met het programma VUstat (zie bijlage B). Open de rubriek Hypothesetoetsen en vervolgens de rubriek Binomiale toets. Bij het formuleren van een toets gaat het om een aantal vaste elementen. Bij de binomiale toets zijn dat: -‐ de nulhypothese p = … -‐ linkszijdige, rechtszijdige of tweezijdige toets -‐ het significantieniveau α -‐ de grootte van de steekproef -‐ het aantal successen in de steekproef (een succes is een uitkomst in overeenstemming met de nulhypothese) Het aantal successen in de steekproef is met een verticale lijn in de verdeling aangegeven. Door invullen of door die lijn te slepen kun je het aantal successen in de steekproef aanpassen. Ook hier heb je weer enkele instelmogelijkheden: • Overschrijdingskans In de verdeling worden de staven bij eenzelfde of extremer aantal successen rood gekleurd.
• Kritiek gebied In de verdeling worden de staven waarbij het aantal successen dat tot verwerpen van de nulhypothese aanleiding geeft, rood gekleurd.
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
26
• Normale benadering De best passende normale verdeling wordt getekend.
• Conclusie Met deze optie krijg je een uitgebreid geformuleerde conclusie. 17. We bekijken het probleem uit opgave 15
a. Kies de volgende instellingen: p = 0,43; α = 0,05; toets: linkszijdig; steekproef: aantal waarnemingen: 20; aantal successen: 15. Tekenen: kritiek gebied. Wat gebeurt er met je conclusie als je zowel het aantal waarnemingen als het aantal successen met een factor 10 vermenigvuldigd? b. Wat gebeurt er met je conclusie als je voor α een waarde α > 0,05 kiest? En wat als je α < 0,05 neemt?
c. Wat gebeurt er met je overschrijdingskans als je voor α een waarde α > 0,05 kiest? En wat als je α < 0,05 neemt? d. Wat gebeurt er met je overschrijdingskans als je bij toets kiest voor tweezijdig in plaats van linkszijdig? e. Wat gebeurt er met je conclusie als je bij toets kiest voor rechtszijdig in plaats van tweezijdig?
Vaak constateren mensen iets, bijvoorbeeld dat een munt vaak op kop valt en denken daarom dat
ze eenzijdig moeten toetsen. H0: kans op kop = 21 tegen H1: kans op kop >
21. Dit is onjuist. Zo’n
constatering mag je wel op het idee brengen een hypothese te toetsen, maar je moet onbevooroordeeld aan de toets beginnen: eerst de toets formuleren en dan pas het experiment uitvoeren. In dit geval moet dus tweezijdig getoetst worden. In het voorbeeld van het toepen deelt Sanne eerlijk of niet. Als ze oneerlijk deelt, is het verwachte
aantal 10-‐en per keer groter dan 21 en beslist niet kleiner. Nu moet dus eenzijdig getoetst worden.
18. Sanne beweert dat een punaise met kans 43 met de punt naar boven valt en met kans
41 met de
punt naar beneden. Harm zou niet weten waarom dat zo is.
Om Sannes bewering te toetsen, keert hij een bakje met honderd punaises ondersteboven en telt het aantal punaises X dat met de punt omhoog komt te liggen. Als significantieniveau neemt hij α = 0,1. Het kritieke gebied bestaat uit twee stukken. De kans dat de waarde van X in één van die stukken ligt, moet dus kleiner dan 0,05 zijn.
a. Bereken P(X ≥ 84) en P(X ≤ 66). b. Wat zal Harms conclusie zijn als X de waarde 84 blijkt te hebben? c. Wat zal Harms conclusie zijn als X de waarde 66 blijkt te hebben?
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
27
Als X de waarde 84 blijkt te hebben, hoeven we niet het kritieke gebied te bepalen. We kunnen volstaan met de overschrijdingskans van 84, dat is de kans op een aantal van 84 of meer,
P(X ≥ 84). Omdat die kleiner is dan 21α = 0,05, kan Harm Sannes bewering verwerpen.
19. Nog even terug naar het vermeende steken van de kaarten door Sanne (opgave 13). Neem aan dat H0 waar is: Sanne deelt eerlijk. X is het aantal keer dat Sanne een of meer 10-‐en krijgt in een serie van twintig keer dat ze zelf deelt. Als significantieniveau kiezen we weer 10%.
Bereken P(X ≥ 13).
Omdat deze kans kleiner is dan 0,1, zullen we H0 bij α = 0,1 verwerpen, als Sanne 13 keer ten minste één 10 krijgt in de serie van twintig. Ook nu hoeven we dus niet het kritieke gebied te bepalen. De kans P(X ≥ 13) is de overschrijdingskans van 13, dat is de kans op een aantal van 13 of groter.
20. Gregor Mendel (1822-‐1884) deed biologische experimenten, waarbij hij erwtenplantjes met elkaar kruiste. Volgens de theorie moesten 75% van de nakomelingen geel zijn en 25% groen. Hij testte de theorie met 8023 erwtenplantjes van de tweede generatie.
a. Welke waren Mendels H0-‐ en H1-‐hypothese, denk je? Wat was zijn toetsingsgrootheid? b. Wat is het kritieke gebied bij α = 0,05?
21. We gaan nu in de mediatheek aan de slag met VUstat (zie bijlage B).
Open de rubriek Hypothesetoetsen en vervolgens de rubriek Binomiale toets. Controleer je antwoorden op de vragen 8 t/m 20 met VUstat. Bekijk de uitgewerkte conclusie en noteer je eigen antwoorden op deze manier.
Samengevat: Soms moet je eenzijdig en soms tweezijdig toetsen.
In het geval van tweezijdig toetsen bestaat het kritieke gebied uit twee stukken. Die worden zó bepaald dat de kans dat de toetsingsgrootheid X een waarde in een van die stukken aanneemt – als H0 waar is – kleiner is dan α. Dus zó dat de kans dat X een waarde in één van die stukken aanneemt
kleiner is dan 21α.
Stel dat X de waarde x aanneemt. H0 wordt verworpen als de overschrijdingskans P(X ≥ x) kleiner is
dan 21α en ook als de overschrijdingskans P(X ≤ x) kleiner is dan
21α.
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
28
In het geval van eenzijdig toetsen bestaat het kritieke gebied uit één stuk. Dat wordt zó bepaald dat de kans dat de toetsingsgrootheid X een waarde in dat stuk aanneemt – als H0 waar is – kleiner is dan α. Stel dat X de waarde x aanneemt. Bij een rechtszijdige toets wordt H0 verworpen als de overschrijdingskans P(X ≥ x) kleiner is dan α en bij een linkszijdige toets als de overschrijdingskans P(X ≤ x) kleiner is dan α.
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
29
6. Toetsen met de binomiale verdeling
We bekijken nog even twee situaties van paragraaf 1 (zie opgaven 2 en 3).
22. In tien worpen valt een munt zeven keer op kop. Iemand beweert daarom dat de munt vals is. a. Geef je hem gelijk bij een significantieniveau van 0,1?
“Ik had graag een stuk Edammer van een pond.” De kaasboer snijdt op het oog een stuk kaas voor de klant. In acht van de tien keer blijkt het meer dan 500 gram te zijn. Een klant beweert dat de kaasboer systematisch teveel snijdt.
b. Geef je hem gelijk bij een significantieniveau van 0,1?
23. Een examen bestaat uit twintig multiplechoicevragen. Bij elk van de twintig vragen moet je een van
de vier antwoorden aankruisen. Heb je negen of meer antwoorden goed dan ben je geslaagd.
Iemand die niets van het onderwerp begrijpt en alle vragen op de gok beantwoordt kan door stom geluk toch slagen.
a. Hoe groot is zijn kans om te slagen?
Van een leerling vermoedt de leraar dat hij de toets volledig op de gok heeft ingevuld. Die leerling scoorde 8 goede antwoorden.
b. Is deze score voldoende reden om het vermoeden van de leraar te verwerpen bij een significantieniveau van 10%?
Een andere leerling heeft zich beter op de test voorbereid. Zijn kans p op het aankruisen van een juist antwoord is duidelijk groter dan 0,25. De kans om te slagen hangt af van p. Bij elke waarde van p kun je die kans op de GR uitrekenen.
c. Hoe kan dat op jouw GR? Voer die kans op je GR in als functie bij Y = … en bereken voor welke p de slaagkans 90% is.
24. Volgens de VVV van het eiland Texel regent het daar in de zomer maar op 15% van de dagen. Anja gaat daar drie weken kamperen. X is het aantal dagen dat het regent in de eenentwintig dagen dat Anja op Texel kampeert. Neem aan dat X binomiaal verdeeld is. Veronderstel dat de VVV gelijk heeft (dat is H0).
a. Wat is in dit geval E(X)?
Anja weet alles van hypothesetoetsen en zegt dat ze de bewering van de VVV op grond van haar vakantie-‐ervaring kan verwerpen bij significantieniveau 0,05.
b. Hoeveel dagen heeft het tijdens Anja’s vakantie geregend? c. Waarom is het eigenlijk twijfelachtig of X wel binomiaal verdeeld is? (Zoek de definitief van een
binomiaal kansexperiment nog eens op.)
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
30
25. In de kantine van een groot bedrijf staan vierkante tafeltjes met vier stoelen er omheen. Een psycholoog observeert het gedrag van de mensen die zich daar in de middagpauze ophouden. In het bijzonder kijkt hij naar de tafeltjes waaraan twee mensen zitten. Die twee kunnen tegenover elkaar zitten of naast elkaar aan de hoek van het tafeltje. In de loop van enkele dagen ziet hij 87 keer twee mensen aan een tafeltje: 34 keer tegenover elkaar en 53 keer naast elkaar. De psycholoog concludeert hieruit dat er een uitgesproken voorkeur is voor de hoekopstelling. (Een mogelijke verklaring is dat men oogcontact wil vermijden en dat kan moeilijk als men tegenover elkaar zit.) Statistisch verdedigt hij zijn bevinding als volgt: als er geen voorkeur zou zijn tussen beide opstellingen, zullen deze met gelijke kans worden
gekozen, dus allebei met kans 21.
Laat p de kans zijn op de hoekpositie en neem als toetsingsgrootheid X het aantal keer dat de hoekopstelling wordt gekozen.
a. Formuleer de H0-‐ en H1-‐hypothese in termen van p.
De psycholoog deed 87 observaties. X is binomiaal verdeeld met 87 herhalingen en onbekende kans p.
b. Bereken de kans dat – onder H0 – daarbij 53 of meer keer de hoekopstelling wordt geconstateerd. c. Waarom is hier sprake van een tweezijdige toets? d. Wat is je conclusie bij een significantieniveau van 10%?
e. Ben je het eigenlijk wel eens met p = 21 als je ervan uitgaat dat de twee mensen zonder een
bepaalde voorkeur aan een tafeltje gaan zitten?
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
31
7. De tekentoets
26. Een panel deskundigen proeft van acht bekende wijnen de jaargangen 2010 en 2011 en gaat daarbij na of er kwaliteitsverschil is. Na het proeven bleek dat zes van de acht wijnen van 2010 als beter werden beoordeeld. Concludeer je, bij een significantieniveau van 10%, dat er sprake is van kwaliteitsverschil? Licht toe met een berekening.
Bij elk van de wijnen wordt beslist welke de beste is: de wijn van 2010 of die van 2011. Het gaat er niet om hoeveel beter. De beste krijgt een +, de andere een −. Vervolgens worden het aantal +'en (of −'en) geteld. Daarom wordt zo'n toets een tekentoets genoemd.
Voorbeeld: We vergelijken de resultaten van paren planten. Het enige verschil tussen twee planten in een paar is dat bij de een wel kunstmest is toegepast, bij de andere niet. Als de kunstmestplant het beter doet dan de plant in zijn paar zonder kunstmest, noteer je dat met +, anders met −.
De toetsingsgrootheid X is het aantal +’en. p is de kans op een +.
H0: p = 21
Voor H1 heb je nu drie mogelijkheden:
H1: p ≠ 21; H0 wordt verworpen als de tweezijdige overschrijdingskans kleiner dan α is.
H1: p > 21; H0 wordt verworpen als de eenzijdige overschrijdingskans kleiner dan α is.
H1: p < 21; H0 wordt verworpen als de eenzijdige overschrijdingskans kleiner dan α is.
Opmerking: wat doe je als er bij een tekentoets twee gelijke voorkomen (twee planten met en zonder kunstmest presteren even goed)? Dat moet je van tevoren afspreken. Je zou die bij de resultaten weg kunnen laten. Je zou ze ook voor de helft mee kunnen tellen bij de ene groep en voor de helft bij de andere groep.
27. Soms scoort een leerling bij een herkansing ineens veel hoger dan bij de eerste toets, maar het omgekeerde komt ook voor. Een docent wiskunde zegt dat herkansingen zinloos zijn, omdat ze even vaak slechter als beter gemaakt worden dan de eerste toets. Dit jaar heeft hij veertien keer een leerling een herkansing gegeven. De resultaten staan hieronder:
eerste toets 4,7 2,0 5,5 6,1 4,7 5,4 6,9
3,3 5,0 5,1 5,5 4,8 4,4 2,9
herkansing 4,6 3,6 5,6 7,1 4,4 5,5 8,0
3,5 5,6 5,2 5,1 5,2 2,8 4,4
Tot welke conclusie leidt een tekentoets bij een significantieniveau van 0,05?
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
32
28. Twaalf mensen met een hoge bloeddruk werden behandeld met een nieuw medicijn.
Hieronder staat hun bloeddruk vóór en na de behandeling: vóór 83 72 101 98 77 101 88 96 96 107 79 79 na 79 71 91 100 88 96 84 95 97 100 80 75
Concludeer je dat het medicijn helpt? Gebruik een tekentoets met significantie 5%.
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
33
8. Onderzoek
In deze paragraaf ga je zelf op onderzoek uit. Je gaat zelf een onderzoeksvraag opstellen en deze ga je beantwoorden met behulp van een hypothesetoets. Hoe ziet een goed opgezet onderzoek er uit? We onderscheiden verschillende delen: • onderzoeksopzet • verzamelen van data • verwerken van data • analyse van data • conclusie en rapportage
Onderzoeksopzet Hierin staat de onderzoeksvraag centraal: wat wil je te weten komen? Je begint met het formuleren van een vraag, probleem of theorie. Bijvoorbeeld: “jongens zijn beter in rekenen dan meisjes”. Om de juistheid van deze hypothese te kunnen nagaan zul je eerst de begrippen meetbaar moeten maken (operationaliseren). Bijvoorbeeld: wat bedoel je met “jongens” en “meisjes”. Bedoel je jongens en meisjes uit groep 8, uit 3-‐havo of 5-‐vwo? En wat bedoel je met “beter in rekenen”? Een hogere score bij de cito-‐rekentoets? Of bij de rekenvragen in de IQ-‐test van BNN? Bij deze operationalisatie zul je keuzes moeten maken. Op basis hiervan stel je een statistische hypothese (H1) vast. Bijvoorbeeld: “jongens uit 5-‐vwo scoren hoger dan meisjes op de cito-‐rekentoets. Deze hypothese moet je vergelijken met een andere hypothese (de nulhypothese H0) die beweert dat er geen verschil is.
Verzamelen van data Dit deel bevat een plan hoe je aan de gewenste data gaat komen. Hoe groot neem je de steekproef? Als je zelf een steekproef (enquête) neemt, moet je je afvragen of die representatief is. Je moet er met name op letten dat je geen ingebouwde voorselectie hebt. Ook moet je erop letten dat je vragen niet suggestief zijn. Zie pagina 27 voor tips bij het opstellen van een enquête. Raadpleeg ook hoofdstuk 9 van Getal & Ruimte (Beschrijvende Statistiek) nog eens (zie tevens Bijlage A op pagina 30). Kijktip: bekijk de uitzending van Labyrint (30 minuten) over de verkiezingen op http://www.wetenschap24.nl/programmas/labyrint/labyrint-‐tv/2012/september/Verkiezingen.html Je mag voor je onderzoek ook bestaande data gebruiken; een lijst met websites met veel data over diverse onderwerpen vind je verderop in deze paragraaf.
Verwerken van data Verwerk de gegevens die je hebt verzameld overzichtelijk. Overweeg zelf of je de data in een tabel wilt weergeven of dat je gebruikmaakt van cirkeldiagrammen, staafdiagrammen, histogrammen, lijngrafieken, etc. Je kunt Bijlage A (zie pagina 30), een lijst met uiteengezette mogelijkheden, hiervoor gebruiken. Maak gebruik van Microsoft Excel of VUstat. Analyseren van data Ga met behulp van kansrekening na of je de nulhypothese al dan niet verwerpt. Laat zien dat je de geleerde theorie van de eerste zes paragrafen kunt toepassen! Indien je meerdere deelvragen hebt opgesteld, dan analyseer je de data uiteraard per deelvraag.
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
34
Concluderen en rapporteren Hierin beantwoord je de (deelvragen en de) onderzoeksvraag. Je vat de uitkomsten van het onderzoek samen. Deze kunnen leiden tot aanbevelingen, eventueel voor vervolgonderzoek. In een bijlage kunnen de tabellen en eventueel geraadpleegde literatuur/websites (bronnenlijst) worden opgenomen. Opmerkingen met betrekking tot het onderzoek: -‐ Verzin een onderzoeksvraag die “omvangrijk genoeg” is. Het is niet de bedoeling dat het een
onderzoek wordt dat binnen een half uur afgerond kan worden. -‐ Zoek bij gebrek aan inspiratie op internet naar leuke/interessante onderzoeksvragen. Wees
creatief! -‐ Houd er bij het operationaliseren van je onderzoeksvraag rekening mee, dat je een binomiale of
tekentoets moet kunnen gebruiken. -‐ Bedenk een passende titel voor het onderzoek. -‐ Ook aan de relevantie van het onderzoek moet aandacht worden besteed: voor wie is het
onderzoek interessant en waarom? -‐ Vraag jezelf bij het formuleren van de hypothesetoets af of het gaat om een tweezijdige of een
eenzijdige toets. Welk(e) significantieniveau(s) neem je? -‐ De onderzoeksvraag kan eventueel opgesplitst worden in deelvragen. Welke variabelen zijn
interessant? Tips bij het opstellen van een enquête:
Realiseer je om te beginnen wat het doel is van de enquête, dus wat je te weten wilt komen. Wil je bijvoorbeeld de service van je bedrijf verbeteren, een voorspelling voor de toekomst doen, eventueel passende maatregelen nemen, etc. Van belang is ook de doelgroep: zijn het mannen, 65+ers, automobilisten, veelverdieners, scholieren, hooligans? Bijzondere aandacht verdient het stellen van vragen in een enquête. Daarbij moet je op een heleboel dingen letten:
• Stel de vraag niet aan een bij voorbaat selecte groep. • Zorg ervoor dat de vraag helder gesteld is; vermijd (dubbele) ontkenningen. • De vraag mag niet suggestief zijn. • De vraag mag niet in strijd zijn met de privacy. • De vraag moet niet uitgaan van vooringenomen standpunten. • Wees specifiek; vermijd termen als “vaak”, “zelden”. • Stel geen vragen die iedereen hetzelfde zal beantwoorden. • Stel geen vragen over het verre verleden of de verre toekomst.
Websites met data over diverse onderwerpen: www.verkiezingsuitslagen.nl
Een online databank met verkiezingsuitslagen van Eerste Kamer, Tweede Kamer, provincie en gemeente, te selecteren op jaartal, provincie, kieskring en gemeente.
www.knmi.nl/klimatologie/ en www.weerdirect.nl en http://www.cesar-‐database.nl/ Websites met allerlei historische weergegevens uitgesplitst naar weerstation en datum.
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
35
http://www.gbe-‐bund.de/
Duitse site over gezondheid, ook internationale vergelijking tussen landen.
https://easy.dans.knaw.nl/dms Een Engelstalige site met data van allerlei Nederlandse onderzoeken, waarvan een flink aantal beschikbaar zijn voor geregistreerde gebruikers.
www.koningvoetbal.nl
Een website met allerlei voetbaluitslagen van de Eredivisie, maar ook wedstrijden van het Nederlands elftal, Europacupwedstrijden van Nederlandse clubs en veel info over WK’s en EK’s.
http://www.cbsinuwbuurt.nl/
Hier kun je door selectie van plaats, buurt en thema allerlei interessante gegevens op wijkniveau vinden.
http://www.meertens.knaw.nl/nfb/
Site met diverse databanken, waaronder een familienamendatabank en een voornamendatabank.
www.cbs.nl
Door te klikken op thema's, dan een thema te kiezen (bijvoorbeeld bevolking of onderwijs) en vervolgens te klikken op cijfers krijg je de mogelijkheid om via StatLine de data te sorteren naar eigen inzicht (m.b.v. de knop Pas gegevens aan). Eenmaal in StatLine kun je zelf tabellen maken.
http://www.census.gov/
Een Amerikaanse site met allerlei historische gegevens over onder andere inkomen opgesplitst naar ras (white, black, Hispanic, Asian), leeftijd, gezinssamenstelling en sekse.
www.euphix.org Engelstalige internationale vergelijking over gezondheid.
www.nationaalkompas
Over gezondheid, waarbij veel tabellen als grafisch zijn omgezet. http://lib.stat.cmu.edu/DASL/ Kies: datasubjects
Een Amerikaanse site met zeer veel data op allerlei gebied.
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
36
Bijlage A – Samenvatting Beschrijvende Statistiek H9
Statistiek begint met het stellen van een vraag, bijvoorbeeld naar de verschillen tussen twee groepen leerlingen. Om die vraag te kunnen beantwoorden worden gegevens verzameld, bijvoorbeeld door middel van een enquête. De verzamelde gegevens worden gerangschikt in een datamatrix. In de verticale kolommen van de matrix staan de scores van de gemeten variabelen, in de horizontale rijen staan de objecten van het onderzoek. Vaak is de datamatrix zo uitgebreid, dat je daaruit niet rechtstreeks conclusies kunt trekken. Daarom worden de data gerepresenteerd in getallen, kleinere tabellen of in diagrammen. In getallen: mediaan, kwartielen. In kleinere tabellen: frequentietabel, kruistabel. In diagrammen: cirkeldiagram, staafdiagram, histogram, frequentiepolygoon, boxplot. De mediaan is de waarde die de op volgorde gezette scores van een variabele in twee helften verdeelt: 50% van de scores heeft een waarde die kleiner is dan de mediaan en 50% een waarde die groter is dan de mediaan. De kwartielen zijn de waarden die de geordende scores in vier opeenvolgende kwarten verdelen. Bij een oneven aantal is de mediaan de middelste waarneming, bij een even aantal het gemiddelde van de middelste twee waarnemingen. In een frequentietabel staat hoe vaak de verschillende scores op een variabele voorkomen. De relatieve frequentie van een score is het percentage van het totaal waarin de score voorkomt.
In formule: (frequentierelatieve frequentie (in %) = 100%)totale aantal ×
Een cumulatieve (relatieve) frequentie van een score is de (relatieve) frequentie van die score plus die van alle lagere waarden (in procenten). In een kruistabel worden twee variabelen tegen elkaar uitgezet. Er staan de frequenties of de relatieve frequenties in waarin de combinaties van scores voorkomen. Voorbeeld:
geslacht
wisgroep
totaal A/C B
man 13 56 69
vrouw 30 55 85
totaal 43 111 154
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
37
Een steelbladdiagram geeft een overzicht van alle scores, gerangschikt in een verticale “steel” en horizontale “bladeren”. In een cirkeldiagram worden de percentages van de scores uitgezet als sectoren in een cirkel. Voorbeeld:
In een staafdiagram worden de (relatieve) frequenties van de scores uitgezet als losse staven. Een histogram is een staafdiagram bij een continue variabele (de scores kunnen in principe alle getallen in een domein aannemen). De scores zijn ingedeeld in klassen. De staven staan aan elkaar vast. Voorbeeld van een reepdiagram (links) en een geclusterd staafdiagram (rechts):
Een frequentiepolygoon is een lijndiagram bij een continue variabele die de (relatieve) frequenties met elkaar verbindt. Bij een cumulatieve frequentiepolygoon zijn de (relatieve) cumulatieve frequenties in een lijngrafiek gezet. Daaruit kun je bij een waarde aflezen hoeveel procent van de data een kleinere of gelijke waarde heeft. Als je de uiterste waarden, de mediaan en het eerste en derde kwartiel kent, kun je de boxplot maken.
6 1 3 3 4
6 5 5 6 6 6 7 8 9 9 9 9
7 0 0 0 1 1 1 2 3 3 4
7 5 5 6 6 6 6 7 8 9
8 0 2 2 4
8 8
9 0
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
A/C. B.
erg groot
groot
tamelijk groot
middelmatig
niet zo groot
helemaal geen
0
5
10
15
20
25
30
35
40
45
helemaal geen niet zo groot middelmatig tamelijk groot groot erg groot
A/C. B.
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
38
Voorbeeld:
kleinste
waarde
eerst
kwartie
l
med
iaan
%
B-‐groep
6,0 6,5 7,0 7,5 8,0 8,5 9,0 cijfer
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
39
Bijlage B Aan de slag met VUstat Het hoofdmenu
VUstat is meer dan alleen een statistiekprogramma. Naast de rubrieken Data analyse en Dataplot vind je verschillende rubrieken die met statistiek en kansrekening te maken hebben. Hieronder staan de rubrieken die je voor deze PO nodig hebt, met een korte toelichting. In veel
schermen kom je de infoknop tegen. Daarmee krijg je specifieke informatie op een scherm. * Data analyse Met VUstat kun je op een eenvoudige manier statistisch onderzoek doen. Dat kan met kant-‐en-‐klare bestanden, maar je kunt ook zelf een enquête houden en de resultaten in VUstat invoeren. Van de uitkomsten kun je allerlei diagrammen maken. Een uitgebreide optie om statistische plaatjes te maken vind je in Dataplot. * Dataplot Met Dataplot kun je diagrammen van frequentietabellen maken. Dat kunnen simpele diagrammen zijn, maar ook 3 dimensionale diagrammen. Je kunt zelf de vormgeving doen. * Hypothesetoetsen In deze rubriek wordt het toetsen van een hypothese met behulp van een grafiek toegelicht. Je ziet als het ware hoe de toets werkt. De conclusie van de toets wordt apart geformuleerd en kun je afdrukken of in een tekstbestand inlezen. Er zijn vier toetsen: een binomiale toets, een t-‐toets, een z-‐toets en een poissontoets. Hypothesetoetsen, Test met twee alternatieven Open de rubriek Hypothesetoetsen en vervolgens de rubriek Test met twee alternatieven. Je hebt nu enkele instelmogelijkheden en knoppen. • Hypothesen Test met twee (binomiale) alternatieven: De nul-‐hypothese H0=p0 en de alternatieve hypothese H1=p1 kun je opgeven. De resultaten op het scherm worden gerelateerd, zoals gebruikelijk, aan de nulhypothese. • Parameters De verdelingen zijn binomiale verdelingen, de waarde van p komt overeen met p0 en p1. De waarde van n, het aantal experimenten, geef je hier op. De beslisgrens is het aantal successen waarbij een beslissing voor p0 of p1 wordt genomen. De grens is de verticale lijn, die je aan/uit kunt zetten. Met de keuze van de beslisgrens ligt de grootte van de fouten van eerste en tweede soort vast. • Beeld • Grens Toont de lijn die je kunt slepen.
• Fouten
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
40
Toont de fouten van eerste en tweede soort in de grafiek, de kleuren komen overeen met de tabel. • Beslissingsgebied Toont onder de verdelingsgrafieken de ligging van de waarden waarbij de nulhypothese wordt verworpen/geaccepteerd. • Foutentabel Toont de tabel met fouten van eerste en tweede soort, de kleuren komen overeen met de grafiek. Binomiale toets Open binnen de rubriek Hypothesetoetsen de rubriek Binomiale toets. Bij het formuleren van een toets gaat het om een aantal vaste elementen. Bij de binomiale toets zijn dat: -‐ de nulhypothese p = … -‐ linkszijdige, rechtszijdige of tweezijdige toets -‐ het significantieniveau α -‐ de grootte van de steekproef -‐ het aantal successen in de steekproef (een succes is een uitkomst in overeenstemming met de nulhypothese) Het aantal successen in de steekproef is met een verticale lijn in de verdeling aangegeven. Door invullen of door die lijn te slepen kun je het aantal successen in de steekproef aanpassen. Ook hier heb je wederom enkele instelmogelijkheden: • Overschrijdingskans In de verdeling worden de staven bij eenzelfde of extremer aantal successen rood gekleurd.
• Kritiek gebied In de verdeling worden de staven waarbij het aantal successen dat tot verwerpen van de nulhypothese aanleiding geeft, rood gekleurd.
• Normale benadering De best passende normale verdeling wordt getekend.
• Conclusie Met deze optie krijg je een uitgebreid geformuleerde conclusie.
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
41
Bijlage C – Beoordeling ! Inleverdatum: groep van docent .... op datum … ! Het te laat inleveren van de PO heeft consequenties voor je eindcijfer. Voor elke werkdag dat de
PO te laat wordt ingeleverd gaat er een half punt van je eindcijfer af! ! De opdracht wordt eigendom van de school, dit onder andere in verband met de inspectie. ! In geval van een gelijkwaardige inbreng van alle leden van de groep krijgen alle leden hetzelfde
eindcijfer. Als dit niet het geval is, kan de begeleidende docent van deze regel afwijken. Het werkstuk wordt beoordeeld op gebruikte wiskunde, de correctheid van de berekeningen en/of redeneringen (toelichtingen), tekeningen en grafieken en de helderheid van de gebruikte argumentatie; dus op inhoud en vorm. In de praktijk komt dit neer op de volgende criteria: Inhoud: • tijdig inleveren • onderzoek: formulering doel-‐ of probleemstelling • de gebruikte wiskunde moet zinvol en correct zijn • wiskundig niveau • inhoudelijke samenhang, goede opbouw (“leest het als een artikel?”) • ondersteuning met diagrammen, tabellen, tekeningen, enz. • gebruik hulpmiddelen (Microsoft Excel, internet, GR, computer, etc.) • conclusie • planning (evt. tussentijds bijgesteld) • logboek • bronvermelding Verzorging: • titelpagina (namen, klas, inleverdatum, onderzoeksvraag) • goed taalgebruik • leesbaarheid en spelling • totaalindruk bij doorbladeren, zoals: indeling, structuur, overzichtelijkheid
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
42
Bijlage D – Beoordelingsformulier punten max
! VERZORGING (20): Titelpagina: onderzoeksvraag (2), namen (1), klas(sen) (1), inleverdatum (1) … 5 Taalgebruik … 5 Leesbaarheid en spelling … 5 Indeling, structuur en overzichtelijkheid … 5 -‐-‐-‐-‐-‐-‐-‐-‐ -‐-‐-‐-‐-‐-‐-‐ +
Subtotaal A … 20 ! VERANTWOORDING (20):
" Planning … 10 " Logboek … 10 -‐-‐-‐-‐-‐-‐-‐-‐ -‐-‐-‐-‐-‐-‐-‐ + Subtotaal B … 20
! CONTROLEOPGAVEN (60): … 60 -‐-‐-‐-‐-‐-‐-‐-‐ -‐-‐-‐-‐-‐-‐-‐ + Subtotaal C … 60 ! ONDERZOEK (100):
# ONDERZOEKSOPZET … 20 " Onderzoeksvraag (en deelvragen) geformuleerd
* Onderzoeksvraag omvangrijk genoeg? * Relevantie van onderzoeksvraag verantwoord
" Hypothesetoets geformuleerd * Een-‐ of tweezijdige toets verantwoord * Significantieniveau
# VERZAMELEN VAN DATA … 10 " Data in bijlage toegevoegd. Verantwoord, representatief en niet suggestief?
# VERWERKEN VAN DATA: overzichtelijk (tabellen, diagrammen, grafieken)? … 15 # ANALYSEREN VAN DATA: kansrekening uit PO toegepast? … 35
* Correcte berekeningen * Zinvolle berekeningen * Voldoende berekeningen * Voldoende wiskundig niveau
# CONCLUDEREN EN RAPPORTEREN … 10 Conclusie(s) en beantwoording onderzoeksvraag, Aanbevelingen of vervolgonderzoek
# BRONNENLIJST … 5 # Inhoudelijke samenhang, goede opbouw … 5
-‐-‐-‐-‐-‐-‐-‐-‐ -‐-‐-‐-‐-‐-‐-‐ + Subtotaal D … 10
Cijfer =
Subtotaal A: … 20
Subtotaal B: … 20
Subtotaal C: … 60
Subtotaal D: … 100
Totaal: … 200
Eindcijfer: …
Cijfer =