“Verschillen” een statistiek hoofdstuk Statistiek en Kansrekening volgens de vernieuwde wiskunde...

30
“Verschillen” een statistiek hoofdstuk Statistiek en Kansrekening volgens de vernieuwde wiskunde cTWO

Transcript of “Verschillen” een statistiek hoofdstuk Statistiek en Kansrekening volgens de vernieuwde wiskunde...

Page 1: “Verschillen” een statistiek hoofdstuk Statistiek en Kansrekening volgens de vernieuwde wiskunde cTWO.

“Verschillen”een statistiek hoofdstuk

Statistiek en Kansrekening volgens de vernieuwde wiskunde

cTWO

Page 2: “Verschillen” een statistiek hoofdstuk Statistiek en Kansrekening volgens de vernieuwde wiskunde cTWO.

• De politiechef van Amsterdam zegt dat de criminaliteit hoog is onder Marokkanen.

• Waarom is statistisch onderzoek hierbij belangrijk?

• Hoe zou je dit statistisch onderzoeken?

Page 3: “Verschillen” een statistiek hoofdstuk Statistiek en Kansrekening volgens de vernieuwde wiskunde cTWO.

• Het gaat steeds om verschillen tussen twee groepen.

We gaan bekijken:• Vertikaal vergelijken, horizontaal percenteren• Odds-ratio• Maximaal cummulatief percentage verschil via tabel, reepdiagram en cum.freq. polygoon• Overlap• Effectgrootte

Page 4: “Verschillen” een statistiek hoofdstuk Statistiek en Kansrekening volgens de vernieuwde wiskunde cTWO.

geslachtwisgroep

totaalA/C B

man 13 56 69vrouw 30 55 85totaal 43 111 154

Bereken het percentageverschil tussen mannen en vrouwen in de A/C groep.

13 en 30 t.o.v. 43 berekenen heeft geen zin, omdat je dan geen rekening houdt met het feit dat er meer vrouwen dan mannen zijn .

Je berekent eerst hoeveel procent van de vrouwen in de A/Cgroep zitten. Ook hoeveel procent van de mannen.

Dan is het percentageverschil 30/85x100% - 13/69x100% = 16%

Page 5: “Verschillen” een statistiek hoofdstuk Statistiek en Kansrekening volgens de vernieuwde wiskunde cTWO.

• De regel is bij vertikaal vergelijken moet je eerst horizontaal percenteren.

• Als bij mannen en vrouwen een derde deel voor A/C had gekozen, was dit percentage -verschil nul geweest.

Page 6: “Verschillen” een statistiek hoofdstuk Statistiek en Kansrekening volgens de vernieuwde wiskunde cTWO.

geslachtwisgroep

totaalA/C B

man 13 56 69vrouw 30 55 85totaal 43 111 154

Een andere manier van vergelijken is de Odds-ratio Bereken twee delingen: bijvoorbeeld13/56 = 0,23.. en 30/55=0,54…deel nu de grootste door de kleinste -> 2,34.. We noemen tussen 2 en 3 het verschil middelmatig( <2 is gering >3 is groot )

Page 7: “Verschillen” een statistiek hoofdstuk Statistiek en Kansrekening volgens de vernieuwde wiskunde cTWO.

De Odds-ratio kan alleen berekend worden bij een tabel met 2 maal 2 variabelen.

Wat te doen bij meer variabelen?

Page 8: “Verschillen” een statistiek hoofdstuk Statistiek en Kansrekening volgens de vernieuwde wiskunde cTWO.

kunstbelangstelling A/C B niet 8 11 gering 11 27 middelmatig 11 43 vrij groot 9 17 groot 2 10 zeer groot 2 3  43 111

Het is mogelijk om de bovenste 3 variabelen en de onderste 3 samen te nemen.Zo is toch met 2 maal 2 variabelen te werken en de odds-ratio te berekenen.Ook is het mogelijk om een tabel met cum.frequentie in procenten te maken.

Page 9: “Verschillen” een statistiek hoofdstuk Statistiek en Kansrekening volgens de vernieuwde wiskunde cTWO.

kunstbel cum. A/C B Vcp niet 19% 10% 9%

gering 44% 34% 10%

middelmatig 70% 73% 3% vrij groot 80% 88% 8% groot 95% 97% 2% zeer groot 100% 100% 0% 

Bij een maximaal Vcp van minder dan 15% noemen we het verschil gering (15%-30% ->middelmatig, meer dan -> 30% groot)

Page 10: “Verschillen” een statistiek hoofdstuk Statistiek en Kansrekening volgens de vernieuwde wiskunde cTWO.

Reepdiagram van de kunstbelangstellingHet maximale Vcp is bij een reepdiagram te zien als de steilste verbindingslijn

810

11

27

1143

9 17

2 102 3

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

1 2

Reeks6

Reeks5

Reeks4

Reeks3

Reeks2

Reeks1

zeer groot

groot

vrij groot

middelmatig

gering

niet

A/C B

Page 11: “Verschillen” een statistiek hoofdstuk Statistiek en Kansrekening volgens de vernieuwde wiskunde cTWO.

Dit zijn nieuwe gegevensBij twee cum. freq. polygonen is het maximale Vcp te zien als de langste vertikale verbindingslijn. (natuurlijk komt een boxplot hieronder ook ter sprake)

0,0

20,0

40,0

60,0

80,0

100,0

120,0

1,0

Series1

Series2

Page 12: “Verschillen” een statistiek hoofdstuk Statistiek en Kansrekening volgens de vernieuwde wiskunde cTWO.

Hieronder zijn de scores 7, 10 en 16 op een getallenlijn doorballetjes weergegeven en de plaats van het gemiddelde met een wigje . De drie scores wijken respectievelijk -4, -1 en +5 af van het gemiddelde. Dat is in het plaatje met pijlen aangegeven.De afwijkingen noemt men deviaties; daarvoor gebruikt men de letter d (van deviatie = afwijking).De drie d-waarden zijn hier respectievelijk −4, −1 en +5.

d = −4

d = −1d = +5

5 6 7 8

9

10 11 12 13 14 15 16

Page 13: “Verschillen” een statistiek hoofdstuk Statistiek en Kansrekening volgens de vernieuwde wiskunde cTWO.

Met de deviaties wordt eerst de variantie en daarna de standaard afwijking uitgerekend.

Voor veel verdelingen geldt de volgende vuistregels:Tussen het gemiddelde-min-sd en het gemiddelde-plus-sd ligt ongeveer 68% van de gehele verdeling.Tussen het gemiddelde-min-2-keer-sd en het gemiddelde-plus-2-keer-sd ligt ongeveer 95% van de gehele verdeling.

Page 14: “Verschillen” een statistiek hoofdstuk Statistiek en Kansrekening volgens de vernieuwde wiskunde cTWO.

Overlap Bij een onderwijskundig onderzoek wordt in twee vergelijkbare klassen een wiskundig begrip op twee verschillende manieren uitgelegd: een traditionele manier en een nieuwe manier. In de twee klassen werd de uitleg afgesloten met dezelfde toets.

Page 15: “Verschillen” een statistiek hoofdstuk Statistiek en Kansrekening volgens de vernieuwde wiskunde cTWO.

27 leerlingen, in de overlap 4 + 8 + 6 = 18Niet in de overlap 9 van de 27 is ongeveer 33%Dit is een maat voor het effect van de nieuwe uitleg. Maar de groepen moeten even groot zijn.

Page 16: “Verschillen” een statistiek hoofdstuk Statistiek en Kansrekening volgens de vernieuwde wiskunde cTWO.

Een laatste methode van vergelijken is de effectgrootteDe effectgrootte is de waarde van de breuk:

verschil tussen de gemiddeldes . gemiddelde van de standaardafwijkingen

Als waardering van D is vrij gangbaar:D 0,4 gering 0,4 < D ≤ 0,8 middelmatig 0,8 < D 1,5 groot D > 1,5 erg groot

Page 17: “Verschillen” een statistiek hoofdstuk Statistiek en Kansrekening volgens de vernieuwde wiskunde cTWO.

Onderzoek 2Presteerden A/C-leerlingen in klas 3 even goed in wiskunde als B-leerlingen?Bereken - om deze vraag te beantwoorden - het maximale cumulatieve percentageverschil van cijfwis voor de A/C - en de B-groep. Hoe interpreteer je het gevonden verschil?

(gebruik bij de Digfimap freq.tabel en splitsen)

Page 18: “Verschillen” een statistiek hoofdstuk Statistiek en Kansrekening volgens de vernieuwde wiskunde cTWO.

Kansrekening

• Op dit moment beschikbaar:– Verdelingen– Discrete verdelingen– Normale verdeling

• In de maak:– Toepassingen– Toetsen

Page 19: “Verschillen” een statistiek hoofdstuk Statistiek en Kansrekening volgens de vernieuwde wiskunde cTWO.

Inhoudsopgave Verdelingen

• Frequentieverdelingen• Kans • Op den duur …• Simulaties • Rekenen met kansen • De som van de kansen is 1 • Voorwaardelijke kansen

Page 20: “Verschillen” een statistiek hoofdstuk Statistiek en Kansrekening volgens de vernieuwde wiskunde cTWO.

Voorbeeld

De minilotto is een spel waarbij je twee nummers moet omcirkelen op een formulier:

Page 21: “Verschillen” een statistiek hoofdstuk Statistiek en Kansrekening volgens de vernieuwde wiskunde cTWO.

Inhoudsopgave Discrete kansverdelingen

• Kansverdelingen• Verwachtingswaarde en standaardafwijking • Zonder terugleggen • Wel/Niet• De variantie

Page 22: “Verschillen” een statistiek hoofdstuk Statistiek en Kansrekening volgens de vernieuwde wiskunde cTWO.

Voorbeeld

Bij het kaartspel toepen worden alleen de kaarten B, V, H, A, 7, 8, 9, 10 gebruikt van elk van de kleuren schoppen, harten, ruiten en klaveren. De 10'en zijn de hoogste kaarten; het is gunstig als je veel 10'en hebt.Jan speelt het spel en krijgt vier willekeurige kaarten uit de 32 kaarten.Bereken de kans dat Jan precies twee 10'en krijgt.

Page 23: “Verschillen” een statistiek hoofdstuk Statistiek en Kansrekening volgens de vernieuwde wiskunde cTWO.

Manier 1 Er zijn zes verschillende volgordes om twee 10’en te krijgen. De kansen op elk van deze zes manieren blijken hetzelfde te zijn, namelijk

De gevraagde kans is dus

Page 24: “Verschillen” een statistiek hoofdstuk Statistiek en Kansrekening volgens de vernieuwde wiskunde cTWO.

Manier 2 Je moet twee van de vier 10’en krijgen en twee van de achtentwintig niet zijn viertallen waarbij dat het geval is. In totaal zijn er viertallen viertallen waarbij dat het geval

is.In totaal zijn er viertallen

De gevraagde kans is

Page 25: “Verschillen” een statistiek hoofdstuk Statistiek en Kansrekening volgens de vernieuwde wiskunde cTWO.

Inhoudsopgave Normale verdeling

• Extreem weer • Vele kleintjes middelen uit • Wat is normaal?• Standaardiseren• Over continue verdelingen

Page 26: “Verschillen” een statistiek hoofdstuk Statistiek en Kansrekening volgens de vernieuwde wiskunde cTWO.

Voorbeeld

We bekijken de lengte van een groep 16-jarige jongens en van een groep 16-jarige meisjes. Bij de jongens is de gemiddelde lengte 178 cm en de sd 7 cm. Bij de meisjes is de gemiddelde lengte 168 cm en de sd 6 cm. Een jongen en een meisjes uit deze groepen krijgen verkering. Ze zijn beiden erg lang: de jongen 196 cm en het meisje 186 cm.Berekende z-waarde van de lengte van de jongen en van de lengte van het meisje om te bepalen wie van de twee de grootste uitschieter is qua lengte binnen zijn/haar groep .

Page 27: “Verschillen” een statistiek hoofdstuk Statistiek en Kansrekening volgens de vernieuwde wiskunde cTWO.

Arie en Gré werken ’s nachts. Na hun werk komen ze, onafhankelijk van elkaar, tussen middernacht en 1:00 uur aan bij een bushalte.Er vertrekken in het eerste uur van de dag drie bussen: om 0:15 uur, om 0:30 uur en om 1:00 uur.a. Hoe groot is de kans dat Arie en Gré allebei de bus van 0:30 uur hebben?b. Hoe groot is de kans dat Arie en Gré dezelfde bus hebben. Tip: teken zo nodig een passend plaatje in een eenheidsvierkant.c. Hoe groot is de kans dat Arie en Gré niet meer dan 10 minuten na elkaar bij de bushalte arriveren?

Page 28: “Verschillen” een statistiek hoofdstuk Statistiek en Kansrekening volgens de vernieuwde wiskunde cTWO.
Page 29: “Verschillen” een statistiek hoofdstuk Statistiek en Kansrekening volgens de vernieuwde wiskunde cTWO.

Gemengd normaalDe lengte van 18-jarige jongens is normaal verdeeld met gemiddelde 180 en standaardafwijking 7 cm; de lengte van 18-jarige meisjes is normaal verdeeld met gemiddelde 170 en standaardafwijking 6 cm.a. Teken de twee verdelingskrommen in één figuur.

We bekijken nu een grote groep van 18-jarigen, evenveel jongens als meisjes. De lengte in cm in die groep noemen we L. b. Teken met een andere kleur de verdelingskromme van L.c. Is L normaal verdeeld, denk je? Waarom?d. Bereken P(L < 175) als de gekozen persoon een jongen is en ook als de gekozen persoon een meisje is. Wat is dus P(L < 175) in de gemengde groep?e. Is L normaal verdeeld?

Het is mogelijk de verdelingskromme van L op de GR te tekenen. Dan kun je zien dat L niet normaal verdeeld is. In het algemeen is “gemengd normaal” dus niet normaal.

Page 30: “Verschillen” een statistiek hoofdstuk Statistiek en Kansrekening volgens de vernieuwde wiskunde cTWO.

Afsluiting

• Vragen?

• Bedankt voor jullie aandacht