Twijfel en zekerheid

18
Twijfel en zekerheid Derde bijeenkomst capture, mark, recapture kleinste kwadraten methode

description

Twijfel en zekerheid. Derde bijeenkomst capture , mark, recapture kleinste kwadraten methode. Capture , mark, recapture. N = geschatte aantal M = eerste gemerkte vangst C = totaal tweede vangst R = aantal gemerkte exemplaren in tweede vangst. onderzoekje. - PowerPoint PPT Presentation

Transcript of Twijfel en zekerheid

Page 1: Twijfel en zekerheid

Twijfel en zekerheidDerde bijeenkomst

•capture, mark, recapture•kleinste kwadraten methode

Page 2: Twijfel en zekerheid

Capture, mark, recapture

Page 3: Twijfel en zekerheid

N = geschatte aantalM = eerste gemerkte vangstC = totaal tweede vangstR = aantal gemerkte exemplaren in tweede vangst

Page 4: Twijfel en zekerheid

onderzoekje In een bos zijn 100 konijnen Er worden bij de eerste vangst 20 konijnen gemerkt De konijnen worden weer losgelaten Vervolgens worden 10 keer 10 konijnen gevangen Na elke vangst worden de 10 konijnen weer losgelaten Telkens wordt bij de 10 vangsten het aantal gemerkte

konijnen genoteerd

Page 5: Twijfel en zekerheid

Spelen is leren?

= Simuleer het voorgaande verhaal m.b.v. 100 legers van het RISK-spel. Onderzoek in hoeverre het geschatte aantalN de werkelijkheid benadert.Bepaal m.b.v. onderstaande voor steekproeven aangepaste formule voor de standaarddeviatie het 95% betrouwbaarheidsinterval.

Page 6: Twijfel en zekerheid

De correlatiecoëfficiënt

Fictie of waarheid: de correlatiecoëfficiëntDe correlatiecoëfficiënt is een hulpmiddel waarmee je kunt onderzoeken of er een statistisch verband is tussen twee variabelen. Dat kunnen twee onafhankelijke variabelen zijn of een te kiezen variabele en een daarvan afhankelijke variabele. Realiseer je dat je met de correlatiecoëfficiënt een statistisch (zeg maar “rekenkundig”) verband kunt ontdekken. Daarmee is nog niet gezegd dat er ook een causaal (oorzakelijk) verband is. Immers, niets is zeker en ook dat niet. Lees bijvoorbeeld maar eens het volgende artikel uit NRC:

Page 7: Twijfel en zekerheid

https://www.nrc.nl/nieuws/2010/12/20/hoe-meer-telefoonmasten-hoe-meer-geboortes/

DOOR STEVEN DE JONG WETENSCHAP

Page 8: Twijfel en zekerheid

Er is een sterke correlatie gevonden tussen het aantal telefoonmasten en het geboortecijfer per gemeente. Iedere extra mast staat volgens de Britse wiskundige Matt Parker  in verhouding tot 17,6 baby’s meer dan het landelijke gemiddelde.

Parker vatte de bevindingen samen en maakte er een persberichtje van. Hij wilde daarmee aantonen dat journalisten oorzakelijke en statistische verbanden nogal eens door elkaar halen. Een kop als ‘Straling GSM-mast zorgt voor geboortegolf’ zou hem in zijn vooroordeel bevestigen.

Page 9: Twijfel en zekerheid

Stel dat je het verband wilt onderzoeken tussen twee variabelen x en y. Je beschikt over waarden x1, x2, x3, …., xn bij waarden y1, y2, y3, …., yn.Je vraagt je af of er een statistisch lineair verband tussen y en x bestaat: y = a.x + b

Als je de waarden van y uitzet als functie van x in een zogenaamde scatterplot (puntengrafiek) krijg je een figuur van de volgende gedaante:

Page 10: Twijfel en zekerheid

Als er een lineair verband tussen y en x bestaat, is het waarschijnlijk dat de daarbij behorende rechte door het punt

gaat. Dit punt is als het ware het zwaartepunt van je puntenverzameling:

Page 11: Twijfel en zekerheid

Voor de correlatiecoëfficiënt R geldt nu:

De correlatiecoëfficiënt (symbool R) geeft aan hoe betrouwbaar het veronderstelde wiskundige verband y = a.x + b tussen y en x is. De waarde van de correlatiecoëfficiënt ligt tussen -1 en +1 ( -1 R 1 ). Bij negatieve waarden hoort een dalende lijn bij toenemende x (a < 0), bij positieve waarden van R hoort een stijgende lijn (a > 0). Dit tekenverschil wordt vaak ondervangen door niet R te geven, maar R2. Dat geeft dus informatie over de betrouwbaarheid van de gevonden functie zonder de aard van het verband (dalende of stijgende lijn) aan te geven.

Page 12: Twijfel en zekerheid

Voor de betrouwbaarheid van de gevonden functie gelden devolgende standaardregels:•Als -0,1 < R 0 of 0 R < 0,1 is er geen correlatie, m.a.w. het gevonden verband is niet correct.•Als -0,3 < R -0,1 of 0,1 R < 0,3 is er nauwelijks correlatie, m.a.w. het gevonden verband is onbetrouwbaar.•Als -0,5 < R -0,3 of 0,3 R < 0,5 is er een matige correlatie, m.a.w. het gevonden verband is niet erg zeker.•Als -1,0 R -0,5 of 0,5 R 1,0 is er een sterke correlatie, m.a.w. het gevonden verband is sterk en natuurlijk betrouwbaarder naarmate R dichter bij -1 of 1 ligt.

Als je naar de formule voor R kijkt, begrijp je dat er aardig wat rekenwerk vast zit aan het bepalen van de correlatiecoëfficiënt. Zie hiervoor ook het onderdeel “Kleinste kwadraten methode voor een lineair verband”. Gelukkig biedt een spreadsheet programma uitkomst: uit een tabel met waarden voor variabelen x en y kun je via formules/functie invoegen/correlatie snel de waarde van R uitrekenen.

Page 13: Twijfel en zekerheid

OpdrachtEen groepje leerlingen denken dat er een lineair verband is tussen de concentratie van sulfaat in grond en de groei van waterkersplantjes op die grond. Onderzoek of hun resultaten deze hypothese ondersteunen. Maak weer gebruik van Excel.De meetresultaten vind je hierna:

sulfaatgehalte van de grond (mmol/L) groei waterkers /dag in mm

2,3 0,9

7,8 2,5

0,5 2,1

4,1 2,7

6,7 1,2

3,4 3,3

1,8 0,3

9,3 1,5

5,1 2,8

8,2 1,4

Page 14: Twijfel en zekerheid

OpdrachtEen groepje leerlingen denken dat er een lineair verband is tussen de pH van grond en de groei van waterkersplantjes op die grond. Onderzoek of hun resultaten deze hypothese ondersteunen. Maak gebruik van Excel.De meetresultaten vind je hierna:

pH van de grond groei waterkers /dag in mm

4,9 0,9

6,8 3,6

5,4 1,3

6,2 2,7

5,1 1,2

6,5 3,3

4,0 0,3

5,7 1,5

6,2 2,8

5,4 1,4

Page 15: Twijfel en zekerheid

OpdrachtOp de autosnelweg A1 van Eindhoven naar Maastricht staat voor Maastricht om vijf uur ’s middags elke dag een file. De lengte van deze file voor een aantal verschillende dagen vind je in het overzicht hierna. In dat overzicht vind je ook het aantal eieren dat door de twintig kippen van boer B. op een boerderij in Friesland werd gelegd. Bereken de correlatiecoëfficiënt. Wat zou jouw conclusie zijn?

kilometers file aantal eieren

4,9 4

7,8 12

5,7 8

3,8 2

12,1 20

6,5 8

8,4 15

9,3 18

5,1 6

8,2 11

Page 16: Twijfel en zekerheid

Kleinste kwadraten methode

(lineair verband)

Page 17: Twijfel en zekerheid

-

Uit de twee verkregen vergelijkingenBereken je v0 en a.

Page 18: Twijfel en zekerheid

Opdrachten 18, 19 en 20