Statistiek voor Historici

22
Statistiek voor Historici Hulpvak GB2HVST / G2HV09A Hulpvak GB2HVST / G2HV09A Dr. L.J. Touwen Dr. L.J. Touwen College 8 College 8

description

Statistiek voor Historici. Hulpvak GB2HVST / G2HV09A Dr. L.J. Touwen College 8. Achtste college:. Chikwadraat en correlatie revisited Steekproeven en kansberekening. Drs: 2,9 ects BA: 4 ects. Voor doctoraalstudenten geldt:. Hoofdstuk 7 (steekproeven) vervalt - PowerPoint PPT Presentation

Transcript of Statistiek voor Historici

Page 1: Statistiek voor Historici

Statistiek voor Historici

Hulpvak GB2HVST / G2HV09AHulpvak GB2HVST / G2HV09A

Dr. L.J. TouwenDr. L.J. Touwen

College 8College 8

Page 2: Statistiek voor Historici

Achtste college:

Chikwadraat en correlatie Chikwadraat en correlatie revisitedrevisited

Steekproeven en kansberekeningSteekproeven en kansberekening

Page 3: Statistiek voor Historici

Voor doctoraalstudenten geldt: Hoofdstuk 7 (steekproeven) vervaltHoofdstuk 7 (steekproeven) vervalt

Eén tentamenvraag minderEén tentamenvraag minder

óf:óf: 1,1 ects in de vrije keuzeruimte1,1 ects in de vrije keuzeruimte

Drs: 2,9 ects

BA: 4 ects

Page 4: Statistiek voor Historici

Chi-kwadraat

Ken de formule (observed minus expected Ken de formule (observed minus expected in het kwadraat gedeeld door expected, de in het kwadraat gedeeld door expected, de som daarvan)som daarvan)

Begrijp het systeem van de drempelwaarde Begrijp het systeem van de drempelwaarde (afhankelijk van de vrijheidsgraden:(afhankelijk van de vrijheidsgraden:

DF=(kolommen – 1)*(rijen – 1)DF=(kolommen – 1)*(rijen – 1)

Page 5: Statistiek voor Historici

Correlatie coëfficiënt

Berekent de mate van Berekent de mate van (beredeneerde) (beredeneerde) samenhang tussen twee variabelensamenhang tussen twee variabelen

Tussen 0 en 1 (of tussen 0 en –1)Tussen 0 en 1 (of tussen 0 en –1)

Zie voorbeelden in boek HudsonZie voorbeelden in boek Hudson

Page 6: Statistiek voor Historici

Rangcorrelatie

Instrument om bij ordinale variabelen een associatie of correlatie te ontdekken

Spearman’s rangcorrelatiecoëfficiënt berekent een correlatiecoëfficiënt op basis van de rangordes (te berekenen met de functie RANK)

Voorbeeld in Excel

Page 7: Statistiek voor Historici

Regressiemodel

Regressielijn door puntenwolkRegressielijn door puntenwolk

Verschil met trendlijn: een trend is een Verschil met trendlijn: een trend is een aspect van de tijdreeksanalyse, geen causaal aspect van de tijdreeksanalyse, geen causaal verbandverband

Methodologie is overeenkomstigMethodologie is overeenkomstig

Page 8: Statistiek voor Historici

Excel functies Correl (..), Pearson (..), RSQ(..), RANK(..)Correl (..), Pearson (..), RSQ(..), RANK(..)

Let op: voor het berekenen van Let op: voor het berekenen van trendlijnentrendlijnen(bij tijdreeksanalyse)(een lineaire trendlijn wordt net zo (bij tijdreeksanalyse)(een lineaire trendlijn wordt net zo

berekend als een regressielijn):berekend als een regressielijn):Trend(..): levert trendwaarden op Trend(..): levert trendwaarden op Lineest (..) levert de parameters van de trendlijn opLineest (..) levert de parameters van de trendlijn opNB zijn een array-functies!NB zijn een array-functies!

Slope (..), intercept(..) leveren de parameters van de Slope (..), intercept(..) leveren de parameters van de regressielijnregressielijn op. op.

Page 9: Statistiek voor Historici

Steekproeven

Het gaat om een Het gaat om een representatief representatief en en groot groot genoeggenoeg deel van de populatie deel van de populatie

Te gebruiken wanneer de populatie te groot Te gebruiken wanneer de populatie te groot is om in zijn geheel te bestuderenis om in zijn geheel te bestuderen

Page 10: Statistiek voor Historici

Steekproeven

Chapter 7: vooral aandacht voor het trekken Chapter 7: vooral aandacht voor het trekken van goede steekproevenvan goede steekproeven

§§ 7.10 hoeft niet te worden bestudeerd! 7.10 hoeft niet te worden bestudeerd!

Page 11: Statistiek voor Historici

Steekproeven

Een steekproef moet a-select worden Een steekproef moet a-select worden getrokken (getrokken (random sample=aselecte random sample=aselecte trekkingtrekking))

Er zijn twee maten om het succes van de Er zijn twee maten om het succes van de steekproef te meten:steekproef te meten:

- BetrouwbaarheidBetrouwbaarheid- NauwkeurigheidNauwkeurigheid

Page 12: Statistiek voor Historici

Steekproeven

VoorbeeldenVoorbeelden::

- de analyse van vijftig inwoners van Amsterdam in - de analyse van vijftig inwoners van Amsterdam in 1800 (om iets te zeggen over de hele bevolking 1800 (om iets te zeggen over de hele bevolking van de stad)van de stad)

- telefonische interviews over het voorgenomen telefonische interviews over het voorgenomen stemgedrag van bijv. 1000 Nederlanders aan de stemgedrag van bijv. 1000 Nederlanders aan de vooravond van de verkiezingenvooravond van de verkiezingen

- Zie ook alle voorbeelden in het boekZie ook alle voorbeelden in het boek

Page 13: Statistiek voor Historici

Steekproeven Voor betrouwbaarheid (Voor betrouwbaarheid (confidenceconfidence) van ) van

voorspellingen over de populatie en de voorspellingen over de populatie en de nauwkeurigheid (nauwkeurigheid (accuracyaccuracy) waarmee deze worden ) waarmee deze worden gedaan, geldt:gedaan, geldt:

‘Vage uitspraken zijn eerder waar!’ m.a.w.

‘Hoe preciezer je prognose, hoe groter de kans dat je naast het waarde voor de gehele populatie zit!’

Onderzocht aan de hand van de Onderzocht aan de hand van de normaalverdeling.normaalverdeling.

Page 14: Statistiek voor Historici
Page 15: Statistiek voor Historici
Page 16: Statistiek voor Historici

Centrale limietstelling: “sampling distribution is a normal distribution”

Page 17: Statistiek voor Historici

Steekproeven

Betrouwbaarheid= Hoe goed Betrouwbaarheid= Hoe goed (representatief) is onze steekproef als we (representatief) is onze steekproef als we hem vergelijken met andere (mogelijke) hem vergelijken met andere (mogelijke) steekproeven?steekproeven?

Nauwkeurigheid= hoe precies benaderen Nauwkeurigheid= hoe precies benaderen de uitspraken die we op basis van onze de uitspraken die we op basis van onze steekproef doen de werkelijke steekproef doen de werkelijke populatiekenmerken?populatiekenmerken?

Page 18: Statistiek voor Historici

Steekproeven

Bij een betrouwbaarheidsniveau van [bijvoorbeeld] 95 % of 99 %:

De kans is 95 % of 99 % dat het gemiddelde dat we berekenen op basis van onze steekproef, binnen een redelijke marge in de buurt van het populatiegemiddelde ligt.

Page 19: Statistiek voor Historici

Steekproeven

Wat is een redelijke marge ?

Bij 95% hoort een z-waarde, die het interval bepaalt: z=1,96 (komt uit een tabel).

Page 20: Statistiek voor Historici

Steekproeven

Bij een nauwkeurigheid met een maximale fout van [bijvoorbeeld] 5 % of 10%:

We accepteren een foutmarge van 5% of 10 % bij de berekening van een gemiddelde op basis van onze steekproef, ten op zichte van het (werkelijke) populatiegemiddelde.

Page 21: Statistiek voor Historici

“The historical sample”

Page 22: Statistiek voor Historici

Volgend week

Bekijk de inleveropdrachten: gelegenheid Bekijk de inleveropdrachten: gelegenheid tot het stellen van vragen.tot het stellen van vragen.

Chapter 8: CliometricsChapter 8: Cliometrics