Statistiek voor Historici
description
Transcript of Statistiek voor Historici
Statistiek voor Historici
Hulpvak GB2HVST / G2HV09AHulpvak GB2HVST / G2HV09A
Dr. L.J. TouwenDr. L.J. Touwen
College 8College 8
Achtste college:
Chikwadraat en correlatie Chikwadraat en correlatie revisitedrevisited
Steekproeven en kansberekeningSteekproeven en kansberekening
Voor doctoraalstudenten geldt: Hoofdstuk 7 (steekproeven) vervaltHoofdstuk 7 (steekproeven) vervalt
Eén tentamenvraag minderEén tentamenvraag minder
óf:óf: 1,1 ects in de vrije keuzeruimte1,1 ects in de vrije keuzeruimte
Drs: 2,9 ects
BA: 4 ects
Chi-kwadraat
Ken de formule (observed minus expected Ken de formule (observed minus expected in het kwadraat gedeeld door expected, de in het kwadraat gedeeld door expected, de som daarvan)som daarvan)
Begrijp het systeem van de drempelwaarde Begrijp het systeem van de drempelwaarde (afhankelijk van de vrijheidsgraden:(afhankelijk van de vrijheidsgraden:
DF=(kolommen – 1)*(rijen – 1)DF=(kolommen – 1)*(rijen – 1)
Correlatie coëfficiënt
Berekent de mate van Berekent de mate van (beredeneerde) (beredeneerde) samenhang tussen twee variabelensamenhang tussen twee variabelen
Tussen 0 en 1 (of tussen 0 en –1)Tussen 0 en 1 (of tussen 0 en –1)
Zie voorbeelden in boek HudsonZie voorbeelden in boek Hudson
Rangcorrelatie
Instrument om bij ordinale variabelen een associatie of correlatie te ontdekken
Spearman’s rangcorrelatiecoëfficiënt berekent een correlatiecoëfficiënt op basis van de rangordes (te berekenen met de functie RANK)
Voorbeeld in Excel
Regressiemodel
Regressielijn door puntenwolkRegressielijn door puntenwolk
Verschil met trendlijn: een trend is een Verschil met trendlijn: een trend is een aspect van de tijdreeksanalyse, geen causaal aspect van de tijdreeksanalyse, geen causaal verbandverband
Methodologie is overeenkomstigMethodologie is overeenkomstig
Excel functies Correl (..), Pearson (..), RSQ(..), RANK(..)Correl (..), Pearson (..), RSQ(..), RANK(..)
Let op: voor het berekenen van Let op: voor het berekenen van trendlijnentrendlijnen(bij tijdreeksanalyse)(een lineaire trendlijn wordt net zo (bij tijdreeksanalyse)(een lineaire trendlijn wordt net zo
berekend als een regressielijn):berekend als een regressielijn):Trend(..): levert trendwaarden op Trend(..): levert trendwaarden op Lineest (..) levert de parameters van de trendlijn opLineest (..) levert de parameters van de trendlijn opNB zijn een array-functies!NB zijn een array-functies!
Slope (..), intercept(..) leveren de parameters van de Slope (..), intercept(..) leveren de parameters van de regressielijnregressielijn op. op.
Steekproeven
Het gaat om een Het gaat om een representatief representatief en en groot groot genoeggenoeg deel van de populatie deel van de populatie
Te gebruiken wanneer de populatie te groot Te gebruiken wanneer de populatie te groot is om in zijn geheel te bestuderenis om in zijn geheel te bestuderen
Steekproeven
Chapter 7: vooral aandacht voor het trekken Chapter 7: vooral aandacht voor het trekken van goede steekproevenvan goede steekproeven
§§ 7.10 hoeft niet te worden bestudeerd! 7.10 hoeft niet te worden bestudeerd!
Steekproeven
Een steekproef moet a-select worden Een steekproef moet a-select worden getrokken (getrokken (random sample=aselecte random sample=aselecte trekkingtrekking))
Er zijn twee maten om het succes van de Er zijn twee maten om het succes van de steekproef te meten:steekproef te meten:
- BetrouwbaarheidBetrouwbaarheid- NauwkeurigheidNauwkeurigheid
Steekproeven
VoorbeeldenVoorbeelden::
- de analyse van vijftig inwoners van Amsterdam in - de analyse van vijftig inwoners van Amsterdam in 1800 (om iets te zeggen over de hele bevolking 1800 (om iets te zeggen over de hele bevolking van de stad)van de stad)
- telefonische interviews over het voorgenomen telefonische interviews over het voorgenomen stemgedrag van bijv. 1000 Nederlanders aan de stemgedrag van bijv. 1000 Nederlanders aan de vooravond van de verkiezingenvooravond van de verkiezingen
- Zie ook alle voorbeelden in het boekZie ook alle voorbeelden in het boek
Steekproeven Voor betrouwbaarheid (Voor betrouwbaarheid (confidenceconfidence) van ) van
voorspellingen over de populatie en de voorspellingen over de populatie en de nauwkeurigheid (nauwkeurigheid (accuracyaccuracy) waarmee deze worden ) waarmee deze worden gedaan, geldt:gedaan, geldt:
‘Vage uitspraken zijn eerder waar!’ m.a.w.
‘Hoe preciezer je prognose, hoe groter de kans dat je naast het waarde voor de gehele populatie zit!’
Onderzocht aan de hand van de Onderzocht aan de hand van de normaalverdeling.normaalverdeling.
Centrale limietstelling: “sampling distribution is a normal distribution”
Steekproeven
Betrouwbaarheid= Hoe goed Betrouwbaarheid= Hoe goed (representatief) is onze steekproef als we (representatief) is onze steekproef als we hem vergelijken met andere (mogelijke) hem vergelijken met andere (mogelijke) steekproeven?steekproeven?
Nauwkeurigheid= hoe precies benaderen Nauwkeurigheid= hoe precies benaderen de uitspraken die we op basis van onze de uitspraken die we op basis van onze steekproef doen de werkelijke steekproef doen de werkelijke populatiekenmerken?populatiekenmerken?
Steekproeven
Bij een betrouwbaarheidsniveau van [bijvoorbeeld] 95 % of 99 %:
De kans is 95 % of 99 % dat het gemiddelde dat we berekenen op basis van onze steekproef, binnen een redelijke marge in de buurt van het populatiegemiddelde ligt.
Steekproeven
Wat is een redelijke marge ?
Bij 95% hoort een z-waarde, die het interval bepaalt: z=1,96 (komt uit een tabel).
Steekproeven
Bij een nauwkeurigheid met een maximale fout van [bijvoorbeeld] 5 % of 10%:
We accepteren een foutmarge van 5% of 10 % bij de berekening van een gemiddelde op basis van onze steekproef, ten op zichte van het (werkelijke) populatiegemiddelde.
“The historical sample”
Volgend week
Bekijk de inleveropdrachten: gelegenheid Bekijk de inleveropdrachten: gelegenheid tot het stellen van vragen.tot het stellen van vragen.
Chapter 8: CliometricsChapter 8: Cliometrics