Datajournalistiek
-
Upload
peterverweij -
Category
Education
-
view
1.778 -
download
6
description
Transcript of Datajournalistiek
Datajournalistiek
Peter VerweijD3-Media
Utrecht 2012
Programma: data bevragen en data verklaren
19.00 verschillende stappen in een onderzoek; 19.30 Data verzamelen; werken met spreadsheets; basis
en gevorderden scraping; 20.00 pauze en bespreking van de opdrachten 20.30 data analyse: data downloaden voor basis en data
cleaning voor gevorderden; verbanden en kruistabellen 21.00 discussie eigen data sets (21.30 primaire data; verzamelen: enquete en twitter api)
Meer data meer ideeen voor verhalen
Gemeente: paspoort/ID; WOZ; grafrechten;
LinjesregenKamerledenHOIHuizen verkoopWijken en pvvstemmersVerkeersongevallen/kruispunten
Europese aanbestedingenCriminaliteitKinderarbeidOlieprijzenVoedselen grondstoffenGezondheid/overgewicht
Van idee naar onderzoek
Kun je aan de data komen?Wat wil je precies weten; van idee naar hypothese?Met welk doel zijn die data verzameld en past dat bij
doelstelling van journalistieke onderzoekNiet: data doorploegen en hopen op een goed idee; ‘hypotheses are nets, only he who casts will catch’
motto KRP-Novalis)
Empirische cyclus
OnderzoekPlaats van statistiek in het onderzoek;Hoe kijk je naar het onderzoek: hypothese;Meten: probleemstelling operationalisering en meetniveau's;Meetniveau's en statistische analyse; veel gebruikte maten
en cijfers; beschrijvend en verklarend;Steekproeven, fouten marges; fouten eerste en tweede
orde;Datamatrix en data formaten; opschonen van datahttp://www.robertniles.com/stats/
Secundaire data verzamelen Downloaden uit databases en importeren
Google public data en wolfram alpha Nationaal: cbs, rivm verkeersongevallen Lokaal: cbs buurten, utrecht lokaal Internationaal: Wereldbank ; Eurostat
Scraping: Van html/xml naar xls of csv format Copy past Google docs; excel import html Python of Ruby scripts for scraping
» Scraperwiki» Voorbeeld Reuters
Pdf via cometdocs
Secundaire data 2
Data cleaning Excel zoek en vervang Google refine Data converter en mr. people
Opdracht 1 Datajournalism is teamwork: schrijvers,
onderzoekers/methodologen, programmeurs, designers; NYT hack day
Linux versus Windows :DNR Verschil tussen een database en spreadsheets Verschillende programma's: open office versus microsoft
office; mysql Elementaire bewerkingen in excel: omzet coca cola Voortgezet: zoek data voor burgemeesters
Onderzoek 2 Operationalisering:
theorie naar empirie; populariteit(theorie) naar stemmen(variabele) naar
vraag/item Operationalisering en meetniveau's
Nominaal Ordinaal Interval Ratio
Operationalisering is meten van de variabele, maar dus ook de statistiek
Onderzoek 3
Statistiek: Data analyse met
Excel via statistische functies SPSS of R program
Overzicht maten en toetsen naar meetniveau (en parametervrije toetsen)
Populatie, steekproef en foutenmarges Presentatie van data:
Als getal Als grafiek; soorten grafieken Als kaart, data koppelen aan kaart; geocoding
Opdracht 2 Voor basis:
%-stijging criminaliteitscijfers per politieregio 2005 en 2009
Voortgezet: Maak een data analyse van bestand
burgemeesters in Nederland
Discussie data sets
- Wat is originele bron en reden voor verzameling?- Wat is jouw reden; wat wil je weten; wat is je hypothese?- Wat is format van de datamatrix voor het onderzoeken van
de hypothese? Moeten de data worden opgeschoond?- Met welke berekeningen-verschillende maten en toetsen-
wil je de hypothese toetsen?- Hoe vertaal je deze technisch statistische analyse in een
journalistiek verhaal?
Primaire data verzamelen
Guardian project over de rellen in London Philip Meyer en precision journalism
Digitale enquetes Survey Monkey Google forms
Data direct downloaden via API's Programming: API en Twitter Twitter data downloaden met NodeXL
Meer....literatuur
David Herzog Data Journalism tools Report Data Journalism op DNR