Datajournalistiek

16
Datajournalistiek Peter Verweij D3-Media Utrecht 2012

description

ppt voor ccj over datajournalistiek 14/2/2012

Transcript of Datajournalistiek

Page 1: Datajournalistiek

Datajournalistiek

Peter VerweijD3-Media

Utrecht 2012

Page 2: Datajournalistiek

Programma: data bevragen en data verklaren

19.00 verschillende stappen in een onderzoek; 19.30 Data verzamelen; werken met spreadsheets; basis

en gevorderden scraping; 20.00 pauze en bespreking van de opdrachten 20.30 data analyse: data downloaden voor basis en data

cleaning voor gevorderden; verbanden en kruistabellen 21.00 discussie eigen data sets (21.30 primaire data; verzamelen: enquete en twitter api)

Page 3: Datajournalistiek

Meer data meer ideeen voor verhalen

Gemeente: paspoort/ID; WOZ; grafrechten;

LinjesregenKamerledenHOIHuizen verkoopWijken en pvvstemmersVerkeersongevallen/kruispunten

Europese aanbestedingenCriminaliteitKinderarbeidOlieprijzenVoedselen grondstoffenGezondheid/overgewicht

Page 4: Datajournalistiek
Page 5: Datajournalistiek

Van idee naar onderzoek

Kun je aan de data komen?Wat wil je precies weten; van idee naar hypothese?Met welk doel zijn die data verzameld en past dat bij

doelstelling van journalistieke onderzoekNiet: data doorploegen en hopen op een goed idee; ‘hypotheses are nets, only he who casts will catch’

motto KRP-Novalis)

Page 6: Datajournalistiek

Empirische cyclus

Page 7: Datajournalistiek

OnderzoekPlaats van statistiek in het onderzoek;Hoe kijk je naar het onderzoek: hypothese;Meten: probleemstelling operationalisering en meetniveau's;Meetniveau's en statistische analyse; veel gebruikte maten

en cijfers; beschrijvend en verklarend;Steekproeven, fouten marges; fouten eerste en tweede

orde;Datamatrix en data formaten; opschonen van datahttp://www.robertniles.com/stats/

Page 8: Datajournalistiek

Secundaire data verzamelen Downloaden uit databases en importeren

Google public data en wolfram alpha Nationaal: cbs, rivm verkeersongevallen Lokaal: cbs buurten, utrecht lokaal Internationaal: Wereldbank ; Eurostat

Scraping: Van html/xml naar xls of csv format Copy past Google docs; excel import html Python of Ruby scripts for scraping

» Scraperwiki» Voorbeeld Reuters

Pdf via cometdocs

Page 9: Datajournalistiek

Secundaire data 2

Data cleaning Excel zoek en vervang Google refine Data converter en mr. people

Page 10: Datajournalistiek

Opdracht 1 Datajournalism is teamwork: schrijvers,

onderzoekers/methodologen, programmeurs, designers; NYT hack day

Linux versus Windows :DNR Verschil tussen een database en spreadsheets Verschillende programma's: open office versus microsoft

office; mysql Elementaire bewerkingen in excel: omzet coca cola Voortgezet: zoek data voor burgemeesters

Page 11: Datajournalistiek

Onderzoek 2 Operationalisering:

theorie naar empirie; populariteit(theorie) naar stemmen(variabele) naar

vraag/item Operationalisering en meetniveau's

Nominaal Ordinaal Interval Ratio

Operationalisering is meten van de variabele, maar dus ook de statistiek

Page 12: Datajournalistiek

Onderzoek 3

Statistiek: Data analyse met

Excel via statistische functies SPSS of R program

Overzicht maten en toetsen naar meetniveau (en parametervrije toetsen)

Populatie, steekproef en foutenmarges Presentatie van data:

Als getal Als grafiek; soorten grafieken Als kaart, data koppelen aan kaart; geocoding

Page 13: Datajournalistiek

Opdracht 2 Voor basis:

%-stijging criminaliteitscijfers per politieregio 2005 en 2009

Voortgezet: Maak een data analyse van bestand

burgemeesters in Nederland

Page 14: Datajournalistiek

Discussie data sets

- Wat is originele bron en reden voor verzameling?- Wat is jouw reden; wat wil je weten; wat is je hypothese?- Wat is format van de datamatrix voor het onderzoeken van

de hypothese? Moeten de data worden opgeschoond?- Met welke berekeningen-verschillende maten en toetsen-

wil je de hypothese toetsen?- Hoe vertaal je deze technisch statistische analyse in een

journalistiek verhaal?

Page 15: Datajournalistiek

Primaire data verzamelen

Guardian project over de rellen in London Philip Meyer en precision journalism

Digitale enquetes Survey Monkey Google forms

Data direct downloaden via API's Programming: API en Twitter Twitter data downloaden met NodeXL

Page 16: Datajournalistiek

Meer....literatuur

David Herzog Data Journalism tools Report Data Journalism op DNR