Datajournalistiek

Post on 27-May-2015

1.778 views 6 download

description

ppt voor ccj over datajournalistiek 14/2/2012

Transcript of Datajournalistiek

Datajournalistiek

Peter VerweijD3-Media

Utrecht 2012

Programma: data bevragen en data verklaren

19.00 verschillende stappen in een onderzoek; 19.30 Data verzamelen; werken met spreadsheets; basis

en gevorderden scraping; 20.00 pauze en bespreking van de opdrachten 20.30 data analyse: data downloaden voor basis en data

cleaning voor gevorderden; verbanden en kruistabellen 21.00 discussie eigen data sets (21.30 primaire data; verzamelen: enquete en twitter api)

Meer data meer ideeen voor verhalen

Gemeente: paspoort/ID; WOZ; grafrechten;

LinjesregenKamerledenHOIHuizen verkoopWijken en pvvstemmersVerkeersongevallen/kruispunten

Europese aanbestedingenCriminaliteitKinderarbeidOlieprijzenVoedselen grondstoffenGezondheid/overgewicht

Van idee naar onderzoek

Kun je aan de data komen?Wat wil je precies weten; van idee naar hypothese?Met welk doel zijn die data verzameld en past dat bij

doelstelling van journalistieke onderzoekNiet: data doorploegen en hopen op een goed idee; ‘hypotheses are nets, only he who casts will catch’

motto KRP-Novalis)

Empirische cyclus

OnderzoekPlaats van statistiek in het onderzoek;Hoe kijk je naar het onderzoek: hypothese;Meten: probleemstelling operationalisering en meetniveau's;Meetniveau's en statistische analyse; veel gebruikte maten

en cijfers; beschrijvend en verklarend;Steekproeven, fouten marges; fouten eerste en tweede

orde;Datamatrix en data formaten; opschonen van datahttp://www.robertniles.com/stats/

Secundaire data verzamelen Downloaden uit databases en importeren

Google public data en wolfram alpha Nationaal: cbs, rivm verkeersongevallen Lokaal: cbs buurten, utrecht lokaal Internationaal: Wereldbank ; Eurostat

Scraping: Van html/xml naar xls of csv format Copy past Google docs; excel import html Python of Ruby scripts for scraping

» Scraperwiki» Voorbeeld Reuters

Pdf via cometdocs

Secundaire data 2

Data cleaning Excel zoek en vervang Google refine Data converter en mr. people

Opdracht 1 Datajournalism is teamwork: schrijvers,

onderzoekers/methodologen, programmeurs, designers; NYT hack day

Linux versus Windows :DNR Verschil tussen een database en spreadsheets Verschillende programma's: open office versus microsoft

office; mysql Elementaire bewerkingen in excel: omzet coca cola Voortgezet: zoek data voor burgemeesters

Onderzoek 2 Operationalisering:

theorie naar empirie; populariteit(theorie) naar stemmen(variabele) naar

vraag/item Operationalisering en meetniveau's

Nominaal Ordinaal Interval Ratio

Operationalisering is meten van de variabele, maar dus ook de statistiek

Onderzoek 3

Statistiek: Data analyse met

Excel via statistische functies SPSS of R program

Overzicht maten en toetsen naar meetniveau (en parametervrije toetsen)

Populatie, steekproef en foutenmarges Presentatie van data:

Als getal Als grafiek; soorten grafieken Als kaart, data koppelen aan kaart; geocoding

Opdracht 2 Voor basis:

%-stijging criminaliteitscijfers per politieregio 2005 en 2009

Voortgezet: Maak een data analyse van bestand

burgemeesters in Nederland

Discussie data sets

- Wat is originele bron en reden voor verzameling?- Wat is jouw reden; wat wil je weten; wat is je hypothese?- Wat is format van de datamatrix voor het onderzoeken van

de hypothese? Moeten de data worden opgeschoond?- Met welke berekeningen-verschillende maten en toetsen-

wil je de hypothese toetsen?- Hoe vertaal je deze technisch statistische analyse in een

journalistiek verhaal?

Primaire data verzamelen

Guardian project over de rellen in London Philip Meyer en precision journalism

Digitale enquetes Survey Monkey Google forms

Data direct downloaden via API's Programming: API en Twitter Twitter data downloaden met NodeXL

Meer....literatuur

David Herzog Data Journalism tools Report Data Journalism op DNR