Welkom. Wat gaan we doen? • Data leren gebruiken als startpunt van verhalen • Naar de IATI set...

Post on 24-May-2015

214 views 0 download

Transcript of Welkom. Wat gaan we doen? • Data leren gebruiken als startpunt van verhalen • Naar de IATI set...

Welkom

Wat gaan we doen?

• Data leren gebruiken als startpunt van verhalen

• Naar de IATI set kijken van buitenlandse zaken

In de IATI set• Zitten ‘alle’ ontwikkelingshulp uitgaves sinds 2005

• Per land

• Per sector

• Per organisatie

• Per dag

• Per transactie

• enz

Veel hulpmiddelen maar nog geen verhalen

We zoomen in op de belangrijkste thema’s

En laten jullie op zoek gaan naar interessante vragen en verhalen

Maar in de eerste weken leren we daarnaast Excel gevolgd door een toets (die ook meetelt voor het cijfer)

Wat is data?

[[[[[[[[[]]]]]]

Dit lijken 4 makkelijke stappen

• Maar hou er rekening mee dat onze data niet mals is

[[[[[[[[[]]]]]]

Beginnen vanuit de data of de vraag?

[[[[[[[[[]]]]]]

Data verkrijgenAPI: application programming interface

Scrapen: Het extraheren van gegevens in een document of website

OCR-software: Het gebruiken van software om afbeeldingen die tekst bevatten om te zetten in computer tekst

WOB: Wet openbaarheid van bestuur

Bestanden: Gewoon een bestandje waar het allemaal in staat

[[[[[[[[[]]]]]][[[[[[

[[[[[[[[[]]]]]][[[[[[

Scrapen

Programma’s vertellen waar je naar op zoek bent.

Levert bijna nooit perfecte resultaten

Google docs functie importHTML kan gebruikt worden om in simpele vorm te scrapen

Opschonen

• Data is vaak ingevuld door mensen• Mensen maken

– typfouten – dubbele spaties– onregelmatig afkorting gebruik

• Daarnaast is vaak niet alles relevant

Leer de data begrijpen– Wat betekenen deze cijfers?– Hoe zijn ze verkregen?– Kan ik deze bron vertrouwen?– Wat is het jargon dat gebruikt wordt?

Onze vraag?

Bij welke opleiding kunnen mannelijke studenten het beste kijken als ze op zoek zijn naar een vrouwelijke student, liefst ook nog een die later veel gaat verdienen (en voor de dames doen we hetzelfde natuurlijk)

Row 1 Row 2 Row 3 Row 40

2

4

6

8

10

12

Column 1

Column 2

Column 3

Row 1 Row 2 Row 3 Row 40

2

4

6

8

10

12

Column 1

Column 2

Column 3

http://public.tableausoftware.com/workbooks/Utrechtloongeslacht

Samenvattend

• Data!• Data, informatie, kennis, wijsheid• The inverted piramid of datajournalism

– Compile– Clean– Context– Combine– Communicate

En nu jullie

• Maar eerst 20 minuten roken/koffie drinken!

Excel

• Excel is niet sexy

• Maar toch kun je hier 90% van je werk hierin doen.

• Voor sommige zal dit makkelijk zijn, anderen wat minder. Probeer elkaar te helpen.

Excel!

• Vandaag kijken we naar:– Formules– Filteren– Sorteren

– Als we tijd hebben ook naar• Draaitabellen• Combineren

Basis

• =A1+A2• Autosom• Functies

Tijd voor wat data!

• http://www.nu.nl/data/3387101/nunl-maakt-data-beschikbaar.html

• We gaan voor de bovenste set! (Academy awards)

Filteren/Sorteren

• Filteren (data weglaten die niet boeit)• Sorteren (op volgorde zetten)

• Handig functie is subtotal• =SUBTOTAL(101,H2:H504)

Opdrachten

• Oscar set:– Wat is de film met de laagste IMDB score die erin

staat– Wat is de langste film die wel genomineerd is,

maar niet gewonnen

Maar wat als?

• Ik wil weten hoeveel Actie films er in staan?

• Wat de gemiddelde lengte is per genre?

• Of winaars een hogere imdb score hebben dan genomieerden?

Draaitabel!

• Ideaal voor het snel samenvatten van data

Vlookup (combineren)

• http://bit.ly/1ekfQis

Samenvattend

• Excel is niet sexy, maar wel handig– Formules– Functies– Filteren– Sorteren– Draaitabel– Combineren

Volgende week

• Komt (waarschijnlijk) Ellen van One World langs

• Gaan we groepen maken• Verdelen we de thema’s in de data set• Gaan we verder met Excel

Nog vragen?

• Naast:– Komt deze presentatie online te staan? (JA)