Masterscriptie Jan Kruidhof - Nerd Met Vijf Poten
-
Upload
jan-kruidhof -
Category
Documents
-
view
191 -
download
5
description
Transcript of Masterscriptie Jan Kruidhof - Nerd Met Vijf Poten
Masterscriptie Jan Kruidhof
Master journalistiek / Rijksuniversiteit Groningen
Hoofdbegeleider: Dr. A.R.J. Pleijter
Een vergelijking van de werkwijze en
routines van Nederlandse datajournalisten'Nerd met vijf poten'
'Nerd met vijf poten'Een vergelijking van de werkwijze en routines
van Nederlandse datajournalisten
Masterscriptie Jan Kruidhof
Master journalistiekRijksuniversiteit Groningen
Hoofdbegeleider: Dr. A.R.J. Pleijter
Tweede versieInleverdatum: 29 januari 2013
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
2
De grote illustratie op de voorpagina is een still uit ‘Nederland van Boven’. De onderste illustratie is gemaakt door Frédérik Ruys en verscheen bij het artikel: Dolf Rogmans, 'Cijfers
brengen de mierenhoop tot leven' Villamedia (21-10-2011).
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
3
Inhoudsopgave
6 Hoofdstuk 1: Inleiding
9 Hoofdstuk 2: Theoretisch kader
2.1: Is een databestand journalistiek?
10 2.2: Wat is datajournalistiek?
14 2.3: Computer Assisted Reporting (CAR)
16 2.3.1 Verschil CAR en datajournalistiek
2.4: Pioniers in Nederland
19 2.5: Actueel overzicht datajournalistiek in Nederland
2.5.1 Internet
20 2.5.2 Kranten
21 2.5.3 Radio en televisie
24 Hoofdstuk 3: Workflows en routines
3.1: Basiselementen van journalistieke workflow
26 3.2: The inverted pyramid of data journalism
27 3.2.1: Samenstellen
28 3.2.2: Opschonen
3.2.3: Contextualiseren
3.2.4: Combineren
29 3.3: De workflow van The Guardian
31 3.4: Workflows wereldwijd
32 3.5: Mirko Lorenz
33 3.6: Nederland van Boven
34 3.7: Luuk Sengers
3.8: Waar te beginnen?
35 3.9: Routines
38 Hoofdstuk 4: Methode
4.1 De respondenten
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
4
40 4.2 De interviews
42 4.3 Analyse van de interviews
4.4 Thema’s
44 4.5 Kwaliteit van het onderzoek
45 Hoofdstuk 5: Onderzoeksresultaten
5.1: Doelstelling
46 5.1.1: Nieuwswaarde als harde eis
5.1.2: Nieuws niet het enige doel
47 5.1.3: Visualiseren makkelijker dan data vinden
5.1.4: Persoonlijk maken
48 5.2: Onderwerpen
5.2.1: Tijdgebrek
49 5.2.2: Beschikbaarheid en aandacht
5.2.3: Veel soorten onderwerpen
50 5.2.4: Televisie stelt eisen aan datajournalistiek
5.2.5: Multimediaal project is dwingend
51 5.2.6: Persoonlijk
5.3: Samenwerken met andere partijen
52 5.3.1: Voor wat hoort wat
53 5.3.2: Crowdsourcing
5.3.3: Pogingen tot crowdsourcing
54 5.3.4: Bedrijven
55 5.3.5: Obstakels bij samenwerking met bedrijven
56 5.4: Organisatie
5.4.1: Invloed van hoofdredactie
57 5.4.2: Geen hulp van collega’s
58 5.4.3: Wel hulp van collega’s
59 5.4.4: Omvang NOS voor- en nadeel
5.4.5: Vormgeving
60 5.4.6: Vrijwilligersorganisatie
5.5: Medewerkers
61 5.5.1: Niet echt datajournalist
5.5.2: Vereiste talenten
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
5
62 5.5.3: Ideale team
63 5.5.4: Programmeerkennis
64 5.6 Werkwijze
65 5.6.1: Workflow
66 5.6.2: Meer structuur in workflow NOS
67 5.6.3: Routines
69 5.6.4: Het begin
70 5.6.5: Verkrijgen van data lastig?
71 5.6.6: CBS
72 5.6.8: Zelf data verzamelen
73 5.6.9: Data verkrijgen middels WOB
74 5.6.10: Data verkrijgen middels scrapen
75 5.6.11: Checken en opschonen
76 5.6.12: Data bevragen
77 5.6.13: Presenteren
78 5.6.14: Gratis tools
5.6.15: Consequent visualiseren
79 Hoofdstuk 6: Conclusie
84 Literatuurlijst
91 Topiclijst interviews
96 Transcripties
Dimitri Tokmetzis (Sargasso)
118 Arlen Poort (NRC Handelsblad) en Laura Wismans (nrc.next)
147 Jerry Vermanen (Nu)
165 Anke Vellenga (NOS)
179 Jasper Koning (Nederland van Boven)
202 Erik Bloem (Altijd Wat)
219 André Tak (RTL Nieuws)
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
6
1. Inleiding
“Datajournalistiek is hot”, kopte de website van de Vereniging van Onderzoeksjournalisten in
december 2011.1 “De journalistiek redden? Data!” stond een paar maanden later op De Nieuwe
Reporter.2 “Data-driven journalism is the future,” stelde Tim Berners-Lee, de bedenker van het
web.3 De Universiteit van Tilburg besloot een master datajournalistiek aan te bieden en volgens
Laurens Verhagen - hoofdredacteur van de websites van de Volkskrant, Het Parool, Trouw en
De Morgen - is datajournalistiek binnenkort onmisbaar: “Ik verwacht nog hele mooie dingen te
zien. Je kunt straks niet meer zonder datajournalistiek.”4
De afgelopen jaren waren al verschillende spraakmakende, verrassende en buitengewoon
fraaie datajournalistieke producties te zien. De Britse krant The Guardian zette 1,2 miljoen
bonnetjes van Lagerhuisleden online en gaf de bezoekers van haar site de mogelijkheid om de
declaraties door te spitten. Verdachte gevallen konden aan de redactie gemeld worden en zo
werden bonnetjes voor onder meer een nieuwe tv, een mollenvanger, beddengoed en de
renovatie van een tweede huis ontdekt.5 De Amerikaanse krant The Washington Post bracht met
het project ‘Top Secret America’ overzicht aan in het enorme netwerk van Amerikaanse
overheidsorganisaties en private bedrijven die verspreid over meer dan 10.000 locaties werken
aan topgeheime operaties.6
Ook in Nederland kwamen steeds meer datajournalistieke projecten van de grond. Het VPRO-
televisieprogramma Nederland van Boven combineerde helikopterbeelden, satellietfoto’s en
GPS-gegevens van “de krioelende mierenhoop die Nederland is” met datavisualisaties over
1 ‘Datajournalistiek is hot’, Vereniging van Onderzoeksjournalisten (08-12-2011) http://www.vvoj.nl/cms/2011/12/08/datajournalistiek-is-hot/. 2 Laura Wismans, ‘De journalistiek redden? Data!’ De Nieuwe Reporter (27-04-2012) http://www.denieuwereporter.nl/2012/04/de-journalistiek-redden-data/. 3 Charles Arthur, 'Journalists of the future need data skills, says Berners-Lee' The Guardian (19-11-2010) www.guardian.co.uk/technology/organgrinder/2010/nov/19/berners-lee-journalism-data. 4 Jerry Vermanen, ‘Nederland heeft een data-primeur nodig’ De Nieuwe Reporter (27-04-2012) http://www.denieuwereporter.nl/2012/04/nederland-heeft-een-data-primeur-nodig/. 5 ‘Investigate your MP’s expenses’, The Guardian http://mps-expenses.guardian.co.uk/; Titia Ketelaar, ‘Bonnetjesschandaal bij de Britten’ nrc.next http://www.NRCnext.nl/blog/2009/05/16/bonnetjesschandaal-bij-de-britten/; ‘MP’s expenses in the news’ http://bit.ly/PTk5Q8 6 ‘Top Secret America’ The Washington Post (18-07-2010) –http://projects.washingtonpost.com/top-secret-america/.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
7
aspecten uit het dagelijks leven en hield daarmee meer dan een miljoen kijkers per aflevering
aan de buis gekluisterd.7
Ondanks dat datajournalistiek steeds meer wordt bedreven en besproken is het nog niet
gemakkelijk om te omschrijven wat het werkveld precies inhoudt. “Both ‘data’ and ‘journalism’
are troublesome terms”, geeft journalist en docent Paul Bradshaw toe in The Data Journalism
Handbook, dat in april 2011 verscheen.8 “It represents the convergence of a number of fields
which are significant in their own right – from investigative research and statistics to design and
programming. The idea of combining those skills to tell important stories is powerful – but also
intimidating.”9
Die hoeveelheid mogelijkheden is enerzijds een prachtige ontwikkeling. “Gathering, filtering
and visualizing what is happening beyond what the eye can see has a growing value”, schreef de
Duitse journalist Mirko Lorenz.10 Anderzijds kan de overdaad aan mogelijkheden een journalist
ook overweldigen. Hoe pak je nu een onderwerp aan? Ga je met een scherp afgebakende vraag
op pad of importeer je een dataset in Excel en schudt je net zo lang tot er iets interessants
uitrolt? Moet je als journalist leren programmeren of schakel je een externe programmeur in?
Giet je de data in een mooie visualisatie waarin iedereen zelf kan grasduinen door de informatie
of schrijf je de conclusie volledig uit zodat iedereen het snapt?
Volgens Jelle Kamsma, de eerste full-time datajournalist van Nu, was het lastig om dat zelf uit
te vinden. Het gebrek aan modellen, stucturen en workflows vormde volgens hem een van de
grootste barrières voor beginnende datajournalisten. “Toen ik begon in dit werkgebied waren er
geen lokale modellen beschikbaar. Ik had een mentor nodig, maar die was er niet in Nederland,
dus ik moest ik alles zelf uitvinden. Nu zie je dat er steeds meer expertise wordt gedeeld en dat
helpt.”11 Een workflow is het stappenplan dat je volgt wanneer je aan een project werkt.
Datajournalisten zijn er nog niet over uit welke aanpak het beste werkt. Een paar vaste
onderdelen zijn al wel bekend: je moet de data verkrijgen, opschonen, analyseren en het
resultaat - in wat voor vorm dan ook - publiceren. Maar hoe je dit proces goed aanpakt is nog
7 Peter Teffer, ’Nederland van Boven is de ijsbreker voor de datajournalistiek’ De Nieuwe Reporter (23-12-2011) http://www.denieuwereporter.nl/2011/12/nederland-van-boven-is-de-ijsbreker-voor-de-datajournalistiek/ http://nederlandvanboven.vpro.nl/ 8 Paul Bradshaw, ‘What is data journalism’ Data Journalism Handbook http://datajournalismhandbook.org/1.0/en/introduction_0.html 9 Paul Bradshaw, ‘How to be a data journalist’ The Guardian http://www.guardian.co.uk/news/datablog/2010/oct/01/data-journalism-how-to-guide 10 Mirko Lorenz, ‘Why journalists should use data’ Data Journalism Handbook (geen datum) http://datajournalismhandbook.org/1.0/en/introduction_1.html. 11 Liliana Bounegru, 'Digging deeper: An in-depth look at data journalism in the Netherlands' Data Driven Journalism (06-12-2011) datadrivenjournalism.net/news_and_analysis/doing_data_journalism_in_the_netherlands.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
8
niet uitgekristalliseerd. Lucien Baard van De Twentse Courant Tubantia vergeleek het met het
bakken van een cake: “Datajournalistiek bestaat uit een aantal ingrediënten. Wij hebben meel,
eieren, melk, enzovoort. We gooien alles in een zak en schudden ermee, hopend dat er een cake
uitkomt.”12
Wat zou het mooi zijn als je een kijkje in de keuken van de Nederlandse datajournalisten zou
kunnen nemen, dacht ik. Hoe zouden zij een datajournalistiek project aanpakken? En waar
zitten de verschillen? Werkt een krant anders dan een blog? Is de convergentie van de
journalistiek inmiddels al in zo’n vergevorderd stadium dat je dit terugziet in de aanpak van
datajournalistieke projecten? Al deze vragen komen samen in een hoofdvraag: in hoeverre
verschillen de workflows en routines van Nederlandse journalisten die zich bezighouden met
datajournalistiek? Om deze vraag te beantwoorden ging ik in gesprek met deze journalisten,
maar onderzocht ik ook wat in welke traditie de Nederlandse datajournalistiek voortborduurt en
wat in het recente verleden al door wetenschappers over dit onderwerp geschreven is.
In het onderzoek wordt allereerst het onderzoekssubject gepresenteerd. Er wordt besproken
hoe datajournalistiek gedefinieerd zou kunnen worden en welke geschiedenis het metier heeft
binnen en buiten onze landsgrenzen. Daarnaast wordt besproken welke actuele ontwikkelingen
in Nederland plaatsvinden op dit gebied. Vervolgens wordt een overzicht gegeven van de
onderzoeken die al eerder zijn gedaan naar de werkwijze van datajournalisten. Welke workflows
zijn bekend en welke stappen zijn hierin te onderscheiden? Aansluitend wordt uiteengezet hoe
dit onderzoek is uitgevoerd, hoe de respondenten zijn gekozen en geïnterviewd en welke
methodes gehandhaafd zijn voor de analyse van de interviews. Hierna zullen de
onderzoeksresultaten worden gepresenteerd. Tenslotte wordt de conclusie worden getrokken uit
het onderzoek en de onderzoeksresultaten.
12 Jerry Vermanen, ‘Vier lessen voor beginnende datajournalisten’ De Nieuwe Reporter (29-02-2012) http://www.denieuwereporter.nl/2012/02/vier-lessen-voor-beginnend-datajournalisten/.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
9
2. Theoretisch kader
Datajournalistiek is enerzijds een nieuwe ontwikkeling, maar kent anderzijds een lange traditie.
In dit hoofdstuk zal worden uiteengezet hoe datajournalistiek opkwam en op welke
journalistieke geschiedenis het voorborduurt. Maar wat is datajournalistiek nu exact? Over het
antwoord op die vraag wordt nog flink gediscussieerd. De verschillende visies en standpunten in
dit dispuut komen uitgebreid aan bod. Daarnaast zal worden beschreven hoe datajournalistiek
zich momenteel in Nederland ontwikkelt.
2.1 Is een databestand journalistiek?
Misschien denkt u wel: “Laten we nu niet allemaal direct achter de zoveelste journalistieke rage
aanrennen. Want data, is dat nu wel journalistiek? Het publiceren van ruwe data an sich, kun je
dat echt onder de noemer journalistiek scharen?” Adrian Holovaty, een jonge journalist en
programmeur uit de Amerikaanse staat Illinois, was een van de eerste datajournalisten en hij
werd een beetje zat van die vraag. In 2009 beantwoordde hij hem op zijn blog.
Here, at last, is the definitive, two-part answer:
1. Who cares?
2. I hope my competitors waste their time arguing about this as long as possible.13
Holovaty won in 2005 op 24-jarige leeftijd de Knight Batten Award voor innovatieve
journalistiek voor de site ChicagoCrime.org. Dit was een van de eerste zogenaamde mash-ups
van data. Op de site werden misdaadcijfers van de politie van Chicago gecombineerd met de
kaartgegevens van Google Maps. Inwoners van de stad konden na het invullen van eigen
postcode bijvoorbeeld precies zien hoeveel moorden recentelijk in hun omgeving waren
gepleegd en waar de meeste overvallen plaatsvonden.14 Inmiddels is de site opgegaan in
EveryBlock, wat Holovaty zelf omschreef als “chicagocrime.org on steroids”, met meer dan
alleen misdaadcijfers en informatie over verscheidene Amerikaanse steden.15
13 Adrian Holovaty, ‘The definitive, two-part answer to "is data journalism?"’ Adrian Holovaty http://www.holovaty.com/writing/data-is-journalism/ (21-05-2009). 14 Pamela Licalzi O'Connell, ‘Do-It-Yourself Cartography’ New York Times http://www.nytimes.com/2005/12/11/magazine/11ideas1-13.html?_r=1 (11-12-2005). 15 Adrian Holovaty, ‘In memory of chicagocrime.org’ Adrian Holovaty http://www.holovaty.com/writing/chicagocrime.org-tribute/’ (31-01-2008).
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
10
In 2006 schreef Holovaty een bericht op zijn blog wat naderhand werd omschreven als “het
manifest voor datajournalistiek”.16 In zijn bericht riep Holovaty nieuwsorganisaties op afscheid
te nemen van het wereldbeeld dat gefocust is op klassieke verhalen met een titel, intro en een
lead. Wat hij dan wel wilde? Als voorbeeld noemde hij een verslag van een brand. “Being able to
read that story on a cell phone is fine and dandy. Hooray, technology! But what I really want to
be able to do is explore the raw facts of that story, one by one, with layers of attribution, and an
infrastructure for comparing the details of the fire.”17 Hij zou willen dat hij de details van de
brand – datum, tijd, plaats, slachtoffers, brandweerkazerne, afstand tot de kazerne, namen en
jaren werkervaring van betrokken brandweermannen, tijd die het kostte om te arriveren – zou
kunnen vergelijken met de details van eerdere branden. Dat is een goed voorbeeld van een
datajournalistieke manier van denken.
Holovaty vond het zelf niet belangrijk of wat hij voor ogen had journalistiek genoemd kon
worden. “[T]he question of ‘How is this journalism?’ is academic”, schreef hij. Journalisten
zouden zich volgens hem minder druk moeten maken om wat wel en niet journalistiek is en
meer om belangrijke, specifieke informatie waar mensen wat aan hebben in hun leven en die
hun helpt om de wereld beter te begrijpen. “A newspaper ought to be that: a fair look at current,
important information for a readership.”18
2.2 Wat is datajournalistiek?
Adrian Holovaty was niet alleen degene die journalisten opriep om data en journalistiek te
combineren, maar ook de eerste die dat beschreef als “data journalism”. Simon Rogers,
eindredacteur van het datablog van The Guardian en een voorbeeld voor datajournalisten
wereldwijd, schreef althans op Twitter: “I first heard the words 'data journalism' from
@adrianholovarty here in 2006. Started a journey for me”.19
Nu was er dus een doel en een richting. Maar nog steeds was het niet gemakkelijk om
datajournalistiek te omschrijven. Journalist en computerwetenschapper Jonathan Stray
omschrijft datajournalistiek kortweg als “obtaining, reporting on, curating and publishing data
in the public interest”.20 Het lastige van zo’n omschrijving is, dat er van alles onder kan vallen.
16 Adina Levin, ‘Database journalism – a different definition of “news” and “reader”’ BookBlog http://www.alevin.com/?p=1391 (23-03-2009). 17 Adrian Holovaty, ‘A fundamental way newspaper sites need to change’ http://www.holovaty.com/writing/fundamental-change/ Adrian Holovaty (06-09-2006). 18 Ibidem. 19 Simon Rogers, ‘@smfrogers’ Twitter (29-08-2011) https://twitter.com/smfrogers/status/108238296685096961. 20 Jonathan Stray, ‘A computional journalism reading list’ Jonathan Stray http://jonathanstray.com/a-computational-journalism-reading-list (31-01-2011).
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
11
“In its current state, data journalism describes neither a beat21 nor a particular medium”, stelde
Associated Press-redacteur Troy Thibodeaux.22 Datajournalistiek gaat immers niet alleen over
financiële of politieke onderwerpen. Het kan net zo goed gevaarlijke verkeerssituaties in een
klein dorpje in kaart brengen als een overzicht bieden van de toestand van het onderwijs in een
heel land. Verhalen die middels datajournalistiek tot stand komen kunnen gepubliceerd worden
in kranten of op websites, maar ook in apps of televisieprogramma’s. Bovendien omhelst het een
overlappende set van uiteenlopende competenties uit verschillende werkvelden. Die combinatie
van werkwijzes is volgens Thibodeaux vooral waar het in de datajournalistiek om gaat. De
statistiekmethoden uit de sociale wetenschap, de technieken om kaarten te maken uit
Geografische Informatie Systemen (GIS), de visualisaties van grafisch vormgevers en allerlei
technieken van computerwetenschappers: database-administratie, systeem-engineering
enzovoort.
Simon Rogers geeft, net als Adrian Holovaty, weinig om een specifieke definitie. In zijn artikel
met de veelzeggende titel ‘Anyone can do it - Datajournalism is the new punk’ stipt hij vooral
aan wat datajournalistiek niet is. Zo gaat het volgens hem niet alleen om
onderzoeksjournalistiek. “Not all data journalism has to bring down the government - it's often
enough for it to shine a light in corners that are less understood, to help us see the world a little
clearer.” Ook gaat het niet alleen om visualisaties. Data leent zich daar toevallig goed voor, maar
terwijl sommige verhalen het beste tot hun recht komen in plaatjes en infographics, komen
andere verhalen het beste tot hun recht in een geschreven tekst.23 Zelfs iets wat slordig
uitgevoerd is kan toch raak zijn, stelt Rogers. “Of course, for some people, this will never be
journalism. But then, who cares? While they're worrying about the definitions, the rest of us can
just get on with it.”24
NRC Handelsblad-redacteur Dick van Eijk, die als een van de eerste Europese journalisten
met datajournalistiek aan de slag ging, geeft wel om definities. In het jaarboek
Onderzoeksjournalistiek 2012 van de Vereniging van Onderzoeksjournalisten (VVOJ) stelt hij
allereerst dat het jammer is dat er zo weinig oog is voor de lange geschiedenis die
datajournalistiek in Nederland heeft. In zijn slotalinea merkt hij op dat datavisualisatie toch
21 Een bepaald onderwerp dat je als journalist langdurig volgt en waar je regelmatig verslag van doet. 22 Troy Thibodeaux, ‘5 tips for getting started in data journalism’ Poynter (06-10-2011) http://www.poynter.org/how-tos/digital-strategies/147734/5-tips-for-getting-started-in-data-journalism/. 23 Simon Rogers, ‘Anyone can do it - Datajournalism is the new punk’ The Guardian Datablog (24-05-2012) http://www.guardian.co.uk/news/datablog/2012/may/24/data-journalism-punk 24 Ibidem.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
12
echt iets anders is dan datajournalistiek, hoewel het wel vaak op één hoop gegooid wordt. “Een
cruciaal aspect van journalistiek ontbreekt in datavisualisaties: het verhaal.”25
Ook Nu-datajournalist Jerry Vermanen – die zich overigens voornamelijk richt op
datavisualisaties – vindt ook dat iets wel aan bepaalde eisen moet voldoen voordat het
datajournalistiek genoemd kan worden. “RTL doet nog steeds aan datajournalistiek, volgens
André Tak”, schrijft hij op Twitter, verwijzend naar een artikel op De Nieuwe Reporter waarin
de chef onderzoeksredactie van RTL Nieuws werd aangehaald.26 “Dat klopt dus niet”, reageert
Vermanen.27 In een e-mail legt hij uit wat hij bedoelt: “Het belangrijkste voor mij is dat RTL wel
aan datajournalistiek doet, maar niet zo vaak als ze zelf denken. Volgens mij kun je het pas
datajournalistiek noemen zodra je een goede analyse volgens een datajournalistiek proces erop
hebt toegepast. En dat gebeurt niet altijd.”28 Maar Vermanen kijkt ook direct kritisch naar zijn
eigen werk. “Daarbij kun je ook opmerken dat niet al mijn werk bij NU.nl datajournalistiek is.
Een simpel grafiekje bij een werkeloosheidsbericht? Is dat datajournalistiek? Dat maakt mij niet
zoveel uit, eigenlijk. Ik vind het belangrijker dat áls iets wordt voorgehouden als
datajournalistiek, dat er ook daadwerkelijk een analyse op is toegepast waarin enkele
basisprincipes van datajournalistiek terugkomen.” Wat de basisprincipes van datajournalistiek
zijn en wat het datajournalistiek proces behelst, komt in het volgende hoofdstuk aan bod.
Kortom: er is nog geen vaste definitie te geven van het begrip datajournalistiek.
Datajournalisten zijn het daar onderling nog niet over eens en maken zich ook lang niet allemaal
druk om een precieze definitie – zelfs niet als het om hun eigen werk gaat – zoals ook uit de
woorden van Vermanen blijkt. Toch moest voor dit onderzoek ergens een grens worden
getrokken. Wat werd allemaal meegenomen in het onderzoek? Wat kan allemaal gezien worden
als datajournalistiek? Aangezien er op dit moment geen vaste definitie van datajournalistiek valt
te geven, is dit dilemma elementair benaderd. Datajournalistiek bestaat uit data en journalistiek.
Wanneer in dit onderzoek wordt gesproken over datajournalistiek, gaat het om producties
waarbij die twee elementen beiden een voorname rol spelen: de data en de journalistiek.
Deze benadering levert direct een volgend dilemma op. Want wat zijn data? En wat is
journalistiek? Alle gegevens vormen toch data? En staat het begrip journalistiek sinds de
opkomst van bloggers en burgerjournalisten niet op losse schroeven? Om te beginnen met de
25 Dick van Eijk, ‘Datajournalistiek in Nederland: hot, maar niet nieuw’ in: Ditty Eimers ed., Onderzoeksjournalistiek 2012 (Utrecht en Zellik, 2012) 67-70, aldaar 70. 26 Mirjam Prenger, ‘Tegels lichten’ De Nieuwe Reporter (11-12-2012) http://www.denieuwereporter.nl/2012/12/tegels-lichten/. 27 Jerry Vermanen, ‘@JerryVermanen’ Twitter (11-12-2012) https://twitter.com/jerryvermanen/status/278417298530918400. 28 Jerry Vermanen, correspondentie met auteur (15-01-2013).
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
13
data. In principe vormen alle gegevens inderdaad data. Wanneer in dit onderzoek wordt
gesproken over data gaat het echter om kwantitatieve gegevens. Nu betekent dit niet direct dat
datajournalistiek alleen om cijfertjes gaat. Getallen spelen vaak een rol, maar hoeven niet de
boventoon te voeren. Ook een netwerkanalyse, waarbij gekeken wordt naar de relatie tussen
verschillende actoren, kan gezien worden als datajournalistiek. Ook kan datajournalistiek
gepresenteerd worden in de vorm van een kaart. In de uiteindelijke presentatie van zo’n
netwerkanalyse of kaart hoeft de nadruk niet te liggen op cijfers, maar bij de totstandkoming
van de analyse speelt kwantitatieve data wel een belangrijke rol. Nu zou in principe gesteld
kunnen worden worden dat data an sich al datajournalistiek kunnen zijn, net zoals foto’s an sich
fotojournalistiek kunnen vormen. In dit onderzoek wordt met datajournalistiek echter geduid op
journalistieke producties waarbij de data duidelijk ook zijn geanalyseerd en op een
journalistieke wijze zijn gepresenteerd. Wat die analyse precies inhoudt komt in het volgende
hoofdstuk aan bod. Maar wanneer wordt een productie met data precies journalistiek?
Om die vraag te beantwoorden, moet eerst antwoord gegeven worden op de vraag: wat is
journalistiek? Dick van Eijk schrijft in de inleiding van ‘Investigative journalism in Europe’ dat
er drie fundamenteel verschillende manieren zijn om deze vraag te beantwoorden: de
empirische, de normatieve en de analytische manier. Bij de empirische manier wordt gekeken
wat een journalist precies doet als hij zegt journalistiek bezig te zijn. Kortom: de alledaagse
praktijk. Dit zijn vaak praktische criteria, die echter inconsistent of onlogisch kunnen zijn. Op de
empirische wijze is het bijvoorbeeld moeilijk te zeggen of een datavisualisatie die zomaar door
iemand online is gezet gezien kan worden als datajournalistiek. De normatieve manier geeft
strikt gesproken geen antwoord op de vraag wat journalistiek is, maar beschrijft wat
journalistiek zou moeten zijn. Dit is een belangrijk onderscheid. Een voorbeeld van een
normatieve kenmerken zijn de negen principes die de Amerikaanse journalisten Tom Rosenstiel
en Bill Kovach opstelden. Zij gingen aan het eind van de twintigste eeuw op zoek naar de
basisprincipes van journalisten en destilleerden negen basiselementen, zoals: “Journalism’s first
obligation is to the truth” en “Its essence is a discipline of verification”.29 Wie leest en luistert
29 Bill Kovach en Tom Rosenstiel, The elements of journalism. What newspeople should know and the public should expect (New York 2001) 12; De volledige lijst van elementen is als volgt: 1. Journalism’s first obligation is to the truth. 2. Its first loyalty is to citizens. 3. Its essence is a discipline of verification. 4. Its practitioners must maintain an independence from those they cover. 5. It must serve as an independent monitor of power. 6. It must provide a forum for public criticism and compromise. 7. It must strive to make the significant interesting and relevant.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
14
hoe datajournalisten als Holovaty, Rogers en Vermanen over hun werk spreken, herkent
dezelfde principes. De analytische manier tenslotte probeert journalistiek op zo’n manier te
definieren dat de overeenkomsten en verschillen met aangrenzende disciplines als wetenschap
en literatuur duidelijk worden.30 Hoogleraar Frank van Vree hanteert naast de normatieve en
empirische definitie twee andere definities. Als derde noemt hij de sociologische of professionele
definities, waarbij met journalistiek wordt geduid op een professionele gemeenschap met regels,
beroepsorganisaties en beroepsopleidingen. Ten vierde noemt hij definities die gebaseerd zijn
op de waarneming en het gedrag van de nieuwsconsument.31 Wanneer gesproken wordt over
journalistiek, kan het dus gaan over het journalistieke ideaal, de praktijk of het beroep. Van Eijk
komt uiteindelijk zelf tot de volgende definitie: ‘Journalism is truth-seeking storytelling,
primarily serving citizens, without a legal foundation’.32 Dit is een definitie waar ik mij goed in
kan vinden.
Voldoet alles wat in dit onderzoek wordt aangeduid als datajournalistiek aan deze definitie van
journalistiek? Nee. Er kan niet van elke besproken datajournalistieke productie worden gezegd
dat die het resultaat is van een zoektocht naar waarheid. Soms zijn het gewoon leuke weetjes die
aantrekkelijk worden gepresenteerd. Maar de besproken producties zijn wel afkomstig van
journalistieke organisaties die over het algemeen streven naar ‘truth-seeking storytelling’ waar
met name burgers wat aan hebben. En de journalisten die aan het woord komen onderschrijven
over het algemeen wel hetzelfde journalistieke ideaal en werken ook in dezelfde sector. Zijn
dataproducties die niet journalistiek zijn daarom onbetrouwbaar en oninteressant? Nee, zeker
niet. Er bestaan prachtige, betrouwbare datavisualisaties die niet journalistiek zijn. Maar die zijn
eenvoudig niet het onderwerp van dit onderzoek.
2.3 Computer Assisted Reporting (CAR)
Holovaty en Rogers komen wellicht wat eigenwijs over, met hun ‘who cares’-attitude. Maar ze
beseffen zicht terdege dat zij niet het wiel hebben uitgevonden. In zijn e-book Facts are sacred -
The power of data stelt Rogers allereerst dat datajournalistiek wel trendy is, maar niet nieuw.
Hij beschrijft hoe Florence Nightingale al tijdens de Krimoorlog (1853-1856) aantoonde dat je
8. It must keep the news comprehensive and proportional. 9. Its practitioners must be allowed to exercise their personal conscience. 30 Dick van Eijk, ‘Introduction’ in: Dick van Eijk ed., ‘Investigative Journalism in Europe’ (Amsterdam 2005) 4-6. 31 Frank van Free, in reactie op Dick van Eijk, ‘Waarom een goede definitie van journalistiek belangrijk is’ De Nieuwe Reporter (07-07-2006) http://www.denieuwereporter.nl/2006/07/waarom-een-goede-definitie-van-journalistiek-belangrijk-is 32 Dick van Eijk, ‘Introduction’ 8.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
15
met cijfers, statistieken en visualisaties de maatschappij kunt veranderen.33 Ook besteed hij in
het boek uitgebreid aandacht aan Philip Meyer, een van de eerste journalisten die computers
gebruikte voor data-analyse. Na rellen in Detroit deed hij in 1967 samen met twee onderzoekers
van de Universiteit van Michigan onderzoek met behulp van een computer, een IBM 360 ter
grootte van een eettafel. In hun reportage voor de Detroit Free-Press toonden ze aan dat een
willekeurige deelnemer aan de rellen net zo goed iemand met een universitaire opleiding kon
zijn als een high school dropout. Het verslag zou later bekroond worden met een Pulitzerprijs en
vormde volgens Meyer het begin van een nieuw tijdperk in de journalistiek. In zijn boek
Precision Journalism, dat verscheen in 1973, legde Meyer uit hoe methoden uit de sociale
wetenschap toegepast kunnen worden in de journalistieke praktijk. “[P]ush journalism toward
science, incorporating both the powerful data-gathering and analysis tools of science and its
disciplined search for verifiable truth.”34
Een jaar na het onderzoek van Meyer werd voor de eerste keer overheidsdata geanalyseerd met
inzet van computers. Clarence Jones van de The Miami Herald liet in 1968 rechtenstudenten
gegevens uit rechtbankdossiers invoeren in een computer. Uit analyse van de gegevens bleek dat
sommige categorieeen verdacht vaker en zwaarder werden gestraft dan andere. Elliot Jaspin van
The Providence Journal was de eerste journalist die overheidsbestanden aan elkaar koppelde.
Zo kon hij vaststellen dat er veel schoolbuschauffeurs betrokken waren geweest bij
verkeersovertredingen en drugshandel. De inzet van computers voor journalistiek kreeg de
naam computer-assisted reporting, ofwel CAR.35 Er wordt ook wel gesproken van computer-
assisted research and reporting (CARR). Een andere benaming is computer-assisted
journalism (CAJ). In dit onderzoeken blijft het beperkt tot CAR, aangezien dit de
meestgebruikte term is. Deze term behelst een breed scala van activiteiten – eigenlijk alles
waarvoor je de computer kunt gebruiken bij nieuwsgaring. Dit loopt uiteen van zoeken op
internet, e-mailen, maar ook dat wat wij nu beschouwen als datajournalistiek.36
In 1989 richtte de University of Missouri School of Journalism het Missouri Institute for
Computer Assisted Reporting (MICAR) op, dat later werd omgedoopt tot National Institute for
Computer Assisted Reporting (NICAR). Dit instituut werkte nauw samen met de
onderzoeksjournalistieke organisatie Investigative Reporters en Editors (IRE). Zowel NICAR als
33 Simon Rogers, Facts are sacred - The power of data (2011). 34 Philip Meyer, Precision journalism (1991). 35 Dick van Eijk en Henk van Ess, Lesmateriaal voor Computer Assisted Reporting (Amsterdam 2003) 10. 36 Steve Paulussen, [email protected]. Een studie naar de mogelijkheden en
gevolgen van het internet voor de journalistieke nieuwsgaring en nieuwsproductie (Gent
2003) 180.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
16
IRE is altijd erg betrokken geweest bij de ontwikkeling van datajournalistiek en helpt
journalisten met ondermeer congressen, trainingen en fondsen.
2.3.1 Verschil CAR en datajournalistiek
Journalisten die data verzamelen, verwerken en analyseren zijn dus geen nieuw fenomeen. Maar
wat is nu precies het verschil tussen datajournalistiek en CAR? ‘CAR was and is primarily a
technique, not a process affecting the whole workflow of journalism in a fundamental way’,
stelde de Duitse journalist Mirko Lorenz. Niet dat hij het belang van CAR wil afzwakken. ‘This is
not about devaluing CAR. The use of computer searches in large databases remains an extremely
important skill for investigative journalism. But data-driven journalism is rather different,
making CAR one element in the chain of future events. Today data-driven journalism can be
defined as a workflow, where data is the basis for analysis, visualization and - most importantly -
storytelling.’37 Voor de duidelijkheid: met data-driven journalism wordt hetzelfde aangeduid als
met datajournalistiek. Ook Philip Meyer ziet een verschil tussen datajournalistiek en CAR:
‘When information was scarce, most of our efforts were devoted to hunting and gathering. Now
that information is abundant, processing is more important.’38 Maar hoe ontwikkelde CAR zich
in Nederland? Daarover gaat de volgende paragraaf.
2.4 Pioniers in Nederland
Terwijl CAR in de Verenigde Staten een vlucht nam, gebeurde er in Europa nog vrij weinig. Een
van de weinigen die zich op het nieuwe werkveld waagde was Dick van Eijk. De journalist van
NRC Handelsblad herinnert zich de begindagen van CAR nog goed. In 1994 stuurde zijn krant
hem naar een conferentie over datajournalistiek die NICAR en IRE jaarlijks organiseren. “[Ik
was] een van de circa 550 deelnemers, en een van de vijf Europeanen. De andere vier kwamen
uit Scandinavië.” Nederlandse journalisten behoorden volgens Van Eijk in Europa tot de
pioniers op het gebied van datajournalistiek, ver voordat hun Britse collega’s aan data begonnen
te snuffelen. “Sterker nog, sommigen hebben dat van hun Nederlandse collega’s geleerd.”39
37 Mirko Lorenz ‘Status and Outlook for data-driven journalism’ in: Data-driven journalism: What is there to learn? A paper on the data-driven journalism roundtable held in
Amsterdam on 24 August 2010. (2010) 9. http://mediapusher.eu/datadrivenjournalism/pdf/ddj_paper_final.pdf 38 Alex Howard, 'The bond between data and journalism grows stronger' O'Reilly (04-02-2012) http://radar.oreilly.com/2012/02/data-journalism-computer-assisted-reporting-government.html. 39 Dick van Eijk, ‘Datajournalistiek in Nederland al twee decennia oud’ De Nieuwe Reporter (01-05-2012) http://www.denieuwereporter.nl/2012/05/datajournalistiek-in-nederland-al-twee-decennia-oud/.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
17
Van Eijk was sinds 1993 bezig met CAR, naast zijn andere werkzaamheden op de
binnenlandredactie. “Het eerste project ging over het onbekende netwerk van bestuurders in de
sociale zekerheid.”40 In 1994 werd een grote stap voorwaarts gemaakt. Na de
gemeenteraadsverkiezingen bedacht de redactie dat het mogelijk moest zijn om de
verkiezingsresultaten weer te geven op een kaart, waarbij de winsten of verliezen van een partij
correspondeerden met een bepaalde kleur. Tegenwoordig is zoiets een fluitje van een cent, maar
in 1994 was men hier in de verkiezingsnacht vier uur mee bezig. De verkiezingsuitslag had de
redactie op een floppy gekregen van het Algemeen Nederlands Persbureau (ANP). Later kreeg
de redactie ook medewerking van het het Centraal Bureau voor de Statistiek (CBS) en kon een
kaart worden gemaakt met de geografische verdeling van scheidingen.41
De kaart van de verkiezingen werd gezien als een goede illustratie van de geografische
aspecten van de politieke krachtmeting. Daarom werd dezelfde opzet toegepast na de Europese
verkiezingen in 1994. Ook daarna bleef Van Eijk bezig met GIS-analyses. In december 1997 en
januari 1998 verschenen in de bijlage Profiel en op de binnenlandpagina’s van de NRC verhalen,
kaarten, tabellen en cijfers over 2048 Nederlandse gemeenten. De verslagen werden gebundeld
in het boek Een atlas van Nederlandse gemeenten.42 Dit was de eerste grote GIS-analyse van
Nederland.43 Van Eijk gebruikte hiervoor databases met gegevens over de inkomensverdeling in
die buurten. Dat leverde niet alleen mooie plaatjes op, maar ook interessante reportages over de
bewoners van die buurten. Bovendien hadden de verhalen en kaarten ook een politieke impact,
wordt gesteld in het handboek Onderzoeksjournalistiek, waar de werkwijze overigens wordt
omschreven als “datamining”. “In het algemeen was toen de indruk dat achterstandswijken
vooral in gemeenten in het westen van het land zouden liggen. Maar de analyses en reportages
in de atlas toonden aan dat ook bijvoorbeeld in het oosten veel buurten op achterstand
stonden.”44
Vanaf 2004 werd op de NRC-burelen opnieuw gewerkt aan een grootschalig dataproject. De
redacteuren Freek Staps en Arlen Poort verzamelden samen met het data-analysebureau
Dankers & Frank gegevens over de Nederlandse huizenmarkt door gewoon de informatie op te
40 Ibidem (DvE, DNR) 41 Dick van Eijk, ‘Computer Assisted Reporting in the Dutch Newsroom. The Case of NRC Handelsblad’ in Peter Vasterman en Peter Verwey red., Computer Assisted Research and Reporting (Utrecht 1994) 29-30. 42 Dick van Eijk, ‘Een atlas van Nederlandse gemeenten. 2049 Buurten vergeleken’ (Rotterdam 1998). 43 Nico Kussendrager, Onderzoeksjournalistiek (Groningen 2007) 100. 44 Ibidem (NK, Ond.)
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
18
slaan die huizensite Funda publiceerde.45 “Te koop: 90.000 huizen voor 28.000.000 euro”,
kopte NRC Handelsblad. Daaronder werd antwoord gegeven op vragen als: waar staan de
duurste huizen, hoe lang staan ze te koop, waar staan de meeste huizen te koop?46 De
daaropvolgende jaren bleef Dankers & Frank de gegevens van Funda verzamelen. Zodoende kon
Poort in 2009 aan de hand van vijf jaar aan woningmarktgegevens een diepgravende publicatie
over de invloed van de kredietcrisis op de Nederlandse woningmarkt brengen.47 In datzelfde jaar
vertelde Poort in een interview met de VVOJ dat het downloaden van grote databases niet zo
ingewikkeld is. “Ik had inmiddels een cursus gevolgd in het downloaden van dit soort gegevens
bij IRE. (...) Bij de IRE-cursus – feitelijk drie workshops! – had ik de programmeertaal Practical
Extraction and Reporting Language ofwel Perl geleerd.” Met Perl kun je een klein programma
schrijven waarmee je gegevens binnenhaalt. Daarbij kun je aangeven in welke gegevens je
geïnteresseerd bent. “In mijn geval was dat bijvoorbeeld het adres en de prijs van de woning.”48
‘Database onderzoek’ stond in Nederland en Vlaanderen nog in de kinderschoenen, stelde
Poort in het interview. Hij pleitte ervoor dat journalisten daar meer mee bezig moeten, maar
vermoedde dat er bij Nederlandse en Belgische journalisten te weinig kennis is over het doen
van dit soort onderzoek. “Jammer, want zo moeilijk is het niet.” Het werk zelf misschien niet, als
je een beetje om kunt gaan met computers, maar Poort noemde zelf ook een paar obstakels.
Wanneer opleidingen niet voldoende mogelijkheden aanbieden om vaardig te worden in
datajournalistiek, moet je zelf aan de slag. “Zelf wat boeken kopen, naar wat cursussen gaan.”
Bovendien moet je je chef zien te overtuigen dat het zin heeft om je - deels - vrij te maken voor
dit soort onderzoek. Kortom: “Je moet zelf echt een doorzetter zijn om dit te doen.”49
Bas Broekhuizen, docent Journalistiek en Nieuwe Media en voormalig internetredacteur bij de
Volkskrant, riep journalisten in 2010 ook op om meer te experimenteren met het visualiseren
van informatie.50 Arjan Dasselaar had twee jaar eerder al zijn teleurstelling geuit over het gebrek
aan Nederlandse ‘databasejournalistiek’. “Nederlandse journalistieke organisaties laten
45 Rachel Levy, ‘‘Journalisten moeten meer database onderzoek doen’’ Vereniging van Onderzoeksjournalisten (25-01-2009) http://www.vvoj.nl/cms/2009/01/25/journalisten-moeten-meer-database-onderzoek-doen/; N.B. Dit artikel is alleen te lezen voor leden van de VVOJ. 46 Kussendrager, Onderzoeksjournalistiek 100. 47 Levy, ‘’Journalisten moeten’’; Melle Garschagen, Arlen Poort, ‘Er zit maar één ding op: omlaag. Verkopers wachten maandenlang met prijsverlaging’ NRC Handelsblad (17-01-2009) 14. 48 Levy, ‘’Journalisten moeten’’. 49 Ibidem. 50 Bas Broekhuizen, ‘Journalisten moeten meer experimenteren met InfoVis’ De Nieuwe Reporter (03-02-2010) http://www.denieuwereporter.nl/2010/02/journalisten-moeten-meer-experimenteren-met-infovis/
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
19
databases met veelomvattende informatie [...] links liggen.” Dick van Eijk stelde in dit artikel dat
dit veel te maken heeft met de bedrijfscultuur van Nederlandse journalistieke organisaties. “Een
van de grote problemen bij het tot stand komen van databasejournalistiek is dat nieuwsredacties
meestal niet de baas zijn over de technologie in een grote organisatie.” Zelf experimenteren zit er
daarom vaak niet in, omdat dit strijdig is met het IT-beleid.51
Een deel van de verklaring schuilt volgens Van Eijk ook in de doelstelling die journalistieke
organisaties zich stellen: “Journalistieke managers in Amerika hebben meer het idee dat hun
medium ook service moet verlenen aan hun lezers.” Behalve het geijkte nieuws horen daarbij
ook databases.52 Maar het gebrek aan datajournalistiek is niet alleen de schuld van door
hogerhand opgelegd IT-beleid of de servicegerichtheid van managers. Ook op redacties zelf mag
er het nodige veranderd worden. “Het is geen onwil van redacties, maar een gebrek aan kennis.
In de Verenigde Staten zie je dat veel meer journalisten dan hier kunnen programmeren.”53
2.5 Actueel overzicht datajournalistiek in Nederland
Inmiddels wordt er in Nederland aardig aan de weg getimmerd op het gebied van
datajournalistiek. Niet alleen in kranten, maar ook op internet, televisie en de radio komen
datajournalistieke producties voorbij. In deze paragraaf wordt per medium een overzicht
gegeven van de huidige ontwikkelingen.
2.5.1 Internet
Begin 2011 ging Laurens Verhagen, de toenmalig hoofdredacteur van Nu, op zoek naar een
datajournalist voor zijn nieuwssite. Op zijn verlanglijstje stond iemand die én enorme databases
kon doorspitten, gegevens kon analyseren, combineren en eventueel visualiseren, én gewoon,
ouderwets een verhaal kon schrijven én een teamspeler was. Misschien vroeg hij wel te veel, gaf
Verhagen eerlijk toe.54 Maar hij vond toch een “nerd met vijf poten” en wel in de persoon van de
toen pas afgestuurde Jelle Kamsma. Hij werd in het diepe gegooid en moest veel zelf uitvinden.
“Het eerste probleem dat ik tegenkwam is dat er geen mensen zijn die vaardig zijn in
datajournalistiek en je dingen kunnen leren”, aldus de datajournalist. “Ik begon echt op nul en
moest alles zelf uitvogelen.” “Een andere barriere is het gebrek aan modellen, structuren en
51 Arjan Dasselaar, ‘Waar blijven de journalistieke databases?’ De Nieuwe Reporter (11-03-2008) http://www.denieuwereporter.nl/2008/03/waar-blijven-de-journalistieke-databases/. 52 Dasselaar, ‘Waar blijven de journalistieke databases?’. 53 Ibidem. 54 Joost Ramaer, 'Datajournalistiek, of: Nu zoekt nerd met vijf poten' De Nieuwe Reporter (24-01-2011) www.denieuwereporter.nl/2011/01/datajournalistiek-of-nu-nl-zoekt-nerd-met-vijf-poten/
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
20
workflows. Toen ik begon in dit veld waren er geen lokale modellen beschikbaar. Ik had een
mentor nodig, maar die was er niet in Nederland, dus moest ik alles zelf uitvinden. Nu zie je dat
er steeds meer expertise wordt gedeeld en dat helpt.”55 In maart 2012 vertrok Kamsma naar RTL
Nieuws, waarover later meer.
Ook in de Nederlandse blogosfeer, het totaal van blogs en hun onderlinge verbanden, is men
bezig met datajournalistiek. In 2011 kon het weblog Sargasso dankzij een startsubsidie van het
Stimuleringsfonds voor de Pers á € 84.471 behalve een webredacteur ook een datajournalist
aannemen. Het groepsblog wil hiermee de datajournalistiek in Nederland een impuls geven.
“Met datajournalistiek kan door het opsporen, verzamelen, analyseren en combineren van
gegevens nieuwe informatie gegenereerd worden die anders niet beschikbaar zou zijn en die
daarmee kan bijdragen aan de politieke meningsvorming.”56 Sargasso werkt samen met het
ANP, waarvoor het dagelijks een cijfernieuwtje aanlevert. De twee partijen organiseerden
gezamenlijk een hackathon over armoede en in september staat een hackathon over de komende
verkiezingen gepland.57 Bij een hackathon (een samenvoeging van hacken en marathon) biedt
een nieuwsorganisatie meestal een dataset waar deelnemers mee aan de slag kunnen. De
deelnemers hebben vaak erg uiteenlopende achtergronden. Vaak is het een combinatie van
journalisten, ICT’ers, hackers en mensen die betrokken zijn bij het onderwerp door bijvoorbeeld
hun beroep. De evenementen duren meestal 12 of 24 uur of zelfs meerdere dagen. Hackathons
hebben twee primaire doelen. Allereerst kunnen nieuwsorganisaties zo een vliegende start geven
aan hun datajournalistieke projecten. Daarnaast biedt het nieuwsorganisaties de kans om hun
netwerk uit te breiden en talent aan te trekken.
2.5.2 Kranten
Jelle Kamsma werd bij Nu opgevolgd door Jerry Vermanen, die tot die tijd bureauredacteur was
bij het regionale dagblad De Stentor. Na het bezoeken van Hacking Journalism, een bijeenkomst
voor journalisten en programmeurs rondom het thema datajournalistiek, kwam hij op idee voor
RegioHack: een project van De Stentor, De Twentsche Courant Tubantia en Saxion
55 Liliana Bounegru, 'Digging deeper: An in-depth look at data journalism in the Netherlands' Data Driven Journalism (06-12-2011) datadrivenjournalism.net/news_and_analysis/doing_data_journalism_in_the_netherlands. 56 Dorien Vrieling, ‘Sargasso Verlicht’, Stimuleringsfonds voor de Pers (2011) http://www.persinnovatie.nl/3312/nl/Sargasso-verlicht. 57 Jerry Vermanen, ‘Wat is er aan datajournalistiek in Nederland?’ De Nieuwe Reporter (25-04-2012) http://www.denieuwereporter.nl/2012/04/wat-is-er-aan-datajournalistiek-in-nederland/; Dimitri Tokmetzis, ‘Doe mee aan de Hackathon Verkiezingen 2012’ Sargasso (25-06-2012) http://Sargasso.nl/archief/2012/06/25/doe-mee-met-de-hackathon-verkiezingen-2012/.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
21
Hogescholen waarbij journalisten samenwerken met programmeurs, opendata-experts en
grafici om datajournalistiek in Nederland vooruit te helpen.58 In november 2011 organiseerde
RegioHack een hackathon waar journalisten, studenten en programmeurs dertig uur lang
onderzoek deden met behulp van data. De deelnemers liepen tegen veel muren op en kregen de
nodige teleurstellingen te verwerken, maar kwamen ook veel te weten.59 Inmiddels zijn er alweer
plannen gesmeed voor de tweede versie van RegioHack en voorafgaande open avonden.60
Ook de Volkskrant heeft een datajournalist in huis. Sybren Kooistra, een voormalig stagiair,
ging hier in september 2012 aan de slag.61 NRC Handelsblad, de eerste krant die zich in
Nederland intensief bezighield met datajournalistiek, bleef zich op dit gebied verder
ontwikkelen. Begin 2012 presenteerde Arlen Poort bijvoorbeeld met behulp van cijfers van het
CBS een uiterst gedetailleerde kaart waar bezoekers konden inzoomen op ieder postcodegebied
om te kijken hoe het daar gesteld was met onder meer het fiscaal maandinkomen per persoon of
het percentage niet-westerse allochtonen of eenouderhuishoudens.62
2.5.3 Radio en televisie
In Hilversum was de VPRO de eerste omroep die een datajournalist in dienst nam. Frédérik
Ruys ging aan de slag voor Nederland van Boven, wat - zoals beschreven in de inleiding - een
groot succes was. De collega’s van het documentaireprogramma Tegenlicht ontwikkelden in
2011 de eerste iPad-documentaire ter wereld bij de aflevering ‘Money & Speed: Inside the black
box’. Deze documentaire draait om de flash crash die op 6 mei 2010 plaatsvond op de
Amerikaanse financiële markten. Aan de hand van interviews met experts en minitieuze
datavisualisaties en kaarten is geprobeerd de snelste en diepste daling van de Dow Jones tot dan
toe te reconstrueren.63
Het VPRO-radioprogramma Argos droeg een steentje bij door, in samenwerking met
studenten van de Radbout Universiteit Nijmegen, een verbeterde Wikileaks-zoekmachine te
58 Jerry Vermanen, Femke Nales, Martijn Bekhuis en Heinze Havinga 'Voorstelrondje: wie zitten er achter RegioHack?' RegioHack (13-09-2011) www.regiohacknl/regiohack-blog/voorstelrondje-wie-zitten-er-achter-regiohack. 59 Jerry Vermanen, 'RegioHack, the day after' RegioHack (12-11-2011) www.regiohack.nl/regiohack-blog/regiohack-the-day-after/. 60 Heinze Havinga, ‘@HeinzeHavinga’ Twitter (26-07-2012) https://twitter.com/HeinzeHavinga/status/228588255887642624 . 61 http://nl.linkedin.com/in/sybrenkooistra; E-mailcorrespondentie tussen auteur en Sybren Kooistra. 62 Arlen Poort, ‘Statistiek saai? CBS-cijfers komen tot leven op de kaart’ NRC (14-02-2012) www.nrc.nl/nieuws/2012/02/14/statistiek-saai-cbs-cijfers-komen-tot-leven-op-een-kaart. 63 ‘Money & speed: Inside the black box’ Tegenlicht (31-01-2011) http://tegenlicht.vpro.nl/afleveringen/2010-2011/the-future-of-finance/money-and-speed.html.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
22
ontwikkelen.64 Met ‘The Argos Machinery’ kunnen zowel de cables als de war logs van Irak en
Afghanistan doorzocht worden. Wat in het kader van open data wel opmerkelijk is, is dat de
zoekmachine niet publiek toegankelijk is gemaakt. Alleen collega’s, journalisten en onderzoekers
hebben toegang tot de machine en pas nadat zij hun gerichte vragen hebben voorgelegd. “[D]aar
hebben we een simpele reden voor”, vertelde Argos-redacteur Huub Jaspers. “Wij kunnen
werken met de meest ongecensureerde documenten. We hebben deze week gemerkt dat er ook
in de gecensureerde versie van de documenten veel persoonsgegevens staan, bijvoorbeeld over
personen die samen werken met de Amerikanen in landen waar er partijen zijn die dat die
mensen heel erg kwalijk kunnen nemen. Wij vinden toch dat je dat toch niet zomaar
toegankelijk moet kunnen maken voor mensen.”65
Ook het NCRV-televisieprogramma Altijd Wat heeft een datajournalist in dienst genomen.
Erik Bloem maakte in april 2012 de overstap van de Volkskrant naar het opinierende
programma.66 De aanstelling van Jelle Kamsma bij RTL Nieuws was van korte duur. Na drie
maanden besloot RTL niet verder te willen met de datajournalist. Hun datajournalistieke project
- RTL Nieuws Facts, waarvoor in 2011 € 92.500 beschikbaar werd gesteld door het
Stimuleringsfonds voor de Pers - gaat wel door. Nieuws Facts zou een platform voor data- en
onderzoeksjournalistiek moeten worden.67 De site werd in februari 2013 gelanceerd.
De NOS heeft op dit moment geen datajournalist in dienst, maar is wel met het onderwerp
bezig. De nadruk ligt hier vooral op het visualiseren van data. “Ik vind dat we daarin voorop
moeten lopen”, vertelde informatiespecialist Anke Vellenga. “Saaie tabellen leest niemand.”68
Samen met collega’s van andere afdelingen vormde ze daarom een werkgroep voor
64 VVOJ-voorzitter Henk van Ess ontwikkelde eerder al de Wikileaks-zoekmachine Cablesearch, in samenwerking met een programmeur die op de site alleen wordt aangeduid als “Udo”; Tonie van Ringelestijn, 'Nederlander maakt betere Wikileaks-zoeker' Bright (02-12-2010) https://www.bright.nl/nederlander-maakt-betere-wikileaks-zoeker; http://cablesearch.org/?page_id=61. 65 Samir Streefkerk, 'Argos komt met nieuwe Wikileaks-zoekmachine: 'Media moeten nieuwe wegen bewandelen'' OnJo (13-10-2011) www.onjo.nl/Item.2569.0.html?&no_cache=1&tx_ttnews%5Btt_news%5D=51046 66 http://www.linkedin.com/in/erikbloemjournalist 67 Jaap Meijers, 'RTL Nieuws gaat verder met datajournalistiek - zónder datajournalist' De Nieuwe Reporter (05-06-2012) www.denieuwereporter.nl/2012/06/rtl-nieuws-gaat-verder-met-datajournalistiek-zonder-datajournalist; ‘RTL Nieuws Facts’ Stimuleringsfonds voor de Pers http://www.persinnovatie.nl/3309/nl/rtl-nieuws-facts 68 Bas Nieuwenhuijsen, ‘Datavisualisatie is een andere, leuke manier om je verhaal te vertellen’ Spreekbuis (geen datum) http://www.spreekbuis.nl/content/2600/%22Datavisualisatie_is_een_andere__leuke_manier_om_je_verhaal_te_vertellen%22.html.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
23
datavisualisatie.69 Een van de leden van de werkgroep is onderzoeksjournalist Hugo van der
Parre. “Het is een zoektocht. Hoe maak je een onderwerp zo helder mogelijk? Welke tools
hebben we, welke moeten worden aangepast of nieuw ontwikkeld?”70 Volgens Vellenga zal in de
toekomst iedere NOS-journalist om moeten kunnen gaan met datavisualisaties. “Het is voor ons
een taak erbij, wij maken bijvoorbeeld tijdlijnen. Uiteindelijk moeten anderen binnen de NOS
dat ook kunnen doen, het moet een normaal onderdeel van het werk worden.”71
Datajournalistiek bouwt voort op het fundament dat is gelegd met CAR en precision
journalism. Deze journalistieke werkwijzen kwamen op in de Verenigde Staten en werden later
ook in Europa opgepikt. Behalve de essentie – het gebruiken van data in journalistieke
producties – is ook de workflow van precision journalism doorgesijpeld in de datajournalistiek
van vandaag. Hierover gaat het volgende hoofdstuk, waarin verschillende workflows worden
vergeleken.
69 Anke Vellenga, ‘Datajournalistiek en visualisatie nieuwe uitdaging voor informatiespecialisten’ Vereniging van Pers- en Omroepdocumentalisten (09-01-2012) http://www.vpod.nl/datajournalistiek-en-visualisatie-nieuwe-uitdaging-voor-informatiespecialisten/. 70 Ibidem. 71 Ibidem.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
24
3. Workflows en routines
Verschillende journalisten en onderzoekers noemden het ontbreken van een workflow een
obstakel in de datajournalistiek. Er bestaan inmiddels wel een aantal beschrijvingen van de
processen die voorkomen bij de totstandkoming van een datajournalistieke productie. Geven
deze modellen het proces allemaal op dezelfde manier weer of zijn er verschillen?
3.1 Basiselementen van journalistieke workflow
Philip Meyer gaf in Precision journalism al aan dat “the journalistic body of knowledge” sowieso
de volgende elementen moet bevatten:
1. How to find information;
2. How to evaluate and analyze it;
3. How to communicate it in a way that will pierce the babble of information overload and
reach the people who need and want it. 72
Dit zijn de basiskwaliteiten waarover iedere goede journalist volgens Meyer moet beschikken.
Dit lijkt op het eerste oog redelijk vanzelfsprekend, maar Meyer benadrukt dat dit ook betekent
dat je allerlei dingen niet moet doen. Stap 1, informatie vinden, lijkt bijvoorbeeld nogal evident.
Maar het houdt ook in, dat je als journalist niet alles gelooft wat je verteld wordt, niet
gemakkelijk te manipuleren bent en niet teveel vertrouwt op persberichten. Dit is ook erg
belangrijk om in gedachten te houden bij datajournalistiek, want ook datasets zijn makkelijk te
manipuleren. En heb je eenmaal betrouwbare en interessante informatie gevonden, dan kun je
die niet zomaar de wereld insturen. Eerst komt stap 2: evalueren en analyseren. Kijk welk
verhaal er achter jouw informatie schuilgaat. Is wat je ziet logisch? Kun je een patroon te
herkennen? Bestaat er een opvallende afwijking? Is er informatie die verdere vragen oproept?
Kun je de informatie vergelijken met soortgelijke gevallen? Wanneer je op deze manier de kern
van je verhaal hebt gevonden, is het tijd voor stap 3: het presenteren van je verhaal. Doe dit zo
effectief mogelijk. Het kan verleidelijk zijn om je publiek te imponeren met een overdaad aan
bronnen en verhalen. Een overdaad aan informatie leidt tot ruis. Een journalistiek verhaal moet
helder en duidelijk zijn om zijn publiek te bereiken.
72 Philip Meyer, Precision journalism.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
25
In principe is dit ook de essentie van de huidige workflowmodellen voor datajournalistieke
producties: informatie vinden, analyseren en presenteren. Maar dan moet je wel weten wat je
met data kunt doen. ‘Knowing what to do with data’ is volgens Meyer de essentie van the new
precision journalism. Hij helpt zijn lezers vooruit met een stappenplan. Het mooie van deze
workflow uit 1991 is, dat je hier enerzijds duidelijk kenmerken uit de tijd van precision
journalism en CAR terugziet, maar anderzijds ook de contouren herkent van de huidige
workflowmodellen. Die elementen uit de tijd van CAR kunnen ietwat gedateerd lijken, net zoals
de logge IBM 360 waarmee Meyer zijn onderzoek uitvoerde in onze ogen een antieke computer
lijkt. Maar die computer bevatte wel belangrijke elementen waarop onze computers van vandaag
voortborduren en zodoende is ook de verouderde workflow van Meyer een interessant
uitgangspunt voor een vergelijking van de workflowmodellen van vandaag.
Meyer beschrijft als volgt hoe je te werk moet gaan met data.
1. Collect it.
Deze stap lijkt vanzelfsprekend, maar zeker toen in 1973 de eerste editie van Precision
Journalism verscheen, was het nog helemaal niet gebruikelijk om iets wetenschappelijks als
datasets te gebruiken voor journalistiek. Maar je moet er wel wat voor doen, data komt niet
vanzelf naar jou toe.
2. Store it.
‘Old-time journalists store data on stacks of paper on their desks, in corners of their offices,
and, if they are really well organized, in clip-files’, stelt Meyer. ‘Computers are better.’ Dit is
nu typisch een opmerking uit het CAR-tijdperk, waarin lezers nog op de handige
eigenschappen van een computer gewezen moesten worden. Niettemin is dit vandaag ook
nog een issue: een prachtige tabel kan waardeloos zijn als je het als printje aangeleverd krijgt
en niet in een computer kan analyseren.
3. Retrieve it.
Met de gereedschapset van precisiejournalistiek kun je informatie aan een dataset onttrekken
die er niet bewust in is gestopt. Je moet alleen wel de juiste vragen op de juiste manier weten
te stellen.
4. Analyze it.
‘Journalistic analysis often consists of merely sorting to find and list the interesting
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
26
deviances.’ Behalve het noteren van interessante afwijkingen kan analyseren ook bestaan uit
het traceren van patronen die wellicht iets suggereren.
5. Reduce it.
Data reduceren is net zo belangrijk als data verzamelen. ‘A good news story is defined by
what it leaves out as well as what it includes.’ Dit zien we ook terug in de opvattingen van de
huidige Nederlandse datajournalisten.
6. Communicate it.
Publiceer je verhaal, maar houd het begrijpelijk en leesbaar. ‘A report unread or not
understood is a report wasted.’73
3.2 The inverted pyramid of data journalism
Een van de bekendste modellen is opgesteld door de Britse internetjournalist Paul Bradshaw.
Behalve journalist is Bradshaw ook auteur van het Online Journalism Handbook en doceert
interjournalistiek aan de Birmingham City University en City University's School of Journalism
in London. Hij schreef mee aan verschillende boeken over journalistiek en is oprichter van de
crowdsourcing-website Help me investigate.
In oktober 2010 beschreef Bradshaw in het artikel ‘How to be a data journalist’ waaruit het werk
van een datajournalist bestaat.74 Dit model, dat hij later ‘The Data Journalism Continuum’ zou
noemen, bestond uit vier achtereenvolgende stappen: finding, interrogating, visualising en
mashing.75 In juli 2011 publiceerde Bradshaw een herziende versie van het model: “the inverted
pyramid of data journalism”.76
73 Philip Meyer, Precision journalism. 74 Paul Bradshaw, ‘How to be a data journalist’ The Guardian (01-10-2010) http://www.guardian.co.uk/news/datablog/2010/oct/01/data-journalism-how-to-guide 75 Paul Bradshaw, ‘Data journalism’ (22-02-2011) slide 23/48 http://www.slideshare.net/onlinejournalist/data-journalism-city-online-journalism-wk8 76 Paul Bradshaw, ‘The inverted pyramid of data journalism’ http://onlinejournalismblog.com/2011/07/07/the-inverted-pyramid-of-data-journalism/
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
27
Figuur 1: The inverted pyramid of data journalism
Zoals te zien is de pyramide opgebouwd uit vijf lagen: compile (samenstellen), clean
(opschonen), context, (combine) combineren. De laatste stap is communicate (overbrengen).
Deze laag is door Bradshaw ook weer in zes delen opgesplitst. In de presentatie van zijn model,
op het Online Journalism Blog, gaf hij de volgende toelichting bij de stappen. Dit is volgens mij
de meeste heldere beschrijving van de verschillende stadia in het totstandkomingsproces van
een datajournalistiek item.
3.2.1 Samenstellen
Het samenstellen is volgens Bradshaw het belangrijkste stadium. Niet alleen omdat al het
andere daarop rust, maar omdat dit het stadium is waar het meest op teruggekeerd wordt. In
ieder volgend stadium kan het nodig zijn nieuwe informatie samen te stellen. Het samenstellen
is dus niet een stap die altijd na het verkrijgen van de eerste data is afgerond. Soms kan het
nodig zijn om later nog nieuwe data te verzamelen. Je zou het kunnen vergelijken met een
kleisculptuur: soms heb je genoeg aan de eerste homp klei waarmee je begint en soms moet je
daar later nog wat klei aan toevoegen. En af en toe leg je in eerste instantie een stukje opzij wat
later toch goed van pas komt.
Het samenstellen zelf kan verschillende vormen aannemen. Data wordt, in het meest
eenvoudige geval:
1. direct geleverd door een organisatie
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
28
2. gevonden door geavanceerde zoekmethoden om de krochten van overheidswebsites te
doorzoeken
3. samengesteld middels het scrapen van databases achter online formulieren of pagina’s
4. verkregen door documenten om te zetten in een bestand dat kan worden geanalyseerd
5. verkregen door informatie uit API’s te halen
6. door de journalist zelf verzameld worden door observaties, online formulieren of
crowdsourcing
3.2.2 Opschonen
Data verkrijgen is slechts het begin. Je moet ook kunnen vertrouwen op de kwaliteit van de data.
Dit betekent dat je het moet opschonen. Dit opschonen neemt doorgaans twee vormen aan: het
verwijderen van menselijke fouten en het converteren van de data naar een bestand dat
overeenkomt met de andere data die je gebruikt. Wat bijvoorbeeld vaak voorkomt in datasets
zijn: dubbele entries, lege entries, verkeerde vorm informatie (bijvoorbeeld woorden in plaats
van nummers) en verschillende namen voor hetzelfde (P.v.d.A. of PvdA).
3.2.3 Contextualiseren
Net als andere bronnen is data niet altijd betrouwbaar. Het draagt zijn eigen bias, verhaal en
standpunt met zich mee. Net als bij andere bronnen moet je je afvragen wie de data verzameld
heeft, wanneer, hoe en met welk doel. Waarschijnlijk moet je na het beantwoorden van die
vragen op zoek naar nog meer data. Neem het aantal misdaden in een stad: dat is interessant om
te weten, maar pas als je de context weet. Hoeveel mensen wonen er in een stad, hoeveel politie
is er, hoeveel misdaden werden er vijf jaar eerder gepleegd, wat is de definitie van misdaad,
hoeveel mensen zijn er werkloos. Kennis van statistiek is wat dit betreft een must.
Overigens: wanneer je aan het begin van het proces een duidelijke vraag hebt, helpt dat om je
focus niet te verliezen of een interessante invalshoek te missen.
3.2.4. Combineren
Goede verhalen kúnnen gevonden worden in een enkele dataset, maar vaak zul je twee sets
moeten combineren. Immers, als je mocht kiezen tussen een verhaal met één bron of een met
meerdere bronnen, wat zou je dan kiezen? De klassieke combinatie is de mashup op een kaart:
combineer je data met geografische gegevens en visualiseer zo de regionale verspreiding van een
verschijnsel. Waar komen de bezuinigingen het hardste aan? Welke scholen doen het het beste?
Wat zijn wereldwijd de meest besproken onderwerpen op Twitter?
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
29
3.3 De workflow van The Guardian
Paul Bradshaw is niet de enige die de algemene workflow van datajournalistiek in kaart heeft
gebracht. Simon Rogers, eindredacteur van de dataredactie van The Guardian, heeft
bijvoorbeeld in een grafiek weergegeven hoe zijn redactie normaal gesproken een
datajournalistiek project aanpakt. Een beetje dubbelop misschien, grapte hij zelf. ‘Yes, this is a
graphic about how we produce data that often results in graphics. A data visualisation about
data visualisations, if you will.’ Hij lichtte de grafiek kort toe op het Datablog.77
Stap één is het lokaliseren van de data. Net als Bradshaw gaf ook Rogers aan dat die data uit
allerlei bronnen afkomstig kunnen zijn: actueel nieuws, overheidsdata, journalistieke research
enzovoort. Stap twee is kijken wat er met de data gedaan kan worden. Moeten die gecombineerd
worden met andere datasets (‘mash it up’)? Hoe kunnen ontwikkelingen het beste worden
weergegeven? Stap drie is het opschonen van de data. Rogers beschrijft dit bijna hetzelfde als
Bradshaw. Stap vier: ‘Now we’re getting there’. Nu is het tijd om daadwerkelijk berekeningen uit
te voeren om te kijken of er een verhaal in de data zit. De laatste stap is stap vijf: het kiezen van
een output. Wat is de beste vorm om het verhaal te presenteren: een tekst, een grafiek, een
visualisatie? Welke tools gebruiken we daarvoor?
77 Simon Rogers, ‘Data journalism broken down: what we do to the data before you see it’ The Guardian (07-04-2011) http://www.guardian.co.uk/news/datablog/2011/apr/07/data-journalism-workflow.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
30
Figuur 2: Guardian data journalism workflow
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
31
3.4 Workflows wereldwijd
Simon Rogers werkte ook mee aan het onderzoek Trends in Data Journalism, dat in september
2011 verscheen. Het werd geschreven door de Finse onderzoekers Tanja Aitamurto, Esa
Sirkkunen en Pauliina Lehtonen. Aitamurto interviewde Rogers en acht andere datajournalisten
uit het Verenigd Koninkrijk, de Verenigde Staten en Argentinië en vroeg hen onder meer naar
hun workflow bij bij datajournalistieke onderwerpen.
De onderzoekers concludeerden dat er twee manieren zijn om een datajournalitiek verhaal te
beginnen. Optie 1 is dat de redactie al een verhaal heeft ontdekt en dat de dataset meer
informatie verschaft over dat onderwerp. Optie 2 is dat een dataset dient als startpunt voor het
hele verhaal. De eerste optie lijkt volgens de onderzoekers meer gangbaar bij de
nieuwsorganisaties die zij onderzochten.78
Ook Aitamurto en zijn collega’s volgen min of meer dezelfde volgorde als Bradshaw en Rogers.
Na het verkrijgen van de data gaat het datateam de data eerst opschonen, om die vervolgens te
analyseren. Indien nodig worden de data gecombineerd met andere datasets om zo weer nieuwe
datasets te creëren. Na de analyse worden visualisaties en graphics gemaakt – door het team zelf
of in samenwerking met andere afdelingen. Nieuwsorganisaties benadrukken hierbij de
verhaallijn. “[D]ata visualisations and analyses are often a part of story, embedded in the
storyline, rather than the story’s main point.”79
“The data-analysis process can result in stories with visualisations, or in more permanent news
applications on the Web […] Further, news organisations are looking into the possibility of
developing mobile applications, as well, but the emphasis is still heavily on the Web.”80 De
gebruikte datasets worden normaal gesproken ook op de websites van de nieuwsorganisaties
gepubliceerd. Het publiceren van de ruwe data wordt gezien als een integraal onderdeel van het
78 Tanja Aitamurto, Esa Sirkkunen en Pauliina Lehtonen, Trends In Data Journalism (08-09-2011) 11 http://virtual.vtt.fi/virtual/nextmedia/Deliverables-2011/D3.2.1.2.B_Hyperlocal_Trends_In%20Data_Journalism.pdf; Geinterviewde journalisten: 1. Simon Rogers, The Guardian, editor of The Guardian.co.uk/data, United Kingdom. 2. David Donald, data editor, iWatch News, Center for Public Integrity, United States. 3. Scott Klein, Pro Publica, editor of news application, United States. 4. Barbara Grady, Oakland Local, United States. 5. Shane Shafflet, Bay Citizen, software developer and reporter, United States. 6. Jeffrey Friedman, research director, Maplight, United States. 7. Angelica Peralta, La Nacion, editor of news applications, Argentina. 8. Joseph Germuska, The Chicago Tribune, senior developer, news applications, United States. 9. Peter Aldhous, The New Scientist 79 Ibidem. 80 Ibidem.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
32
[story] proces. Dit heeft twee redenen: allereerst, transparantie. Wanneer de datasets online
staan kan iedereen er dezelfde analyses mee doen en de resultaten vergelijken met die van de
nieuwsorganisatie. Ten tweede kunnen nieuwsorganisaties door het publiceren van de data
mensen uitnodigen om zelf aan de slag te gaan met de data en nieuwe informatie te creëren. Zo
kan de samenleving meer profiteren van het simpelweg publiceren van datasets dan van het
publiceren van slechts de nieuwsreportage. Anderen kunnen relevante informatie vinden die
niet opgemerkt was door de journalisten.
Aitamurto en zijn collega’s stellen concluderend dat de workflow ruwweg in de volgende stappen
valt op te delen:
1. Het herkennen van de kern van het verhaal en de mogelijke rol voor de data in het
verhaal
2. Het herkennen en verkrijgen van de benodigde juiste data
3. Het geschikt maken van de data voor analyse
4. Analyse van de gegevens met de juiste tools en zonodig het mashen met andere datasets
5. De productie van het verhaal: tekst, visualisaties, interactieve elementen.
6. Het publiceren van de gegevens die werden gebruikt in de analyse.
7. Lezers uitnodigen om zelf aan de slag te gaan met de data, erop te reageren of het verhaal
te delen met social media als Flickr, Facebook en Twitter.81
3.5 Mirko Lorenz
Mirko Lorenz: “Data-driven journalism can be defined as a workflow, where data is
the basis for analysis, visualization and - most importantly – storytelling.”82
Datajournalistiek kent niet alleen een workflow, zoals alle journalistiek. Nee, datajournalistiek ís
een workflow. Althans, dat stelde Mirko Lorenz in zijn artikel ‘Status and outlook for data-
driven journalism’. In 2010 heeft hij deze definitie in een paar stappen uiteengezet op IJ-7, een
81 Tanja Aitamurto e.a., Trends In Data Journalism 11. 82 Mirko Lorenz, ‘Status and Outlook for data-driven journalism’ in: Data-driven journalism: What is there to learn? A paper on the data-driven journalism roundtable held in
Amsterdam on 24 August 2010 http://mediapusher.eu/datadrivenjournalism/pdf/ddj_paper_final.pdf (2010) 10.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
33
conferentie over onderzoeksjournalistiek van de universiteit van Stanford.83 Waar het Finse
onderzoek eindigde met zeven stappen, beperkt Lorenz zich tot vijf stadia.
1. Digging deep into (big) data (scrape, cleanse, structure)
2. Mining for "nuggets" of information (filter)
3. Visualizing information in graphics or multimedia specials
4. Connecting classic storytelling with otherwise dry statistics
5. Creating media that has value for readers/users
3.6 Nederland van Boven
Frederik Ruys visualiseerde voor het VPRO-programma Nederland van Boven allerlei datasets.
Voor het journalistieke vaktijdschrift Villamedia visualiseerde de datajournalist zijn eigen
manier van werken.84
Figuur 3: Workflow Nederland van Boven
Ook hier is een inmiddels herkenbare volgorde zichtbaar. Wat op televisie natuurlijk wel
belangrijker is dan voor kranten en weblogs is de laatste stap: het animeren. Want alleen een
statische visualisatie is natuurlijk niet voldoende voor een televisieprogramma.
83 http://www.slideshare.net/mirkolorenz/datadriven-journalism-what-is-there-to-learn (Sheet 8/33) 84 De illustratie is gemaakt door Frederik Ruys en verscheen bij het artikel: Dolf Rogmans, 'Cijfers brengen de mierenhoop tot leven' Villamedia (21-10-2011).
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
34
3.7 Luuk Sengers
In Nederland heeft onderzoeksjournalist en docent journalistiek Luuk Sengers gedetailleerd
beschreven welke workflow je bij dataprojecten zou kunnen volgen. In zijn boek
Onderzoeksjournalistiek: researchproces van idee tot verhaal geeft hij niet zozeer een
beschrijving van geanalyseerde workflows, maar adviseert hij een zekere workflow door een
bepaalde volgorde van vragen uit te stippelen die een beginnend datajournalist voor zichzelf zou
moeten beantwoorden.
Het allereerste wat je jezelf zou moeten afvragen is volgens Sengers: “Welke data zijn er over
mijn onderwerp en wie verzamelt die?” Hij geeft een aantal hulpvragen die je jezelf zou kunnen
stellen om erachter te komen welke data je nodig hebt.
- “Welke daders, getroffenen en/of getuigen houden misschien gestructureerd gegevens
bij? Wie heeft er belang bij om bepaalde zaken te registreren of te meten? En wie heeft
er een plicht om gegevens bij te houden?
- Moeten zij die data doorgeven aan een autoriteit, bijvoorbeeld de overheid, een
statistisch bureau of een overkoepelende (belangen-) organisatie?”
Sengers hanteert in zijn volgorde van vragen dezelfde volgorde van thema’s die eerder al in
bovenstaande workflows te zien waren. Stap twee is: ‘Hoe krijg ik data die niet online staan?’
Stap drie is het organiseren van data en stap vier en vijf gaan over het presenteren van de data,
respectievelijk in een geografische kaart en een netwerkvisualisatie.
3.8 Waar te beginnen?
De workflowmodellen komen in grove lijnen aardig overeen. Ieder model kent (een vergelijkbare
vorm van) de volgende volgorde van stappen:
- het verkrijgen van data
- het opschonen van data
- het analyseren van data
- het presenteren van het verhaal dat uit de data naar voren komt
In de praktijk kan de invulling van die workflow wel verschillen. Voordat de Nederlandse
datajournalisten naar hun werkwijze werd gevraagd, is voor dit onderzoek eerst uitgezocht
welke verschillende werkwijzen al gedocumenteerd zijn.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
35
De verschillen beginnen al bij het allereerste begin: waar begin je mee? Een mogelijkheid is om
te beginnen met de data. Zoek een interessante dataset, bekijk het van alle kanten en zoek naar
een interessante journalistieke invalshoek. Maar volgens Carin Beenen, journalist bij het
Eindhovens Dagblad, is het beter om allereerst een goede en journalistieke vraag te formuleren
waarmee je aan de slag gaat en je goed af te vragen wat het einddoel van je onderzoek is. “Dat
lijkt een open deur maar zeker bij grote onderzoeken is het goed om dat in het achterhoofd te
houden omdat je het oorspronkelijke doel van het onderzoek al snel uit het oog kunt verliezen
als je op interessante zijwegen stuit.”85 Ook Bas Broekhuizen adviseert om vanuit een
journalistieke vraag te beginnen. Gewoon, zoals ander redactiewerk ook gebeurt. “Vervolgens
kijk je of je data kunt vinden die je helpen de vraag te beantwoorden.”86 De docent Journalistiek
en Nieuwe Media beschrijft ter illustratie wat hij zag op de hackevenementen die hij bijwoonde.
“Die jongens gaan los op data, maar leveren uiteindelijk iets dat geen vraag beantwoordt. Je
krijgt een visualisatie van alle openbare toiletten in Amsterdam, welk verhaal vertel je
daarmee?”87
Op zich klinkt zijn kritiek voor een journalist heel plausibel. Want inderdaad: waar is het
verhaal? Een journalistieke productie moet immers een verhaal vertellen. Toch? Maar je zou, net
als Adrian Holovaty, deze vraag ook simpelweg kunnen pareren met: “Who cares”? Een mooi,
toelichtend verhaal zou wellicht een mooie aanvulling zijn op zo’n visualisatie, maar zou een
helder overzicht van de openbare toiletten in Amsterdam niet best handig kunnen zijn voor
bijvoorbeeld lezers van het Parool? In dit onderzoek wordt zoiets echter niet gezien als
datajournalistiek, aangezien journalistiek inderdaad een verhaal moet vertellen. Wanneer die
visualisatie een verhaal zou vertellen, zou dit het stempel journalistiek verdienen. Maar
aangezien het alleen een overzicht van toiletten was, valt het buiten dit onderzoek.
3.9 Routines
De werkwijze van een journalist wordt niet alleen bepaald door de stadia van het
totstandkomingsproces, maar ook door andere elementen van zijn werkwijze. Journalisten
werken volgens een set van regels, normen en procedures: hun routines. Dit werd in 1957 al
opgemerkt door Bruce Westley en Malcolm Maclean, twee grondleggers van de journalism
85 Carin Beenen in reactie op Paul Vereijken, 'Hoe begin je met datajournalistiek?' Spotlight Effect (05-07-2011) www.spotlighteffect.nl/journalistiek/hoe-begin-je-met-datajournalistiek. 86 Jerry Vermanen, 'Alles om ons verandert in data' RegioHack (15-09-2011) www.regiohack.nl/interviews/alles-om-ons-verandert-in-data/. 87 Ibidem.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
36
studies.88 In de jaren negentig omschreven de academici Pamela Shoemaker en Stephen Reese
routines als: “Patterned, routinized, repeated practices and forms that media workers use to do
their jobs”.89 Een voorbeeld van zo’n routine is de deadline, die een vaste plek heeft in het
journalistieke proces en dat proces ook beïnvloedt. De socioloog Gaye Tuchman, die routines als
eerste koppelde aan journalistiek, zag routines als strategische rituelen.90 Die routines spelen
een grote rol in de nieuwsselectie. Er is weinig tijd, ruimte en geld en vanuit dit oogpunt is het
efficiënt om aan de hand van routines te bepalen aan welk nieuws aandacht wordt besteed.
Routines hebben ook een nadelige kant. Volgens Reese conditioneren ze de autonomie en
invloed van journalisten, terwijl die zich hier niet van bewust zijn.
Datajournalistiek is een nieuwe manier van werken. Maar journalisten houden vaak juist vast
aan een bekende manier van werken. De Nederlandse communicatiewetenschapper Mark Deuze
stelt dat journalisten wel erg gehecht aan hun routines. Journalisten lijken volgens hem een
dubbele houding te hebben ten opzichte van vernieuwing en verandering in het vak.
“Journalisten staan positief tegenover ontwikkelingen die het werk vergemakkelijken, maar zijn
huiverig als het erom gaat de aangeleerde werkwijzen daadwerkelijk te veranderen en echt
gebruik te maken van allerlei nieuwe mogelijkheden.”91 Nauw verbonden met routine is de
werkverdeling. Hoe zijn de verhoudingen tussen verschillende journalisten? Deuze stelt dat
journalisten niet alleen werken volgens patronen en routines, volgens vaak ongeschreven regels
en afspraken, maar ook binnen een tamelijk hiërarchische redactie.92
De manier waarop een journalist en een nieuwsorganisatie projecten organiseren heeft ook
invloed op het eindproduct, concludeerden de sociologen Herbert Gans en Todd Gitlin. Neem de
journalistieke gewoonte om artikelen ‘oprolbaar’ te maken. Van een journalist wordt verwacht
dat hij in een nieuwsverslag allereerst meldt wat volgens hem het belangrijkste is. Dat zit zo in
het denken van een journalist gebakken dat hij het bijna niet meer doorheeft. Maar hiermee
heeft de beoordeling van de situatie door de journalist vanzelfsprekend ook invloed op het
uiteindelijke artikel.
Journalistieke routines hebben ook het denken van de nieuwsconsument beïnvloed. De
Amerikaanse historicus en wetenschapsfilosoof Thomas Kuhn, die bekend werd met het
introduceren van de term ‘paradigmashift’, omschreef paradigma’s wel als manieren om de
88 Bruce Westley en Malcolm MacLean, ‘A conceptual model for communications research’ Journalism Quarterly (1957) 31-38, aldaar 34. 89 Pamela J. Shoemaker en Stephen D. Reese, Mediating the message (New York 1996) 100. 90 Gaye Tuchman, ‘Making news by doing work: Routinizing the unexpected’ American Journal of Sociology 77 (1979) 110-131. 91 Mark Deuze, Wat is journalistiek? (Amsterdam 2004) 58. 92 Idem, 153.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
37
werkelijkheid te representeren gebaseerd op breed gedragen aannames over hoe informatie
verzameld en geïnterpreteerd dient te worden. Het is erg belangrijk om te beseffen dat zo’n
paradigma niet garandeert dat de informatie die je krijgt de waarheid is. Het is simpelweg een
manier om ons informatie te geven op een manier die wij accepteren. Zulke routines hebben
goede kanten: hoor en wederhoor zorgt er bijvoorbeeld voor dat meerdere kanten van een
verhaal belicht worden. Maar wat als je niet op twee, maar op wel drie of dertig manieren naar
een verhaal kunt kijken? Als journalist val je dan al snel terug op de routine van hoor en
wederhoor. Je kiest een voorstander, je kiest een tegenstander en klaar: jij hebt je werk netjes
gedaan. En de kijker denkt: dit is kennelijk de situatie. Er is een voorstander die zus zegt en een
tegenstander die zo zegt. Dat er misschien wel tig andere manieren zijn om naar een verhaal te
kijken vergeten we al snel, omdat we zo gewend zijn aan die paradigma’s en routines.
Zo kan ook datajournalistiek haar routines en paradigma’s ontwikkelen. Dat kan voordelen
hebben, maar ook nadelen. Een journalist kan er zijn werk mee vergemakkelijken, maar ze
kunnen hem ook in de weg zitten. Wat zou er bekend zijn over routines binnen de
datajournalistiek?
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
38
4. Methode
Het doel van dit onderzoek is om na te gaan in hoeverre de werkwijze en routines van
Nederlandse media verschillen waar het gaat om datajournalistiek. Om in kaart te kunnen
brengen hoe Nederlandse journalisten datajournalistieke items aanpakken heb ik contact
gezocht met de journalisten die hier in Nederland het meest intensief mee bezig zijn en heb ik
hun geïnterviewd.93
4.1 De respondenten
In eerste instantie ben ik op zoek gegaan naar datajournalisten die zichzelf als zodanig
omschrijven, door anderen zo worden omschreven en/of specifiek met datajournalistiek bezig
zijn. Zodoende kwam ik terecht bij een eerste selectie van respondenten, namelijk Arlen Poort,
Dimitri Tokmetzis, Jerry Vermanen en Laura Wismans. Deze groep was nog te klein voor een
wetenschappelijk onderzoek, dus heb ik ook afspraken gemaakt met mensen die wel intensief
bezig zijn met datajournalistiek, maar zichzelf niet volledig beschouwen als makers van
datajournalistiek. Dit waren Erik Bloem, Jasper Koning en Anke Vellenga. Hieronder worden zij
aan u voorgesteld.
Erik Bloem (Altijd Wat)
Erik Bloem is onderzoeksjournalist bij het televisieprogramma Altijd Wat. Hij studeerde Frans
met Europese Studies en volgde de Postdoctorale Opleiding Journalistiek. Hij werkte voor NRC
Handelsblad en de Volkskrant, waar hij meewerkte aan onderzoeken naar invloedrijke
Nederlanders en straffen in Nederland. Hij werkte voor de Volkskrant ook als redacteur
economie. Altijd Wat heeft de opzet van een magazine op tv. De redactie bestaat grotendeels uit
de oude redactie van Netwerk.
Jasper Koning (Nederland van Boven)
Jasper Koning was eindredacteur van Nederland van Boven. Hij studeerde journalistiek en ging
daarna bij computermagazine PC Magazine werken. Als webredacteur werkte hij voor de NCRV
en ICT-nieuwssite ZDNet. Daarna ging hij aan de slag bij de VPRO, waar hij verschillende
93 Enkele van de journalisten zijn fulltime bezig met datajournalistiek, maar voor anderen is datajournalistiek (nog) een zijproject. Aangezien niet iedereen zichzelf beschouwt als datajournalist, zullen zij in dit onderzoeksverslag eenvoudigweg aangeduid worden als ‘journalisten’ of ‘respondenten’.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
39
websites onderhield, projectmanager werd en nu werkt als redacteur digitaal voor Tegenlicht.
Arlen Poort (NRC Handelsblad)
Arlen Poort studeerde aan de School voor Journalistiek en liep stage bij NRC Handelsblad. Daar
werkte hij vanaf 1996 voor de bijlage Profiel aan de graphics en tegenwoordig is hij
eindredacteur Binnenland. Datajournalistiek doet hij hiernaast. Voordat hij bij het NRC
Handelsblad begon was hij verslaggever voor de Havenloods in Rotterdam.
André Tak (RTL Nieuws)
André Tak is coördinator van de onderzoeksredactie van RTL Nieuws. Eerder werkte hij voor
het VARA-televisieprogramma Zembla. In 2011 stelde het Stimuleringsfonds € 92.500
beschikbaar voor de RTL Nieuws Facts. Deze feitensite, waar allerlei statistieken over veiligheid,
verkeer, zorg en geld zijn te raadplegen, werd in februari 2013 gelanceerd.
Dimitri Tokmetzis (Sargasso)
Dimtiri Tokmetzis is hoofdredacteur van het groepsblog Sargasso. Hij studeerde geschiedenis
en ging daarna de journalistiek in. Hij was algemeen verslaggever bij het Utrechts Nieuwsblad
en richtte zich daarna op onderzoeksjournalistiek. Later werkte hij op de onderzoeksredactie
van NRC Handelsblad en als freelancer. Dimitri is tevens de auteur van ‘De Digitale Schaduw’,
een boek over privacykwesties waarin hij waarschuwt voor de gevaren van een oncontroleerbare
digitale identiteit. Sargasso kon in 2011 dankzij een startsubsidie van het Stimuleringsfonds
voor de Pers á € 84.471 een datajournalist aannemen.
Anke Vellenga (NOS)
Anke Vellenga is bij de NOS informatiespecialist op de afdeling Documedia, waar research wordt
gedaan en het beeld- en tekstarchief wordt bijgehouden. Ze studeerde Informatiedienstverlening
en -management, een opleiding waarbij je leert hoe je met informatie omgaat en hoe je dat kan
managen in een organisatie. Daarna werkte ze bij RTL, waar ze zich bezighield met research en
archiveren, en het Algemeen Dagblad, waar ze zich focusde op research. Daarnaast heeft ze de
master Media en Journalistiek gedaan. Op dit moment is ze bezig met de postdoc Internationale
Researchjournalistiek.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
40
Jerry Vermanen (Nu)
Jerry Vermanen is datajournalist bij de website Nu. Hij studeerde Industrieel Ontwerpen
(bachelor) en Journalistiek & Nieuwe Media (master). Hij liep stage bij het ANP en werd hierna
internetredacteur bij regionaal dagblad de Stentor, waar hij Regiohack opzette en leidde. Jerry
schreef ook mee aan het Data Journalism Handbook.
Laura Wismans (nrc.next)
Laura Wismans werkt als (data)redacteur en factchecker bij nrc.next. Ze studeerde
communicatiewetenschappen en journalistiek, werkte kort voor Elsevier en ging daarna als
dataredacteur aan de slag voor Sargasso en het ANP. Laura zit ook in het bestuur van open
datastichting Open State (een fusie van Het Nieuwe Stemmen en Hack de Overheid).
De respondenten zijn werkzaam voor verschillende soorten media: een van hen werkt voor een
groepsblog, een ander voor een nieuwssite, twee voor een krant, twee voor multimediale
nieuwsorganisaties en twee voor een televisieprogramma. Het idee hierachter was, dat kon
worden vergeleken of journalisten verschillende werkwijzen hebben als zij datajournalistieke
producties maken voor nieuwsorganisaties die verschillende mediavormen als primair kanaal
gebruiken.
Ik heb in de zomer van 2012 ook contact gezocht met Sybren Kooistra, die inmiddels als
datajournalist werkt voor de Volkskrant, maar hij had op dat moment naar eigen zeggen nog
(te) weinig zicht op zijn taken, routines en workflow. Een andere datajournalist is Frédérik Ruys,
die meewerkt aan Nederland van Boven. Ik heb hem niet geinterviewd, maar Jasper Koning wel
en die heeft uitgebreid verteld over de totstandkoming van dit programma. Ook heeft Ruys de
voorlopige versie van deze scriptie gelezen en van commentaar voorzien. Buiten Kooistra en
Ruys is er bij mijn weten niemand in Nederland intensief bezig met datajournalistiek.
4.2 De interviews
Dit onderzoek is opgezet als kwalitatief onderzoek. Het doel van kwalitatief onderzoek is om
onder meer gedragingen en ervaringen van betrokkenen te beschrijven en interpreteren op een
manier die de natuurlijke omgeving zo min mogelijk verstoort. In het onderzoek is als methode
gekozen voor het kwalitatieve onderzoeksinterview. Dit is een methode van dataverzameling
waarbij niet strikt wordt vastgehouden aan van tevoren geformuleerde vragen over een bepaald
onderwerp, maar waarbij gebruik wordt gemaakt van een lijst met onderwerpen. Op deze
manier kon ik een interview aanpassen aan de loop van het gesprek. Binnen het kwalitatief
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
41
interview bestaan twee vormen: het ongestructureerd en het semi- of half-gestructureerd
interview. Hier heb ik gekozen voor het semi-gestructureerde interview. Deze structuur is er op
gericht om de waarde en betrouwbaarheid van sleutelbegrippen te optimaliseren.94 Hierbij is
slechts een deel van de vragen en gespreksonderwerpen van tevoren vastgesteld en bestaat ook
de ruimte om hiervan af te wijken. Datajournalistiek zoals die momenteel wordt beoefend is nog
een relatief nieuw werkveld en over de werkwijze was nog zoveel onduidelijk, dat een volkomen
gestructureerde interviewmethode de kans op onverwachtse en wellicht des te interessantere
resultaten zou doen afnemen. Een semi-gestructureerd interview kan er toe leiden dat het
gesprek op andere zaken komt die de onderzoeker niet eerder in aanmerking had genomen,
maar die belangrijk voor zijn begrip kunnen zijn. Dit kan helpen om onderzoeksvragen te
beantwoorden of te formuleren.95
De interviews vonden plaats in de periode van juli tot en met oktober 2012. Ik heb de
respondenten eerst via een e-mail gevraagd of zij mee wilden werken aan de interviews en heb
daarna een afspraak gemaakt. Voorafgaand aan de interviews heb ik mij verdiept in het werk
van iedere respondent. Zo kon ik vragen hoe de respondent bij specifieke items te werk was
gegaan. Daarna ben ik voor bijna alle interviews naar de werkplek van de respondenten gereisd.
Zodoende hoefden zij weinig moeite te doen en kon het gesprek plaatsvinden in een voor hen
vertrouwde omgeving. Alleen het gesprek met André Tak is om praktische redenen telefonisch
gehouden. De gesprekken duurden een uur tot anderhalf uur. Alleen het gesprek met André Tak
was korter, dit duurde ongeveer veertig minuten. Alle gesprekken werden opgenomen met een
voicerecorder. Daarnaast maakte ik aantekeningen.
Geen artikel is hetzelfde en ieder project heeft specifieke eigenschappen. Wanneer gevraagd
zou worden naar een algemene workflow zou het voor een datajournalist wellicht moeilijk zijn
om een antwoord te geven dat voor ieder project van toepassing is. Ik heb me daarom
voorgenomen te vragen naar een paar voorbeeldcasussen die als uitgangspunt gebruikt kunnen
worden. Ik was dan benieuwd naar
- een item waar ze heel trots op zijn
- een item waar het productieproces heel goed verliep
- een item waar het productieproces moeizaam verliep
Deze vragen heb ik niet bij ieder interview allemaal expliciet hoeven stellen om een antwoord te
krijgen.
Na afloop van de gesprekken zijn alle interviews volledig getranscribeerd. Hierbij werd de
94 Alan Bryman, Social Research Methods (Oxford 2004) 313. 95 Mark Saunders, Philip Lewis en Adrian Thornhill, Methoden en technieken van onderzoek; derde editie (Amsterdam, 2004) 261.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
42
opgenomen tekst letterlijk uitgeschreven. In hoofdstuk 8 zijn alle transcripties terug te vinden.
Vervolgens zijn de interviews geanalyseerd.
4.3 Analyse van de interviews
Om de interviews te analyseren is gekozen voor de analysemethode van de gefundeerde
theoriebenadering. Het belangrijkste onderdeel van deze analysemethode is de constante
vergelijking.96 De analyse van het onderzoek werd uitgevoerd in drie stappen, zoals die
beschreven zijn door de Nederlandse sociologe Hennie Boeije. Zij noemt deze analysemethode
ook wel “de onderzoeksslang”. Deze onderzoeksslang slingert gedurende het gehele onderzoek,
zowel in de theoretiserende fase als de beschrijvende fase, heen en weer tussen ‘gegevens’,
‘activiteiten’ en ‘resultaat’. De slang begint bij het verzamelen van gegevens: de interviews. De
eerste activiteit is vervolgens het open coderen. Hierbij worden de getranscribeerde
interviewteksten gefragmenteerd, beoordeeld op relevantie en voorzien van steekwoorden. Dit
resulteert in een lijst met codes. De tweede fase is het axiaal coderen. Hierbij worden stukken
tekst die in de eerste fase dezelfde code hebben gekregen vergeleken op verschillen en
overeenkomsten. De zogenaamde ‘onderzoeksslang’ wordt afgesloten in fase drie, waarin
gezocht wordt naar uitzonderingen op de gevonden codes. De onderzoeksbegrippen worden
vergeleken met de literatuur.97
Door het volgen van de onderzoeksslang vergelijk je costant je onderzoeksresultaten met de
literatuur en je verwachtingen. Na het opsturen van de voorlopige versie van de scriptie
reageerde een enkele respondent met opmerkingen. Ook andere betrokkenen lazen de
voorlopige versie en gaven op- en aanmerkingen.
4.4 Thema's
Voor de interviews heb ik het onderwerp opgedeeld in de volgende thema's:
De workflow
Voor beginnende datajournalisten is het lastig een aanpak te ontwikkelen. Zij kunnen wat
opsteken van de verschillende werkwijzen van andere media. Daarnaast is het interessant om te
onderzoeken in hoeverre media die zich primair op verschillende verschijningsvormen richten
van aanpak verschillen. Zijn we echt in het multimediale tijdperk aanbeland?
96 Hennie Boeije, ‘Analyseren in kwalitatief onderzoek. Denken en doen’ (Amsterdam 2005) 75. 97 Ibidem, 80-98.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
43
De doelstelling
Het uiteindelijke doel kan zijn om zo snel mogelijk data te publiceren bij actueel nieuws. Het
kan ook zijn om iets te onthullen wat nog niet openbaar was. Of: lezers de mogelijkheid geven
om zelf informatie te vinden. Elke optie vergt een heel andere aanpak.
De onderwerpen
Wie uitgaat van een bepaalde bron, wordt daardoor beinvloedt. De bron is dan leidend. Dit
levert een ander verhaal op dan wanneer je uitgaat van een specifieke vraag. Wanneer de
datajournalistiek een soort aanvulling is op een groter verhaal, heeft dit ook gevolgen.
De medewerkers
De manier waarop een journalist te werk gaat beinvloedt zijn items. Net zoals zijn
werkomgeving of zijn eerdere werkervaring zijn werkwijze kan beinvloeden. Hebben ze een
journalistieke achtergrond of zijn het van origine designers? Zijn ze jong met frisse ideeen of
ouder met veel ervaring?
Daarnaast is de werkverdeling binnen het team van belang. Bij een grote redactie (zoals NOS,
RTL, Volkskrant of NRC) kunnen de taken meer verdeelt worden. Bij Nu is maar een
datajournalist. Sargasso organiseerde hackathons. Dit heeft ongetwijfeld gevolgen voor de
totstandkoming van de verhalen, maar welke precies?
De organisatie
De werkwijze van een nieuwsorganisatie, ook van de niet-datajournalistieke afdelingen, kan
direct of indirect invloed hebben op de datajournalistieke producties. Als de hele organisatie
bijvoorbeeld gewend is aan hele korte deadlines is het moeilijker voor een datajournalist om
meer tijd vrij te krijgen voor een project.
De volledige topiclijst die gebruikt is voor de interviews is terug te vinden in de bijlagen.
4.5 Kwaliteit van het onderzoek
Bij de uitvoering van wetenschappelijk onderzoek is het uiteraard van belang dat dit
onderzoek een betrouwbare weergave van de werkelijkheid is. Het werkelijkheidskarakter
en de juistheid van wetenschappelijke studies hebben, zoals Hennie Boeije beschrijft,
‘betrekking op enerzijds de validiteit van uitspraken die onderzoekers doen op de grond van
de resultaten van hun onderzoek, en anderzijds op de navolgbaarheid van het
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
44
onderzoeksproces dat tot die resultaten heeft geleid.’98 Validiteit draait om de beinvloeding
van het onderzoek door systematische fouten. Wanneer onderzoekers meten wat zij beogen
te meten, wordt dat gezien als validiteit. In dit onderzoek is op verschillende manieren
geprobeerd om deze factoren te waarborgen. De validiteit kan bijvoorbeeld bedreigd worden
doordat een deel van de doelpopulatie niet kan of wil meewerken aan het onderzoek. 99
Aangezien bijna iedereen die in Nederland intensief bezig is met datajournalistiek
geinterviewd is voor dit onderzoek, is de validiteit op dit punt bijvoorbeeld gewaarborgd.
Ter bevordering van de navolgbaarheid van het onderzoeksproces wordt hier allereerst de
onderzoeksmethode besproken. Daarnaast is de werkwijze navolgbaar gemaakt door
relevante documentatie in de bijlage op te nemen. Zo is de topiclijst voor de interviews in de
bijlage terug te vinden en daarnaast zijn alle interviews volledig getranscribeerd en
opgenomen in de bijlage. Wie wil kan de interviews nalezen en controleren hoe de
bevindingen uit dit onderzoek tot stand zijn gekomen. Tot slot hebben verschillende
betrokkenen, die geinterviewd zijn of anderzijds betrokken zijn bij datajournalistiek, het
onderzoek nagelezen in het kader van zogenaamde member validation of member checks.100
Zij hadden geen kritiek op hoe de interviews zijn weergegeven of de conclusies die eruit zijn
getrokken. Wel zijn er nog enkele updates toegevoegd, zodat de gegeven informatie zo
actueel mogelijk is. Op grond van deze aspecten mag de lezer ervan uitgaan dat dit een
betrouwbaar onderzoek is.
98 Hennie Boeije, ‘Kwalitatief onderzoek’ in: Harm ’t Hart, Hennie Boeije en Joop Cox (ed.),
Onderzoeksmethoden (Den Haag 2009) 247-281, aldaar 273. 99 Idem, 274. 100 Idem, 275.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
45
5. Onderzoeksresultaten
In dit hoofdstuk zullen de onderzoeksresultaten gepresenteerd worden. Op basis van de
themaverdeling en de codering tijdens de analyse zijn verschillende paragrafen opgesteld waarin
te lezen valt wat de respondenten over bepaalde thema’s zeggen. Een kleine opmerking vooraf:
voor de volledigheid wordt hieronder zo precies mogelijk vermeld hoeveel van de
geïnterviewden een bepaald standpunt innamen. Tenzij anders vermeld, wil dit niet automatisch
zeggen dat de overige geïnterviewden niet op die manier werken. Het kan bijvoorbeeld zijn dat
de overige sprekers niets over het bewuste onderwerp hebben gezegd.
5.1 Doelstelling
Een van de factoren die bepaalt hoe je als nieuwsorganisatie te werk gaat, is je doelstelling. Je
zou er vanuit kunnen gaan dat nieuwsorganisaties logischerwijs het doel hebben om nieuws te
brengen. Maar wie datajournalistieke projecten in het buitenland bekijkt, merkt dat
nieuwsorganisaties – anders dan hun naam doet vermoeden – zich hierbij niet alleen op
nieuwsonderwerpen focussen. Sommige items zijn niet zozeer nieuws, maar bieden meer inzicht
in een bekend fenomeen. Hoe zou dit zijn in Nederland? Is nieuwswaarde een vereiste voor hun
dataprojecten? En zo niet, wat dan wel? Na analyse van de interviews kan het volgende worden
geconcludeerd:
• Bij vier van de zeven organisaties die in dit onderzoek aan bod komen, is het brengen van
nieuws het voornaamste doel. Bij deze organisaties wordt van de meeste items verwacht
dat ze nieuws bevatten en datajournalistieke items vormen hierop geen uitzondering.
• De overige drie organisaties maken ook graag nieuws, maar nieuwswaarde is geen
vereiste voor hun producties. Zij vinden het ook interessant om meer inzicht te
verschaffen in dingen die al bekend zijn of belichten de bekende werkelijkheid graag op
een verrassende manier.
• Twee organisaties hebben zowel als doel om data te visualiseren als om zelf data te
vinden om daar nieuws uit te halen. Het visualiseren is volgens hen een stuk makkelijker
dan het zelf vinden van data.
• Vier organisaties stelden expliciet dat ze proberen hun data zo persoonlijk mogelijk aan
hun publiek te presenteren.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
46
5.1.1 Nieuwswaarde als harde eis
Bij vier organisaties is het een vereiste dat hun dataproducties nieuws bevatten. Bij RTL Nieuws
is die eis het hardste: hier wordt zelfs verwacht dat dataprojecten de opening van het nieuws
vormen. Ook bij het NRC Handelsblad is nieuwswaardigheid een eis. Er moet bij de krant een
trend, ontwikkeling of iets onverwachts in de data zitten. Wat iedereen al weet of verwacht is
volgens Arlen Poort niet spannend om op te schrijven. Daarom heeft hij op de redactie de regel
gesteld dat er altijd een nieuwskop boven een graphic moet staan. Bijvoorbeeld: ‘Meeste
moorden in Amsterdam’ boven een kaart waarop Amsterdam naar voren springt. Zo wil de krant
laten zien wat het nieuws is, maar ook waarom een lezer een artikel moet lezen en wat hij eruit
kan concluderen. Gelukkig gebeurt er volgens Poort altijd wel wat in data. Hij zit op een lijn met
Jerry Vermanen van Nu. De populaire site heeft eveneens de doelstelling om nieuws te brengen
– zo snel en duidelijk mogelijk. Bezoekers van Nu zijn volgens Vermanen mensen die snel het
nieuws willen weten, die binnen anderhalve minuut een berichtje willen doornemen en het dan
volledig willen snappen. Achtergrondnieuws zien ze niet als hun kracht.
Bij de NOS is het eigenlijk wel de bedoeling dat datajournalistieke items nieuws bevatten, maar
Anke Vellenga vindt persoonlijk dat de omroep best meer aandacht mag besteden aan
achtergronden. Soms doet ze dat wel, maar praktisch is het simpelweg lastig om
achtergrondartikelen een plek te geven binnen de NOS. De organisatie was vroeger gericht op
televisie, maar nu is internet ‘first’. En de website is vooral een nieuwssite. Het is voor de
internetredactie lastig om achtergrondnieuws weg te zetten binnen de site. Vellenga: ‘In het
blokje ‘laatste nieuws’ heb je dan een achtergrondverhaal, dat klopt eigenlijk niet’.
5.1.2 Nieuws niet het enige doel
Erik Bloem van NCRV’s Altijd Wat ziet vaak dat datajournalistiek dingen oplevert waarvan hij
denkt: ‘Ohja, dat wist ik eigenlijk al wel een beetje – en nu is het in kaart gebracht’. Dat is niet
het soort onderzoek dat hij wil verrichten. Hij wil hard nieuws. ‘Eigenlijk wil ik dat mensen
‘schande’ zeggen. Nu hoeft dat niet altijd, maar je wilt wel tegels lichten.’ Maar dat is lastig met
datajournalistiek, merkt hij. En Altijd Wat is bovendien ook geen nieuwsprogramma, maar een
opinieprogramma. De makers vinden het leuk om nieuws te maken, maar dat kan niet elke week
en dat is ook niet hun streven. Ze willen spraakmakende verhalen maken. Afstand nemen van
het hijgerige en laten zien hoe het nou eigenlijk echt zit. Altijd Wat wil een ander licht laten
schijnen op de samenleving.
De bekende werkelijkheid in beeld brengen vanuit een verrassende invalshoek was ook het doel
van de makers van Nederland van Boven. Zij wilden Nederland laten zoals een kijker of
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
47
bezoeker dat nog nooit had gezien. Dat deed het programma vooral met helikopterbeelden. Wat
niet met de helikopter gefilmd kon worden, werd getoond in datavisualisaties. De makers waren
op zoek naar een nieuwe manier om naar Nederland te kijken, wat in die zin wel nieuws was.
Maar ze zochten eerder de verrassing dan hard nieuws. De redactie kreeg veel reacties op een
fragment dat helemaal geen nieuws was. In dit fragment zag de kijker een meeuw die van Texel
naar Amsterdam vliegt. Eindredacteur Jasper Koning: ‘Het is niet wereldschokkend, maar het
brengt wel bij veel mensen het besef: ‘Jemig, een vogel vliegt dus in een dagje van Texel naar
Amsterdam’.’
Ook bij Sargasso is nieuws geen vereiste voor de datajournalistieke items. Het
langetermijndoel van het groepsblog is het vormen van een kwaliteits online medium. De
makers willen op een vernieuwende manier goede verhalen maken en datajournalistiek is een
van die manieren. Anders dan bij bijvoorbeeld de NRC kan bij Sargasso iets wat algemeen
bekend is wel de moeite waard zijn om te publiceren. Zo zag een blog in een Twitteronderzoek
dat iedereen op het Binnenhof ‘totaal geobsedeerd’ is door Pauw & Witteman. Dimitri
Tokmetzis vindt het toch leuk om dat soort dingen duidelijk te maken. ‘Dat weet iedereen, maar
het is wel goed om dat af en toe ook te laten zien.’ Soms gaat het bieden van
achtergrondinformatie en nieuws ook samen. Bijvoorbeeld met de hackathon over politieke
data, die door Sargasso werd georganiseerd. Hiermee probeert het blog achtergrondinformatie
te bieden, maar uit zo’n hackathon verwacht Tokmetzis ook wel nieuws te halen.
5.1.3 Visualiseren makkelijker dan data vinden
Het ene doel is soms lastiger te realiseren dan het andere. Twee nieuwsorganisaties (Nu en
NOS) lieten weten dat hun doel enerzijds is om data te visualiseren en anderzijds om zelf data te
verzamelen om daar vervolgens nieuws uit te halen. Beiden gaven los van elkaar aan dat het
visualiseren van bestaande data een stuk makkelijker is dan het zelf vinden van data. Op het
verkrijgen van data wordt hieronder nog dieper ingegaan.
5.1.4 Persoonlijk maken
De journalisten die voor dit onderzoek zijn geïnterviewd zijn, doen erg hun best om hun
producties persoonlijk te maken voor hun publiek. RTL Nieuws wil met datajournalistiek zoveel
mogelijk gegevens waar het publiek zelf wat aan heeft inzichtelijk maken. Het liefst doet het
programma dit door gegevens te koppelen aan de woonplaats van de gebruiker. ‘Dat is eigenlijk
de belangrijkste doelstelling,’ stelde André Tak. Mensen kunnen zo zien hoe de plek waar zij
wonen functioneert ten opzichte van andere plaatsen.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
48
De datajournalistiek van de NOS is op een soortgelijke manier begonnen. De medewerkers
vroegen zich af hoe ze verhalen waar cijfers in voorkomen mooier kunnen presenteren voor
mensen en inzichtelijker kunnen maken. Een bezoeker moet kunnen uitzoeken wat het nieuws
voor hem persoonlijk betekent.
De makers van Nederland van Boven hebben zich ten doel gesteld om data altijd te verpakken
in een aansprekend, persoonlijk verhaal, dat herkenbaar is voor kijkers. Ieder onderdeel van het
programma, hoe klein ook, moest een verhaallijntje hebben. Dit was een van de twee belangrijke
elementen die volgens Jasper Koning goed werkten in de eerste serie van het programma. Het
andere element was het in beeld brengen van pure complexiteit. Grote hoeveelheden,
enormiteit. Koning: ‘Ik denk dat dit een mannelijke appeal is en dat persoonlijke verhaal meer
de vrouwelijke appeal is.’
5.2 Onderwerpen
Wat maakt een onderwerp meer of minder geschikt voor datajournalistiek, volgens de
nieuwsorganisaties die hier in Nederland mee bezig zijn? En welke factoren spelen een rol bij
het kiezen van een onderwerp? Dit is de ervaring van de geïnterviewde journalisten.
• Drie van de zeven geïnterviewden stellen dat ze door tijdgebrek niet toekomen aan
onderwerpen die ze wel zouden willen behandelen.
• Twee organisaties pakken in principe ieder onderwerp aan voor datajournalistiek.
• Onderwerpen als discriminatie, zorg en migratie komen veel voor in datajournalistiek.
De overheid geeft hier veel gegevens over vrij.
• Voor datajournalistiek op televisie gelden speciale eisen. Zo helpt het als een onderwerp
dramatisch is en als er beweging in zit.
• Een multimediale opzet kan een project meerwaarde bieden, maar het beperkt ook de
mogelijkheid om gaandeweg het project van onderwerp te veranderen.
• Ook bij het kiezen van onderwerpen wordt gefocust op onderwerpen die het publiek
persoonlijk raken. Onderwerpen die het publiek niet raken zijn moeilijk te slijten, ook al
zijn ze belangrijk.
5.2.1 Tijdgebrek
Een onderwerp kan om verschillende reden niet geschikt zijn voor een dataproject. Drie
journalisten gaven aan dat ze over het algemeen weinig tijd hebben en dat ze daardoor sowieso
maar weinig onderwerpen kunnen behandelen. Dimitri Tokmetzis vertelde dat hij wel van grote
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
49
projecten houdt, maar dat die ook wel veel tijd kosten. Hij was ten tijde van het interview
bijvoorbeeld met een aantal non-gouvernementele organisaties in gesprek om een hackathon te
organiseren over de Europese lobby, om die in kaart te brengen. ‘Maar dat kost gewoon veel
tijd.’
Arlen Poort heeft hetzelfde probleem. Naast zijn werk als eindredacteur voor de
binnenlandredactie heeft hij niet zoveel tijd om andere dingen te doen. Als hij dat wel zou
hebben, zou hij dingen met sport doen. Er worden volgens hem nergens zoveel rare statistieken
over verzameld als over sportwedstrijden. ‘Daar kun je natuurlijk hele mooie dingen mee
vergelijken.’
Ook Anke Vellenga doet haar datajournalistieke werk naast haar gewone werkzaamheden, in
haar geval als informatiespecialist. Ze komt aan veel dingen niet toe omdat ze er te weinig tijd
voor heeft. Ze heeft bijvoorbeeld niet altijd tijd om de vaardigheden onder de knie te krijgen die
voor het behandelen van een onderwerp nodig zijn.
5.2.2 Beschikbaarheid en aandacht
Onderwerpen als discriminatie, zorg en migratie komen van oudsher vaak aan bod in CAR en
datajournalistiek. Volgens Arlen Poort komt dit doordat overheidsgegevens vaak met deze
onderwerpen te maken hebben. Informatie over bijvoorbeeld bedrijven is vaak moeilijker te
verkrijgen. De oorzaak ligt volgens hem dus puur in het feit dat gegevens over deze onderwerpen
zo gemakkelijk beschikbaar zijn. Sargasso heeft ook veel aandacht besteed aan migratie, maar
volgens Dimitri Tokmetzis is dit om andere redenen het geval. ‘Enerzijds omdat er zoveel onzin
over wordt gezegd, anderzijds [is het] ook toeval want een van onze vrijwilligers zit daar heel
goed in. Dus die levert altijd hele goede data.’ Bovendien vond de redactie het ook een belangrijk
onderwerp. Maar sommige onderwerpen maken weinig kans, ook al vindt de redactie ze
belangrijk. Tokmetzis zou bijvoorbeeld graag bezig willen met de Europese Unie, een belangrijk
onderwerp. Maar daar trek je weinig lezers mee, weet hij. ‘Ik weet nu al dat ik dat verhaal
moeilijk kan slijten.’
5.2.3 Veel soorten onderwerpen
De website Nu probeert bij het verzamelen van haar data nu nog allerlei verschillende
onderwerpen. ‘We schieten nu nog heel erg met hagel, we proberen zoveel mogelijk
verschillende onderwerpen te raken.’ Na verloop van tijd zal de site zich proberen te beperken
tot een aantal aandachtsgebieden. Criteria voor die onderwerpen zijn onder meer: is er goede en
betrouwbare data over dit onderwerp te vinden? Kunnen we ons hiermee onderscheiden van
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
50
andere nieuwsmedia? Hebben we medewerkers die al veel van dit onderwerp weten? Ook
bezoekersaantallen spelen een rol.
Bij de NOS zijn in principe alle onderwerpen mogelijk. Iedere redactie kan iets aandragen. De
economieredactie is veel betrokken bij datajournalistiek, maar de binnenlandredactie ook. De
buitenlandredactie iets minder, maar Vellenga zou het zelf wel heel interessant vinden om
hiermee bezig te gaan.
5.2.4 Televisie stelt eisen aan datajournalistiek
Een opinieprogramma als Altijd Wat heeft, in tegenstelling tot een krant, niet de verplichting
om bijna het hele spectrum van het nieuws te behandelen. Je zou in theorie bepaalde
onderwerpen een jaar lang links kunnen laten liggen. Dit heeft een voordeel en een nadeel,
volgens Erik Bloem. Het voordeel is dat je meer je eigen keuzes kan maken. Het nadeel is dat je,
als jij je dan ergens in verdiept, beseft dat je veel hebt gemist en niet weet. Daarin moet je dan
opnieuw beginnen. “In die zin is een datajournalist dus generalist”, aldus Bloem, die overigens
benadrukt dat hij zichzelf niet echt als datajournalist ziet.
Jasper Koning erkent dat, omdat Nederland van Boven een televisieprogramma is, bewust
werd gezocht naar een beetje dramatiek in de verhalen. De makers zochten bijvoorbeeld naar
een onderwerp dat iets met gevaar te maken had. ‘Dan ga je over Nederland nadenken en denk
je: we moeten iets met water.’ Op televisie kun je prachtige beelden laten zien, maar het moet
niet te statisch worden. GPS-animaties werken volgens Koning het beste, omdat daar beweging
in zit. Daarom werd besloten dat in iedere aflevering van het programma minimaal één op GPS
gebaseerde animatie moest zitten. Dat werkte beter dan animaties over bijvoorbeeld de
ontwikkeling van gebieden. Zoiets leent zich volgens Koning minder goed voor een echt
vernieuwend, verrassend beeld. ‘Omdat je dan veel sneller in een soort aardrijkskundigeachtige
uitleg terecht komt.’ Als je bijvoorbeeld aantoont dat er in het Noorden veel grasland is, is dat
een kwestie van land groen kleuren. Dan gebeurt er in beeld dus niet zoveel.
5.2.5 Multimediaal project is dwingend
Nederland van Boven was een multimediaal project. Op de cover van de VPRO-gids kon je met
de Layar-app op je mobiel een speciale datalaag ontdekken en er was ook een uitgebreide
website. Doordat die site aan het programma was gekoppeld, waren de onderwerpen
dwingender. De makers hebben tijdens de totstandkoming van het programma nog veel
veranderd. Op een gegeven moment was er zelfs sprake van om de boel om te gooien, vertelde
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
51
Koning. ‘Toen heb ik gezegd: “Dat kan niet, want we zijn al zover met de website, met grote
datasets te verzamelen, dat kunnen we niet opeens veranderen.”’
5.2.6 Persoonlijk
De voorkeur voor producties die het publiek persoonlijk aanspreken, die ook bij de
doelstellingen aan bod kwam, is ook terug te zien in de onderwerpskeuze. Ook in de keuze van
onderwerpen richten veel van de geïnterviewden zich op persoonlijk aansprekende verhalen. Zo
vertelde Dimitri Tokmetzis dat hij voor de korte dagelijkse verhalen die hij voor het ANP schrijft
onderwerpen probeert te zoeken die mensen raken of veel mensen aangaan, zodat het voor een
hoop mensen interessant is. Als voorbeeld noemt hij de veiligheid van het treinverkeer. Ook wie
zelf niet geregeld met de trein reist, kent waarschijnlijk wel iemand die dat wel doet. Erik Bloem
stelt dat hij voor de onderwerpen van Altijd Wat een soortgelijk criterium heeft. ‘Verhalen
moeten het dagelijks leven van mensen raken.’ Hij noemt als voorbeeld de zorg, een onderwerp
dat heel dicht bij mensen staat omdat veel mensen daarmee te maken hebben. Een tweede
criterium dat hij handhaaft, is dat je tegels moet lichten, een inzicht bieden wat er anders niet
was geweest. ‘Een inzicht moet het ‘ohja’-niveau wel ontstijgen.’
5.3 Samenwerken met andere partijen
Datajournalisten vertelden bij het bespreken van hun doelstelling al, dat het visualiseren van
bestaande data makkelijker is dan zelf data verzamelen. En onder het kopje onderwerpen kon u
lezen dat datajournalisten weinig tijd hebben. Maar hoe kom je dan aan nieuwe data? Een van
de manieren is om samen te werken met andere partijen, zoals bedrijven, wetenschappers of je
publiek. Hoe werkt dit en hoe kun je dit het beste aanpakken?
Dit is de ervaring van de geïnterviewde journalisten.
• Vraag niet alleen wat de andere partij voor jou kan betekenen, maar ook wat jij voor hem
kan doen. Dit is niet alleen beleefd en wel zo eerlijk, maar het kweekt ook goodwill.
• Crowdsourcing is in de Nederlandse datajournalistiek tot nu toe geen succes.
Journalisten betwijfelen of het publiek wel mee wil werken en of de verkregen data
betrouwbaar is. Projecten waarbij crowdsourcing werd geprobeerd verliepen
problematisch of mislukten.
• De samenwerking met bedrijven verloopt over het algemeen soepeler. Bedrijven zijn
vaak bereid om mee te helpen, al stellen ze soms wel voorwaarden voor het gebruik van
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
52
hun data. Datajournalisten zijn hiertoe bereid, maar maken geen reclame voor de
bedrijven.
• Het grootste obstakel bij het gebruik van data van derden vond Jasper Koning
(Nederland van Boven) dat het slechts tot op zekere hoogte te controleren was of de
verstrekte data wel waarheidsgetrouw waren.
• Een ander obstakel was het Commissariaat van de Media, dat data zag als iets van
waarde. En de VPRO mag als publieke omroep geen dingen van waarde aannemen. Dit
bezorgde Koning veel kopzorgen, maar de zaak is uiteindelijk uitgepraat.
5.3.1 Voor wat hoort wat
Sargasso werkt als groepsblog veel samen met vrijwilligers, maar ook met andere organisaties.
Dimitri Tokmetzis ziet samenwerken als een goede manier om kosten te besparen. ‘Ik vind
onderzoeksjournalistiek heel belangrijk en ik wil dat dit blijft bestaan en ik vind dat online
media daar ook een rol in moeten hebben. Dat is ook een reden dat we samenwerken met andere
media, om het gewoon betaalbaar te houden voor iedereen.’ Hij deelt vaak de kosten met
samenwerkende partijen. Op die manier heeft het blog leuke content online, kunnen lezers er
gratis van profiteren en kan de redactie onderwerpen agenderen die zij belangrijk vindt.
Tokmetzis wijst erop dat het belangrijk is om de meewerkende partij ook te helpen. Hij vertelt
bijvoorbeeld dat hij altijd op zoek is naar NGO’s die veel bezig zijn met een bepaald onderwerp.
Sargasso wil dan wel helpen, als het blog ook nieuwswaardige data krijgt. Andere
nieuwsorganisaties doen dat ook wel, geeft Tokmetzis toe. ‘Het verschil is dat wij ook echt
meehelpen.’ Volgens Tokmetzis hebben onderzoekers vaak prachtige data waar je journalistiek
echt wat leuks mee kan doen, maar zijn veel onderzoekers teleurgesteld door journalisten. ‘Dan
hebben ze twee dagen lang die data lopen crunchen en daar een mooi stukje over geschreven en
dat wordt dan helemaal ingekort naar een klein stukje achterin de krant.’ Sommige
onderzoekers zouden volgens Tokmetzis daarom niet meer met een van de grote kranten samen
willen werken. Sargasso helpt onderzoekers juist mee, stelt Tokmetzis. Bijvoorbeeld met een
hackathon. Sargasso krijgt hierme veel data, maar vraagt ook aan de onderzoekers of zij nog
dingen nodig hebben of de hackathon zo kunnen uitvoeren data de data bruikbaar wordt voor
wetenschappelijk onderzoek. ‘Je merkt dat dit heel veel goodwill kweekt. Maar die mensen zijn
ook voor ons aan het werk dus ik vind dat er best iets tegenover mag staan.’
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
53
5.3.2 Crowdsourcing
Het publiek kan voor een datajournalist een bron van wijsheid vormen en kan hem een helpende
hand bieden. Crowdsourcing, zoals het inschakelen van je publiek wordt genoemd, werd
populair onder journalisten toen The Guardian het publiek liet grasduinen door declaraties van
politici. Een bezoeker kon simpelweg kiezen of een bonnetje de moeite waard was om te
onderzoeken of niet. Zo scheidde het publiek het kaf van het koren en konden journalisten zich
focussen op de bonnetjes die interessant leken. Ondanks dit succesverhaal is crowdsourcing
onder Nederlandse datajournalisten nog niet populair.
Arlen Poort van NRC Handelsblad heeft nooit overwogen om lezers in te zetten. Het zou
volgens hem wel mooi zijn als mensen dat willen, maar hij denkt niet dat mensen zin hebben om
daar al te veel tijd aan te besteden. ‘Ik heb niet eens zin om te helpen als ik op een website kom
en er komt zo’n pop-upje: ‘Mogen we u twee minuten vragen stellen?’’ Zijn collega Laura
Wismans stelt daarnaast dat data van derden vaak ook heel onbetrouwbaar is. Jerry Vermanen
van Nu stelt ook dat het heel moeilijk is om bijvoorbeeld een goede enquête te maken waar je
ook controleert of alle informatie die je verzamelt representatief is en of het allemaal klopt. Bij
Nu denken ze er wel over na of we een enquete in kunnen zetten, maar willen ze zich ook niet
verplichten om gebruik te maken van dit middel, simpelweg omdat het kan. Bij Nederland van
Boven is ook nog gekeken of er iets gedaan kon worden met publieksinteractie. De makers
hebben nog overwogen om te vragen om foto’s inclusief GPS-informatie van hijskranen te
maken. Zo hadden ze een hijskranenkaart kunnen maken en kom je iets te weten over
bouwputten. Een ander idee was om met GPS-foto’s alle openbare beveiligingscamera’s in
Nederland in kaart te brengen. De reden dat deze projecten niet zijn doorgegaan, is dat de
makers te weinig inzendingen verwachtten. ‘We waren nog niet begonnen, niemand kende ons
nog. Dan krijg je misschien twintig meldingen binnen. Dat schiet niet op, daar hebben we niets
aan.’
5.3.3 Pogingen tot crowdsourcing
Altijd Wat heeft in samenwerking met Sargasso wel daadwerkelijk geprobeerd om hun publiek
in te zetten. Ook hier was het de bedoeling om bouwprojecten in kaart te brengen. Ook was men
benieuwd hoeveel bouwprojecten vertraging opliepen. Gaat het juist bij overheidsprojecten mis
of ook bij particulieren? Aangezien er veel te weinig mensen reageerden, mislukte het project.
Erik Bloem betwijfelt achteraf gezien of het publiek van Altijd Wat het publiek is dat je moet
bevragen over dit soort onderwerpen. ‘Omdat wij een wat ouder kijkerspubliek hebben. Dus dat
zal een van de redenen zijn geweest.’ De NCRV-journalisten speelden nog wel met de gedachte
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
54
om bouwprojecten op een andere manier in kaart te brengen, bijvoorbeeld via lokale media.
Maar dat is er tot op heden niet van gekomen.
Ook een ander project waarin Sargasso lezers inzette verliep niet zonder problemen. In dit
project stonden WOB-verzoeken centraal. WOB-verzoeken doen een beroep op de Wet
Openbaarheid Bestuur (WOB) die overheidsorganen verplicht om uit eigen beweging informatie
over de uitvoering van haar taken te verstrekken, maar ook om op verzoek van burgers bepaalde
informatie te verstrekken, tenzij bepaald is dat die informatie niet voor publicatie geschikt is.
Overheidsinformatie is op te vragen door middel van een WOB-verzoek en het indienen van zo’n
verzoek wordt ook wel wobben genoemd. Bij het project van Sargasso werden twintig
bereidwillige lezers ingezet om WOB-verzoeken in te dienen om een overzicht te krijgen van
zoveel mogelijk beveiligingscamera’s in de openbare ruimte. De WOB-verzoeken waren
voorgeschreven en de participerende lezers hoefden de verzoeken eigenlijk alleen maar op te
sturen om ze vervolgens terug te sturen naar Sargasso. Toch ging dit ook niet altijd goed. Lezers
lieten bijvoorbeeld termijnen verlopen en wilden soms de resultaten niet terug sturen naar
Sargasso. Uiteindelijk moest Tokmetzis zelf dreigen met het inzetten van een advocaat om alle
stukken terug te krijgen.
5.3.4 Bedrijven
Sargasso heeft betere ervaringen met het samenwerken met bedrijven. Hier hebben de makers
van Nederland van Boven ook veel ervaring mee. Zelfs bedrijven waarvan je het niet zouden
verwachten waren bereid om mee te werken. Zoals Brinks, van het waardetransport. Maar
ondanks dat dit bedrijf graag mee wilde werken aan een item over de routes van hun
dienstauto’s liep dit op niets uit. Het bedrijf wist simpelweg niet hoe ze hun data uit hun
programma konden krijgen. Ze hadden een tool die ze in hun internetbrowser gebruikten en
konden wel een bitmap geven, maar verder niets. Waar die data precies te halen was, viel niet te
traceren. ‘Dus ze wilden wel, maar het lukte technisch niet’, vertelt Jasper Koning.
De redactie heeft met verschillende partijen onderhandeld over het vrijgeven van data. Soms
met succes, andere keren zonder resultaat. Tomtom wilde hun data bijvoorbeeld niet delen.
‘Tien jaar oude data zijn nog steeds een paar ton waard en we gaan dat niet aan jullie geven’, zei
de fabrikant van navigatiesystemen. Telecomgigant Vodafone wilde hun gegevens wel delen,
maar wel onder strikte voorwaarde dat de data na gebruik vernietigd zou worden, dat de
redactie het niet zou delen en dat het alleen voor de doeleinden van het televisieprogramma
gebruikt zouden worden.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
55
De vraag die zich opdringt, is in hoeverre je moet toegeven aan eisen of verzoeken van
meewerkende partijen. Koning vertelt dat hij wel onderhandelde met de meewerkende partijen,
maar dat is volgens hem niet anders dan normaal journalistiek werk. Dan zou je kunnen zeggen:
‘Maak je je niet te afhankelijk van zo’n bedrijf?’ Nou, ik denk van niet. Wij hadden onze
verhaallijn en wisten naar welke data we op zoek waren. Dat is het vertrekpunt geweest van
waaruit we naar instanties zijn gegaan.’ Dit vindt ook Dimitri Tokmetzis. Hij merkt dat
bedrijven soms graag meewerken, maar wel graag hun naam vermeld zien staan. Dat vinden ze
bij Sargasso geen probleem. ‘Dat is logisch, dat je de bron aangeeft. Als je ze alleen hoeft te
noemen vind ik dat geen punt.’ Het volgens Dimitri niet meer dan normaal dat je de bron
noemt, maar hij gaat geen reclame voor meewerkende bedrijven maken. ‘Dat is gewoon een
normaal journalistiek proces.’
5.3.5 Obstakels bij samenwerking met bedrijven
Maar ook als je geen haarbreed toegeeft aan de partijen van wie je data verkrijgt, ben je nog niet
gevrijwaard van de mogelijkheid dat er gebruik van je wordt gemaakt. Dit vond Koning achteraf
gezien de grootste uitdaging. ‘Je moet wel geloven dat de data die zij jou leveren werkelijke data
zijn. Daar houdt het wel ergens op.’ Koning probeerde wel te checken of de datasets die hij kreeg
klopten. ‘Om Vodafone als voorbeeld aan te houden. Dan heb je een dataset en daar staan op een
gegeven moment getallen in. En die getallen zeggen: “Het was dan en dan, daar en daar heel erg
actief.” Ik heb natuurlijk geen mogelijkheid om dit te checken. We hebben wel een redacteur
aangenomen met expertise van geografische data, dus die kon in zoverre controleren: is dit een
valide dataset, ziet dit er goed uit? Maar zeker weten doe je het nooit.’
Uiteindelijk was het verkrijgen van data niet zozeer moeilijk omdat bedrijven niet mee wilden
werken, maar omdat het Commissariaat van de Media dwars ging ligggen. De VPRO mag als
publieke omroep geen dingen van waarde aannemen. Koning: ‘Het Commissariaat van de Media
dacht gaandeweg het proces: ‘Ja, maar die dataset die jullie hebben vertegenwoordigt een
waarde’. De makers waren het principieel met het commissariaat oneens. Als je een directeur
van een bedrijf een lezing laat geven, kost dat geld, maar een interview is gratis. Zo kost een
dataset normaal gesproken ook geld, maar als je die raadpleegt, is dat ook een soort interview,
was hun redenatie. Voor de zekerheid heeft de redactie wel overeenkomsten moeten sluiten met
meewerkende partijen, waarbij die in ieder geval afstand deden van de data. ‘Dat was nog wel
een heel juridisch traject erbij. Dus we hebben niet hoeven wobben, maar daarin hebben we nog
wel een heleboel papierwerk te verstouwen gehad, wat nog even een projectje binnen het project
werd.’ Maar wat betekent dit voor datajournalistiek bij de publieke omroep? Volgens Koning gaf
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
56
het commissariaat uiteindelijk wel toe, maar gezien de tijdsdruk konden ze geen uitzondering
maken en schaarden ze zich aan de conservatieve kant. ‘Maar de VPRO heeft de eerste horde
genomen.’
5.4 Organisatie
Hoe ervaren Nederlandse datajournalisten de organisatie waarbinnen zij opereren? Begrijpen
hun collega’s de datajournalistieke projecten? Trekken leidinggevenden er geld voor uit?
Dit is de ervaring van de geïnterviewde journalisten.
• Bij twee nieuwsorganisaties worden datajournalistieke projecten bemoeilijkt omdat
er door de leidinggevenden weinig tot geen geld voor vrij wordt gemaakt.
• Bij drie van de onderzochte organisaties stappen collega’s van de datajournalisten
wel eens op hun af met een dataset. Bij drie organisaties gebeurt dit bijna nooit.101
• Bij Nu is de geringe kolombreedte van de site een beperkende factor voor
visualisaties.
• De NOS is een grote organisatie. Dit heeft als voordeel dat er veel specialisten zijn,
maar als nadeel dat de communicatie soms moeizaam verloopt en dat beslissing
langzaam worden genomen.
5.4.1 Invloed van hoofdredactie
Bij de NOS is internet first geworden, maar bij het NRC Handelsblad is men hier van
teruggekomen. Tot ruim twee jaar geleden was de strategie nog om alles op het web te doen,
maar dat is inmiddels veranderd. De site is nu voor snel nieuws en heeft een eigen redactie. Deze
webredactie mag eigenlijk niet meer bezig met arbeidsintensieve achtergrondstukken, zoals de
stembureau-uitslag op lokaal niveau. Daar is ook geen geld voor. ‘De krant is gewoon het
grootste verdienmodel’, licht Laura Wismans toe. Arlen Poort begrijpt de nieuwe strategie, maar
legt zich er niet bij neer. ‘Ik had mij net aangeleerd in de jaren daarvoor hoe ik die geografische
visualisaties moet doen, tja, dan ga ik het ook gewoon doen.’ Het is niet zo dat datajournalistiek
zijn hobbyprojectje is, waar hij tegen de zin van de hoofdredacteur mee bezig is. ‘Die ziet
natuurlijk ook wel dat dit iets innovatiefs geeft aan NRC Handelsblad. Van: “Hier werken
mensen die wat kunnen”. Of zoiets.’
101 Bij Sargasso zijn maar twee vaste redacteuren en is van collega’s niet echt sprake. Wel helpen vrijwilligers geregeld met datajournalistiek.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
57
Ook bij de NOS is er geen geld voor datajournalistiek. Anke Vellenga heeft weleens met de
hoofdredacteur gepraat. ‘Dan wordt gezegd: ‘Maar wat ga je dan doen? Wat voor nieuws ga je
dan brengen?’ Ja, dat weet ik nu nog niet.’ De informatiespecialist denkt dat datajournalistiek
niet zo hoog op het prioriteitenlijstje van haar leidinggevenden staat. ‘En ik heb ook het idee dat
ze het ook niet helemaal honderd procent begrijpen.’ Ze begrijpt overigens wel dat een
leidinggevende niet zomaar geld uitgeeft aan een nieuwe technologie. Daarom doet ze het
voorlopig in haar eigen tijd, net als Simon Rogers die bij The Guardian zonder budget begon en
zijn chefs overtuigde met de resultaten die hij boekte. Maar het boeken van resultaten gaat
moeilijk als je bijna geen middelen hebt, merkt Anke. ‘Ik ga nu gewoon proberen aan te tonen
wat we allemaal kunnen, maar dat is lastig als je er niet fulltime mee bezig kan.’ In februari
2013, een paar maanden na het interview, laat Vellenga weten dat de situatie enigszins
veranderd is. De hoofdredactie lijkt inmiddels de meerwaarde van datajournalistiek in te zien en
denkt er nu serieus over na.
André Tak van RTL Nieuws heeft niet ervaren dat de hoofdredactie moeilijk te overtuigen was
van het belang van datajournalistiek. Hij benadrukt het voordeel dat je op internet veel uit
datajournalistiek kan halen en zodoende meer bezoekers op je site kunt krijgen. Maar hij
begrijpt wel waardoor van hogerhand enigszins argwanend naar datajournalistiek gekeken kan
worden. ‘Kijk, als je constant maar je datajournalistieke methodes loopt te benadrukken, maar
daar komt niets uit… Dan kan ik me wel voorstellen dat mensen argwanend worden.’ Volgens
Tak moet je niet teveel nadruk leggen op de datajournalistieke methode. Het doel is immers niet
datajournalistiek, maar nieuws brengen. En dat daar nu net even andere methodes voor worden
gehanteerd is volgens hem helemaal niet zo belangrijk. Ook dit doet overigens denken aan
Simon Rogers, die na een optreden in Amsterdam stelde dat datajournalistiek over een paar jaar
gewoon één van de vele gereedschappen uit de journalistieke toolbox zal vormen.102
5.4.2 Geen hulp van collega’s
Niet alle leidinggevenden zijn dus even makkelijk te overtuigen van het belang van
datajournalistiek. Hoe zit dit met collega’s die dichterbij de datajournalisten staan? Laura
Wismans hoopt dat de bewustwording op de NRC-burelen groter wordt. ‘Mensen komen
natuurlijk best wel databestanden tegen, maar daar doen ze nooit wat mee.’ Ze hoopt dat
collega’s in gaan zien dat data waardevol kan zijn en het naar haar of Arlen doorsturen. ‘Maar
die stroom is nog niet echt op gang gekomen.’ Arlen heeft nog zijn best gedaan door een soort
102 Jerry Vermanen, ‘“Data journalism will be ‘just’ journalism”’ De Nieuwe Reporter (13-02-2012) http://www.denieuwereporter.nl/2012/02/data-journalism-will-be-just-journalism/.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
58
masterclass datajournalistiek te geven aan zo’n vijftien mensen van de binnenlandredactie. ‘Ik
heb ze ook heel veel voorbeelden laten zien van bestanden die je als journalist tegen kunt
komen, waar nieuws in zit, maar wat niemand in de gaten heeft, omdat ze niet weten wat ze
ermee moeten. Ik heb echt geprobeerd om dat helemaal zo te doen zodat mensen daarna
dachten: ‘Goh, er is een rapport verschenen, maar misschien zit daar nog wel iets veel
interessanters achter’. Maar het komt niet echt.’
Wat niet meehelpt, is dat medewerkers van nrc.next, NRC.nl en NRC Handelsblad veel meer
gescheiden van elkaar werken dan een paar jaar eerder. Poort legt uit dat de eigenaren van de
organisaties zo beter kunnen zien of de afzonderlijke afdelingen rendabel zijn. ‘Zo werkt dat bij
alle bedrijven hoor, daar is niets raars aan en ik vind dat alleen maar goed. Je moet weten of dat
wat je doet geld oplevert. Maar het nadeel is dus dat je niet meer van elkaars expertise kunt
profiteren. Veel minder makkelijk.’ Aan de andere kant werken er ook weer een paar goede
programmeurs bij het concern waar hij zonodig hulp van kan vragen.
Bij Nederland van Boven verzorgden Jasper Koning en Frederik Ruys samen het leeuwendeel
van de datajournalistiek. Ook bij RTL Nieuws gebeurt het niet zo vaak dat collega’s naar de
onderzoeksredactie komen met data die ze hebben gevonden. André Tak begrijpt dit wel. Het
komt volgens hem doordat de rest van de redactie heel erg bezig is met het nieuws van de dag.
‘Het is geen onwil, maar mensen letten daar niet op, omdat ze bezig zijn met het verslag doen
van dagelijks nieuws.’ Dan kom je niet heel erg gauw in aanraking met data, stelt hij. Overigens
is de rest van de redactie volgens hem wel positief over datajournalistiek. ‘Het levert een
nieuwsonderwerp op en extra clicks voor de website, dus iedereen is er wel enthousiast over.’
5.4.3 Wel hulp van collega’s
Erik Bloem maakt wel vaak mee zijn collega’s van Altijd Wat op hem af stappen. ‘Kunnen we
hier iets mee? En weet jij of hier ook data over te vinden zijn?’, vragen ze dan. Anderzijds ervaart
hij zijn functie wel een beetje als een eilandje. ‘Ik zwem een beetje tussen de verslaggevers en de
redacteurs.’
Ook de collega’s van Jerry Vermanen bij Nu dragen redelijk vaak onderwerpen aan. Hij werkt
vooral veel samen met de redacteur die schrijft over technologie en de redactrice die zich
bezighoudt met economische onderwerpen. Maar op de dag van het interview heeft hij net een
artikel gepubliceerd waarvoor hij heeft samengewerkt met de politiek verslaggever in Den Haag.
En WOB-verzoeken maakt hij weer samen met Brenno ‘Big Wobber’ de Winter.
Anke Vellenga mag dan enige moeite hebben om haar leidinggevenden bij de NOS te
overtuigen van het belang van datajournalistiek, maar ze krijgt van collega’s op de vloer wel veel
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
59
positieve reacties op de datajournalistieke projecten. Zij zien volgens haar ook echt het nut in
van datajournalistiek. Af en toe vraagt ze of collega’s nog een leuk verhaal hebben. Ze denkt niet
dat iedere collega het journalistiek aspect van data zou beseffen als hij of zij zelf op een databron
zou stuiten. Maar meestal komen ze wel even naar haar toe als dat gebeurt. ‘Ik heb iets met eh…
cijfers.’
5.4.4 Omvang NOS voor- en nadeel
Vellenga leidt bij de NOS een werkgroep datajournalistiek die bestaat uit ongeveer vijftien
medewerkers van allerlei verschillende afdelingen, waaronder binnenland, buitenland,
economie, NOS op 3, de internetredactie, nieuwe media en documentalisten. Het bij elkaar
krijgen van al die mensen was lastig, omdat de NOS zo’n grote organisatie is. Maar een grote
organisatie heeft ook als voordeel dat er veel specialisten rondlopen. Vellenga: ‘De
samenwerking tussen verschillende disciplines vind ik echt een voordeel. Dus dat je dan vanuit
de redacteur inhoudelijk input krijgt. Wij hebben weer meer verstand van datasets en hoe je
datasets kan vinden.’
Een grote organisatie vereist wel duidelijke communicatie. Zo verliep de totstandkoming van
een van de projecten waar Vellenga uiteindelijk aardig trots op was – een treemap103 van de
rijksbegroting op Prinsjesdag – enigszins moeizaam. De afdeling Economie had ook bedacht dat
ze een visualisatie wilde die de begroting weergeeft en was naar NOS op 3 gegaan. Daar was een
stagiaire vervolgens een dag bezig geweest om daar een visualisatie van te maken. Dus eigenlijk
werd er op twee plekken binnen dezelfde organisatie dezelfde visualisatie gemaakt. ‘Dat was een
beetje dubbel.’ Ook kan er binnen de NOS niet snel besloten worden om bijvoorbeeld één
persoon vrij te maken voor datajournalistiek. ‘Het duurt een eeuwigheid voordat er een keer een
beslissing wordt genomen. Want er moet overlegd worden en het moet allemaal strategisch en
op beleidsniveau uitgewerkt worden.’
5.4.5 Vormgeving
Jerry Vermanen heeft bij Nu nooit financiële beperkingen gehad. Het scheelt hierbij wel erg dat
de meeste tools gratis zijn, geeft hij toe. Hij heeft wel een andere beperking, waar de andere
organisaties minder last van hebben: de kolombreedte van Nu. Vergeleken met andere websites
is die best wel smal, dus moet hij daar rekening mee houden als hij visualisaties maakt. Voor
sommige visualisaties maakt hij een aparte pagina, bijvoorbeeld met het Europees
103 Een rechthoek bestaande uit kleine vierkanten die in grote corresponderen met
bijvoorbeeld het budget van de ministeries die zij representeren.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
60
Kampioenschap voetbal. Er was toen geen andere manier waarop de visualisatie kon worden
weergegeven. Een pop-up is weer lastig in verband met advertenties en doorklikken. ‘Dat is
gewoon een beperking en daar moet je rekening mee houden.’
5.4.6 Vrijwilligersorganisatie
Sargasso is binnen de onderzochte groep een vreemde eet in de bijt. Het groepsblog is in
principe een vrijwilligersorganisatie. Bovenaan staat de stichting, daaronder een kleine redactie
en daaronder weer een flink reservoir aan vrijwilligers. Tokmetzis: ‘Ik ben de baas van de site en
moet aan het bestuur verantwoording afleggen.’ Het is volgens hem wel een lastig moment als in
een vrijwilligersorganisatie opeens geld een rol speelt en professionele krachten komen die
professionele eisen gaan stellen. Sargasso kreeg geld van het Stimuleringsfonds voor de Pers en
werkt steeds meer voor professionele bedrijven. ‘We zijn nu bezig met het ANP en Nieuwsuur.
Dan loop je wel tegen de reputatie van een blog aan en gaan klanten op een blog kijken.’
Tokmetzis is eerlijk: wat op zijn site staat is niet altijd even goed. ‘Het blijft schipperen: tot
hoever ben je een professionele organisatie en tot hoever ben je een vrijwilligersorganisatie.’
5.5 Medewerkers
Voor dit onderzoek zijn tussen juni en november 2012 zeven journalisten geïnterviewd die zich
intensief bezighouden met datajournalistiek. De een is dagelijks bezig met datajournalistiek, de
ander publiceert misschien maar een paar keer per jaar een datajournalistieke publicatie. Wat ze
gemeen hebben, is dat ze de journalistieke waarde van data zien. Hoe ze hier verder mee
omgaan verschilt per persoon en nieuwsorganisatie. De journalisten zullen allereerst aan u
voorgesteld worden. Vervolgens wordt geanalyseerd wat hun achtergrond is en wie volgens hen
geschikt is voor datajournalistiek. Moet je daarvoor bijvoorbeeld kunnen programmeren? En
wat is belangrijker: technisch of journalistiek inzicht?
• Een goede datajournalist moet allereerst een goede journalist zijn, stellen twee van
de meewerkende journalisten.
• Datajournalistiek kun je het beste in een team bedrijven, is de overtuiging van vier
geïnterviewden.
• Technische kennis is niet noodzakelijk voor wie begint met datajournalistiek.
Gewoon beginnen werkt het beste, merkten drie van de geïnterviewde journalisten.
Het helpt wel als je gevoel hebt voor feiten checken, getallen, internet, techniek en
internetapplicaties.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
61
• Aangezien maar weinig mensen op al die vlakken expert zijn, komt datajournalistiek
het best tot stand in een team van verschillende experts die elkaar aanvullen, stellen
drie geïnterviewden.
• Een van de geïnterviewden kan al behoorlijk programmeren en vier journalisten
zouden graag meer programmerkennis in huis halen of verwerven. Een van de
geïnterviewden heeft nog geen behoefte aan een programmeur.
5.5.1 Niet echt datajournalist
Niet iedereen die zich bezighoudt met datajournalistiek noemt zich ook een datajournalist. Anke
Vellenga stelt wel dat zij bij de NOS degene is die het dichtst bij deze functie in de buurt komt,
maar dat de NOS ‘niet echt’ een datajournalist in dienst heeft: ‘Er is niemand die dat fulltime
doet.’ En Erik Bloem omschrijft zich op LinkedIn wel als datajournalist, maar ziet zichzelf
eigenlijk niet zo. Hij noemt zich zo sinds hij op de vacature voor datajournalist bij Altijd Wat
heeft gereageerd: ‘Vervolgens heb ik binnen die vacature wel aangegeven dat ik niet alleen maar
een datajournalist ben, maar liever als een algemeen onderzoeksjournalist beschouwd wil
worden.’ Het verschilt per project hoeveel hij met datajournalistiek bezig is. Zijn eerste maanden
bij Altijd Wat was hij fulltime bezig met data-analyses. ‘Maar dat leverde naar mijn zin niet iets
op waar we echt mee de bühne op konden, waar je echt iets mee ontdekt.’ Maar als een project
geen datajournalistiek vereist, kan hij ook op een andere manier research doen en veel minder
op data gericht zijn. ‘Ik doe absoluut niet alleen datadingen.’ Jasper Koning geeft al voor het
interview begonnen is een waarschuwing: ‘Wij hebben niet aan datajournalistiek gedaan, wij
hebben echt datavisualisatie gedaan.’
5.5.2 Vereiste talenten
Wat zijn belangrijke eigenschappen voor een datajournalist? Tokmetzis stel dat een
journalistieke achtergrond belangrijk is. Als je een paar jaar in de journalistiek werkt, ontwikkel
je volgens Tokmetzis een gut feeling voor wat nieuws is en wat niet. ‘De verhalen die je maakt,
daar is datajournalistiek gewoon stap één in. Wel een hele moeilijke stap, maar wat we daarna
doen is altijd gewoon is nabellen, in context plaatsen, het normale journalistieke werk om er een
verhaal van te maken. Dus je bent uiteindelijk toch bezig om een verhaal te vertellen.’
André Tak is het met hem eens. ‘Het belangrijkste is dat [een datajournalist] gewoon een goede
journalist is. Dat is echt het allerbelangrijkste. En je moet ook wat feeling hebben met
getalletjes, dat ook. En je moet ook iets meer feeling dan gemiddeld hebben voor hoe je dat
allemaal op internet zet. Maar als je geen goede journalist bent, dan val je heel snel door de
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
62
mand. Dan weet je bij God niet waar je informatie moet zoeken en dan weet je ook geen goede
vragen te stellen. Dus dat is gewoon het allerbelangrijkste.’ Alle geïnterviewden hebben ook een
journalistieke opleiding afgerond en/of bij een journalistieke organisatie gewerkt voordat ze met
datajournalistiek aan de slag gingen.
En technisch inzicht, is dat belangrijk? Arlen Poort kan behoorlijk aardig programmeren. Hij
deed dat al een beetje op zijn vijftiende en leerde door de jaren heen verschillende
programmeertalen, onder meer via NICAR. Vergeleken met de andere datajournalisten is hij
technisch het meest onderlegd. Dimitri Tokmetzis en Laura Wismans waren daarentegen niet
enorm technisch, toen ze bij Sargasso begonnen met datajournalistiek. ‘We hebben het echt een
beetje strompelend moeten leren’, vertelt Tokmetzis.
Volgens Erik Bloem heb je niet hele bijzondere talenten nodig om met datajournalistiek aan de
slag te gaan. Je moet volgens hem gewoon beginnen. Maar, zegt hij, ‘je moet wel dat feitelijke
hebben’. En gevoel voor cijfers is ook niet weg, zegt André Tak: ‘Je moet ook wat feeling hebben
met getalletjes’.
5.5.3 Ideale team
Het mooiste is als iemand én journalistieke kennis én technische kennis én grafische kennis
heeft. Maar die combinatie is moeilijk te vinden in één persoon, denkt Anke Vellenga. Zij denkt
daarom dat samenwerking uiteindelijk de beste oplossing is.
Op de onderzoeksredactie van RTL Nieuws wordt datajournalistiek verricht door een team
waarvan de leden elkaar aanvullen. Iedereen kan wel overweg met Excel, maar één persoon is
daar uitzonderlijk goed in, terwijl anderen goed zijn in het bedenken van ideeën en het opvragen
van informatie. En er is ook nog iemand die er goed in is om dat allemaal op internet te krijgen,
vertelt Tak. ‘Dus er is niet één persoon die alles kan. We hebben dat een beetje verdeeld en
iedereen heeft zijn eigen taak.’
Ook Dimitri Tokmetzis denkt dat datajournalistiek het best kan worden aangepakt door een
team. Als je datajournalistiek goed wilt aanpakken op een grote redactie, heb je volgens hem
twee mensen nodig: een journalist die techniek begrijpt en daarnaast ‘een keiharde
programmeur’, die bijvoorbeeld kan scrapen en webvisualisaties kan bouwen. Hij vond het dan
ook geen slimme zet van Altijd Wat om een datajournalist te zoeken. ‘Ik zag die vacature en toen
heb ik ook gezegd: ‘Jullie zoeken de verkeerde persoon. Jullie moeten een programmeur hebben
en niet een journalist, die hebben jullie zelf wel.’ Er lopen daar genoeg journalisten rond. Maar
ja, ze hebben niet geluisterd.’ Het ideale team van Jasper Koning ziet er ongeveer hetzelfde uit,
maar de televisiemaker ziet hier ook graag een vormgever bij.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
63
‘Je hebt een journalistiek iemand nodig om een verhaal in die data te kunnen zien. Of dat
nu een vernieuwend verhaal is of puur visualiserend, maar iemand moet naar dat verhaal
kijken. Je hebt een grafisch iemand nodig die echt naar de vormgeving kijkt: hoe ziet dit
eruit, hoe representeren we die data? En je hebt een technisch iemand nodig die de data
kan bewerken, die erin kan rekenen, die er iets mee kan doen. Dus die drie kwaliteiten
heb je altijd nodig. Dat is in een tv-redactie bijvoorbeeld niet altijd bij elkaar en in een
digitaalafdeling ook niet altijd bij elkaar. Soms moesten we die techniek ook echt bij een
gespecialiseerd bedrijf halen om bijvoorbeeld echt die treinen [in de visualisatie] over die
spoorrails te krijgen, om die vliegbewegingen goed te krijgen.’
5.5.4 Programmeerkennis
Hoe zit het met de programmeertalenten van de geïnterviewde journalisten? Uit de gesprekken
blijkt dat sowieso twee van hen graag beter willen kunnen programmeren. Laura Wismans zegt
bijvoorbeeld dat ze hier vaak tegenaan loopt. Jerry Vermanen kan naar eigen zeggen een beetje
programmeren. ‘Een beetje copy-past-programmeren’ noemt hij het zelf. ‘Beetje
Frankensteincode maken. En dan werkt het soms en meestal niet en dan schakel ik weer hulp
in.’ Vaak zoekt en vindt hij hulp op internet. Hij zou nog wel beter willen kunnen
programmeren, maar weet anderzijds ook weer niet of hij dat ontzettend graag moet willen. ‘Op
een gegeven moment houdt het gewoon ergens op, dat ik er zoveel tijd in moet steken dat het
niet meer efficiënt is om het door mij te laten doen. Dat het gewoon makkelijker is om hier
iemand van techniek in te huren of iemand van buitenaf aan die klus te laten werken, die het
dan in een halve dag of een ochtend heeft geregeld.’
Anke Vellenga zou graag iemand in de buurt hebben die goed kan programmeren. ‘We hebben
wel programmeurs bij Nieuwe Media natuurlijk, maar die werken meer op lange
termijnprojecten. Die kunnen niet even snel ingezet worden voor een visualisatie die morgen af
moet.’ Ook Dimitri Tokmetzis zou wel een programmeur willen bij Sargasso. Hij wil
bijvoorbeeld veel meer databases koppelen. ‘Van die echt grote databases en dan
geautomatiseerd naar verbanden gaan zoeken. Nu is het toch vaak meer journalistiek gedreven,
handmatig, op je guts kijken: waar kan nog wat zitten? Dat lukt ons met Excel nog niet.’ Hij
heeft het idee dat ze nogal wat over het oog zien. Die gedachte werd bevestigd bij een hackathon,
waar de financiële posities van scholen werd bekeken. Wat zijn de reserves, afgezet tegen het
leerlingenaantal en tegen het soort bestuur. Tokmetzis: ‘Daar kwamen echt inzichten uit naar
voren die je er anders gewoon niet uithaalt. (...) Een van de dingen die ze ontdekten was dat er
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
64
op Vlieland meer leerlingen ingeschreven stonden dan er kinderen van die leeftijd zijn. Dus daar
is iets geks aan de hand.” Volgens hem is dit het echte werk, waar de meerwaarde van
datajournalistiek zich toont. ‘We hebben nu eindelijk een beetje een workflow, dat het allemaal
een beetje loopt, dus de volgende stap is om dat soort klussen te gaan doen. En zelf veel
informatie binnen te slepen. Veel meer gaan scrapen.’ Maar programmeurs zijn duur. ‘Die
kosten zo 80 euro per uur. En journalisten zijn gewoon goedkoper.’
Niet iedereen heeft trouwens behoefte aan een programmeur. Erik Bloem zou nog geen
concrete toepassing voor een programmeur weten. ‘Daar is Dimitri veel verder mee.’
5.6 Werkwijze
Hoe pak je een datajournalistiek project aan? Waar begin je? Wat doe je met de data die je in
handen krijgt? Welke afwegingen maak je bij de visualisatie? Hierover zeiden de geïnterviewde
journalisten het volgende.
• De journalisten herkennen zich wel in de workflows die in het theoretisch kader zijn
beschreven, maar de stappen worden lang niet altijd netjes gevolgd.
• Bij de NOS is de workflow het meest gestructureerd, omdat hier een grote groep mensen
moet samenwerken.
• De journalisten volgen niet altijd een vaste werkwijze, maar hebben ze wel routines voor
onderdelen van hun werk.
• Begin niet alleen met een vraag. Kijk ook of de benodigde data wel beschikbaar is.
Anders breekt dit je later in het proces op.
• Beginnen met data die er al is, is makkelijker dan beginnen met data die je nog moet
zoeken of verzamelen.
• Data verkrijgen betekent nog niet dat die bruikbaar is. Soms zijn bestanden onbruikbaar
door hun bestandsformaat of doordat ze onvolledig zijn.
• Twee datajournalisten hebben de indruk dat het verkrijgen van data bij officiële
instanties, wat soms best lastig is, langzamerhand makkelijker gaat.
• Het Centraal Bureau voor de Statistiek (CBS) wordt door de meeste datajournalisten op
de voet gevolgd. Veel berichten worden overgenomen. Een journalist vindt dat je hier wel
mee moet uitkijken.
• Journalisten verzamelen de data graag zelf, omdat dit unieke verhalen oplevert, maar dit
kost ook veel tijd.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
65
• Sommige journalisten gebruiken de Wet Openbaarheid Bestuur (WOB) nooit. Bij Nu
gebruiken ze de WOB, maar vaak pas als laatste redmiddel. En bij RTL wordt de WOB
relatief snel ingezet.
• Sommige journalisten scrapen nooit, anderen geregeld en bij de NRC wordt iedere week
de website van Funda gescraped.
• Twee journalisten vertelden dat ze bij het analyseren vaak vergelijkingen maken. Dit zou
het ook goed doen in het nieuws.
• Deskundigen kunnen een belangrijke rol spelen bij het analyseren van data.
• Het merendeel van de journalisten vindt het vooral belangrijk dat data niet te
ingewikkeld worden gepresenteerd. Zij houden niet van ingewikkelde visualisaties.
• Gratis tools kunnen erg handig zijn, maar uniformiteit in de presentatie is ook
belangrijk, volgens de journalisten. Daarom laten ze soms speciale sjablonen
ontwikkelen.
• ‘Visualiseren moet je wel consequent doen.’ Spreekt de visualisatie niet voor zich, dan
kun je niet teveel bijkleuren. Dan wordt het een animatie.
5.6.1 Workflow
Hebben de ondervraagde journalisten ook een vaste werkwijze voor hun datajournalistieke
projecten? Dimitri Tokmetzis kan de standaardworkflow zo opdreunen: ‘Je hebt vier
basisstappen, die zijn bekend. Vinden, verwerken, opschonen, analyseren en visualiseren. Dat
blijft gewoon. Daar zit je aan vast. Hoe dat precies gaat, dat ligt aan het onderwerp. Of je er
nieuws uit wilt halen of achtergrond.’ Arlen Poort gelooft niet dat er een standaard workflow is.
Laura Wismans stelt dat de stappen die in de standaardmodellen op zich wel kloppen, maar dat
je niet alles altijd doet. ‘Soms is data al schoon, wordt het gewoon schoon uit een database
gedraaid. Nou, klaar is Kees.’ ‘Maar globaal denk ik dat die stappen, bijvoorbeeld het
stappenplan op de site van The Guardian, grotendeels wel kloppen.’ Vermanen vindt de
workflowmodellen wel handig om aan iemand uit te leggen hoe hij ongeveer te werk gaat. ‘Of
voor academici, die zijn dol op modellen. Omdat je de werkelijkheid toch op een bepaalde
manier moet uitleggen.’ Maar de modellen komen volgens hem niet helemaal overeen met de
werkelijkheid. ‘Het werkt wel zo in de praktijk, maar niet in dat vaste stramien.’ Maar dat geeft
niet, zegt hij. ‘Het maakt ook niet uit of de bedenker van dat model wel of niet echt denkt dat het
zo gaat in de praktijk - het is gewoon een goed communicatiemiddel. Vaak zal het ook
ongemerkt wel volgens zo’n model verlopen en dan sta ik er niet eens bij stil, waarschijnlijk.’
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
66
Aan de andere kant kun je volgens Vermanen ook moeilijk oneens zijn met de modellen. ‘Het
zijn gewoon standaardschema’s. Dat is bijna ieder journalistiek project zo: je verzamelt
informatie, je verwerkt informatie, je presenteert informatie. En dat verwerken kun je dan weer
in meerdere onderdelen opsplitsen, maar het komt in de basis op hetzelfde neer: ontvangen,
verwerken, zenden. Tja, daar kun je het niet erg mee oneens zijn. Zo werkt het nu eenmaal.’ In
werkelijkheid is een datajournalistiek project volgens Vermanen vaak een vloeibaar proces: het
kan alle kanten op gaan.
Frederik Ruys, de datajournalist van Nederland van Boven, visualiseerde zoals gezegd de
workflow van zijn programma. De stappen waren achtereenvolgens: speuren, analyseren,
combineren, visualiseren, schrijven en animeren. Volgens Jasper Koning is dit echt hoe de
redactie te werk ging. Maar de workflow verschilde wel per dataset. Bij een fragment waarin een
meeuw werd gevolgd die van een Waddeneiland naar Amsterdam vloog, was bijvoorbeeld niet
veel research nodig en was de visualisatie redelijk straight forward. Maar voor een visualisatie
van treindata waren veel meer berekeningen nodig en moest er veel data worden aangepast om
de treinen daadwerkelijk over sporen te laten rijden en niet dwars door het land. ‘Daar hebben
we zelfs externe partijen bij gehad die meehielpen met rekenen.’ ‘Er is zelfs processingkracht in
India ingekocht om bij te processen. Tegen dat soort dingen loop je wel pas aan als je het
probeert.’ Dus dat proces wisselt wel per omvang van de dataset. Vliegbewegingen zijn om
soortgelijke redenen ook heel moeilijk. Hierbij heb je geen losse punten die een lijn vormen,
maar bereken je het traject op basis van een aantal controlepunten. Zo’n dataset vereist ook veel
bewerking en aanvulling.
Bij RTL is een redelijk vast stappenplan, vertelt André Tak. Het begint met een idee.
Vervolgens wordt gekeken of en hoe de benodigde gegevens te verkrijgen zijn. Wanneer de
gegevens binnen zijn, wordt gekeken of die eenduidig is en of die aanvulling nodig heeft. ‘Dan
gaat diegene die in Excel gespecialiseerd is op basis van die gegevens die we hebben de meest
interessante vragen stellen.’ Afhankelijk van de antwoorden wordt gekeken wat journalistiek
gezien het meest interessante is. ‘En op het internet kunnen we natuurlijk wat breder
uitpakken.’ Interessante gegevens die niet meer in het televisie-item passen, kunnen online een
plekje krijgen.
5.6.2 Meer structuur in workflow NOS
Bij de NOS is meer sprake van een gestructureerde aanpak. Anke Vellenga overhandigt als enige
een uitgeschreven stappenplan. Het document van anderhalf A4 beschrijft de volgende negen
stappen.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
67
1. Idee/dataset
2. Data verzamelen
3. Data opschonen
4. Analyse
5. Keuze visualisatie/tool
Stappen bij externe/uitgebreide visualisatie
a. Financiering
b. Keuze voor externe datavisualisator
c. Opmaken van briefing voor externe datavisualisator
6. Productiefase
7. Publicatie
8. Externe kanalen
9. Evaluatie
Bij de NOS houden ze zich niet helemaal vast aan dit schema, vertelt Vellenga. ‘Maar op zich
gaat het meestal wel zo.’ De informatiespecialist heeft zelf wel een verklaring voor het feit dat de
werkwijze van haar organisatie een stuk gestructureerder is dan die van andere
nieuwsorganisaties. ‘Die andere zijn echt datajournalist en die zijn in hun eentje of samen met
een programmeur. En bij ons is het echt een samenwerkingsproces over de hele redactie. En wij
hebben eigenlijk geen datajournalist en ook geen programmeur. Dan moet je dat toch zo een
beetje oplossen.’
Het stappenplan moet overigens nog wel een beetje aangescherpt worden, zegt ze. ‘De eerste
stap is: je gaat naar Documedia en redactie en media gaan overleggen over een visualisatie of
idee.’ Een dag voor het gesprek heeft iemand van de economieredactie die stap overgeslagen.
‘Die is gelijk naar NOS op 3 gegaan.’ Uiteindelijk werd toen op twee plekken binnen de NOS
afzonderlijk aan twee vrijwel identieke visualisaties gewerkt. ‘Dus het moet nog wel misschien
beter duidelijk gemaakt worden.”
5.6.3 Routines
Hoewel niet iedereen strikte workflows volgt, zijn er wel bepaalde routines te herkennen bij de
datajournalistieke projecten van de geïnterviewde journalisten. Bij Sargasso hebben ze drie
verschillende ritmes – korte periodes voor dagelijks nieuws en langere periodes voor
achtergrondverhalen. ‘Het eerste is echt het hele korte nieuws. We hebben met ANP afgesproken
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
68
dat we in principe dagelijks een nieuwtje afleveren, een cijfernieuwtje. En één keer in de week
probeer je een wat groter verhaal te maken, met wat meer body. Ofwel bijzondere data die nog
niemand heeft, die we hebben gewobt soms of via ministeries hebben gekregen of via anderen,
via niet zomaar openbaar gemaakte stukken.’ Dat is het tweede ritme. ‘Daarnaast hebben we
echt de grote projecten die hackathons bijvoorbeeld, waar we echt de diepte in willen gaan en
daar een hele serie verhalen uit willen krijgen. Dus eigenlijk drie niveaus heb je. Lekker snel, wat
meer achtergrondverhalen en de echt diepgaande stukken.’
Tokmetzis noemt een voorbeeld van ‘lekker snel’: ‘Wat we gisteren hadden bijvoorbeeld, over
treinen die rode seinen negeren, daar is onderzoek naar geweest, helemaal weggestopt in een
rapportje. Dat rapportje heette ook STS Passages 2011, geen hond die dat leest natuurlijk,
behalve ik dan. Daar bleek gewoon nieuws in te zetten: dat het aantal treinen dat door rood rijdt
enorm is gedaald. Ik haal die data eruit, zet het even netjes op een rij, maak een basale analyse,
dat gaat dan vervolgens naar ANP, die zet er een journalist op, die gaat dan rondbellen en je
hebt nieuws, in vrij korte tijd. Is dat datajournalistiek? Ik denk het niet, maar wij zitten
inmiddels zo goed in die datastroom.’ Rapporten die op het eerste oog oninteressant zijn hebben
sowieso Tokmetzis’ voorkeur. ‘Ik bekijk altijd eerst de rapporten met de meest saaie naam, daar
zitten vaak interessante dingen in.’ Als hij zo’n rapport in handen krijgt, neemt hij het op
geroutineerde wijze door. ‘Je leest eerst even de inleiding en samenvatting door, bekijkt even de
methodologie: hoe zijn die cijfers tot stand gekomen. Vervolgens scroll ik vrijwel meteen door
naar de tabellen. De cijfers moeten het verhaal al vertellen.’
Poort heeft ook bepaalde routines. Als hij een bestand krijgt opent hij dat zo mogelijk in
Excel. Wat hij dan als eerste doet, is uitzoomen. ‘Dat kan hè, dat je het werkblad op tien procent
zet. Dan zie je niet meer wat er staat, maar dan zie je wel een tabel. En als dat er visueel raar
uitziet, dan zoom ik in op de rare plekken en kijk ik: is daar iets verkeerd gegaan met het
importproces? Alsof je de tabel uitprint en vijfentwintig meter verderop gaat staan en dan kijk
je: ‘Is dat nu een mooi patroontje?’’ Visualisaties, die in de workflows pas aan het eind van het
traject aan bod komen, maakt Poort ook wel eens tijdens de analysefase. ‘Je kunt ook
puntenwolken maken bijvoorbeeld. Stel: je vraagt je af of er een verband is tussen de lengte van
een hardloper en hoe snel hij aan de finish is. Als je daar de gegevens van hebt, dan maak je daar
eerst een puntenwolkje van. Als dat een mooi wolkje is, wat een beetje bij elkaar zit, dan heb je
een verhaal. Als het allemaal in een cirkel staat: laat maar gaan, daar hoef je niet eens verder
naar te kijken.’
De werkdagen van Vermanen vertonen ook een bepaalde vorm van routine. Hij beschrijft zijn
globale werkdag: ‘Ik kom hier ‘s ochtends aan, ik weet dat om half tien de CBS-cijfers er zullen
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
69
zijn, dus daar probeer ik al tijd voor vrij te maken, dat zijn gewoon vaste dingen en er komen
altijd goede visualisaties uit. Maar dat is eigenlijk de vastigheid die ik heb, van de CBS-cijfers.
Tussendoor en ook van tevoren op Nu kijken. We hebben nu weekvergaderingen, dus we weten
ook welke onderwerpen er in de loop van de week aankomen, dus die kun je ook al een beetje
vooruit plannen. En: die collega is daarmee bezig, kan daar data in zitten?’ Bij het maken van
visualisaties valt hij vaak terug op standaardvormen. ‘Aan de ene kant omdat dat sneller werkt -
een lijngrafiek, een staafdiagram of soms een kaartje, dat is vrij makkelijk te bepalen wanneer je
wat moet inzetten. En het is voor lezers ook heel goed herkenbaar.’
5.6.4 Het begin
Hoe kom je op ideeën voor een datajournalistiek project? Voor de een is dat makkelijker dan
voor de ander. Sommige geïnterviewden zien bij het vinden van een dataset direct een
journalistiek verhaal voor zich. Zo vertelt Arlen Poort dat hij sinds kort weet van het bestaan van
de Nationale Databank Weggegevens. Mensen denken dan al snel aan file-informatie, maar
Arlen legt uit dat hij zulke info eerder wil gebruiken voor economische vraagstukken. Zijn
bepaalde gebieden minder populair bij automobilisten? Wat zegt dit over de economie?
Normaal stond het altijd vast bij de Beneluxtunnel en toen de crisis begon kon je daar ineens
doorrijden. Komt dat nu doordat er net een paar minder vrachtwagens rijden waardoor het
verkeer doorstroomt? Kortom: hij legt veel koppelingen tussen ‘verkeersdata’ en allerlei andere
onderwerpen.
Sommige mensen, zoals Bas Broekhuizen, stellen dat je bij datajournalistiek met een vraag
moet beginnen. Dimitri Tokmetzis doet dit inmiddels juist niet meer. Hij baseert zich op zijn
eigen ervaring: ‘Wij begonnen in het begin ook vaak met een vraag om er vervolgens achter te
komen dat de benodigde data niet bestond of niet te krijgen was. Dan is al je moeite voor niets.’
‘Vragen zijn heel belangrijk, natuurlijk. Je moet altijd vragen stellen. Soms is het ook allebei een
beetje. Maar je moet wel weten dat de data er zijn.’
André Tak herkent wel wat Tokmetzis zegt. Maar hem zou zoiets nooit overkomen. ‘Ik snap het
wel. Maar dan heb je in het begin niet goed gekeken of de data wel beschikbaar is en waar. Je
moet je dat echt heel erg goed realiseren in het begin. Je kunt allerlei interessante vragen
bedenken, maar of het allemaal beschikbaar is, dat is net de grote valkuil. Meestal is het
namelijk niet beschikbaar of niet alles.’ Bij RTL kan men zich sowieso niet veroorloven om een
project na een paar weken te moeten afblazen. ‘Als wij met een project beginnen, dan zal het
lukken ook. Wij krijgen die gegevens dan ook.’ Gegevens niet krijgen is geen optie.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
70
Hoe beginnen Tak en zijn collega’s dan met een project? Hoe komen zij bijvoorbeeld op
ideeën? Daarover wil hij weinig kwijt. ‘Dat is een goede vraag. Daar ga ik niet alles over
vertellen.’ Tak beperkt zich ertoe te zeggen dat je in zijn algemeenheid na kunt denken over wat
mensen interessant zouden kunnen vinden als ze op een bepaalde plek wonen. Later zegt hij: ‘Je
moet vanuit de andere kant denken. Waarvan je denkt dat er gegevens zijn. En hoe ze
opgeslagen worden. En daar een vraag bij stellen die interessant is. Maar als je gewoon out of
the blue vragen gaat stellen die je interessant vindt, dan is het maar de vraag of die gegevens op
die manier bij andere partijen voor handen zijn. Dus je moet het een beetje van de andere kant
benaderen en je afvragen waarom organisaties bepaalde gegevens bijhouden, met welk doel, en
dan kijken of wij er wat aan zouden kunnen hebben. Je moet je een beetje verplaatsen in de
andere organisatie.’
Dit lijkt een beetje op wat Dimitri Tokmetzis adviseerde. ‘Als je het jezelf makkelijk wilt
maken, begin je met de data die er al zijn.’ Erik Bloem zegt ook dat je zou kunnen beginnen met
het opvragen van data. Hij is ten tijde van het interview bijvoorbeeld bezig met het onderwerp
energie. Hij weet dat Nederlanders veel energie verbruiken per hoofd van de bevolking. Bloem
doet vervolgens het volgende: hij gaat naar de site van de Wereldbank, waar een database is van
het energieverbruik per hoofd van de bevolking van veel landen. ‘En dan ga je kijken hoe dat
voor Nederland zit, je gaat vergelijken met andere landen.’ Vervolgens kijkt hij of er nog iets met
de dataset moet gebeuren of dat dit gegeven an sich voldoende is om een rol in het verhaal te
spelen. Vergelijken is sowieso iets wat veel gebeurt in datajournalistiek, maar daarover later
meer.
Bij Altijd Wat wordt naast de gebruikelijke methoden gewerkt met een zogenaamde
ideeënfabriek. ‘Het zijn twee mensen die een beetje innovatieve ideeën proberen op televisie te
krijgen. En daar brainstormen we dan mee over bepaalde domeinen waarbinnen wij
onderwerpen willen maken.’ Brainstormen werkt ook goed voor Arlen Poort: ‘De beste ideeën
krijg ik in ieder geval als ik met anderen praat’.
Jerry Vermanen vertelt dat bij Nu de eerste stap is, dat er gekeken wordt of er achter een
(pers)bericht getallen schuilen die te visualiseren zijn. Vermanen: ‘En je afvragen: Waar zijn die
getallen op gebaseerd? Kunnen we een Excel-sheet krijgen?’
5.6.5 Verkrijgen van data lastig?
Stel, je hebt een idee. Wat dan? André Tak vertelt dat je jezelf dan allerlei dingen moet afvragen.
Waar zijn de benodigde gegevens? Zijn ze überhaupt beschikbaar? Welke methode moet je
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
71
hanteren om de data te verkrijgen? ‘Gewoon één telefoontje en vragen? Of moeten we daarvoor
een WOB-procedure starten? Of moeten we iets anders doen?’
Zelf data verzamelen kan best lastig zijn. Jerry Vermanen weet dit uit ervaring. ‘Data
verzamelen en daar zelf nieuws uithalen dat is nu nog wel een echte uitdaging.’ De overheid wil
volgens hem niet altijd meewerken wanneer er grote hoeveelheden informatie worden
aangevraagd. ‘Of je krijgt informatie en komt erachter dat die niet goed is bijgehouden of dat je
er gewoon geen goede conclusie uit kunt trekken omdat je er zoveel kanttekeningen bij kunt
plaatsen.’ Arlen Poort kreeg bijvoorbeeld wel eens gescande tabellen toegestuurd door
gemeentes. Het kost zoveel tijd om zoiets om te zetten naar bruikbare bestanden, dat het bijna
niet de moeite waard is.
Veel gemeentes hebben veel interessante gegevens, maar het is vaak lastig hen te bereiken.
Laura Wismans: ‘Alle gemeentes hebben niet eens een eenduidig e-mailadres waarop je ze kunt
bereiken.’ Politiekorpsen zijn makkelijker te bereiken, maar veel verschillende korpsen houden
hun data op verschillende manieren bij. ‘Zo kun je dus helemaal nooit iets met politiecijfers
doen, want ze zijn niet met elkaar te vergelijken’, vertelt Wismans. ‘Dat is echt wel waardoor
projecten mislukken.’
Gelukkig lijken grote instanties langzamerhand makkelijker data te verstrekken. Jerry heeft
bijvoorbeeld de indruk dat ambtenaren beter bekend raken met data en steeds beter weten waar
de gevraagde data zich bevindt. Laura Wismans merkt ook dat er beweging is op dit vlak: ‘Er
wordt over gesproken. […] Ze worden minder bang. Het wordt niet alleen maar gezien als
supernegatief of ‘ze willen ons er alleen maar mee aanvallen’’.
5.6.6 CBS
Een makkelijke manier om aan data te komen, is het volgen van het Centraal Bureau voor de
Statistiek (CBS). Dat doen de meeste datajournalisten dan ook trouw. Volgens Poort is het CBS
een van de belangrijkste bronnen. Hij is zelf geabonneerd op alle RSS-feeds die het bureau
aanbiedt: ‘Dat zijn denk ik vijftien berichten per dag. Maar het meeste gaat over economische
onderwerpen die heel erg gaan over een bepaalde sector. Dan denk je: ‘Zal wel’. Maar zo zie je
wel alles wat het CBS elke dag publiceert.’ Ook bij Sargasso volgen ze het CBS op de voet. ‘Wat
we vaak doen, is 's ochtends even rondje langs het CBS. Niet om te kijken naar de persberichten,
maar welke tabellen zijn er geüpdatet. Daar zitten vaak nieuwe cijfers in, dus dat kan nieuws
aanleveren en dat is waar veel journalisten niet in kijken.’
Jerry Vermanen houdt het CBS ook scherp in de gaten. Het bureau bepaalt deels zijn agenda.
‘Op vrijdag krijgen we de CBS-agenda. Daar staan alle onderwerpen voor de volgende week in.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
72
CBS-cijfers worden elke dag om half tien ‘s ochtends bekend. Dan is het vrij makkelijk om vrij te
plannen. Je weet welk onderwerp op donderdag om half tien gaat langskomen.’ ‘Soms is een
grafiek eerder klaar dan dat het bericht is getikt. Dan ben je het een beetje voor. Zodra het
bericht online gaat kun je gelijk de grafiek er inknallen en ben je er als eerste mee.’ Vermanen is
wel blij met het CBS. ‘Het handige bij het CBS is vooral dat de statistici die daar werken ook vaak
wel de juiste nieuwsinsteek zien. Die pakken het belangrijkste er ook vaak als wel zelf uit. Dan
kunnen wij heel geforceerd een andere insteek kiezen. Soms werkt het wel als je extra informatie
zoekt in zo’n dataset en dan komt het een alinea eronder te staan, maar de hoofdmoot van het
bericht blijft vaak wel hetzelfde.’ Moet je daar niet een beetje mee oppasen? Vermanen: ‘Het is
een onafhankelijk instituut dus wat dat betreft hebben ze er niet echt belang bij om dingen te
verhullen. […] Je merkt gewoon dat onderzoekers bij het CBS er heel voorzichtig mee zijn om
conclusies te trekken die niet kloppen. Als ik iets tegenkom wat niet klopt en ik bel naar het CBS
wordt dat ook direct aangepast op de site. Maar de hoofdmoot van de berichten blijft eigenlijk
wel altijd hetzelfde. Ik controleer het natuurlijk wel gewoon altijd als ik een dataset krijg, van,
kan ik dezelfde conclusie eruit trekken of kan ik er misschien andere conclusies uit trekken.’
Erik Bloem houdt het CBS niet in de gaten. Wel neust hij regelmatig in databases als Statline
en Eurostat, ‘maar dat is pas op het moment dat ik denk dat daar iets is wat ik nodig heb’. De
CBS-statistiek is volgens hem ook beter geschikt voor internetsites als Nu dan voor een
televisieprogramma. ‘Hij [Jerry Vermanen] maakt daar iets moois en inzichtelijks van. En in die
zin is het heel anders. Daar kun je op televisie natuurlijk ook niet zoveel mee. Op televisie is het
nog niet een halve minuut zendtijd als je laat zien waar alle spelers vandaan komen [op het WK,
wat Vermanen liet zien in een visualisatie die zelfs door The Guardian werd opgepikt].’ De
NCRV-journalist vindt het wel riskant dat het CBS zo’n grote invloed heeft op de
datajournalistiek agenda. ‘Dat is in ieder geval journalistiek gevaarlijk.’ ‘Doordat er minder
mensen op de nieuwsredacties werken komt een KPMG-rapport over het vestigingsklimaat in
verschillende Nederlandse gemeenten gewoon rechtstreeks de krantenpagina’s op. Terwijl ik
denk: ‘Waarom?’ Hoe kan een KPMG-rapport nou nieuws zijn? Want je kunt helemaal niet
achterhalen hoe ze onderzoek gedaan hebben. […] Je moet er wel mee uitkijken, vind ik.’
5.6.8 Zelf data verzamelen
Erik Bloem merkt op dat datajournalistiek nu heel erg gaat over bestaande datasets. In zijn tijd
bij de Volkskrant maakten hij en zijn collega’s zelf een dataset, bijvoorbeeld over de strafmaten
in Nederland of over invloedrijke bestuurders. Dit kost tijd, maar heeft ook een belangrijk
voordeel, vertelt Bloem: ‘Als je zelf een dataset maakt, dan heb je een dataset die niemand
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
73
anders heeft en daar kun je dan ook op voortborduren.’ Dimitri Tokmetzis geeft toe dat zelf data
verzamelen het meest bewerkelijk is, maar noemt het ook het leukste. Sargasso wobte
bijvoorbeeld alle gemeentes om hun cameraposities. ‘Dat is vreselijk veel werk, maar dat levert
wel heel veel op.’ Door een datajournalistieke benadering te kiezen, word je volgens Tokmetzis
gedwongen data te zoeken die nog niet wordt gebruikt. ‘En een van de dingen die wij vonden is
dat het UWV gewoon maandelijks werkloosheidscijfers per postcode bijhoudt. Die cijfers
worden nauwelijks tot niet door andere media gebruikt, terwijl je daar wel heel interessant
nieuws uit kan halen.’
Laura Wismans geniet er het meest van als ze data op een spectaculaire manier heeft
verkregen: ‘Hoe explosiever hoe beter’. Open data zijn in haar ogen heel leuk en heel goed, maar
brengt ook met zich mee dat alle andere journalisten het ook kunnen hebben. Dan ben je
bijvoorbeeld heel lang met iets bezig en dan heeft iemand anders het ook al. Laura: ‘Ik vind het
het leukste als je een dataset hebt waarvan anderen zeggen: ‘Goh, wat leuk dat ze die heeft
losgekregen’.’
5.6.9 Data verkrijgen via WOB
Maar hoe kom je dan aan originele data? Het is niet zo dat die spontaan naar de redactie wordt
gestuurd door een mysterieuze Deep Throat, vertellen de medewerkers van RTL en Nu. ‘Het is
eigenlijk bijna nooit zo dat er data binnenkomt’, zegt Jerry Vermanen. Je zult dus zelf achter je
data aan moeten. Een manier om databestanden te verkrijgen is om te wobben.
Niet iedereen maakt gebruik van deze optie. Poort heeft de WOB bijvoorbeeld nog maar twee
keer gebruikt en beide keren zonder succes. Een keer wobte hij uit ergernis, omdat
Rijkswaterstaat een bestand voor veel geld verkocht terwijl het overheidsinformatie was. ‘Ze
hadden toen niet gereageerd op mijn WOB-verzoek en omdat het niet een deel van mijn
workflow was om daarmee door te gaan is het mij ontschoten.’ Een andere keer wilde hij de
geboortedatum, sekse en het woonadres van kandidaten voor de gemeenteraadsverkiezingen.
Deze informatie moest stuk voor stuk opgevraagd worden bij honderden gemeenten. In de paar
maanden tijd die hij had was dit een onbegonnen zaak.
De WOB wordt ook regelmatig gebruikt bij Nu. Maar het is wel een lastige procedure, zegt
Vermanen. Bovendien is hij voorzichtig met wobben. ‘Je hebt journalisten die al voor elk
wissewasje dreigen met een WOB-verzoek, wat helemaal niet handig is, want soms is een
telefoontje naar een woordvoerder of iets dergelijks veel makkelijker en veel sneller. Voor een
WOB-verzoek moet je het sowieso eerst op andere manieren proberen te regelen. Vaak is dat
voor jezelf ook sneller en voor de overheid minder belastend. Omdat een WOB-verzoek een hele
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
74
procedure is die je dan op gang zet kost het ook daar heel veel tijd en mankracht. Een telefoontje
naar persoon kan ook heel veel bewerkstelligen. En vaak helpt het ook vaak om aan de telefoon
te zeggen: ‘Ik bel nu, ik weet dat ik u ook kan wobben, dat jullie die informatie hebben. Maar
voordat we dat gaan doen.. Ik vraag het nu gewoon even zo aan. Dat scheelt mij heel veel tijd,
scheelt jullie heel veel tijd.’ Een andere reden dat Vermanen niet zomaar gaat wobben, is dat het
erg lang duurt. ‘Dat is gewoon klote, dat dit zo lang duurt en dat je dan exact alles moet
verwoorden omdat je anders toch ergens tussen de letters door wordt genaaid. Dat is niet leuk.
Dus probeer je dat gewoon te vermijden, maar dat is wel iets wat je in je achterhoofd houdt van:
dit is ons ultieme middel om in te zetten.’
Op de RTL-redactie wordt de WOB veel sneller ingezet. Eerst gewoon vragen om de data doet
de redactie niet. ‘‘Nee, [wobben] doen wij vanaf het begin af aan. Kijk, als je dreigt met een
WOB-verzoek en er komt nooit een WOB-verzoek, dan is het dreigement waardeloos.’
5.6.10 Data verkrijgen door scrapen
Achter sommige websites, zoals Funda, schuilen grote databases. Met bepaalde software is het
mogelijk om de inhoud van die databases te hergebruiken. Zo kun je er zelf bijvoorbeeld
onderzoek naar doen. Ook Arlen Poort scrapet geregeld, zoals al eerder werd beschreven. Funda
scrapet hij nu nog iedere week. ‘En ik heb diverse keren de Overheidsalmanak gescraped,
gewoon om te weten welke burgemeester bij welke gemeente zat. En dat ging dan om zijn partij.
Die gegevens waren wel ook op een andere manier beschikbaar, maar het was uiteindelijk
makkelijker als ik heel snel een scriptje schreef waarmee ik dat van die website haalde
Vermanen heeft ook een paar keer gescraped. ‘Gewoon op de simpele manier: gewoon een
plug-in in je browser installeren dat je HTML-tabellen makkelijk in een keer in Excel kun
importeren.’ Net als bij het wobben werkt ook hier een telefoontje soms sneller. ‘Ik heb dat één
keer gedaan en toen dacht ik van: misschien is het gewoon handig als ik even een mailtje stuur
naar die persoon met de vraag of ik het mag hebben. Er stond geen exporteerknop ofzo, dus ik
dacht: dit moet ik scrapen. Nou, gewoon even mailen en die persoon is hier geweest en we
hebben koffie gedronken en hij had die informatie gewoon op een USB-stick staan. Net zo
makkelijk.’
Erik Bloem kan niet scrapen. Hij geeft toe dat dit bij een eerder onderzoek naar de strafmaat in
Nederland wel handig was geweest. ‘Wij wilden weten of er een ontwikkeling was in de
strafmaat. De directe aanleiding was natuurlijk de minimumstraffendiscussie. En wat blijkt dus:
rechters luisteren al naar de roep vanuit de samenleving om zwaarder te straffen.’ ‘Ik heb
gewoon al die tekstbestandjes [met gerechtelijke uitspraken] geopend en dan weet je gauw
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
75
genoeg waar ongeveer de strafmaat staat. Dat is vrij analoog, beetje oude techniek.’ ‘Dimitri had
dan waarschijnlijk een of andere automatische scraper gemaakt die het allemaal in een database
stopte. Dat heb ik niet gedaan.’ Ook Anke Vellenga kan niet scrapen, al zou ze dat wel graag
willen kunnen. ‘Dat wil ik wel leren, maar er is niemand die dat eigenlijk kan. Ook een gemis.
Dat zou een programmeur wel even voor je kunnen doen.’
André Tak is nog een beetje huiverig voor scrapen. ‘Bij scrapen kom je er toch dan weer achter
dat het weer niet vergelijkbaar is. Of dat je echt een ratjetoe binnenhaalt. Het moet wel precies
zijn he. Scrapen is ook weer een aparte techniek. Ik heb het idee dat dit nog te vroeg is op dit
moment. Misschien komt dat later. Gegevens moeten wel betrouwbaar zijn. We maken er
uiteindelijk een nieuwsitem van. En als we dan hebben zitten scrapen en maar wat dingen
hebben binnengehaald.. Het moet wel kloppen.’
5.6.11 Checken en opschonen
Als je eindelijk data binnen hebt, moet je nog wel checken of het klopt. Tokmetzis is inmiddels
erg sceptisch. ‘“Betrouwbaarheid is een groot probleem. Ik doe dit nu ruim een jaar en ik moet
zeggen: ik vertrouw geen enkele cijfers meer. We vinden altijd fouten in cijfers.’ Ook wordt
gekeken of de informatie bruikbaar is. Tak: ‘Is dat allemaal eenduidig aangeleverd of
afwisselend? Moeten er dan bijvoorbeeld nog extra gegevens opgevraagd worden om het
allemaal gelijk te krijgen?’ Vaak moet de data eerst geordend worden. Dat doet Vellenga ook als
eerste. ‘Eerst proberen een beetje te begrijpen: wat is het, wat staat er allemaal in?’ Voor het
importeren en analyseren van grote datasets maakt ze gebruik van het programma LQD
(uitgesproken als liquid). ‘Dus je kunt het opschonen, ordenen, structureren. En dan kun je dus
makkelijk gegevens eruit halen.’
Het belang van goed gestructureerde data moet niet onderschat worden, waarschuwt
Tokmetzis. ‘Daar kom je later ook wel achter hoor, dat die dataverwerking zo ontzettend
belangrijk is. Dat je het goed neerzet. Dat je stappen kunt herleiden. Dat als je ergens een fout
maakt, dat je die fout kan herstellen zonder dat je al die stappen daarna opnieuw moet doen. Dat
is wel prettig. Dus je moet Excel zo gebruiken dat als je ergens wat verandert, dat die analyse
verandert. En die kaarten veranderen.’
Bij Nederland van Boven kostte het behoorlijk veel tijd om de data eenduidig te krijgen. Alle
verschillende varianten van tijds- en locatienotatie moesten eerst op één lijn gezet worden,
voordat er iets met de data kon worden gedaan. Pas daarna kon Koning verder met stap twee:
analyseren. ‘Dan zaten we acht uur lang naar data te kijken: is er een patroon te zien?’
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
76
5.6.12 Data bevragen
Zodra de data gecheckt is en bruikbaar is gemaakt, kun je gaan kijken op welke vragen de
dataset antwoord geeft. Tak: ‘Dan gaat diegene die in Excel gespecialiseerd is op basis van die
gegevens die we hebben de meest interessante vragen stellen.’ Afhankelijk van de antwoorden
wordt gekeken wat journalistiek gezien het meest interessante is en wat de kop van het verhaal
kan worden voor het tv-item. Interessante gegevens die niet meer in het tv-item passen, kan de
redactie op internet kwijt.
Een redelijk eenvoudig begin van het bevragen is vergelijken. Je pakt de gegevens over
fenomeen X in Nederland en legt dit naast de data van andere landen. Of je neemt de data over
verschijnsel Y bij mannen en kijkt hoe dit is bij vrouwen. Bloem vertelde dat hij ten tijde van het
gesprek onderzoek deed naar energieverbruik. ‘Nederland gebruikt erg veel energie per hoofd
van de bevolking. Dan ga je naar de Wereldbank toe en die hebben en een database van het
energieverbruik per hoofd van de bevolking van ontzettend veel landen. En dan ga je kijken hoe
dat voor Nederland zit, je gaat vergelijken met andere landen. Dan ga je kijken of je met die
dataset iets moet of dat je aan dat gegeven an sich genoeg hebt om in dit geval een rol te spelen
in je verhaal.’ Voor het verhaal over energieverbruik waren de gegevens voldoende. ‘Volgens mij
is het genoeg dat ik gewoon kan zeggen dat Nederlanders enorm veel energie verbruiken. Veel
meer dan het gemiddelde van Europa, ten opzichte van Duitsland, enzovoort.’ Tokmetzis’
ervaring is ook dat vergelijkingen goed aanslaan. ‘Je weet gewoon: wat het goed doet in het
nieuws is een vergelijking van Nederland met andere landen, België ofzo. Vaak heb je gewoon
een rijtje met cijfers van de Europese Unie, maar zet het gewoon eens af tegen
bevolkingsomvang. Dan krijg je vaak hele andere inzichten: ‘Eigenlijk doen we het best goed’ of
‘Eigenlijk doen we het helemaal niet zo goed’.’
Soms kom je er pas na het checken en opschonen van de data achter, dat de data toch geen
antwoord bieden op jouw vragen. Dat overkwam Vellenga bij de analyse van een dataset met alle
wapenvergunningen in Nederland. We hebben dat geanalyseerd en gekeken: ‘Wat kunnen we
hier nu uithalen voor nieuws?’ Dat bleek nog best lastig te zijn. Toen hebben we er zelfs ook nog
deskundigen bij gehaald. Wat ook een belangrijk onderdeel is, denk ik wel, van
datajournalistiek. Dat staat hier niet in het werkproces, maar dat is wel zo denk ik. Maar die
[deskundigen] zeiden: ‘Eigenlijk zit hier ook helemaal geen nieuws in’. Want wij wilden weten
hoeveel automatische en semi-automatische wapens zijn er nou in omloop in Nederland. Maar
dat viel niet uit die dataset te halen. Het beste is om al die wapens in het echt te bekijken, maar
dat is natuurlijk niet mogelijk. En het type en kaliber en merk stond er wel bij, maar daar kun je
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
77
niet uit ophalen of ze semi-automatisch zijn. Want ze kunnen verbouwd worden. Ze vergeleken
dat met Volkswagen Polo, dan heb je ook verschillende varianten weer en dat heb je ook met
wapens. Dus dat was een beetje jammer. Maar op zich was het wel een keertje echt
datajournalistiek.’ Uiteindelijk kon de data nog wel gekoppeld worden aan een gerelateerd
verhaal over de schietpartij in Alphen aan de Rijn.
5.6.13 Presenteren
Uiteindelijk wil je als journalist maar één ding met data: het verhaal zo goed mogelijk
presenteren aan je publiek. Maar wat is een goede manier? Vier van de geïnterviewde
journalisten geven aan dat één ding erg belangrijk voor hen is: de presentatie moet niet te
ingewikkeld zijn. Arlen Poort ziet in de Verenigde Staten soms voorbeelden waar hij maar door
en door en door moet blijven klikken. Hij vindt wel dat het een ontdekkingstocht moet zijn,
maar zonder dat er een hoge drempel is. ‘Je moet de bezoeker van je website, want heel vaak zijn
het dan interactieve dingen, niet een taak geven.’ Laura Wismans is het met hem eens. ‘Ik vind
wel dat journalistiek altijd het verhaal moet vertellen en niet alleen het neerplempen en ‘succes
ermee’.’ Volgens Arlen moet je mensen een beetje bij de hand nemen. Dat bedoelt hij niet
paternalistisch. ‘Je moet niet zomaar iets over de schutting flikkeren bij een lezer of een
bezoeker van je website en zeggen: ‘Zoek het maar uit’.’ Beter is volgens hem om te laten zien
waarom iets interessant is. Ook Tak denkt dat je data zo makkelijk mogelijk moet presenteren.
‘‘Er zijn ongetwijfeld mensen die er ook in geïnteresseerd zijn om in de data te zoeken, maar dat
is niet de doorsnee kijker of gebruiker.’ De doorsnee kijker wil volgens hem snel consumeren.
Hij denkt daarom dat je mensen wegwijs moet maken.
Ook Jerry Vermanen richt zich op het gemak van de lezers en niet op grafische hoogstandjes.
‘Als je hele ingewikkelde arty farty dingen gaat maken - dat kost je heel veel tijd, maar lezers zijn
ook gewoon minder geneigd om zoiets heel snel te begrijpen.’ Voor hele grote projecten zou hij
wel de tijd kunnen nemen om lang na te denken over allerlei grafische mogelijkheden, maar
daarbuiten niet. ‘Het is vaak gewoon makkelijker om uit zo’n poule van standaard visualisaties
te graaien want dat communiceert gewoon veel beter en dat werkt sneller.’ Dimitri Tokmetzis
zegt: ‘De beste visualisaties vind ik de simpelste. Dat je gewoon in een klap ziet wat er aan de
hand is.’
Bij RTL letten ze tegenwoordig meer op de presentatie dan bij de eerste dataprojecten. ‘We
proberen het op internet wat beter te doen. Het presenteren van de gegevens was vroeger een
beetje houtje-touwtje. Gewoon: alle gemeentes op een rij en dan moest je jouw eigen gemeente
er maar tussen zien staan. Nu proberen we het op internet beter te presenteren, zodat het
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
78
gebruiksvriendelijker is. Dat je er ook echt wat aan hebt. Die ontwikkeling moet nog verder dan
nu, maar dat is wel de belangrijkste verandering. De resultaten beter proberen weer te geven.’
5.6.14 Gratis tools
De visualisaties van Sargasso worden vaak met eenvoudige programma’s gemaakt. Tokmetzis
begint een project in Excel en stapt vanuit daar vaak over op Google Docs. ‘En vanuit daaruit
kun je aan visualisaties werken. Ik vind de visualisatietechnieken in Google Docs beter. Omdat
ze interactief zijn en je kan er meer mee. Je kan niet alleen een lijngrafiekje of een kolommetjes
maken, maar ook bewegende grafieken en scatter plots [puntenwolken].’ Hij is erg blij met de
mogelijkheden van de gratis software. ‘Plus: je kan ook heel makkelijk kaarten maken, met
Fusion Tables. En daar kun je wel databases mergen [samenvoegen].’
Gratis software is niet altijd afdoende. Tokmetzis vindt de visualisaties van Excel ook niet
voldoende. En Google Charts werkt niet altijd even goed. En alle visualisaties moeten wel
ongeveer dezelfde stijl hebben. ‘Dus ik heb nu de programmeur die we hebben opdracht gegeven
om een aantal templates [sjablonen] te bouwen en een JAVA-library zodat we in ieder geval een
uniforme manier van presenteren gaan krijgen.’ Uniformiteit is ook bij de NOS belangrijk. Toen
hier voor het eerst een treemap online werd gezet, is besloten om er een te laten maken. Er
bestaan wel gratis tools voor, zoals ManyEyes, maar die was volgens Anke te lelijk met
embedden. Bovendien wilden de NOS-medewerkers dat een tool herbruikt kan worden zonder
elke keer iets opnieuw te hoeven programmeren.
5.6.15 Consequent visualiseren
Als datajournalist moet je ook consequent zijn bij het visualiseren. Dat merkte Jasper Koning
toen een televisievisualisatie minder sterk overkwam dan gehoopt. ‘Wij wilden heel graag laten
zien dat er [aan het einde van Koninginnedag] nog een laatste piek rond Amsterdam Centraal
Station was, waar mensen de laatste trein naar huis namen. En we wisten ook dat die er was en
we wisten ook dat die inderdaad daar te zien was, alleen hij kwam er visueel niet zo sterk uit.’
Wat te doen? Je kan ook gewoon het Centraal Station wat harder op laten lichten en vertellen
dat mensen daar de laatste trein nemen. Maar dat was nou precies wat ze niet wilden doen. ‘We
wilden dat aan de hand van de data doen en daar zijn we wel zo strikt mogelijk in geweest, van:
je moet de data visualiseren, anders kun je gewoon een mooie animatie maken.’
Televisiemedewerkers zeiden: ‘Ik zie het niet scherp genoeg, kun je niet gewoon wat oplichten?’
‘Nou nee, dat moet wel binnen de verantwoorde grenzen die je bedacht hebt. Het moet nog wel
ergens op slaan.’
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
79
6. Conclusie
Datajournalistiek heeft de afgelopen jaren steeds meer aandacht gekregen. Er werd veel over
gesproken, maar er werden wereldwijd ook daadwerkelijk veel mooie projecten gepresenteerd.
Hieruit bleek opnieuw dat data prachtige kansen biedt voor de journalistiek. Maar hoe pak je die
dataprojecten precies aan? Daar hadden de Nederlandse pioniers op het gebied van
datajournalistiek het nog wel lastig mee. Welke workflow en routines moet je hanteren? Die
behoefte vormde de aanleiding tot dit onderzoek, waarvan de hoofdvraag luidt: in hoeverre
verschillen de workflows en routines van Nederlandse datajournalisten? Een antwoord op deze
vraag werd gezocht door kwalitatieve onderzoeksinterviews af te nemen bij Nederlandse
journalisten die zich intensief bezighouden met datajournalistiek. Voorafgaand aan de
presentatie van de onderzoeksresultaten werden de ontwikkelingen op het gebied van
datajournalistiek in perspectief geplaatst.
De eerste oproep tot datajournalistiek zoals we dat nu kennen kwam van de Amerikaanse
journalist en programmeur Adrian Holovaty. Hij nam geen genoegen met de digitalisering van
oude journalistieke vormen. Holovaty wilde de mogelijkheden van het web benutten. Van een
brand, zo liet hij zien, kun je een kort verslagje schrijven, maar je kunt ook een overzicht maken
van meerdere branden waar je alle gerelateerde feiten in een gelaagde interface presenteert.
Holovaty’s oproep vond gehoor en geleidelijk aan gingen meer journalisten zich bezighouden
met data.
Het lastige van zo’n nieuwe manier van denken is wel, dat datajournalistiek moeilijk in
woorden te vatten is. Het omvat een overlappende set van uiteenlopende competenties uit
verschillende werkvelden. De statistiekmethoden uit de sociale wetenschap, de technieken om
kaarten te maken uit Geografische Informatie Systemen (GIS), de visualisaties van grafisch
vormgevers en allerlei technieken van computerwetenschappers, zoals programmeerkennis.
Sommige datajournalisten zeggen dat het niet uitmaakt wat je definieert als datajournalistiek,
maar in Nederland zijn er verschillende journalisten die hier wel waarde aan hechten. Zowel de
ervaren datapionier Dick van Eijk als de jongere dataprofeet Jerry Vermanen hebben betwijfeld
of het terecht dat bepaalde producties het label ‘datajournalistiek’ werd gegeven. Zo stelde
Vermanen dat de redactie van RTL Nieuws niet zo vaak aan datajournalistiek doet als zij zelf
denkt. Iets is volgens Vermanen pas datajournalistiek, zodra je een goede analyse volgens een
datajournalistiek proces hebt toegepast. Anderzijds geeft hij toe dat je ook zou kunnen zeggen
dat niet al zijn werk voor Nu datajournalistiek is. Overigens zeggen ook een aantal van de voor
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
80
dit onderzoek geïnterviewde journalisten dat zij zichzelf niet beschouwen als ‘echte’
datajournalisten, hoewel zij zich wel intensief bezig houden met data en journalistiek.
Holovaty was niet de eerste journalist die de waarde van data inzag. In de jaren zestig
lanceerde Philip Meyer al het begrip precision journalism en in de jaren tachtig deed Computer
Assisted Reporting (CAR) haar intrede. In Nederland was Dick van Eijk van NRC Handelsblad
de eerste journalist die zich hiermee bezighield. In 2011 was Nu de eerste website die een
fulltime datajournalist in dienst nam. Er volgden meer datajournalistieke projecten, zoals
RegioHack en Nederland van Boven.
Het verschil tussen CAR en datajournalistiek is volgens Philip Meyer vooral dat er vroeger veel
gezocht moest worden naar informatie en dat er nu zoveel informatie is dat het verwerken ervan
belangrijker is geworden. Maar hoe doe je dat? Verschillende journalisten en wetenschappers
brachten de workflow van datajournalisten in kaart. En hoewel er verschillen waren in het
aantal stappen, kwamen een aantal stadia in alle workflows terug: het verkrijgen van data, het
opschonen van data, het verwerken en analyseren van data en het presenteren van een item.
Maar ja, dit waren bij wijze van spreken slechts de ingrediënten; hoe maken Nederlandse
datajournalisten hier nu een taarten van? Tijd om een kijkje in de keuken te nemen. Maar als we
mee mogen kijken, moeten niet alleen letten op de volgorde waarin een project wordt
opgebouwd, maar ook op de kleine details en de schijnbaar vanzelfsprekende acties: de routines.
Deze ‘rituelen’ kunnen het journalistieke eindproduct behoorlijk beïnvloeden.
De gesprekken werden gevoerd met acht journalisten: Erik Bloem (Altijd Wat), Jasper Koning
(Nederland van Boven), Arlen Poort (NRC Handelsblad), André Tak (RTL Nieuws), Dimitri
Tokmetzis (Sargasso), Anke Vellenga (NOS Journaal), Jerry Vermanen (Nu) en Laura Wismans
(nrc.next). Zij werden geselecteerd omdat hun nieuwsorganisaties ten tijde van het onderzoek
het meest intensief bezig waren met datajournalistiek. Om de gesprekken met de journalisten
wetenschappelijk zo bruikbaar mogelijk te maken, werden de gespreksonderwerpen deels
gestructureerd. Hierbij is een deel van de vragen en gespreksonderwerpen van tevoren
vastgesteld. Het vastgestelde gedeelte bestond uit de volgende vijf aan het datajournalistieke
werk gerelateerde thema’s: doelstelling, onderwerpen, organisatie, medewerkers en werkwijze.
Uit de gesprekken over deze thema’s kunnen na analyse een aantal conclusies worden
gedestilleerd. Sommige zijn schijnbaar vanzelfsprekend, maar daarom niet minder relevant.
De doelstelling van de meeste datajournalistieke projecten van de onderzochte
nieuwsorganisaties is over het algemeen hetzelfde: ze willen nieuws brengen. Bij vier van de
zeven onderzochte nieuwsorganisaties is dit het voornaamste doel. De overige drie organisaties
maken ook graag nieuws, maar nieuwswaarde is geen vereiste voor hun producties. Twee
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
81
organisaties focussen zich specifiek op het visualiseren van data. De meeste organisaties stellen
zich ook ten doel om hun publiek zo persoonlijk mogelijk te benaderen.
Die persoonlijke benadering heeft wel gevolgen voor de onderwerpskeuze. Onderwerpen die
het publiek niet raken zijn moeilijk te slijten en vallen daardoor vaak af, ook al zijn ze belangrijk.
Andere onderwerpen worden juist sneller gekozen, omdat het publiek ervan houdt. Zo helpt het
op televisie als een onderwerp dramatisch is en als er beweging in zit. Dit maakt GPS-bestanden
populaire datasets. Sommige onderwerpen, zoals discriminatie, zorg en migratie, komen
opvallend veel voor in datajournalistiek. Volgens de journalisten komt dit mede omdat de
overheid hier veel gegevens over vrijgeeft. De journalisten zoeken het liefst zelf hun datasets,
maar dit kost veel tijd. Drie van de zeven geïnterviewden stellen dat ze door tijdgebrek niet
toekomen aan onderwerpen die ze wel zouden willen behandelen.
Tijdgebrek? Schakel dan je publiek in, zou je kunnen zeggen. Maar crowdsourcing is in de
Nederlandse datajournalistiek tot nu toe geen succes. Journalisten betwijfelen of het publiek wel
mee wil werken en of de verkregen data betrouwbaar is. Projecten waarbij crowdsourcing werd
geprobeerd verliepen problematisch. Wat soepeler verloopt, is de samenwerking met bedrijven.
Wat hierbij wel een groot obstakel is, is dat journalisten slechts beperkte mogelijkheden hebben
om te controleren of de verkregen data wel waarheidsgetrouw is. Voor Nederland van Boven
vormde het Commissariaat van de Media een ander obstakel, omdat dit data zag als iets van
waarde. De VPRO mag als publieke omroep geen dingen van waarde aannemen en daarom ook
geen data, was de gedachte. Dit bezorgde de programmamakers veel kopzorgen, maar de zaak is
uiteindelijk uitgepraat.
De makers van Nederland van Boven hadden wel een relatief groot budget voor iedere
aflevering. Verschillende andere journalisten worden door een krap budget beperkt in hun
datajournalistieke mogelijkheden. Bij twee nieuwsorganisaties worden datajournalistieke
projecten bemoeilijkt omdat er door de leidinggevenden weinig tot geen geld voor vrij wordt
gemaakt. Wat per organisatie duidelijk verschilde, was de mate waarin journalisten geholpen
werden door hun collega’s met datajournalistieke projecten. Bij drie van de onderzochte
organisaties stappen collega’s van de datajournalisten wel eens op hen af met een dataset. Maar
bij drie andere organisaties gebeurt dit bijna nooit. Datajournalistieke projecten kunnen ook
beïnvloed worden door de omvang van een organisatie. De NOS is bijvoorbeeld zo’n grote
organisatie. Dit heeft als voordeel dat er veel specialisten zijn, maar als nadeel dat de
communicatie soms moeizaam verloopt en dat beslissing langzaam worden genomen.
Hoe groot je budget ook is en binnen wat voor organisatie je opereert, uiteindelijk ben jij als
journalist verantwoordelijk voor je datajournalistieke project. Maar wat moeten medewerkers in
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
82
huis hebben om zo’n project goed te kunnen aanpakken? Een goede datajournalist moet
allereerst een goede journalist zijn, stelden twee van de geïnterviewde journalisten. Technische
kennis is niet noodzakelijk, die kun je gaandeweg wel opdoen. Enig gevoel voor vormgeving,
internet, het werken met getallen en het checken van feiten is wel handig. Maar weinig mensen
blinken op al deze vlakken uit en vier van de journalisten zijn het er dan ook over eens, dat je
een datajournalistiek project het beste in een team kunt aanpakken. Zo’n team zou idealiter
moeten bestaan uit een journalist, een technisch medewerker en eventueel een vormgever. Van
de geïnterviewden kan één journalist al behoorlijk programmeren en vier journalisten zouden
graag meer programmeerkennis in huis halen of verwerven. Een van de geïnterviewden heeft
overigens nog geen behoefte aan een programmeur.
In het theoretisch kader zijn verschillende workflows beschreven. De geïnterviewde
journalisten herkennen zich wel in deze werkwijzen en vinden de modellen ook wel handig,
maar de stappen worden lang niet altijd netjes gevolgd. Bij de NOS is de workflow het meest
gestructureerd, omdat hier een grote groep mensen moet samenwerken. Hoewel de journalisten
niet altijd een vaste werkwijze volgen, hebben sommigen wel routines voor onderdelen van hun
werk. In het theoretisch kader werd ook beschreven hoe vanuit de universitaire wereld werd
geadviseerd om te beginnen met een vraag. Twee journalisten waarschuwen wel, dat je ook moet
kijken of de benodigde data om die vraag te beantwoorden wel beschikbaar is. Het is
makkelijker om te beginnen met data die er al is. Data verkrijgen betekent nog niet dat die
bruikbaar is. Journalisten maken nog geregeld mee dat verkregen data onvolledig of
onbruikbaar is. Maar gelukkig ervaren twee van hen ook, dat het verkrijgen van data bij officiële
instanties langzamerhand makkelijker gaat. Een instantie waar erg veel datasets worden
verkregen, is het Centraal Bureau voor de Statistiek (CBS). Veel berichten van het bureau
worden overgenomen. Een journalist vindt dat je hier wel mee moet uitkijken.
Journalisten zoeken het liefst naar originele data, maar de manieren waarop ze dit doen,
verschillen nogal. Zo gebruiken sommige journalisten de Wet Openbaarheid Bestuur (WOB)
bijna nooit, terwijl anderen hier wel regelmatig data mee opvragen. Sommigen vragen eerst via
de normale weg of ze data mogen krijgen en andere zetten direct de WOB in. Ook scrapen is niet
overal even populair. Sommige journalisten scrapen nooit om data te krijgen en anderen doen
dat juist iedere week. Over de presentatie van de data zijn de journalisten wel redelijk
eensgezind: dat moet niet te ingewikkeld. Het is leuk om je publiek veel opties te geven, maar je
moet je kijkers en lezers wel leiden. Bovendien moeten visualisaties van een nieuwsorganisatie
er het liefst wel uniform uitzien. Gratis tools kunnen erg handig zijn, maar zijn niet altijd even
mooi. Tenslotte is het belangrijk dat je wel consequent bent in het visualiseren. Spreekt de
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
83
visualisatie niet voor zich, dan kun je de boel een beetje extra aanzetten. Maar dan maak je
animatie en geen datajournalistiek.
Kortom: zijn er verschillen te vinden tussen de manieren waarop de onderzochte
nieuwsorganisaties hun datajournalistieke projecten aanpakken? Jazeker. Wat vooral opvalt, is
dat sommige organisaties wel wobben en scrapen, terwijl anderen dit niet doen. Via deze wegen
is veel interessante data te verkrijgen. Ook is het opmerkelijk dat sommige journalisten wel
geholpen worden door hun niet-in-data-gespecialiseerde collega’s, terwijl anderen amper wat
van hun collega’s horen. Een kleine tip zou al een goede aanleiding kunnen zijn voor een mooi
dataproject. Wat overheerst zijn echter de overeenkomsten. De meeste geïnterviewde
journalisten zijn op zoek naar nieuws, hun workflow komt sterk overeen, crowdsourcing werkt
eigenlijk bij niemand en de meeste hebben grote behoefte aan programmeerkennis op de
redactie. Wanneer op Nederlandse redacties meer programmeerkennis aanwezig is, zal de
datajournalistiek zich zal ongetwijfeld verder kunnen ontwikkelen. Ook academisch onderzoek
kan hierbij helpen, door bijvoorbeeld te onderzoeken hoe journalisten zich ervan kunnen
vergewissen dat de data die zij aangeboden krijgen authentiek is. Ook zou het waardevol zijn om
te onderzoeken of overheden niet nog meer kunnen doen om data gemakkelijk beschikbaar te
maken. Hoe dan ook: de Nederlandse datajournalistiek is nog volop in ontwikkeling, maar het
enthousiasme en het doorzettingsvermogen van de betrokken journalisten bieden goede hoop
voor haar toekomst.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
84
Literatuurlijst
Artikelen
Arthur, Charles, 'Journalists of the future need data skills, says Berners-Lee' The Guardian (19-
11-2010) www.guardian.co.uk/technology/organgrinder/2010/nov/19/berners-lee-
journalism-data.
Bounegru, Liliana, 'Digging deeper: An in-depth look at data journalism in the Netherlands'
Data Driven Journalism (06-12-2011)
datadrivenjournalism.net/news_and_analysis/doing_data_journalism_in_the_netherlands.
Bradshaw, Paul, ‘What is data journalism’ Data Journalism Handbook
http://datajournalismhandbook.org/1.0/en/introduction_0.html.
Bradshaw, Paul, ‘How to be a data journalist’ The Guardian
http://www.guardian.co.uk/news/datablog/2010/oct/01/data-journalism-how-to-guide.
Bradshaw, Paul, ‘The inverted pyramid of data journalism’
http://onlinejournalismblog.com/2011/07/07/the-inverted-pyramid-of-data-journalism/.
Broekhuizen, Bas, ‘Journalisten moeten meer experimenteren met InfoVis’ De Nieuwe Reporter
(03-02-2010) http://www.denieuwereporter.nl/2010/02/journalisten-moeten-meer-
experimenteren-met-
infovis/
Dasselaar, Arjan, ‘Waar blijven de journalistieke databases?’ De Nieuwe Reporter (11-03-2008)
http://www.denieuwereporter.nl/2008/03/waar-blijven-de-journalistieke-databases/.
Eijk, Dick van, ‘Datajournalistiek in Nederland al twee decennia oud’ De Nieuwe Reporter (01-
05-2012) http://www.denieuwereporter.nl/2012/05/datajournalistiek-in-nederland-al-twee-
decennia-oud/.
Havinga, Heinze, ‘@HeinzeHavinga’ Twitter (26-07-2012)
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
85
https://twitter.com/HeinzeHavinga/status/228588255887642624 .
Holovaty, Adrian, ‘A fundamental way newspaper sites need to change’
http://www.holovaty.com/writing/fundamental-change/ Adrian Holovaty (06-09-2006).
Holovaty, Adrian, ‘In memory of chicagocrime.org’ Adrian Holovaty
http://www.holovaty.com/writing/chicagocrime.org-tribute/’ (31-01-2008).
Holovaty, Adrian, ‘The definitive, two-part answer to "is data journalism?"’ Adrian Holovaty
http://www.holovaty.com/writing/data-is-journalism/ (21-05-2009).
Howard, Alex, 'The bond between data and journalism grows stronger' O'Reilly (04-02-2012)
http://radar.oreilly.com/2012/02/data-journalism-computer-assisted-reporting-
government.html.
Ketelaar, Titia, ‘Bonnetjesschandaal bij de Britten’ nrc.next
http://www.NRCnext.nl/blog/2009/05/16/bonnetjesschandaal-bij-de-britten/
Levin, Adina, ‘Database journalism – a different definition of “news” and “reader”’ BookBlog
http://www.alevin.com/?p=1391 (23-03-2009).
Levy, Rachel, ‘‘Journalisten moeten meer database onderzoek doen’’ Vereniging van
Onderzoeksjournalisten (25-01-2009) http://www.vvoj.nl/cms/2009/01/25/journalisten-
moeten-meer-database-onderzoek-doen/ - N.B. Dit artikel is alleen te lezen voor leden van de
VVOJ.
LiCalzi O'Connell, Pamela, ‘Do-It-Yourself Cartography’ New York Times
http://www.nytimes.com/2005/12/11/magazine/11ideas1-13.html?_r=1 (11-12-2005).
Lorenz, Mirko, ‘Why journalists should use data’ Data Journalism Handbook (geen datum)
http://datajournalismhandbook.org/1.0/en/introduction_1.html.
Meijers, Jaap, 'RTL Nieuws gaat verder met datajournalistiek - zónder datajournalist' De
Nieuwe Reporter (05-06-2012) www.denieuwereporter.nl/2012/06/rtl-nieuws-gaat-verder-
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
86
met-datajournalistiek-zonder-datajournalist.
Nieuwenhuijsen, Bas, ‘Datavisualisatie is een andere, leuke manier om je verhaal te vertellen’
Spreekbuis (geen datum)
http://www.spreekbuis.nl/content/2600/%22Datavisualisatie_is_een_andere__leuke_manier
_om_je_verhaal_te_vertellen%22.html.
Paulussen, Steve, [email protected]. Een studie naar de mogelijkheden en gevolgen
van het internet voor de journalistieke nieuwsgaring en nieuwsproductie (Gent 2003).
Poort, Arlen en Melle Garschagen, ‘Er zit maar één ding op: omlaag. Verkopers wachten
maandenlang met prijsverlaging’ NRC Handelsblad (17-01-2009).
Prenger, Mirjam, ‘Tegels lichten’ De Nieuwe Reporter (11-12-2012)
http://www.denieuwereporter.nl/2012/12/tegels-lichten/.
Ramaer, Joost, 'Datajournalistiek, of: Nu zoekt nerd met vijf poten' De Nieuwe Reporter (24-01-
2011)
www.denieuwereporter.nl/2011/01/datajournalistiek-of-nu-nl-zoekt-nerd-met-vijf-poten/.
Ringelestijn, Tonie van, 'Nederlander maakt betere Wikileaks-zoeker' Bright (02-12-2010)
https://www.bright.nl/nederlander-maakt-betere-wikileaks-zoeker
Rogers, Simon, ‘@smfrogers’ Twitter (29-08-2011)
https://twitter.com/smfrogers/status/108238296685096961.
Rogers, Simon, ‘Anyone can do it - Datajournalism is the new punk’ The Guardian Datablog
(24-05-2012) http://www.guardian.co.uk/news/datablog/2012/may/24/data-journalism-
punk
Rogers, Simon, ‘Data journalism broken down: what we do to the data before you see it’ The
Guardian (07-04-2011) http://www.guardian.co.uk/news/datablog/2011/apr/07/data- journalism-
workflow.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
87
Rogmans, Dolf, 'Cijfers brengen de mierenhoop tot leven' Villamedia (21-10-2011).
Stray, Jonathan, ‘A computional journalism reading list’ Jonathan Stray (31-01-2011)
http://jonathanstray.com/a- computational-journalism-reading-list.
Streefkerk, Samir, 'Argos komt met nieuwe Wikileaks-zoekmachine: 'Media moeten nieuwe
wegen bewandelen'' OnJo (13-10-2011)
www.onjo.nl/Item.2569.0.html?&no_cache=1&tx_ttnews%5Btt_news%5D=51046
Teffer, Peter, ’Nederland van Boven is de ijsbreker voor de datajournalistiek’ De Nieuwe
Reporter (23-12-2011) http://www.denieuwereporter.nl/2011/12/nederland-van-boven-is-de-
ijsbreker-voor-de-datajournalistiek/.
Thibodeaux, Troy, ‘5 tips for getting started in data journalism’ Poynter (06-10-2011)
http://www.poynter.org/how-tos/digital-strategies/147734/5-tips-for-getting-started-in-data-
journalism/.
Tokmetzis, Dimitri, ‘Doe mee aan de Hackathon Verkiezingen 2012’ Sargasso (25-06-2012)
http://Sargasso.nl/archief/2012/06/25/doe-mee-met-de-hackathon-verkiezingen-2012/.
Vellenga, Anke, ‘Datajournalistiek en visualisatie nieuwe uitdaging voor informatiespecialisten’
Vereniging van Pers- en Omroepdocumentalisten (09-01-2012)
http://www.vpod.nl/datajournalistiek-en-visualisatie-nieuwe-uitdaging-voor-
informatiespecialisten/.
Vereijken, Paul, 'Hoe begin je met datajournalistiek?' Spotlight Effect (05-07-2011)
www.spotlighteffect.nl/journalistiek/hoe-begin-je-met-datajournalistiek.
Vermanen, Jerry. ‘Nederland heeft een data-primeur nodig’ De Nieuwe Reporter (27-04-2012)
http://www.denieuwereporter.nl/2012/04/nederland-heeft-een-data-primeur-nodig/.
Vermanen, Jerry, ‘Vier lessen voor beginnende datajournalisten’ De Nieuwe Reporter (29-02-
2012)
http://www.denieuwereporter.nl/2012/02/vier-lessen-voor-beginnend-datajournalisten/.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
88
Vermanen, Jerry, ‘Wat is er aan datajournalistiek in Nederland?’ De Nieuwe Reporter (25-04-
2012)
http://www.denieuwereporter.nl/2012/04/wat-is-er-aan-datajournalistiek-in-nederland/.
Vermanen e.a., Jerry, 'Voorstelrondje: wie zitten er achter RegioHack?' RegioHack (13-09-2011)
www.regiohacknl/regiohack-blog/voorstelrondje-wie-zitten-er-achter-regiohack.
Vermanen, Jerry, 'RegioHack, the day after' RegioHack (12-11-2011)
www.regiohack.nl/regiohack-
blog/regiohack-the-day-after/.
Vermanen, Jerry ‘@JerryVermanen’ Twitter (11-12-2012)
https://twitter.com/jerryvermanen/status/278417298530918400
Vrieling, Dorien, ‘Sargasso Verlicht’, Stimuleringsfonds voor de Pers (2011)
http://www.persinnovatie.nl/3312/nl/Sargasso-verlicht.
Wismans, Laura, ‘De journalistiek redden? Data!’ De Nieuwe Reporter (27-04-2012)
http://www.denieuwereporter.nl/2012/04/de-journalistiek-redden-data/.
‘Datajournalistiek is hot’, Vereniging van Onderzoeksjournalisten (08-12-2011)
http://www.vvoj.nl/cms/2011/12/08/datajournalistiek-is-hot/.
‘Investigate your MP’s expenses’, The Guardian http://mps-expenses.guardian.co.uk.
‘Money & speed: Inside the black box’ Tegenlicht (31-01-2011)
http://tegenlicht.vpro.nl/afleveringen/2010-2011/the-future-of-finance/money-and-
speed.html.
‘MP’s expenses in the news’ http://bit.ly/PTk5Q8.
‘RTL Nieuws Facts’ Stimuleringsfonds voor de Pers http://www.persinnovatie.nl/3309/nl/rtl-
nieuws-
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
89
facts
‘Top Secret America’ The Washington Post (18-07-2010)
http://projects.washingtonpost.com/top-secret-
america/.
Monografieën
Aitamurto, Tanja, Esa Sirkkunen en Pauliina Lehtonen, Trends In Data Journalism (08-09-
2011) 11
http://virtual.vtt.fi/virtual/nextmedia/Deliverables-
2011/D3.2.1.2.B_Hyperlocal_Trends_In%20Data_Journalism.pdf
Deuze, Mark, Wat is journalistiek? (Amsterdam 2004)
Eijk, Dick van, ‘Een atlas van Nederlandse gemeenten. 2049 Buurten vergeleken’ (Rotterdam
1998).
Eijk, Dick van en Henk van Ess, Lesmateriaal voor Computer Assisted Reporting (Amsterdam
2003).
Kovach, Bill en Tom Rosenstiel, The elements of journalism. What newspeople should know
and the public should expect (New York 2001).
Lorenz, Mirko, ‘Status and Outlook for data-driven journalism’ in: Data-driven journalism:
What is there to learn? A paper on the data-driven journalism roundtable held in Amsterdam
on 24 August 2010. (2010)
http://mediapusher.eu/datadrivenjournalism/pdf/ddj_paper_final.pdf.
Meyer, Philip, Precision journalism. A Reporter’s Introduction to Social Science Methods – 4th
edition (Lanham, Boulder, New York en Oxford 2002).
Rogers, Simon, Facts are sacred - The power of data (2011). [E-book, verkrijgbaar via Amazon.]
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
90
Shoemaker Pamela J. en Stephen D. Reese, Mediating the message (New York 1996).
Bundels
Eimers ed., Ditty, Onderzoeksjournalistiek 2012 (Utrecht en Zellik 2012).
Hart, Harm ’t, Hennie Boeije en Joop Cox (ed.), Onderzoeksmethoden (Den Haag 2009).
Kussendrager ed., Nico, Onderzoeksjournalistiek (Groningen 2007).
Vasterman ed., Peter en Peter Verwey, Computer Assisted Research and Reporting (Utrecht
1994).
Presentaties
Bradshaw, Paul, ‘Data journalism’ (22-02-2011) slide 23/48
http://www.slideshare.net/onlinejournalist/data-journalism-city-online-journalism-wk8
Lorenz, Mirko, 'Data-driven journalism. What is there to learn?' IJ-7 Innovation-Journalism
Conference (Stanford 7-9 juni 2010) www.slideshare.net/mirkolorenz/datadriven-journalism-
what-is-there-to- learn
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
91
Topiclijst interviews
Thema I: De workflow
● Doel: in kaart brengen uit welke stappen de totstandkoming van een datajournalistiek
item bestaat en waarin de verschillende media verschillen.
● Relevantie: voor beginnende datajournalisten is het lastig een aanpak te ontwikkelen. Zij
kunnen wat opsteken van de verschillende werkwijzen van andere media. Daarnaast is
het interessant om te onderzoeken in hoeverre media die zich primair op verschillende
verschijningsvormen richten van aanpak verschillen. Zijn we echt in het multimediale
tijdperk aanbeland?
● Initiële vraag: in welke stappen zou u de totstandkoming van een datajournalistiek item
opdelen?
● Aspecten:
○ Hoe/waarom is die aanpak ontstaan?
○ Wat zijn de voor- en nadelen van die aanpak?
○ Wat wordt nu anders aangepakt dan tijdens eerdere projecten?
○ Welke opties zijn er per stap?
Bijv. bij het verkrijgen van data: scrapen, WOB’en, samenwerken enz.
○ Aan de hand van welke criteria wordt een keuze gemaakt?
○ Hoeveel tijd neemt elke stap in? (Is het antwoord: ‘Dat varieert’, dan vragen naar top 3-
casussen.)
○ Wat gebeurt er na publicatie? Updates? Aanvullingen? Correcties?
○ Voor krant en tv first: wat wordt online gepubliceerd en wat komt in krant/op tv?
○ Wat zou u wel graag toevoegen aan uw werkwijze maar is op dit moment nog niet
mogelijk?
Thema II: De doelstelling
● Doel: in kaart brengen welke invloed de doelstelling van een datajournalist of het
datajournalistieke team heeft op de items die worden geproduceerd.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
92
● Relevantie: het uiteindelijke doel kan zijn om zo snel mogelijk data te publiceren bij
actueel nieuws. Het kan ook zijn om iets te onthullen wat nog niet openbaar was. Of:
lezers de mogelijkheid geven om zelf informatie te vinden. Elke optie vergt een heel
andere aanpak.
● Initiële vraag: welk doel hebben jullie voor ogen wanneer jullie bezig zijn met
datajournalistiek?
● Aspecten:
○ Welke gevolgen heeft dat voor de werkwijze?
○ Wat denken jullie dat jullie doelgroep graag wil zien?
○ Is de doelstelling ook bijgesteld sinds de eerste datajournalistieke projecten?
○ Waardoor is jullie doelstelling beinvloed?
(Bijvoorbeeld: ‘commercieel interessant volgens directie’ of ‘past bij onze missie
als nieuwsorganisatie, namelijk..’)
Thema III: Onderwerpen
● Doel: in kaart brengen wat het het uitgangspunt vormt voor datajournalistieke verhalen.
Een vraag? Een dataset? Een artikel van een collega? Een beat?
● Relevantie: wie uitgaat van een bepaalde bron, wordt daardoor beinvloedt. De bron is
dan leidend. Dit levert een ander verhaal op dan wanneer je uitgaat van een specifieke
vraag. Wanneer de datajournalistiek een soort aanvulling is op een groter verhaal, heeft
dit ook gevolgen.
● Initiële vraag: hoe komen jullie aan jullie onderwerpen?
● Aspecten:
○ Houden jullie bepaalde beats in de gaten?
Zo ja: welke en waarom juist die?
○ Houden jullie bepaalde websites in de gaten die data releasen?
Zo ja: welke en waarom juist die?
○ Welke aspecten maken een onderwerp interessant voor jullie?
○ Wat voor onderwerpen zou u wel willen behandelen maar passen niet bij uw
organisatie?
Thema IV: De medewerkers
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
93
● Doel: te weten komen wat de professionele achtergrond van de datajournalisten is.
● Relevantie: de manier waarop een journalist te werk gaat beinvloedt zijn items. Net zoals
zijn werkomgeving of zijn eerdere werkervaring zijn werkwijze kan beinvloeden. Hebben
ze een journalistieke achtergrond of zijn het van origine designers? Zijn ze jong met
frisse ideeen of ouder met veel ervaring?
Daarnaast is de werkverdeling binnen het team van belang. Bij een grote redactie (zoals
NOS, RTL, Volkskrant of NRC) kunnen de taken meer verdeelt worden. Bij Nu is maar
een datajournalist. Sargasso organiseerde hackathons. Dit heeft ongetwijfeld gevolgen
voor de totstandkoming van de verhalen, maar welke precies?
● Initiële vraag: wat is uw achtergrond als journalist?
● Aspecten:
○ Wat is zijn/hun eerdere werkervaring?
○ Wanneer in aanraking gekomen met datajournalistiek?
○ Wie werkt er mee aan de projecten?
■ Vanaf welk stadium?
■ Op welk onderdeel?
■ Waarom juist zo?
■ ‘Afgekeken’ van andere nieuwsorganisatie?
■ Is dit optimaal volgens iedereen?
○ Wat is zijn/hun specialiteit? (Programmeren, vormgeving, klassieke
onderzoeksjournalistiek)
○ Waar ligt zijn/hun interesse?
Thema V: De organisatie
● Doel: in kaart brengen in wat voor omgeving de datajournalistieke items gemaakt
worden.
● Relevantie: de werkwijze van een nieuwsorganisatie, ook van de niet-datajournalistieke
afdelingen, kan direct of indirect invloed hebben op de datajournalistieke producties. Als
de hele organisatie bijvoorbeeld gewend is aan hele korte deadlines is het moeilijker voor
een datajournalist om meer tijd vrij te krijgen voor een project, “want zo werken wij hier
niet”.
● Initiële vraag: hoe zou u werkwijze van de rest van uw organisatie omschrijven?
● Aspecten:
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
94
○ Wat is de routine voor niet-datajournalistieke items?
○ Hoe is het contact tussen de datajournalisten en niet-datajournalisten?
Professioneel: wordt er samen vergaderd?
○ Komen niet-datajournalisten met ideeen of verzoeken?
○ Werken datajournalisten in dezelfde ruimte?
○ Is de omgeving positief over datajournalistiek?
○ Hoeveel budget en mankracht heeft de organisatie vrijgemaakt voor
datajournalistiek?
(Wanneer het antwoord is: ‘dat kan ik niet zeggen’, vragen met welke redactie
het budget van datajournalistiek te vergelijken is.)
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
95
Transcripties
Dimitri Tokmetzis (Sargasso)
Welk doel hebben jullie voor ogen als jullie bezig zijn met datajournalistiek?
“Een wat minder praktisch doel, maar mijn langetermijndoel is dat we een kwaliteits online
medium zijn. Een kwaliteitsblog zeg ik maar. Dat we ons op onderzoeksjournalistiek gaan
richten en dat ook met moderne middelen gaan doen. Wat we eigenlijk deze twee jaar doen en
waar we subsidie voor hebben gekregen is eigenlijk een groot experiment waarbij we op een
vernieuwende manier proberen goede verhalen te maken uiteindelijk en datajournalistiek is
daar één van. WOB-journalistiek is daar ook een van en die twee gaan heel goed samen. En een
derde is crowdsourcing, waar we vrij actief mee bezig zijn. Die drie vallen vaak toch wel samen
in grote projecten. En wat mijn persoonlijke doel daarbij is, is dat ik uiteindelijk gewoon wil dat..
ik vind onderzoeksjournalistiek heel belangrijk en ik wil dat dat blijft bestaan en ik vind dat
online media daar ook een rol in moeten hebben. Dat is ook een reden dat we samenwerken met
andere media, om het gewoon betaalbaar te houden voor iedereen. Dus we delen de kosten vaak.
Op die manier hebben we leuke content online, gratis voor mensen om te hebben, plus we
kunnen onderwerpen agenderen die wij belangrijk vinden. Dus eigenlijk een alternatief
medium, die wel goede content biedt. En datajournalistiek is daar een instrument in. Neemt niet
weg dat wij ook wel zien dat op de kortere termijn datajournalistiek wel potentie heeft in
Nederland, dat er veel vraag naar is en dat dit voor ons een belangrijke bron van financiering is.
Iets waar wij nog groot in kunnen worden en we worden het liefst marktleider in Nederland.”
Maar het is dus vooral een middel, niet een doel an sich?
“Datajournalistiek is geen aparte vorm van journalistiek. Basale datajournalistiek zou iedere
journalist moeten kunnen. Een Excel-sheet lezen of getallen lezen.”
Welke gevolgen heeft die doelstelling voor jullie werkwijze?
“We proberen onderwerpen anders te benaderen, het is eigenlijk hoe ik altijd wel heb gewerkt.
Ik begin gewoon met een hele brede vraag en kijk dan welke data daarbij te vinden zijn.
Proberen toch op andere verhalen te komen dan andere media doen. Zoals nu bijvoorbeeld met
die politieke data. Gaan we een hackathon organiseren. Een van de manieren die we hier
proberen is achtergrond bieden. We zullen er ook wel nieuws uithalen hoor. We hebben data die
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
96
teruggaat tot 1971. Wat we willen is de long view nemen, in de electorale ontwikkelingen
bijvoorbeeld. Hoe is men anders gaan stemmen in Nederland. Dat zijn dingen die je juist goed
met datajournalistiek kunt doen. We hebben al die data, we hebben alle enquêtes – er worden
Nationale Kiesonderzoeken gehouden, voor en na alle verkiezingen, tot 1971 gaat dat terug – dat
is allemaal gecodeerde data. Dan moet je dus ook datajournalistieke middelen gebruiken om
inzichtelijk te maken wat daar in zit en kijken, wat voor ontwikkelingen zitten daar nou in. En ik
denk dat je dat met traditionele journalistiek niet goed kan doen. Of je moet iemand zo gek
hebben dat hij dat allemaal handmatig gaat doornemen. Maar je hebt het hier over miljoenen
records, dus dat lukt gewoon niet. Dus dat moet je slimmer oplossen. Dat hebben we ook gedaan
met die crisis, met de hackathon, over waar vallen nu de klappen van de crisis. Een
datajournalistieke benadering dwingt je om data te zoeken die nog niet wordt gebruikt. En een
van de dingen die wij vonden is dat het UWV gewoon maandelijks werkloosheidscijfers per
postcode bijhoudt. Die cijfers worden nauwelijks tot niet door andere media gebruikt, terwijl je
daar wel heel interessant nieuws uit kan halen.”
“Op die manier proberen we dus echt een ander soort verhalen te maken.” “Maar daar moet ik
bij zeggen, de verhalen die je maakt, daar is datajournalistiek gewoon stap één in. Wel een hele
moeilijke stap, maar wat we daarna doen is altijd gewoon is nabellen, in context plaatsen, het
normale journalistieke werk om er een verhaal van te maken. Dus je uiteindelijk toch bezig om
een verhaal te vertellen. Een grafiek alleen er op kwakken is eigenlijk niet genoeg, zelden
genoeg. Kan wel, als de cijfers echt voor zich spreken, maar er moet altijd context bij en duiding,
als het even kan.”
Aan de ene kant zeg je dus dat jullie achtergronden willen bieden, maar door jullie
samenwerking met het ANP zijn jullie ook gedwongen om hard nieuws af te leveren. Hoe werk
dat in de praktijk?
“Ja, we hebben eigenlijk verschillende tempo's waarin we werken. Eerste is echt het hele korte
nieuws. We hebben met ANP afgesproken dat we in principe dagelijks nieuwtje afleveren, een
cijfernieuwtje. Wij hoeven het niet helemaal zelf na te bellen, maar wij leveren het
basismateriaal aan en een redacteur van hun gaat er vervolgens mee aan de slag, dat is heel goed
te doen. Dat is gewoon klein nieuws, maar die kleine nieuwtjes doen het hartstikke goed merken
we, die worden echt goed opgepikt en komen overal weer terug.”
Waar hebben we het dan bijvoorbeeld over?
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
97
“Wat we gisteren hadden bijvoorbeeld, over treinen die rode seinen negeren, daar is onderzoek
naar geweest, helemaal weggestopt in een rapportje. Dat rapportje heette ook STS Passages
2011, geen hond die dat leest natuurlijk, behalve ik dan. Daar bleek gewoon nieuws in te zetten:
dat het aantal treinen dat door rood rijdt enorm is gedaald. Ik haal die data eruit, zet het even
netjes op een rij, maak een basale analyse, dat gaat dan vervolgens naar ANP, die zet er een
journalist op, die gaat dan rondbellen en je hebt in nieuws, in vrij korte tijd. Is dat
datajournalistiek? Ik denk het niet, maar wij zitten inmiddels zo goed in die datastroom. En ik
vind het wel een prettige manier van werken, want ik ben eigenlijk de hele dag bezig met allerlei
databronnen en dit is gewoon een klein verhaaltje, maar laatst kwam ik ene rapport tegen over
krimpgebieden in Nederland, daar zijn nieuwe bevolkingprogNOSes gemaakt, dat kun je
opschalen naar veel grotere verhalen. Dus daar maken we op dit moment een groter verhaal van.
Dus voor het ANP maken we iedere dag een klein verhaaltje, hup data, resultaat willen ze zien en
wij ook. En één keer in de week probeer je een wat groter verhaal te maken, met wat meer body.
Ofwel bijzondere data die nog niemand heeft, die we hebben gewobt soms of via ministeries
heeft gekregen of via anderen, via niet-zomaar openbaar gemaakte stukken. Ehm, dat proberen
we een keer per week te doen. Dat halen we wel redelijk. Daarnaast hebben we echt de grote
projecten die hackathons bijvoorbeeld, waar we echt de diepte in willen gaan en daar een hele
serie verhalen uit willen krijgen. Dus eigenlijk drie niveaus heb je. Lekker snel, wat meer
achtergrondverhalen en de echt diepgaande stukken.”
Maak je verhalen die de lezers graag willen of heb je andere drijfveren?
“Met de korte verhaaltjes dat is toch wel veel producties draaien. Het voordeel is meer voor mij
dan voor de lezers. Soms halen we er echt nieuws uit, soms zijn het stukjes waarvan je denkt:
“Mwoh, is de wereld door dit stuk nu een betere plek door geworden, ik denk het niet”. Is ook
niet erg, maar waar heel veel kranten gewoon behoefte aan hebben is eigen nieuws. Wij zijn wel
zo oplettend dat we dat soort dingen oppakken. Of dat we bij een gijzeling gaan kijken: wat staat
er in CBS Statline, hoeveel gijzelingen zijn er jaarlijks eigenlijk? Een beetje
achtergrondinformatie. Dus ja, dat is vooral de functie. Bij de grote producties probeer je echt
wel een leuk verhaal te vertellen, ben je veel meer verhalend bezig of probeer je echt iets naar
boven te halen. Die grote projecten zijn echt wat meer, ideologisch gericht wil ik niet zeggen,
maar dat zijn wel onderwerpen waarvan wij denken dat er meer aandacht voor moet zijn. Met
name politiek bijvoorbeeld: er ligt zoveel politieke data die niet worden gebruikt, maar die wel
veel meer zeggen over hoe het er aan toe gaat in de politiek. Een paar maanden geleden hadden
we bijvoorbeeld Twittergedrag, de key-players op het Binnenhof geanalyseerd, een sociale
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
98
netwerkanalyse. Wat je daar uitkrijgt vond ik toch wel interessant: er kwamen bijvoorbeeld een
aantal PR-mensen uit, die kwamen vrij hoog in dat netwerk eruit, die je anders gewoon niet
opmerkt. En, dit was dan het eerste verhaal, een probeerseltje, maar dat algoritme wat erachter
zit is gewoon lekker aan het doorsnorren en die database is al lekker aan het vollopen. Dus je
krijgt een steeds beter beeld van wie er nou in dat mediaspel op het Binnenhof belangrijk zijn en
wie niet. En er komen altijd namen bovendrijven die je anders niet had gezien. Die normaal in
de luwte blijven, maar door die sociale netwerkanalyses toch komen bovendrijven. Een van de
dingen die wij bijvoorbeeld zien is dat iedereen op het Binnenhof bijvoorbeeld totaal
geobsedeerd is door Pauw & Witteman. Toch leuk als je dat kan duidelijk maken. Begin je
discussie te voeren, is dat nu de bedoeling van het Binnenhof: dat je met je kop op Pauw &
Witteman komt? Zo werkt het natuurlijk wel en dat weet iedereen, maar het is wel goed om af en
toe te laten zien ook.”
Zo'n onderwerp als bijvoorbeeld over die treinen, hoe komt dat op jouw pad?
Er zijn gewoon een aantal sites, waar continu alle rapporten van de overheid worden geupload.
Rijksoverheid.nl, kun je gewoon kiezen wat je wil: wil je alle persberichten zien, of alle rapporten
of alle jaarverslagen. Wat we vaak doen, is 's ochtends even rondje langs het CBS. Niet om te
kijken naar de persberichten, maar welke tabellen zijn er geüpdate. Daar zitten vaak nieuwe
cijfers is, dus dat kan nieuws aanleveren en dat is waar veel journalisten niet in kijken.
En hoe kies je wat interessant is?
Ik bekijk altijd eerst de rapporten met de meest saaie naam. Je moet altijd de rapporten met de
meest saaie naam bekijken, daar zitten vaak interessante dingen in. Waar komt het vandaan, is
ook belangrijk.
Je leest eerst even de inleiding en samenvatting door, bekijkt even de methodologie: hoe zijn
die cijfers tot stand gekomen. Vervolgens scroll ik vrijwel meteen door naar de tabellen. De
cijfers moeten het verhaal al vertellen.
Maar dat zijn waarschijnlijk vaak PDF'jes.
Als het heel veel cijfers zijn neem ik weleens contact op om te vragen of er ook Excel-files zijn,
maar die zijn er vrijwel nooit. Je hebt wel programma's die PDF'jes omzetten naar Excel. Werkt
niet altijd even goed, dus je moet handmatig wat bijwerken.
Maar doe je dat allemaal al direct of kun je ook van papier lezen of er iets interessants in zit?
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
99
Nou, je voelt vaak zelf al vrij snel aan – ook omdat je de samenvatting hebt gelezen en de
conclusie kent.. Op een gegeven leer je die cijfers dan wat sneller interpreteren. Je voelt het
meestal al snel aan. Wat ik wel vaak doe, met CBS-cijfers bijvoorbeeld, is even snel een grafiekje
maken. Zodat je in ieder geval een trend ziet. Kun je daarna verder gaan zoeken, wat gaan
schuiven, data toevoegen. Ik maak al heel snel een schifting: dit wel, dit niet.
Is het voor een artikel al voldoende als je alleen de interessante dingen uit een rapport
opschrijft of heb je een verplichting dat je er altijd een grafiekje bij doet.
Nou, het ANP neemt geen grafieken af. Dat deden we eerst wel, maar klanten hoeven het
gewoon niet, nemen het niet over, dus dan is het een beetje zonde van je tijd. Voor Sargasso
plaats ik niet alle stukken, maar meestal wel en daar doe ik meestal wel een grafiek bij, omdat ik
hem toch al heb gemaakt.
Heb je ook bepaalde beats, bepaalde onderwerpen die je in de gaten houdt?
Ehm, ik zit uit persoonlijke interesse veel op privacy-onderwerpen, maar daar is niet zoveel data
over.
Wat bedoel je precies met privacy?
Vooral in relatie met technologie. Datapreventie enzo. Privacy is een onderwerp dat het goed
doet bij ons, we hebben nu bijvoorbeeld een project waar we allen toezichtcamera's in
Nederland in kaart brengen. Dat is een voorbeeld van zo'n groot project dat we doen, met heel
veel vrijwilligers. Kijk dan, als je met veel vrijwilligers werkt, moet je gewoon een onderwerp
hebben dat ze aanspreekt. Politiek doet het altijd goed. Economie. Armoede, gelijkheid. Privacy.
Daar moet je echt wel rekening mee houden. Die kun je niet inzetten voor klusjes over eh,
bepaalde activiteiten, maar als het ze echt raakt vinden ze het wel leuk om mee te werken.
Ik probeer verder voor de korte dagelijkse verhaaltjes wel verhalen te maken die echt ergens
over gaan, dat mensen raakt of veel mensen aangaat. Dat het voor een hoop mensen interessant
is.
En wat is dan jouw definitie van wat mensen raakt? Emotioneel?
Nou, als het gaat over [treinen die] door een rood sein rijden; heel veel mensen rijden met de
trein. Die willen wel weten hoeveel treinen er nu door rood rijden, bijvoorbeeld. Maar niet
emotioneel, het zijn toch cijfers, die zijn emotioneel wat afstandelijk.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
100
Wat we wel veel hebben gedaan is migratie. Enerzijds omdat er zoveel onzin over wordt
gezegd, anderzijds ook toeval want een van onze vrijwilligers zit daar heel goed in. Dus die
levert altijd hele goede data. Maar we vonden het ook een belangrijk onderwerp. Daar hebben
we ook wel een paar keer echt hard nieuws uit gehaald. Kamervragen mee weten te krijgen.
Bleek bijvoorbeeld dat de IND gebruik maakte van verkeerde cijfers.
Zijn er ook nog onderwerpen die je wel wilt behandelen, maar het nu niet verkocht krijgt aan
lezers of aan het ANP of het gaat om een of andere manier niet?
Nou, het is meer tijdgebrek. Die grote onderwerpen zijn gewoon leuk om te doen, die grote
dingen. Maar het kost ook allemaal heel veel tijd. Ik ben bijvoorbeeld met een aantal NGO's in
gesprek om over de Europese Lobby een hackathon te organiseren. Om die lobby in Europa in
kaart te brengen. Maar dat kost gewoon veel tijd.
Zijn er dingen waarvan je denkt dat ze wel gecheckt kunnen worden, maar..
Ach, zoveel. Dat is een van de redenen dat ik met een programmeur wil gaan werken. Kijk, wij
werken redelijk low-tech. In die zin, dat wij geen flitsende visualisaties hebben, werken veel met
Excel, Google Refine, Fusion Tables en daar doen we het eigenlijk wel mee. Ehm, we zijn veel
meer gefocust op het nieuws en op het verhaal zelf. Mijn mening is dat heel veel visualisaties
eigenlijk weinig toegevoegde waarde hebben. Vaak zijn het zoekplaatjes, ook de interactieve
dingen – mensen gebruiken het gewoon niet. Ze willen gewoon weten: wat staat daar nou in. Ik
ben zelf ook zo'n luie lezer, ik ga echt niet alles lopen aanklikken. Heb ik gewoon geen zin in, of
het moet me persoonlijk aangaan. Ehm, nu ben ik een beetje afgedwaald.
Ohja, ik zou veel meer databases willen koppelen. Een van de dingen die bij de hackathon naar
boven kwamen is.. Een van de dingen die ze hebben gedaan, ze hebben de financiële posities van
scholen bekeken. Wat zijn de reserves, afgezet tegen het leerlingenaantal en tegen het soort
bestuur – is het katholiek of protestants. En daar kwamen echt inzichten uit naar voren die je er
anders gewoon niet uithaalt. Maar dan heb je wel een goede programmeur nodig die dat even
voor je kan doen. Dat lukt ons met Excel nog niet. Dat soort dingen zou ik wel meer willen
aanpakken. Van die echt grote databases en dan geautomatiseerd naar verbanden gaan zoeken.
Nu is het toch vaak meer journalistiek gedreven, handmatig, op je guts kijken: waar kan nog wat
zitten. Ik heb het idee dat we nogal wat over het oog zien.
Een van de dingen die ze [de deelnemers aan de hackathon] ontdekten was dat er op Vlieland
meer leerlingen ingeschreven stonden dan er kinderen van die leeftijd zijn. Dus daar is iets geks
aan de hand.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
101
Daar krijgt een school meer geld dan hij recht op heeft?
Ja, dat is daar aan de hand. Dat is de meerwaarde van datajournalistiek. Dat is voor mij het
echte werk. Zo zijn er veel meer dingen. Er is nog zoveel data beschikbaar. Je kunt er dingen in
vinden, en dat vinden is gewoon deels geprogrammeerd. En programmeurs zijn duur, die kosten
zo 80 euro per uur. En journalisten zijn gewoon goedkoper. Daar komen we gewoon nog
onvoldoende aan toe. We hebben nu eindelijk een beetje een workflow, dat het allemaal een
beetje loopt enzo, dus de volgende stap is om dat soort klussen te gaan doen. En zelf veel
informatie binnen te slepen. Veel meer gaan scrapen. Er is zoveel informatie beschikbaar die
niet actief worden vrijgegeven, maar waar wel heel veel interessante dingen in staan.
Is dat ook over allerlei verschillende onderwerpen?
Jaja, we hebben de hele database van het College Bescherming Persoonsgegevens bijvoorbeeld.
We komen er gewoon niet aan toe om daar analyses op los te laten. Maar die moeten we
eigenlijk eens gaan koppelen aan het KvK-register. Zodat je dus kan zien van hoeveel in dat
register van het CBP staat of ze persoonsgegevens verwerken. Mooi zou zijn als je daarin kan
zien welke bedrijven daar nu niet in staan, die wel persoonsgegevens verwerken. Ik ben er wel
eentje tegengekomen die dat niet doet bijvoorbeeld, maar dat zou je eigenlijk geautomatiseerd
moeten doen. Je zou ook verbanden kunnen zoeken, van welke clusters van bedrijven hebben
bewaren nou welke informatie. Het is nog beter als je data kunt combineren. Stel: ik geef mijn
data aan bedrijf X of instantie, waar gaat het dan naartoe? Of waar kunnen mijn gegevens dan
naartoe gaan? Waar komt het dan terecht? Daar kun je natuurlijk hele leuke dingen mee doen.
Maar ja, geen tijd.
Slotvraag over onderwerpen: onderwerpen als armoede en politiek komen veel naar voren. Je
zei al: armoede is ook gewoon omdat er veel cijfers over zijn. Is er nog een andere reden
waarom die onderwerpen veel aan bod komen?
Ja, dat past een beetje bij ons blog. We zijn een beetje links, schijnt. Ikzelf niet overigens, ik ben
a-politiek. Maar ik vind dat wel een belangrijk onderwerp, zeker in deze tijd van crisis. Ik vind
dat je, dat we daar nog veel te weinig over schrijven.
Armoede of politiek?
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
102
Armoede. Ehm, dus ja, ik vind het wel een belangrijk onderwerp en als je dan wat met cijfers
kunt doen, graag. Ik vind het belangrijk dat mensen wel inzicht hebben in hoe het met mensen
gaat. We doen het nog onvoldoende, dat zeg ik er meteen bij.
Politiek: Nederlanders vinden politiek interessant en er is veel data over beschikbaar. Weet je,
het is in deze situatie nog een beetje het Wilde Westen. Er is heel veel data beschikbaar en we
zijn nu gewoon aan het kijken, wat kun je ermee, gewoon proberen. Zo werkt het vaak.
Maar er zijn nog meer onderwerpen waar ik graag mee bezig zou willen. De Europese Unie
bijvoorbeeld. Ook een belangrijk onderwerp. Trek je alleen niet zoveel lezers mee. Ik weet nu al
dat ik dat verhaal moeilijk kan slijten.
Dat is zonde, he?
Ja, wordt vaak als een ver-van-mijn-bed-show gezien, terwijl het dat absoluut niet is. Je merkt
wel dat er nu meer interesse voor is. Maar daar is gewoon heel veel te halen en daar is
ongelovelijk veel data over. Over subsidies, structuurfondsen, dat soort dingen. Dat is allemaal
gedocumenteerd. Alle begrotingen. Zijn wel honderd verhalen te halen.
Workflow: In welke stappen zou je de totstandkoming van een datajournalistiek project van
jullie beschrijven?
Je hebt vier basisstappen, die zijn bekend. Vinden, verwerken, opschonen, analyseren en
visualiseren. Dat blijft gewoon. Daar zit je aan vast. Hoe dat precies gaat, dat ligt aan het
onderwerp. Of je er nieuws uit wilt halen of achtergrond. Kijk, visualiseren doen wij weinig, dat
is echt een vak apart. En ik denk dus dat visualisaties weinig toevoegen, op dit moment nog,
komt wel. Ik zeg vaak: de beste visualisaties vind ik de simpelste. Dat je gewoon in een klap ziet
wat er aan de hand is. Ik hou zelf wel van treemaps.
Treemaps?
Van die blokken. Dat je bijvoorbeeld ziet: m’n begroting is dit, dit is ontwikkelingshulp, dat je
een beetje de verhoudingen ziet. Dat soort dingen, daar hou ik wel van. Dat vertelt gewoon een
verhaal. Maar van die zoekplaatjes, mwoh. Als iemand goed kan visualiseren: mooi hoor,
prachtig, graag. Maarrem, ja het ligt er wel aan of het nieuws is of niet of meer achtergrond. Ik
bedoel, als je echt op zoek bent naar hard nieuws moeten de data echt kloppen. En we komen
vaak tegen dat de data niet kloppen. Omdat er toch fouten in zitten, zelfs in het CBS. Ik heb CBS
ook weleens moeten bellen, van: ‘Kijk hier nog eens naar, volgens mij klopt het niet helemaal’.
Omdat er gewoon rare dingen uit komen.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
103
Als je het gewoon per stap bekijkt, allereerst bijvoorbeeld ‘vinden’: welke opties heb je dan voor
jezelf?
De vraag is of je het jezelf makkelijk of moeilijk maakt. Makkelijkste is data gebruiken die er al
zijn. Die makkelijk te vinden zijn, het CBS bijvoorbeeld of Eurostat. Waarvan je weet dat ze
tamelijk correct zijn. Betrouwbaarheid is een groot probleem. Ik doe dit nu ruim een jaar en ik
moet zeggen: ik vertrouw geen enkele cijfers meer. We vinden altijd fouten in cijfers. Rapporten
enzo moet je altijd wantrouwen, want de cijfers kloppen vaak gewoon niet. Er zijn heel veel
bronnen: uit rapporten kun je data halen, open data, de overheid zet ook steeds meer open data
centraal neer. Je moet gewoon een beetje in de gaten houden. Af en toe krijg je iets opgestuurd
van iemand.
Het leukste is, maar ook het meest bewerkelijke, je eigen datasets maken. Bijvoorbeeld wat wij
hebben gedaan: alle gemeenten WOB’en om hun cameraposities. Dat is vreselijk veel werk, maar
dat levert wel heel veel op. Als je het goed doet levert het een heel mooi verhaal op, maar het is
wel gewoon heel veel werk. Dat is leuk: zelf turven en tellen en op die manier aan je data komen.
Wat we in het begin deden met het ANP is gewoon onderwerpen verzinnen en dan gingen we
vervolgens kijken of de data er ook zijn. Daar zijn we vrij snel van teruggekomen. Meer dan de
helft van de verhalen kregen we gewoon niet rond, omdat de data er niet bleken te zijn. Of te
moeizaam of teveel werk om te krijgen of te duur. Dus wat ik wel steeds meer ben gaan doen is
echt kijken: welke data zijn er eigenlijk. En dan kijken welk onderwerp, welke journalistieke
vragen ik daarop los kan laten. Dat scheelt gewoon écht heel veel werk. Dat zou mijn advies zijn
aan iedereen die ermee begint: werk vanuit de data, niet alleen vraaggericht. Vraaggericht kan
en dat levert soms hele mooie verhalen op, maar dat levert ook heel veel teleurstellingen op.
Bas Broekhuizen die zei juist: begin eerst met de vraag.
Vragen zijn heel belangrijk, natuurlijk. Je moet altijd vragen stellen. Soms is het ook allebei een
beetje. Maar je moet wel weten dat de data er zijn.
Anders ben je gewoon voor niks bezig.
Ja. We hebben heel veel tijd eraan verspild, aan alle onderwerpen waar we niet genoeg data voor
konden vinden. Of dat de data maar tot 2009 lopen ofzo en journalistiek niet meer zo
interessant zijn. Dat ze onvolledig waren. Dat we vaak wel iets vinden, maar het is te weinig
vaak. Niet betrouwbaar genoeg, zijn we ook vaak tegenaan gelopen. Dat je het dan toch maar
niet doet. Op die manier moesten we heel veel verhalen afleggen en dat is gewoon zonde van je
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
104
tijd. Als je er in komt, ik zit nu een soort dataflow, overal zie ik data en dat je daar ook wel
verhalen in ziet en bij bedenkt.
Zou je daar iets meer over kunnen vertellen? Dat is juist wat interessant is voor mensen
Dat hoor ik ook wel van collega’s, dat die er allemaal mee worstelen: ‘Hoe kom je aan je
verhalen?’ Ik vind het niet zo moeilijk. Het punt is: veel datajournalisten zijn geen journalisten,
op dit moment. Zo’n Jelle Kamsma is geen journalist en Jerry is eigenlijk..
Die komt van De Stentor toch?
Ja, maar hij heeft geen klassieke verslaggeversrol gehad. Je moet gewoon journalistiek kijken
naar data.
Gewoon wie, wat, waar, wanneer, waarom?
Ja dat, maar ook.. Op een gegeven moment, als je een paar jaar in de journalistiek werkt, dan
ontwikkel je een gut feeling voor wat nieuws is en wat niet. Menig journalist kan dat beamen,
dat kun je ook niet meer uitzetten. Op ieder feestje, met wie je ook praat, dan denk je meteen:
‘Zit hier een verhaal in?’ Zo is het ook met data: ‘Zit hier in een verhaal in?’ En ja, gewoon zelf de
koppeling leggen met de actualiteit of met de achtergrond. Of je eigen algemene ontwikkeling
daar op loslaten. Want als je veel weet van een onderwerp dan kun je meteen zien aan data:
‘Hier kan nieuws in zitten’. Net zoals je dat in normale journalistiek hebt als je een rapport ziet.
‘Dat komt van die en die, door die gepubliceerd en dat is de achtergrond - daar zou weleens
nieuws in kunnen zitten’. Zo werkt het ook met data. Het is echt wel een journalistiek proces.
Maar welke routines heb je bijvoorbeeld, bijvoorbeeld dagelijks?
‘Ja, ik weet niet, dat gaat gewoon dag en nacht door. Zoals de journalistiek werkt.’ ‘Kijk ik heb
wel een rondje van sites waar ik even langs ga om te kijken naar datasets en waarvan je weet.. Je
moet al weten dat de leuke dingen vaak zitten in de saaie dingen. Van wie komt het? Wat zou
erachter kunnen zitten? Dan kun je wat gerichter gaan zoeken. Als je zo’n ding opent,
bijvoorbeeld over die treinseinen, dat je dan ook weet: er is net een ongeluk gebeurt. Dus
misschien dat daar wat meer in zit, dat het relevant is nu.’
En is het ook vaak zo dat je.. Stel je voor, je hoort nieuws op de radio, dat je denkt: ‘Kan ik daar
een dataset bij zoeken?’
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
105
‘Ja hoor, als ik even niets heb dan kijk ik even of er data bij te vinden zou zijn. Gewoon even iets
snels tussendoor.’ ‘Een ander ding wat ik ook doe is gewoon een enorme bak met data pakken en
gewoon kijken wat er in zit. Dan kijk je naar stijgingen, dalingen, dat soort dingen, daar zit
potentieel nieuws in. Ja, dan vind je het wel.
Wat zou je aan iemand die wel die journalistieke achtergrond heeft adviseren? Hoe heb jij die
workflow ontwikkeld?
‘Leer Excel. Als je denkt: hier zou wat in kunnen zitten, plemp het in Excel, ga eens wat
grafieken maken, ga ze een beetje sorteren enzo. Dan merk je snel genoeg, zitten er rare
afwijkingen in of.. Ja, zo simpel werkt het vaak.’
En voor de rest kijken: kan ik het combineren?
‘Vaak is het dan nog vrij saai. Wat ik dan vaak doe is.. Dan heb je bijvoorbeeld alle
verhuisbewegingen in Nederland, maar ja, het is niet zo interessant om absolute aantallen te
hebben. Dus zet je het af tegen de bevolkingsomvang. Dan haal je zelf die cijfers erbij of soms
doet het CBS dat al voor je. Dat is heel mooi, dan hoef je het zelf niet meer te doen. Maarre, dat
doe ik ook wel met Europese onderwerpen. Je weet gewoon: wat het goed doet in het nieuws is
een vergelijking van Nederland met andere landen, Belgie ofzo. Vaak heb je gewoon een rijtje
met cijfers van de Europese Unie, maar zet het gewoon eens af tegen bevolkingsomvang. Dan
krijg je vaak hele andere inzichten: ‘Eigenlijk doen we het best goed’ of ‘Eigenlijk doen we het
helemaal niet zo goed’. Zo doe ik het nu ook met de Olympische Spelen. Ik heb een hele dataset
van alle winnaars. ‘Nou, hoe heeft Nederland het gedaan met alle Olympische Spelen? En hoe
doen de mannen het ten opzichte van de vrouwen?’ Dan gaan we dat soort vragen in de data
inzichtelijk maken. Is gewoon een kwestie van sorteren, filteren en af en toe wat data toevoegen.
En tegen de tijd dat je denkt: ‘Dit is wel een verhaal’, dan heb je al je data al. Kun je het zo naar
het ANP doorschieten.’
Dus wat betreft het vinden van verhalen is het: je journalistieke instinct volgen, maar aan de
andere kant zei je ook: als je gaat zoeken na een idee, werkt het niet zo goed.
‘Ik doe het meestal dat ik data zoek en daar onderwerpen bij zoek.’ ‘Maar het is niet een ding, je
doet verschillende dingen door elkaar.’
Wat is dan bijvoorbeeld een onderwerp waar je echt trots op bent. Niet een groot project,
maar een klein project waar het werken, het totstandkomingsproces heel goed ging?
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
106
‘Een groter project wat ik wel heel leuk vond om te doen, waren de stemmingen. Natuurlijk, je
komt altijd problemen tegen, maar dat begon eigenlijk vorig jaar. Toen was er eens een
hackathon geweest en leerde ik de mensen van Pollitics kennen, die al die stemmingen
bijhouden. Toen hebben we afgesproken: het probleem waar zij tegen aanliepen was eigenlijk
het coderen van al die stemmingen. Waar is nu precies over gestemd. Toen heb ik gezegd: ik wil
jullie wel helpen daarbij. Vrijwilligersdag georganiseerd. Toen hebben we nog meer van die
stemmingsdata gekregen en toen zijn we maar eens gaan kijken: wie stem nu met wie mee enzo?
Toen het kabinet-Rutte viel was dat een mooi moment om erin te duiken. We hebben al die data
gekregen, een ruwe analyse gemaakt. Kwamen we nog allemaal problemen tegen, dat de Tweede
Kamer meer stemmingen had genoteerd dan wij hadden. Achteraan gegaan. Bleek dat de
hamerstukken, dat wij die niet hadden, want die worden in de commissievergadering behandeld
en niet in de plenaire zitting. Dus uiteindelijk hebben we besloten: we nemen de hamerstukken
niet mee.
Hoe ontstaat het precies? Met zo’n hackathon?
Ja, dat is hoe wij werken. Daarom werken we ook zo goedkoop. We maken veel gebruik van
vrijwilligers bij dit soort dingen. Ik ben ook altijd op zoek naar NGO’s die veel bezig zijn met een
bepaald onderwerp. Dan willen wij wel helpen, als we ook nieuwswaardige data krijgen. Maar
NRC Handelsblad laat dat ook doen. Het verschil is dat wij ook echt meehelpen. Want dat merk
ik wel: heel veel onderzoekers hebben vaak prachtige data, waar je ook journalistiek echt wat
leuks mee kan doen, maar die voelen zich gewoon een beetje genaaid door de grote kranten. Dan
hebben ze twee dagen lang die data lopen crunchen en daar een mooi stukje over geschreven en
dat wordt dan helemaal ingekort naar een klein stukje achterin de krant. We hebben wel een
paar van dat soort onderzoekers gehad die zeiden: ‘Met het NRC willen wij niet meer
samenwerken’. Wat wij doen is: we helpen ze gewoon mee. Ook met zo’n hackathon. We krijgen
veel data, maar we vragen ook: zijn er nog dingen die jullie nodig hebben? Kunnen we het op
een manier doen zodat jullie de data voor jullie onderzoek kunnen gebruiken? Je merkt dat dit
heel veel goodwill kweekt. Maar die mensen zijn ook voor ons aan het werk dus ik vind dat er
best iets tegenover mag staan.
Waarin verschilt jullie werkwijze van andere journalisten?
Ik denk dat wij wat meer verhaalgericht zijn en minder op visualisaties. Het is denk ik iets
minder zichtbaar wat wij doen.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
107
Hoe bedoel je minder zichtbaar?
Nou, als RTL Nieuws met iets komt is dat beter zichtbaar. Onze spullen zijn ook all over the
place, maar niet altijd op onze site. We hebben natuurlijk geen hoge bezoekersaantallen, dus het
heeft wel minder impact. Maar we doen wel meer dan anderen. Soms heeft het regionaal wel
degelijk impact. En er zijn ook een paar keer Kamervragen gesteld en onderzoeken ingelast naar
aanleiding van stukken van ons. Plus: wij zijn een stichting, dus we werken veel samen met
vrijwilligers. Crowdsourcing, dat soort dingen. Dat brengt risico’s met zich mee, maar dat
betekent wel dat je veel goedkoper kunt werken.
En de risico’s zijn dan?
Betrouwbaarheid van mensen en daarmee de betrouwbaarheid van je data. Daar hebben we best
wel problemen mee gehad.
Maar ontdekte je dat wel op tijd?
Jajaja, maar met dat cameraproject bijvoorbeeld. Dat hebben we met twintig vrijwilligers
gedaan, die hebben gewobt. We werken ook heel veel samen met universitaire groepen
overigens. Maar dat hebben we met vrijwilligers gedaan en die hebben gewobt en een aantal
heeft dat gewoon niet goed gedaan. Je kan wel proberen het te begeleiden, maarre...
Maar je had al een WOB klaargezet toch?
Ja, dat is allemaal goed gegaan maar in het proces zijn er gewoon fouten gemaakt. Dat mensen
termijnen hebben laten verlopen en dat soort dingen. Dat kan niet, dat is niet handig. Er zijn
leges in rekening gebracht die nooit zijn betaald. Nu vind ik dat niet zo erg, maar daar hebben
we ook nooit meer iets van gehoord. Maar daarmee loop je wel weer een financieel risico, dus
dat is niet handig. Een probleem waar we op een gegeven moment tegen aan liepen, was dat wel
alle WOB-stukken binnen waren, maar dat een aantal vrijwilligers gewoon uit beeld waren
verdwenen. Die reageerden niet meer op mails en alles, maar die hadden de stukken nog wel.
Dus ik heb echt met een advocaat moeten dreigen om die stukken terug te krijgen. Op een
gegeven moment echt gezegd van: ‘Jongens, woensdag wil ik die stukken hebben’. Ik zat er echt
al twee maanden achteraan en vaak gebeld enzo. ‘Ik wil woensdag die stukken hebben, anders
krijg je een advocaat achter je aan.’
En was het gewoon luiheid of iets anders?
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
108
‘Ja, mensen met een beetje persoonlijke problemen, denk ik. Ja, kan best zijn, maar we hebben
wel een productie af te maken. Een groot project waar heel veel mensen heel veel tijd in hebben
gestoken. Dan dreigt zoiets te mislukken.’
En die universitaire groepen?
Ja, dat doen we ook heel veel.
En zoek jij die zelf op?
Ja, maar ze weten ons inmiddels ook aardig te vinden, maar voor zo’n hackathon ga ik overal de
boer op om data los te krijgen van wetenschappers. Want die hebben vaak hele interessante
dingen. Maar ook wel om hulp te vragen. Zij weten het beste wat die data kunnen, wat ze zijn,
wat de zwaktes erin kunnen zijn. En ik wil ook graag dat ze er op zo’n hackathon ook zijn om
mee te analyseren. Dat we geen fouten maken bijvoorbeeld.
Zijn er buiten jullie om ook hackathons? Want je zei dat er ook andere zijn, maar ik ken alleen
die van jullie.
Ja, ze zijn er wel, maar niet nieuwsgericht. Wij doen hackathons rond nieuwsthema’s. Dat is wel
het verschil ja. Ik bedoel: Hack de Overheid doet ook hackathons. Waar wij ook wel naar toe
gaan hoor en gaan kijken. Vaak hebben ze interessante data en worden er leuke dingen gemaakt.
Het is ook goed voor je contacten in de programmeurswereld. Maarre, daar proberen we altijd
wel bij te zijn. Maar wij doen het echt rond nieuwsthema’s. En het is best veel werk om te doen.
Maar het is wel heel erg leuk.
Het verwerken, dan heb je het over Excel?
Ja, het is verschillend, daar gebruik je allerlei programma’s voor.
Wat is jouw definitie van schone data?
Data die klopt, waar geen dubbelingen in zitten, waar geen fouten in zitten. Een foutloze dataset
bestaat niet. Dat is echt onmogelijk denk ik. Maar een dataset die op zo’n manier is gemaakt dat
je ermee kant visualiseren, dat Google er wat mee kan, dat je er kaarten van kunt maken. Dat
soort dingen. Daar kun je Excel voor gebruiken. Met Excel kom je een heel eind, daarmee kun je
echt tachtig procent van het werk doen. Maar voor het echt zware werk heb je Google Refine
nodig bijvoorbeeld. Zou wel handig zijn als je wat MySQL en dat soort dingen kent. Kan ik zelf
niet, maar ik red het tot nu toe prima met Excel.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
109
Google Refine en Excel is tot nu toe genoeg?
Ja, voor mij wel. Maar als je echt zware bestandskoppelingen enzo wilt doen dan red je het daar
niet mee. Dus daar hebben we echt programmeurs voor nodig. Dus ik hoop het allemaal nog wel
te leren, maar dat heeft gewoon tijd nodig. En die tijd heb ik gewoon niet.
Op het schoonmaken ga ik verder niet teveel in, want het kan zomaar zijn dat er, als ik dit
klaar heb, weer een nieuw programma is..
Ja, ik denk dat bijvoorbeeld Jerry dat wel anders doet. Die heeft wel programmeerervaring.
Programmeurs lachen me ook altijd uit als ik over Excel begin. Die vinden het helemaal niets,
maar voor mij werkt het gewoon goed. Ik kan er goed mee overweg.
Hoe zou je precies het verschil tussen verwerken en analyseren..
Je kan pas goed analyseren als je data goed zijn. Anders klopt je analyse niet.
In Excel kan je al die dingen toch doen? Opschonen, verwerken en visualiseren? Merk je dan
nog een duidelijk onderscheid van de ene stap in de volgende?
Wat ik vaak doe is: ik begin in Excel, als het kan. Want Excel is gewoon goed en daar kun je echt
veel mee. En vervolgens ga ik naar Google Docs, daar werk ik ook heel veel mee. En vanuit
daaruit kun je aan visualisaties werken. Ik vind de visualisatietechnieken in Google Docs beter.
Omdat ze interactief zijn en je kan er meer mee. Je kan niet alleen een lijngrafiekje of een
kolommetjes maken, maar ook bewegende grafieken en scatter plots [puntenwolken, JK]. Dus je
kan er ongelovelijk veel mee, met Google Docs. Plus: je kan ook heel makkelijk kaarten maken,
met Fusion Tables. En daar kun je wel databases mergen [samenvoegen, JK]. Op basaal niveau
kan ik dat ook wel. Als je bijvoorbeeld regionale data hebt over gemeenten, dan moet je dat
gewoon in een kaartje zetten. Dan kun je bijvoorbeeld zien dat heel veel werkloosheid in het
Oosten van het land zit. Dat haal je gewoon niet zo snel uit een tabel. Dat vertelt vaak meteen
het verhaal. Plus: je gebruikt het toch later en dan heb je mooi een interactieve kaart op je site.
Dus analyse en visualisatie komen dichtbij elkaar. Tenminste: bij ons.
Dus het kan ook zijn dat als je aan het visualiseren bent ziet: daar zit het probleem.
Ja, vaak ontdek je het dan. Dus dat je eerst een grafiek maakt en dan een trend ziet.
En dan kun je vervolgens weer teruggaan naar het verwerken...
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
110
Ja, zeker hoor. Daar kom je later ook wel achter hoor, dat die dataverwerking zo ontzettend
belangrijk is. Dat je het goed neerzet. Dat je stappen kunt herleiden. Dat als je ergens een fout
maakt, dat je die fout kan herstellen zonder dat je al die stappen daarna opnieuw moet doen. Dat
is wel prettig. Dus je moet Excel zo gebruiken dat als je ergens wat verandert, dat die analyse
verandert. En die kaarten veranderen.
Dat je die cellen aan elkaar linkt?
Ja, veel formules gebruiken en die intact laten, want anders ga je honderd keer heen en weer.
Dat kost heel veel tijd. Maar ja, dat is iets wat je al doende leert.
(Somt samenwerkingsverbanden op. )
Bedrijven.
Heb je dat ook weleens gedaan, bedrijven?
Ja, soms. Of stichtingen, dat soort dingen. Laats hadden we een verhaal gemaakt over
beschermde diersoorten in Nederland, waar die het meeste voorkomen.
Ja, in Amsterdam kwamen die veel voor toch?
Ja, maar dat was ook omdat hier veel stadsecologen actief zijn en die lopen veel te turven. Ja,
dat vertekent het beeld, dus dat moet je wel weten.
Is dat altijd voor-wat-hoort-wat met bedrijven en stichtingen?
Nee hoor, soms vinden ze het gewoon leuk. Dan willen ze wel even genoemd worden, maar dat is
logisch, dat je de bron aangeeft.
Zie je daar als journalist nog dilemma’s in?
Ligt eraan, op welke voorwaarden je dat doet. Als je ze alleen hoeft te noemen vind ik dat geen
punt. Niet meer dan normaal dat je de bron noemt, waar het vandaan komt. Maar ik ga geen
reclame voor ze maken. Dat is gewoon een normaal journalistiek proces. Maar bedrijven vinden
het vaak best leuk om mee te werken. TomTom bijvoorbeeld, dat is uiteindelijk niet doorgegaan,
omdat ze het daar toch te bewerkelijk vonden, maar die konden zo laten zien waar in Nederland
bijvoorbeeld veel te hard gereden wordt. Dat zijn wel hele leuke datasets. Maar het kost vaak
veel tijd en uiteindelijk, als ze daar zelf achter komen, schrikken ze nog wel eens. Dan toch maar
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
111
niet.
Zou je met ieder bedrijf kunnen of willen samenwerken?
Ja, ach, ligt eraan. Ik moet wel weten waar de gegevens vandaan komen.
Bij Nu hebben ze bijvoorbeeld wel editorials..
Ja, die hebben wij ook. Maar daar staat ook gewoon bij dat het een editorial is.
Maar ook bijvoorbeeld met een bedrijf als Shell?
Het bestuur zou zeggen: ‘Nee, dat willen we niet’. En ik zou zeggen: ‘Ik heb er geen problemen
mee’. Van mij mag alles erop. Als zij ervoor betalen, prima. Het staat mijn redacteuren vrij om
daar omheen alles te vragen wat ze willen, ook naar aanleiding van zoiets.’
Die stukken voor het ANP, hoeveel tijd nemen die in?
‘Soms een half uur, soms een halve dag.’
En dan heb je het hele stuk af?
‘Ja, maar ik hoef alleen de cijfers aan te leveren. Iemand anders gaat het nabellen. Er zijn dingen
die ik echt in een kwartier heb gedaan. ‘Dit is zo duidelijk, het verhaal wat hier in zit.’ Moet je
wel mee uitkijken hoor, trouwens. Dat je niet te snel wilt gaan. Vaak zit er ook weer een verhaal
achter de cijfers. Je moet wel een beetje weten waar je het over hebt. Sommige stukken ben ik
bijna een dag mee bezig geweest. Maar die vond ik gewoon leuk en interessant om te doen.
Probeer het toch wel een beetje body te geven. Dat het wel ergens over gaat.’
Wat doe je eigenlijk nog na publicatie? Vul je dingen aan?
‘Ja, nou, soms, meestal niet zo. Vaak geen tijd meer voor. We hebben wel van die lopende series,
over de wereldtemperatuur en de olieprijzen. Daar hebben we maandelijks een update van. Dat
zien we wel in de bezoekersstatistieken terug dat die echt als referentie worden gebruikt. Dat
zijn de twee dingen die we dan structureel doen. Het is wel de bedoeling.. We zitten er wel aan te
denken, dat gaat de UvA [Universiteit van Amsterdam, jk] misschien voor ons bouwen, om uit
die Haagse Twitterstolp een ranglijst te maken wie nou populair is op Twitter, wie niet. Maar
voor de rest.. Nee, het is gewoon verhaalgedreven. Het verhaal is af en dan heb je nog de
discussie eronder. Daar voeg ik nog weleens dingen toe, als mensen vragen hebben. Of dat ik wat
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
112
dingen aanpas of verduidelijk. Dat is wel het voordeel van een blog. Dus ik probeer me wel altijd
met de discussie te bemoeien. En als er vragen zijn, die te beantwoorden. Maar verder, nee.
Dus dan is het na een paar dagen wel afgelopen?
Soms, als een onderwerp een half jaar later weer in het nieuws is, dan wijzen we er nog weleens
op: ‘We hebben toen dit geschreven’.
Wat mij ook nog opviel: soms vallen jullie met een artikel met de deur in huis. Soms zit er een
afbeelding bij. Soms is het gewoon alleen de data. Hebben jullie daar over nagedacht: ‘We
willen heel vrij kunnen werken’ of gaan jullie het wel meer een standaardaanpak ontwikkelen?
‘Ja, dat gaan we wel doen hoor. Het is nu nog een beetje een zooitje. Komt ook omdat ik niet de
enige ben die die datadingen doet. Stephan [Ockhuijsen, jk] is er ook heel actief in. We hebben
wat andere bloggers die heel handig zijn met data - dat is ook een van de redenen dat wij
uberhaupt in de data zijn gestapt. We zijn nu wel bezig om te kijken.. We hebben wel een
zoektocht: ‘Welk visualisatieprogramma gaan we gebruiken?’ Dat we daar wat meer uniformiteit
in krijgen. Als we een grafiek hebben, dat we gewoon een uniforme grafiek hebben. DataWrap
hebben we gebruikt, maar daar zijn we niet tevreden over. Excel vind ik eigenlijk niet mooi.
Google Charts werkt niet altijd even goed. Dus ik heb nu de programmeur die we hebben
opdracht gegeven om een aantal templates [sjablonen, jk] te bouwen en een JAVA-library zodat
we in ieder geval een uniforme manier van presenteren gaan krijgen. Waarop duidelijk staat dat
het van ons is en dat er een huisstijl komt, voor de nieuwe site dan. Dat we allemaal op dezelfde
manier onze data presenteren. We zullen ook wat meer uniformer gaan werken.. Ik wil op een
gegeven moment af van tabellen en dat soort dingen op de voorpagina. Dat moet gewoon naar
doorlink komen allemaal. Ik merk gewoon dat mensen er niet op klikken als er grafiek boven
staat, dat vinden ze saai. ’ ‘Meer verhalend werken. Of het moet iets heel moois zijn, een mooie
visualisatie die we hebben. Die meteen op de voorpagina gaat.’ ‘Dus daar zijn we nu mee bezig,
om meer uniformiteit te krijgen. Maar dat geldt eigenlijk voor de hele site. De kwaliteit wat
omhoog, wat uniformer allemaal.’
Jullie hadden laatst een grappige ‘wedstrijdanalyse’ van de wedstrijd Nederland-Denemarken.
Zou dat dan ook nog steeds kunnen, een minder serieus stukje?
‘Ja, je moet ook een beetje leuke dingen doen. Stephan heeft laatst ook gekeken naar de
gemiddelde lengte van mensen en de hoogte van de doelpalen. Eigenlijk kwam hij tot de
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
113
conclusie dat de doelpalen hoger moeten, omdat mensen zo gegroeid zijn, de afgelopen honderd
jaar. En dat de doelpalen niet mee zijn gegroeid.’
Ik heb ook een stuk geschreven over de routines en daarin stellen mensen dat iedere standaard
die je jezelf oplegt invloed heeft op het journalistieke product.
‘Dat is wel zo, want, jawel, het bepaalt wel een beetje hoe je werkt. Ook met die data van de dag,
van het ANP: het ANP heeft andere stukken dan wij. Ik schrijf het heel anders op,veel luchtiger.
Veel persoonlijker. Ik merkte ook, toen Laura er nog zat, die plaatste vaak die stukken een-op-
een door. A) Daarmee onderscheid je jezelf niet, want dat stuk staat al overal. Het is niet
duidelijk dat het van ons komt. Maar B) Het past ook niet zo goed op ons blog, zo’n heel feitelijk,
klein, droog nieuwsstukje. Dus ik probeer altijd wel een eigen draai aan die stukken te geven. En
als ik dan passages gebruik die ANP heeft nagebeld, dan breng ik dat ook niet alsof het van mij
is. Maar ik zeg: ‘Onze collega’s van het ANP, enzovoort.’ Dus ik probeer daar wel een eigen draai
aan te geven, dat iets wel bij onze stijl past. Dat ik het wat luchtiger op schrijf of..’
‘Ik heb nu zo’n stukje, dat wordt niet door het ANP opgepakt, maar ik vond het wel leuk om er
toch op Sargasso wat aandacht aan te besteden. Over depressieve gevoelens bij mannen en
vrouwen in het afgelopen jaar. Er is laatst onderzoek geweest van het CBS en daaruit blijkt dat
vrouwen depressiever zijn dan mannen, eigenlijk structureel veel depressiever zijn dan mannen.
Dan denk mensen toch: ‘Hoe komt dat dan?’ En dan weet je nu al dat het een mooie discussie
kan gaan opleveren, kun je een beetje lopen stoken. Kijk, het ANP kan zoiets niet, die moet
gewoon heel feitelijk doen, maar voor een blog is dat prima, daar kun je ook een beetje lol mee
hebben.’
Alexander zei al dat ik van de verschillende aanpak goed de voor- en nadelen moest vragen.
Maar als ik het goed begrijp zijn de voordelen van werken met vrijwilligers dus dat ze
goedkoop zijn en..
‘..dat ze een bepaalde expertise met zich meebrengen die journalisten niet hebben. Er zijn echt
vrijwilligers die echt heel veel verstand hebben van iets en ook een enorme drive hebben om iets
te doen. Zoals laatst ook met dat cameraproject, daar zat ook een programmeur bij die
vrijwilligers. Rijkswaterstaat, die zat gewoon te traineren. Daarvan kreeg ik wel een lijst met al
hun camera’s, maar dan heel erg opgeknipt en daar konden we niets mee gewoon. Normaal
gesproken moet je dat dan handmatig doen, maar die man maakt even een scriptje en die trekt
alles er zo uit. Die zet dat gewoon goed neer op een kaart. Ja dat is super. Dat soort mensen heb
je op een redactie gewoon niet rondlopen. Wat dat betreft zijn die vrijwilligers dus wel handig.’
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
114
‘Ik denk, als je dit goed wilt doen, op een grote redactie, dan moet je en een journalist
neerzetten - zoals ik, die wel iets van techniek begrijpt - en daarnaast moet je gewoon een
keiharde programmeur erbij hebben. Die gewoon dingen kan maken, scrapen, dat soort dingen
kan doen.’
‘Ik was laatst bij Altijd Wat, van de NCRV, die hebben ook een datajournalist aangenomen
inmiddels. Ik zag die vacature en toen heb ik ook gezegd: jullie zoeken de verkeerde persoon.
Jullie moeten een programmeur hebben en niet een journalist, die hebben jullie zelf wel. Er
lopen daar genoeg journalisten rond. Maar ja, ze hebben niet geluisterd. En er komt ook niets uit
nu, geloof ik.’
Maar jullie werken nog wel met ze samen toch?
‘Ja, maar dat project is een beetje.. [bootst leeglopende ballon na]. Volgens mij hebben ze er niet
zoveel zin in. Ik zou ze eigenlijk adviseren over een hele grote productie. Plan voor ze geschreven
enzo, maar ze pakken het maar niet op. Nee, je ziet veel mislukken hoor, ook bij RTL gaat het
mis.’
Maar als ik contact met hun opneem, denk je dat ze daar uberhaupt nog iemand hebben die er
wat over kan vertellen?
André Tak, die gaat erover. Nu ja, ze hebben Jelle eruit gezet en volgens mij hebben ze verder
niet zoveel mensen die dat kunnen. Ik weet het niet.
Aan de hand van welke criteria maken jullie keuzes. Je zei al: tijd speelt een rol, je kan wel met
een vraag beginnen, maar dat is tijdrovend. Anderzijds hebben jullie ook de luxe om soms te
tijd voor iets te nemen.
‘Soms wel ja, als je iets belangrijks hebt, maak je graag tijd daarvoor vrij.’
Over jezelf nog even: wanneer was het eerste moment dat je met datajournalistiek in
aanraking kwam?
‘Mmm.. dat is nog niet zo lang geleden hoor, anderhalf jaar denk ik, twee jaar geleden. Toen ik
in New York woonde. Daar speelde het al wel. Daar zag ik dat kranten ermee bezig waren en in
Nederland begon er toen net een beetje over gepraat te worden. Met Sargasso deden we af en
toe wel van die dataprojectjes enzo.’
En heb je ook een journalistieke opleiding gedaan?
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
115
‘Ik heb geschiedenis gestudeerd, ook, in Utrecht. En daarna bij het Utrechts Nieuwsblad terecht
gekomen, als trainee van het Wegener-klasje. Gewoon algemene verslaggeverij gedaan op de
regioredacties enzo en daar het vak geleerd. En daarna al vrij snel richting
onderzoeksjournalistiek gegaan, de zwaardere dingen enzo. Dat werd het AD, toen ben ik naar
de Amersfoortse Courant gegaan, vooral onderzoeksjournalistiek gedaan. Grote verhalen,
moorden, dat soort dingen. Toen ben ik daar gillend weggelopen.’
Waarom?
‘Dat is een vreselijke krant, het AD. Stel proleten bij elkaar. Vreselijke sfeer, gewoon geen ruimte
meer voor goede journalistieke producties. Moet allemaal snel en vooral niet te ingewikkeld.
Toen had ik het vrij snel gezien en ben ik voor mezelf begonnen. In Maastricht gaan wonen en
toen ben ik vrij snel bij het NRC Handelsblad terecht gekomen op de redactie
onderzoeksjournalistiek. Daar een half jaar meegedraaid ter vervanging van iemand en daarna
mocht ik een tijdje blijven. Daarna gaan freelancen en vooral voor het NRC en Intermediair.
Voor NRC veel voor het zaterdags bijvoegsel. Toen naar New York gegaan,
correspondentenwerk. Boek geschreven. Sinds vorig jaar weer terug en toen ben ik Sargasso
gaan doen.’ ‘En in Amerika heb ik ook het businessmodel voor Sargasso uitgewerkt en een deal
met het ANP geregeld en ander geld geregeld.’
En heb jij het datawerk jezelf aangeleerd of van Laura..?
‘Nou, Laura was zelf ook nog niet zo technisch onderlegt hoor, toen ze hier begon. Dus we
hebben het echt een beetje strompelend moeten leren. En met enige bluf wel bij het ANP
binnengekomen, moet ik zeggen. Haha, maar het is wel goed gegaan. Maar we hebben gewoon
on-the-spot geleerd. En wat ik zeg, als je goed Excel kan, kan je al een hele hoop. Ik heb er wel
tijd voor genomen om me dat eigen te maken. Dus al doende leer je wel.’
‘Het is allemaal niet zo ingewikkeld, het valt echt wel mee. Datajournalistiek is moeilijk, dat durf
ik echt wel te zeggen. Omdat je heel veel combineert, goed met data, wat zegt die data nou, je
moet data kunnen lezen, het is gewoon echt journalistiek werk, plus de technische component
die eraan vast zit. Ik vind het wel ingewikkeld vaak, maar op zich, die vaardigheden op zich zijn
wel te leren, daar hoef je geen keiharde programmeur voor te zijn.’
Wat was de werkverdeling toen?
‘Laura zat toen drie dagen per week bij het ANP, ook echt op de redactie. Als aanspreekpunt ook,
dat is ook belangrijk. Want uiteindelijk is het de bedoeling dat ze het bij het ANP zelf doen.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
116
Kennisoverdracht. Ik adviseer het ANP ook hoe ze dat in hun redactioneel proces moeten
onderbrengen.’
‘Ik deed dan de wat grotere producties, de hackathons, de contacten met NGO’s en
universiteiten. Dat soort dingen deed ik vooral. Dus dat werkte op zich wel goed, goede
onderverdeling. Ik haalde data vaak binnen, praatte ik los overal en zij ging ermee aan de slag.
Nu doe ik eigenlijk alles en dat blijf ik ook doen. Die redacteur komt straks echt alleen voor het
blog. Ik doe echt puur de datajournalistiek en de WOB-projecten.’
En Excel, daar was je tot een paar jaar geleden ook echt niet superhandig mee?
‘Nee nee, daar heeft mijn vrouw mij het afgelopen jaar veel bij moeten helpen. Zij is gewoon
goed met data, zij is wetenschapper, neurowetenschapper, dus ze moet veel data analyseren.’
Heb je jullie aanpak nog van iemand afgekeken?
‘Mwoh, iedereen kijkt natuurlijk wat The Guardian doet, maar bij ons was het wel anders omdat
wij echt nieuws moeten genereren. Dat hebben we echt zelf moeten leren. Voor de rest kijk je
natuurlijk wel wat anderen doen, het is een klein wereldje dus je deelt veel, overlegt veel.’ ‘Er
zijn maar een paar in Nederland die het doen. Dus daar zijn contacten mee.’
Als je nu opnieuw zou beginnen, zou je het dan anders hebben aangepakt?
‘Nou, wel anders dan we toen waren begonnen ja. Meer vanuit de data werken. Niet alleen maar
ingewikkelde dingen doen, maar ook hele simpele dingen. Die moet je ook doen, anders word je
gek. Gewoon van die dagelijkse stukjes, ik denk dat dat wel heel goed is. Dat is echt geen
verheven datajournalistiek waarbij je hele ingewikkelde dingen doet, maar het is wel goed om in
contact te blijven met die data, te weten wat er is. En je haalt er toch vaak ook nog een nieuwtje
uit.’
Wat betreft de rest van ‘de organisatie’. Wat is de werkwijze van Sargasso?
‘Dat is ingewikkeld hoor. [Grinnikt] Omdat we zoveel samenwerken is het echt lastig. Het ANP
heeft een hele andere.
Maar los van de datajournalistieke tak?
Oké. Nou, we hebben een stichting, daaronder een kleine redactie, daaronder een flink reservoir
aan vrijwilligers. Het is in principe een vrijwilligersorganisatie. En ik ben dan baas van de site en
moet aan het bestuur verantwoording afleggen.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
117
En hoe beinvloedt hoe de rest van Sargasso werkt jullie datajournalistiek werk?
Dat is een moeilijk punt soms. Het is altijd lastig als in een vrijwilligersorganisatie opeens geld
komt en professionele krachten en die ook meer professionele eisen gaan stellen. En we werken
steeds meer met professionele klanten. Het ANP en Nieuwsuur zijn we nu mee bezig. Dan loop
je wel tegen de reputatie van een blog aan en gaan klanten op een blog kijken. Het is niet altijd
even goed wat er staat. Dus dat is wel een probleem waar we tegenaan beginnen te lopen nu. Het
blijft schipperen: tot hoever ben je een professionele organisatie en tot hoever ben je een
vrijwilligersorganisatie.
Komen andere redacteurs ook met ideeen?
Ja, soms met hele goede hoor. Echt leuke dingen. Laatst heeft iemand gekeken naar het
spoorboekje en hoeveel je nou betaalt per reistijd. Bleek dat het traject Den Haag - Amsterdam
eigenlijk buitensporig duur is. Terwijl je volgens de nieuwe regeling er alleen maar langer over
doet en meer gaat betalen. Dat soort dingen.
Is er nog iets dat je zelf kwijt wilt?
Ehm.. Nou, wat ik wel kan zeggen: als je de komende tijd verzekert wilt zijn van werk, duik dan
in de datajournalistiek. Dat is wel een goede markt op dit moment. Maar voor de rest, nee. Het
is een hoop poeha, die datajournalistiek. Maar het is gewoon journalistiek.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
118
Arlen Poort (NRC Handelsblad) en Laura Wismans (nrc.next)
Allereerst, jullie doelstelling. Welk doel hebben jullie voor ogen als jullie bezig zijn met
datajournalistiek?
A: ‘Ik vind dat heel moeilijk te beantwoorden, wat het doel.. Je kunt iets zeggen over het doel
van je journalistiek. En dat is, als je het heel hoogdravend zegt, zorgen dat mensen beslissingen
kunnen nemen die de maatschappij misschien ten goede komen. Het gaat om waar geven ze hun
geld aan uit, maar ook waarop gaan ze stemmen, welke culturele voorstellingen gaan ze
bekijken? Dat is een idealistisch idee. Je kunt ook zeggen: journalistiek dient, als je het zou
vergelijken met de Tweede Wereldoorlog..
L: Haha, tien minuten zitten we erin..
A: Haha, nee.. Maar dat mensen nooit kunnen zeggen: ‘Ik wist dat niet, ik wist niet dat het zo erg
was, ik wist niet dat dit speelde’. Gewoon het heel goed informeren van mensen. Dat ze op de
hoogte zijn van alles wat relevant is. Maar ja, als je het toepast op datajournalistiek. Ja..
L. Ik denk niet dat het anders is dan normale journalistiek.
A: Nee, maar het blijft heel erg hoogdravend. Het is niet zo dat je elke dag als je hier komt, je
pakt een kopje koffie en je stelt je de vraag: ‘Wat is mijn doel vandaag?’
Maar hebben jullie wel een doelstelling meegekregen? Dat de data wel een beetje spannend
moet zijn bijvoorbeeld? Worden jullie gepusht om het een beetje vlot te houden of is het doel dat
er belangrijke dingen..
L: “Het moet nieuwswaardig zijn, moet ergens een trend in zitten of een ontwikkeling of een
onverwacht iets. Dan is het de moeite van het beschrijven waard. Iets wat iedereen al weet, wat
iedereen verwacht, ook al is het data - dan is het niet zo spannend om op te schrijven. Maar dat
is eigenlijk nooit zo, er gebeurt altijd wel iets in cijfers. Zeker hoe groter de datasets, hoe
spannender het is, meestal.
A: En als je kijkt naar - dat was dan niet echt datajournalistiek en ook heb ik het niet gedaan -
maar vorig jaar was er een artikel, dat stond eerst in next, ongeveer een jaar geleden, over
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
119
vrouwenoverschotten in de jongere leeftijd - twintigers, dertigers - in Amsterdam. Omdat het
kennelijk zo is dat vrouwen liever in de stad wonen dan mannen. Dat is demografie, demografie
kun je saai noemen. Maar als je het toepasselijk opschrijft - ik weet even niet meer wie dat
opschreef, dat was een freelancer - maar het was een heel leuk onderwerp, omdat er wel een
soort van probleem werd benoemt: ‘Er zijn vrouwen die een man zoeken en een kind willen
krijgen, maar die mannen komen ze niet meer tegen, want die wonen niet meer in de stad’. Het
ligt er dus maar net aan.. Volgens mij is het qua spannendheid.. Kijk, wij zijn ook maar gewone
mensen met gewone interesses. Toevallig werk je bij een krant en doe je dingen met informatie,
maar saaie informatie, daar zitten hele interessante achtergronden bij. Dat is puur het
sekseverschil, als je dat als definitie in een databestand leest, denk je: “Zal wel..”. Maar als je
daar de vraag bij stelt en ‘goh, dat zou wel eens een interessant onderwerp kunnen zijn’, dan
kom je bij een onderwerp uit dat iedereen wil lezen. Heel veel mensen hadden het daar over.”
L: Datajournalistiek is nooit alleen de cijfers beschrijven. Dat is altijd het verhaal daarachter:
wat betekent dat dan en voor wie heeft het invloed? Dat is ook wel een groot verschil.
Datajournalistiek is lang niet alleen cijfers.
Dat is ook nog wel een discussie onder datajournalisten zelf: alleen een dataset, zou dat voor
jullie ook voldoende zijn? Iets waar je als lezers doorheen kan scrollen?
A: Ligt eraan. Die kaart van CBS-gegevens, die ik in februari online heb gezet. Dat is eigenlijk
precies dat. In de krant heeft een stuk gestaan en op de website stond er ook een wat kleiner
stuk. Meer om het wat body te geven. Maar eigenlijk, die interactieve kaart was het gewoon.
Maar het ligt heel erg aan de manier van presenteren. Soms zie ik in Amerika voorbeelden en
daar moet je door en door en door blijven klikken. Je moet de bezoeker van je website, want heel
vaak zijn het dan interactieve dingen, niet een taak geven. Het gaat erom.. Kijk, een landkaart -
iedereen kent landkaarten. Sinds Google Maps bestaat kan iedereen met die interface omgaan.
Als je daar iets op legt wat een nieuwe dimensie geeft aan de werkelijkheid, dan heb je daar op
zich al genoeg aan. Dat was die CBS-postcodedemografiekaart eigenlijk. Dat gaf voor het eerst
inzicht in de omgeving van hoe mensen wonen. Wat hun stad of buurt is.
L: Maar daar hoor wel bij: wat is er opvallend aan voor heel het land? Of voor heel het ding dat
je beschrijft. De service daarbij is, dat mensen hun eigen vierkante kilometer kunnen bekijken.
Ik vind wel dat journalistiek altijd het verhaal moet vertellen en niet alleen het neerplempen en
‘succes ermee’.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
120
A: Nee, dat is waar. En hierbij heb ik ook wel geprobeerd een paar opmerkelijke dingen in
Nederland te laten zien, maar ja. Iets wat zo gedetailleerd is. Bovendien: deze dataset had ook
geen ontwikkeling. Dit was gewoon dit jaar, dat was het dan. Je kon ook niet zeggen: daar is iets
gegroeid of zoiets. Ja, ik heb heel veel wijken - ik heb die hele kaart zo’n beetje bekeken. Maar
dan nog: je kunt niet in je eentje heel Nederland af gaan, elke straat van Nederland. Er zijn een
paar dingen die ik opmerkelijk vond, maar er zijn nog duizend andere opmerkelijke dingen op
die kaart te vinden die ik ook niet gezien heb.
L: Dat willen lezers wel graag. Dat merk je wel, daar heb ik zelf een scriptie over geschreven, dat
de aandacht van mensen er wel lang bij blijft als ze zichzelf kunnen opzoeken.
A: Maar het moet wel makkelijk, mensen moeten niet voor een taak gesteld worden. Het moet
wel een ontdekkingstocht zijn, zonder dat er een hoge drempel is. De nieuwsgierigheid moet van
zichzelf blijken. Je moet niet eerst twintig keer moeten klikken en nadenken waar je naartoe
gaat om te weten wat het verhaal is.
Hebben jullie ook het doel om het allemaal online te zetten of in de krant te houden? Of kies je
wat makkelijk is voor het verhaal?
A: Nou ja, het is lastig. Ik ben in principe voor open data: overheidsinformatie moet openbaar
zijn. Als je het weer over die CBS-kaart hebt. Het databestand erachter is gewoon een enorm
grote tabel van het CBS. Dat is een Excelsheet, maar dan heel groot. Ik heb daar een visualisatie
van gemaakt. Dat is mijn werk. En dat ga ik niet weggeven. Door die kleurtjes enzo, dat is
allemaal van mij. Het staat op het web, maar mensen kunnen dat niet.. Nou ja, je kunt wel een
script schrijven om die data daar weer uit te genereren, maar het is niet dat je het weggeeft. Dat
blijft op onze site staat, niemand anders kan er wat mee doen. Dat zou ik nooit zomaar
weggeven. Aan de andere kant: dat was een beetje een moeilijk verhaal met die
stembureaukaart. Die ga ik ook in september weer maken. Die we in juni 2010 hebben gemaakt.
Het lastige daarbij was: ik wilde het wel online zetten.. Het databestand zelf bevatte alleen maar
de naam en het nummer van een stembureau per gemeente. Dus: ‘Basisschool de Paperclip in
Enschede’ of zoiets. Maar je weet niet wáár die zit. Maar iemand anders, een hobbyist zou je
kunnen zeggen, die ook wetenschapper aan de TU Twente is, die had zelf iets van 80 uur achter
de computer gezeten om van alle stembureaus in Nederland het adres op te zoeken. Dan wist je
niet alleen dat dat Basisschool de Paperclip was, maar ook aan Grote Markt nummer zoveel in
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
121
Enschede. Nu.. Wij hebben samengewerkt, dus hij heeft ons die adressen gegeven en ik heb hem
weer met andere dingen geholpen. En hij verdiende er geld mee om die dataset te verkopen. Dus
ik had op zich wel die dataset online willen zetten - van: download die hele lijst maar en ga er
wat mee doen - maar ja, hij had daar wel 80 uur op een zolderkamertje aan zitten werken. Dat
ga je niet zomaar doen. Dus dat was meer dat je iemand anders werk beschermt, dat je het niet
op een andere manier downloadbaar op de website zet.
Dus waar het kan, waar jullie de mogelijkheid hebben maken jullie het zo openlijk mogelijk en
dat doen jullie alleen niet als er een beperking is?
Het heeft er ook een beetje mee te maken hoeveel werk je er zelf in hebt gestoken. En ga je nou
echt de concurrent helpen door je werk weg te geven. Ehm, daarin moet je denken bijna een
commerciële afweging maken.
L: Er zit ook wel verschil denk ik tussen de data weggeven en het hele werk weggeven, inclusief
presentatie en verhaal. Het is juist wel vleiend als iedereen het erover heeft en linkjes naar jouw
kaart staan. Dat is prima en daar wordt iedereen ook wel blij van. Maar op het moment dat
mensen zelf die kaart daar neer zouden zetten, dan wordt het minder leuk. Maar die data
daarachter, mochten zij er een andere toepassing van maken.. Dat is een beetje de filosofie van
open data, als zij daar iets anders mee willen is dat leuk. Maar ja, mocht er een copyright van
iemand anders op zitten, dan is dat natuurlijk niet aan de orde. Ik heb ook best wel vaak gehad..
Dat vond ik zelf een heel leuk onderwerp, over beschermde diersoorten in eh..
..in Amsterdam?
L: Ja, daar ging het verhaal uiteindelijk over, maar we hadden het voor elke gemeente in
Nederland. Superleuk om daar eens inzicht in te krijgen en daar hadden we ook leuke kaarten
bij gemaakt. Maar ja, die dat die erachter zat konden we dan weer niet delen, want die is van
iemand anders. Maar ja, mensen kunnen wel het kaartje bekijken, want op geaggregeerd niveau
mochten ze dat overnemen. Ja, dat zijn dan weer.. Meestal zijn het toch wel commerciële
afwegingen, denk ik.
A: Het heeft ook iets te maken met.. Ik kan niet een concreet voorbeeld bedenken.. Je kunt een
dataset krijgen met veel vuiligheid erin. Ik weet niet of je daar bekend mee bent?
Dat meneer De Boer aangeduid staat als ‘Boer, de’ en ‘De Boer’ en daardoor per ongeluk
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
122
dubbel geteld kan worden?
A: Een goed voorbeeld is trouwens de lintjesregen. Dat is een beetje een knullig voorbeeld, maar
onze lezers zijn daar gek op. Dus elk jaar doe ik dat weer. En dit jaar is het iets veranderd. Maar
hiervoor was het altijd: dan kreeg je een Word-bestand met.. Elke regel was dan een naam, en
dat was dan wel ‘F.J. de Boer uit Waddinxveen’, maar de indeling was niet altijd hetzelfde. Soms
was het ook ‘F.J. de Boer’ en dan stond daarachter ‘Koster van de St. Mariakerk te Waddinxveen,
wonende aldaar’. Als je dat leest denk je: lijkt allemaal hetzelfde, maar als je het in een Excel-
sheet wil zeggen, moet je heel veel dingen anders gaan ombouwen, zodat het gestructureerde
data zijn. Maar dat lijstje zette ik wel gewoon als een Excel-document op de website. Daar heb ik
een volle dag steeds weer aan moeten besteden om dat goed te kneden, omdat je dat bijna
allemaal met de hand moet doen.
L: Het leuke is, dat iedereen dat bijna doet. Want hetzelfde hebben wij bij het ANP gehad, haha.
Dat is zo zonde werk.
A: Ja, dat is echt onzin. En uiteindelijk had ik, helemaal lullig.. Ken je Google Refine? Dat was
nu ongeveer anderhalf jaar uit. Toen heb ik mezelf dat aangeleerd omdat ik bij de VVOJ een
cursus gaf in Google Refine. Toen dacht ik: ‘Nou, als ik nou als praktijkvoorbeeld te lintjesregen
doe, dan kan ik die hele Refine zo programmeren dat ik er iets aan heb dit jaar.’ Komen ze dit
jaar met een hele andere lijst! Was het allemaal onzin. Uren aan besteed, maar dat was allemaal
niet meer nodig. Maar dat terzijde. Maar goed, daar besteed je dan een dag aan. Maar dat geef je
eigenlijk weg als service. Het is niet zo dat.. Een jaar daarna heeft het geen commerciële waarde
meer ofzo. Dat geef je dan maar weg voor de hobbyist die er misschien iets anders mee wil doen.
L: Je kunt kijken of er in Waddinxveen misschien extra veel lintjes worden uitgedeeld.
A: Precies, dat soort dingen. Ik vind het niet zo erg om dat soort dingen weg te geven. Dat vind
ik service.
L: Vind ik ook een beetje bij de filosofie van open data horen.
Dan het thema ‘Onderwerpen’. Hoe komen jullie over het algemeen aan jullie onderwerpen?
A: Eh..
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
123
Kiezen jullie ze zelf? Komen mensen vanuit de redactie naar jullie toe met ideeen?
A: Meestal kiezen we ze zelf.
L: Ook wel, als je weet dat de verkiezingen er aan komen, dan ga je nadenken: ‘Wat kunnen we
met de verkiezingen doen?’ Want je weet dat die behoefte er is. Dat werkt ook weer een beetje
twee kanten op. Soms vraagt iemand zich iets af of, wat ik heel erg hoop: mensen komen
natuurlijk best wel databestanden tegen, maar daar doen ze nooit wat mee. En ik hoop dat de
bewustwording wat groter wordt. Dat ze denken: ‘He, daar zit wat in, laat ik het doorsturen’.
Maar die stroom is nog niet echt op gang gekomen.
A: Ik heb eerder dit jaar voor alleen de binnenlandredactie, dat waren toen aanwezig misschien
vijftien mensen, een wat ze dan een masterclass noemen gegeven. Ik heb ze ook heel veel
voorbeelden laten zien van bestanden die je tegen kunt komen als journalist, waar nieuws in zit,
maar wat niemand in de gaten heeft, omdat ze niet weten wat ze ermee moeten. En echt
geprobeerd om dat helemaal zo te doen zodat mensen daarna dachten van: ‘Goh, er misschien
een rapport verschenen, maar daar zit dat nog achter en wat erachter zit is nog veel
interessanter’. Maar het komt niet echt.
Maar zie je zo’n zaal dan echt voor je zitten, terwijl ze met grote ogen denken: ‘Waar heb je het
over?’
A: Nee, helemaal niet, want ik heb heel veel voorbeelden genoemd. Vaak uit van Amerikaanse
kranten, omdat die het makkelijks te vinden zijn op het web. Bijvoorbeeld een onderzoek, dat
ging naar een soort Amerikaans equivalent van de Cito-toetsen. Maar dan op de middelbare
school. Ik weet niet precies hoe dat nou zat hoor. Maar een krant in Amerika had alle resultaten
van heel Amerika uitgezocht en toen gekeken: ‘Zijn er nou scholen waar de uitkomsten niet waar
kunnen zijn?’ Gewoon een statistische berekening op losgelaten, van: hebben de scholieren van
deze ene school nu significant anders gescoord dan een willekeurige andere school? Daar
kwamen uitkomsten uit waaruit bleek: dit moet wel vuil spel zijn. Het was niet helemaal
bewezen, maar er werden gewoon verdachte scholen aangewezen. Beetje Diederik Stapel-achtig,
dat de leraar de toetsen voormaakte of zoiets. Dat voorbeeld geef je dan in de hoop dat de
onderwijsredacteur misschien ook denkt van: ‘Goh, dat kunnen we ook met Cito-toetsen doen of
met eindexamenresultaten’.
In Amerika is toch veel meer data open. The Texas Tribune had van de oudste gevangene in de
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
124
staat zijn gewicht, zijn lengte, zijn naam, de reden waarvoor hij vast zat. Nu vraag ik mij bij de
Cito al af: daar zullen mensen in Nederland vast over in opstand komen, als dat openbaar
wordt gemaakt.
A: Dat zou goed kunnen. Wat nu openbaar wordt gemaakt is alleen het gemiddelde Cito-cijfer
per school. Maar wat je eigenlijk wilt weten, en dat kun je geanonimiseerd doen, is van scholier
A tot en met Z: die heeft 500 gescoord, die heeft 100 gescoord, etcetera, zodat je een verdeling
van alle scholieren krijgt. En daar hoef ik echt niet de namen bij te hebben. Het mooiste zou
natuurlijk wel zijn als je de postcode van de scholier hebt, zodat je ook kan kijken..
L: ..uit welke buurt die komt.
A: Ja, maar goed, dat wordt moeilijk. Maar als je alleen al de reeks scores hebt, dan heb je
niemands privacy aangetast. Ik heb het nooit gevraagd, maar ik denk dat het a hell of a job gaat
worden om dat te krijgen.
En zie je daarin ook een trend, dat het makkelijker wordt?
L: Ken je Hack de Overheid? Daar zit ik in het bestuur. En daarbij heb je open onderwijsdata,
open cultuurdata, open zorgdata. En je merkt gewoon dat er veel meer over wordt gesproken.
We gaan binnenkort - op 8 september - ook Apps voor Democratie organiseren, over de data van
de Tweede Kamer. Er zit gewoon beweging in. Er wordt over gesproken. Gerdi Verbeet zet zich
bijvoorbeeld persoonlijk in voor Apps voor Democratie, die gewoon ook mensen uitnodigt en
met mensen uit het veld in gesprek wil gaan. Daaraan merk je: er zit wel beweging in. Ook de
inspectie, als we het over Cito-scores hebben, ook daar wordt er over gesproken. Ze worden
minder bang. Het wordt niet alleen maar gezien als supernegatief of ‘ze willen ons er alleen maar
mee aanvallen’. Dat is natuurlijk ook helemaal niet.. Aan de ene zijn journalisten wel altijd op
zoek naar schandalen, maar aan de andere kant is het ook heel logisch dat je als burger wilt
weten hoe het zit met de scholen waar jou kind straks op gaat zitten. En dat besef komt wel
steeds meer, denk ik.
A: Het gekke is ook.. Als je als journalist op zoek bent naar schandalen heb je meer aan notulen
enzo dan aan een databestand waar in feite alleen maar getallen in staan. Dat zijn geen
schandalen, dat zijn alleen..
L: Fraude kun je er wel in zien. Ik mag hopen dat elke organisatie dat er ook uit wil halen. Dat
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
125
word je toch niet blij van, het is beter als dat er niet is.
A: Ja, maar heel vaak gaat het juist puur om data die je puur servicegericht kunt gebruiken. Of
demografisch om inzicht te geven in hoe een land verandert. Zitten helemaal geen schandalen in
ofzo, is puur interessant.
Dat is niet waar jullie op uit zijn, jullie zijn niet op zoek naar dirt?
L: Ik ben bijvoorbeeld wel best lang bezig geweest met een verhaal over immigratiecijfers.
Omdat er een heel groot verschil zat tussen de immigratiecijfers van het CBS en die van de IND,
terwijl je zou denken: ‘Zijn allebei vrij betrouwbare bronnen voor cijfers, ze hebben er niet echt
baat bij om te liegen of weet ik veel wat’. Maar immigratie is natuurlijk, zeker in het afgelopen
kabinetsbeleid, een superheet hangijzer. Daar ga je dan wel extra in porren. En waar ik dan
bijvoorbeeld achter kwam is dat er in de immigratiecijfers, heb je ongeveer voor gezinsmigratie,
waar het voornamelijk over ging, elk jaar ongeveer 10.000 mensen die binnenkomen. Ik weet
niet precies of die getallen kloppen. Maar 20 procent daarvan, ongeveer 2.000.. Nee, het waren
4.000 baby’s ongeveer. Dus gezinsmigratie ligt volgens mij tussen de 20.000 en 22.000 per jaar.
En 4.000 daarvan zijn baby’s die in Nederland geboren worden. En dat betekent dus een heel
groot verschil met hoe de IND telt. Namelijk: die baby’s hebben ook een verblijfsvergunning
nodig en hoe het CBS telt, namelijk: mensen die zich opnieuw inschrijven in een gemeente, die
eerder van buitenaf kwamen. Is helemaal niet raar, ik snap dat de IND.. Die moet die
verblijfsvergunningen uitgeven, dus het is logisch dat zij die mensen tellen. Maar wat ik dan
denk: ja, dan moeten ze dat in een aparte categorie tellen. Want op dit moment is het een heet
hangijzer dat er zo’n ‘tsunami’ van mensen naar ons land toekomt. Op twintig procent daarvan,
van de gezinsmigranten, heeft dus geen enkel beleid invloed. Ja, dan ga je wel extra daarin
porren, omdat je weet dat dit een mooi verhaal oplevert. Dus, als het erin zit dan haal je het er
wel uit natuurlijk, haha.
Nu je het zegt van immigratie.. Je merkt ook vaak, eigenlijk al vanaf het begin van
datajournalistiek.. Als je kijkt naar Philip Meyer enzo, zijn het onderwerpen die te maken
hebben met mensen die gediscrimineerd worden, zorg, immigratie enzo. Merken jullie bij jullie
zelf ook vaak dat het vaak die kant op gaat?
A: Ik denk dat dat komt omdat overheidsgegevens heel vaak hiermee te maken hebben. Het is
heel mooi om onderzoek te doen naar boekhoudingen van bedrijven, maar je kunt bedrijven wel
opbellen, maar die geven hun boekhouding toch niet. En juist datajournalistiek probeert veel
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
126
meer met kleinschalige data die in hele grote bestanden zit iets te doen. En je hebt wel via
Datastream of Bloomberg allemaal macrocijfers en beurskoerzen van individuele bedrijven,
maar heel weinig andere microdata, zoals het CBS dat noemt. En die heb je van de overheid
natuurlijk wel. Dus ik denk dat eerder het verschil dat er andere onderwerpen naar boven
komen. Puur de beschikbaarheid.
L: Plus, aan de andere kant, ik zit niet zo diep in de economie. En daar zitten wel hele
ingewikkelde rekenmodellen achter. Dus dat zegt mij niks, als ik naar zulke cijfers kijk. Dat is
denk ik ook wel een verschil. En terwijl er heel van economieredacteuren zijn die ook wel naar
cijfers kijken, want die zijn toch al een beetje.. Als ik een nieuw onderwerp ga bedenken, met een
blank sheet, dan denk ik niet: ‘Goh, laat ik eens iets economisch doen.’ Dat is bijna nooit zo.
A: Een heel goed ding, wat eigenlijk al jaren zou kunnen, wat nooit iemand doet - ik ook niet,
haha: alle prijzen, van alle supermarktartikelen staan gewoon online. Bijvoorbeeld op Albert.nl
kun je gewoon van elk individueel potje pindakaas zien hoe duur het is. Je kunt dus zelf een
scriptje schrijven om van week tot week de prijsontwikkeling van alles in de supermarkt te
vinden. Dat is dan wel puur huishoudgerichte economie, maar daar kun je wel iets heel moois
mee doen.
L: Maar iedereen vindt het interessant, want iedereen doet boodschappen. En dat is wel het
leuke.
A: In die zin is het wel jammer dat de euro al is ingevoerd, want die discussie die we toen
hadden van: ‘Is alles nu duurder geworden?’ Als die euro nou over vijf jaar wordt ingevoerd kun
je nu beginnen met al die prijzen. En dan tel je nog een paar jaar door en dan zeg je: ‘Ja, het is
wel zo’ of ‘Het is niet zo’.
Is het bij jou trouwens net zo, dat je zegt: ‘Ik heb geen voorkeur voor het economische’?
A: Iedereen heeft zijn interesses, maar het heeft er ook een beetje mee te maken: wat komt er op
je pad. In die zin is journalistiek natuurlijk puur opportunistisch.
Wat zijn je interesses dan vooral?
A: Ik vind demografie zelf interessant. Ik vind dingen rondom verkiezingen interessant, maar
eigenlijk alles wel. Het heeft er ook mee te maken.. Je kunt mij datajournalist noemen, maar
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
127
eigenlijk ben ik gewoon puur eindredacteur voor de binnenlandredactie. Ik heb op zich niet
zoveel tijd om andere dingen te doen. Als ik dat wel zo hebben, zou ik ook met sport dingen
doen. De Olympische Spelen komen eraan, je kunt heel veel statistiek doen. Er worden nergens
zoveel rare statistieken over verzameld als over sportwedstrijden, daar kun je natuurlijk hele
mooie dingen mee vergelijken. Ik kan zo gauw niet iets verzinnen.
Zijn er nog meer onderwerpen waar je graag mee bezig zou willen, maar op een of andere
manier komt het er niet van?
A: Wat ik net noemde, prijzen van bijvoorbeeld Albert.nl. Gewoon niet aan toegekomen om daar
iets mee te doen.
L: Is wel echt een leuke.
A: Ik wil nog, maar ik weet pas sinds een paar maanden dat dat bestaat, dat is - ik ben even de
naam vergeten - de Nationale Databank Weggegevens. Daarin wordt realtime van alle snelwegen
en provinciale wegen en volgens mij ook van de doorgaande stadswegen bijgehouden hoeveel
verkeer er rijdt en met welke snelheid het rijdt. Dat is live dus.
L: Dat gaat via die lussen in de weg.
A: En ook, er worden een paar gegevens gecombineerd. Onder andere die lussen in de weg, ik
denk dat dat een van de belangrijkste is, maar ook mobiele telefoongegevens. Hoeveel mobiele
telefoons komen er voorbij. Het zijn een paar databestanden die met elkaar gecombineerd
worden. Maar daar kun je.. De eerste gedachte die mensen hebben daarbij is: file-informatie.
Dat is heel belangrijk. Maar daar gaat het mij denk ik niet om. Ik zou eerder geïnteresseerd zijn
in economische ontwikkelingen. Zijn er nou gebieden die in of uit de gratie raken. We zitten hier
in een kantorenpark [vlakbij station Rotterdam Alexander] dat twintig jaar geleden in opkomst
kwam. Alle snelweglocaties. Daar ging iedereen werken, dus dat moest je ook zien in het
verkeersbeeld. Als er opeens elke ochtend heel veel verkeer hier in de buurt was.. Maar nu zie je
op dit soort locaties juist heel veel kantoren leegstaan, omdat het geen swingende locatie is. Dat
moet je op de een of andere manier merken. Je moet een maandagochtend van 1985 - bij wijze
van spreken, niet dat die data er zijn hoor - kunnen vergelijken met een maandagochtend in
2012. De mensen bewegen zich anders.
Als buurten uit de gratie raken, dat zegt ook iets over de economie. Ik rij zelf maar heel weinig
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
128
auto, maar het is mij opgevallen dat in 2009 toen de crisis net bezig was.. Ik moest toen een paar
keer door de Beneluxtunnel rijden. Normaal stond het daar altijd was en nu kon ik opeens elke
dag doorrijden. Dacht ik van: ‘Hoe komt dat nou?’ Zou dat nou komen door net die paar
vrachtwagens minder? Dat daardoor het verkeer doorstroomt?
Of dat je zoiets combineert met benzineprijzen.
A: Kun je ook naar kijken. Je kunt die data ook aggregeren, dat je er niet van weg naar weg naar
kijkt, maar op een iets hoger niveau. Dat je dingen goed beheert.
Maar hier je dus nog niets mee gedaan omdat je de data laat hebt ontdekt?
A: Het is er nog niet van gekomen. Maar ik wist pas in mei ofzo dat dit bestond. Dat bestaat ook
nog niet zo lang hoor, een jaartje pas.
Zijn er ook nog bepaalde manieren waarop je liever aan data komen? Bijvoorbeeld WOB’en of
opbellen?
L: Ja, hoe explosiever hoe beter. Open data is heel leuk en heel goed, maar dat betekent wel dat
alle anderen het ook kunnen nadoen of ook kunnen hebben. Ben je heel lang met iets bezig,
heeft iemand anders het ook al. Ik vind het het leukste als een dataset hebt waarvan anderen
zeggen: ‘Goh, wat leuk dat ze die heeft losgekregen’. Waar je gewoon weinig over hoort. Vlak
voordat ik wegging bij ANP was ik in gesprek met een zorgverzekeraar die.. Het leek mij heel
interessant om te kijken naar welk type contract mensen hebben en hoe vaak ze zich ziek
melden. Ik dacht: mensen met een vast contract melden zich veel vaker ziek. Dat is eigenlijk niet
iets wat zorgverzekeraars graag vrijgeven, die zitten echt op hun.. Van verzekeringen data los
krijgen lukt sowieso bijna nooit. Maar nu had ik iemand die echt wel begreep wat ik wilde. Het
ging niet om privacy, het ging ook niet om hun bedrijf in diskrediet te brengen. Het ging om het
inzicht in dat type contract. Die had dat helemaal door. Dat vind ik dan zo leuk dat je dan - ik wil
er nog steeds wel mee verder hoor - dat je dat dan los kan krijgen, want je weet dat niemand
anders dat heeft en het iets nieuws oplevert. Dat vind ik extra leuk.
Hebben jullie trouwens een WOB’er in dienst?
A: Wij hebben Wilmer Heck. Niet dat dat nu de WOB’er is, maar die is wel het aanspreekpunt.
En coördineert dat niet drie mensen tegelijk ongeveer hetzelfde WOB-verzoek sturen. En Dick
van Eijk is ooit min of meer pionier met WOB’en geweest. Misschien dat hij een van de eerste
twintig WOB’ers in Nederland was qua het eerste WOB-verzoek of zoiets.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
129
L: Het is niet dat iemand fulltime zit te WOB’en ofzo.
Is dat een manier waar jullie graag mee werken?
A: Ik moet zeggen: ik heb de WOB nog maar twee keer gebruikt. En een keer daarvan was puur
uit ergernis dat Rijkswaterstaat een bestand voor heel veel geld verkoopt terwijl het gewoon
overheidsinformatie is. Maar daar ben ik niet mee doorgegaan omdat ik het alleen maar deed
omdat ik boos was. Eigenlijk wel jammer dat ik er nooit mee door ben gegaan. Dat was het
actueel hoogtebestand. Zie je van elke vierkante meter hoeveel centimeter ten opzichte van
N.A.P. het is. Kost toen een miljoen gulden - het is dus lang geleden - terwijl het helemaal door
de overheid is verzameld en wordt beheerd. Belastinggeld, ik vind dat moet beschikbaar zijn
voor reproductiekosten. Ik dacht dan aan een paar CD-ROM’s branden, een paar tientjes
hooguit en geen miljoen. Ze hadden toen niet gereageerd op mijn WOB-verzoek en omdat het
niet een deel van mijn workflow was om daarmee door te gaan is het mij ontschoten.
En een ander ding, en dat sloeg eigenlijk op een van de vragen die jij stelde over dingen die niet
gelukt zijn, dat was met de gemeenteraadsverkiezingen van 2010, toen wilde ik van alle
kandidaten voor de gemeenteraadsverkiezingen de gegevens opvragen over hun geboortedatum,
sekse en woonadres. Dat zijn openbare gegevens, maar bij gemeenteraadsverkiezingen is elke
gemeente zelf het hoofdstembureau. De kiesraad heeft daar dan, behalve een paar data, niet echt
een functie bij. Er is dus geen centraal aanspreekpunt voor gemeenteraadsverkiezingen. Ik heb
toen alle gemeenten ge-e-maild, telefonisch ging dat natuurlijk niet, dat zijn er gewoon te veel,
met de vraag: ‘Kunt u mij deze gegevens geven?’ Sommige gemeenten reageerden direct met de
gevraagde gegevens, maar ja, heel veel gaven of geen antwoord of gaven wel de gegevens, maar
alleen de namen en niet de leeftijden of de adressen. En toen kwam ik er ook nog eens achter,
omdat de adressen altijd wel openbaar waren, dat Binnenlandse Zaken kennelijk vlak voor de
verkiezingen aan de gemeenten bericht had gestuurd, dat ze niet meer hoefden in te gaan op de
vraag: ‘Mogen wij de adressen hebben?’ Vanwege de privacybescherming. Dus je moet nu, als je
wilt weten wat de adressen zijn, naar het gemeentehuis toe om daar de lijsten in te zien met alle
adressen.
Dus ze mogen de informatie nog wel laten zien..
A: Ze móéten het laten zien, want het is openbaar, maar ze hoeven het niet meer per e-mail ofzo
toe te sturen aan mensen. Maar sommige gemeenten hadden dat kennelijk over het hoofd
gezien, want die hadden toch gemaild. Maar ik wist dat pas halverwege het proces, dat
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
130
Binnenlandse Zaken dat bericht had gestuurd. [Bij] een aantal gemeenten [heb ik] ook nog, toen
ze hadden afgewezen, een beroep op de WOB gedaan. En ik wist wel, de verkiezingen kwam
eraan - het was in januari geloof ik dat ik dat deed en de verkiezingen waren in maart - ik wist
wel dat ik die procedure nooit zou gaan volgen natuurlijk. En bovendien moet je dat dan
vierhonderd keer of een paar honderd keer doen en dat is gewoon te veel. Maar uiteindelijk is
dat hele project gewoon niet gelukt om teveel gemeenten moeilijk deden. En de meesten die
moeilijk deden die hadden het niet eens over de brief van Binnenlandse Zaken, maar die zeiden
gewoon: ‘Daar hebben we geen zin in’ of ze reageerden niet of ze stuurden de verkeerde
gegevens, dus niet alles wat ik vroeg en gingen daarna niet meer op mijn vraag in. Gewoon
onwil, eigenlijk.
Dat zou je ze nog wel een dwangsom kunnen opleggen, maar dat is gewoon teveel moeite?
A: Ehm, ja, het is gewoon teveel. Je kunt niet in je eentje - het waren toen 430 gemeenten, geloof
ik - laten we zeggen dat er 250 of misschien wel 300 niet of niet juist op mijn vraag hadden
geantwoord. Ik kan niet in mijn eentje 300 procedures volgen. En zelfs de hele krant kan dat
niet. Dat moet je iedereen aan het werk stellen.
L: Gemeentes hebben heel veel interessante gegevens, maar het is te ingewikkeld.. Alle
gemeentes hebben niet eens een eenduidig e-mailadres waarop je ze kunt bereiken. Met
politiekorpsen ook, dat is wel een heel stuk minder, maar iedereen houdt het voor zichzelf bij en
op een andere manier. Zo kun je dus helemaal nooit iets met politiecijfers doen, want ze zijn
niet met elkaar te vergelijken. Dat is echt wel waardoor projecten mislukken.
A: Ik wist inmiddels wel van de Kiesraad hoe de uitkomst, de output van de verkiezingssoftware
eruit zag. Van sommige [gemeenten, jk] ik kreeg ik precies zo’n tabel netjes in een
computerformaat. Van andere kreeg ik dan een printje wat dan gescand was.
L: Ja echt? [Kreunt]
A: En die scan was dan weer als een TIFF of een JPEG’je naar mij ge-emaild. Dat kan onkunde
zijn, omdat ze gewoon niet weten hoe ze iets in een ander formaat moeten doen, maar het kan
ook puur.. In Amerika weet ik dat het heel vaak gebeurt dat ze dat doen, zodat ze aan de
wettelijke verplichting hebben voldaan: de informatie is er. Maar een gescande PDF, ja, daar
kun je bijna niks mee. Dat kun je wel door OCR-software# sturen, maar dat moet je allemaal nog
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
131
controleren. Dus dat is zo’n enorme hoeveelheid werk.
L: Daarom is het wel goed dat dit met de nieuwe WOB gaat verbeteren, als het goed is.
Daar staat in dat je het in een digitaal bestandsformaat moet aanleveren?
L: Ja, waar je iets mee kan, volgens mij staat dat er in.
En heb je ook weleens overwogen om lezers in te zetten of samen te werken met andere
organisaties?
A: Lezers inzetten nooit overwogen. Jij?
L: Ja, bij Sargasso wel, maar daar heb je het denk ik uitgebreid met Dimitri over gehad. Heeft
Dimitri verteld over een bouwproject wat we wilden doen?
Hij heeft het vooral gehad over de camera’s.
L: Wat we ook hadden gedaan.. We wilden wel eens weten.. Je hoort altijd alleen maar over
bouwprojecten die over hun budget heen gaan en die ver over tijd zijn. We wilden wel eens
kijken of dat echt iets is dat altijd gebeurt of zijn er ook heel veel bouwprojecten waar het goed
gaat? Gaat het juist bij overheidsprojecten mis of ook bij particulieren? Ik weet wel wat er bij mij
om de hoek gebeurt, maar niet wat er in de Kerkstraat in Breda gebeurt, dus toen wilden we er
met behulp van lezers proberen erachter te komen. Dat hebben we toen samen met Altijd Wat
gedaan, maar dat gaf veel te weinig respons, dus dat was ook een mislukt project. Ik vind het
nog steeds superinteressant om erachter te komen, maar er is nog geen databestand van.
Sargasso heeft het al een paar keer gedaan. Op de een of andere manier verwacht ik het bij een
krant ook niet zo snel. Maar jullie hebben wel een veel grotere achterban.
A: Ja, maar je moet denk ik heel goed.. Beroemdste voorbeeld is natuurlijk van de Guardian, met
de bonnetjes. Je moet natuurlijk heel erg oppassen hoe je het doet en wat je doet. En mensen die
er aan meedoen moeten er ook niet al te veel tijd aan besteden. Wat die lezers toen volgens mij
kregen was een willekeurig bonnetje. En dan de keuze: ‘Is dit een interessant bonnetje: ja of
nee?’ Als je dat zo aanbiedt heb je natuurlijk iets waar mensen in hun lunchpauze wel eventjes
een paar minuten aan willen besteden en daarna kunnen ze het vergeten, maar dan heb je in
ieder geval wel een voorselectie gekregen. Maar de vraag van: ‘Zijn er bouwprojecten bij u in de
buurt die ergens aan voldoen?’, daarmee zadel je mensen met heel veel werk op.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
132
L: Ja, dat is ingewikkeld.
A: Het zou natuurlijk heel mooi zijn als mensen daaraan mee willen werken, maar ik denk dat
niemand daar zin in heeft. Ik heb al niet eens zin als ik op een website kom en er komt zo’n pop-
upje: ‘Mogen we u twee minuten vragen stellen?’
L: Ik ook niet. Je moet het altijd toch zelf doen. Want het is vaak ook heel onbetrouwbaar.
Je kunt hen niet checken natuurlijk, zelfs als het er geloofwaardig uit ziet.
A: Ja en dat was het mooie van The Guardian. Het was alleen maar de vraag: ‘Is dit een
interessant bonnetje of niet?’ En de meesten zullen niet interessant zijn geweest, want die
gingen om een puntenslijper van tien cent, dus ja, daar moet je dan maar op vertrouwen, omdat
je uit die enorme berg data nooit alles kunt bekijken, omdat het ook alleen maar gescande
dingetjes zijn natuurlijk. En als lezers met duizend bonnetjes aankomen, kun je die allemaal
bekijken. En dan zie je waarschijnlijk wel duizend keer porno-dvd’s of weet ik wat voor rare
dingen.
Hoe ziet jullie workflow er standaard uit?
A: Ik denk dat er geen standaard is.
Maar gaat het bijvoorbeeld in de volgorde verzamelen, opschonen, verwerken..?
L: Die stappen die worden beschreven, die kloppen wel. Alleen niet alles doe je. Soms is data al
schoon, wordt het gewoon schoon uit een database gedraaid. Nou, klaar is Kees. En bij het ANP
deden we bijvoorbeeld vaak niets aan visualisatie. Dat is wel, ik weet niet.. Je hebt Jelle en Jerry
vast ook gesproken, of niet?
Jerry ga ik nog spreken. Van Jelle weet ik niet of hij kan en wil praten over RTL.
Bijvoorbeeld om Jerry die nu bij Nu werkt als uitgangspunt te nemen. Hij doet volgens mij heel
andere vorm van datajournalistiek dan wij doen of ik bij Sargasso of ANP deed. Want hij zoekt
heel vaak data bij verhalen, daarom moet het ook zo snel bij hem. Anders verdwijnt het verhaal
van de voorpagina en maakt het grafiekje dat hij erbij maakt niet uit. Bij hem is juist de vorm
heel erg belangrijk en veel minder dat hij echt zelf trends zoekt in data en daar heel veel
verhalen uit haalt. Dat is natuurlijk wel zijn ambitie, maar dat verdwijnt een beetje naar de
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
133
achtergrond omdat hij heel veel met dat visualiseren bezig is. Per medium leg je wel op een hele
andere manier de nadruk. Bij het ANP kan je bijvoorbeeld helemaal niets met visualisaties doen.
Dat doet Jerry dan weer wel. Maar globaal denk ik dat die stappen, bijvoorbeeld op de site van
The Guardian hebben ze een stappenplan gemaakt, dat klopt denk ik wel grotendeels.
Dimitri vertelde soms dat hij aardig snel naar de stap van visualisatie gaat, puur omdat hij
dan zelf kan zien wat er aan de hand is. En dat hij dan vervolgens weer teruggaat naar het
begin.
A: Wat ik zelf doe, om aan te geven hoe belangrijk visualisaties zijn.. Als ik een bestand krijg - en
als ik dat in Excel kan openen dan doe ik dat - wat ik dan altijd als eerste doe is heel erg
uitzoomen in Excel. Dat kan he, dat je het werkblad op tien procent zet. Dan zie je niet meer wat
er staat, maar dan zie je wel een tabel. En als dat er visueel raar uitziet, dan zoom ik in op de rare
plekken en kijk ik: is daar iets verkeerd gegaan met het importproces? Alsof je de tabel uitprint
en vijfentwintig meter verderop gaat staan en dan kijk je: ‘Is dat nu een mooi patroontje, had je
dit als behangrol kunnen gebruiken?’
L: Wat grappig!
A: En soms zie je dat het rechterrandje opeens een bulpje heeft. Was het een CSV-bestand
bestand, wat met komma’s gesepareerd wordt? Dan kan het zijn dat er ineens komma’s die
eigenlijk tekstkomma’s zijn, dat die als separeerkomma’s zijn gezien. Dat heb je heel snel door
met puur visualisatie. Dat is een hele goede tip denk ik. Maar het laat ook zien dat visualisatie
heel belangrijk is. Je kunt ook puntenwolken maken bijvoorbeeld. Stel: je vraagt je af of er een
verband is tussen de lengte van een hardloper en hoe snel hij aan de finish is. Als je daar de
gegevens van hebt, dan maak je daar eerst een puntenwolkje van. Als dat een mooi wolkje is, wat
een beetje bij elkaar zit, dan heb je een verhaal. Als het allemaal in een cirkel staat: laat maar
gaan, daar hoef je niet eens verder naar te kijken.
L: Dat vind ik ook. Heel veel dingen, zeker die demografische dingen, die gaan op gemeente-,
wijk- of postcodeniveau. Daar zie je niets in als het in een tabel staat. Dan gooi ik het ook altijd
even in een kaart.
Zelfs al gebruik je die kaart uiteindelijk niet voor je verhaal?
L: Misschien wel juist. Uiteindelijk gebruik ik misschien wel een kaart voor het verhaal, maar
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
134
dat is dan een kaart vijf versies verder. Maar het verhaal zie je pas als je het op een kaart neerzet.
Of bijvoorbeeld een lijndiagram. Bij de analyse gebruik ik ook zeker visualisatietools.
Gaan jullie voor de uiteindelijke vormgeving ook naar een afdeling vormgeving en vertel je
dan precies hoe je het wil hebben?
A: Wel voor de papieren krant. We hebben een studio waar mensen heel mooi dingen in
Illustrator en Photoshop kunnen maken. Ik geef wel altijd gegevens aan ze die, zoals ik ook bijna
al wil dat het eruit komt te zien. Alleen zij kunnen het mooier maken en ik ben geen kunstenaar.
Ik ben ook al lang blij dat zij daar zitten. Maar op het web: eigenlijk is er gewoon helemaal geen
geld voor dingen op het web maken. Ik blijf het doen. De krant had een strategie tot twee jaar
geleden: ‘We gaan alles op het web doen en het web wordt een betaalmuur en alles wat we doen
moet eigenlijk op de site komen’. Zo ben ik ook mijzelf visualisaties op het web aan gaan leren.
Ik dacht van: ‘Dat wordt mijn toekomst’ [lacht]. Die strategie is helemaal veranderd. Die website
heeft een eigen redactie van een paar man, eigenlijk. En dat moet snel nieuws zijn. Wat op zich
goed is hoor, dat is geen kritiek op die strategie. Alleen, zoals stembureau-uitslagen enzo, dat
mag die redactie eigenlijk niet meer doen. Maar ja, ik had mij net aangeleerd in de jaren
daarvoor hoe ik die geografische visualisaties moet doen, tja, dan ga ik het ook gewoon doen.
Dus eigenlijk mag een krantenredacteur niet aan de website..
A: Nee, eigenlijk mag dat niet. Kijk, er is niemand die met een scheidsrechtersfluit achter je gaat
staan als je het doet.
Maar dat is om dubbelwerk te voorkomen?
A: Het komt er eigenlijk op neer dat.. Het heeft voor een groot deel.. Grofweg heb je nrc.next,
NRC Handelsblad en NRC.nl. De eigenaren van ons willen - en dat geldt voor alle bedrijven -
kijken: ‘Zijn al die afdelingen rendabel?’ Dan moet je weten hoeveel mensen hebben zijn in
dienst, wat kosten die mensen en wat zijn de opbrengsten uit de verkoop van dat medium. Dat
kan je alleen maar doen als mensen niet voor iedereen werken, want dan weet je niet hoeveel
mensen er eigenlijk bij next werken. Dat is nu veel helderder omdat er nauwelijks meer
wisseldiensten zijn, die je een paar jaar geleden wel had.
L: Nu worden er alleen maar artikelen doorgeschoven, haha.
A: Waarschijnlijk wordt er een soort bedrag gehangen aan een artikel dat in NRC Handelsblad
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
135
wordt geschreven. Dat wordt in nrc.next doorgeplaatst en ik neem aan dat next dan virtueel geld
moet betalen aan NRC Handelsblad. Zo werkt dat bij alle bedrijven hoor, daar is niets raars aan.
Vind ik ook alleen maar goed. Je moet weten of dat wat je doet geld oplevert. Maar het nadeel is
dus dat je niet meer van elkaars expertise kunt profiteren. Veel minder makkelijk. Maar als ik
een mooi project heb en ik kan er een interactieve kaart bij maken, dan doe ik dat gewoon.
Zijn jullie er wel eens tegenaan gelopen dat iets heel mooi online zou kunnen, maar..
A: Nee.
L: Ik denk wel dat het hier zo is dat.. De krant is gewoon het grootste verdienmodel. Als er een
heel gaaf verhaal in de krant staat, dan zet je misschien een teaser op de site. Maar uiteindelijk
wil je dat mensen die krant kopen. Terwijl de aandacht genereren met zo’n gaaf data-artikel doe
je met de krant en niet met online. En dan is het wel zo met zo’n CBS-kaart bijvoorbeeld, daar
heb je niets aan in de krant. Want dat past niet op papier.
A: Er was wel een spreadsheet, maar daar laat je een paar voorbeelden zien.
L: Maar dat interactieve dat is echt iets wat alleen maar op het web kan. Daar verwijs je dan ook
naar, maar dat is meer service. Dat moet je heel leuk vinden. Ik snap wel dat de krant daar niet
vijf redacteuren op gaat zetten. Dat kan gewoon niet uit.
A: Dat ik dat toen gedaan heb.. Het leuke wat ik zelf vond.. Mensen bleven daar maar naar
kijken. De totale hoeveelheid mensen die het hebben gezien was misschien niet eens zo groot,
maar mensen bleven er heel lang, er werd heel veel over getwitterd. Dat geeft natuurlijk ook wel
een goede naam aan NRC Handelsblad als krant. In die zin is het wel geld waard. Dus het is niet
zo dat het voor mij hobbyisme is en dat de hoofdredacteur daar boos over is. Die zit natuurlijk
ook wel dat dit iets innovatiefs geeft aan NRC Handelsblad. Van: ‘Hier werken mensen die wat
kunnen’ of zoiets.
Maar zoiets als een datablog van The Guardian is dus niet wat jullie graag zouden willen?
A: Ik weet het niet. Waar ik zelf, maar dat is puur mijn persoonlijke mening, maar ik vind: je
moet je energie vooral steken in je werk, in plaats van altijd maar over je werk te praten. Ik vind
datajournalistiek heel belangrijk, ik vind het leuk dat jij hier bent, maar als ik op alle
uitnodigingen enzo was ingegaan.. Dan ben je alleen nog maar meta aan het praten: ‘Dit zou
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
136
mooi zijn’, ‘Dat zou mooi zijn’, ‘Heb je gezien wat die mensen gedaan hebben?’. Dan dat je nu
echt wat doet. Zo’n datablog ja.
L: The Guardian zet daar ook wel datastukken op. Ze doen nu af en toe iets meta’s, maar niet
heel vaak.
Dat bedoelde ik inderdaad. Dat je die stukken online ziet staan.
A: Maar er zijn niet zoveel stukken. Dan zou het eens in de maand ofzo geupdate worden.
L: Dat is denk ik wel het grote verschil: The Guardian heeft ook wel vaak - ik wilde dat dat bij
het ANP ook wel eens kon, in plaats van dat er altijd een newsangle in moest zitten - iets als:
‘Hoe zit het met de tienermoeders in Engeland?’ Dan zetten ze daar een kaart en een dataset bij
en dat is het voor hun dan. Maar dat zou voor NRC nooit voldoende zijn. Daar moet altijd een
verhaal achter. ‘Is er iets gebeurd met de tienermoeders? Laat een tienermoeder aan het woord.’
A: Je kunt heel makkelijk zeggen: ‘Ineens veel minder tienermoeders’.
L: Maar dan moet dat er wel in zitten.
A: Of de kop mag ook zijn: ‘Tienermoeders een voortdurend probleem’, als ze niet af- of
toenemen.
L: Dat zou inderdaad kunnen.
Dat was ik bedoelde met die doelstelling. Dat je werkt vanuit het idee dat er een verhaal in
moet zitten.
A: Niet zozeer een verhaal, maar ook gewoon nieuws. Maar nieuws is een heel ruim begrip. Wat
ik net zei van tienermoeders - als het constant blijft kan het ook nieuws zijn dat het gelijk blijft.
L: Maar dan is het nieuws: ‘Beleid heeft geen invloed’. Als er beleid op wordt gemaakt.
Ik zou het als lezer alleen al interessant vinden, ook al is het ontzettend vanzelfsprekend, dat je
bijvoorbeeld in bepaalde steden ontzettend veel tienermoeders hebt en in andere gebieden niet.
A: Maar dan nog.. Ik ben ooit bij de krant gekomen in 1996 om alleen maar graphics te maken in
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
137
een papieren bijlage.
Was dat Profiel?
A: Ja, precies. Toen ik hier na een tijdje ervaring in kreeg heb ik voor de krant de regel opgesteld
- en die regel geldt nog steeds, de Arlen Poort-regel boven graphics: er moet altijd een
nieuwskop boven staan. Er moet een kop staan die laat zien wat je kunt zien in die graphic.
Bijvoorbeeld: ‘Meeste moorden in Amsterdam’ en dan zie je een kaartje waar Amsterdam uit
sprint. Of: ‘Dip in inflatie’ en dan zie je de inflatie dalen. Volgens mij is dat gewoon wat je als
krant moet doen. Het gaat over nieuws. Dit zijn dingen die nieuws zijn, maar we laten ook zien
aan een lezer: waarom moet ik dit lezen en wat kan ik hieruit concluderen. Je moete mensen een
beetje bij de hand nemen. Dat moet je niet paternalistisch zien, maar.. Je moet niet zomaar iets
over de schutting flikkeren bij een lezer of een bezoeker van je website en zeggen: ‘Zoek het maar
uit’. Je moet laten zien: ‘Dit is interessant, want..’
L: Daar ben ik het zeker mee eens. The Guardian doet dat vaak niet en als je het bekijkt vanuit
het idee van NRC, dan zouden wij het moeten doen voor in de krant. En dat kleine hapsnap
nieuws, dat kost ons meer tijd dan wanneer het CBS met iets komt, dus dat is niet echt de
moeite. Dan kun je beter je energie steken in wat grotere projecten. En daar past zo’n
Guardianblog weer niet bij. Dat is wel echt een verschil in visie, ik weet zeker dat Jerry hier
anders over denkt bijvoorbeeld. Of ik weet van RTL - niet van Jelle, maar van die mensen zelf -
dat ze zeggen: ‘Of de opening van het half acht Nieuws of laat maar zitten’. Dat is een beetje
gechargeerd gezegd.
Beetje alles op niets.
L: Precies.
A: Wij hadden een spread over het slechte weer, gecombineerd met de Vierdaagse. En ik had
daar drie graphicjes bij gemaakt, over alle zomers van 1970 tot nu toe. Dus van 1 juni tot 16 juli,
gewoon: hoeveel uren zon, hoeveel uren regen. Dat zijn gegevens die op de website van het
KNMI staan. Alle daggegevens kun je downloaden, gooi je in Excel, maak je kleine selectie van,
draai je een beetje om, je kneed het een beetje, hoppakee: leuk grafiekje, uurtje werk. Dat is ook
een vorm van datajournalistiek die er niet zo uit ziet. Dat is alleen maar een illustrerende
graphic die wel meteen de vraag beantwoordt: ‘Is dit nou de slechtste zomer zolang ik mij kan
herinneren of niet?’ Was niet zo. Dat is ook een vorm van datajournalistiek die puur service is en
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
138
gewoon het geven van de feiten. Dat was geen groot nieuws, maar wel illustrerend. Het geeft wel
informatie. Maar dat zijn geen grote projecten, dat kost een uurtje.
L: Dat zou wel een los artikel op zo’n datablog worden, om de vergelijking te trekken.
A: Daar zou ik dan geen zin in hebben, om dat op een datablog te zetten.
L: Precies, dat is niet.. Nee, je moet het bij de krant houden.
A: Tenzij zo’n datablog nu een miljoen bezoekers per dag trekt en ook geld genereert. Dan is het
wat anders. Maar anders is het echt parels voor de zwijnen gooien.
Denken jullie wel eens vooruit: stel, we zijn een paar jaar verder, de krant wordt vooral op
iPads gelezen? Zou je dan bijvoorbeeld meer met infographics gaan werken dan met vaste
plaatje?
A: Dat ik die interactieve kaarten publiceer.. Ik probeer mijn eigen kennis op peil te houden om
interactieve dingen te maken.
L: Dat is wel waar het uiteindelijk meer naartoe zal gaan. Als je kijkt naar de oplage van de iPad-
abonnementen: dat gaat wel omhoog. Tuurlijk, daar zit wel toekomst in.
A: Ik hoop het zelfs.
Maken jullie ook wel eens iets speciaal voor de iPad?
A: Nee. We proberen wel dingen.. De kaarten die ik maakte werkten voorheen niet op de iPad,
maar dankzij de nieuwe versie van het open sourceprogramma Open Layers, niet genoeg te
prijzen, werkt het nu wel op de iPad. En ik heb wel alle kaarten op de service gezet. maar ik
moest een aantal dingen op de kaart aanpassen. En dat heb ik gedaan. Gewoon omdat ik het
heel belangrijk vindt dat mensen dat op hun iPad kunnen zien.
L: Maar die is niet apart in de app toch?
A: Nee, gewoon op de website. De app is eigenlijk gewoon de papieren krant waar je door je
beeldscherm naar kan kijken.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
139
L: Ik denk, over twintig jaar wordt het een beetje Harry Potter-achtig.# Maar nu..
Nu is het gewoon een soort PDF?
L: Ja, maar dat is voor alle kranten zo. Ik lees ook de Volkskrant-app, die gebruikt hetzelfde
techniekje als wat andere kranten gebruiken. Bijvoorbeeld Wired maakt echt een aparte editie
voor de iPad, maar zo ver zijn kranten in Nederland nog lang niet.
A: Dat heeft er ook weer mee te maken.. Je ziet de iPad-abonnees toenemen, maar in zijn totaal
is misschien vijf procent of minder dan je totale aantal abonnees. Ja, hoeveel geld ga je
investeren in zo’n kleine groep? Maar je kunt tegelijk denken: als je er meer investeert, wordt die
groep groter. Maar dat is de vraag: hoe ga je investeren? Uiteindelijk zal het wel gebeuren, maar
of dat over drie jaar of over tien of twintig jaar is..
L: Maar het is wel mooi om de kennis die we nu opbouwen, die kun je uiteindelijk daarin
toepassen. Dat is wel mooi eraan.
Doen jullie na publicatie nog iets met updates?
A: Eh, ligt eraan wat je update noemt. Het nieuws is elke dag anders.
Maar als je een artikel hebt gepubliceerd: bijvoorbeeld het CBS-artikel.
A: Stel dat ze over twee jaar nieuwe postcodegegevens hebben, dan kan ik ook vergelijkingen
maken tussen toen en nu.
L: Maar dat is dan weer een nieuw artikel.
A: Je moet volgens mij niet.. Dat is het lastige denk ik op het web. Als je dingen gaat updaten,
moet je heel goed nadenken over wat echt nieuw is en wat een beetje nieuw is. Volgens mij kun
je dan beter voor het echt nieuwe gaan en een nieuw artikel publiceren met nieuwe..
L: En daar kun je dan wel weer de niet heel erg newsy informatie onder hangen, dat je daarna
weer een zo volledig mogelijke set gebruikt. Maar mensen vinden dat ook niet meer. Het is nooit
zo dat er nog 100.000 hits komen op iets dat al drie weken geleden is gemaakt. Dus het is de
moeite gewoon niet.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
140
Wat zouden jullie graag toevoegen aan de werkwijze wat nu nog niet kan? Bij de BBC hebben
ze bijvoorbeeld een team waar de vormgever ook een beetje data aankan en een beetje kan
schrijven.
A: Ik zou wel willen dat er meer mensen zijn die dit werk ook kunnen doen. Omdat je dan meer
interactie en ideeën van mekaar hebt. De beste ideeën krijg ik in ieder geval als ik met anderen
praat. En als er helemaal niemand is die op de manier kan denken zoals jij denkt, dan voel je je
een beetje eenzaam. Daarom ben ik blij dat ik voor een groot deel gewoon eindredacteur ben,
anders is het helemaal zo’n eiland.
L: Ja, alleen datajournalistiek doen is wel een beetje veel.
Je bedoelt: ‘in je eentje’ of ‘puur en alleen met datajournalistiek bezig zijn’?
L: Allebei. Dataprojecten duren vaak lang. Ik ben zelf redelijk goed met computers, maar ik zou
graag beter willen kunnen programmeren, omdat dat de hele tijd de dingen zijn waar ik
tegenaan loop. Ga ik toch weer een hele middag zitten proberen en lukt het uiteindelijk niet.
Gaat er weer een dag overheen als ik iemand anders moet vragen die me wil helpen. Als je daar
een programmeur bij hebt zitten - voor mij zou dat twee keer zo snel gaan. Dat versterkt elkaar
een beetje. Of als een vormgever er naar kijkt en zegt: ‘Wow, dat is gaaf!’ Ik ben van huis uit geen
vormgever, ik denk meer in vragen. Dus ja, dat geeft natuurlijk een beter beeld.
Wat zie jij als grootste verschillen tussen NRC en Sargasso qua datajournalistiek?
L: Zover ben ik nog niet, ik werk hier nog maar twee-en-een-halve week. Waarom ik het wel heel
leuk vind om hier te gaan werken is dat het niet alleen datajournalistiek is. Ik ben voor een heel
groot deel factchecker - die rubriek aan het begin van next - en dat vind ik heel leuk: dat je
dagelijks met iets bezig bent wat morgen in de krant kan staan. Terwijl je op dataprojecten soms
wel drie weken je tanden kan stuk bijten. En uiteindelijk blijkt het misschien wel niets te zijn, bij
wijze van spreken. Dan kabbelt het een beetje voort. Ik vind die urgentie en afwisselijk nu heel
leuk. Maar goed, dat factchecken heeft niet zoveel met datajournalistiek te maken.
Maar het grootste verschil met ANP en hier is wel de manier van presenteren. Laatst had ik
hier met Oscar, van de Haagse redactie, een verhaal over hoe de toekomst van de Tweede Kamer
eruit gaat zien. De peilingen plus tien procent van het aantal zetels is ongeveer de demografie
van de Tweede Kamer die er na 12 september zal gaan zitten. Daar hadden we een verhaal over
gemaakt. Dat kan dan in next op de voorpagina en op pagina vier en vijf en in Handelsblad ook
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
141
nog op twee pagina’s. Met graphics erbij. Dat kan nooit bij het ANP. Dan klinkt het heel erg
eigengeilerij als ik denk: ‘Mijn ding moet er groot in’, maar het is meer dat je er veel aandacht
aan besteed. Het is niet: je belt iemand en klaar is Kees, wat veel stukken natuurlijk ook wel zijn.
Handmatig waren al die dingen bij elkaar gezocht. Bij het ANP zou het verdwijnen in een
berichtenstroom met 2000 tekens en dat is het. Dat is wel een van de redenen voor mij om ook
hiervoor te kiezen, omdat er veel meer presentatiemogelijkheden zijn.
Wanneer kwam jij in aanraking met datajournalistiek?
L: Ik vond statistiek al heel interessant tijdens mijn bachelor [Communicatie- en
Informatiewetenschappen, jk], maar de reden dat ik dit uiteindelijk daadwerkelijk ben gaan
doen is dat ze bij mijn opleiding voortdurend zeiden: ‘Kies een niche, kies een niche, anders kom
je er niet’. Dat blijkt ook wel zo te zijn, want ik koos dit en direct sprak ik met Dimitri en een
maand later had ik een baan. En nu heeft Rob me bij Dimitri weggeplukt omdat er zo weinig
mensen zijn die het doen. Want degene die dat hier deed gaat naar Moskou. Dat werkte dus en
dat was voor mij een van de belangrijkste redenen om me hierin te verdiepen. Buiten dat ik het
interessant vond. Maar zo ben ik er wel heel snel ingerold. Het was nog zo klein dat als je je een
beetje mengt en je kop boven het maaiveld uitsteekt dat iedereen je ook ziet.
En wat was het eerste van datajournalistiek dat je zag? Waardoor je überhaupt op het idee
kwam dat het een niche voor jou zou kunnen zijn?
L: Dat weet ik niet. We hadden vijf of zes richtingen waarin je je scriptie kon schrijven. En dat
waren een beetje de begeleiders die daarbij hoorden. Toen heb ik daar voor gekozen. Mijn vorige
scriptie ging over digitaal lesmateriaal, dus dat past er goed bij. Namelijk op een digitale manier
ingewikkelde informatie ontsluiten en lieftst ook nog met infographics.
[Laura verlaat gesprek, moet weer aan de slag.]
Zijn er bepaalde websites die je in de gaten houdt? Bepaalde beats?
Wat ik altijd leuk vind is Flowing Data, daar kijken volgens mij heel veel mensen naar. Van
Nathan Yau - ik denk dat hij een Chinees is. Eigenlijk verzamelt hij vooral interessante of juist
slechte - maar dat zijn daarom ook interessante - voorbeelden van visualisaties. Dat zijn twee of
drie postings per dag. En dat kan echt van alles zijn. Grappige cartoons, die toch iets over
datavisualisatie zeggen of echt interessante nieuwe onderwerpen die bij een of andere krant
online zijn gezet. Maar dat is meer gewoon leuk om te zien. Kan soms inspiratie zijn, soms alleen
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
142
maar leuk.
Maar ook sites voor bronnen? Rijksoverheid, CBS?
Ja, ik ben geabonneerd op alle RSS-feeds van het CBS. Dat zijn denk ik vijftien berichten per
dag. Maar het meeste gaat over economische onderwerpen die heel erg gaan over een bepaalde
sector. Dan denk je: ‘Zal wel’. Maar zo zie je wel alles wat het CBS elke dag publiceert. En dat is
toch wel een van de belangrijkste bronnen. Voor de rest probeer ik wel eens in de zoveel tijd
dingen in de gaten te houden, maar dat gaat niet altijd even gestructureerd, over de open data
website van de rijksoverheid. Nationaal Geo Register, dat is een beetje een vreemd website
waarin alle open geografische bestanden van de overheid zitten. Ook lang niet alles trouwens
hoor. En ook heel veel dingen van gemeenten, dus alleen de gemeente Eindhoven. Dat kan op
zich interessant zijn als je voor het Eindhovens Dagblad werkt, maar voor ons natuurlijk
helemaal niet. Dat soort dingen hou ik wel in de gaten. Maar het belangrijkste is misschien wel
de RSS-feeds van het CBS, denk ik.
Zijn er ook nog onderwerpen die jouw persoonlijk aanspreken?
Eh, verkiezingen is eigenlijk van oudsher.. Mijn allereerste verkiezingen waren in 1998, gewoon
omdat in de bijlage Profiel zouden de verkiezingsuitslagen komen. En Dick van Eijk had toen -
toen werkte ik hier nog niet - voor het eerst van die kaarten gemaakt. Dat was de allereerste
keer dat de uitslag op kaarten stond.
Dat heb ik gelezen inderdaad. Op die oude computers.
Toen gloednieuwe computers, in 1994 had hij het gedaan. Maar nu werkt dat in een paar
seconden, of minder, maar toen was je echt een paar uur aan het rekenen op een oude MS-DOS
computer, als je iets wilde laten zien. Maar goed, ik werkte hier toen nog niet, maar toen ik die
kaarten zag als abonnee dacht ik: ‘Wow, dat is interessant, dit wil ik ook kunnen’. Maar goed,
sinds 1998 heb ik altijd de verkiezingsuitslagen gedaan. Later ook op het web. Als ik ziek ben,
dan zijn ze er niet, bij wijze van spreken. Het is een beetje van mij geworden. Niet dat is de baas
ben geworden.
Verandert de aanpak ook nog?
We hebben sinds 2010 interactieve kaarten op web, wat we daarvoor niet hadden. We hadden
wel.. Dick van Eijk heeft toen zelf wel eens HTML image maps# gemaakt. Maar daar kun je niet
op inzoomen, dat is veel rudimentairder. Dat is eigenlijk gewoon een GIF’je# waar je op kunt
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
143
klikken en dan komt er iets tevoorschijn, maar dan veel rudimentairder. Maar eigenlijk verschilt
de aanpak ervan niet. Want op de verkiezingsavond wil je gewoon weten: wat is de totale uitslag
en wat is er gestemd in de gemeente waar ik woon. Maar de kaarten van nu zijn weliswaar live,
maar bieden niet meer informatie dan die kaarten uit 1994. Want er is ook niet meer informatie
beschikbaar. Het zijn verkiezingen, dat is het nu eenmaal.
En je bent begonnen in..
Ik ben stage gaan lopen in 1995 en in 1996 in dienst gekomen voor de Profiel-bijlage. Ik was als
kind altijd gek op landkaarten en op de Bosatlas. Maar ik kwam hier toen om infographics te
maken. Er was één PC op de krant, een Windows 95-PC, toen net nieuw. Ik had al heel snel
Excel ontdekt. Voor infographics moet je vaak getallen hebben en die moeten gestructureerd
zijn, dus heel vaak was ik dingen van papier aan het overtikken. Internet ging gewoon met een
geluidsmodem, heel langzaam dus. Het CBS kwam net met Statline, maar dat was nog niet op de
website. Dan kreeg je elke maand een CD-ROM. Maar goed, ik heb toen wel heel snel ontdekt
dat - alleen al door Excel veel te gebruiken - dat je daar interessante dingen mee kan doen.
Aanvankelijk, als ik dan een graphic moest maken.. Dat kon elke week een ander onderwerp
zijn. Stel dat ik wilde weten hoeveel, verzin maar wat.. Van 1980 tot 1995 hoeveel mensen er in
Nederland woonden. Dat zocht je aanvankelijk naar 1980: zoveel miljoen. 1981: zoveel miljoen.
Maar op een gegeven moment zag je: er zijn ook bestanden waar het per gemeente staat. En dat
kun je dan wel groeperen, zodat je hetzelfde grafiekje kunt maken, maar je kunt ook kijken: is er
een regionale verandering. Zo ga je langzaam dingen ontdekken van bestanden die niet hetzelfde
zijn als wat je publiceert in de krant. En als spelenderwijs eigenlijk ben ik er ingerold.
En die cursussen bij IRE, wanneer waren die dan ongeveer?
Ja, ik ben een keer bij NICAR geweest. Daar heb ik heel veel aan gehad. Vooral omdat ik daar
een beetje heb leren programmeren. Dat was zoiets als een VVOJ-conferentie, maar daar heb je
dus tientallen onderwerpen waar mensen over praten. Maar ik heb toen drie verschillende
tracks gevolgd om met PERL te programmeren. Eigenlijk een beetje een ouderwetse
programmeertaal, maar die doet wat je wil. En het voordeel was dat het werd gegeven door
medejournalisten, die wisten dus precies waarvoor je het nodig zou kunnen hebben. Dat is een
erg groot voordeel. Maar als je dat dan drie keer een uurtje hebt gedaan, dan ben je over de
drempel van de angst om te programmeren heen gezet.
Maar je hebt verder geen scholing gehad in programmeren?
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
144
Nee, maar ik heb wel vroeger, toen ik een jaar of vijftien was, toen had ik een huiscomputer..
Toen heb ik in Basic wel geprogrammeerd, maar niet heel erg uitgebreid. Het lastige bij
programmeren is dat je moet weten wat je wilt. Je kunt wel achter een computer gaan zitten en
zeggen: nu ga ik iets programeren. Maar je moet wel een doel hebben. En wat ik eigenlijk wilde:
dat webscrapen, dat heb ik toen geleerd. Dat je een programmaatje schrijft, dat programmaatje
gaat voor jou naar een website toe en haalt de informatie eraf waarvan jij tegen het programma
hebt gezegd: ‘Dat wil ik eraf hebben’. En dan kun je dan bijvoorbeeld elk jaar doen. En daar
herkende ik de kracht van. Dat kan heel belangrijk zijn, als er op een website informatie staat die
je niet kunt krijgen. Niet op een andere manier dan op die manier. En zo heb ik langzamerhand
ook wel wat meer programmeertalen.. Die webapplicaties met interactieve kaarten is bijna
helemaal JavaScript, maar goed, als je hebt geleerd om niet bang te zijn om iets in PERL te
doen, dan kun je ook wel JavaScript aanpassen. Niet dat ik nou een grote programmeur ben,
helemaal niet.
Maar als je dit op papier zet, zullen veel journalisten toch wel denken: ‘Wow, wat is die al ver’.
Ja, dat is waar. Maar je moet zorgen dat je.. Volgens mij is het het makkelijkst als je ook toegang
hebt tot het maken van een website. Dus dingen op een server kan zetten bijvoorbeeld. Volgens
mij is het heel erg nuttig om met JavaScript een beetje aan de gang te gang. Er zijn genoeg
websites met heel veel voorbeeldjes, bijvoorbeeld http://www.w3schools.com. En zo leer je denk
ik heel snel zien wat je kunt doen met JavaScript. Daar kun je niet echt mee webscrapen, maar..
Het is denk ik vooral een drempel die je over moet. Angst en ingewikkeld en computercode. Als
je dat voor het eerst ziet dan denk je: ‘Wat staat hier?’
Scrapen jullie nog vaak?
Funda doe ik nog steeds elke week.
En andere onderwerpen?
Ik heb diverse keren de Overheidsalmanak gescraped, gewoon om te weten welke burgemeester
bij welke gemeente zat. En dat ging dan om zijn partij. Die gegevens waren wel ook op een
andere manier beschikbaar, maar het was uiteindelijk makkelijker als ik heel snel een scriptje
schreef waarmee ik dat van die website haalde.
Dus het was niet dat ze het niet wilden geven?
Nee, maar dan kreeg je weer XML en dat was gewoon teveel gedoe dus ik dacht: ‘Ik doe dat wel
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
145
eventjes, dat gaat sneller’. En bijvoorbeeld ook de Gouden Gids voor dingen gescraped. Onder
andere over horeca, maar volgens mij is daar uiteindelijk niets mee gedaan. Want Jan Meeus die
wilde weten waar alle cafés in Nederland zaten. Op de Gouden Gids-website kon je dat
natuurlijk makkelijk zien.
Dat is wel legaal?
Het enige wat niet legaal zou zijn, is dat je daarna weer die lijst met al die cafés zou publiceren.
De Gouden Gids heeft het copyright natuurlijk op de manier waarop ze de informatie tonen.
Maar als ik via de Gouden Gids-website met de hand zou schrijven waar alle cafés zitten en ik
zou daarna gaan turven dat er duizend in Amsterdam zijn en zevenhonderd in Rotterdam, dat
staat je vrij.
Zou je die cafés dan wel in Google Maps mogen zetten?
Nee, want dan zou je de individuele gegevens gebruiken. Maar dat was ook helemaal niet het
plan hoor. Kijk, zoals met het scrapen van die Albert-website: in principe is die informatie voor
iedereen die naar die website gaat of de winkel van Albert Heijn binnenloopt beschikbaar om op
te schrijven.
Je doet het alleen wat sneller?
Ja. En ik doe er ook niets mee om hem als supermarkt te gaan beconcurreren.
Over de medewerkers: Laura zei dat ze nog wel een programmeur wilde hebben. Heb jij dat
ook?
Laura werkt hier natuurlijk pas twee weken, maar de webmasters hier kunnen ook heel goed
PHP, JavaScript, SQL. De technische jongens van de website kunnen heel veel. Ik vind het leuk
om in mijn vrije tijd uren te pielen om een JavaScript werkende te krijgen, maar Appie
[Verschoor, de webmaster] heeft dat waarschijnlijk in vijf minuten voor elkaar. Maar ik vind het
leuk om zelf te leren en dat doe je alleen met vallen en opstaan.
En stappen jullie vaak naar hem toe?
Jajaja, heel vaak. Het vaakste voor de interactieve kaarten. Hij is sowieso de webmaster, dus
sommige dingen moet ik gewoon met hem overleggen. Maar ook technische kwesties. En
binnenkort, als de verkiezingsuitslagen de avond van 12 september.. Novum, ons ANP zal ik
maar zeggen, die hebben telefonisch contact vanuit hun callcenter met alle gemeenten. Zodra er
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
146
een uitslag binnen is tikken zij dat over. Novum moet ons die gegevens weer aanleveren. En
Appie zorgt dat die gegevens binnenlopen en ik zorg ervoor dat die gegevens dan weer in de
interactieve kaart komen. Dus we moeten in die zin samenwerken. Maar hij helpt mij ook als ik
er in JavaScript niet uitkom. En zijn ervaring is tien keer zo groot als die van mij. Zonder hem
zou het allemaal nooit gelukt zijn, denk ik.
Wat betreft de organisatie: hebben jullie een eigen plek op de redactie?
Nee en ik vraag mij ook af of dat een goed idee is. Daar kun je op heel veel verschillende manier
over denken. Maar wat je doet is gewoon journalistiek. Je hebt ook geen groepje mensen die heel
goed kunnen interviewen. Of mensen die alleen maar reportages kunnen schrijven. In principe
is iedereen journalist. Kijk, er zijn natuurlijk wel mensen die veel beter in een persoonlijk
interview zijn dan anderen. En er zijn mensen die veel beter zijn in de Haagse kaasstolp. En
mensen die beter zijn in het schrijven van reportages over de onderkant van samenleving.
Iedereen heeft zijn liefhebberij of zijn specialisme. En dat moet je vooral gebruiken. Maar het
blijft gewoon journalistiek. Alleen je past technieken toe die nog weinig anderen gebruiken.
Maar stel.. Eerder dit jaar ben ik bij die nieuwe datajournalistiek opleiding in Tilburg geweest.
Ik heb toen met Thalia een soort gastcollege gegeven. En daar zaten volgens mij zeker een stuk
of zestig studenten. Als die allemaal in de journalistiek terecht komen en elk jaar zijn het er weer
zestig. Dan krijg je natuurlijk veel meer mensen die op deze manier journalistiek bedrijven. Dan
is het binnen de kortste keren normaal. Daar hoef je geen apart groepje van te maken.
Het is al lang journalistiek, dat was het tien jaar geleden ook al. Het enige is: je loopt tegen
technische vragen aan. Technische vragen die je als ‘opschrijfboekjejournalist’ niet hebt. Hoe
werkt dit op mijn computer? Welke functie kan ik hiervoor in Excel gebruiken? Wat is de SQL-
code ergens voor? Dat zijn technische vragen die je voor een groot deel ook op internet
beantwoord kan vinden. Maar het is prettig als er mensen in je omgeving zitten die het
antwoord waarschijnlijk hebben en dat je elkaar daarmee kan helpen. Dat is de enige reden
waarom je ze bij elkaar zou willen zetten. Maar ja, dan hoef je ze niet eens aan één bureaublok te
zetten, maar gewoon binnen één organisatie.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
147
Jerry Vermanen (Nu)
Wat is hier jouw doelstelling?
Mijn doel is om hier bij Nu met data om te gaan. Aan de ene kant visualiseren. Er komt veel
nieuws binnen waar getallen in zitten. Voor lezers is het soms heel lastig om bepaalde getallen in
een context te plaatsen, om te begrijpen: wat betekent dit nou? En we hebben heel veel
economische berichten. Dat is vaak heel lastig, hele lastige onderwerpen. Het gaat over rente en
over inflatie en dat soort zaken en dat helpt heel veel om dat in een tekst uit te leggen en soms is
het ook heel goed om naast die tekst een afbeelding te hebben van: ‘Dit betekent het en dit daalt
en daarmee maak je lezers op een bepaalde manier, geef je ze cijferwijsheid mee. Je leert ze wat
makkelijker met die cijfers om te gaan. Je geeft ze wat inzicht, van: ‘Kijk, hier gebeurt het, hier is
een omslag’ en ‘Kijk, omdat dit negatief is krijg je geld in plaats van dat je geld toelegt’. Het is
gewoon: hele ingewikkelde materie visualiseren en uitleggen.
Aan de andere kant willen we bij Nu ook zelf data verzamelen en daar ook zelf nieuws uithalen.
Dat eerste, data visualiseren, is op zich vrij makkelijk. Ligt eraan hoe moeilijk je het maakt, maar
soms heb je gewoon een pak data waar je een hele ingewikkelde visualisatie bij maken, maar
soms werkt een lijngrafiek of een staafdiagram net zo makkelijk. Maar dat data verzamelen en
daar zelf nieuws uithalen dat is nu nog wel een echte uitdaging. Zelf bakken met informatie bij
de overheid opvragen en de overheid wil daar niet altijd aan meewerken of je krijgt informatie
en komt erachter dat die niet goed is bijgehouden of dat je er gewoon geen goede conclusie uit
kunt trekken omdat je er zoveel kanttekeningen bij kunt plaatsen. Dus het laatste is nogal vrij
ingewikkeld. Maar het is in ieder geval de doelstelling van Nu om daar nu een tijdje mee aan de
slag te gaan om te kijken van, hoe gaat dat nou. Ook omdat wij er nu mee aan de slag gaan wordt
het ook steeds makkelijker, omdat we steeds vaker bij instanties data opvragen en ambtenaren
enzovoort die raken er steeds meer mee bekend, die weten de weg van waar ze moeten zijn voor
informatie. Door een aantal datajournalisten ook in te zetten - ik ben dan degene bij Nu en je
ziet het op steeds meer plekken opkomen - en vaker om data te vragen wordt het ook
makkelijker om die informatie te krijgen.
En wat betreft het eerste: data visualiseren. Ik had eerst begrepen dat bij Nu de databerichten
eigenlijk moeten overeenkomen met wat op de voorpagina staat op dat moment en dat je
daarom ook heel snel moet werken. Is dat nog steeds zo?
Ja, dat klopt nog steeds. Ja, het is eigenlijk heel logisch. Dat is het moment ook dat een bericht
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
148
nog het meeste wordt gelezen. Als een bericht net online staat, het moment dat de meeste
mensen in dat bericht komen. Dat is de piek en daarna daalt dat steeds meer. Je moet zo snel
mogelijk werken, dat geldt ook voor de redacteuren, je moet het zo snel mogelijk proberen aan
te vullen met nieuwe informatie. Het heeft geen nut meer als je dat een halve dag of een dag
later gaat doen. Dat geldt ook voor die grafieken. Op het moment dat je die grafieken moet
bijvoegen moet het bericht gewoon nog zo vers mogelijk zijn. Dat is het moment dat de meeste
mensen dat bericht nog lezen. Er zijn heel weinig lezers die eerst een bericht lezen en achteraf
terugkomen van: ‘Nou, misschien die wel geüpdate zijn met recente informatie of een grafiek’.
Dus je moet er gewoon zo snel mogelijk bij zijn.
Hoe lang heb je dan ongeveer? Twee uur?
Sommige dingen kun je vooruitplannen, dus dat scheelt. Soms weet je dat een bericht eraan zit
te komen, zoals bij de CBS-berichten. Op vrijdag krijgen we de CBS-agenda. Daar staan alle
onderwerpen voor de volgende week in. CBS-cijfers worden elke dag om half tien ‘s ochtends
bekend. Dan is het vrij makkelijk om vrij te plannen. Je weet welk onderwerp op donderdag om
half tien gaat langskomen. Om half tien exact staan die berichten erop. Dus om half tien is het
F5 en terwijl je met je grafiek bezig gaat weet je dat er of bij het ANP of hier op de redactie ook
iemand aan de slag gaat met de CBS-cijfers, want dat zijn vaak een of twee datasets per dag. En
dat gaat vaak over vrij belangrijke dingen. Als het ANP niet besluit om er iets mee te doen
kunnen we zelf nog besluiten om er iets mee te doen. Dus dat zijn dingen die je van te voren kan
inplannen. Dus vaak is het een grafiek soms nog wel eerder klaar dan dat het bericht is getikt.
Dan ben je het een beetje voor. Zodra het bericht online gaat kun je gelijk de grafiek er inknallen
en ben je er als eerste mee. En soms is het gewoon haasten.
Dus je kunt van tevoren ook al een beetje bedenken van: dit is zus en zo’n bericht, daar past
zo’n soort grafiek bij..
Het handige bij het CBS is vooral dat de statistici die daar werken zien ook vaak wel de juiste
nieuwsinsteek. Die pakken het belangrijkste er ook vaak als wel zelf uit. Dan kunnen wij heel
geforceerd een andere insteek kiezen. Soms werkt het wel als je extra informatie zoekt in zo’n
dataset en dan komt het een alinea eronder te staan, maar de hoofdmoot van het bericht blijft
vaak wel hetzelfde.
En kun je hun daar ook op - dit is zo’n vraag die vanzelfsprekend lijkt - maar kun je het CBS
daar een beetje op vertrouwen of ben je er beducht op dat ze iets proberen te verhullen?
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
149
Het CBS is sowieso niet… Het is een onafhankelijk instituut dus wat dat betreft hebben ze er niet
echt belang bij om dingen te verhullen. Als je zelf verbanden ziet en je vraagt aan een CBS-
onderzoeker: “Klopt dit?” Dan hoor je die onderzoekers ook vaak van: “Het zou best zo kunnen
zijn, maar wij kunnen dat niet concluderen.” Dat heeft gewoon met de hele correlatie causaliteit
te maken. Je merkt gewoon dat onderzoekers bij het CBS er heel voorzichtig mee zijn om
conclusies te trekken die niet kloppen. Als ik iets tegenkom wat niet klopt en ik bel naar het CBS
wordt dat ook direct aangepast op de site. Maar de hoofdmoot van de berichten blijft eigenlijk
wel altijd hetzelfde. Ik controleer het natuurlijk wel gewoon altijd als ik een dataset krijg, van,
kan ik dezelfde conclusie eruit trekken of kan ik er misschien andere conclusies uit trekken.
Maar weet je, het zijn ook niet enorm complexe datasets die in een keer worden vrijgegeven. Het
gaat echt over een vrij specifiek gebied, een vrij specifieke periode. Soms verleng je de periode
zelf en kijk je en dan denk je: klopt nog steeds, de conclusie, en het is misschien iets
genuanceerder, maar bij het CBS weten dan vaak ook wel de genuanceerde conclusie te trekken
van als het CBS zegt: “Dit is het hoogste punt ooit”, dan klopt het eigenlijk altijd. Zodra het
ingewikkeld wordt zijn ze zelf ook wel wat genuanceerder en klopt het nog steeds wat ze
eigenlijk zeggen.
En als je iets hebt wat je niet vooruit kan plannen, welke stappen neem je dan allereerst in je
hoofd zeg maar. Stel, er komt onverwachts data binnen. Of er is een onderwerp waar wel data
aan te koppelen is.
Het is eigenlijk bijna nooit zo dat er data binnenkomt. Weleens een persbericht waar wat
getallen in hangen. Vaak moet je voor de rapporten er wel achteraanbellen, dus dat is vaak de
eerste stap: kijken van wat, wat zouden hier überhaupt voor getallen achter kunnen liggen die
we kunnen visualiseren. Als je bijvoorbeeld rapporten hebt waar een top tien lijstje in staat wil je
weten op basis waarvan die top tien is gemaakt, welke getallen zitten erachter, kunnen we de
hele Excel-sheet krijgen. Dat is meestal ook makkelijker om te vragen dan om de data vragen,
een woordvoerder zegt dan: waar heb je het over. Maar als je zegt: we willen de Excel sheet
achter het onderzoek hebben, dan is het vaak al een stuk makkelijker vragen. Daar zit ook
meestal alle informatie in die ik nodig heb.
Dat is eigenlijk de eerste stap: om informatie vragen. En vervolgens vragen: wat kun je
hiermee? Wat is hier een goede visualisatie bij? Dan is het vaak heel makkelijk om naar de
standaardvormen te grijpen. Aan de ene kant omdat dat sneller werkt - een lijngrafiek, een
staafdiagram of soms een kaartje, dat is vrij makkelijk te bepalen wanneer je wat moet inzetten.
En het is voor lezers ook heel goed herkenbaar. Als je hele ingewikkelde arty farty dingen gaat
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
150
maken - dat kost je heel veel tijd, maar lezers zijn ook gewoon minder geneigd om zoiets heel
snel te begrijpen en dan kun je alleen maar bij hele grote projecten doen en dan heb je iets meer
tijd om zoiets te laten bezinken van, goh, ik kan nu deze keuze maken, oke, maar misschien iets
langer over nadenken. Het is vaak gewoon makkelijker om uit zo’n poule van standaard
visualisaties te graaien want dat communiceert gewoon veel beter en dat werkt sneller.
En die andere kan van het verhaal, de data verzamelen, hebben jullie daar een achterliggend
doel bij? Bij Sargasso zijn ze veel bezig met privacy, hebben jullie ook een bepaalde hoek
waarin jullie zoeken?
Nee, in het begin nog niet. We zijn heel erg, we schieten nu nog heel erg met hagel. We proberen
zoveel mogelijk verschillende onderwerpen te raken. Dan kijken we waar we makkelijk data bij
kunnen verzamelen. Dat is heel lastig om in te schatten waar al die data te halen vallen - welke
beleidsgebieden, welke ministeries enzovoort. Dus we proberen nu heel veel verschillende
onderwerpen uit en zijn van plan om dat na verloop van tijd iets meer in te perken en een aantal
aandachtsgebieden: we vinden dit belangrijk bijvoorbeeld, economie, veiligheid en ehm, sport
bijvoorbeeld, ik noem effe drie willekeurige gebieden. Van dit zijn gebieden die we belangrijk of
we kunnen daar goede en betrouwbare data over halen of we merken juist dat het ingewikkeld is
en we willen een voortrekkersrol bij hebben omdat het ons dan ook weer differentieert van
andere nieuwsmedia die er ook mogelijk mee aan de slag zouden kunnen gaan. Dus we zetten nu
heel breed in, alles wat in ons op komt aan onderwerpen proberen we nu data over te
verzamelen en na verloop van tijd gaan we dat een paar keer evalueren. Waar moeten we ons
vooral op richten? Dat betekent niet dat wie andere onderwerpen gelijk uitsluiten, maar wel dat
we ons meer focussen op een aantal deelgebieden. Maar hoeveel dat er zijn en welke dat hebben
we eigenlijk nog niet besloten.
Baseer je dat dan op bijvoorbeeld bezoekersaantallen?
Ja, ook. Maar ik kan me heel goed voorstellen dat technologie er eentje is die we er in houden,
omdat we Colin hebben (onze redacteur die veel over technologie schrijft en goed is met getallen
en ook vaak eigen getallen verzamelt) dus dat is ook een gebied waar we makkelijk cijfers in
kunnen hebben, maar aan de andere kant, als we bij die technologieberichten veel visualisaties
doen, dat is ook een categorie die op zichzelf heel populair is, een categorie die op de voorpagina
staat, iets waar we ons mee onderscheiden van anderen van andere sites die over technologie
schrijven. Er zijn niet veel kranten die enorm goed over technologie schrijven. Dat is dan iets
waar we heel goed in kunnen worden. Dat is bijvoorbeeld een die we zouden kunnen kiezen.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
151
Maar dat gaat dan in overleg met de redacteur. Goh, zie jij dat zitten. En natuurlijk ook met de
chef en de hoofdredacteur. Het gaat ook gewoon informeel, als we bij een bureau staan.
En heeft wat je zelf leuk vind ook invloed? Zou je de selectie persoonlijk kunnen sturen?
Wat dat betreft ben ik denk ik wel makkelijk, dat ik het ook wel leuk vindt zodra het goed gaat en
wij ons kunnen onderscheiden. Dus ik denk dat het bijna op hetzelfde neerkomt.
Het is niet zo dat jij bepaalde onderwerpen heel interessant vindt?
Ik zou het heel grappig om eens een onderzoek te doen met gaming, datajournalistiek en gamen,
maar dat is puur omdat het een eigen interesse is. Het is dan maar de vraag of er heel
interessante dingen uit te halen vallen. Dat denk ik niet zo snel.
Maar dat is meer voor een keertje..
Nee inderdaad, ik denk niet dat wij de gamingdatajournalistiek ingaan, hehe. Dat zou wel heel
tof zijn, maar zie ik niet heel erg zitten.
Wat wil de bezoeker?
Het moet gewoon communicatief zijn, heel duidelijk een boodschap overbrengen. Dat is gewoon
onze Nu-bezoeker: gewoon mensen die snel het nieuws willen weten, die binnen anderhalve
minuut een berichtje willen doornemen en het dan ook volledig willen snappen. Zo snel mogelijk
nieuws. Dus ja, daar richten we ons eigenlijk gewoon op. Gewoon duidelijk een boodschap
overbrengen.
Moeten jullie onderwerpen per se nieuws zijn? Of zou het ook kunnen zijn wat op zich al
bekend is en dan mooi in beeld gebracht wordt?
Nee, voor ons is echt nieuws belangrijk. Ik kan me voorstellen dat een krant iets meer de
achtergrond in kan, maar dat is niet onze kracht natuurlijk. Bij ons is het echt de kracht om het
snelle nieuws te brengen en om.. We schrijven af en toe wel eens beschouwende stukken maar
ook daar zit vaak een nieuwsmoment aan. Voor een krant zou dat denk ik wel heel goed werken,
bijvoorbeeld een Guardian, die heeft dat, die hebben een hele andere insteek met hun website.
Die kunnen ook veel meer beschouwender en vaak ook meer gewoon een data-onderwerp
neerleggen en dan heel groot vraagteken erboven: “Kan jij hier iets mee, lezer?” Dat is niet des
Nu om dat te doen, dat is ook niet onze kracht, dus die weg zouden we niet in moeten slaan. Of
we zouden daar een Nu-stijl voor moeten vinden, maar.. Het zou ook gewoon tijd innemen van
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
152
het nieuwsgedeelte. Daar valt nog heel veel nieuws te halen.
Is de doelstelling ook nog veranderd sinds het begin? Zijn jullie qua koers veranderd?
Ik weet niet de exacte doelen die zijn ingesteld toen Jelle hier begon, maar dat zullen dezelfde
doelstellingen zijn geweest. Ik weet wel dat Jelle in het begin heel erg veel bezig is geweest met,
in plaats van dat hij zich op het nieuws kon richten en daar nieuws uit halen en dingen kon
visualiseren, dat hij veel technische dingen moest uitzoeken. Welke gereedschappen gebruiken
we, dat soort zaken. Daar ben ik nu ook nog wel mee bezig, we zijn bijvoorbeeld net overgestapt
op een andere visualisatietool die ook op de app werkt en met grote projecten komt het ook op
het technische neer, maar wat ik van Jelle begreep was dat het aan het begin veel meer was. Van
“hoe krijgen we dit überhaupt in het CMS werkend?”. Daar lag toen heel erg de focus op. De
doelstelling was toen wel hetzelfde, maar waar hij dagelijks mee bezig was was wel net even iets
anders dan hoe mijn situatie nu is. Wat dat betreft is het nu allemaal net iets meer goed
geregeld. Lijkt me ook logisch, gelukkig.
Workflow. Heb je ‘s ochtends een standaard?
Wat het voordeel was toen ik hier begon.. Toen Jelle hier begon had hij niet echt een
leermeester, maar toen ik hier kwam heb ik twee dagen met Jelle meegekeken. Ook technisch,
hoe het systeem werkt en dat soort dingen. Dus dat scheelde heel erg. Ik was in ieder geval qua
technische kennis, begon ik niet echt met een achterstand. Ik herken op zich wel wat Jelle zegt,
qua workflow. Maar ik heb het idee dat dat bij heel veel redacteuren is. Als je aan redacteuren
vraagt: wat is precies je workflow? Je bent elke dag bezig met andere onderwerpen en er komt
nieuws tussendoor en dan moet je schakelen en improviseren. Dat is best lastig. Hoe mijn dag er
globaal uit ziet is: ik kom hier ‘s ochtends aan, ik weet dat om half tien de CBS-cijfers er zullen
zijn, dus daar probeer ik al tijd voor vrij te maken, dat zijn gewoon vaste dingen en er komen
altijd goede visualisaties uit.
Gaat ook geen dag voorbij zonder..
Ja hoor, maar als enige vastigheid is dat zo’n beetje. Bijvoorbeeld gisteren en vandaag waren er
bijvoorbeeld geen CBS-cijfers, behalve opeens gisteravond. Weet ook niet precies hoe dat zat.
CBS-cijfers over afval ofzo, afvalverwerking. Stond nergens op de agenda. Maar was ook ‘s
avonds, dus toen werkte ik niet meer.
Ehm, maar dat is eigenlijk de vastigheid die ik heb, van de CBS-cijfers. Tussendoor en ook van
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
153
tevoren op Nu kijken. We hebben nu weekvergaderingen, dus we weten ook welke onderwerpen
er in de loop van de week aankomen, dus die kun je ook al een beetje vooruit plannen. En: die
collega is daarmee bezig, kan daar data in zitten? Dus CBS-cijfers op vast moment,
weekvergadering en ondertussen op Nu kijken. Welke berichten staan nu op de site en waar zou
ik data aan kunnen toevoegen?
‘Die modellen, ze hebben wel vaak terugkoppelingen, maar ook daar zul je merken.. Als je het
schema zou volgen zou je denken: ‘Ik zou nu ongeveer bij de dataverwerking moeten zijn’, maar
dan zit je in gedachten eigenlijk al bij de datavisualisatie. Soms zijn de dingen ook zo obvious, zo
simpel. ‘Ik weet ongeveer we die dataverwerking, ik moet het alleen nog even doen.’ Dat is
gewoon handwerk in Excel. Maar dat je dan alvast nadenkt over de visualisatie en terwijl je
nadenkt over de visualisatie denk je: ‘Oh wacht, als ik nu deze vorm kies dan moet ik misschien..
Oh wacht, dan moet ik de getallen toch anders verwerken.’ En dan heb je weer een andere
terugkoppeling. Het is leuk om daar een schema bij te hebben, maar dat is nadeel van elk
schema: er zijn een heleboel uitzondering.’
Vind je ze wel nuttig?
‘Ja, het communiceert makkelijk. Het is makkelijk om aan iemand uit te leggen van ‘dit is
ongeveer hoe ik werk’.’
Kun je er ook van leren?
‘Mm.. het zijn gewoon standaardschema’s . Dat is bijna iedereen journalistiek project zo: je
verzamelt informatie, je verwerkt informatie, je presenteert informatie. En dat verwerken kun je
dan weer in meerdere onderdelen opsplitsen, maar het komt in de basis op hetzelfde neer:
ontvangen, verwerken, zenden. Tja, daar kun je het niet erg mee oneens zijn. Zo werkt het nu
eenmaal. Er is vaak wel terugkoppeling in: ‘Terwijl je informatie aan het verwerken bent, krijg je
feedback en moet je weer nieuwe informatie verzamelen.’ Dat soort dingen. Maar goed, dat is
gewoon hoe het.. Het is een vloeibaar proces eigenlijk, het kan alle kanten omgaan.’
Toen ik dat las van Jelle, dacht ik: dat is een mooi scriptieonderwerp. Toen zag ik de
workflowmodellen en dacht ik: mooie modellen. Maar dan praat je met journalisten en die
zeggen al snel: ‘Het zijn leuke modellen, maar zo werkt het niet in de praktijk.’
‘Het werkt wel zo in de praktijk, maar niet in dat vaste stramien. Het maakt ook niet uit of de
bedenker van dat model wel of niet echt denkt dat het zo gaat in de praktijk - het is gewoon een
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
154
goed communicatiemiddel. Vaak zal het ook ongemerkt wel volgens zo’n model verlopen en dan
sta ik er niet eens bij stil, waarschijnlijk.
Je bedoelt: om te communiceren aan je collega’s hoe je werkt of..
‘Ja, of bij een presentatie of voor academici, die zijn dol op modellen. Omdat je de werkelijkheid
toch op een bepaalde manier moet uitleggen. En dan is een model, het woord zegt het al, een
vereenvoudiging van de werkelijkheid. Zodra je iets vereenvoudigd haal je nu nuances weg en in
de werkelijkheid heb je wel met nuances te maken.’
Ben je veel bezig met WOB’en?
‘Ja, we hebben Brenno de Winter hier vaak op de redactie rondlopen. De WOB is wel een lastige
procedure natuurlijk. Je hebt journalisten die al voor elk wissewasje dreigen met een WOB-
verzoek, wat helemaal niet handig is, want soms is een telefoontje naar een woordvoerder of iets
dergelijks veel makkelijker en veel sneller. Voor een WOB-verzoek moet je het sowieso eerst op
andere manieren proberen te regelen. Vaak is dat voor jezelf ook sneller. En voor de overheid
minder belastend. Omdat een WOB-verzoek een hele procedure is die je dan op gang zet kost het
ook daar heel veel tijd en mankracht. Een telefoontje naar persoon kan ook heel veel
bewerkstelligen. En vaak helpt het ook vaak om aan de telefoon te zeggen: ‘Ik bel nu, ik weet dat
ik u ook kan WOB’en, dat jullie die informatie hebben. Maar voordat we dat gaan doen.. Ik vraag
het nu gewoon even zo aan. Dat scheelt mij heel veel tijd, scheelt jullie heel veel tijd.’
Maar dien je vaak een WOB-verzoek in?
‘Ja, we hebben pas nog een paar WOB-verzoeken.. We hebben ze opgesteld. We bellen ze nu na
en zitten nu op het punt van: moeten we nu gaan overwegen om nu nog een paar telefoontjes
erachteraan te wagen en effe iets meer druk te zetten of gaan we inderdaad die WOB-procedure
opstarten. Met het risico dat het gewoon heel erg lang gaat duren, want dat wordt natuurlijk zo
lang mogelijk gerekt tot alle mogelijke grenzen en dwarsgezeten. Dat wil je eigenlijk niet.’ ‘Het
duurt gewoon heel erg lang. Dat is gewoon klote, dat dat zo lang duurt en dat je dan exact alles
moet verwoorden omdat je anders toch ergens tussen de letters door wordt genaaid. Dat is niet
leuk. Dus probeer je dat gewoon te vermijden, maar dat is wel iets wat je in je achterhoofd houdt
van: dit is ons ultieme middel om in te zetten. We zitten er nu een beetje tegenaan: ‘Gaan we nu
voor bepaalde onderwerpen wel of niet een WOB-verzoek indienen?’
En scrapen, doen jullie dat ook weleens?
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
155
‘Ja, wel een paar keer gedaan, ja. Gewoon op de simpelde manier: gewoon een plug-in in je
browser installeren dat je HTML-tabellen makkelijk in een keer in Excel kun importeren. Ja,
gebruiken we weleens inderdaad ja. Zijn wel een paar projecten waarvan ik denk: daar zouden
we eigenlijk iets voor moeten bouwen. Maar soms is het van: Oh, daar staat allemaal informatie
op de site en dat ga ik scrapen en moeilijk doen enzo. Ik heb dat één keer gedaan en toen dacht
ik van: Misschien is gewoon handig als ik even een mailtje stuur naar die persoon met de vraag
of ik het mag hebben. Er stond geen exporteer-knop ofzo, dus ik dacht: dit moet ik scrapen. Nou,
gewoon effe mailen en die persoon is hier geweest en we hebben koffie gedronken en hij had die
informatie gewoon op een USB-stickje staan. Ok, net zo makkelijk. Scrapen is niet zo’n ultiem
machtsmiddel als de WOB natuurlijk, maar het is hier wel hetzelfde verhaal: als het makkelijk
kan, waarom moeilijk doen? Maar ja, we hebben het wel een paar keer gebruikt ja. Want we
moesten de informatie wel hebben en er werd traag gedaan. Maar we hebben het nog niet zo
ingewikkeld meegemaakt dat we echt Python [programmeertaal, jk] nodig hadden.’
En werken jullie ook weleens samen met lezers, andere journalisten of blogs?
‘Ehm.. Ik heb er een tijdje geleden over nagedacht dat het misschien leuk zou zijn om een grote
enquete te kunnen uitzetten naar lezers. Het nadeel is wel vaak met dat soort dingen.. Data heeft
een gloed om zich heen van: dit is objectief, alles hierin klopt perfect. Als ik zelf een enquete
online zie staan denk ik vaak: ‘Hoe kan ik dit gaan kapot maken? Allereerst even kijken hoe vaak
ik dezelfde inzending kan sturen. Of als ik de enquête heb ingevuld, kan ik hem dan nog eens
invullen? En nog eens en nog eens. En gelukkig - of helaas - zijn er wel meer van dat soort
rotjochies. Het is heel moeilijk om een goede enquête te maken waar je ook controleert of alle
informatie die je verzamelt representatief is, of het allemaal klopt.. We zitten er nu wel over na
te denken of we dit kunnen inzetten, maar aan de andere kant: volgens mij moeten we niet gaan
denken vanuit het gereedschap. Van: we hebben het gereedschap De Enquete en we moeten dat
per se gaan inzetten. We hebben tot nu toe geen onderwerp gevonden waarbij we het goed
konden inzetten.’
‘Een tijdje geleden zag ik bij Tweakers dat ze wel zoiets wilden doen. Die wilden toen via een
mobiele app gaan meten wat de uploadsnelheden en downloadsnelheden zijn en
verbindingssnelheden en dat soort zaken. Zag er op papier heel goed uit, maar ze merkten
gewoon dat.. Ze hadden het goed aangepakt. Je hebt natuurlijk wel een heel specifiek publiek
dat die app installeert dus je hebt sowieso geen aselecte steekproef meer, dus echt representatief
is het op dat moment niet meer, maar goed. Daar kun je nog iets bij voorstellen. Maar daarna
kwamen ze er door technische dingen achter dat het gewoon niet werkte. Hij moest dus meten of
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
156
je wel of geen verbinding had, maar het probleem was dat als je geen verbinding had hij die
gegevens niet lokaal opsloeg. Hij verzond ze gelijk als hij verbinding had, maar als je geen
verbinding hebt kun je het niet versturen. Dat is in feite de goede manier om zoiets te gaan
meten, met alle kanttekeningen erbij, maar zelfs dan - met zo’n goede opzet - is het nog lastig
om het helemaal goed opgezet te krijgen. Soms heb je wel het onderwerp.. Ik denk dat we
gewoon een keer toevallig tegen een onderwerp aan moeten lopen. Van: we kunnen het op geen
andere manier aanpakken dan met een enquete, hoe gaan we die enquete opzetten.
Beetje wat The Guardian toen heeft gedaan met die bonnetjes. Dat was ook niet vanuit het
gereedschap gedacht, van: ‘We hebben dit gereedschap, waar kunnen we dit voor inzetten?’, nee,
het precies andersom. Het ging om die bonnetjes en er was geen enkele andere mogelijke
manier om al die duizenden bonnetjes te controleren behalve door dat gereedschap in te zetten
en daarmee het publiek te bereiken.
Daar kon je ook niet echt mee klooien.
Ze hadden het zo opgezet dat er niet mee te sjoemelen was, omdat er uiteindelijk een redactie
achter zat. Je kon alleen maar aangeven: dit is verdacht en dit is goed. En zodra er volgens mij
twee of drie mensen aangaven van ‘Dit is een verdacht bonnetje’ dan werd die doorgestuurd
naar de redactie en die ging er vervolgens naar kijken. Dus je had altijd een soort
veiligheidsmechanisme. Het was ook geen enquete wat dat betreft.
Zijn er ook onderwerpen die je wel zou willen gebruiken, maar waar je op een of andere
manier nog niet aan toekomt?
‘Ja, er zijn heel veel datasets die ik zou willen hebben. Er zijn ook heel veel datasets die niet
worden vrijgegeven omdat het nieuws is. En je gaat als ambtenaar geen dataset vrijgeven als je
er de volgende dag mee om de oren wordt geslagen in de krant of op Nu. Dat doe je niet. Dus er
zijn heel onderwerpen. Wat ik net zei: wapenvergunningen, ben ik al tijdje mee bezig. En we
zitten er heel dichtbij telkens, maar of die persoon is net op vakantie of ‘Ja, ik heb maandag
overleg met de persoon die erover gaat, daar ga ik het neerleggen en dan mail ik je terug’, word
je niet teruggemaild, gelijk terugbellen, in gesprek, hele dag in gesprek. Oke, dag daarna weer
bellen. Weer in gesprek. ‘s Middags weer proberen. ‘Ik heb het bij hem neergelegd, daar gaan we
je nog over op de hoogte houden.’ Week later weer bellen..
En die data is wel openbaar, die is niet geheim?
Nee, daar zit is geen privacygevoelige informatie in. We willen het ook niet op postcodeniveau of
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
157
straatniveau hebben, maar we willen het echt op gemeenteniveau. Het is tot in zekere mate
geanonimiseerd. Het is informatie die beschikbaar is, dat hebben we ook al gehoord in één van
de eerste gesprekken. ‘Die informatie is wel beschikbaar’, zei ik heel blufferig, terwijl ik het niet
zeker wist of ze het op die manier hadden geïndexeerd. ‘Ja, we hebben dat inderdaad, we hebben
het ook op straatniveau.’ Dan weet je: ‘Ik weet dat ik het tot zo specifiek kan krijgen’. Maar dan
krijg je dus die gesprekken van ‘ik ga je nog mailen’ en weer bellen en zo gaat het de hele dag
heen en weer. Op een gegeven moment voeren we de druk steeds verder op en dat is het: ‘Ok, dit
is het allerlaatste telefoontje. We kunnen het nu gaan regelen of we gaan een WOB-verzoek
sturen. We hebben Brenno de Winter die daarmee kan helpen.’
Die naam kennen ze inmiddels wel?
Brenno kent heel veel mensen en heel veel mensen kennen Brenno, dus dat scheelt weer. Dus op
een gegeven moment moet je misschien een beetje een lul worden. Ik weet niet zo goed.. Op die
manier moet je gewoon die informatie zien los te krijgen. Want dat is ook informatie waar we
recht op hebben. Dat is informatie waar we met zijn allen voor hebben betaald en die heel veel
zegt, zeker nu met die schietpartijen. [De schietpartij in een bioscoop in Aurora ligt vlak achter
ons, jk.] Nu hoeven we daar in Nederland niet zo snel zorgen over te maken, want het is totaal
niet te vergelijken met Amerika. Maar als het informatie is over het aantal wapens dat in jouw
gemeente.. Waarom zouden we dat niet mogen weten? En hele saai, economische informatie
wel? Ik kan wel heel goed begrijpen dat een politieagent daar ook een beetje huiverig voor is.
Want misschien blijkt er wel uit dat ze hun werk niet goed doen. Of dat het aantal verstrekte
vergunningen is gestegen en het aantal delecten ook en dat ze een verkeerd beleid voeren. Weet
ik veel allemaal. Maar dat is gewoon informatie waar we recht op hebben. Dus, ja. Duurt alleen
eventjes.
En zijn er ook nog technieken die je graag zou willen gebruiken? Jelle zei dat de visualisaties
die hij gebruikte zichtbaar moesten zijn op desktops, tablets, mobieltjes enzovoort. Is dat voor
jou ook zo?
Ja, we hadden eerst Fusion Charts, waar we visualisaties mee maakten. Lijngrafieken,
staafdiagrammen. Dat werkte met Flash, dus dat werkte niet op iPads en ook niet op de mobiele
app. Die hebben we laatst geswitcht naar HighCharts, dat gewoon javascript is en overal op
werkt. Waarbij we vervolgens ook weer moeten kijken hoe we dat precies gaan schalen, want we
laten het in een iframe zien, maar de breedte van de website is anders dan de breedte van de app
enzovoort. Je moet oppassen dat verschillende programmeertalen niet met elkaar in de knoop
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
158
komen. Dat moet je ook allemaal uitzoeken enzo. Maar dat hebben nu redelijk goed gedaan. De
standaarvisualisaties kunnen we nu goed vertonen op alle apparaten. Het gaat weleens een
keertje mis, maar dat is dan weer iets waar we aan kunnen werken en dan overleg ik met de
mensen van techniek. ‘Goh, hebben jullie tijd om daar een keertje naar te kijken?’ ‘We hebben
het heel druk!’ ‘Nou, volgende week dan misschien?’ En dan is het opgelost.
En heb jij nog dingen die jij nog heel graag wil proberen, maar dat past niet bij Nu of daar is
geen geld voor?
Nee, qua geld heb ik sowieso nooit beperkingen gehad, wat dat betreft. Nu zijn de meeste tools
ook gratis, dus dat scheelt heel erg.
Je zou bijvoorbeeld met een vormgever willen werken..
Wat dat betreft zijn er misschien twee beperkingen. De eerste is: we hebben een kolombreedte
die vergeleken met andere websites best wel smal is. Dus we moeten daar ook rekening mee
houden als we visualisaties maken. Voor de EK-visualisatie heb ik toen een aparte pagina
gemaakt. Dat is eigenlijk de enige oplossing waarop we die konden weergeven. In het bericht zelf
- ben ik het nu serieus vergeten? - nee, 400 pixels.
Is het echt maar 400 pixels?
400 of 500.. Volgens mij 410, even uit mijn hoofd. Maar goed, dat is een beperking gewoon en
daar moet je rekening mee houden. Zo is de website nu eenmaal en voor echt grote projecten
moeten we kijken of we daar misschien een template-pagina van maken. Of misschien een
andere manier, een pop-up ofzo. Maar dat is ook weer met advertenties en andere zaken en
doorklikken lastig. Maar die kolombreedte is gewoon een beperkende factor.
Een andere is: ik ben een journalist die een klein beetje kan programmeren. Een beetje copy-
past-programmeren. Beetje Frankensteincode maken. En dan werkt het soms en meestal niet en
dan schakel ik weer hulp in. Internet is wat dat betreft heel genadig, van: ‘We helpen je wel
even’. Er zijn heel veel bronnen waar je dan terecht kan of iemand die een bepaalde library heeft
gemaakt die hij dan kan mailen bijvoorbeeld. Dan heb je mailcontact met een of andere
gigantische programmeerheld die het belangeloos voor je oplost. ‘Ik heb er nog even iets extra’s
voor gemaakt en als je het toch weer terugverandert moet je dit en dat aanpassen.’ Fuck, vet
gaaf. Dat is wel voor mijzelf een beperking, dat ik dat niet uit mijzelf kan doen. Maar aan de
andere kant: ik weet niet of ik dat per se moet willen. Op een gegeven moment houdt het gewoon
ergens op, dat ik er zoveel tijd in moet steken dat het niet meer efficiënt is om het door mij te
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
159
laten doen. Dat het gewoon makkelijker is om hier iemand van Techniek in te huren of iemand
van buitenaf aan die klus te laten werken, die het dan in een halve dag of een ochtend heeft
geregeld. Dat is erg een beperking, gewoon je eigen kunnen eigenlijk.
Dat zei Dimitri trouwens ook. Een programmeur is 80 euro per uur en een journalist is veel
goedkoper. Dan moet je ook denken: wat is het beste?
‘Wat ik zelf vaak doe is kijken: welke library’s zijn er al beschikbaar? Dan heb je alvast een
beginpunt om mee te beginnen.’
Hoe kan ik een library goed omschrijven?
Normaal gesproken begin je met programmeren vanaf het begin, dus moet je alle algoritmes zelf
schrijven. Bijvoorbeeld als je een algoritme wil schrijven van: ‘Ik wil een cirkel tekenen en die
cirkel moet op een gegeven moment van positie x,3 naar positie x,0 bewegen en ondertussen van
y,0 naar y,5.’ Normaal gesproken zou je al die programmeertaal zelf moeten uitschrijven en een
goede library is eigenlijk een verzameling code die heel veel dingen van tevoren al heeft
vastgesteld. Dus daar hoef je alleen maar in te vullen: ‘Cirkel, begintpunt x, beginpunt y,
volgende punt x, volgende punt y’, heel simpel gezegd. Je hebt ook veel ingewikkeldere librarys,
zodra het interactief wordt, waarbij een heleboel andere effecten bij komen kijken. Maar een
library is gewoon een van tevoren vastgelegde berg code, eigenlijk. Het voordeel van een goede
library is vaak dat er ook heel veel voorbeelden in zitten. Dat is waar ik dan vaak naar kijk.
Iemand heeft dan een hele taal uitgeschreven, eigenlijk, en dat dan bovenop een bestaande
programmeertaal. Eigenlijk wordt ook geen taal uitgeschreven, maar een heleboel wetten,
eigenlijk. In Javascript, jadajadajada, alles wat er achter ligt hoef je verder eigenlijk niet meer
naar te kijken. En op basis van die wetten hebben ze dan visualisaties en voorbeelden gemaakt.
En daar kijk je dan vaak naar, wat is interessant voor grote projecten? Daar kun je dit en dit mee
weergeven, is misschien interessant voor de politieke verkiezingen straks. Dit is wat voor dit
onderwerp, kan ik het aanpassen? Op internet kijken of er al andere mensen mee bezig zijn
geweest. Kan ik er iets aan toevoegen? Op fora kijken: ik heb deze code, kan iemand mij even
helpen?
Naar welke sites ga je dan voor hulp?
Stack Overflow (http://stackoverflow.com/) is een hele goede. Dat is waar heel veel
programmeervragen al zijn opgelost. Voor specifieke zaken kun je er vaak ook code op dumpen.
Je hebt een andere site, jsFiddle (http://jsfiddle.net/), daar kun je dan vaak hele
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
160
programmeertaal ingooien. Die website bestaat eigenlijk uit een aantal vensters: in het ene
venster gooi je al je code, dan heb je een venster waar je visualisatie alvast wordt getoont en
zodra je iets aan de code verandert en je drukt op ‘run’ dan heeft hij dat weer aangepast. Gewoon
een soort van coderen op internet en meerdere mensen kunnen ook aan datzelfde stuk
programmeercode werken. Dus dat gaat vaak een hele tijd zo heen en weer. Dan heb je een vraag
en iemand op Stack Overflow weet het toevallig. Als iemand het daar niet weet zit ik weer bij een
bepaalde maillijsten, bijvoorbeeld die van NICAR-IRE. Dat is vaak meer specifiek echt op
datavisualisatie, Stack Overflow is meer voor programmeren. Die mailinglijsten zijn meer: ‘Ik
moet iets in Excel doen’, ‘Heeft iemand goede voorbeelden van een kaart’.
Iets journalistieker?
Ja, klopt. Dus dat zijn een paar van die bronnen waar je een beetje tussendoor kan pendelen en
kijken of je daar je vraag krijgt beantwoord. En als het echt niet lukt, ja, dan houdt het op een
gegeven moment ook op. Dan ben je in tussentijd misschien, omdat je je zo hebt verdiept en
zoveel voorbeelden hebt zien langskomen, heb je misschien veel betere ideeen gekregen om het
misschien eenvoudig op te lossen. En ook sneller. ‘Dan probeer ik het deze keer op die manier
op te lossen, maar een volgende keer..’ Maar dan ben je toch een paar stappen vooruit gekomen.’
Over jou persoonlijk: je kwam op het idee voor RegioHack bij..
‘..SETUPs Hacking Journalism bijeenkomst.’
Was je daarvoor al met datajournalistiek bezig?
‘Niet mee bezig, maar ik had er wel eens van gehoord. Ik wist dat ze bij Nu een datajournalist
zochten. ‘What the fuck, wat is dat eigenlijk?’ Dat was vlak voor SETUP, Jelle was toen al
aangenomen. Ik had er daarvoor al wel eens over gehoord en ik wist dat ze bij The Guardian iets
met data hadden gedaan maar dat was heel abstract enzo en ik was toen eigenlijk nog maar net
afgestudeerd en kort aan het werk bij de regiokrant, dus dan ben je heel erg bezig met andere
nieuwe dingen in je leven. Het zal dan best dat er ergens iets met datajournalistiek gebeurt en
dan weet je wel dat het op zich interessant is, maar dan is het nog niet van: ‘Daar ga ik diep in
duiken’. En toen kwam SETUP en toen dacht: ‘Ik weet dat het interessant is, laat ik er gewoon
naartoe gaan, dan kijken we wel of het echt zo interessant is’. Dat bleek dus van wel.’
Je bachelor was Industriele Vormgeving. Heb je daar ook soortgelijke dingen gedaan?
Dat is heel grappig, want ik ken wel een paar oud-klasgenoten die nu ook naar de
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
161
datavisualisatiekant zijn gegaan. Niet voor journalistiek, maar vaak voor bedrijven of interface-
ontwerp. Datavisualisatie zelf is natuurlijk al wat ouder. Er zijn nu heel veel dingen bijgekomen
dat het nu interactiever is geworden en er is veel data die er eerder nog niet was. Dus vroeger
was het ook heel veel handwerk en nu kun je veel meer dingen automatiseren. Het is
makkelijker en moeilijker geworden, tegelijkertijd. We hebben wel wat lessen interface-
ontwerpen gekregen en statistiek. Wat wel nuttig was, was dat ik wel een halve beta-
achtergrond.. Industrieel ontwerp zitten tussen beta en vrije kunsten in. We kregen echt
hardcorde wiskunde. Dat ik dacht: ‘Wat moet ik hier in godsnaam mee, dit is echt super
abstract.’ Ik zag echt niet wat ik daar in de praktijk mee moest. Daarna had je een watermeloen
voor de klas staan en die gingen ze door midden snijden en moest je gaan kleien en met
houtskool gaan klooien. Twee colleges op die manier na elkaar. ‘Mm.. oké.. En nu het verband
graag.’ En dat had je een projectgroep en dan kwam het ongeveer bij elkaar. Maar nooit
helemaal per se. Maar die beta-achtergrond is wel heel nuttig geweest. Er zijn wel wat
journalisten die beta zijn, maar hier op de redactie zijn het ook vooral mensen die bij
Nederlands, politicologie, economie vandaan komen. Economie is al een groot voordeel omdat
je dan al veel met getallen bezig bent, maar sommige mensen hebben ook HBO journalistiek
gedaan. In de regiojournalistiek heb je ook veel mensen die HBO hebben afgerond. Die zijn
journalistiek heel goed onderlegd, maar die hebben geen beta-achtergrond. En dat is mijn
voordeel wel, dat ik iets beter met getallen kan omgaan. Nu zal ik nooit een statisticus of een
wiskundige kunnen aftroeven, dus ik zal zo iemand graag om hulp vragen als ik het zelf niet
snap, maar ik kan iets meer zelf oplossen. En makkelijker met die persoon in gesprek treden.
‘We hebben hier een standaarddeviatie..’ ‘Ok, ik snap wat je bedoelt.’ Ik zou het niet kunnen
narekenen per se, maar ik weet in ieder geval wat ze bedoelen. Dat scheelt wel, dat je in ieder
geval met elkaar kunt communiceren. Maar in Enschede was niet echt een vak Datavisualisatie,
van ‘we hebben deze en deze getallen, hoe breng ik dat in beeld’. Wel heel veel dingen die eraan
verwand waren. Lineaire algebra enzo. Dus ik weet wat een matrix is en hoe een matrix werkt.
Het is een beetje weggezakt, maar ik weet de basisdingen wel. Interfacedesign hebben we wel
een beetje gehad, maar die echte klik daartussen niet. Dat kwam meer in de master daarna. Het
is wel grappig dat veel klasgenoten ook in de datavisualisatie zijn gerold, veel commerciele
klussen, of eigen bureautjes hebben opgericht. Met een ander doel dan journalistiek, maar wel
hetzelfde proces.”
Wat doet Nu na publicatie? Past je hetzelfde artikel ook aan als er nieuwe informatie is?
‘We hebben natuurlijk vaak cijfers die na een tijdje worden ververst. Een tijdje geleden hebben
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
162
we een discussie gehad. Stel je voor dat het gaat over voedselprijzen, graanprijzen. Dat wisselt
telkens. Stel dat we daar twee maanden geleden een artikel over hadden, natuurlijk tot dat
moment. Maar stel dat we nu weer een artikel hebben, dat de graanprijzen enorm zijn gestegen.
De discussie ging erover of we dan het oude artikel ook gaan updaten. Dat doen we uiteindelijk
niet. Dan krijg je een beetje een rare archieffunctie. Dan zou je eigenlijk alle oude berichten op
die manier moeten aanvullen met vernieuwde informatie. Zo van: we hadden eerst bericht dat
iemand ziek was. En een week later is iemand weer minder ziek. Dan maken we wel weer een
nieuw bericht dat hij minder ziek is, maar we gaan niet in het oude bericht ook nog zeggen: ‘Hij
was later weer minder ziek’. In data is dat ook lastig, want dan heb je een grafiek bij het bericht
dat de graanprijzen enorm hoog zijn. In die grafiek zie je een piek. Maar als je dat up-to-date
houdt zie je die grafiek daarna nog heel lang doorlopen. Dat is voor een lezer niet heel erg
logisch, dat je die grafiek daarna nog door laat lopen. Dus dat doen we sowieso niet. De versie
die we dan in het artikel stoppen, tot die datum, die gaan we daarna niet nog een keer aanvullen.
Dat zou heel raar zijn. Dan zou je dat bij bijna alle grafieken moeten doen, want heel veel
grafieken zijn tijdseries.
Als we ergens een fout in hebben gemaakt, bijvoorbeeld een fout getal, dan moeten we dat
sowieso natuurlijk oplossen en zo snel mogelijk. Ook een week later, dan moeten we dat gewoon
verbeteren, maar dat lijkt me vrij logisch. Dat zouden we anders ook rectificeren.
Nou is er een ander ding: het CBS maakt vaak schattingen. Soms hebben ze dan historische
data en dan weten ze gewoon dat dit dat getal is, bijvoorbeeld inflatie. Van de afgelopen paar
kwartalen heeft het CBS niet echt een schatting, maar ook niet echt een feit, dat hangt er een
beetje tussenin: ze hebben dan een getal aangehouden voor de inflatie, maar dat kan nog een
paar procentpunten schelen. Als je een kwartaal later kijkt is dan in plaats van 4,1 misschien 4,0
geworden. Nou pas ik die in feite ook niet aan. Dat doen we ook omdat we op dat moment die
CBS-cijfers krijgen. Dat is wat het CBS op het moment dat het artikel wordt gepubliceerd schat,
wat betreft de inflatie. En het kwartaal daarna kloppen die cijfers wel weer. Dus op het moment
dat de lezer het meest recente bericht leeest hebben ze ook weer die cijfers. Maar de laatste
kwartalen zijn dan weer een soort schattingen.
Staat er dan ook bij dat het een schatting is?
Er staat niet altijd in elk artikel: ‘Het CBS heeft hier een asterixje bij geplaatst’. Als ik het kan
dan doe ik het wel hoor. Maar het is ook een beetje de vraag hoe ver je moet gaan, want vaak
kloppen die cijfers gewoon. Het wordt niet vaak in het kwartaal erna weer gecorrigeerd. Dus je
zou heel veel kanttekeningen moeten plaatsen voor iets wat eigenlijk niet eens verandert.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
163
Is er nog iets wat betreft de workflow dat we nog niet hebben behandeld?
‘Ehm.. Dat zul je misschien zelf ook al hebben gemerkt. Het is best wel lastig om een workflow te
bedenken. Het is natuurlijk een gebied wat heel erg in opkomst is. Er zijn journalisten die het
niet heel erg leuk vinden als ze horen: ‘Datajournalistiek, dat is net in opkomst’, want er zijn een
heleboel mensen al langer bezig met..
Dick van Eijk reageerde inderdaad al op een van jouw stukken, over de geschiedenis van
datajournalistiek.
Ook wel ergens terecht hoor, want hij heeft er wel een punt mee. We moeten niet denken dat
onze generatie het wiel uit heeft gevonden. Er wordt al heel lang met data en getallen omgegaan.
Dus dat was ook wel een hele goede toevoeging van hem, dat Nieuwe Reporter-artikel. Maar aan
de andere kant: datajournalistiek, de vorm waarin het nu gebeurt, is wel helemaal nieuw. Tien
jaar geleden had je niet al die interactieve tools beschikbaar, je had niet die enorme bakken aan
data. Er was wel data beschikbaar, maar het was niet zoveel en van zulke hoge kwaliteit. En je
had die interactieve tools niet, dat scheelt gewoon heel erg veel. En die tools zijn ook nog gratis.
Vroeger moest je daar veel vaker voor betalen. Dus de instap is ook een stuk lager geworden.
Maar omdat er zoveel tools zijn en zoveel mogelijkheden - datavisualisatie buiten
datajournalistiek onploft nu ook echt, een heel bruisend veld is. Er gebeurt zeker iets nieuws.
Dus de datajournalistiek zoals we dat nu kennen is wel heel erg nieuw. Zou je daar niet twee
termen voor moeten hanteren? Dat kan me verder niet zoveel schelen, maar dat maakt het aan
de andere kant wel lastig. Daardoor heb je wel een hele nieuwe workflow, hele andere
competenties die je moet hebben. Dick van Eijk en andere - met respect - oude rotten in het vak,
kunnen vaak wel programmeren enzo, maar die komen wel vanuit een ander veld daar naartoe.
En je merkt dat je dingen net even iets anders benadert of uitwerkt. Dat houdt het allemaal heel
spannend, maar dat betekent wel dat voor echte datajournalistiek zoals we dat nu kennen - alle
interactieve zaken - heb je wel een iets andere workflow. Je moet iets meer zoeken. En omdat
het allemaal zo nieuw is weet nog niet iedereen wat die workflow is. Er komen ineens zoveel
modellen, omgekeerde piramides en allemaal dingen, dat is best wel lastig, want ja, als je
hiermee aan de slag moet gaan, waar moet je dan in godsnaam beginnen? Dat is lastig en wat
mij betreft is het antwoord gewoon: ergens beginnen. Een dataset pakken en er een beetje mee
aan gaan klooien. Kijken of je er iets in kan vinden. Kijken waar je vastloopt.
Waar zit vooral het verschil?
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
164
Heel plat: print en internet. Niet dat het een beter is dan het ander. Want sommige dingen in
print zijn echt ongelofelijk mooi en zou je nooit online kunnen doen. Het klinkt heel raar, maar
in een krant heb je een hogere resolutiedichtheid dan op je beeldscherm. Je kan dus veel meer
details weergeven. In inkt kun je veel fijnere beeldpunten plaatsen. Je zou het misschien ergens
kunnen uitrekenen. Maar in print kun je hele kleine, priegelige letters weergeven. Sinds de
nieuwe iPads en Macbook Pro’s met hoge resolutie schermen kun je veel meer details zien. Kun
je ook verder inzoomen. Nu heb je in print nog steeds een hogere resolutie en kun je meer
details weergeven. Dat is het grote voordeel. Maar je bent statisch, je kan maar een dataniveau
weergeven. Je hebt een heel andere manier van de data benaderen en verwerken. Je werkt naar
een ander product toe, uiteindelijk. Online kun je meerdere datalagen maken. Je kunt het
interactief maken, maar aan de andere kant moet je ook weer rekening houden dat je niet te
priegelig kan gaan werken omdat het op je beeldscherm is. Maar elk beeldscherm is niet
hetzelfde, kan groot of klein zijn, kan ook een telefoon zijn. En je bent met interactieve tools
bezig, dus je bent bezig met Fusion Tables, wat je voor print misschien minder snel zou
gebruiken. Je hebt dus iets andere wetten. Je hebt ook in het dagelijks werken. Op een papieren
krantenredactie werk je in een andere routine dan op internet. Op internet is het: direct online,
zo snel mogelijk. Bij een krant kun je soms wat meer je tijd nemen en heb je soms wat meer tijd
om artikelen te plannen, ook al heb je daar soms ook heel hectische dagen, waar dingen zo snel
mogelijk af moeten. Bijvoorbeeld omdat de achterste pagina’s van een krant dicht moeten en
toevallig heb jij daar net een artikel gepland en daar hoort een visualisatie bij en dan moet dat
ook zo snel mogelijk. En als die pagina dicht is kunnen we naar de voorpagina’s kijken, anders
krijgen we die nooit af. Zit er een eindredacteur in je nek te hijgen. Er zitten gewoon een
heleboel verschillen tussen. Op wat voor redactie werken, naar welk eindproduct werk je toe. En
ja, Dick van Eijk werkt voor de papieren krant en ik voor Nu, wat internet-only is.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
165
Anke Vellenga (NOS)
Allereerst: jouw officiële titel is toch informatiespecialist?
“Ja, dat klopt.”
Wat houdt dit precies in?
“Ik werk op de afdeling Documedia. Aan de ene kant doen wij research. Dus: als journalisten
achtergrondinformatie of beeld nodig hebben, dan zoeken wij dat voor ze op. En het andere deel
is archiveren van het beeldarchief en tekstarchief. En tekstarchief is dan wat wij in uitzendingen
hebben gehad zetten wij in het systeem zodat we makkelijk kunnen terugvinden welke
onderwerpen we allemaal hebben uitgezonden. En dat is alleen voor televisie trouwens, dat
tekstarchief. En ongeveer een jaar geleden ben ik begonnen met het opzetten van
datajournalistiek bij de NOS, want er werd eigenlijk niet iets aan gedaan. Op zich bestaat
datajournalistiek al vrij lang, weet je waarschijnlijk ook inmiddels. Maar niet dat het zo
genoemd wordt en actief gedaan wordt.”
Dus al bestaat het al langer..
“Niemand was er mee bezig.”
En de oudere varianten, rondneuzen in Excel?
“Waarschijnlijk wel, dat wordt altijd wel eens gedaan denk ik. Dat is maar net hoe het uitkomt,
als er een verhaal met cijfers komt zal dat vast wel gebeuren, maar het was geen speciaal,
ingebed iets.”
En op welk moment dacht jij: hier ga ik in duiken? Was dat in deze functie?
“Het is nog steeds buiten mijn gewone functie, ik doe dit allemaal in de tijd die ik hier over hou.
Dat is misschien sowieso wel goed om te weten, dat wij hier niet echt een datajournalist in dienst
hebben. Ik kom daar nu misschien het dichtste bij. En er is iemand bij NOS op 3 met NOS op 3
Lab mee bezig, maar die doet het ook maar een paar dagen per week en die houdt zich ook bezig
met innovatie: datavisualisatie en innovatie doet hij. Dus wij werken wel samen, maar er is
niemand die dat fulltime doet.”
“Het moment dat ik dacht: ‘Hier ga ik mee beginnen’, was vorig jaar ergens. Een expertisedag
voor onderzoeksjournalisten. Daar was een presentatie van Hack de Overheid. Toen dacht ik:
‘Dat is inderdaad interessant’ en daar zouden wij wel wat mee kunnen doen. Ik dacht dat het ook
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
166
wel bij onze afdeling zou passen. Toen ben ik een paar maanden later naar The Guardian
geweest in Londen, toevallig. Ik ging eigenlijk naar een vriendin en toen dacht ik: ‘Dan kan ik
net zo goed bij The Guardian vragen of ik even mag langskomen’ en dat mocht. Dus toen heb ik
gevraagd hoe hij, Simon Rogers, dat heeft opgezet. En toen dacht ik: ‘Dat ga ik ook gewoon
doen’.”
En wat voor tips kreeg je mee?
“Hij heeft een beetje verteld hoe zij zijn begonnen. En hij vertelde dat hij ook heel veel in zijn
vrije tijd heeft gedaan om dat op te zetten, want ook die hoofdredactie dacht: ‘Dat kost tijd en
geld en dat hebben we niet’, dus hij dacht: ‘Ik doe het gewoon in mijn eigen tijd en dan zeg ik wel
dat het niet zoveel geld kost en dan laat ik ze wel zien wat er allemaal uitkomt.’ Uiteindelijk heeft
hij ze overtuigd en nu werken ze er met een stuk of vijf mensen, alleen aan datajournalistiek.
Dus toen dacht ik: ‘Ja, dat is inderdaad een manier, gewoon beginnen en mensen overtuigen’.”
En toen kwam je terug..
“Een paar maanden later is de werkgroep opgezet. Het was juli dat ik er was en in oktober
hadden we het eerste werkgroepoverleg. Dat duurt hier altijd een tijdje, want het zijn mensen
van verschillende redacties en iedereen werkt in verschillende diensten, dus voordat je een keer
een groep bij elkaar hebt duurt dat weer een paar weken. Maar in oktober hadden we toen het
eerste werkgroepoverleg. Daar zitten mensen van verschillende redacties in. Van Documedia,
Nieuwe Media, verschillende redacties: Binnenland, Buitenland, Economie, NOS op 3, Digidesk
(de internetredactie) en de mensen van NOS Net (die ook meer met sociale media bezig zijn).”
Wat is dan het verschil tussen Nieuwe Media en NOS Net?
“Nieuwe Media faciliteert meer wat er mogelijkheid is op de website. Dus die doet inhoudelijk
niets, maar die maken de website of applicaties.”
Meer de techneuten?
“Ja.” “En NOS Net doet vooral ook dingen voor internet, maar ook wel eens voor tv. Met
mensen, ooggetuigen bijvoorbeeld. Of dat ze een deskundige groep maken en enquetes
uitsturen.”
Zij onderhouden de band met het publiek via internet?
“Ja. Laatst met ‘Vraag het Den Haag’ hebben zij ook meegewerkt.”
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
167
En jij hebt toen NOS-breed een mailtje uitgestuurd met de vraag wie er mee wilde doen?
“Nee, ik heb wel mensen uitgekozen met wie ik het er daarvoor over had gehad en die dat
interessant vinden. En als je het er dan met mensen over hebt dan hoor je wel: ‘Oh, dan moet je
die ook uitnodigen want die vindt dat ook wel interessant’. En zo krijg je uiteindelijk wel een
groepje bij elkaar.”
En hoe groot is die groep nu precies?
“Ik denk ongeveer vijftien mensen. Halverwege is het ook uitgebreid met twee mensen van
Nieuwsuur. Daar is dan ook weer een meisje mee bezig, Lieke Kwant. En die zitten dan ook bij
ons.” “[Lieke] heeft wat meer ruimte gekregen [voor datajournalistiek]. Het verschil met
Nieuwsuur is dat zij meer de echt journalistieke verhalen maakt. Dus wel op zoek gaat naar
datasets en dat analyseert en dan er verhalen van maakt. Maar zij hebben een andere soort site
dan ons, dus zij kan heel weinig kwijt qua visualisaties. Bij hun is het meer vanuit het verhaal
werken.”
Hoe ontstaat een datajournalistiek item precies?
“Gisteren was de eerste keer dat we die treemap online hebben gezet. Er moeten nog wel wat
dingen aangepast worden. Maar eigenlijk was het idee om een tool te hebben waarbij je
makkelijk dingen kan vergelijken en verhoudingen kan zien. En om dat op een originele manier
te doen. En je hebt wel gratis tools, zoals ManyEyes waarbij je ook een treemap kan maken,
maar die is heel lelijk met embedden. Eigenlijk was er niet een goed alternatief. Dus toen
hebben we besloten om er eentje te laten maken. Als wij een tool laten maken.. Wij willen dat
herbruiken. Het moet makkelijk te maken zijn. Maar meestal ben ik degene die dat maakt of
mijn collega’s van Documedia. Niet dat je elke keer opnieuw hoeft te programmeren. Dat is nu
gemaakt en gisteren hebben we het voor de eerste keer online gebruikt. Dat was dus eigenlijk
vanuit het idee van een visualisatie.”
Bedenken jullie dat bij Documedia? Want ik neem aan dat er ook andere mensen met die
informatie bezig zijn. Is er NOS-breed overleg?
“Nee, niet NOS-breed. Dat is ook wat is lastig vind aan het productieproces [van de treemap].
Ook waar ik trots op ben, omdat het iets van onszelf is. Maar het verliep moeizaam omdat de
communicatie beter had gekund. Het proces was zegt maar: wij hadden het bedacht, de treemap
willen we de eerste keer online hebben met Prinsjesdag. Er is een mail over geweest, wie wat
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
168
gaat doen voor radio en tv en daar stond onze treemap ook tussen. Nog contact over gehad met
de coordinator. Maar ondertussen hadden ze bij Economie ook bedacht van: ‘Wij willen een
visualisatie die die begroting weergeeft’ en die zijn naar NOS op 3 gegaan. Dus daar is een
stagiaire een dag bezig geweest om daar een visualisatie van te maken. Op een andere manier,
maar wel van de Rijksbegroting. Dus eigenlijk ga je op twee manieren iets visualiseren. Dat was
een beetje dubbel. Inhoudelijk is er verder niet iemand bij geweest. Bij de Haagse redactie
wisten ze ervan. Uiteindelijk hebben wij het bij Documedia zelf gemaakt. En de Digideskredactie
zet het dan uiteindelijk op de website. Daar waren ook weer problemen mee, met het systeem.
Dat zat ook allemaal niet mee.”
En jullie hebben dan ook zelf die vormgeving gedaan?Of heeft een extern bedrijf dat gedaan?
“Wij hebben – dat is inderdaad een goede – dat laten doen door een extern persoon, eigenlijk.”
Maar je hebt het zo aangeleverd gekregen dat je volgend jaar de cijfers kan invoeren en dat het
direct klaar is?
“Ja, of je kan het voor allerlei dingen gebruiken. Hopelijk gaan we het vaker dan een keer per
jaar gebruiken.” “En Nieuwe Media heeft trouwens ook nog meegewerkt, in samenwerking met
die externe programmeur, om het mogelijk te maken op de site. Ik weet niet meer precies hoe
dat allemaal werkt, ik ben niet technisch aangelegd. Maar dan had hij een ZIP-bestand met
allemaal dingen. Een basiscode met allerlei dingen ofzo en dat heeft Nieuwe Media dan weer
gedaan.”
Wat veel stappen moet je dan doorgaan zeg.
“Ja, ik heb ook even een printje voor je gemaakt.”
Dankjewel!
“Het is niet zo dat we ons altijd aan die stappen houden, maar over het algemeen wel.”
Dus jullie hebben wel een soort algemeen stappenplan?
“Ja, dit hebben we ook met de werkgroep opgezet.” “We houden ons niet helemaal vast aan het
schema. Maar op zich gaat het meestal wel zo. En bij ons is misschien ook het verschil.. Die
andere zijn echt datajournalist en die zijn in hun eentje of samen met een programmeur. En bij
ons is het echt een samenwerkingsproces over de hele redactie. En wij hebben eigenlijk geen
datajournalist en ook geen programmeur. Dan moet je dat toch zo een beetje oplossen. Maar
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
169
zoals gister.. De eerste stap is: je gaat naar Documedia en redactie en media gaan overleggen
over een visualisatie of idee. En diegene van de economieredactie heeft dat dus al niet gedaan,
die is gelijk naar NOS op 3 gegaan. Dus het moet nog wel misschien beter duidelijk gemaakt
worden.”
Bij de NOS is zo’n workflow dus meer noodzakelijk –
“Anders wordt het een chaos.”
Hebben jullie als werkgroep ook een bepaald doel voor ogen?
“Wij zijn eigenlijk begonnen vanuit de visualisatie. Dus: hoe kun je verhalen waar al cijfers in
voorkomen, mooier presenteren voor mensen en inzichtelijker maken en dat mensen kunnen
uitzoeken: ‘Wat betekent dit nieuws nu voor mij persoonlijk?’ Dus dan denk je vooral uit de
visualisatie en niet per se uit de data want die is er al, die hebben de redacteuren al. Maar
eigenlijk wil ik nu wel meer die kant op vanuit de data.. Dat je inderdaad op zoek gaat naar data
en daar probeert nieuws uit te halen. Dus dan is het weer het doel om iets naar boven te brengen
wat mensen nog niet weten. En vervolgens als het nog uitkomt en mogelijk is om daar dan een
visualisatie van te komen, maar dat het begin van het verhaal de dataset is.”
Want bijvoorbeeld die cijfers over die wapenvergunningen.. Jerry Vermanen was daar ook
mee bezig en die zei dat het verschrikkelijk lastig was om die data te krijgen. Jullie is het dus
gelukt. Ben je daar lang mee bezig geweest?
“Ik heb daar helemaal niets aan gedaan, eigenlijk, dus ik ga niet met de eer strijken, haha. Maar
de redacteur die die specialisatie heeft is er wel een tijdje geweest, inderdaad. Uiteindelijk heeft
hij het niet via de WOB hoeven doen, maar hij heeft er wel veel moeite in gestoken.”
En dat was een idee van Documedia?
“Dat was zijn idee. Hij zei: ‘Wij krijgen een dataset met alle wapenvergunningen van Nederland,
wat kunnen wij ermee gaan doen?’ Dus hij heeft die dataset aan ons gegeven. Dat was echt
megagroot. We hadden uiteindelijk drie Excel-bestanden nodig, anders paste het gewoon niet in
Excel. En uiteindelijk hebben wij dat geanalyseerd bij Documedia, of eigenlijk ik. We hebben dat
geanalyseerd en gekeken: ‘Wat kunnen we hier nu uithalen voor nieuws?’ Dat bleek nog best
lastig te zijn. Toen hebben we er zelfs ook nog deskundigen bij gehaald. Wat ook een belangrijk
onderdeel is, denk ik wel, van datajournalistiek. Dat staat hier niet in het werkproces, maar dat
is wel zo denk ik. Maar die [deskundigen] zeiden: ‘Eigenlijk zit hier ook helemaal geen nieuws
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
170
in’. Want wij wilden weten hoeveel automatische en semi-automatische wapens zijn er nou in
omloop in Nederland. Maar dat viel niet uit die dataset te halen. Het beste is om al die wapens in
het echt te bekijken, maar dat is natuurlijk niet mogelijk. En het type en kaliber en merk stond
er wel bij, maar daar kun je niet uit ophalen of ze semi-automatisch zijn. Want ze kunnen
verbouwd worden. Ze vergeleken dat met Volkswagen Polo, dan heb je ook verschillende
varianten weer en dat heb je ook met wapens. Dus dat was een beetje jammer. Maar op zich was
het wel een keertje echt datajournalistiek. En uiteindelijk hebben we het wel gebruikt, gekoppeld
aan een verhaal over Alphen aan de Rijn. ‘We hebben ook een dataset en dit zijn de gegevens die
erin voorkomen, mannen, vrouwen, schietsport, jachtsport.’”
En die redacteur was van Binnenland?
“Ja. Maar hij heeft wel een specialisatie in, beetje politie..”
Veiligheid?
“Ja.”
Hij gaf die dataset aan jullie. Hoe begin je dan met analyseren?
“Eerst ordenen. Eerst proberen een beetje te begrijpen: wat is het, wat staat er allemaal in? En
uiteindelijk heb ik dus.. Excel was niet handig omdat je dan drie keer alles moet doen en dan
weer bij elkaar optellen. Uiteindelijk heb ik een deel in Acces kunnen doen. En we toen nog een
systeem aangeschaft. Liquid heet dat, LQD. Daarmee kun je veel grotere datasets importeren en
analyseren. Dus je kunt het opschonen, ordenen, structureren. En dan kun je dus makkelijk
gegevens eruit halen, van: hoeveel wapens zijn er in de regio Amsterdam-Amstelland? Of:
hoeveel mannen hebben nou een wapen en hoeveel vrouwen? Daarmee hebben we het
uiteindelijk geanalyseerd.”
En moet je je zoekvraag dan programmeren?
“Nee, je hoeft niet te programmeren. Het is juist een heel makkelijk, simpel systeem. Het is een
beetje slepen en filteren, eigenlijk. Selecteren. Het ziet er een beetje uit als Excel, maar het is
makkelijker. En het is geen rekenprogramma, wat Excel eigenlijk wel is. Het is echt een
programma om data te structureren, te ordenen.”
En die deskundigen waren wapendeskundigen?
“Ja, van de politie.”
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
171
En was het makkelijk om die erbij te krijgen?
“Ik heb dat dus ook niet geregeld, dat heeft die redacteur die die contacten al heeft geregeld. En
ik had niet het idee dat dit voor hem moeilijk was, maar misschien omdat ze al contact hadden.
En hij had ook van een van hun ook die dataset gekregen. En ze vertelden ook heel open hoe ze
daar nu bezig waren sinds Alphen aan de Rijn om die wapenvergunningen in kaart te krijgen.
Want dat was nadat gebeurd was nog niet zo geregistreerd en nu zijn ze ook aan het nadenken:
‘Hoe kunnen we dit wel in beeld krijgen – ook met automatische en semi-automatische wapens?’
Daar heeft hij ons ook open over verteld.”
Dit was dus wel een succesverhaal?
“Voor mij persoonlijk in ieder geval wel, omdat het eindelijk een keer een echt datajournalistiek
verhaal is. Vanuit de data en niet van ‘Oh, wat voor mooie visualisatie past hierbij’. Wij hebben
uiteindelijk ook visualisaties gemaakt, maar dat was niet het startpunt. En het was een goede
samenwerking, met die redacteur en de deskundigen erbij.”
Is de doelstelling ook bijgesteld sinds jullie zijn begonnen? Ontdekken jullie als werkgroep wat
wel en niet werkt?
“Eigenlijk lopen we de hele tijd tegen dat soort dingen aan. We zijn bijvoorbeeld ook begonnen
met: welke tools kunnen we gebruiken. Dan blijken bepaalde tools toch niet zo mooi of handig te
zijn. Maar eigenlijk had ik voor mijzelf altijd al het idee van, dat onderzoeksjournalistieke is wel
iets waar ik uiteindelijk op wil uitkomen. Dus het niet heel erg duidelijk veranderd, ofzo. Het is
meer de uitwerking die aangepast moest worden. En we hebben sowieso niet echt een hele
sterke doelstelling. Het is nog niet geëmbed in onze organisatie. Het is nog steeds een beetje in
de oriënterende fase, van bovenaf. Ik zit er middenin, maar we worden nog niet echt erkend van
hogeraf. Nu is er die jongen van NOS op 3, die ermee bezig is om te kijken hoe we ermee verder
kunnen, maar voor hetzelfde geld houdt dat ook op.”
Dat is ook maar tijdelijk?
“Ja, tot januari geloof ik. Dus dan kun je wel allerlei doelen hebben, maar als dat niet..”
Onderwerpen. Hebben jullie ook specifieke onderwerpen waar jullie graag wat mee willen
doen?
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
172
“In principe is alles mogelijk. We hebben verschillende redacties. De economieredactie is hier
ook veel mee bezig, dus economische verhalen is mogelijk. En binnenlandse natuurlijk. Laatst
heb ik nog iets voor buitenland gemaakt. Buitenland is wel iets minder, maar persoonlijk vind ik
dat heel interessant, om daar juist wel mee bezig te gaan. Dat is nog wel iets om aan te werken,
maar in principe is het voor alle onderwerpen geschikt.”
Zijn er onderwerpen die jou persoonlijk erg aanspreken?
“Ja, inderdaad buitenlandse onderwerpen. Ontwikkelingssamenwerking. Conflicten.”
Zijn er ook bepaalde websites die data uitbrengen die je in de gaten houdt?
“Ja, af en toe. Het is niet echt regelmatig of op vaste tijdstipppen, maar als ik een keer tijd over
bekijk ik wel eens een aantal websites, of daar nog iets interessants op staat. Dat kunnen
buitenlandse dingen zijn, zoals WHO [Wereld Handelsorganisatie] en UN [Verenigde Naties],
Wereldbank, van alles. Of bij The Guardian zelf, daar hebben ze natuurlijk ook allerlei datasets.
En Nederlandse: overheid.nl, onderwijs, wij hebben wel een rijtje.”
En kijk je ook vaak naar de CBS-site?
“Ook CBS inderdaad.”
Maar is het ook zo dat je die echt elke dag of wekelijks checkt?
“Nee, maar dat is dus alleen als ik tijd over heb. En dat is de laatste tijd niet echt..” “Maar CBS is
inderdaad een goede, ook omdat ze een agenda hebben van wat er gaat komen. Dat hebben
andere organisaties ook wel, VN enzo. Dan zou je eventueel als je iets interessants ziet, dat alvast
kunnen inplannen. Dat is hier ook altijd lastig.” “Heel vaak moet iets op het laatste moment
gebeuren en dan komt het soms net niet goed uit.”
Heb je ook wel eens dat je van tevoren al zegt: ‘Die dag ga ik daar mee bezig’?
“Je kan wel een beetje inplannen. Ik heb nu een keer in de week een dienst waar ik mijn tijd vrij
mag indelen en dat is meestal datajournalistiek. Dus dan zou ik dat kunnen doen. Maar ik heb
tot nu toe niet iets gezien waarvan ik zeg: ‘Daar moeten we echt mee bezig’.”
Dat is ook wat bij doelstelling hoort: als jullie iets brengen moet het dan per se nieuws zijn?
“Eigenlijk is dat wel het uitgangspunt. Persoonlijk vind ik dat we best meer aandacht mogen
besteden aan de achtergronden. Uiteindelijk heb ik dat ook gedaan met het HIV-verhaal en de
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
173
wapenvergunningen. Want er zat niet echt nieuws in die dataset. Maat het verduidelijkt wel veel
dingen. En voor mensen kan het ook persoonlijk interessant zijn dat ze kunnen zien: ‘Wat
gebeurt in mijn regio of met mijn leeftijdsgenoten?’”
Zou dat bij de NOS passen, denk je dat je dat erdoor krijgt?
“Ehm.. Ik denk zelf van wel. Maar ik denk dat het beleid niet zo is. Dat wil ik ook nog even
duidelijk maken. Eigenlijk is bij NOS nu internet first. Eerst was tv first, nu is internet first. En
de website is vooral een nieuwssite. En voor de internetredactie is het ook lastig om
achtergrondartikelen te publiceren op de website. In het ‘laatste nieuws’-blokje heb je dan een
achtergrondverhaal, dat klopt eigenlijk niet. Voor hun is dat lastig om weg te zetten.”
Ik zei al: welke onderwerpen zou je willen behandelen die niet bij de organisatie passen. Dat
zijn dus meer die achtergrondverhalen?
“Ja. Eigenlijk wel. Maar niet specifieke onderwerpen.”
Wat zijn voor datajournalistiek de voor- en nadelen van deze organisatie?
“De samenwerking tussen verschillende disciplines vind ik echt een voordeel. Dus dat je dan
vanuit de redacteur inhoudelijk input krijgt. Wij hebben weer meer verstand van datasets en hoe
je datasets kan vinden. We missen alleen een beetje een technisch persoon. Maar de
internetredactie weet weer wat er allemaal mogelijk is op de website.”
Technisch als in: een programmeur?
“Ja, een programmeur. We hebben wel programmeurs bij Nieuwe Media natuurlijk, maar die
werken meer op lange termijnprojecten. Die kunnen niet even snel ingezet worden voor een
visualisatie die morgen af moet.” “En een nadeel vind ik dat er geen officiële coordinator is, die
fulltime met datajournalistiek bezig is. Dat het nu vooral naast het gewone werk gedaan moet
worden.”
Heb je wel, als je met collega’s praat van andere afdelingen, het idee dat ze de waarde van
datajournalistiek inzien?
“Ja, hier op de vloer wel, zeker. Veel positieve reacties en mensen zien ook echt het nut wel.
Alleen van bovenaf is het wat lastiger.”
Weet je dan ook wat ze precies lastig vinden?
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
174
“Ze willen het dan wel gelijk allemaal goed hebben. En ik heb ook het idee dat ze het ook niet
helemaal honderd procent begrijpen. Zij hebben het ook druk met allerlei verschillende dingen,
dan staat dit niet zo hoog op hun prioriteitenlijstje, volgens mij.”
Erik Bloem zei:“Datajournalistiek is soms meer wetenschap dan journalistiek”. Nu wordt er
gediscussieerd over de waardering van de NOS voor wetenschap. Heeft dit hier ook mee te
maken?
“Nou, ik denk dat sowieso van onderzoeksjournalistiek in het algemeen het beeld bestaat dat dit
veel tijd kost en weinig oplevert. En dat zij dat hierbij ook hebben. Ik heb het er wel eens met de
hoofdredacteur over gehad en dan zegt zij: ‘Maar wat ga je dan doen? Wat voor nieuws ga je dan
brengen?’ Ja, dat weet ik nu nog niet.”
Ze wil direct resultaat zien.
“Ja. En dan kan ik mij van haar ook wel voorstellen dat ze daar niet zomaar geld aan gaat
besteden. Maar ondertussen.. Ik ga nu gewoon proberen aan te tonen wat we allemaal kunnen,
maar dat is lastig als je er niet fulltime mee bezig kan.”
Je kan hier natuurlijk moeilijk zeggen: ‘Ik ga twee weken ergens mee bezig en misschien levert
het niets op’.
“Nee. En nu hebben we dus hele beperkte middelen en dat schiet ook niet op, met resultaten die
je dan kan laten zien.”
Heb je wel een budgetje gekregen?
“Nee. Wel voor de treemap bijvoorbeeld of de pensioenvisualisatie.”
Technieken. wobben, scrapen, doen jullie dat soort dingen ook?
“Sommige journalisten gebruiken de WOB wel natuurlijk. Scrapen zou ik heel graag zelf kunnen,
maar dat kan ik niet. Dat wil ik wel leren, maar er is niemand die dat eigenlijk kan. Ook een
gemis. Dat zou een programmeur wel even voor je kunnen doen.”
Werken jullie ook samen met andere partijen, bijvoorbeeld met hackathons?
“Doen wij ook niet. Wij hebben wel eens het idee gehad hoor, wij willen nog wel eens een
hackathon ofzo organiseren. Maar weer: tijd, geld.”
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
175
En werken jullie ook nog met andere programma’s samen dan Nieuwsuur?
“Nee. Zou ook nog een optie kunnen zijn. Sta ik wel voor open, maar is er nooit van gekomen
eigenlijk.” “Samen sta je natuurlijk sterker. Dat vind ik wel mooi aan de datajournalistiek in
Nederland. Datajournalisten staan wel open voor samenwerking en kennis delen. Dat is wel
gaaf. Ik mail ze ook wel eens van: ‘Ik heb geen idee hoe dit moet, weet jij het?’ En dan leggen ze
het gewoon uit.”
Wat betreft updates: bij een nieuwe ontwikkeling plaatsen jullie gewoon een nieuw bericht,
neem ik aan?
“Ja, dat hangt er vanaf hoe lang na die tijd het is. Meestal vullen we het de eerste paar dagen nog
wel aan. We hadden bijvoorbeeld eens iets met tandartstarieven en een tandarts met hele hoge
tarieven had zijn tarieven ook aangepast. Ja, dan passen wij dat ook aan. Maar mailen ze ons
zelf, dat iets niet klopt, dan passen we dat ook aan. Laatst hadden we een enquête met mensen
in het buitenland en een paar weken later waren er nog mensen die er heel graag bij wilden, toen
hebben we dat ook gedaan. Dat was een kleine moeite. Maar bijvoorbeeld UWV-cijfers, die
krijgen we nu elke maand. Dan maak ik een kaartje van de werkloosheidspercentages per
gemeente. Dat maak ik gewoon elke maand opnieuw. En dan maak ik een nieuw artikel.”
En dat plaats je dan in een dossier of onder een tag?
“Nee, dat is iets waar we ook aan willen werken. Hoe je dat terugvindt op de site of hoe je dat
kan ordenen. Maar daar wordt nog aan gewerkt.”
Denken jullie bij Digimedia bij datajournalistiek ook aan een specifiek medium?
“Meestal ben ik vooral bezig met de visualisatie en dat is vooral voor internet. En de redacteur of
verslaggever mag nadenken wat hij op radio en televisie gaat doen. En daarbij hebben we op
televisie ook een paintboxafdeling, die in principe de infographics, plaatjes, kaartjes voor
televisie maakt.”
Werken jullie veel samen met de paintboxafdeling?
“Nee. Dat zou misschien wel moeten. Dat zou handig kunnen zijn, omdat ze sowieso meer
kennis hebben van grafische vormgeving en wat handig is en wat niet, maar op zich komt dat er
steeds niet van.”
Als je hun kennis van 3D-visualisaties combineert met datajournalistiek..
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
176
“..kun je hele gave dingen doen. Maar het enige wat ik dan zou kunnen doen is de data
aanleveren.”
Snappen zij die data ook goed of zijn het meer grafisch vormgevers?
“Ik weet het niet honderd procent zeker, maar volgens mij zijn zij meer vanuit de grafische hoek
en hebben ze minder verstand van data.”
En het is natuurlijk het mooiste als iemand én journalistieke kennis én technische kennis én
grafische kennis heeft.
“Ja, en die combinatie is moeilijk te vinden in één persoon. En vandaar dat ik denk dat
samenwerking uiteindelijk de beste oplossing is.”
Wat betreft de medewerkers. Jij bent vanuit de opleiding bezig geweest met informatie.
“Ja, niet met data, maar wel met informatie. [Lachend] Ik weet alles van data. Een
informatieprofessional, noemen ze dat.”
Om wat voor informatie moet ik denken?
“De opleiding heet Informatie, Dienstverlening en Management, aan de Hanzehogeschool. En
tijdens die opleiding leer je eigenlijk hoe je met informatie omgaat en hoe je dat kan managen in
een organisatie. Het is ook helemaal niet op journalistiek gericht, tenminste niet die opleiding.
Je leert zeg maar vooral ook organisaties adviezen geven hoe zij met hun informatie om kunnen
gaan. Archiveren, wat de werkprocessen zijn met informatie. Maar niet echt: ‘Ga een Excel-
bestand analyseren’ ofzo, dat hoefden wij niet. Maar wel researchen: wat zij dan betrouwbare
bronnen en wat niet? Of business intelligence, dat hadden we toen wel. Dat is eigenlijk ook een
soort van datajournalistiek, maar dan meer voor het bedrijfsleven. Toen dacht ik wel: ‘Oh, dat is
wel heel interessant’. Maar toen zag ik dit nog niet voor me.”
Ik zag dat je ook bij het Algemeen Dagblad en RTL hebt gewerkt. Was dat ook te vergelijken
met datajournalistiek?
“Bij RTL was het archiveren en researchen en bij het AD alleen maar research.”
Weet je toevallig ook bij RTL wat er is gebeurt met Jelle Kamsma?
“Volgens mij weet Jelle dat zelf niet eens. Ik heb het hem wel gevraagd en heb hem ook wel eens
gesproken daarna, maar waarschijnlijk hadden ze toch andere ideeen over hoe zij die
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
177
datajournalistiek daar wilden invullen en heeft er zich hogerop iets afgespeeld, maar volgens mij
weet hij dat zelf ook niet.”
Ik ben wel benieuwd hoe RTL haar datajournalistiek nu wil aanpakken.
“Toevallig, die mensen van mijn oude afdeling – de Documedia-afdeling ook zeg maar,
Documentatie – die hebben mij ook gevraagd: ‘Misschien willen wij er ook wel wat mee doen,
wat zou jij ons dan voor tips geven?’ Ik weet niet hoe ver ze inmiddels zijn, maar ze zijn zich wel
aan het verdiepen.” “Want ik denk dat informatiespecialisten best wel wat kunnen bijdragen aan
datajournalistiek.”
En de andere mensen van de werkgroep, hebben die een soortgelijke achtergrond of zijn het
allemaal journalisten?
“Mijn directe collega’s hebben dezelfde opleiding gevolgd en de anderen zijn van allerlei
verschillende redacties. Die hebben journalistieke achtergrond. Hugo van der Parre is natuurlijk
een onderzoeksjournalist. Gert-Jan Dennekamp is natuurlijk verslaggever met een economische
achtergrond.”
Maar geen echte ‘nerds’, kort door de bocht?
“Wij weten hoe je data moet zoeken en analyseren en ik snap ongeveer hoe je moet scrapen,
maar om het echt te doen, dat wordt lastig. Dat is wel een gemis.”
Je zei al dat je bij The Guardian langs bent geweest. Zijn er nog andere organisaties waarvan
je de kunst een beetje kon afkijken?
“Ik denk dat je voor elke organisatie moet kijken wat voor jou het beste werkt. We zijn ook zo
megagroot, dat werkt ook niet echt mee.”
Heb je het idee dat een gewone verslaggever het datajournalistieke aspect van data zou
herkennen als hij tijdens zijn werk op data zou stuiten?
“Ja. Niet bij iedereen, maar meestal komen ze dan wel even naar mij toe: ‘Ik heb iets met eh..
cijfers’.” “En af en toe vraag je ook wel eens: ‘Heb je nog een leuk verhaal?’”
Heel praktisch: zitten jullie in dezelfde ruimte?
“Ja. Op een grote redactievloer.”
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
178
Zijn er nog dingen die we nog niet behandeld hebben?
[Kijkt door vooraf gemaakte aantekeningen.] “Nee, we hebben eigenlijk alles wel gehad. Het
belangrijkste is er nu niet een datajournalist echt fulltime hiermee bezig is, bij ons. En een
technisch persoon. Dat is het grootste probleem.”
Toch gek, je zou denken dat je in zo’n grote organisatie wel één persoon vrij kan maken. Maar
dan moet je toch door allerlei lagen.
“En het duurt een eeuwigheid voordat er een keer een beslissing wordt genomen. Want er moet
overlegd worden en het moet allemaal strategisch en op beleidsniveau uitgewerkt worden. En
voordat je, wat ik eerder al zei, hier een groep mensen bij elkaar hebt, ben je alweer een tijdje
verder.”
Tot slot: als er iemand bij jou zou komen zoals jij bij Simon Rogers kwam, en vroeg om tips.
Wat zou je dan zeggen?
“Ook gewoon: beginnen. Kijken hoe ver je komt. Laat zien wat je kan. En de samenwerking vind
ik heel belangrijk. Probeer samen te werken met collega’s die er ook interesse en enthousiasme
voor hebben. Dat eigenlijk.”
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
179
Jasper Koning - Nederland van Boven
‘Een ding wat wel handig is om vooraf te zeggen: ik heb in een paar interviews over Nederland
van Boven al de vraag gehad: ‘Wat hebben jullie nu journalistiek ontdekt? Wat is jullie
datajournalistiek?’ En daarmee meteen een waarschuwing: wij hebben niet aan
datajournalistiek gedaan, wij hebben echt datavisualisatie gedaan.’ ‘Je hebt waarschijnlijk een
vragenschema en misschien dat we her en der vastlopen omdat we er ook pas zelf gaandeweg het
project achter zijn gekomen dat dit echt een verschil is. Datajournalistiek en datavisualisatie.’
‘Ik kom er met een huidig project achter dat het alleen al lastig is om te bedenken: waar zijn we
naar op zoek? Er zijn zoveel databronnen.’
De doelstelling. Hoe is het programma ontstaan? Zagen jullie Brittain from above en
Deutschland von oben en dachten jullie direct: dat gaan we ook doen?
‘Het project Nederland van Boven als geheel is Nederland op een manier laten zien zoals een
kijker/bezoeker het nog nooit eerder heeft gezien. En dat aan de hand van spectaculaire
helicopterbeelden en datavisualisaties. Wat we voor ogen gehad hebben is: wat je niet met een
heli kunt filmen, daarvoor heb je datavisualisatie. Dus we proberen dat aanvullend te laten zijn
op de helicopterbeelden. Om een voorbeeld te geven: het bootverkeer voor de haven van
Rotterdam, dat speelt zich af over 24 uur. Als je dat filmt zie je geen wegen in de zee lopen, maar
dan zie je gewoon enkele boten. Als je 24 uur boten afspeelt zie je opeens hele duidelijke
patronen, dat kun je niet filmen en wel met data tonen. Dus dat was een doel, om
datavisualisatie toe te passen. En wat we wilden toevoegen aan Duitsland en Engeland is dat wij
echt wel veel meer een verhaal wilden vertellen. Bij BBC zit een visualisatie over taxi’s en dan
zeggen ze ook in Brittain from above: ‘Kijk, in de spits nemen taxi’s allemaal binnendoorwegen’.
En vervolgens zie je daar in die visualisatie helemaal niets van. En dat was bij ons wel een
trigger: ‘Nee, er moet wel een wisselwerking zijn tussen voice-over en datavisualisatie. Dat moet
kloppen en er moet een verhaaltje in zitten, hoe klein en hoe dun ook. Dat is wel iets wat we
hebben willen toevoegen. Dus ik denk dat dat onze doelen zijn geweest.’
Dat was wat je in de eerste vergaderingen..
‘… dat ontstaat na verloop van tijd. Er is een ding van Brittain from above, daar ga je mee aan de
slag, je hebt een X aantal gesprekken, je gaat kijken: ‘Wat is dat eigenlijk, datavisualisatie?’. Na
een paar slagen kwamen we bij het bedrijf dat ze voor Brittain from above en Deutschland von
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
180
oben ook heeft gemaakt, dus zijn we daarmee in gesprek gekomen. Wat is daar goed gegaan, wat
kan daar nog beter? Die puzzelstukjes vormen uiteindelijk je hele verhaal.’
De bedoeling was dus niet om nieuws te brengen, maar inzicht bieden in wat je niet kunt zien?
‘In die zin nieuws, dus wel op een nieuwe manier naar Nederland kijken. Zoals je niet eerder
naar Nederland hebt gekeken. Maar wat heel vaak is.. Als boten in een bepaalde vorm voor de
haven van Rotterdam varen, dat is iets wat je op zich wel kan bedenken, dat hoeft niet heel
schokkend te zijn. Maar op het moment dat je het ziet en met data inzichtelijk maakt, juist
omdat je het niet kan filmen, is dat wel nieuw en kan dat wel verrassend zijn. Dus het is eerder
dat de verrassing gezocht werd dan echt het nieuwe. En dat zit ook in… Eeen visualisatie waar
heel veel reacties op kwamen is die van de meeuw die van Texel 300 kilometer.. In principe is
het een stipje dat van Texel naar Amsterdam vliegt. Het is niet wereldschokkend, maar het
brengt wel bij veel mensen het besef: ‘Jemig, een foto vliegt dus in een dagje van Texel naar
Amsterdam’, met de gegevens erbij dat dit 300 kilometer is op een dag en dat dat is om zijn
jongen te voeren. Dat gehele samenspel van info en beeld en visuaslisatie, dat maakt dat het iets
wordt waar mensen van denken: ‘Jeetje, dat wist ik nog niet en zo had ik het nog niet eerder
gezien’. En daar ben je continu naar op zoek, naar een nieuwe manier van kijken.’
Wat denk je dat mensen echt raakt?
‘Ik denk dat het een wisselwerking is tussen dat het er heel gaaf uit ziet – die visualisaties zagen
er gewoon heel tof uit. Wat de truck is en wat ik mij kan herinner.. Tegelijk met dat wij bezig
waren was PBS bezig met America Revealed. Daar kreeg ik van dat bedrijf een animatie van te
zien, van pizzakoeriers die pizza’s bezorgen in New York. En wat me daar opviel was dat een van
de redactrices ook zei: ‘En nu gaat hij naar huis’. En toen was het opeens geen opgloeiend stipje
meer, maar toen was het echt een pizzakoerier. En ik denk dat als dat lukt, dat die opgloeiende
stipjes in een keer een verhaal krijgen en daardoor persoonlijk worden – ik denk dat dat bij die
meeuw ook heel goed is gelukt, dat het niet meer een stipje was maar een verhaal werd – dat dat
heel erg werkt. Dat is één. En aan de andere kant, tenminste wat mij zelf in ieder geval – en dat
misschien toch meer een mannelijk ding – is gewoon de pure complexiteit in beeld weten te
brengen. Zoals met vliegbewegingen: de hoeveelheid vliegtuigen, de enormiteit daarvan.
Massaal wordt Nederland bevlogen en daar met een camera heel spectaculair doorheen en dat
dan er gewoon heel tof uitziet.
Het gevoel dat je hebt bij Discovery met Big Machines en dat soort dingen?
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
181
‘Ja, dan is het gewoon the impact. Dus ik denk dat dat een mannelijke appeal is en dat
verhaal/persoonlijke meer de vrouwelijke appeal is.
Had je dat van tevoren al bedacht?
‘Nee.’
Dat was ook geen doelstelling: we willen de mannen zus bereiken en de vrouwen zo?
‘Nee. We hebben wel in ons hoofd gehad: ‘Dit zou iets kunnen zijn wat snel heel technisch wordt
en Discovery-achtig en hoe zorgen we dat dit ook voor vrouwen interessant is?’ Maar die meeuw
heb ik heel lang op de plank gehouden omdat ik wist.. Technisch gezien was dat de makkelijkste
animatie om te maken: het is gewoon één GPS-track. Dus het is alleen maar camera. Het enige
waar je mee bezig bent is om voldoende met die camera om die ene punt heen te draaien, dat er
nog iets gebeurt in beeld. Maar het was technisch eigenlijk heel simpel. En dingen als
treinverkeer, botenverkeer, vliegverkeer, ja díe waren heel ingewikkeld en daar zijn we heel lang
mee bezig geweest. En daar moet je veel meer over het verhaal nadenken.’
Ik hoorde ook al dat je al die punten dan weer handmatig moest invoeren, zodat een trein over
het spoor rijdt en niet dwars door een woonwijk.
‘Ik denk in die zin, dat ik het meest trots nog wel ben op die van het treinverkeer. En omdat het
technisch heel moeilijk was om die data helemaal te berekenen, maar ook omdat we daar de
data ook echt bewerkt hebben voor het verhaal. We hebben gezegd: we gaan eerst alle treinen
vanuit Groningen naar Leeuwarden op Utrecht laten afkomen, dan uit Amsterdam, dan uit Den
Haag/Rotterdam. En zo al die windstreken allemaal op Utrecht af laten komen. Dus zo hebben
we echt een flinke bewerking.. Want in het eerste shot toon je maar een vijfde van de data en
daarna het andere stuk en daarna het andere stuk. Dat is sowieso al iets dat je wel moet
bedenken. Van: ‘We kunnen ook de helft weglaten’. Dan kunnen we daar wel met een camera
overheen gaan en dat dan als eerste shot.. Dat is gescript, dat is in scene gezet, dat is bedacht,
daarvan wisten hoe lang elke scene moet duren. Dan zoom je in op Utrecht en zie je al die
wissels heen en weer gaan. Dat is een los databestand. Dan zoomt hij uit om een totaalplaatje te
geven van.. En dan weet je dat het dus heel bijzonder is dat al treinverkeer soepel langs Utrecht
gaat de hele dag. Dus daar zit echt een opbouw in waarbij die data echt gemanipuleerd is om je
verhaal te vertellen. En het is in mijn optiek ook heel goed gelukt. Hij onthult echt in plaats van
dat je in een keer ziet: pats boem, hier zie je 24 uur.. Wat wel je eerste neiging is.’
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
182
‘Er is online een Noorse visualisatie van verhuisbewegingen. En die toont dan ook hele toffe
lijntjes vanuit Oslo naar buiten en van buitenaf naar Oslo en dat toont dus aan dat mensen
vanuit Oslo verhuizen en naar Oslo verhuizen. En die camera springt gewoon wat rond en
springt dan naar een volgende stad en daar gaan ook mensen in en uit en het ziet er heel gaaf uit
en dat ding is ook veel rondgestuurd. Maar als je daar kritisch naar gaat kijken dan denk je: ‘Ja
goh, dus mensen verhuizen naar Oslo en eruit. Ja, boeiend.’ Er zit eigenlijk helemaal geen
verhaal in en er is helemaal niet nagedacht over hoe de camera gaat. En dat is iets waar wij heel
veel over nagedacht hebben. Hoe dun ook, al is het alleen maar om aan te tonen dat er wegen
voor de haven liggen, er moet een verhaal in zitten en je denkt na over camera, timing en hoe je
wat jij vertelt staaft met de data. En dat is echt wel een principe waar we heel scherp op zijn
geweest en wat, denk ik, ook heel sterk uit die animaties komt.’
En die onderwerpen. Allereerst de onderwerpen van de afleveringen. Op basis waarvan heb je
die gekozen? Je zei al dat je een beetje dramatiek in de data brengt. Zijn onderwerpen als
‘gevaar’ daarom ook gekozen?
‘We wilden natuurlijk de werking van Nederland laten zien. Dus dan ga je na: wat heb je
allemaal in Nederland? Daar is inderdaad met name dan meer vanuit tv iets meer op dramatiek
gericht. Dus daar komt dan: we moeten ook iets met gevaar. Dan ga je over Nederland nadenken
en denk je: we moeten iets met water. Dus dan komt die animatie erin. Dus dan komt dat
onderwerp op de kaart. Dus dat ontstaat ook gewoon om te proberen een soort geheel beeld van
de werking van Nederland te geven. Dus dan kom je snel bij natuur, dan kom je bij water en dan
is veiligheid daar ook een onderdeel van. Die onderwerpen hebben gedurende het proces nog
wel heel veel veranderd. Dus daar zaten we zelf ook nog wel mee te hannesen. Op een gegeven
moment was er zelfs sprake om de boel om te gooien en toen heb ik gezegd: ‘Dat kan niet, want
we zijn al zover met de website, met grote datasets te verzamelen, dat kunnen we niet opeens
veranderen’. Eerst zou boeren veel meer een aflevering alleen maar over boeren worden. Dat is
een aflevering over knutselen geworden, om het wat anders te maken en online gaat dat nog wel
veel meer over boeren.’ ‘Het aantal koeien per vierkante kilometer. Waar boeren meer doen dan
alleen boeren, dus dat je er ook kan logeren of melk kan kopen. En de grootte van
boerenbedrijven. Het idee was dat je dan op zoek kan gaan waar nog een pittoresk
boerenlandschap te vinden is. Waar je ook kan logeren en met veel koeien. Want koeienlucht is
een fijne boerenlucht en varkenslucht is vies. Dat stinkt. In Brabant stinkt het daarom ook veel
meer, want daar zitten varkens. Maar met die onderwerpen.. We hadden in ons hoofd een
beetje: we doen twee animaties per aflevering. En dat is eigenlijk na verloop van tijd geweest dat
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
183
we ook heel erg gaan zoeken. Die GPS-animaties die werken het beste, daar zit beweging in. Met
wandelaars, met mensen die.. We gingen op een gegeven moment ook veel meer naar animaties
als de ontwikkeling van natuurgebieden. Die lenen zich eigenlijk veel minder goed voor een echt
vernieuwend, verrassend beeld. Omdat je dan veel sneller in een soort aardrijkskundigeachtige
uitleg terecht komt. Dus daar hebben we op een gegeven moment wel gezorgd: per aflevering
moet er minimaal één zo’n GPS-gebaseerde animatie zijn. Omdat die zich ook veel meer leent..
Want daar gingen we natuurlijk ook naar op zoek: hoe vertaalt zich dat nu naar tv, die data? En
dan ontdek je: als die beweging er al in zit door GPS – dat beweegt, dat is een puntje, dat kan
ergens naartoe, die kun je met een camera gaan volgen – dan gebeurt er iets in beeld. Dan moet
je er nog een verhaal bij bedenken. Maar dat werkt al beter dan aantonen dat er in het noorden
grasland is. Dat is gewoon land groen inkleuren. Dan gebeurt er niet zoveel. In die zin waren er
ook wel pragmatische redenen om te zoeken. Zo ben ik op een gegeven moment bij natuur gaan
denken: we moeten nog iets met dieren daarin doen. Ik wil getrackte dieren daarin doen.
Zeehonden waren niet gelukt, die hadden we niet, daar konden we de GPS-tracks niet van
krijgen. Ik weet niet meer precies wat daarmee was, maar op een of andere manier lukte het niet
om dat binnen te krijgen. Volgens mij worden ze wel getrackt. Of geteld. Maar anyway, toen ging
ik kijken: wat is er dan? En toen stuitte ik per ongeluk op een onderzoek dat herten gevolgd
werden met hele grote GPS-batterijen en daar gaan zoeken en dat is een hele leuke animatie
geworden. En dat was ook grappig, want dat onderzoek was net begonnen, dus het was voor hun
ook voor het eerst dat ze resultaten zagen.’
En hoe ging die samenwerking met verschillende mensen? Ik las dat je ontzettend veel data kon
krijgen. Maar je hoort weleens van datajournalisten die dingen willen onthullen, dat ze moeten
wobben en scrapen. Zijn jullie daar ook mee bezig geweest?
‘Nee, scrapen was gewoon niet nodig. We hebben een paar.. Vooraf hadden we gezegd: we willen
geen dynamische data, het is statische data. Puur omdat dynamische data verandert en je moet
er een beeld van schetsen. Van de site kwam wel vaak de vraag: gaan we wat met de actuele data
doen? Dat leek veel te risicovol. Voor de website hebben we het gewoon nooit nodig gehad om te
wobben. Het was wel dat we bepaalde GPS-gegevens van politievoertuigen, die in de aflevering
Veiligheid hadden, die kregen we eerst niet. Die kregen we pas toen we al twee afleveringen
hadden uitgezonden. En toen had de politie zoiets van.. We hadden dat contact al wel, maar
tijdens de eerste afleveringen hebben we die data gekregen en een verhaal verzonnen en de
animatie nog gemaakt. Dat was echt een last minute klus.’
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
184
Hadden jullie toen al wat anders voorbereid?
‘Dat hebben we afgeschoten. Er zijn ook een X aantal animaties in het proces nog afgeschoten
omdat ze gewoon niet goed waren of niet goed het verhaal vertelden.’
Ik dacht dat jullie bij aflevering 1 de hele serie al af hadden, omdat het zulk intensief werk is
‘Dat hoopten we ja, haha. Nee, er zijn echt animaties op maandagavond nog de montagekamer
in gegaan om voor dinsdag net op tijd.. Eentje zelfs die ik nog niet eens gezien had, wel versie
één, maar er maar op vertrouwd heb. Aerodata, dat zijn al die meetvliegtuigen die over heel
Nederland gaan. En daar is het verhaal ook niet al te sterk geworden, daar had nog een slag
overheen gemoeten. Maar het zag er wel heel spectaculair uit. Maar zo zijn er nog wel een paar
geweest. Maar dat was ook omdat het knutselland was en niet boeren meer, dus moest het iets
anders worden.’
‘De moeilijkste data om te krijgen was.. Informatie over wat er onder de grond zit, dat is gewoon
heel slecht vastgelegd. Mensen wilden wel meewerken, maar het was er gewoon niet. Of we
konden het niet krijgen in een formaat dat bruikbaar was voor ons. Hetzelfde geld voor Brinks,
van waardetransport. Die wilden hun data met plezier met ons delen, wat mij hogelijk
verbaasde, alleen ze wisten zelf niet hoe ze het uit hun tool moesten krijgen. Ze hadden het in
hun browseromgeving in een tool en ze gebruikten dat op het nú te bekijken. Ze konden me een
bitmap geven met een dikke viltstipstreep erop, maar daar had ik niets aan. Het was gewoon
niet te traceren waar die data te halen was, dus dat hield gewoon op.’
‘Gewoon in Internet Explorer. Daar konden ze dat wel opvragen, dan zagen ze op een schermpje
waar die auto’s rijden. Alleen wij moesten natuurlijk het archief hebben van eerdere ritten. En ze
wisten gewoon niet hoe ze dat moesten archiveren of waar dat in het systeem ging. En we
konden daar niet in en konden het bedrijfje niet snel genoeg traceren die die tool had gemaakt
en daar mochten we eigenlijk geen contact mee. Dus ze wilden wel, maar het lukte technisch
niet. En het andere ding wat ons, gaande het proces, het meeste werk opleverde was dat wij een
publieke omroep zijn, dus wij mogen geen dingen van waarde aannemen en dat het
Commissariaat van de Media gaandeweg het proces dacht: ‘Ja, maar die dataset die jullie
hebben, dat vertegenwoordigt een waarde’. En daar hebben we een heel gesprek met hun over
gehad waarbij wij zeiden: ‘Als je een directeur van een bedrijf een lezing laat geven, kost dat
geld, maar als je hem als VPRO interviewt is het gratis’. Een dataset kan wel geld kosten, maar
wij raadplegen, wij interviewen de data. Dus wij waren het er ook principieel niet mee eens.
Maar om aan de safe side te zitten hebben we wel overeenkomsten moeten sluiten met die
partijen, waarbij ze in ieder geval afstand doen en erkennen dat ze die data.. Dat was nog een
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
185
heel juridisch traject erbij. Dus we hebben niet hoeven wobben, maar daarin hebben we nog wel
een heleboel papierwerk te verstouwen gehad, wat nog even een projectje binnen het project
werd.’
Wat betekent dit dan voor de toekomst van datajournalistiek bij de publieke omroep?
‘Nou, dat de VPRO daar in ieder geval een eerste horde genomen heeft. We hebben ook
gesproken met het Commissariaat van de Media en die gaven uiteindelijk wel toe, maar gezien
de tijdsdruk konden ze daar nu niet nog een uitzondering op maken en dan scharen ze zich
sneller aan de conservatieve kant.’
Maar als je kijkt hoe duur sommige sprekers van Speakers Academy zijn, terwijl die ook gratis
interviews geven..
‘..dat is precies onze redenatie. Maar het was bijvoorbeeld wel dat Tomtom.. Die wilden hun data
niet met ons delen, want die zeiden: ‘Tien jaar oude data is nog steeds een paar ton waard en we
gaan dat niet aan jullie geven’. Vodafone deelde hun gegevens wel met ons, wat natuurlijk ook
uiterst kritische data is, niet alleen qua waarde maar ook privacygevoelig. Dus dat was ook onder
strikte voorwaarden dat we het daarna zouden vernietigen, dat we het niet zouden delen, dat we
het alleen hier voor deze doeleinden zouden gebruiken. Dus je komt dan wel in onderhandeling
met die partijen, maar ik denk nog steeds dat het niet anders is dan normaal journalistieke werk.
Ook als je binnen een bedrijf.. Je kan het breekijzer gebruiken of listig afspreken in een kroeg of
je bellen en overleggen met een bedrijf op en kijkt wat je er dan uit krijgt.’
Dus in die zin is het wel weer echt datajournalistiek?
‘Ja. Je doet gewoon research en bent bezig hoe dan ook die data boven water te krijgen en wij
hadden dan het voordeel dat het op een vrij positieve manier was, omdat wij er iets moois van
maakten wat die bedrijven zelf ook wel konden waarderen, dat we dat met hun data deden. Dan
zou je kunnen zeggen: ‘Maak je je niet te afhankelijk van zo’n bedrijf?’ Nou, ik denk van niet. Wij
hadden onze verhaallijn en wisten naar welke data we op zoek waren. Dat is het vertrekpunt
geweest waar vanuit we naar instanties zijn gegaan.’
Er heeft nooit een bedrijf gezegd: ‘We willen wel data geven, maar dan willen we er wel iets voor
terug’?
‘Dat hebben ze misschien wel gezegd, maar dat hebben we.. We hebben niet eens de tijd gehad
om er meer mee te kunnen doen. Er zijn alleen wel bepaalde dingen.. De politie Haaglanden had
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
186
de positie van hun auto’s vrij gegeven en die zeiden: ‘Je mag niet te ver inzoomen op waar die
auto’s rijden, want dat soort gegevens zijn vertrouwelijk’. En Vodafone kon niet de activiteit per
beller vrijgeven. Dat mogen ze niet eens, alleen per zendmast. En wij hebben dat weer
terugvertaald naar zoveel mogelijk kleine gebiedjes waar die activiteit is. Omdat je anders alleen
maar heel Eindhoven ziet oplichten of niet en wij wilden het natuurlijk bijvoorbeeld per wijk
doen. Maar dat zijn wel logische beperkingen.’
‘Wat ik achteraf de grootste uitdaging vond.. Je krijgt activiteit per zendmast, bijvoorbeeld van
Vodafone, laat ik dat voorbeeld aanhouden. Dus dan heb je een dataset en daar staan op een
gegeven moment getallen in. En die getallen zeggen: ‘Het was dan en dan, daar en daar heel erg
actief’. Ik heb geen mogelijkheid natuurlijk om te checken.. We hebben wel een redacteur
aangenomen met expertise van geografische data, dus die kon in zoverre controleren: is dit een
valide dataset, ziet dit er goed uit? Die kon daar ook echt bewerkingen in doen. Maar er is geen
enkele methode.. Je moet wel geloven dat die data die zij jou leveren, dat dit werkelijke data is.
Daar houdt het wel ergens op. En daar kan je nog wel een soort check op doen dat je gaat kijken:
lijkt dit ongeveer te kloppen? En dan zie je bij die telefoondata dat die steden het eerste
oplichten en dat daar de meeste activiteit is, dus dan denk je: dat is vrij logisch. Maar ja, dat is
wel.. Waar kun je dan nog checken..
Heb je weleens getwijfeld?
‘Nou, nee. Die met die telefoondata was wat dat betreft wel de pittigste, want dan moet je gaan
kiezen hoe je dat visualiseert. En dan denk je: ‘We gaan dat laten oplichten, als oplichtende
wolkjes, maar hoe hard laat je iets oplichten en hoe donker maak je iets waar het minder actief is
en hoe ver kan je daarin gaan?’’
Voordat sommige regio’s opeens overkomen als donkere, Middeleeuwse gebieden.
‘Ja, zwarte vlekken. Bij Amsterdam, bij Koninginnedag.. Wij wilden heel graag laten zien dat er
nog een laatste piek rond Amsterdam Centraal Station was, waar mensen de laatste trein naar
huis namen. En we wisten ook dat die er was en we wisten ook dat die inderdaad daar te zien
was, alleen hij kwam er visueel niet zo sterk uit. Hoever kan je dan gaan? Je kan ook gewoon het
Centraal Station wat harder op laten lichten en vertellen dat mensen daar de laatste trein.. Maar
dat was nou precies niet wat we wilden doen. We wilden dat aan de hand van de data doen en
daar zijn we wel zo strikt mogelijk in geweest, van: je moet de data visualiseren, anders kun je
gewoon een mooie animatie maken. En als je dat gaat doen, ga je nat. Dus dat was wel echt onze
strijd in de redactie. Tv die dan zegt: ‘Ik zie het niet scherp genoeg, kun je niet gewoon wat
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
187
oplichten?’ Nou nee, dat moet wel binnen de verantwoorde grenzen die je bedacht hebt. Het
moet nog wel ergens op slaan. En als het zo’n abstracte data wordt.. Het is activiteit per
zendmast, dat is al niet te bedenken, dat ga je terugvertalen naar kleine gebiedjes, waarvan je
weet.. Die zendmast heeft drie antennes, die antennes staan in een richting, dus je kan het delen
door drie. Dan ga je een furanoid tekenen, wat een vlak is. Daar kan je dan een bepaalde
activiteit aan toewijzen. Zo maak je een soort honingraat van Amsterdam en dat ga je op een
gegeven moment inkleuren. Ja, dan ben je al zo abstract en theoretisch bezig dat je denkt: wat
maakt het nog uit al ik het dan wat meer oplicht? Dus dat is je spanningsveld.’
Dan moet je streng zijn voor jezelf.
‘Je wil de data visualiseren, dat is wat je aan het doen bent. En anders ben je een animatie aan
het maken.’
Wat was jouw ervaring met datajournalistiek? Je werkt nu bij Digitaal, maar was je altijd al een
whizzkid?
‘Nee, ik ben projectleider bij Digitaal. Ik heb een journalistieke achtergrond en mijn rol is ook
veel meer het verhaal en de camera in de gaten houden. De datajournalist was Frederik [Ruys]
en die had kennis van geografische data en die kon die vertaling doen van zendmastactiviteit
naar een furanoid en dat soort ingewikkelde dingen waar ik niks van af weet. Maar ik heb
genoeg ervaring in het samenwerken met techneuten om de goede vragen te kunnen stellen en
de inschatting te kunnen maken van: dit kan wel, dit kan niet. Maar ik heb daar wel een
aansturende, coördinerende rol in gehad.’
En wat was voor jou zelf de eerste keer dat je met datajournalistiek in aanraking kwam?
‘Dat is denk ik Nederland van Boven geweest.’
Maar dat je het alleen zag, zonder dat je er zelf aan meewerkte?
‘Pfoe, ik heb echt het idee dat ik pas daarna.. Ja, ik ben me er echt rondom dit project in gaan
verdiepen. Ik kan niet zo een, twee, drie iets herinneren van voor die tijd. Het enige wat ik nog
weet is dat boekje van Freakonimics, dat ik graag aanhaal omdat daar zo briljant in zit dat je de
goede vragen aan data moet stellen om verrassende conclusies te krijgen. En ik ben wat dat
betreft toch iemand eigenlijk, stiekem, van het geschreven woord. Dus zo’n boek vind ik toch wel
heel prettig. Dus nee, ik kan nu wel een heleboel dingen noemen die ik recentelijk heb ontdekt,
die ik ook fantastisch vind, maar van voor die tijd.. Ongetwijfeld heb ik wel wat gezien.’
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
188
Maar je volgde The Guardian bijvoorbeeld niet al jarenlang?
‘Nee. In aanloop naar dit project heb ik wel een presentatie gezien van Aaron Koblin, die is
inmiddels hoofd creative arts team in Google [Creative Director van het Data Arts Team van
Google]. Die heeft onder andere ook die clip van The Arcade Fire gemaakt, waar Google Maps in
wordt gebruikt, met [Chris] Milk samen. Die is fantastisch. En hij heeft de Johnny Cash clip, die
is fantastisch.. En hij heeft onder andere ook het sms-verkeer van Amsterdam rond
nieuwjaarsnacht geanalyseerd en in een visualisatie weergegeven. Die zag er fantastisch uit. En
hij heeft ook de vliegbewegingen van Amerika gevisualiseerd. Dat waren wel wat dingen die wel
inspirerend zijn geweest, ook voor dit project.’
Hoe groot was jullie team eigenlijk?
‘Twee a drie man redactie, daar zijn een paar wisselingen in geweest. Een echte datajournalist,
Frederik Ruys. En ik als eindredacteur en Geert [Rozinga] eindredacteur tv. En een producer en
dan heb je de losse ploegen voor tv en camera en editing enzo.’
En die redacteuren, hadden die iets met data?
‘Nee, Frederik en ik hebben dit behoorlijk samen gedaan. Wel in afstemming met Geert
natuurlijk en die aansluiting met tv zoeken en Geert kwam er steeds meer in. Maar in principe
hebben wij het leeuwendeel met zijn tweeen gedaan. Maar je moet niet vergeten dat we
natuurlijk wel samenwerkten met 422 South in Bristol, die dat natuurlijk wel al voor Engeland
en Duitsland hadden gedaan. Dus daar zat ook nog een hele ploeg mensen met een art director,
een producer, twee graphic jongens en ook nog een programmeur. Dus daar is ook heel veel
werk verricht. En daar zat een oude BBC-techneut die vroeger zelf nog de radio aanslingerde
met een draaiorgel. Die schreef nu zelf eigen JAVA-scriptjes om al die data weer te vertalen naar
één vorm. Je moet rekenen, dat bootverkeer, je denkt: dat is gewoon simpel, dat zijn posities.
Maar nu heb je ook de tijd en de datum daarin, want je wilt weten op welke dag, hoe laat was die
boot op een plek. Nu zijn er voor elk van die drie elementen ongeveer tien verschillende notaties
te verzinnen. Voor datum heb je de Nederlandse notatie, de Engelse notatie en nog andere
notaties. Voor tijd heb je 24-uursnotatie, A.M., P.M. en voor locatie heb je diverse projecties
waarbinnen je net een ander coordinatenstelsel hebt. Zij krijgen al dat soort verschillende
datasets binnen, maar moeten dan in één systeem gaan barsen. Zij moeten daar eerst een
gigantische berekenslag op doen om alles één te maken. Je kunt je voorstellen dat daar ook nog
weer een hele grote kans op fouten in zit. Een missertje in je berekeningsscript en je hele beeld
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
189
wordt anders en je bootjes varen niet meer door de zee, maar varen in eens in Duitsland door
het land. En dat hebben we meegemaakt. Dus dat soort dingen kom je ook ineens tegen.’
Dat deden zij dus vooral? Jullie zaten niet met een rekenmachine in de hand?
‘Nou, Frederik prepareerde die data wel voor ze. We probeerden dat wel zo goed mogelijk aan te
leveren. En daar kregen we natuurlijk wel wat op terug en dan moesten we checken: klopt dit
nog steeds?’
Hoe zag dat er precies uit? Jullie bereiden iets voor, zij gaven aan wat ze nodig hadden..
‘Stel dat je die botendata van kop tot staart neemt. De redactie verzint: we gaan een aflevering
over Rotterdam doen. Wij gaan bedenken wat we dan willen vertellen over Rotterdam. We
hebben iets gehoord over een rotonde in de haven. Op basis daarvan data opgevraagd bij
havenbedrijf Rotterdam. Die data komt dan op een harde schijf binnen. Dan gaan Frederik en ik
zoeken: kunnen we in die data inderdaad zelf vinden dat er een rotonde lijkt te zijn voor de
haven van Rotterdam? Nou, die lijkt er dan ongeveer te zijn. Dan gaat hij met een briefing naar
dat Engelse bedrijf toe. Dus dan schrijf ik: ‘Het komt in deze aflevering, het komt ongeveer in die
plek met die video eromheen, we willen ongeveer zo’n lengte en we hebben deze shots in
gedachten van een boot die helemaal de haven ingaat en dat we aan de hand daarvan laten zien
dat er een rotonde is. Dus het verhaal beschrijven. We krijgen een eerste ruwe versie van hun,
nog zonder enige vorm van camera of wat ook, die puur laat zien hoe die data loopt op een dag.
Dus dat is een hele ruwe visualisatie. En dan ga je in stappen daar vormgeving aan toevoegen, je
timing veranderen en je camera aan toevoegen. Tot je uiteindelijk langzaam in vier, vijf iteraties
naar een eindanimatie gaat. En die moet dan nog naar de editset om in het programma verwerkt
te worden.’
Dat lijkt me wel vet, dat je iets langzaam ziet ontwikkelen, van ruw..
‘Nou, toen ik de eerste animatie ook af zag en dit was deze en hier zijn we ook heel lang mee
bezig geweest, omdat we hier alles moesten uitvinden.. Dit was de tweede aflevering, Rotterdam,
maar deze animatie waren we heel vlot mee bezig. In eerste presentatie gebruikte ik deze ook,
deze heb ik bijna ook altijd wel in presentaties gehad, omdat ik dit verhaaltje als eerste rond
had. Maar als je dat voor het eerst echt af ziet, dat is wel echt geweldig. En als je hem dan op tv
tussen de rest in gemonteerd ziet en hij heeft muziek erachter en de voice-over er overheen, dat
is nog geweldiger. Dat is wel kicken. Jij weet dat dat ooit – en zeker bij deze, want hier heb ik bij
Frederik ook naast gezeten op zijn zolderkamertje, dat we acht uur bezig zijn geweest om alleen
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
190
maar lullig te kijken of er nu een rotonde was te zien en welk bootje is nu een goed bootje om als
voorbeeld te nemen – dan weet je wel ongeveer waar het vandaan is gekomen en dan kijk je wel
anders.’
Want wie had bij de VPRO nu eigenlijk als eerste bedacht: ‘Dit moeten we gaan doen’?
‘Erik van Heeswijk, hoofdredacteur digitaal, die tennist met iemand die heel veel van
geografische data weet. En zijn tennispartner had een programma in Engeland gezien dat heette
Brittain from above en die zei tegen Erik: ‘Daar moeten jullie ook iets mee doen bij de VPRO’.
En hij is dat hier toen gaan pitchen en dat is opgepikt en toen is gezegd: ‘Wij gaan daar een
project van maken’.’
En hoe ben jij erbij gekomen?
‘Geert was toen vanuit tv ingeschakeld en Erik had mij naar voren geschoven als eindredacteur
vanuit digitaal. Dat was ook voor het eerst. Normaal krijgt digitaal dan achteraf te horen: ‘Ohja,
we willen hier ook een leuke website bij’ en Erik heef gezegd: ‘Nee, we moeten crossmediaal
werken, we moeten over onze mediagrenzen heen stappen’. En vandaar dat ik daar ook als
eindredacteur in zat om ook volwaardig mee te kunnen praten. En dan kun je dus dit soort
wisselwerkingen tussen digitale informatie en tv-beelden krijgen. Dat heeft in die zin denk ik
heel goed uitgepakt.’
Ben je, afgezien van het tv-programma, organisatorisch ook tevreden?
‘Het kan altijd beter. In een nieuw programma moet je wel elk wiel uitvinden. Naast dit hebben
we ook de website nog gemaakt, waar mensen zelf met de data aan de slag konden. Dat was zo
mogelijk nog ingewikkelder. Daar wordt nu ook wel kritisch naar gekeken. Dat mensen moeilijk
kunnen zien, dat hoeft natuurlijk ook niet, wat er verder achter zit.’
Wat was de kritiek dan? Ik hoor van andere datajournalisten juist vaak kritiek op te
ingewikkelde webtoepassingen en vond jullie site juist mooi overzichtelijk.
‘Nou, dank je, dat is fijn om te horen, dat is juist wat we voor ogen hebben gehad. ‘Laten we het
zo simpel mogelijk houden.’ En dan zie je dat dit toch moeilijk is.’
Persoonlijk had ik het leuk gevonden om allerlei dingen te checken, maar dit is ook voor
bijvoorbeeld wat oudere mensen overzichtelijk.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
191
‘Dat hebben we inderdaad heel erg geprobeerd in de gaten te houden, dus dat is prettig om te
horen. Om inderdaad die simpelheid voor ogen te houden. Maar drie sliders; wanneer je een
slider verschuift veranderd er direct iets; weinig laadtijd. De moeite, dat begrijp ik wel, is de
interpretatie ervan. We gingen drie datasets met elkaar combineren op die website. Bijvoorbeeld
het aantal koeien, grootte van boerderijen en wat je kan bij zo’n boerderij. Iedere dataset op zich
is al best wel pittig. Het aantal koeien per vierkante kilometer – ja, daar moet je wel een
voorstelling van maken. Hoe doe je dat dan? Ok, je hebt naar boerenbedrijven gekeken en
hoeveel koeien er bij zo’n boerenbedrijf is en waar die zit. Die combinatie: wat heb ik dan? Dan
heb ik een gebied waarin én boerderijen zitten met veel koeien én die boerderijen zijn groot van
omvang qua omzet die ze draaien én ze doen er ook nog logeren bij. En wat betekent dat dan?
Dat stuk interpretatie was voor veel mensen toch moeilijk. En wat ik ook wel heb gemerkt is dat
mensen soms de kleuren door elkaar haalden. De achtergrond was blauw en de data was oranje.
Dat mensen dan niet snapten wat dan het actieve gebied was. Dan zie je toch.. Het is
supermoeilijk om zo’n online kaart te maken. We hebben superveel geleerd en ik ben er heel
trots op, dat het ook gelukt is. Er zitten datasets in die nog nooit eerder zo publiekelijk voor
mensen toegankelijk waren. Huizenprijzen, omvang van tuinen bestond niet. Die heeft het
kadaster speciaal voor ons uitgerekend. Er zitten unieke datasets in die eerder niet bestonden,
maar er moet wel een vervolg op komen. Die kennis moet verder benut worden.’
Gaan jullie ermee verder?
‘Dat is nu een beetje het jammerlijke. Dat een netmanager van tv, Nederland 1, daar nu over
oordeelt, die niet zoveel verder komt dan: ‘Een weblog van Boer Zoekt Vrouw haalt meer
bezoekers dus dat is beter’. Ja, dat is een beetje de frustratie als je te ver voor de muziek vooruit
loopt. Nu zijn er wat positieve voortekenen dat de erkenning wel vanuit andere hoek komt in de
vorm van prijzen die we met die site aan het winnen zijn. Dus hopelijk geeft dat weer een nieuw
verhaal, dat er toch een vervolg kan komen.’
En het programma zelf, krijgt dat sowieso een vervolg?
‘Ja, er komt een tweede seizoen. Daar zit het digitale stuk dus minder zwaar in. Maar je moet je
ook bedenken: die kennis vertaalt zich ook door dat ik nu in een project van datavisualisatie
voor Why Poverty bezig ben en die conclusies die ik geleerd heb nog scherper toepas. Door
inderdaad redacteuren aan te nemen die echt in de data naar interessante conclusies gaan
zoeken. Dus meer dat journalistieke toe gaan passen. Dus veel meer met voorgebakken
resultaten te komen en de bezoeker nog minder zelf te laten uitzoeken, omdat dat toch nog heel
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
192
moeilijk blijkt te zijn. En dat ik ook wel snap: veel bezoekers hebben ook andere dingen te doen
dan heel veel data interpreteren en kijken wat dat dan is. Je moet het voorbakken en uitgezocht
hebben en presenteren.’
Vind je dat jammer? Of is het de taak van een journalist om de data te duiden?
‘Ik denk dat dat een ontwikkeling is waarvan we nu net aan het ontdekken zijn wat we daar dan
mee moeten. En ik denk dat het wel goed ook is, dat je als journalist zelf in die data op zoek gaat
naar interessante conclusies, dat dat wel deels onze taak is. Ik zou het andere kant juist ook heel
leuk vinden als je tools biedt, waarmee je.. Wat bij die kaart toch de hoop was, dat mensen hun
eigen omgeving heel erg gaan uitzoeken, want dat is altijd leuk, want daar woon jij zelf. En dat
die weer ons zouden verrassen met: ‘Nou, ik heb nu gewoon uitgevogeld dat er gewoon
ontzettend veel koeien in Utrecht staan’. Dat dat een beetje de wisselwerking zou worden. Dat is
niet helemaal gelukt. Maar dat lijkt mij nog steeds wel iets moois om na te streven.’
Sargasso en Altijd Wat merkten ook dat het lastig is om medewerking te krijgen van je publiek.
Je moet zorgen dat het voor hun een kleine handeling is, anders wordt het teveel voor ze. Zij
wilden hulp vragen bij een item over bouwprojecten, maar dat mislukte ook.
‘Voor bouwputten hebben wij dat ook overwogen. We hebben bij Nederland van Boven ook
gekeken: kunnen we nog iets met publieksinteractie? Data laten aandragen? Dat hebben we
eigenlijk gedaan bij een animatie waar we GPS-trackers hebben meegegeven aan boswandelaars.
Maar wat we wel overwogen hadden is hijskranen op de foto zetten en opsturen met GPS-
locatie. Dan krijg je een hijskranenkaart en kom je dus iets te weten over bouwputten. En eentje
die ik nog steeds in mijn achterhoofd heb zitten – ik moet alleen nog andere mensen ervan
overtuigen – is om openbare beveiligingscamera’s in beeld te gaan brengen.’
Dat heeft Sargasso toch gedaan?
‘Een stukje. De ambitie is natuurlijk landelijk dekkend. Elke openbare camera in Nederland op
de foto krijgen. In die zin heeft Nederland van Boven nu wel een beetje naam en faam om daar
wat mee te doen. Als wij van die miljoen mensen duizend zover kunnen krijgen dat zij ieder
dertig camera’s op de foto zetten.. Wat je dan weer zou kunnen doen is het blikveld van die
camera in beeld brengen, in overlappende cirkels op elkaar zetten en dan zie je dus precies welke
stukjes Nederland nog niet gefilmd worden.’
Heb je dan nog problemen met de politie?
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
193
‘Dat zou kunnen. Ik vind het nog steeds een heel cool idee. Dan heb je wel inderdaad dat mensen
alleen een fotootje nemen en zorgen dat ze hun GPS aan hebben en die metadata meesturen en
hoeven verder niks te doen. Wij doen de rest, wij checken of er werkelijk een camera op die foto
staat, waar die is genomen, of we hem al hebben, voegen hem toe en zo bouw je langzaam een
database.’ ‘Want dan maak je het simpel. Om die reden hebben we het ook niet gedaan. We
waren nog niet begonnen, niemand kende ons nog. Dan krijg je misschien twintig meldingen
binnen. Dat schiet niet op, daar hebben we niets aan. Daar kunnen we niet op inzetten.’
Die workflow: ging dat echt zoals jullie dat zelf hebben getekend? (Wijst op workflowtekening.)
‘Ja, ik denk dat dat wel.. Zoals met die boten: dat zijn deze stappen ongeveer. Daar komt het wel
op neer.’
In eerdere gesprekken merkte ik dat sommige datajournalisten al in het begin van het proces
met simpele tools een eenvoudige visualisatie maken om trends te ontdekken. Dus eigenlijk je
van stap 1 al naar visualiseren..
‘..Nee, dat is wel de tweede stap: analyseren. Wat ik zei over die boten, dat we acht uur zaten te
kijken: is dat patroon te zien? Dat is ook met dat soort vergelijkbare tools als.. Google had ook
een mapping tool, maar die hebben ze toevallig tijdens ons project stopgezet. Dat is het nadeel
van Google tools die gratis zijn: ze kunnen stoppen. Er waren een paar andere: ESRI heeft een
tool waar we gebruik van hebben gemaakt. De precieze tools weet Frederik beter dan ik, maar hij
had een paar tools om die data te plotten op een kaart om inderdaad zelfstandig eerst te kunnen
zien: wat zijn de patronen? Dat hebben we met die websitedata heel uitvoerig gedaan, want voor
die websitedata was het cruciaal dat die data landsdekkend is en dat er in Groningen ook iets
gebeurd en dat er in Limburg ook iets gebeurd. Dat er niet alleen in de Randstad wat aan de
hand is.’
Verder met de workflow: duren de verschillende fases even lang?
‘Bij die meeuw was niet veel research nodig en geen visualisatie nodig, want die wisten we
gewoon al wel. Die was vrij straight forward, terwijl bij die treindata ontzettend veel
berekeningen zaten. Daar hebben we zelfs externe partijen bij gehad die meehielpen met
rekenen. En dan is een visualisatie ook veel langduriger. Dus dat proces wisselt wel per omvang
van de dataset. In complexiteit ook: vliegbewegingen, supermoeilijk. Dat is allemaal berekend.
Dus dan heb je geen losse punten die een lijn vormen, maar dan bereken je het traject op basis
van een aantal controlepunten. Dus dat is een grote berekende dataset.’
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
194
‘Het is een beetje zoals wanneer je een afbeelding hebt. Je kunt een pixelafbeelding hebben en
daar is iedere pixel werkelijk ingekleurd. Of je hebt vectorafbeeldingen en die tekenen de lijnen..
Zo heb je ook datasets die daadwerkelijk elke punt geven en je hebt meer vectordatasets die de
controlepunten geven en dan moet je het stuk er tussenin zelf invullen. Dat zijn gewoon veel
complexere datasets en die duren dus ook veel langer voordat je een eerste visualisatie te zien
krijgt. De processing time wordt op een gegeven moment zelfs een issue. De computers daar in
Engeland stonden gewoon nachten te stampen om één animatie eruit gepoept te krijgen.’
Je zei in een interview al dat je dacht dat we al wat verder waren op dat gebied.
‘Er is zelfs processingkracht in India ingekocht om bij te processen. Tegen dat soort dingen loop
je wel pas aan als je het probeert.’ ‘Ik durf serieus te zeggen dat geen enkele partij in Nederland
is die zoveel grote, complexe datasets in zo weinig tijd verhaspelt heeft en er iets van heeft
gemaakt. Ik bedoel: twintig animaties, dertig datasets online, vijftig in een jaar tijd is echt giga.
En wij kregen ook te horen: ‘Waarom ga je dan naar een Engels bedrijf? Waarom blijf je niet in
Nederland, wij kunnen dat toch ook wel maken?’ En wij hebben daar een avond voor
georganiseerd in Pakhuis de Zwijger. Wij hebben gezegd: ‘Kom maar op dan’. Dan zeggen ook
veel mensen: ‘Die processingtijd, dat kunnen wij veel sneller’. En dat is leuk, met een eerste
versie, die eerste visualisatie aan het begin van het project. Ja, dat lukt wel, die kregen wij ook
wel binnen een dag. Maar nu high res[olution] op 1040 pixels voor HDTV-uitzending. Met alle
vormgeving eromheen en geen ruisje in het beeld en geen rastertje om de pixels heen. Christal
clear. Dan heb je een ander verhaal. Dan staan je machines een paar nachten te pompen, want
dit is gewoon hoogst mogelijke kwaliteit. Het moest ook naast die superhoogwaardige
helikopterbeelden komen te staan. Dus het moest gewoon het best mogelijke van dit moment
uitgerenderd worden. En dan doe je dat echt niet effe in een paar uur.’
Zeggen mensen dat ook eerlijk: ‘Wij kunnen dit niet aan’?
‘Ik heb bij die mensen gewoon zelf de conclusie getrokken. Van: wat jij nu laat zien en wat jij
zegt. En bij die Pakhuis de Zwijger-avond merkten we ook dat heel veel mensen daar wel tegen
aanliepen. Van: ‘Jeetje, dit was eigenlijk toch wel ingewikkelder of moeizamer dan we gedacht
hadden’. Soms wordt je ook wel weer verrast door iemand die er wel iets heel tofs mee doet of er
iets anders van kan maken, maar over het algemeen was bij mij wel de conclusie: we hebben het
behoorlijk goed ingeschat. En zo’n bedrijf dat het al een paar keer eerder heeft gedaan en ook
voor de BBC heeft gedaan.. Als het echt veel sneller had gekund hadden ze het daar ook
geweten.’
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
195
Qua organisatie. Ik denk niet dat er iemand van een ander programma naar jullie toekwam met:
‘Ik heb nog een leuk idee voor jullie’, of wel?
‘Nee, van andere redacties is er denk ik niet echt veel input. We hebben wel met Labyrint nog
wat samen nagedacht, maar ik kan me niet echt herinneren dat daar echt iets heel concreets uit
is gekomen. We hebben wel veel rondgelopen in die geosector. Daar hebben we ook heel vaak dit
project gepresenteerd, als: ‘Hier zijn we mee bezig, dit is ook een mogelijkheid voor jullie om te
laten zien dat wat jullie doen heel bijzonder is en wat voor geografische data je hebt’.’
Hoe heb je dat aangepakt?
‘We hebben hier een heleboel mensen uitgenodigd in de Tuinzaal [vergaderruimte in VPRO-
gebouw]. Van ministeries, bedrijven en topmensen. We moesten natuurlijk ook sponsorwerving
nog doen, daar hadden we ze ook voor uitgenodigd.’ ‘De financiering van de NPO die binnen
was, was niet voldoende om alles te kunnen realiseren, dus we hebben ook nog zelf extra geld bij
geworven. Dat mag, tot op zekere hoogte. Dus in die zin hebben we ook een X aantal keren op
beurzen van geo ons gepresenteerd en dan komen er wel bedrijven op af, van: ‘Je moet deze data
gebruiken’. Dat heeft niet altijd tot resultaat geleid, maar er komen ook bedrijven die zeggen:
‘We hebben luchtfoto’s van Nederland vanuit 1930 en dat plakken wij aan elkaar tot een hele
kaart van Nederland’. En dan zie je Nederland in de oorlog met kraters in de grond. Daar
hebben we nog niet eens wat mee kunnen doen, maar dat soort tips komen dan wel op je af. Dus
vanuit het veld, vanuit de sector zeg maar, komen er wel veel tips en gaan mensen meedenken.
En op een gegeven moment kwam na elke presentatie ook wel iemand op me af die zei: ‘Weet je
welke data je zou moeten visualiseren? Onze databak, die is mooi, die moet je eens bekijken!’
‘Jajaja, we zijn al vol en het is al heel druk.’ Maar de organisatie binnen de VPRO.. Nee, kan ik
me niet iets concreet herinneren.’
‘We hebben bij de NPO wel aangevoerd: ‘Het is innovatief’. Met name voor de website hebben
we ook nog uit een innovatiepot financiering geregeld. Die nu niet meer bestaat overigens, is ook
allemaal wegbezuinigd. En dan ga je ook de markt op om dat nog eventueel aan te vullen. We
konden natuurlijk gewoon een begroting maken: we willen zoveel dagen met een helikopter de
lucht in. Die heli kost geld..’
Was die niet knetterduur?
‘Nou, knetterduur. Mensen vinden.. Ja, het kost geld. Het was een heli met een piloot met een
camera onder de heli met een aparte cameraman die met een joystickje echt precies de goede
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
196
beelden schiet. Ja, dat zijn specialisten. Dus dat is superduur, dus dan heb je al een vette post.
En als je zegt: ‘We moeten toch echt wel twintig, dertig dagen vliegen’, dan tikt dat al aan.’
‘Ik heb nog wel een puntje dat ik ook wel ontdekt heb tijdens het maken hiervan, wat heel.. Twee
dingen eigenlijk, die ik wel belangrijk vind. Ten eerste, over de indeling van het team. Het valt
me op dat je met datajournalistiek drie kwaliteiten nodig hebt, die alledrie moeten
samenwerken. Je hebt een journalistiek iemand nodig om een verhaal in die data te kunnen
zien. Of dat nu een vernieuwend verhaal is of puur visualiserend, maar iemand moet naar dat
verhaal kijken. Je hebt een grafisch iemand nodig die echt naar de vormgeving kijkt: hoe ziet dit
eruit, hoe representeren we die data? En je hebt een technisch iemand nodig die de data kan
bewerken, die erin kan rekenen, die er iets mee kan doen. Dus die drie kwaliteiten heb je altijd
nodig. Dat is in een tv-redactie bijvoorbeeld niet altijd bij elkaar en in een digitaalafdeling ook
niet altijd bij elkaar. Soms moesten we die techniek ook echt bij een gespecialiseerd bedrijf halen
om bijvoorbeeld echt die treinen over die spoorrails te krijgen, om die vliegbewegingen goed te
krijgen. Dat grafische zat dan ten dele ook wel bij ons en ten dele ook bij Engeland, dus je haalt
het overal wel een beetje vandaan. Maar je hebt wel die drie disciplines nodig om
datajournalistiek, datavisualisatie te doen.’
‘Het andere punt waar we tegen aanliepen wanneer je hiermee aan de slag gaat, is.. Gemiddeld
zijn journalisten bezig om in Word een verslag voor een tv-redactie te typen en hebben een
telefoon nodig en een computer waar je Word kan doen. Ga je nu tekstbestanden opvragen die
pure, kale tekst 144 MB groot zijn en je moet daar 24 van op een computer zetten en je wilt daar
bewerkingen op doen, dan red je dat niet op een standaard kantoor-pc die hier in de omgeving
staan. Dus je hebt gewoon apparatuur nodig die er niet is. Dus de datajournalist heeft de helft
van de tijd maar thuis gewerkt of inderdaad bij die gespecialiseerde bedrijven gezeten om in
hemelsnaam maar überhaupt die datasets te kunnen openen. Je moet je bedenken: sommige
van die datasets zijn zo belachelijk ontiegelijk groot..’
Alleen aan tekst..
‘Pure tekst, 144 MB is een uur bootverkeer. Alle boten die in een uur in de haven van Rotterdam
varen.’
Je denkt: 144 MB, dat is niet zo groot. Maar in pure tekst, hoe krijg je dat vol..
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
197
‘Dat is giga. Ga je daar een bewerking op doen, dan ga je zoeken naar een bootje, dan staat die
computer al gerust tien tot twintig minuten te ratelen om die vraag te beantwoorden. En dan
blijkt dat je net de verkeerde vraag hebt gesteld. Dan ben je dus acht tot twaalf uur bezig.’
Werd je dan niet helemaal gek af en toe?
‘Jaha. Dan merk je dus: we hebben techniek nodig, maar we hebben echt een
databaseprogrammeur nodig die die gegevens in een database kan zetten.’
Kon Frederik dat ook?
‘Nee, niet zo sterk. Hij is meer graficus van huis uit en hij snapt die geografische data heel goed.
Waren we met economische data aan de slag gegaan, dan heb je iemand anders nodig. Dus per
type data heb je ook weer een specialist nodig. Maar ook gewoon zoiets praktisch als apparatuur,
daar kom je pas achter op het moment dat je ermee aan de slag gaat. Dan weet je dus: oke, zo
moet ik ongeveer mijn organisatie in gaan richten wil ik serieus datajournalistiek gaan
bedrijven. Dus wil je hier echt verder mee.. Ik werk bij digitaal, daar maken we websites. We
hebben ook bij ICT-helpdesk afgesproken dat wij wel alle programma’s mogen installeren die
andere mensen niet mogen installeren. Simpelweg omdat we dat voor ons werk nodig hebben.’
‘Op zich, de machinerie die onze programmeurs hebben, daar zou je een heel eind mee moeten
komen. Want die programmeurs zijn ook al gewend om in databases rond te neuzen. Maar die
zijn al projecten aan het doen. Die zouden dat qua apparatuur en kennis moeten kunnen doen,
maar zo iemand heb je ook voor datajournalistiek nodig, maar wel iemand die rechtstreeks met
een journalist samenwerkt.’
En stel, iemand van een kleine nieuwsorganisatie komt naar je toe en zegt: ‘Wij willen ook iets
met datajournalistiek doen’. Wat zou je hem dan adviseren?
‘Het hangt er heel erg vanaf. Wil je eens, een keer iets maken? Dat is iets anders dan dat je
datajournalistiek structureel een plek wilt geven of een project wil doen van de omvang van
Nederland van Boven. Dus heel erg: wat heb je nodig? Doe je iets kleins eenmalig, dan zou ik
zeggen: ‘Huur het in bij een specialist’. Dan hoef je het niet in je organisatie te halen. Wil je het
in je organisatie voor langere tijd een plek geven, bedenk dan dat je dus niet alleen de goede
mensen nodig hebt die heel erg moeilijk te vinden zijn. Totdat ik Frederik vond die én journalist
was én graficus én geodata snapte, dat was een godswonder. Ik had hem ook voor iets heel
anders uitgenodigd en geheel toevallig tijdens het gesprek kwamen we erachter, dat ik zei: ‘Maar
ik wil jou op mijn redactie hebben als datajournalist’. Ik had net die dag de vacature
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
198
uitgeschreven en geheel los daarvan sprak ik hem, eigenlijk als potentieel iemand om de
visualisaties te maken, te visualiseren. En toen gaandeweg het gesprek ontdekte ik: maar jij bent
onze datajournalist. Die mensen vinden is supermoeilijk. Het is nog heel erg nieuw. Bedenk dat
er gewoon heel veel experimentkosten bij komen kijken. Wees je daarvan bewust. Je zit ergens
in een beginfase, dus je gaat fouten maken. En je gaat nog achteraf bedenken dat het zoveel
duizend keer efficiënter had gekund als je dat allemaal van tevoren had geweten. Dat is denk ik
voorlopig nog onontkoombaar met datajournalistiek. Dus weet je van die risico’s bewust. En dat
het dus niet alleen die expertise vinden is, maar ook heel pragmatisch apparatuur is. En dat de
kans op niet honderd procent slagen aanwezig is, dat je nog in een pioniersfase bezig bent. Dat
je erachter kan komen: ‘Jeetje, nu hebben we zo ons best gedaan om het simpel en begrijpelijk te
houden en dan zijn er nog mensen die het niet snappen’. En hoe dieper jijzelf in die data komt,
hoe moeilijker het wordt om daar nog afstand van te nemen. Dus gebruikerstest.. Als ik een ding
anders had gedaan bij die kaart – en dat is altijd een issue – is gebruikerstests. Sneller aan
mensen laten zien die er gebruik van..
Die webkaarten.
‘Ja. Ik denk dat die animaties maken, dat dit gewoon.. Niet om te willen pochen of arrogant te
doen – wij hebben het ook gewoon ingehuurd bij een Engels bedrijf – maar ik denk toch dat, om
het echt goed te doen, dat het niet veel clubs gegeven zal zijn in Nederland.. Omdat het wel een
heel gespecialiseerd.. Het is niet onmogelijk, maar.. En het kost veel.’ ‘Ze kunnen het wel, maar
op een ander niveau denk ik. En ongetwijfeld is dat volgend jaar anders en over twee jaar nog
weer heel anders.’
‘En afgezien van die afschrikverhalen is het primair: verhaal, verhaal, verhaal, verhaal. Wat wil
je vertellen? Moet je dat met data doen of kun je dat ook in een andere vorm doen? Waarom
gebruik je data? Wij hadden heel erg: als we het met de camera niet kunnen filmen, dan doen we
dat met een datavisualisatie. Het begint bij het verhaal. Het grootste spanningsveld waar we ook
tegen aan hebben gelopen is: data is kneedbaar. Als jij zegt: ‘Ik wil in de data zien dat station
Amsterdam ’s avonds heel fel oplicht’, dan kun je die data altijd wel zo manipuleren dat dit eruit
is te halen. Dus je moet naar die data luisteren. Je moet openstaan voor wat die data jou te
vertellen heeft. Daarnaar durven kijken en dat verhaal durven vertellen. En tegelijkertijd móet je
wel een bepaalde bril opzetten, van: ik ga hiernaar op zoek, ik ga deze vragen stellen. En ik ga
kijken of dat in die data zit. Je kan niet alleen maar je volledig overgeven aan de dataset en
hopen dat daar iets uitkomt. Je zal een bepaalde bril op moeten zetten om daar in te duiken. Dus
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
199
het is een wisselwerking tussen jouw vooropgestelde vraag willen beantwoorden en voldoende
open blijven om je te laten verrassen door wat er in die data zit.’
Heb je ook wel eens gehad dat je een database in handen kreeg en gewoon ging schudden,
zonder dat je een bewuste vraag in gedachten had?
‘Nou, we hadden wel een paar datasets waarvan we dachten: die zijn zo bijzonder, daar moeten
we iets mee doen. Het kadaster gaf ons het BAG-bestand, met alle gegevens van alle gebouwen
in heel Nederland. Met bouwjaar er bij in en vorm en positie. ‘Dit is zo uniek, daar moeten we
iets mee doen.’ Maar we wisten nog niet wat. Dat is uiteindelijk de groeianimatie van Utrecht
geworden en een online kaart. Die [animatie] is heel erg versneden met helikopterbeelden,
omdat we eigenlijk uiteindelijk de animatie iets te droog vonden. Dus hebben we daar toch
helikopterbeelden doorheen gemonteerd. Wat heel mooi heeft uitgepakt, volgens mij. En
hetzelfde geldt voor ProRail, met die treingegevens. Frederik had een contact bij ProRail, die
wilde die gegevens leveren. Ja, dat is dan sterk argument om te denken: ‘Daar gaan we iets mee
doen’. Vodafone idem dito: zij wilden meewerken, zij wilden hun telefoongegevens leveren. Dan
verzinnen we wel iets wat we daarmee gaan doen, want dat zijn gewoon toffe gegevens om te
pakken te krijgen.’
Het is niet zo dat jullie dachten: ‘We willen het telefoonverkeer in kaart brengen, laten we
contact zoeken met Vodafone’?
‘Nee. We dachten: we willen laten zien hoe Nederland wakker wordt. Dat idee hadden we al wel.
En we hadden contact met Vodafone en toen hebben we die twee aan elkaar gepuzzeld van: ‘He,
dat kunnen we daarmee dan misschien aantonen’. Want later hebben we diezelfde
Vodafonegegevens ook ingezet in de Koninginnedaganimatie, om aan te tonen of grote groepen
mensen de routes van de gemeenten volgden. Dat blijft ook met data: je kan meerdere verhalen
met dezelfde dataset vertellen.’
‘Maar echt helemaal willekeurig in een dataset grasduinen. Het waren er wel veel, ik moet ook
wel even graven: ‘Wat hadden we ook alweer?’’
Dimitri vertelde bijvoorbeeld dat hij bij het CBS de dataset zocht met de sufste titel, waarachter
iets verscholen zou kunnen zitten, om die vervolgens eens beter te bekijken.
‘Dat hebben wij denk ik niet gedaan. Wij hadden natuurlijk al zoveel bronnen om uit te putten.
En we moesten wel bij die tv-aflevering blijven. Wat wel is.. Op een gegeven moment krijg je een
bestand met alle gegevens van alle boeren in handen. Van Alterra. Ik weet even niet meer hoe
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
200
dat bestand heet, maar iets met agrarische informatie bladiebla. En dan zie je dus daar ook in
staat of boeren kerstbomen verkopen of niet en hoeveel kippen ze op hun land hebben. Dan
blijkt dat die boeren dat dus ieder jaar, wettelijk verplicht, helemaal moeten invullen. En daar
hebben we bijvoorbeeld die kaart uitgehaald van welke boeren doen meer dan boeren alleen.
Daar zou je potentieel zoveel meer uit kunnen halen.’
Je zei eerder ook dat daar iets in stond over opvolgers?
‘Ja, of ze een opvolger hebben of niet. Ga potentieel nadenken: welke boerenbedrijven hebben
geen opvolger, wat is hun land en waar staan bouwprojecten gepland voor de komende tijd? Ik
denk dat je daar hele leuke conclusies uit kunt trekken. Als je dan bij projectmanagers hun
projectplannen gaat halen en of dat toevallig op het land is van boerenbedrijven waar geen
opvolger is. Die konden nog wel eens verkocht gaan worden. Zulke connecties moeten te maken
zijn. Wij hebben natuurlijk de mazzel gehad dat we heel veel bestanden in handen kregen omdat
mensen sympathie hadden voor ons project. En dan ben je natuurlijk wel zo’n journalist dat je
ook naar die bestanden kijkt van: mmm, we kunnen hier natuurlijk ook hele andere dingen mee
doen.’
‘Maar het gaat in goed vertrouwen. Off the record informatie moet je ook gewoon wel secuur
mee omgaan, het is ook jouw reputatie. Je kunt er wel mee doen wat je wil, maar dan krijg je
daarna nooit weer wat van ze.’ ‘Dan heb je als media wel een ander belang dan de bronhouder en
daarover moet je elkaar recht in de ogen kunnen kijken. Ik zou niet snel meer iets naar
[bepaalde nieuwsorganisatie] sturen. Als ik zie wat die ervan maken..’
Bij een grote organisatie wil een eindredacteur ook wel precies weten wat ze na twee weken
onderzoek kan verwachten, hoorde ik. Hoe zit dat bij jullie?
‘Dat is bij ons ook.. Wij hadden wel zoiets: er moeten elke aflevering wel twee animaties zijn die
de moeite waard zijn om te kijken. Dus je kan wel degelijk een bepaalde productieëis stellen. En
dan ga je gewoon met een bepaalde bril op met die data aan de slag. Van een heleboel hebben we
ook gezien: ja, daar konden we niets mee, want we hadden wel een deadline te halen.’
Je zei in een interview dat je in de toekomst nog wel meer bezig wilde met ‘serieuze
datajournalistiek’. Zelf data opbouwen. Zijn er dingen die je in het tweede seizoen ook echt
anders gaat doen dan in het eerste seizoen? Ik neem nu trouwens aan dat jij ermee bezig gaat. Is
dat zo?
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
201
‘Nee, ik ben er wel deels bij betrokken hoor. En ik hou wel in de gaten en ik ben wel aan het
meedenken hoe we een vernieuwingsslag kunnen maken. Nederland van Boven moet natuurlijk
vooral gewoon visueel uitdagend blijven. Dus daar zitten we wel te kijken: goh, kunnen we
datasets van Utrecht van 1800, daar zijn hele 3D-modellen van, zou je daar virtueel overheen
kunnen vliegen met een virtuele helikopter? Zoiets zou een nieuwe vorm van datavisualisatie
kunnen doen?
In Groningen hebben ze dat gedaan, trouwens.
‘Ja. En ik denk dat wij dat mooier kunnen. En dat we dat, als dat met een echte heli doen en met
een virtuele.. Daar moet de VPRO het ook van hebben. Wij zijn heel goed in iets heel mooi in
beeld brengen. Dus daar probeer ik toch wel over mee te denken. En wat ik nu in dat Why
Poverty project heel scherp heb, na aanleiding van die websitelessen.. We moeten nog meer zelf
al in die data wroeten. Nu met twee redacteuren die niets anders gaan doen dan op zoek naar de
meest interessante conclusie uit die dataset halen. Dus dat is wel.. Misschien bedoelde ik dat wel
met meer serieuze datajournalistiek. Het lijkt me wel heel spannend om uit zo’n dataset van
boeren en boerenvolgers te kijken en daar een conclusie uit te halen die je niet zou verwachten,
wat tot iets leidt. Maar ik weet niet of ik dat zélf heel erg ga doen.’
Waarom ga je er niet mee bezig dan?
‘Nou, ik ga er wel mee bezig in die zin dat ik nu bezig ben met die Why Poverty-datavisualisatie,
maar het werkelijke redactiewerk.. Ik ben meer coordinerend en hou het overzicht en probeer de
lijnen uit te zetten. Dus ik ben er wel in die zin mee bezig, maar ik werk dan weer met
redacteuren samen om het echte veldwerk te doen, zeg maar.’
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
202
Erik Bloem (Altijd Wat)
Allereerst: wat is jouw achtergrond?
Ik ben eigenlijk na mijn studie bij de Volkskrant terecht gekomen als onderzoeker op het Top
200-project. Daarin probeerden we aan de hand van een database met functiegegevens een lijst
samen te stellen van invloedrijke Nederlanders. Ik vulde de database en er was in beginsel een
hoogleraar, later een onderzoeksinstituut in Wenen dat een netwerkanalyse uitvoerde. Zo ben ik
bij de Volkskrant terecht gekomen. Uiteindelijk ben ik zelf ook wat datajournalistiek onderzoek
gaan doen. Maar ook gewoon in zijn algemeenheid onderzoek. En omdat ik weet hoe een
database werkt, heb ik toen gesolliciteerd bij Altijd Wat. Omdat veel journalisten, zoals je zult
weten, niet weten hoe databases werken, omdat ze als alfa’s zijn opgeleid en die bedrevenheid
met de computer sowieso wat minder hebben. Dus vandaar dat ik hier zit. Maar ik doe absoluut
niet alleen datadingen. Laatst hebben we iets gedaan met moties en amendementen. Dat is ook
wel meer gedaan, maar wij hadden andere gegevens. Wij hadden gegevens van de universiteit
Leiden. Die hadden iedereen die bij die moties genoemd worden in kaart gebracht, terwijl de
meeste sets alleen maar de eerste indiener noemen. Daar hebben we een graphic mee op
internet gemaakt.
Was dat die met de SP?
Ja. En we hebben de Altijd Wat Wijzer, ken je die? Dat is mooi vehicel om data een beetje
aantrekkelijk te presenteren.
Hoe werkt dat precies samen met het programma?
Het is aanvankelijk bedoeld om gewoon op zichzelf te staan. Je hebt vijf elementen in onze
uitzending. Je hebt de Altijd Wat Wijzer, een gesprek, feit of fictie, een reportage en een column.
Het is een van die onderdelen. Maar wij hebben twee maanden geleden een zorgverhaal gemaakt
waar ik ook bij betrokken was en we wilden eigenlijk een beetje in kaart brengen hoe mensen
nou aankijken tegen de kostenstijgingen in de zorg, wat de redenen daarvoor zijn. En daarvoor
wilden we ook laten zien waar die kosten vandaan komen, hoe die kosten gestegen zijn, wat een
gemiddeld gezin tegenwoordig uitgeeft aan zorg. Omdat dat allemaal droge materie is – aan de
ene kant allemaal sprekers, dat is niet hele aantrekkelijke televisie, en aan de andere kant die
gegevens – hebben we die Altijd Wat Wijzer gebruikt. Door hem op te knippen in vijf stukjes van
30 seconden, die loopt door de reportage heen. Dat hebben we bij de SP eigenlijk ook zo gedaan.
Dat blijkt te werken. Op die manier kunnen we data aantrekkelijk maken.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
203
Voor de site gebruik je dan dezelfde graphics?
Nee. Met een jongen van internet design heb ik een poster ontworpen. Op een bepaalde manier
ouderwets, maar het werkt wel. Het ziet er aantrekkelijk uit. Je kunt het makkelijk delen op
Facebook, Twitter.
En die jongen, is dat dan een jongen van jullie redactie?
Nee. Hij is echt van internet en hij doet dus ook dingen voor radio en andere
televisieprogramma’s. En ik heb gewoon een verzoek ingediend bij Internet, of er iets mogelijk
was. En ze vonden het een leuk idee. Ze zijn toen iemand gaan vrijmaken en die heeft daar een
aantal dagen voor gekregen om daarmee bezig te gaan.
Hij maakt dus geen deel uit van jullie redactie. Maar jullie zouden hem niet altijd nodig hebben
en hij zou niet altijd tijd hebben?
Nee, maar mijn functie is een nieuwe functie. Dus alles wat er gebeurt is ook een beetje nieuwig
en de ervaring leert nu dat zij [de afdeling Internet] dat ook leuk vinden en dat ze daar ook
positieve reacties op krijgen, dus ligt het in de lijn der verwachting dat dit vaker kan gaan
gebeuren.
Het is nu gewoon nog een beetje..
Pionieren.
En als je het zou opdelen in percentages, hoeveel procent van je tijd ben je dan echt bezig met
datajournalistiek, denk je?
De eerste maanden was ik wel fulltime bezig met data-analyses. Dan is het ook nog een beetje
zoeken, want ik wil wel even een zijstapje maken.
Wat ik wel vind bij datajournalistiek is dat het heel vaak dingen oplevert waarvan je denkt:
‘Ohja, dat wist ik eigenlijk al wel een beetje – en nu is het in kaart gebracht’. Maar goed, dat is
niet echt het onderzoek dat ik wil bedrijven. Dat is bijna een wetenschappelijke discipline. Wat
ik ook zie als ik de datablogs een beetje volg is dat.. Er komen niet hele schokkende dingen uit.
Dus we zijn ben de zorgkosten toen bezig geweest. Ik heb allerlei ziekenhuiskosten opgevraagd.
Die hebben allemaal voor elke zorgbehandeling een prijs. Er zijn per ziekenhuis 4300
zorgbehandelingen. Maar ja. Bij al die organisaties heb ik PDF’jes opgevraagd, PDF omgezet
naar Excel. Excel in een MySQL-database gestopt en op gegeven moment kun je dan van een
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
204
aantal behandelingen die veel uitgevoerd worden een overzicht maken waar die het duurst en
het goedkoopste zijn. Daar hebben we ook een soort poster van op internet gemaakt. Dus toen
ben ik heel veel met data bezig geweest, maar dat leverde naar mijn zin niet iets op waar we echt
mee de buhne op konden, waar je echt iets mee ontdekt.
Want je wilt wel graag hard nieuws?
Ja, eigenlijk wil ik dat mensen ‘Schande’ zeggen. Nu hoeft dat niet altijd, maar je wilt wel tegels
lichten. En dat is lastig met datajournalistiek.
En stel dat jij een ingewikkeld onderwerp mooi en helder in kaart brengt: zou dat niet geschikt
zijn voor Altijd Wat?
Dat kan. Mensen kunnen ook naar mij toe komen om te vragen: ‘Kun jij dit een beetje helder in
kaart brengen?’ Dan kunnen we dat gewoon doen.
Maar niet dat je dat als uitgangspunt of doel neemt. Je wilt echt op zoek naar nieuws.
We zijn nu bezig met een onderzoek, daar kan ik niet teveel over zeggen, maar dat gaat over
duurzaamheid. En waarom dat in Nederland niet zo goed lukt. En dat is een beetje in kaart
brengen hoe de lijnen lopen. Maar ook een beetje onderzoeksjournalistiek.
Achtergrondgesprekken voeren. En door een paar tegels te lichten toch laten zien: ‘Zo werkt
het’. Maar het is in grote mate toch een overzichtsverhaal.
Bij NRC zeiden ze: ‘Wij willen echt met nieuws komen’. Jullie willen dat wel, maar..
Maar NRC is echt een krant. Ik heb ook wel met Arlen Poort.. Ik heb stage gelopen bij NRC
Handelsblad en toen zat ik ook bij Arlen Poort. Die was toen heel druk met die
verkiezingskaarten. Want hij heeft dat prachtig.. Met die stembureaus, dat je per stembureau de
uitslag kan checken. Zij willen echt nieuws maken, ja. Daar worden ze ook om gekocht
natuurlijk.
Wat dat betreft hebben jullie iets meer ruimte.
Ja, wij zijn een opinieprogramma. We vinden het leuk om nieuws te maken, maar we kunnen
niet elke week nieuws maken en dat is niet ons streven. Maar we willen wel spraakmakende
verhalen maken.
We hebben het al een beetje gehad, maar: de doelstelling. Wat is, in een paar zinnen, jouw taak?
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
205
Mijn taak is om grotere verhalen voor te bereiden, eigenlijk. Grotere, ingewikkelde, verhalen
voor te bereiden.
En dat voorbereiden houdt dan in, dat je ook al mensen zoekt?
Ja, ook gesprekken met mensen voeren. Mensen zoeken, gegevens erbij zoeken.
En de data, wanneer komt dat aan bod?
Het kan natuurlijk op allerlei manieren gebeuren. Er kan een verslaggever of redacteur naar mij
toe komen, van: ‘Kunnen we hier iets mee? En weet jij of hier ook data over te vinden zijn?’.
Gebeurt dat vaak trouwens, dat mensen naar jou toe komen?
Ja.
Verder kan het zijn dat je op iets stuit, doordat je een verhaal hoort van een vriend van je of dat
je op internet nieuws aan het bekijken bent en denkt: ‘He, hoe zou dat eigenlijk zitten?’ Dat kan.
Verder hebben we hier ook.. Het heette de ideeenfabriek, maar het zijn twee mensen die een
beetje innovatieve ideeen proberen op televisie te krijgen. En daar brainstormen we dan mee
over bepaalde domeinen waarbinnen wij onderwerpen willen maken. En zo zijn we ook op die
duurzaamheid gekomen. Dus zo kan dat gebeuren.
Hebben jullie beats die jullie in de gaten houden? Bijvoorbeeld hoe het met de gezondheidszorg
zit?
Dat is een van de thema’s waarop wij hebben ingezet deze zomer, de gezondheidszorg. Daar
hadden we al wat mee gedaan en daar zijn we nu mee verder gegaan. Dat is wel een van de
domeinen waarin wij geinteresseerd zijn. Wij zijn een opinieprogramma en dat lijkt misschien in
werkwijze op Zembla of Tegenlicht: je hebt geen verplichting op net als een krant het hele
spectrum van het nieuws te.. Dus je kunt een jaar lang de ziekenhuiszorg theoretisch gezien
helemaal links laten liggen en helemaal vergeten hoe het ook alweer zat en dat is een voordeel en
een nadeel. Want als je je er dan in verdiept, dan besef je je dat je het al die tijd niet hebt
bijgehouden, dus dat je heel veel mist en niet weet. En dat je daarin weer overnieuw moet
beginnen. In die is een datajournalist – zo zie ik mijzelf dus niet echt, als datajournalist – dus
generalist. Die moet dus elke keer weer zich verdiepen in het onderwerp waar hij mee bezig is
om te begrijpen welke data relevant zijn, wat die kunnen betekenen enzovoorts.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
206
Vind je dat leuk of juist een belemmering?
Dat voelt wel op een bepaalde manier als een belemmering. Het maakt het werk wel leuk. Het
maakt het werk heel afwisselend. Maar ik was hiervoor dus economiejournalist bij de
Volkskrant. En dan heb je gewoon je portefeuille en dan hou je bij wat er in portefeuille gebeurt.
En dan kan je op het moment dat er iets is waarmee je de diepte in kan gaan.. Dan weet je daar
heel erg veel van. Dus dat is anders. Ze zijn na mijn tijd een beetje bezig gegaan met de
financiele huishouding van die woningcoorporaties, bijvoorbeeld. Ik zat daar toen ook een beetje
in. Omdat je daar inhoudelijk heel erg mee bezig bent kun je er ook meer mee. En kun je er ook
makkelijker nieuws mee maken.
Krijg je hier nu wel de ruimte om ergens flink in te duiken?
“Ik krijg daar de tijd voor, ja. Ik ben eigenlijk aangenomen voor vier afleveringen per jaar.” “Als
redacteur schuif ik dan aan.”
Maar dan schuift er tussendoor ook vast van alles tussen?
“Het is ook mijn eigen onrust. Omdat ik dus, zoals gezegd, van de Volkskrant kwam en daar
werd elke dag natuurlijk een stukje verwacht. Nu zit je soms een week te broeden op iets en op
een gegeven moment wil je dat kwijt. Wil je dat het iets is en dat je weer met iets anders verder
kan.”
Welke invloed heeft dat verder, dat je van een krant komt? Merk je dat je een andere
werkinstelling hebt?
“Hier is het toch meer een overheidsinstelling.”
Hoe bedoel je dat precies?
“Het is toch wat rustiger. Vooral de redacteuren zijn wat rustiger. Er zit wat minder druk achter.
En de krant was echt hectiek. Elke dag de deadline.”
Heeft dat ook invloed op de uiteindelijke dingen die jullie maken? Dat die ook rustiger zijn?
“Dat is wat wij willen. Uiteindelijk willen wij afstand nemen van dat hijgerige en laten zien hoe
het nou eigenlijk echt zit. En dat is wel leuk. Daarom is het leuk dat ik die ervaring bij de krant
heb. Dat je dat dus van twee kanten kan belichten. Dat je wel weet hoe je nieuws moet maken,
maar daar 1) langer de tijd voor hebt en 2) dus ook gedegener kunt doen.”
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
207
Die doelstelling, van twee kanten dingen belichten, afstand nemen, is dat ook omdat jullie
denken dat de doelgroep dat wil? Of: ‘voor ons is dat nodig’?
“Zo is het programma opgezet. Altijd Wat is opgezet als een opinieprogramma dat eigenlijk een
ander licht wil laten schijnen die spelen in onze samenleving. Het zijlicht laten zien.”
Nu heb ik zelf bij Tegenlicht stage gelopen en daar schreef de voormalig eindredacteur eens: ‘Je
moet kijkers ook geven wat ze juist niet willen zien’. Gewoon zelf maken wat je belangrijk vindt.
“Wij kunnen dat hier ook wel maken, maar een eindredacteur wordt volgens mij ook afgerekend
op marktaandeel.”
Maar jullie kunnen in principe wel..
“..in principe kunnen wij alles maken.”
Het programma bestaat nu twee jaar, denk ik?
“Ja, ik ben er dus sinds 1 april bij.”
Is de doelstelling voor zover jij weet sinds het begin of sinds jij er bent nog veranderd?
“Je merkt wel dat er af en toe discussie is over wat je wilt uitdragen – dat gaat vooral over welke
items je wel en niet wilt. Er zijn nu vijf categorieen en er gaan stemmen op die zeggen: ‘Dat is
teveel, kaleidoscopisch eigenlijk’. Ja, ik kan het zelf niet zo goed duiden, want ik was ook niet
bekend met het programma, voor ik hier zat. Ik had gek genoeg ook helemaal geen televisie,
toen ik hier kwam werken.” “Wel een toestel, maar geen kabelaansluiting. Was meer een
uitvloeisel van een conflict wat ik had met de kabelmaatschappij en toen dacht ik: ‘Ik vind het
eigenlijk wel lekker zonder’.”
Is gezondheidszorg iets wat jullie nu wel regelmatig in de gaten houden?
“Ja. Ik misschien niet, maar mijn collega wel.”
Er is niet één onderwerp dat je in de gaten houdt, als je specialisme?
“Er zijn wel een aantal onderwerpen waar ik hierna mee aan de slag wil en daarvan hou ik wel in
de gaten wat er gebeurt.”
Zijn er bepaalde websites de je in de gaten houdt?
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
208
“Ik moet eerlijk zeggen dat ik dat heel weinig doe. Ik kijk wel regelmatig op het datablog van The
Guardian, maar eigenlijk verder niet zoveel. Dat zou ik wat meer kunnen doen.”
Maar bijvoorbeeld de site van het CBS?
“Nee. Ik zit wel regelmatig in Statline en Eurostat te neuzen, maar dat is pas op het moment dat
ik denk dat daar iets is wat ik nodig heb.”
Dat is wel echt anders dan bij andere media. Jerry vertelde bijvoorbeeld dat zijn weekplanning
wordt beinvoed door het CBS.
“Wat hij waarschijnlijk doet.. Ik ken hem verder niet hoor, maar ik heb wel wat dingen gezien
die hij heeft gedaan. Bijvoorbeeld voor Nu had hij een graphic gemaakt waar alle spelers op het
Europees Kampioenschap, uit welke competities die komen. En dat heeft in principe natuurlijk
niets met nieuws te maken, dat is gewoon een dingetje en dan denk je: ‘Oh ja, ze spelen allemaal
in Engeland en Italie’. En ik neem aan dat hij dat ook doet met die CBS-cijfers. Dat is meer een
technisch ding. Hij maakt daar iets moois en inzichtelijks van. En in die zin is het heel anders.
Daar kun je op televisie natuurlijk ook niet zoveel mee. Op televisie is het nog niet een halve
minuut zendtijd als je laat zien waar alle spelers vandaan komen.”
Jij bent echt op zoek naar een verhaal, een ontwikkeling?
“Ja, dat moet wel. Maar goed, dat zul je zelf ook.. Maar dat is niet het onderwerp van dit
gesprek.”
Je zei net dat je dingen inzichtelijk wil maken voor mensen of dat ze ‘Schande’ zeggen. Wat zijn
andere aspecten die een onderwerp interessant maken voor jou? Specifiek als je wel met
datajournalistiek bezig bent.
“Het moet het dagelijks leven van mensen raken. Dat is wel een criterium. De zorg staat heel
dicht bij mensen omdat veel mensen daarmee te maken hebben. Dat is één. En twee: je moet
toch tegels lichten, een inzicht bieden wat er anders niet was geweest. En inzicht moet het
‘Ohja’-niveau wel ontstijgen.”
Gebeurt het wel eens dat je een onderwerp hebt, dat het wel een beetje schokkend is, maar dat
het afvalt omdat het nét niet is?
“Nou, bijvoorbeeld dat SP-verhaal.. Ik bedoel, dat hadden we net zo goed niet kunnen maken,
want het is wel een beetje een ‘Ohja’-verhaal. Want we weten dat de SP vrij radicaal is in haar
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
209
standpunten, ideologisch. Dus verwondert het niet dat ze weinig medestanders vinden in de
Kamer. Dus dat had je net zo goed niet.. Als je het criterium wat strikter had genomen.. Maar
omdat de verslaggevers er een verhaal in zagen.. Ik had de data en zij zagen het SP-verhaal; dan
maken zij het SP-verhaal en lever ik de data. Dan maak ik dat inzichtelijk.”
Gebeurt het vaak dat je ergens mee bezig bent en het is niet wat?
“Dat gebeurt wel eens. Ik sluit helemaal niet uit dat je ergens mee bezig gaat en zegt: dit is
niets.”
Je mailde al: ik weet niet veel van workflows. Maar laten we toch even kijken of we iets kunnen
ontdekken. Hoe ziet jouw week er bijvoorbeeld uit?
“Nu zijn wij bezig met een uitzending voor begin december. En daar komt ook een flink deel
internet straks bij kijken, dat waarschijnlijk al wel voor vijf december klaar moet zijn. Nu ben ik
heel erg met het verhaal bezig, om te zorgen dat alle elementen die wij in het verhaal willen, dat
die duidelijk worden. Welke tegels zijn er te lichten? Wat voor invloeden zijn er bloot te leggen?
Dus ik ben gewoon aan het zoeken. Ik ben dagen aan het zoeken, ik ben me aan het verdiepen, ik
ben achtergrondgesprekken aan het inplannen en aan het voeren.”
Hoe lang ben je dan ongeveer bezig per uitzending, denk je?
“Dat is lastig te zeggen. Kan soms ook wel een beetje inefficiënt gaan. Bij de verkiezingen was
eerst wel, dan weer niet, dan weer wel. Een heleboel informatie is ook niet gebruikt. Ik had
bijvoorbeeld ook alle aanwezigheid in kaart gebracht. Daarvan hebben we alleen gezegd dat
Henk van Gerven, een van de SP’ers, dat die in de top-3 aanwezigen stond. Maar ik had een hele
database met alle aanwezigen. Dus je gaat ook heel veel.. Ik vind het moeilijk om te zeggen,
maar de afgelopen.. De eerste twee maanden ben ik met de zorg bezig geweest, de maand daarop
ben ik met deze verkiezingen bezig geweest, toen ben ik begonnen met duurzaamheid en toen
ben ik daarna weer twee weken met verkiezingen bezig geweest.”
Maar je duikt dus sowieso wel twee weken in een onderwerp?
“Ja.”
En hoe begin je dan?
“Je zou kunnen beginnen met het opvragen van de database. Gewoon het downloaden van een
database, natuurlijk. En daar ga je dan eens in zoeken, gewoon kijken. Bijvoorbeeld, nu ben ik
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
210
bezig met.. Nederland gebruikt erg veel energie per hoofd van de bevolking. Dan ga je naar de
Wereldbank toe en die hebben en een database van het energieverbruik per hoofd van de
bevolking van ontzettend veel landen. En dan ga je kijken hoe dat voor Nederland zit, je gaat
vergelijken met andere landen. Dan ga je kijken of je met die dataset iets moet of dat je aan dat
gegeven an sich genoeg hebt om in dit geval een rol te spelen in je verhaal. En voor nu denk ik:
‘Ik hoef daar verder niet mee aan de slag’. Volgens mij is het genoeg dat ik gewoon kan zeggen
dat Nederlanders enorm veel energie verbruiken. Veel meer dan het gemiddelde van Europa, ten
opzichte van Duitsland, enzovoort.”
En dat is gewoon een Excel-bestandje?
“Dit is een soort applicatie op de website, geen Excel-bestand.”
Die hoef je niet te gaan scrapen ofzo?
“Nee.”
Je checkt gewoon de cijfers?
“Ja, daarmee kan ik in dit voorbeeld aan de slag om een soort opzet te maken.”
En dan?
“Dan ga je nadenken: ‘Wat heb je nog meer nodig voor het verhaal?’ En dan vanuit de
gesprekken die ik heb gevoerd met mensen die of wel in de uitzending komen of niet in de
uitzending komen, probeer ik met de informatie die zij mij geven ook weer te kijken of ik
daarmee iets kan. Want zij wijzen soms op documenten, zij wijzen soms gegevensverzamelingen,
zij wijzen soms naar andere personen.”
En dan vervolgens al die informatie in een overzichtelijk verhaal stoppen?
“Ja, ik probeer nu gewoon een opzet te maken van een paar kantjes. Zodat je een beetje het
verhaal kun zien. En kijken wat je mist.”
En wanneer komt er dan een camera bij kijken?
“Als wij vinden dat iemand een goed verhaal heeft en die iemand wil dat verhaal ook wel op
televisie vertellen dan komt de camera erbij kijken.”
Dat is dus pas helemaal aan het eind van het traject?
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
211
“Ja. Zo ben ik ingesprongen in een verhaal over technologie, maar dat is eigenlijk meer ontstaan
omdat ik een aantal bronnen had die wel op televisie wilden vertellen en dan ga ik ook mee met
de verslaggever en mocht die dingen vergeten te vragen of niet weten dan kan ik inspringen.”
Ga je altijd mee met de gesprekken?
“Nee, niet altijd.”
Maar dan brief je iemand al van tevoren?
“Ja, inderdaad. Bij de verkiezingen zorg je gewoon dat de verslaggevers overzicht hebben.
Inzicht hebben in de data, de toplijstjes, dat soort dingen.”
En is het dan helemaal uit jouw handen of komen ze dan nog terug?
“Zij komen in de regel wel terug om te vragen: ‘Vind je dit goed, vind je dat goed?’ Maar de ene
verslaggever trekt natuurlijk meer zijn eigen plan dan een andere verlaggever.”
En ga jij altijd naar de internetjongen toe, als dat nodig is? Of geeft de verslaggever aan wat voor
graphic hij wil?
“Wij hebben een samensteller en die is daar nog wel eens bij betrokken. Bij het SP-verhaal was
ik gewoon diegene. En bij het verhaal van de zorg hebben we een boodschappenmandje
gemaakt. Wat kos een heupoperatie, het plaatsen van een pacemaker en een staaroperatie? Dat
zijn drie operaties waar ontzettend veel omzet in zit in Nederland. Wat kost die in welk
ziekenhuis? Dat heeft hij ook een beetje aangezwengeld. Hij vond dat interessante informatie en
zei: ‘Laten we daarmee uitpakken’. In die zin ging dat toen anders.” “En de samensteller is de
rechterhand van de eindredacteur.”
Doen jullie ook aan updates?
“Op de website? Nee, dat doen we niet. Maar dat zijn wel dingen waar we nu over aan het
nadenken zijn. Ik neem aan dat je de website bezocht hebt; dat is niet wereldschokkend, niet een
plek waar je de hele dag gaat rondneuzen.”
Je moet natuurlijk ook kijken of een grafiek niet te saai is of een infographic juist te ingewikkeld.
“Dat heb ik vaak met die Google Fusion Tables, tenminste bij de kaartjes. Daar heb ik weleens
mee lopen knoeien en dat is hartstikke leuk, vooral voor de vakidioot, maar ga maar eens zelf
van heel Nederland bijvoorbeeld de cijfers over werkloosheid relateren aan de
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
212
verkiezingsuitslag. Dat leek me op zich wel leuk, hoeveel uitkeringsgerechtigden er in een
bepaalde gemeente zijn en wat ze dan gestemd hebben. Maar dan krijg je dus 450 van die
dingetjes en dan ga je alleen maar op zoek naar je eigen gemeente, natuurlijk.”
Maar jullie graphics bij de Altijd Wat Wijzer zien er wel overzichtelijk uit.
“Maar in principe heeft dit niets te maken met datajournalistiek zoals ik het beschreven zie.
Want wat wij doen, en ik doe dat meestal niet overigens, er is een redacteur die verantwoordelijk
is voor de Altijd Wat Wijzer en die schrijft een verhaaltje op basis van dingen die hij heeft
uitgezocht. Daar schrijft hij eigenlijk een artikel van. En dat artikel dat is de voice over. En die
gaat naar dat bureautje dat dat voor ons maakt en die maken er iets van, die tekenen dat erbij.”
Dus eigenlijk is het een krantenartikeltje met graphics?
“Ja, het is eigenlijk een soort gesproken column met heel veel feitenmateriaal. In die zin.. Het is
geen motion graphic, dat is het allemaal niet. Maar ik vind het wel een hele goede manier om
vaak toch redelijk complexe materie aantrekkelijk op de buis te brengen.”
Het ziet er voor een kijker uit als datajournalistiek, maar de totstandkoming is niet echt
datajournalistiek.
“Je moet natuurlijk wel beseffen: datajournalistiek is nu een hype en of het echt iets wordt, dat
moeten we zien. Want dat moet natuurlijk op een gegeven moment wel echt iets gaan toevoegen.
Dat blijft de vraag. Het is goed dat journalisten steeds beter zelf eigenlijk kunnen grasduinen in
data, want dat is voor hun eigen informatiegaring van belang. Dat je ook weet hoe je in Excel
met behulp van een draaitafel bijvoorbeeld eenvoudig allerlei aantallen inzichtelijk kunt maken
voor jezelf. Dat lijkt mij het meest belangrijk. Nu lijkt het erop dat veel mensen het interessant
vinden om ook echt iets met de oorspronkelijke data op internet te doen. Of dat zo blijft is wel de
vraag.”
Simon Rogers, van The Guardian, zei: ‘Datajournalistiek zal wel blijven, maar op een gegeven
moment is het gewoon journalistiek’. Denk jij dat ook?
“Ik denk dat sowieso. Nou is het nog niet zo.. Ik weet niet hoe oud jij bent?”
Vijfentwintig.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
213
“Ook van jouw generatie kan nog niet iedereen met een database overweg. Wat mij verbaast,
maar dat is dus wel zo. Dus er zullen nog wel een paar generaties overheen gaan, voordat dat
heel gewoon is. Maar misschien gaat het ook wel een beetje op een andere manier.”
“Je moet wel feitelijk wíllen zijn. Want het is wel vrij feitelijk. Het is geen human interest
interview. Je moet niet op zoek gaan naar de gesproken waarheid, maar je moet echt op zoek
willen naar die feitelijkheden.”
Mis jij dat nog wel eens, die human interest kant?
“Nou ja, je gaat namelijk onbewust in je leven ook heel feitelijk denken. Je gaat mensen die je
spreekt ga je beoordelen op of wat ze zeggen wel juist is. Of je dat nu echt helemaal moet
doortrekken moet je je ook afvragen. Ik heb er weinig zin in om zo’n kommaneuker te worden.”
En als voor een reportage nog een persoonlijk verhaal gewenst is?
“Dan zal ik dat waarschijnlijk wel naar me toe trekken, omdat ik dat ook leuk vind. Ik probeer
mijn portefeuille wel een beetje zo uit te breiden dat ik ook dat soort dingen kan doen.”
Even checken: ik neem aan dat de webpagina’s en de uitzendingen aan elkaar gekoppeld zijn?
Dat de website synchroon loopt met de uitzendingen?
“Nu nog wel. Dat gaat misschien anders worden.”
Dat je op de website iets ziet waar het in de uitzending niet over gaat?
“Dáár hebben wij geen mensen voor. Dan moet je daar eigenlijk een hele redactie voor hebben.
Maar het zal wel altijd gelieeerd zijn aan een uitzending, omdat we nog steeds een
televisieprogramma zijn. Maar er wordt natuurlijk overal nagedacht over het breder trekken van
dat televisie. Dat mensen die televisie maken meer over internet moeten nadenken en dat hele
tweede scherm-gedoe.”
Dat is natuurlijk wel ideaal: dat je een uitzending bekijkt en op je iPad de visualisaties kan
bekijken.
“Dat zijn wel dingen waar we over nadenken.” “Feit is dat natuurlijk wel steeds meer mensen
zo’n iPad hebben.”
Je vertelde net over je werkwijze, dat je nadenkt wat voor een verhaal nodig is -
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
214
“Het is dus niet zo dat ik een concept heb. Dat ik een werkwijze heb en dat ik weet aan het begin
van een onderwerp: eerst ga ik dit doen en dan dat. Dat zou misschien wel meer kunnen, maar
op dit moment doe ik dat niet.”
Wat betreft jouw werkervaring: je hebt stage gelopen bij het NRC..
“Ja. Ik ben bij de Volkskrant terecht gekomen na mijn studie – Frans met Europese Studies.
Toen ben ik min of meer bij toeval terecht gekomen bij de Volkskrant, op een onderzoeksfunctie.
Dat waren eigenlijk studentenbaantjes. En toen ben ik tussendoor weggeweest naar Rome,
daarna nog een beetje gezworven langs allerlei, Stadstoezicht zelfs. Toen teruggekomen bij de
Volkskrant op hetzelfde onderzoek. Maar dat kun je ook wel op LinkedIn vinden. Bottomline is:
toen ben ik teruggekomen bij de Volkskrant op dat onderzoek en toen dacht ik: ‘Ik wil straks niet
weer bij dat soort rare baantjes terechtkomen als Stadstoezicht dus ga ik doen wat logisch is ten
opzichte van mijn CV en toen heb ik een journalistiekopleiding gevolgd in Rotterdam, de PDOJ.
En toen ben ik bij de NRC terechtgekomen op de binnenlandredactie. Toen weer terug bij de
Volkskrant op het onderzoek over invloedrijke Nederlanders. Toen ook nog over straffen, voor
Moord en Doodslag, in de afgelopen vijf jaar. Toen hebben we nieuws gemaakt met het feit dat..
Dat is in principe ook datajournalistiek, dat vind ik ook wel een punt. Datajournalistiek gaat nu
heel erg over bestaande datasets. En wat wij eigenlijk deden bij de Volkskrant is: wij maakten
zelf een dataset. Als je zelf een dataset maakt, dan heb je 1) een dataset die niemand anders heeft
en daar kun je dan ook op voortborduren. Want nu is er dus een dataset met alle uitspraken.
Dus ik heb een Excel-bestand gemaakt met links naar tekstbestanden waar de uitspraak in staat.
En heb ik in de verschillende velden gewoon ingevuld wat de eis was, van justitie en wat de
uiteindelijk straf was.”
En wat was hiervoor de uitgangsvraag?
“Wij wilden weten of er een ontwikkeling was in de strafmaat. De directe aanleiding was
natuurlijk de minimumstraffendiscussie. En wat blijkt dus: rechters luisteren al naar de roep
vanuit de samenleving om zwaarder te straffen.”
Ik las laatst in een onderzoek uit Amerika dat hoe langer een rechter zijn pauze achter de rug
heeft, hoe zwaarder hij straft.
“Dat is ook echt wel fascinerend.”
Dat is dus ook weer zelf data zoeken. Iets nieuws maken.
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
215
“En Dimitri had dan waarschijnlijk een of andere automatische scraper gemaakt die het allemaal
in een database stopte. Dat heb ik niet gedaan. Ik heb gewoon al die teksbestandjes geopend en
dan weet je gauw genoeg waar staat ongeveer de strafmaat. Dat is vrij analoog, beetje oude
techniek. Die scrapertechnologie die beheers ik niet.”
Wat heb je jezelf wel aangeleerd?
“Ik heb geprobeerd mij alle krochten van Excel eigen te maken. Dat gaat heel aardig.”
Maar niet programmeertalen enzo?
“Ik heb wel in MySQL een database gemaakt. Je moet er gewoon aan beginnen. Het is niet zo
heel ingewikkeld. Je moet wel dat feitelijke hebben. Bij een MySQL is het wel anders dan bij een
human interest-interview. Je moet wel precies opschrijven wat er moet staan, wil de code
werken.”
Dat je het leuk vindt om na een foutmelding het hele ding door te gaan op zoek naar de fout.
“Ja, dat moet je hebben.” “Maar goed, ik kwam hierop omdat ik zei dat ik Moord en Doodslag
had gedaan en toen heb ik gesolliciteerd op een functie als economiejournalist en toen ben ik
aangenomen. Toen heb ik vier, vijf, zes maanden als economiejournalist gewerkt. Dat is bij de
Volkskrant altijd in freelancecontracten. Jonge mensen kunnen daar niet zomaar in dienst
worden genomen omdat de eigenaar dat niet wil. Mondjesmaat werd er eens iemand
aangenomen. Op een gegeven moment dacht ik: ‘Ik wil ook gewoon in loondienst’ en toen heb ik
hier gesolliciteerd.”
En jullie hebben ook nog weleens samengewerkt met Sargasso, toch?
“Ja, dat hebben we geprobeerd.”
Met die aannemersprojecten, maar dat was niet zo’n succes?
“1. De crowdsourcing werkte niet. Nou weet ik ook niet zeker of ons publiek het publiek is dat je
moet bevragen over dit soort onderwerpen. Omdat wij een wat ouder kijkerspubliek hebben.
Dus dat zal een van de redenen zijn geweest. 2. We speelden nog wel met de gedacht om dat op
een andere manier in kaart te brengen, via lokale media ofzo. Maar dat is er tot op heden niet
van gekomen. En Dimitri is daarvoor langs geweest. Hij is ook wel eens langsgeweest om na te
denken over het zorgverhaal. Maar we hebben toen besloten dat we dat wel alleen konden.”
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
216
“Waar ik wel benieuwd naar ben: Jelle Kamsma, die is verdwenen bij RTL. Waarom? Geen idee.
Hij had op een forum wel laten weten dat hij het spijtig vond.” “Dat laat wel zien dat het
pionieren is. Want blijkbaar liepen de verwachtingen uiteen ofzo. En heeft RTL gedacht: dan
gaan we dat anders doen ofzo.” “Ik heb hier ook gezegd.. Hun aanvankelijke insteek was: ‘We
gaan iets groots en fantastisch doen’. Elke drie maanden willen ze iets groots brengen. En dan
moet groter worden dan alleen een uitzending. Maar dan moet je wel een onderwerp hebben dat
1) zich daarvoor leent en 2) moet er ook wel iets boven water komen. Dus je moet beginnen met
het vinden van onderwerpen of het vinden van nieuwshaakjes waar je wat mee kunt. En daar
moet je dan op dooronderzoeken en kijken of dat zich leent voor iets. Dus dat zijn we nu aan het
doen en op het moment dat er echt iets groots is kun je daar groot mee uitpakken. Maar ik ben
principieel tegen dat je eerst in de vorm denkt en dan daar inhoudelijk iets bij gaat zoeken.”
In dit geval was dat: ‘We willen een scoop en zorg jij maar dat er iets komt’.
“Nou, het hoefde het scoop te zijn, maar wel iets wat heel groot was.”
Excel, MySQL –
“Acces deden we [bij de Volkskrant]. Maar ik kan nog niet zelf een Acces-database ontwerpen.
Dat zal niet veel afwijken van MySQL maar op dit moment kan ik dat nog niet.”
Ik wilde nog vragen naar jullie voorbeelden, maar Altijd Wat is natuurlijk een redelijk nieuw
format.
“Ja. Eigenlijk is het meer een magazine-achtig format. Een beetje Vrij Nederland op televisie.”
De organisatie.. Wat is jouw rol binnen de redactie? Is het een eilandje?
“Het is een beetje een eilandje, ik zwem een beetje tussen de verslaggevers en de redacteurs. Ik
zit nu aan het redacteursblok toevallig. Ja, het is wel een eilandje.”
Maar ze weten je wel te vinden?
“Ja, het contact is heel goed. Maar qua functie is het een eilandje.”
En andere programma’s van de NCRV, komen die weleens kijken hoe jullie data aanpakken?
“Nee, toen met de SP is er wel doorgepakt in een radioprogramma, Cappucino.”
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
217
Maar dat had ook van een andere omroep kunnen zijn?
“Ja.”
Hoe is dat uberhaupt bij de NCRV, is er veel contact tussen programma’s?
“Kijk, de mensen hier werken hier al wat langer. Sommige mensen hebben goede contacten, ook
omdat ze bij een andere programma hebben gewerkt. Mensen die van Knooppunt Kranenbarg
komen. En het is eigenlijk de oude redactie van Netwerk he, die het programma nu maken. Die
zijn wel geworteld in de NCRV.”
Maar niet dat je onderwerp gezamenlijk aanpakt van verschillende kanten?
“Nee.”
En jij bent nog de enige datajournalist – of hoe wil je dat noemen?
“Ja, zo staat het nog op m’n.. Maar eigenlijk noem ik mij een datajournalist sinds ik op die
vacature heb gereageerd. En vervolgens heb ik binnen die vacature wel aangegeven dat ik niet
alleen maar een datajournalist ben, maar liever als een algemeen onderzoeksjournalist
beschouwd wil worden.”
Want je zei: de eerste paar maanden heb ik fulltime aan datajournalistiek gewerkt, maar hoe
groot is het data-aspect nu in je werk?
“In het huidige onderwerp zal de data echt een ondergeschoven kindje blijven.”
Dus het verschilt echt per onderwerp?
“Ja. Met die amendementen was het weer alleen maar data.”
Zijn er dingen die jij nog graag zou willen die nu nog niet echt kunnen? Bijvoorbeeld Dimitri zei
dat hij graag een programmeur zou willen. Heb jij nog wensen?
“Nu nog niet. Maar dat komt ook omdat ik zelf nog een beetje zoekende ben. Maar ik sluit dat
niet uit. Je hebt twee dingen die altijd handig zijn. Mensen die gewoon handwerk kunnen
verrichten. Dus wat ik gedaan heb met die ziekenhuisbehandelingen: iemand anders zou ook die
gegevens kunnen verzamelen en dan had ik alle PDF’jes gewoon en dat had ik in één middag..
Maar goed, daar ben ik veel meer tijd aan kwijt geweest. Maar je moet natuurlijk wel zeker
weten dat je werk hebt voordat je mensen gaat inhuren. Een programmeur, daar zou ik de echte
concrete toepassing nog niet voor weten. Daar is Dimitri veel verder mee.”
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
218
Een andere vraag: je hebt mensen die beginnen met een vraag, maar je hebt ook
datajournalisten die gewoon schudden aan een dataset tot er iets uitkomt.
“Ik ga met een vraag een dataset in, anders verdwaal ik. Maar goed, je kunt natuurlijk.. Ik neem
dat als je aan een dataset gaat schudden, dat je dan ook aan de hand van een aantal vragen aan
het schudden bent. Bijvoorbeeld: je hebt een dataset met alle declaraties van alle hoge
ambtenaren, dan ga je eerst eens kijken: ‘Wat is de hoogste declaratie?’”
Zijn er nog dingen waarvan je denkt: die hebben we over het hoofd gezien? En wat zou je een
beginner willen meegeven?
“Kijk uit. Ik zou zeggen: ‘Kijk uit’. Je moet uitkijken dat je goed weet wat je precies wilt doen. Of
dat geschikt is voor het medium waar je voor werkt.”
Want iets in kaart brengen kan voor tv minder werken bijvoorbeeld?
“Ja. En ik denk dat een groot deel van het succes ook ligt in het hele simpele handwerk. Want
dan krijg je de meest unieke gegevensverzameling. En dat is natuurlijk ook de kritiek van
iemand als Dick van Eijk, he. Want ik heb het blog van Jerry Vermanen wel een beetje
meegekregen, van die hele beweging en dat Mozillaboek. Dan zegt hij: ‘De datajournalistiek is
geboren’. Dat schiet Dick van Eijk natuurlijk in het verkeerde keelgat, die denkt: ‘Hoezo? We
zijn al heel lang bezig met datasets’. Maar hij heeft natuurlijk ook gewoon keurig handwerk
gedaan en nu knalt de overheid eigenlijk datasets de wereld in en dat is een andere manier van
werken. Maar je kunt natuurlijk wel verwachten dat daar geen hele schokkende dingen in zitten,
als de overheid dat zomaar.. Dan moet je echt heel creatief zijn, wil je dat met allerlei
verschillende informatie..”
Maar je ziet wel dat het CBS nu wel de agenda van sommige datajournalisten bepaalt.
“Dat is in ieder geval journalistiek gevaarlijk.” “Doordat er minder mensen op de
nieuwsredacties werken komt een KPMG-rapport over het vestigingsklimaat in verschillende
Nederlandse gemeenten gewoon rechtstreeks de krantenpagina’s op. Terwijl ik denk: ‘Waarom?’
Hoe kan een KPMG-rapport nou nieuws zijn? Want je kunt helemaal niet achterhalen hoe ze
onderzoek gedaan hebben. Daar lijkt het dan een beetje op. Je moet er wel mee uitkijken, vind
ik, denk ik.”
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
219
André Tak (RTL Nieuws)
Wat is uw doelstelling als u bezig bent met datajournalistiek?
‘Wat wij willen doen is voor ons publiek of gebruiker zoveel mogelijk gegevens waar hij zelf ook
wat aan heeft inzichtelijk maken. En dan eigenlijk het liefste op zo’n manier dat het is te
koppelen aan de manier waarop je woont. Dat is eigenlijk de belangrijkste doelstelling. Zodat
mensen kunnen zien van, wat zijn de bepaalde prestaties op verschillende onderwerpen van de
plek waar ze wonen ten opzichte van andere plekken.’
Hebben jullie vanaf het begin voor die insteek gekozen, om het te koppelen aan woonplaatsen?
‘Ja, daar hebben we voor gekozen, omdat we er van uit gaan dat mensen dat mensen dat het
meest interessant vinden.’
Moeten jullie items ook per se nieuws zijn of kan het ook inzicht verschaffen in iets wat op zich
al wel bekend is?
‘Dat kan allebei. Maar het belangrijkste is toch wel dat het nieuws moet zijn, want wij gaan er
ook een onderwerp voor maken van televisie, dus het eigenlijk sowieso nieuws zijn. Als het om
een aardigheidjes gaat.. Daar kunnen we weinig mee, als nieuwsorganisatie.’
Want ieder onderwerp wat jullie op het vlak van datajournalistiek doen moet ook geschikt zijn
voor televisie?
‘Ja. Sterker nog: het moet de opening zijn voor televisie, dus het moet wel nieuws zijn, ja. Anders
doen we het niet.’
Wat betreft onderwerpen: hoe komen jullie op jullie ideeën?
‘Dat is een goede vraag. Daar ga ik niet alles over vertellen. Je kan natuurlijk in zijn
algemeenheid nadenken over wat onderwerpen zijn die mensen over het algemeen interessant
vinden. Die ook het meest leven als je op een bepaalde plek woont. Als je daar over door gaat
denken dan kom je op wel een heleboel onderwerpen. Daar moet je wel even voor gaan zitten.’
Zijn er bijvoorbeeld ook mensen die naar jullie toekomen met datasets?
‘Nee, nee, dat gebeurt sowieso.. Mensen hebben altijd het idee dat onderzoeksredacties bestookt
worden ideeen van buiten, maar dat is verwaarloosbaar. Ik denk dat er bij onze
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
220
onderzoeksredactie op jaarbasis misschien één tip binnen komt van buiten waar je wat aan hebt.
Dus daar hebben we met datajournalistiek helemaal weinig van te verwachten.’
Ik hoorde van andere redacties nog wel eens dat ze bijvoorbeeld wetenschappers met datasets
hadden of andere organisaties, maar dat gaat bij jullie vooral van jullie zelf uit. Jullie eigen
ideeën, daar gaan jullie mee aan de slag.
‘Ja. Er zijn heel veel datasets beschikbaar, maar ik kan bij allemaal afvragen of het wel zo
interessant is. Het is misschien wel interessant, maar niet voor de doelgroep waar wij het
programma voor maken. Ik verwacht wel dat de ontwikkeling verder komt dat er later steeds
meer interessante gegevens zijn, maar nu vind ik dat nog tegenvallen.’
Waarom vindt u het precies tegenvallen, als ik vragen mag?
‘Omdat het niet interessant is. Het zijn allemaal gegevens, maar je zou je kunnen afvragen waar
je daar nu precies mee moet. Er is wel een ontwikkeling dat er.. Er was laatst iets over
parkeergarages. Daar heb je op zich wat aan. Daar kun je als gebruiker wat mee. Maar daar kun
je weer de vraag bij stellen: is het nieuws? Nee, dat is geen nieuws. Dat zullen wij dan niet zo
gauw doen. Snap je? Maar het is wel weer een voorbeeld van informatie die wel interessant voor
een gebruiker kan zijn. Maar de combinatie én interessant voor de gebruiker én nieuws, dat zit
er in ieder geval niet bij gegevens die wij nu vinden.’
Als we het hebben over ‘interessant voor de gebruiker’, begrijp ik dan goed dat het herkenbaar
moet zijn in je dagelijks leven, bijvoorbeeld met gevaar te maken hebben.. Echt invloed hebben
op de directe levenssfeer van de gebruiker.
‘Ja, helemaal goed. Inderdaad.’
Wat betreft jullie werkwijze: hebben jullie een vaste structuur bij dataprojecten?
‘Eh ja, wat wij hebben is een klein groepje mensen wat gespecialiseerd is in bepaalde taken. We
hebben natuurlijk gewoon iemand die heel erg handig is in het omgaat met Excel-bestanden. We
hebben weer inhoudelijk mensen die ideeen bedenken en die gegevens opvragen. En we hebben
ook nog iemand die er goed in is om dat allemaal op internet te krijgen. Want daar zijn allemaal
tools voor nodig die ontwikkeld moeten worden, waarop je makkelijk kan zoeken. Dus er is niet
één persoon die alles kan. Dus we hebben dat een beetje verdeeld en iedereen heeft zijn eigen
taak. Iemand die inhoudelijk ermee bezig is, die weet wel van het bestaan van Excel en die kan
misschien wel iets, maar als het om grotere bestanden gaat hebben we iemand anders. Zo
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
221
hebben we ook weer iemand anders die ervoor zorgt dat het goed op internet komt.’
En hebben jullie ook een programmeur?
‘Eh ja, die gegevensprogrammeur hebben we ook. Die dus uiteindelijk de tool maakt, dat doet de
technische dienst. Die maakt dat in orde. Maar die zijn niet constant fulltime ermee bezig, maar
dat is een deel van hun taken.’
Maar wat betreft het proces zelf. Stel, je hebt een idee. Gaan jullie dan direct op zoek naar data
of hebben jullie de data al in handen? Wat is de volgorde van de stappen die jullie nemen?
‘Nou, je zult eerst een goed idee moeten hebben. Als je dat hebt zul je je moeten afvragen van:
waar liggen die gegevens? Zijn die gegevens uberhaupt voor handen? Zijn ze makkelijk voor
handen of ingewikkeld voor handen? En welke methode moeten we dan doen om die binnen te
krijgen? Gewoon één telefoontje en vragen? Of moeten we daarvoor een WOB-procedure
starten? Of moeten we iets anders doen? Nou, op een gegeven moment komen die gegevens en
dan zal bekeken moeten worden hoe het aangeleverd is. Is dat allemaal eenduidig aangeleverd of
afwisselend? Moeten er dan bijvoorbeeld nog extra gegevens opgevraagd worden om het
allemaal gelijk te krijgen? Dan gaat diegene die in Excel gespecialiseerd is op basis van die
gegevens die we hebben de meest interessante vragen stellen. Ook zoekvragen ontwikkelen.
Afhankelijk van de antwoorden kijken we dan wat journalistiek gezien het meest interessante is.
Wat de kop van het verhaal kan worden voor het tv-item. En op het internet kunnen we
natuurlijk wat breder uitpakken. En kunnen we ook andere interessante gegevens, dingen die we
niet in het item kunnen stoppen, ook allemaal kwijt. En de tool kan dan ontwikkeld worden. En
de verschillende verhalen – op internet kun je er meer verhalen uithalen dan op tv, om het zo
maar te zeggen. Zo gaat dat dan een beetje.’
Dus er is wel een redelijk vast stappenplan?
‘Ja, op zich wel.’
Want ik heb ook wel eens van een van de andere geïnterviewde journalisten gehoord dat hij in
het verleden begon met een vraag en dan op zoek ging naar de data, maar hij zei dat hij er dan
vaak tegen aan liep dat de data dan niet volledig was of niet betrouwbaar genoeg of niet
actueel genoeg dat hij uiteindelijk toch het onderwerp moest cancellen.
‘Dat hebben wij nooit. Dat komt.. Ik snap het wel. Maar dan heb je in het begin niet goed
gekeken of de data wel beschikbaar is en waar. Je moet je dat echt heel erg goed realiseren in het
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
222
begin. Je kunt allerlei interessante vragen bedenken, maar of het allemaal beschikbaar is, dat is
net de grote valkuil. En meestal is het namelijk niet beschikbaar of niet alles of precies de vragen
die jij ook noemt. Dus je moet dat in het begin heel erg voor jezelf helder hebben. Want alles
stap je echt in de valkuil dat je er een paar weken later pas achter komt. En dat kunnen wij ons
sowieso al niet veroorloven, om daar na een paar weken pas achter te komen. Dus dat moet in
het begin echt helder zijn. Dus eigenlijk hebben wij in die zin.. En dat klinkt misschien ten
opzichte van die ander wat vreemd in de oren, maar als wij met een project beginnen, dan zal
het lukken ook. Wij krijgen die gegevens dan ook.’
Sorry, dat laatste kon ik niet verstaan.
‘Wij krijgen die gegevens uiteindelijk dan ook. Soms duurt het misschien wel eventjes, maar we
komen er niet achter dat het niet lukt. Dat het niet kan, dat het niet beschikbaar is.’
Wat zijn dan jullie misschien wel favoriete manieren om aan data te komen? Welke technieken
of methodes gebruiken jullie vooral?
‘Ehm, ja. Dan hou ik het een beetje vaag. Je moet je uiteindelijk heel goed de vraag stellen.. Er
worden wel heel veel gegevens bijgehouden. Je moet vanuit de andere kant denken. Waarvan je
denkt dat er gegevens zijn. En hoe ze opgeslagen worden. En daar een vraag bij stellen die
interessant is. Maar als je gewoon out of the blue vragen gaat stellen die je interessant vindt, dan
is het maar de vraag of die gegevens op die manier bij andere partijen voor handen zijn. Dus je
moet het een beetje van de andere kant benaderen en je afvragen waarom organisaties bepaalde
gegevens bijhouden, met welk doel, en dan kijken of wij er wat aan zouden kunnen hebben. Je
moet je een beetje verplaatsen in de andere organisatie.’
Dus jullie bedenken al wel voor jullie echt een vraag bedenken: wat voor data is er uberhaupt
eigenlijk?
‘Ja. Dat heeft een beetje te maken met wat je dus net zegt, dat je er anders pas later achter komt
dat het er helemaal niet is.’
En als je het bijvoorbeeld hebt over scrapen of wobben, gebruiken jullie dat soort methodes ook
veel?
‘Wobben wel, maar scrapen niet. Bij scrapen kom je er toch dan weer achter dat het weer niet
vergelijkbaar is. Of dat je echt een ratjetoe binnenhaalt. Het moet wel precies zijn he. Scrapen is
ook weer een aparte techniek. Ik heb het idee dat dit nog te vroeg is op dit moment. Misschien
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
223
komt dat later. Gegevens moeten wel betrouwbaar zijn. We maken er uiteindelijk een
nieuwsitem van. En als we dan hebben zitten scrapen en maar wat dingen hebben
binnengehaald.. Het moet wel kloppen. Dus daar ben ik een beetje huiverig voor, op dit moment
nog.’
Want dat hebt u wel eens gemerkt in het verleden, dat gescrapete data niet helemaal was als u
dat het liefst zou zien?
‘Mm.. Ik heb tot nu toe niet een voorbeeld gezien van heel veel dingen die gescraped zijn en wat
ook uiteindelijk nieuwsverhalen zijn geworden. Ik vind het tegenvallen op dit moment. In
Nederland dan.’
Ik sprak ook met de datajournalist van Nu. Hij zei dat hij het wobben soms als soort
dreigmiddel achter de hand hield. Hij probeerde eerst gewoon om de data te vragen, omdat
dat uiteindelijk voor beide partijen het snelste is. Een WOB-verzoek kost een overheidsinstantie
veel tijd, maar jou ook. Dus hij probeerde het pas als laatste redmiddel te gebruiken. Doen
jullie dat ook? Vragen jullie vriendelijk om de data of beginnen jullie direct met wobben?
‘Nee, dat doen wij vanaf het begin af aan. Kijk, als je dreigt met een WOB-verzoek en er komt
nooit een WOB-verzoek, dan is het dreigement waardeloos.’
Maar hoe reageren organisaties daar dan op? Is het makkelijk voor jullie om de data te
krijgen die jullie willen hebben?
‘Ja hoor, als de vraag tenminste goed is gesteld en die [data, JK] is ook zo voor handen, dan
komt dat wel, hoor.’
Maar als je mensen gewoon opbelt. Als je zegt: ‘Ik wacht met een WOB-verzoek en vráág of ik
de data mag hebben’, werken partijen dan ook mee of zijn ze daar huiverig voor?
‘Ja, ik denk dat er dan toch wel iets van huiver is.’
Omdat ze toch bang zijn dat ze gepakt worden?
‘Nou, dat weet ik niet. Maar organisaties zitten er toch niet op te wachten om zichzelf heel veel
werk op de hals te halen, dus ja, dan is het toch wat lastiger als je dat eerst vraagt.’
Dus als ik het goed begrijp wobben jullie direct vanaf het begin bij overheidsorganisaties?
‘Doorgaans, in de meeste gevallen gebruiken we daar meteen de WOB voor.’
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
224
Is jullie aanpak ook nog veranderd sinds jullie begonnen zijn met datajournalistiek?
‘We proberen het op internet wat beter te doen. Het presenteren van de gegevens was vroeger
een beetje houtje-touwtje. Gewoon: alle gemeentes op een rij en dan moest je jouw eigen
gemeente er maar tussen zien staan. Nu proberen we het op internet beter te presenteren, zodat
het gebruiksvriendelijker is. Dat je er ook echt wat aan hebt. Die ontwikkeling moet nog verder
dan nu, maar dat is wel de belangrijkste verandering. De resultaten beter proberen weer te
geven.’
Onder datajournalisten wordt ook wel gediscussieerd over hoe je data moet presenteren: geef je
de bezoeker alles op een presenteerblaadje of laat je hem ook zelf nog wat uitzoeken. Hoe denkt
u hierover?
‘Ik ben van mening dat het zo makkelijk mogelijk moet. Er zijn ongetwijfeld mensen die er ook
in geïnteresseerd zijn om in de data te zoeken, maar dat is niet de doorsnee kijker of gebruiker.
Die wil toch snel consumeren. Ik denk dat je mensen wegwijs moet maken.’
Wat betreft uw medewerkers: u had het net al over uw team. Hoe groot is dit precies?
‘Wij hebben gewoon een researchredactie van zes man en die doen dat in principe allemaal.
Maar niet allemaal continue. Het zal van iedereen twintig procent van zijn tijd zijn. Alles bij
elkaar zullen daar misschien acht mensen mee bezig, maar allemaal als deeltijd. We hebben wel
iemand die zich er langer mee bezig houdt, misschien veertig procent van zijn tijd, maar dat is
wel het meeste. Het wordt verder allemaal aangevuld door anderen.’
En wat maakt iemand volgens u geschikt voor datajournalistiek?
‘Het belangrijkste is dat die persoon gewoon een goede journalist is. Dat is echt het
allerbelangrijkste. En je moet ook wat feeling hebben met getalletjes, dat ook. En je moet ook
iets meer feeling dan gemiddeld hebben voor hoe je dat allemaal op internet zet. Maar als je
geen goede journalist bent, dan val je heel snel door de mand. Dan weet je bij God niet waar je
informatie moet zoeken en dan weet je ook geen goede vragen te stellen. Dus dat is gewoon het
allerbelangrijkste.’
Er zijn ook veel vragen geweest over waarom Jelle Kamsma bij jullie vertrokken is. Was hij
volgens u een goede datajournalist?
‘Ja, maar ik ga niet over Jelle praten. Beetje rare vraag voor een scriptie.’
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
225
Het was een veelbesproken onderwerp onder datajournalisten, dus ik moet hier wel naar vragen.
‘Dan heb ik daar niets over te zeggen.’
Dan noteer ik dat als reactie.
En wat betreft de rest van de redactie: hoe kijkt die aan tegen datajournalistiek? Is het een
vreemde eend in de bijt?
‘Nee hoor. Het levert een nieuwsonderwerp op en extra clicks voor de website, dus iedereen is er
wel enthousiast over.’
Bij de NOS hoorde ik dat het nog wel eens lastig was om de chef ervan te overtuigen tijd en
geld vrij te maken voor datajournalistiek. Hebben jullie dezelfde ervaring?
‘Nee, dat heb ik niet gemerkt. Maar als er geen nieuws uit komt, dan snap ik wel dat niemand
enthousiast is. Het doel is natuurlijk niet datajournalistiek. Het doel is nieuws brengen. En dat
we daar net even andere methodes voor hanteren dan voorheen, daar moet je niet teveel de
nadruk op leggen. Dat is eigenlijk helemaal niet zo belangrijk. Het gaat er uiteindelijk om wat er
uit komt. En daar hebben dan net even een andere methode voor gebruikt. En het voordeel
ervan is dat je er op internet meer uit kan halen. Want er gaan gewoon veel meer mensen naar
die site toe.’
‘Kijk, als je constant maar je datajournalistieke methodes loopt te benadrukken, maar daar komt
niets uit.. Dan kan ik me wel voorstellen dat mensen argwanend worden.’
Dus daar komt weer terug dat het echt gaat om de journalistiek.
‘Ja.’
Nog een vraag, om terug te komen op de medewerkers. Zijn zij al langere tijd bezig met
datajournalistiek of soortgelijke methoden of is dit relatief nieuw voor hen?
‘Wat bedoel je precies?’
Bijvoorbeeld tien jaar geleden waren journalisten ook al bezig met databases, maar nu er
meer data en tools vrijkomen trekt het onderwerp een nieuwe groep journalisten. Is dat bij
jullie ook een nieuwe groep?
‘Ja, dat is nieuw.’
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
226
Komen ook andere mensen vanuit de redactie, die niet bij de onderzoeksredactie horen, naar
jullie toe met data die ze tegen zijn gekomen?
‘Dat gebeurt niet zo heel vaak. Maar dat komt ook omdat de rest van de organisatie heel erg
bezig is met nieuws van de dag. Je moet er dan toch een ander oog voor hebben. Dat is geen
onwil, maar mensen letten daar niet op, omdat ze bezig zijn met het verslag doen van dagelijks
nieuws. Dan kom je niet heel erg gauw in aanraking met data. Daar heb ik wel begrip voor.’
Om u nog ruimte te geven om dingen te noemen die we nog niet hebben behandeld: zijn er nog
andere dingen waar u tegen aan loopt met datajournalistiek die andere journalisten met
interesse in data zouden moeten weten?
‘Dan kom ik toch op dat je je goed moet afvragen wat je wilt hebben en waar je het vindt. Dat je
daar heel goed over moet nadenken. Er wordt wel veel gesproken over de open data-beweging,
maar als je daar op gaat zitten wachten, dan gebeurt er helemaal niets. Of misschien pas over
een tijdje. Dat zie ik nu nog niet heel veel gebeuren. Dus je moet er echt zelf achteraan. En
daarbij de goede vragen stellen.’
Als ik het goed begrijp maakt RTL nu ook gebruik van een fonds. Als dat traject is afgelopen,
gaan jullie er dan ook mee door?
‘Dat weet niemand. Maar in principe ga ik er vanuit van wel. Want, zoals ik al zei, het is gewoon
een methode. Waarom zou je die methode opeens loslaten? Misschien in een iets andere vorm.
Maar we gebruiken ook de WOB als methode. Waarom zou je daarmee gaan stoppen? En als
datajournalistiek ook werkt, dan ga je daar toch gewoon mee door? Mijn verwachting is dat het
uiteindelijk gewoon continu doorloopt, als automatisme.’
Gewoon een standaardonderdeel van de toolbox.
‘Ja, het is een methode, zoals er nog tig andere methodes zijn. Waarom zou je dan, als de
subsidie stopt, daar niets mee doen?’
Tot slot nog een ding: is er een bepaald project waarop u heel trots bent?
‘Even kijken. De laatste keer dat we wat gedaan hebben, was met de wapenvergunningen. Ik
heb niet zo een ding wat er bovenuit steekt, maar noem gewoon de laatste. Daar hebben ook
veel mensen op geklikt. Het was op zich wel nieuwswaardig. Niet heel erg nieuwswaardig, maar
wel gedeeltelijk. Dat was toch wel een succesvol project. Nu.nl heeft het ook gedaan. Dat zijn
‘NERD MET VIJF POTEN’ MASTERSCRIPTIE JAN KRUIDHOF
227
toch twee grote nieuwsorganisaties die dat de moeite waard vonden. Dat was op zich een
succesvol project, maar dat was gewoon de laatste die we gedaan hebben.’
Hoeveel projecten zijn er ongeveer per jaar, denkt u?
‘Een stuk of twintig ofzo.’
Is er nog iets wat u graag kwijt wilt, maar wat ik niet heb genoemd?
‘Nee, ik denk dat je wel volledig was met de vragen. We hebben wel heel veel behandeld.’