E DATA RESEARCH oktober Twitteronderdeloep · in kaart. Hiervoor maakte hij gebruik van een...

8
INHOUD De Nederlandse Dataprijs voor het toegankelijk maken en delen van onderzoeksdata gaat dit jaar naar de Nederlandse Liederen- bank en DINED. Heidi Berkhout Op 24 oktober jl. werd voor de derde keer de Nederlandse Dataprijs uitgereikt. € 7.500, een beeld en een diner voor de onderzoeksgroep, met die prijzenpot gingen de Nederlandse Liederen- bank (winnaar Dataprijs humaniora en sociale wetenschappen) en DINED (winnaar Dataprijs exacte en technische wetenschappen) naar huis. Nog lang niet klaar “We zijn heel erg blij met de Dataprijs!”, vertelt Martine de Bruin, lid van het projectteam van de Nederlandse Liederenbank. “De jury noemt onze database een ‘grote aanwinst voor zowel het Ne- derlands academisch als cultureel erfgoed’. Dat is een bevestiging dat we op het goede spoor zitten. Het prijzengeld besteden we aan onze melo- dieënzoekmachine. Hiermee zijn beschreven me- lodieën te vergelijken en kunnen titelloze of ge- varieerde melodieën worden geïdentificeerd. En daarvoor is veel data nodig. Het prijzengeld be- steden aan een pilotproject lijkt ons een goede voorbereiding op een grotere subsidieaanvraag. Maar misschien wordt het ook nog iets anders. Er zijn nog zoveel verrijkingen en verdiepingen mo- gelijk: de Liederenbank is nog lang niet klaar!” Juryvoorzitter prof. Kees Aarts: “In de praktijk wordt de databank al door veel wetenschappers binnen de digital humanities gebruikt voor lite- rair-, muziek-, godsdienst-, algemeen historisch en etnologisch onderzoek. Ook journalisten, musici en middelbare scholieren gebruiken de databank veel. Deze goed gestructureerde data- bank is daarom een grote aanwinst voor zowel het Nederlands academisch als cultureel erfgoed.” Begrijpelijke data Ook Johan Molenbroek en Marijke Dekker, de mensen achter DINED, zijn verrast en blij: “Ons doel is altijd geweest om onbegrijpelijke data begrijpelijk te maken. En dat lukt: met onze inter- actieve tool wordt de variatie in de afmetingen van het menselijk lichaam duidelijk, zonder dat de gebruiker veel kennis over anatomie en statis- tiek nodig heeft. Naast studenten gebruiken ook bedrijven en ziekenhuizen onze database. De vele vragen geven steeds weer aanleiding om verbe- teringen aan te brengen en nieuwe data toe te voe- gen, zoals menselijke krachten. Onze faculteit Industrieel Ontwerpen van de TUDelft stelt ons steeds weer in de gelegenheid om het benodigde programmeerwerk door een student-assistent te laten uitvoeren. En door het winnen van de Dataprijs kunnen we nu ook een paar grotere, al langer gewenste verbeterslagen maken.” Uitnodigend en innovatief Juryvoorzitter prof. Karel Luyben benadrukte namens de andere juryleden de praktische kanten en de mooie interface van DINED. “De dataset is heel praktisch opgebouwd waardoor het maat- schappelijk nut groot is. Het innovatieve karak- ter van de set zal veel wetenschappers uitnodigen voor verder onderzoek. Door veel aandacht te schenken aan zowel de verzameling, beschrij- ving en het beschikbaar stellen van de set, is deze voor een groot publiek zeer toegankelijk.” Meer datasets Naast de winnaars waren vier andere datasets genomineerd. Al zijn deze datasets niet bekroond, alle inzendingen waren mooie en inspirerende voorbeelden van het toegankelijk maken en delen van onderzoeksdata. Initiatiefnemer Research Data Netherlands is voornemens over twee jaar de prijs weer uit te reiken. liederenbank.nl dined.io.tudelft.nl researchdata.nl 3 Twitter: hype of here to stay voor de wetenschap? 4 Deze datasets zijn ook sinds kort beschikbaar 5 CLARIAH werkt aan een digitale infrastructuur 6 Lokale kennis als data mee in onderzoek 6 Deuren open voor virtueel onderzoek 7 RDA-week in beeld 7 KB: toegang tot ieder wetenschappelijk artikel 8 Hay Kranen: ‘Wikipedia goudmijn voor onderzoek’ 8 De bomen en het bos binnen de e-humanities Jaargang 9 | nummer 1 Nieuwsbrief over data en onderzoek in de alfa- en gamma- wetenschappen. E-data & Research verschijnt drie keer per jaar en wordt mogelijk gemaakt door: CentERdata, CLARIAH, DANS, Huygens ING, de Koninklijke Bibliotheek en het RIVM. E - DATA & RESEARCH E - DATA & RESEARCH oktober 2014 1 Scan deze QR code met een smartphone om de website van E-data te bezoeken. www.edata.nl Prof. Louis Grijp (Meertens Instituut) ontving de Dataprijs voor de Nederlandse Liederenbank, een database van 170.000 Nederlandse liederen van de middeleeuwen tot de 20e eeuw. Ir. Ma- rijke Dekker is namens dr.ir. Johan Molenbroek (TU Delft) voor DINED aanwezig, een database met meetgegevens over de variatie van menselijke vorm en afmetingen foto Annemiek van der Kuil Online toegankelijk maken en delen van data bekroond en beloond Liederenbank en DINED winnaars Dataprijs 2014 Wetenschappers kunnen in het KB ResearchLab zelf experimenteren met data van de KB en open-source tools. Inge Angevaare De Koninklijke Bibliotheek (KB) heeft ruim 9 miljoen krantenpagi- na’s, 1,5 miljoen tijdschriftpagina’s en zo’n 90.000 andere publicaties ge- digitaliseerd. Al die bestanden staan online op delpher.nl, waar iedere Nederlander ze kan doorzoeken. Maar onderzoekers willen vaak meer dan alleen maar zoeken. Daarom biedt de KB sinds kort een omgeving aan waar wetenschappers met data en tools kunnen experi- menteren: het KB ResearchLab. Resultaten clusteren Willem Jan Faber, manager van het Lab bij de KB: “Niet alleen de we- tenschappers maar ook wijzelf staan nog aan het begin van een ontdek- kingstocht in Big Data. Om het maximale rendement uit die data te halen, werken we samen met onder- zoekers. We bieden tools en data aan en nodigen wetenschappers uit om ermee te gaan werken.” Ontwikkelt de KB die tools ook? Fa- ber: “De KB is natuurlijk vooral een leverancier van content. Maar uit onze samenwerking met onderzoe- kers ontstaan soms ook tools die de content beter doorzoekbaar maken of die helpen om resultaten te clus- teren. Die kunnen we dan weer aan- bieden aan andere wetenschappers. De samenwerking met onderzoekers is trouwens niet helemaal nieuw. De afgelopen jaren hebben we al wat ervaring opgedaan, bijvoorbeeld met taalkundige Marc van Oostendorp (zie E-data februari 2014, red), met wie we een ‘scandeermachine’ bouwden. Samen met het Instituut voor Nederlandse Lexicologie heb- ben we gewerkt aan een tool voor het taggen van ‘named entities’ (eigen- namen). Nu zijn we zo ver dat we de mogelijkheden van ons lab breder kunnen aanbieden, aan alle onder- zoekers die willen experimenteren.” KB ResearchLab digitale speeltuin voor wetenschappers Online aan de slag met data en tools VERVOLG OP PAGINA 2

Transcript of E DATA RESEARCH oktober Twitteronderdeloep · in kaart. Hiervoor maakte hij gebruik van een...

Page 1: E DATA RESEARCH oktober Twitteronderdeloep · in kaart. Hiervoor maakte hij gebruik van een eigenhandig samengestelde lijst met ... van typische dialectwoorden in de lijst. brondeVolkskrant

INHOUD

De Nederlandse Dataprijs voor

het toegankelijk maken en delen

van onderzoeksdata gaat dit jaar

naar de Nederlandse Liederen-

bank en DINED. Heidi Berkhout

Op 24 oktober jl. werd voor de derde keer deNederlandse Dataprijs uitgereikt. € 7.500, eenbeeld en een diner voor de onderzoeksgroep, metdie prijzenpot gingen de Nederlandse Liederen-bank (winnaar Dataprijs humaniora en socialewetenschappen) en DINED (winnaar Dataprijsexacte en technische wetenschappen) naar huis.

Nog lang niet klaar“We zijn heel erg blij met de Dataprijs!”, verteltMartine de Bruin, lid van het projectteam van deNederlandse Liederenbank. “De jury noemt onzedatabase een ‘grote aanwinst voor zowel het Ne-derlands academisch als cultureel erfgoed’. Dat iseen bevestiging dat we op het goede spoor zitten.Het prijzengeld besteden we aan onze melo-dieënzoekmachine. Hiermee zijn beschreven me-lodieën te vergelijken en kunnen titelloze of ge-varieerde melodieën worden geïdentificeerd. Endaarvoor is veel data nodig. Het prijzengeld be-steden aan een pilotproject lijkt ons een goedevoorbereiding op een grotere subsidieaanvraag.Maar misschien wordt het ook nog iets anders. Erzijn nog zoveel verrijkingen en verdiepingen mo-gelijk: de Liederenbank is nog lang niet klaar!”Juryvoorzitter prof. Kees Aarts: “In de praktijkwordt de databank al door veel wetenschappersbinnen de digital humanities gebruikt voor lite-rair-, muziek-, godsdienst-, algemeen historischen etnologisch onderzoek. Ook journalisten,musici en middelbare scholieren gebruiken dedatabank veel. Deze goed gestructureerde data-bank is daarom een grote aanwinst voor zowel hetNederlands academisch als cultureel erfgoed.”

Begrijpelijke dataOok Johan Molenbroek en Marijke Dekker, demensen achter DINED, zijn verrast en blij: “Onsdoel is altijd geweest om onbegrijpelijke data

begrijpelijk te maken. En dat lukt: met onze inter-actieve tool wordt de variatie in de afmetingenvan het menselijk lichaam duidelijk, zonder datde gebruiker veel kennis over anatomie en statis-tiek nodig heeft. Naast studenten gebruiken ookbedrijven en ziekenhuizen onze database. De velevragen geven steeds weer aanleiding om verbe-teringen aan te brengen en nieuwe data toe te voe-gen, zoals menselijke krachten. Onze faculteitIndustrieel Ontwerpen van de TUDelft stelt onssteeds weer in de gelegenheid om het benodigdeprogrammeerwerk door een student-assistent telaten uitvoeren. En door het winnen van deDataprijs kunnen we nu ook een paar grotere, allanger gewenste verbeterslagen maken.”

Uitnodigend en innovatiefJuryvoorzitter prof. Karel Luyben benadruktenamens de andere juryleden de praktische kantenen de mooie interface van DINED. “De dataset is

heel praktisch opgebouwd waardoor het maat-schappelijk nut groot is. Het innovatieve karak-ter van de set zal veel wetenschappers uitnodigenvoor verder onderzoek. Door veel aandacht teschenken aan zowel de verzameling, beschrij-ving en het beschikbaar stellen van de set, isdeze voor een groot publiek zeer toegankelijk.”

Meer datasetsNaast de winnaars waren vier andere datasetsgenomineerd. Al zijn deze datasets niet bekroond,alle inzendingen waren mooie en inspirerendevoorbeelden van het toegankelijk maken en delenvan onderzoeksdata. Initiatiefnemer ResearchData Netherlands is voornemens over twee jaarde prijs weer uit te reiken.

liederenbank.nldined.io.tudelft.nlresearchdata.nl

3Twitter: hype of here tostay voor de wetenschap?

4Deze datasets zijn ooksinds kort beschikbaar

5CLARIAH werkt aan eendigitale infrastructuur

6Lokale kennis als datamee in onderzoek

6Deuren open voorvirtueel onderzoek

7RDA-week in beeld

7KB: toegang tot iederwetenschappelijk artikel

8Hay Kranen: ‘Wikipediagoudmijn voor onderzoek’

8De bomen en het bosbinnen de e-humanities

Jaargang 9 | nummer 1

Nieuwsbrief overdata en onderzoekin de alfa- en gamma-wetenschappen.

E-data & Research verschijntdrie keer per jaar en wordtmogelijk gemaakt door:CentERdata, CLARIAH,DANS, Huygens ING,de Koninklijke Bibliotheeken het RIVM.

E-DATA&RESEARCH

E-DATA&RESEARCH oktober 2014 1

Scan dezeQR code met eensmartphone om dewebsite van E-datate bezoeken.www.edata.nl

Prof. Louis Grijp (Meertens Instituut) ontving de Dataprijs voor de Nederlandse Liederenbank,een database van 170.000 Nederlandse liederen van de middeleeuwen tot de 20e eeuw. Ir. Ma-rijke Dekker is namens dr.ir. Johan Molenbroek (TU Delft) voor DINED aanwezig, een databasemet meetgegevens over de variatie van menselijke vorm en afmetingen foto Annemiek van der Kuil

Online toegankelijk maken en delen van data bekroond en beloond

Liederenbank en DINEDwinnaars Dataprijs 2014

Wetenschappers kunnen inhet KB ResearchLab zelfexperimenteren met data vande KB en open-source tools.Inge Angevaare

De Koninklijke Bibliotheek (KB)heeft ruim 9 miljoen krantenpagi-na’s, 1,5 miljoen tijdschriftpagina’sen zo’n 90.000 andere publicaties ge-digitaliseerd. Al die bestanden staanonline op delpher.nl, waar iedereNederlander ze kan doorzoeken.Maar onderzoekers willen vaak

meer dan alleen maar zoeken.Daarom biedt de KB sinds kort eenomgeving aan waar wetenschappersmet data en tools kunnen experi-menteren: het KB ResearchLab.

Resultaten clusterenWillem Jan Faber, manager van hetLab bij de KB: “Niet alleen de we-tenschappers maar ook wijzelf staannog aan het begin van een ontdek-kingstocht in Big Data. Om hetmaximale rendement uit die data tehalen, werken we samen met onder-

zoekers. We bieden tools en data aanen nodigen wetenschappers uit omermee te gaan werken.”Ontwikkelt de KB die tools ook? Fa-ber: “De KB is natuurlijk vooral eenleverancier van content. Maar uitonze samenwerking met onderzoe-kers ontstaan soms ook tools die decontent beter doorzoekbaar makenof die helpen om resultaten te clus-teren. Die kunnen we dan weer aan-bieden aan andere wetenschappers.De samenwerking met onderzoekersis trouwens niet helemaal nieuw. De

afgelopen jaren hebben we al watervaring opgedaan, bijvoorbeeld mettaalkundige Marc van Oostendorp(zie E-data februari 2014, red), metwie we een ‘scandeermachine’bouwden. Samen met het Instituutvoor Nederlandse Lexicologie heb-ben we gewerkt aan een tool voor hettaggen van ‘named entities’ (eigen-namen). Nu zijn we zo ver dat we demogelijkheden van ons lab brederkunnen aanbieden, aan alle onder-zoekers die willen experimenteren.”

KB ResearchLab digitale speeltuin voor wetenschappers

Online aan de slag met data en tools

VERVOLG OP PAGINA 2

Page 2: E DATA RESEARCH oktober Twitteronderdeloep · in kaart. Hiervoor maakte hij gebruik van een eigenhandig samengestelde lijst met ... van typische dialectwoorden in de lijst. brondeVolkskrant

DH2014: de volle breedtevan de Digital HumanitiesSteven ClaeyssensHet grootste Digital Humanities-congres vond dit jaar plaats inLausanne. Meer dan 700 deelnemersverzamelden zich nabij het meervan Genève voor een volle weekpresentaties, paneldiscussies, pos-tersessies en praktische workshops.Geesteswetenschappers uit allewindstreken bespraken nieuwe enoude digitale onderzoeksmethodenen ontvouwden hun onderzoeks-plannen. Uit Nederland kwamen on-der meer aansprekende bijdragenvan het Translantis-team (translan-tis.nl), het Riddle of Literary Quali-typroject (literaryquality.huygens.knaw.nl) en het PoliMedia-project(polimedia.nl).De breedte van het congres werdaangezet tijdens keynotes van Be-thany Nowviski en Bruno Latour.Nowviski maakte een rondganglangs lopende onderzoeks- en kun-stenaarsprojecten die de geschiede-nis van de mensheid als maat nemenen hield zo een pleidooi om in deDigital Humanties de Longue Duréein ere te herstellen. Latour steldehet ‘digitale’ in de Digital Humani-ties ter discussie. Hij benadrukte dematerialiteit van ‘alles digitaal’ enwees op de toenemende gelijkenistussen het boek en het web. Vroegerschreven mensen in scriptoria, van-daag schrijven ze in screentoria, al-dus Latour. Volgend jaar is het con-gres in Sydney.dh2014.org

ICPSR summerschool:verdieping en verbredingWouter Quite en Nina ConkovaIeder jaar organiseert het Interuni-versity Consortium for Political andSocial Research (ICPSR) een sum-merschool met allerhande cursus-sen op het gebied van sociaalweten-schappelijke onderzoeksmethoden.Wouter Quite en Nina Conkova wa-ren erbij, deels gesubsidieerd door

DANS. Wouter: “Ik had het geluk inhet kader van mijn promotie-onder-zoek naar de summerschool te mo-gen gaan. Het bezoek aan Ann Arborwas een zeer leerzame ervaring,waar ik naast de verdieping en ver-breding van mijn methodologischekennis ook vele nieuwe contactenheb opgedaan. Een ervaring die ikniet had willen missen.” Nina Con-kova vult Wouter aan: “Door dezesummerschool heb ik mijn kennis instatistische methoden op kunnenfrissen en mijn analytische vaardig-heden kunnen uitbreiden. Sterkernog, ik heb genoten van het grotegezelschap van collega-promovendivan over de hele wereld en van destukjes van de Amerikaanse cul-tuur!”icpsr.umich.edu

Referentieculturen vindenin taal met online toolsPim HuijnenKunnen historici gebruik maken vandigitale krantenarchieven en digi-tale methoden en technieken? Dievraag stond centraal tijdens de con-ferentie ‘Reference Cultures andImagined Empires from a WesternPerspective, 1850-2000’ die 11, 12 en13 juni plaatsvond in Utrecht. Deconferentie was georganiseerd teruitwerking van het begrip ‘reference

cultures’, dat als theoretisch funda-ment dient voor twee onderzoeks-projecten die vanuit de UniversiteitUtrecht worden gecoördineerd: hetNWO-project Translantis en hetdoor HERA gefinancierde Asymenc.Deelnemers vonden elkaar in hetidee dat ‘reference cultures’ in detaal moeten worden gezocht: dewijze waarop mensen andere cultu-ren als referentie gebruiken (en ver-anderingen daarin: van ‘Ameri-kaanse droom’ naar ‘Amerikaansetoestanden’) zegt iets over hun cul-tuur of mentaliteit. Diverse sprekerstoonden hoe digitale methoden entechnieken kunnen bijdragen aan destudie hiervan. Zo liet Bob Nichol-son van Edge Hill University op ba-sis van zijn onderzoek naar digitalekrantenarchieven zien hoe mode-woorden (‘skedaddle’) en grappenin de negentiende eeuw vanuit deVerenigde Staten in Engeland te-recht kwamen (zoek op Youtube op‘Skeddadlemania’ voor een impres-sie). Evenzo inspirerend was de pre-sentatie van Matthias Lemke van deHelmut-Schmidt-Universität Ham-burg. Met behulp van een zelf ont-wikkelde tekstanalyse-tool kon hijde stelling bewijzen dat Duitsekranten de afgelopen decennia intoenemende mate gebruik makenvan neoliberale argumentatie om

politiek beleid te beschrijven – endaarmee de vraag die centraal stondin de conferentie bevestigend be-antwoorden.translantis.wp.hum.uu.nl/conferences

DHBenelux 2014: digitalewetenschappers verbindenJoris van ZundertDe DHBenelux is een nieuwe con-ferentie met als onderwerp: digitalegeesteswetenschappen (DH). Tij-dens deze conferentie kunnen pro-fessionals die digitale componentengebruiken in geesteswetenschappe-lijk onderzoek hun werk presente-ren. Het doel is om (nader) kenniste maken met digitale geesteswe-tenschappen en in contact te komenmet collega’s die digitale methodenen technieken gebruiken. De eersteeditie van de conferentie vondplaats op 12 en 13 juni jongstledenbij het Huygens ING en de Konink-lijke Bibliotheek in Den Haag. Inhaar keynote wenste professorMelissa Terras van het UniversityCollege London Centre for DigitalHumanities de organisatoren veelsucces met het verbinden van decommunity van digitale geestes-wetenschappers in de Benelux. Deconferentie bood een breed over-zicht van projecten, groen en rijp,waarin de bezoeker naar hartelustkon grasduinen: van concrete pro-jecten die de historie van de bevrij-ding van Nijmegen in kaart brengentot meer reflectieve bijdragen overde rol van digitale methoden in filo-sofie. Het afsluitende discussiepanelbelichtte een aantal hot topics in dedigitale geesteswetenschappen, zo-als de rol van digitale methoden inhet onderzoek, en de mate waarindeze onderdeel moeten zijn van hetcurriculum. Verslagen zijn door deorganisatie en deelnemers in ware‘DH-stijl’ online bij elkaar gebracht.dhbenelux.org/#Blogs-and-ReviewsWrapper

2 oktober 2014 E-DATA&RESEARCH

GEHOORD & BIJGEWOOND

ICPSR summerschool leidt tot nieuwe vriendschappen voor Nina(links) en Wouter (vierde van links) foto Marcelo Lima

COLOFON Uitgever: Stichting Uitgeverij E-data & Research Den Haag. Redactieadres: Postbus 93067, 2509 AB Den Haag, 070-3494450, [email protected], www.edata.nl.Hoofd-/eindredacteur: Heidi Berkhout. Redactie: Marika de Bruijne, Steven Claeyssens, René van Horik, Ilja Nieuwland, Rutger Nugteren, Erica Renckens. Redactiesecretariaat:Lucas Pasteuning. Aan dit nummer werkten mee: Inge Angevaare, Nina Conkova, Hella Hollander, Pim Huijnen, Erik de Jager, Emilie Kraaikamp, Annemiek van der Kuil, Ida Nijen-huis, Marieke Polhout, Wouter Quite, Renske Siemens, Bart van Vliet, Lotte Wilms, Carolien van Zuilekom, Joris van Zundert. Opmaak: Colette Sloots, Haarlem.Productie: Amsterdam University Press. Druk: Ten Brink, Meppel. Webmaster: Sonja Duijkers Oplage: 7500 papier, 1900 digitaal. ISSN: 1872-0374. We hebben getracht allebelanghebbenden met betrekking tot het gebruikte beeldmateriaal te benaderen. Degenen die menen rechten te kunnen doen gelden, kunnen zich tot ons wenden. Toezendingpapieren en/of digitale versie is kosteloos aan relaties van de stakeholders en studenten in de alfa- en gammarichtingen. Wilt u een artikel uit E-data overnemen? Neem dan contactop met de hoofdredacteur. Overname van artikelen geschied altijd onder vermelding van de bron E-data & Research en de naam van de auteur van het artikel.

Permanente bèta-versieIs het ResearchLab nu af? Faber: “Nee, enhet zal ook nooit af zijn. We voorzien een per-manente bèta-versie, waar steeds aan gewerkten gebouwd wordt. We groeien mee met detechnische mogelijkheden en de wensen vande onderzoekers. We zien trouwens het onlineResearchLab niet als het enige resultaat vanonze samenwerking met onderzoekers. Wegaan ook bijeenkomsten organiseren, zoalshackatons waar onderzoekers en ontwikke-

laars met elkaar kunnen experimenteren inéén ruimte.”

Ideeën en wensen welkomHoe kunnen onderzoekers het lab vinden? Fa-ber: “Op kb.nl/lab. We nodigen wetenschap-pers van harte uit om daar te komen rondkij-ken en te experimenteren. Ook ideeën en wen-sen zijn welkom.”

kb.nl/lab

Data archiveringbestaat alweer 50jaar in Nederland.In een specialeeditie van E-data& Research halen(internationale)collega’s hun her-inneringen op uithet verleden endelen ideeën voorde toekomst.

Speciale editie van E-dataExperimenteren met data en toolsVERVOLG VAN PAGINA 1

Reis van de Razziazeventig jaar later

Op 9 november 1944 legdehet Duitse leger een cordonrond Rotterdam en Schiedam.In de twee daaropvolgendedagen werden ruim 52.000Rotterdammers en Schiedam-mers tussen zeventien en veer-tig jaar oud opgepakt en afge-voerd richting Oost-Nederlanden Duitsland om daar dwang-arbeid te verrichten. Ten ge-volge van ziekte, ondervoeding,vluchtpogingen, bombarde-menten en andere oorlogs-handelingen zijn duizenden vandeze mannen omgekomen.Filmmaker Erik de Jager heeft,70 jaar later, met het project‘Reis van de Razzia’ de verha-len van 75 overlevenden vast-gelegd voor de toekomst. Deinterviews zijn online beschik-baar via EASY van DANS. (MP)stichtingreisvanderazzia.nl

Fremdenpas van dwangar-beider Jo Vermeulen, num-mer 8416 credit StichtingReis van de Razzia

SURFsara versterktResearch Data NL

Research Data Netherlands(RDNL) is een partner rijker:SURFsara. Met de komst vandeze nieuwe partner kan RDNLmeer wetenschappelijke instel-lingen vanuit een gezamenlijkeaanpak bedienen bij het duur-zaam opslaan en delen vanonderzoeksdata.SURFsara is sterk op het ge-bied van nationale reken- endatadiensten, waaronder HighPerformance Computing, envormt daarmee een aanvullingop het bestaande werkterreinvan RDNL: de technische we-tenschappen (via 3TU.Data-centrum) en de sociale engeesteswetenschappen (viaDANS).De officiële toetreding vanSURFsara vond plaats tijdensde uitreiking van de Neder-landse Dataprijs. Axel Berg,adjunct-directeur SURFsara:“We zijn blij dat deze strategi-sche samenwerking is be-krachtigd. Met de samenwer-king verwachten we onderzoe-kers in Nederland nog beter eneffectiever te kunnen onder-steunen, met een brede en ge-zamenlijke catalogus van dien-sten, expertise en innovaties.”researchdata.nl

KORT

Page 3: E DATA RESEARCH oktober Twitteronderdeloep · in kaart. Hiervoor maakte hij gebruik van een eigenhandig samengestelde lijst met ... van typische dialectwoorden in de lijst. brondeVolkskrant

Manieren zoeken om onderzoeksmethoden tecombineren of om ze samen te gebruiken endeze nog verder te ontwikkelen, is de bood-schap. “Er worden al veel studies gepubli-ceerd, maar bij veel daarvan heb ik mijn twij-fels. Social media bieden een kans voor on-derzoekers en naarmate social media analyticszich ontwikkelen, zullen we meer studies zienvan goede kwaliteit.” Of, zoals Couper con-cludeert: “We hebben minder hype en meerhypothesen nodig.”Het artikel Is the Sky Falling? New Techno-logy, Changing Media, and the Future ofSurveys uit Journal of the European SurveyResearch Association (volume 7, nummer 3,2013) omschrijft meer bevindingen van MickCouper. (MdB)https://ojs.ub.uni-konstanz.de/srm/article/view/5751

Mick Couper, Research Professor aanMichigan University en bekend sur-veymethodoloog, vertelt hoe socialmedia en surveydata elkaar kunnenondersteunen.

Mick Couper: “Social media en surveys kun-nen worden gekoppeld op drie niveau’s: ge-aggregeerd, conceptueel of individueel. Demeesten koppelen op geaggregeerd niveau enlaten verbanden zien tussen surveyresultatenen social media.” Bekende voorbeelden zijnanalyses op basis van Twitter-trends. Tijdenseen griepseizoen wordt veel over griep ge-tweet. Door te analyseren hoe vaak bepaaldewoorden voorkomen, wordt een schatting ge-maakt van de verspreiding van griep door hetland. “Mijn zorg hierbij is dat surveys vaakworden gebruikt als maatstaf. Hierbij zijn dealgoritmen voor het identificeren van trends insocial media gekozen doordat ze passen bij desurveydata. Wat nodig zou zijn, is een onaf-hankelijke evaluatie van trends.”

Hypotheses testenCouper vervolgt: “Met het koppelen op con-ceptueel niveau bedoel ik het testen van hypo-theses in beide databronnen (surveys en socialmedia). Bijvoorbeeld: is een relatie tussenhouding en gedrag hetzelfde wanneer dezewordt gemeten in een survey als wanneer dezewordt gemeten in social media? Ook kan erniet alleen naar trends van losse indicatorsin social media worden gekeken, maar naarassociaties zoals: sturen mensen die over eenbepaald onderwerp tweeten ook tweets overeen ander onderwerp?”

Beperkte groep TwitteraarsCouper: “Surveyresponses zijn ook op indi-vidueel niveau te koppelen aan persoonlijkeberichten op social media. Maar dat is nietmakkelijk. Op basis van surveydata weten wewie Twitter-gebruikers zijn, maar niet wat zeop Twitter posten. En binnen een groep res-pondenten maakt vaak slechts een beperktegroep gebruik van Twitter.” Zo blijkt bijvoor-beeld uit het LISS panel van CentERdata datde Twitter-populatie verschilt van de gehelepopulatie en jonger is dan gemiddeld. Verderstuurt slechts een deel van de mensen opTwitter zelf actief tweets en heeft men temaken met automatische tweets, Twitterbots,retweets en bedrijfstweets.

Nederlandse bevolking.” In 2013 hadden on-geveer 3,3 miljoen Nederlanders een Twitter-account, van wie minder dan de helft dagelijkstwittert. De gebruikers zijn overwegend jong,hoogopgeleid en van het mannelijk geslacht.Deze niet-representatieve steekproef uit deNederlandse bevolking is volgens Tjong KimSang niet het enige probleem bij het gebruikvan twitter-data voor onderzoek: “Als je in-zoomt op een bepaald onderwerp op Twitter,blijven er meestal weinig bruikbare tweetsover.”De onderzoeker raadt zijn collega’s daaromniet direct aan om twitter te gebruiken alsbron van data voor wetenschappelijk onder-zoek. “Social media lijken mij niet geschiktom statistisch relevante informatie over dehele bevolking uit af te leiden,” zegt TjongKim Sang. “Ze zijn wel interessant om trendsop te pikken. Het Instituut voor NederlandseLexicologie heeft bijvoorbeeld tweets gebruiktom nieuwe Nederlandse woorden te vinden.Dit levert geen compleet plaatje op – niet allenieuwe woorden worden gebruikt op Twitter –maar wel diverse interessante vondsten.” (ER)twiqs.nl

Erik Tjong Kim Sang ontwikkeldeTwiqs, een zoekmachine waarmeeonderzoekers, studenten en anderegeïnteresseerden Nederlandsetweets kunnen analyseren.

Twiqs is het resultaat van het TwiNL, een pro-ject van het Netherlands eScience Center.“Het hoofddoel van dit project was om Ne-derlandse tweets te verzamelen en deze opeen gemakkelijk doorzoekbare manier aan tebieden aan andere onderzoekers,” aldus TjongKim Sang, als onderzoeker verbonden aanhet Meertens Instituut. Tweets bevatten naastde feitelijke inhoud ook metadata die waar-devol kunnen zijn voor onderzoek, zoals dagen tijdstip van versturen, informatie over deafzender en hashtags, die een aanwijzing kun-nen geven over het onderwerp.

Twitter-data voor onderzoek“Zelf hebben we ook gezocht naar informatiedie uit deze tweets te halen was, bijvoorbeeldeen voorspelling van een verkiezingsuitslag.De resultaten daarvan waren acceptabel, maartweets zijn geen goede afspiegeling van de

E-DATA&RESEARCH oktober 2014 3

Twitter onder de loep

Trends oppikken Voor de Volkskrant bracht Tjong Kim Sang met behulp vanTwiqs het humeur van de Nederlandse twitteraar per gemeente en per provinciein kaart. Hiervoor maakte hij gebruik van een eigenhandig samengestelde lijst metpositieve en negatieve woorden. Deze afbeelding laat het gemiddelde sentimentvan tweets per gemeente zien voor november 2013. Tjong Kim Sang liep ook hiertegen een beperking aan van het gebruik van tweets als databron: Limburg enVlaanderen kwamen opvallend somber uit de bus - waarschijnlijk door het ontbrekenvan typische dialectwoorden in de lijst. bron de Volkskrant

Het is verleidelijk om social media in te zetten voor onderzoeks-

doeleinden, maar hoe doe je dat op een verantwoorde manier?

Lees mee met twee ervaringsdeskundigen.

Marika de Bruijne en Erica Renckens

Mick Couper,Research Professor aan Michigan University:

‘Minder hype enmeer hypothesen’

Erik Tjong Kim Sang,onderzoeker bij het Meertens Instituut:

‘Interessant omtrends op te pikken’

10 mln voor nieuw MIT-labTwitter stimuleert ook zelf actief hetgebruik van tweets voor wetenschappelijkonderzoek. Op 1 oktober maakte hetbedrijf bekend 10 miljoen dollar teinvesteren in een nieuw lab aan MIT,het Laboratory of Social Machines.Onderzoekers in het lab krijgen volledigetoegang tot de real-time stroom aantweets en tot het gehele archief vanaf debegindagen van Twitter.Op basis daarvan zullen zij nieuwe techno-logieën ontwikkelen die wijs kunnenworden uit de semantische en socialepatronen in de online mediaberichten opTwitter en andere media.

Meest blije gemeenten:• Schiermonnikoog• Reusel-De Mierden

Minst blije gemeenten:• Simpelveld• Vaals

0 - 5 neutraal

5 - 10

10 - 15

15 - 20

20 - 25

25 - 30 opgewekt

Page 4: E DATA RESEARCH oktober Twitteronderdeloep · in kaart. Hiervoor maakte hij gebruik van een eigenhandig samengestelde lijst met ... van typische dialectwoorden in de lijst. brondeVolkskrant

–––––––––––––––––––––––––––

Huygens ING• Naoorlogs emigratiebeleid in Nederland

1945-1967

Deze online onderzoeksgids toont personen,overheidsinstellingen en particuliere orga-nisaties die betrokkenzijn bij zowel het Ne-derlandse emigratie-bestel als bij de (be-leids)processen rondomemigratie en de daarop-volgende immigratie inhet land van bestem-ming. Via 367 gestan-daardiseerde beschrij-vingen zijn de taken,onderlinge verhoudin-gen en archieven ge-analyseerd van instel-lingen en personen inNederland, Australië enCanada en van enkele internationale organi-saties. In 225 gevallen zijn de archivalia na-der toegankelijk gemaakt.resources.huygens.knaw.nl/emigratie

Ook sinds kort beschikbaar:• Dagboekjaren 1831-1844 van Willem deClercq. De digitale scans van dezedagboeken werden door deUniversiteitsbibliotheek van Amsterdam voordit project beschikbaar gesteld.http://resources.huygens.knaw.nl/dagboekdeclercq• Website VOC Kenniscentrum. De websiteinformeert een ruim publiek op hoofdlijnenover allerlei aspecten van de VOC. Het KITLVheeft besloten de hosting en het beheer vande content aan het Huygens ING over tedoen.huygens.knaw.nl/website-voc-kenniscentrum-naar-huygens-ing

Deze publicaties zijnbeschikbaar via www.historici.nl.Bezoek deze site of scan de QRcode.

4 oktober 2014 E-DATA&RESEARCH

SINDS KORT BESCHIKBAAR

attitudes towards immigration: A vignetteexperiment on visa applications• Adams, B.G.; Vijver, F. van de, oktober2013, The Association between RelationalOrientation, Sources of identification, Identity,Personality, Culture and Psychological Well-Being in the Netherlands• CentERdata, mei 2014, Personality - Wave 2• CentERdata, juni 2012, Work andSchooling – Wave 1

Deze bestanden zijn kosteloosbeschikbaar via www.lissdata.nl/dataarchive. Bezoek deze siteof scan de QR-code

Dit overzicht toont databestanden die recent beschikbaar zijn gekomen bijCentERdata, Data Archiving and Networked Services en Huygens ING.

CentERdata• World Values Survey

In december 2012 is de Nederlandse versievan de World Values Survey (WVS) afgeno-men in het LISS panel, in opdracht van BiPuranen, secretaris-generaal van de WorldValues Survey Associatie. Het hoofd-onderzoek van de WVS vindt wereldwijdplaats in een groot aantal landen. Deze lon-gitudinale studie maakt het mogelijk om dewaarden en normen tussen landen te verge-lijken en om de verandering daarvan te me-ten. De uitgebreide dataset bevat onder-werpen zoals sociaal leven, maatschappe-lijke waarden en vertrouwen, religie, media-gebruik, politiek, opvoeding, gezinslevenen werk. De data van de Nederlandse versiezijn beschikbaar via het LISS panel.worldvaluessurvey.org

Ook sinds kort beschikbaar:Studies LISS panel• Jonge, J. de, juni 2013, Consumer hetero-geneity with respect to morality in consumptiondecisions and perceptions of animal welfare -Part 3• Prather, L.R., december 2013, FightingPoverty at Home and Abroad: Explaining Attitu-des Towards Poverty Assistance Programs• Meuleman, R.; Lubbers, M., september 2013,Nationalism and the national dimension ofcultural consumption - Wave 2• Zijlstra, R.; Delbaere, K.; Kempen, R., maart,april/mei, juni 2013, Validation of threemeasures for fall prevention research amongolder people - Wave 1-2• Hosch-Dayican, B.; Aarts, K.; Dassen, A.;Amrit, C., oktober 2013, Calibrating TwitterData: Issue Salience and Issue Ownership inSocial Media and in Surveys• Velden, P.G. van der; Bosmans, M.W.G.;Knaap, L. van der, april/augustus/december2012, Coping self-efficacy after potentialtraumatic events - Wave 1-3• Kalmijn, M., juli/augustus 2013, Life HistoryQuestionnaire - Wave 2• Pieters, R.; Leenheer, J., juni/september/december 2013, maart 2014, Tilburg ConsumerOutlook Monitor• CentERdata, februari/maart 2013, SocialIntegration and Leisure - Wave 6• CentERdata, december 2013, januari 2014,Politics and Values - Wave 7• CentERdata, november/december 2013,Health - Wave 7Studies Immigrant panel• Stupar, S.; Vijver, F. van de, augustus 2013,A Study on Underlying Motivation of EmotionalSuppression in Immigrants and Main-streamers in the Netherlands• Bekhuis, H.; Lubbers, M., september 2013,Migrants National Identification and theNational Dimension of Cultural Consumption• Lelkes, Y.; Iyengar, S., januari 2014,Understanding the underpinnings of immigrant

Achterblijvers opde kade zwaaiennaar de vertrek-kende familie opde boot creditSpaarnestad Foto

Release 2013.01.urn:nbn:nl:ui:13-iy19-ze• Sijs, Prof. Dr. N. Van der (MeertensInstitute) (2014-05-01), Collectie kaartenbehorende bij de Kaartenbank.urn:nbn:nl:ui:13-an8o-3tArcheologie• Bakker, A.M. (Archeodienst BV) (2014-04-01), Plangebied Vindicat, Grote Markt teGroningen.urn:nbn:nl:ui:13-87jq-el• Kremer, drs. H. (Synthegra BV); Leuvering,drs. J.H.F. (Synthegra BV) (2014-07-08),Natuurontwikkeling IJzerhorst te Vierakker;Bureauonderzoek en inventariserendveldonderzoek, karterend booronderzoek.urn:nbn:nl:ui:13-ozqz-wwRuimtelijke Wetenschappen• Kadaster (2013-11-30), TOP25Raster,digitaal topografisch bestand - versienovember 2013. urn:nbn:nl:ui:13-o0n5-f2• NIROV (2008), Verwijzing naar de data van:Nieuwe Kaart van Nederland.urn:nbn:nl:ui:13-ucm-7lj

Via easy.dans.knaw.nl zijndeze bestanden beschikbaar.Bezoek deze site of scan deQR code.

Landen waar de WVS ooit is afgenomencredit WVS

–––––––––––––––––––––––––––

DANS• Zonnen op Gods akker

De gemeente Dordrecht heeft archeologischonderzoek gedaan naar een laatmiddel-eeuws nederzettingsterrein. Het gaat om devermoedelijke resten van het dorp Kruis-kerke/Wolbrandskerke dat op de zuidoevervan de Dubbel lag en tijdens de St. Elisa-bethsvloed van 1421 is verlaten en onderwater kwam te staan. De resultaten van ditopgravingsproject zijn nu beschikbaar inhet online archiveringssysteem EASY. Zon-nen op Gods akker, archeologisch onder-zoek van een laatmiddeleeuws nederzet-tingsterrein. Plangebied Gezondheidspark,Gemeente Dordrecht, T.H.L. Hos en M.C.Dorst, 2010.

Ook sinds kort beschikbaar:Sociale Wetenschappen• Heijting, Dr.ir. S. (Wageningen UR (WUR))(2013-06-21), Weed count data Heijting et al.urn:nbn:nl:ui:13-gx2r-8l• Veldwijk, Drs. J. (2014-09-03), The effect ofincluding an opt-out option in discrete choiceexperiments.urn:nbn:nl:ui:13-5ovx-16• Hillebrink, C. (NWO-MaGW) (2013-03-03),Onderzoek Publicatieculturen NWO-MaGW.Onderzoek naar de verschillen in publicatie-culturen tussen de disciplines van het NWOgebied Maatschappij- en Gedragsweten-schappen.urn:nbn:nl:ui:13-oj3x-blHistorische Wetenschappen• Historical Sample of the Netherlands (2013-08-31), Data Set Linking Historical Lives (LHL)

11 - 15 oktober • GironaArchives and Cultural IndustriesDeze conferentie is een bundeling vanbijeenkomsten, waaronder de Euro-pese conferentie van de InternationalCouncil on Archives (ICA) en eengerenommeerd seminar op het gebiedvan beeldcollecties.girona.cat/web/ica2014/eng

22 - 23 oktober • BrusselConferentie Alliance of PermanentAccess (APA)Tijdens deze conferentie wordt hetAPA-‘Centre of Excellence’ (CoE) ophet gebied van digitale duurzaamheidgelanceerd. De diensten en tools dieonderdeel zijn van het CoE zijn ontwik-keld in EU-projecten, zoals APARSENen SCIDIP-ES.alliancepermanentaccess.org

30 oktober • HilversumStudiedag Webarchivering inNederlandWat wordt er verzameld en door wie?Welke tools worden gebruikt en zijn degearchiveerde websites ook toeganke-lijk voor onderzoekers? Deze vragenkomen aan bod tijdens deze studiedag.ncdd.nl/studiedagwebarchivering

3 - 8 november • LimassolInternational Conference onCultural HeritageConferentie die zich richt op onderzoekop het gebied van restauratie, conser-vering en toegang tot cultureel erfgoed,ook in digitale vorm.culturalheritage2014.eu

5 - 7 november • BerlijnEVA: Electronic Media andVisual ArtsAl meer dan 20 jaar worden de EVA-conferenties georganiseerd. Ze richtenzich voornamelijk op het gebruik vanmultimediatechnieken in onderzoek enanalyse en de uitwisseling van kennistussen erfgoedinstellingen en ontwik-kelaars van technologie.eva-berlin.de/en/eva-berlin.html

8 - 9 december • Den HaagExploring historical sourceswith language technologyTijdens deze workshop staat het toe-passen van taaltechnologie bij hetanalyseren van historische tekstuelebronnen centraal. Huygens ING isgastheer van deze workshop.clarin.eu/events/2014

28 - 29 januari • UtrechtTHATCamp UtrechtThe Humanities and Technology Campis een ‘unconference’. Het is een openen informele bijeenkomst waarin gees-teswetenschappers en ICT-ers samen-komen en bespreken hoe technologieingezet kan worden om onderzoek teondersteunen.utrecht.thatcamp.org/

29 januari en 12 maart • online, Delften Den HaagCursus Essentials 4 Data SupportEssentials 4 Data Support is een intro-ductiecursus voor diegenen die onder-zoekers (willen) ondersteunen bij hetopslaan, beheren, archiveren en delenvan hun onderzoeksdata.datasupport.researchdata.nl

AGENDA

Baksteenfundering van de toren en dewestmuur van de middeleeuwse kerkcredits gemeente Dordrecht, bureau Monu-mentenzorg en Archeologie

Page 5: E DATA RESEARCH oktober Twitteronderdeloep · in kaart. Hiervoor maakte hij gebruik van een eigenhandig samengestelde lijst met ... van typische dialectwoorden in de lijst. brondeVolkskrant

Vanaf 2015 werkt CLARIAH

aan de ontwikkeling van een

digitale infrastructuur voor

geesteswetenschappers.

De voorbereidingen daarvoor

zijn momenteel in volle gang.

Erica Renckens

“Vanaf 1 januari mogen we geld uitgeven,maar voor het zover is, moet er nog heel watoverlegd worden over hoe we dat precies gaandoen,” aldus prof. dr.Lex Heerma van Voss,die als directeur vanhet Huygens INGhoofdaanvrager is vanCLARIAH. Begin dezezomer kreeg CLARIAH(Common Lab Re-search Infrastructurefor the Arts and Huma-nities) een NWO-subsi-die van twaalf miljoeneuro voor het ontwik-kelen van een digitale infrastructuur waaringeesteswetenschappers grote databestandenkunnen interpreteren en ontsluiten.

Voor alles van nutHet is de tweede keer dat het consortium vangeesteswetenschappelijke onderzoeksinstel-lingen de CLARIAH-aanvraag indiende. “Deeerste keer kregen we als commentaar datonze inzet op de gehéle geesteswetenschappente breed was,” vertelt Heerma van Voss.“Daarom hebben we nu de focus gelegd opdrie deelgebieden: taalkunde met overwegendtekstuele data, mediastudies met audiovisuelebronnen en sociaal-economische geschiedenismet gestructureerde databestanden, data-bases.” Alle drie de vakgebieden zijn al voor-loper in de Digital Humanities – een wel-overwogen keuze. “Deze typen bronnen wor-den ook door andere geesteswetenschappe-lijke disciplines gebruikt. We hebben deverantwoordelijkheid voor de hele breedtevan de geesteswetenschappen, dus wat wegaan maken, moet in principe voor alle disci-plines van nut zijn.”

“Taalkundigen kunnen bijvoorbeeld al heelgoed teksten automatisch parsen,” geeftHeerma van Voss als voorbeeld van een toe-passing die breed inzetbaar is. “Nu willen his-torici of letterkundigen meestal niet speciaalweten of iets een lidwoord of een werkwoordis, maar zo’n techniek is wel een middel omgrip te krijgen op een tekst. Je ziet steedsmeer onderzoeken waar een parser wordt ge-bruikt om historische of letterkundige vragente kunnen beantwoorden.”

Lab voor geesteswetenschap“Net als in CLARIN zullen we bij CLARIAHcalls uitschrijven waarin onderzoekers aan-vragen kunnen indienen. We willen wetenwaar de geesteswetenschappers behoefte aan

hebben, dus we vragen mensen om zelf metvoorstellen te komen voor nieuwe datasets ofnieuwe tools om databestanden mee te ont-sluiten.” Toch zullen er ook verschillen zijnmet CLARIN. “In CLARIN zijn voornamelijklosse demonstrators gemaakt,” constateertHeerma van Voss. “Ik denk dat wij meer op-schuiven naar een labsituatie, een volledigeproductieomgeving voor onderzoekers.”In de naam CLARIAH is niet alleen ‘CLA-RIN’, maar ook ‘DARIAH’ te herkennen, beidegrote Europese onderzoeksinfrastructuren –het eerste voor taalkundigen, het andere voorhistorici. “Nederland heeft een voortrekkers-

rol in CLARIN. InDARIAH minder, al isNederland ook daaractief in. CLARIAH zalzowel in CLARIN alsDARIAH de Neder-landse bijdrage leve-ren.” Daarnaast ver-bindt CLARIAH ookNederlandse deelpro-jecten, als CLIO-Infra,Nederlab en EUScreen.

Eisen aan metadataGoede afspraken omtrent metadata zijn voorzo’n brede samenwerking onontbeerlijk.“Daar zullen we het dit najaar – en ongetwij-feld gedurende het hele project – veel overmoeten hebben,” beaamt Heerma van Voss.“Het is best ingewikkeld om tussen al diegeesteswetenschappelijke disciplines te com-municeren. CLARIN heeft eisen gesteld aanhoe de metadata eruit moeten zien. We zijn ernog niet over uit of het zin heeft die regelsgeesteswetenschappelijk breed voor te schrij-ven. In ieder geval streven we de interopera-biliteit ook internationaal na.”

“De demonstrators van CLARIN toonden aanwaar onderzoekers in het veld behoefte aanhadden; daar werden standaarden voor ont-wikkeld. Die standaarden zijn nog altijd volopin ontwikkeling. Deze revolutie zal ook door-zetten als CLARIAH niet gefinancierd zou zijn,maar nu hebben we in Nederland de moge-lijkheid hier goed mee om te gaan en daar eenstructuur voor aan te bieden.”

Een grote vlucht“Ik denk dat over vier jaar elke student eencursus Digital Humanities volgt,” voorspeltHeerma van Voss. “Niet omdat wij dat willen

of geven, maar omdat steeds meer mensen erde mogelijkheden van inzien. We hebben ver-schillende onderzoeksscholen onze aanvraaglaten lezen en gevraagd hoeveel van hunpromovendi gebruik zouden maken van eendergelijke infrastructuur. Momenteel zou datzo’n veertig procent zijn, maar ze gaven alle-maal aan dat dit op korte termijn een nog veelgrotere vlucht zal nemen.”

Bij het onderzoeksinstituut van Heerma vanVoss zelf, het Huygens ING, is de geestes-wetenschappelijke revolutie al voelbaar. “Wij

houden ons veel bezig met het maken vantekstedities. We wisten precies hoe dat moest;daar waren gewoon regels voor. Maar dedigitale revolutie maakt dat alle basale han-delingen voor geesteswetenschappers in be-weging zijn: welke informatie is beschikbaar,hoe vind ik die, hoe bevraag ik de data, hoelaat ik de resultaten zien, hoe zorg ik dat allesteruggevonden kan worden. Ook al heb je eenbriljant idee, je kunt niet zeggen ‘Voortaangaan we het zó doen.’ Alle relevante spelerswerken mee aan CLARIAH, zodat we preciesweten waar onderzoekers behoefte aan heb-ben.”CLARIAH heeft voor vier jaar subsidie gekre-gen. Wanneer kan gesproken worden over eengeslaagd project? “We hebben natuurlijkbeloofd een infrastructuur te ontwikkelen diein de drie gebieden relevant is,” aldus Heermavan Voss. “Maar ik zou het echt een succesvinden als we iets maken waardoor ook an-dere geesteswetenschappelijke disciplineszeggen: ‘Oké, dit is zo interessant, dit ga ikook gebruiken.’”

clariah.nl

E-DATA&RESEARCH oktober 2014 5

Prof. dr. Lex Heerma van Voss foto Bart van Vliet

Moral panic over prostitutieOok voor zijn eigen onderzoek ziet Prof. dr. Lex Heerma van Voss de mogelijkheden van deCLARIAH-infrastructuur. Hij onderzoekt arbeidsomstandigheden wereldwijd. “Ik heb bijvoor-beeld een artikel geschreven over prostitutie. Rond 1900 en rond 2000 zie je een vergelijkbareomslag in het denken over prostitutie: van gereguleerd en geaccepteerd naar verbieden van-wege dwang en slavernij. Inmiddels weten we uit literatuurstudies dat de moral panic van eeneeuw geleden overdreven was, maar daaruit kun je natuurlijk niet concluderen dat dat nu weerzo is. Er blijken veel variabelen een rol te spelen in dit verhaal, meer dan ik als mens kan over-zien. Met de data die we nu in CLARIAH verzamelen, heb ik een veel betere set in handenwaarmee ik variabelen als ‘mate van migratie’ en ‘vrijheid van de vrouw op plek van herkomst’beter in de vingers kan krijgen.”

‘Oké, dit iszo interessant,

dit ga ikook gebruiken’

Prof. dr. Lex Heerma van Voss, directeur Huygens ING en hoofdaanvrager CLARIAH:

‘CLARIAH biedt structuur aande digitale onderzoeksrevolutie’

INTERVIEW

Page 6: E DATA RESEARCH oktober Twitteronderdeloep · in kaart. Hiervoor maakte hij gebruik van een eigenhandig samengestelde lijst met ... van typische dialectwoorden in de lijst. brondeVolkskrant

Tilburg University maaktonderzoeken levensecht meteen augmented reality lab.Een bijzondere eigentijdseonderzoeksmethode voor.Marika de Bruijne

“Om interactief onderwijs aan tebieden en nieuwe onderzoeksideeënte stimuleren, is een augmentedreality lab ideaal”, zegt hoogleraarCognitieve Psychologie en Kunst-matige Intelligentie en bedenker vanhet initiatief Max Louwerse van hetTilburg Center for Cognition andCommunication (TiCC).

ToverstafEen augmented reality lab combi-neert de voordelen van een in-situervaring met die van een laborato-rium. “Ons DAF Technology Labbrengt de werkelijkheid naar hetlaboratorium. In een ruimte van ne-gen bij negen meter projecteren weeen virtuele wereld op de vier wan-

den. Door een 3D-bril te dragen, ver-dwijnen de grenzen tussen de fy-sieke en virtuele wereld en ontstaateen ‘augmented reality’. Maar ookzonder zo’n bril wordt een verge-lijkbare ervaring gecreëerd. Met een

speciale ‘toverstaf’ kan de gebruikervervolgens interacteren met de vir-tuele wereld. Zijn of haar gedragwordt opgenomen door verschil-lende camera’s en microfoons. Naastde 3D-brillen beschikken we ook

over geavanceerdere virtual reality-brillen. Deze zogenoemde OculusRift Head-Mounted Displays zorgenervoor dat gebruikers zich volledigopgenomen voelen in een virtuelewereld en daarin vrij bewegen.”

OnbeperktLouwerse vertelt verder: “Het ideevoor het lab ontstond mede door dewens om een virtuele rechtszaal tebouwen. Maar evengoed kan hetlab gebruikt worden door anderesociale, medische of geestesweten-schappers. Bij economie kun jedenken aan een onderzoeksvraagals ‘hoe meet je stress in directie-kamers?’, bij psychologie aan ‘hoecreëer je een zo kindvriendelijk mo-gelijke onderzoeksomgeving?’en bijmedische psychologie kun je onder-zoeken hoe dokter-patiënt interactiesin ziekenhuizen werken. De toepas-singsmogelijkheden zijn onbeperkt.”Kennis over het meten van hetgedrag is op zijn universiteit al op

grote schaal aanwezig, stelt Lou-werse. “Die is ook nodig om de tech-nologie van het lab goed te kunnenbenutten”, voegt hij toe. Wat hijgraag meer wil zien, is interdiscipli-naire samenwerking, iets wat het labhopelijk aan zal wakkeren. “Het labcombineert onderwijs en onderzoekdoor research-based learning, ver-hoogt interdisciplinair onderzoek enonderwijs, biedt iets anders aan dande standaard hoorcolleges en maaktde link naar technologie”, somt hijenthousiast op. Hij ziet uitbreidingennaar meer wearable computing, sen-sormetingen en andere toepassingenal voor zich.

Het DAF Technology Lab opentzijn deuren in 2015. Onderzoekersdie van het lab gebruik willenmaken, kunnen contact opnemenmet projectcoördinator RebeccaScholte of hoogleraar MaxLouwerse van Tilburg University.tilburguniversity.edu

6 oktober 2014 E-DATA&RESEARCH

De fysieke en de virtuele wereld versmelten. Studenten staan eerst ineen virtuele rechtszaal die vervolgens in een operatiezaal wordt omgeto-verd credit WorldViz/Tilburg University

Hoe zijn diverse soorten

data zo te combineren,

dat dit tot interessante

nieuwe observaties

leidt? Carlijn Hageraats

zocht het uit.

Heidi Berkhout

“Archeologie is in Udhruh promi-nent aanwezig in het landschap. Delokale bevolking weet wat er te vin-den is en waarvoor de objecten inhet verleden gediend hebben. Voorhet Udhruh Oral History-projectnam ik interviews af met de lokalebevolking.Terug in Nederland ging Carlijn aande slag. “Ik stelde woordenlijstensamen: één met informatie uit be-staand archeologische onderzoeken één met informatie uit de inter-views. In Simple Knowledge Orga-nisation System (SKOS), een data-model om kennissystemen te kop-pelen, kende ik labels toe aanindividuele concepten: een prefer-red label voor de voorkeursterm(bijvoorbeeld ‘Romeins legionairfort’), alternative labels voor alter-natieve benamingen (zoals ‘fort’ of‘verdedigingswerk’) en hidden labelsvoor woorden die liever niet gezienworden, zoals woorden die verkeerdgespeld zijn.”

Close matchVervolgens legde Carlijn met SKOSverbanden tussen de verschillendeconcepten. “Met broader en narro-wer worden hiërarchische relaties

aangeduid, bijvoorbeeld tussen hetfort en de objecten waar dit uitbestaat. Het fort is groter dan destenen waar het uit bestaat, en eensteen is kleiner dan het hele bouw-werk. Met related worden associa-tieve, niet-hiërarchische relatiesaangeduid, bijvoorbeeld tussen hetfort en de wachttorens op nabij-gelegen heuvels. Uiteindelijk krij-gen archeologie en oral history iederhun eigen conceptschema metcentrale concepten en onderlingerelaties.” Vervolgens worden beideconceptschema’s met elkaar ver-

bonden door de relaties tussen deonderliggende concepten in kaart tebrengen. De laatste stap is het aan-maken van een semantic repository,waarin de woordenlijst en een lijstmet getagde documenten geüploaden doorzoekbaar gemaakt worden.

Interdisciplinair zoekenMet deze manier van werken wordtbereikt dat bestanden doorzochtkunnen worden vanuit twee disci-plinaire invalshoeken. Carlijn sluitaf: “Een zoekopdracht op ‘fort’ of‘verdedigingswerk’, leidt tot docu-

menten uit de archeologie die hieropbetrekking hebben, maar ook totinterviews met de lokale bevolkingdie hierover gaanen waarin hetconcept met an-dere bewoordingwordt aangeduid.Hierdoor kunnener verbanden ge-legd worden tus-sen twee ‘verschillende talen’; delokale kennis en de wetenschappe-lijke kennis, wat het begrip en hetsamenwerken tussen beide discipli-

nes vergemakkelijkt. Ik verwachtdat deze methode verder te ontwik-kelen is tot een algemeen toepas-

baar concept inde combinatievan oral historyen archeologie,wat het aantrek-kelijker maaktom oral historyfrequenter te ge-

bruiken samen met archeologischonderzoek.”projects.commonsites.net/nl/project/677/

Carlijn HageraatsCarlijn Hageraats, studenteErfgoedstudies (Universiteit vanAmsterdam), Archeologie(Universiteit Leiden) en stagiairebij DANS, onderzocht decombinatie van oral history enarcheologisch onderzoekbinnen het Udhruh Oral History-project.Dit project is onderdeel van hetin 2011 gestarte UdhruhArchaeological-project, eensamenwerkingsverband tussende Universiteit Leiden en de Al-Hussein Bin Talal University inJordanië.Het resultaat staat in haarmasterscriptie: ‘Who saysmyths are not real? Looking atarchaeology and oral history astwo complementary sources ofdata.’

Stagiaire Carlijn Hageraats (links) aan het werk bij het Ottoman-fort foto G. Gazenbeek

Augmented reality lab versmelt fysieke en virtuele wereld

Levensecht onderzoeken in Tilburg University

Fort, kasteel of verdedigingswerk?JONG TALENT

‘Lokale kennismeegenomen

in archeologischonderzoek’

Page 7: E DATA RESEARCH oktober Twitteronderdeloep · in kaart. Hiervoor maakte hij gebruik van een eigenhandig samengestelde lijst met ... van typische dialectwoorden in de lijst. brondeVolkskrant

E-DATA&RESEARCH oktober 2014 7

“Materialen uitgeven op eenmanier die nu relevant is.Dat is waar het om gaat.”Lex Heerma van Voss verteltover het ontsluiten vanNederlandse databronnen.Ilja Nieuwland

Samen met het Nationaal Archiefontsluit het Huygens ING de ko-mende vijf jaar drie belangrijkeNederlandse databronnen online: deNederlandse oorkonden van vóór1500, de Generale Missiven (jaar-lijkse rapporten vanuit Batavia aanhet bestuur van de Verenigde Oost-Indische Compagnie) en de Resolu-ties van de Staten-Generaal (de ver-slaglegging van behandelde zakentijdens de vergaderingen van 1576tot 1796).Heerma van Voss, directeur van hetHuygens ING: “Wat ik boeiend vind,

is dat ik als student geschiedenisregels moest leren die uitontwikkeldwaren, die al tachtig jaar als normvoor historici werden gehanteerd.Nu is dat allemaal in beweging; hetis belangrijk om heel erg interes-sante materialen uit te geven op eenmanier die nu relevant is, die hetstellen van nieuwe vragen toelaat.In eerste instantie worden scans vande databronnen online gezet. Datverhoogt de toegankelijkheid alenorm. Vervolgens worden, naastandere technieken, vrijwilligers in-gezet bij de basistranscriptie van deGenerale Missiven en de Resoluties.Dit schrift is goed leesbaar. Je kuntje voorstellen dat zij voor het slapeneven een Resolutie transcriberen.”

Echte uitdagingDe grootste mogelijkheid tot inno-vatie ziet Heerma van Voss in de

ontsluiting van de Resoluties. Voor-lopers van het instituut zijn al voor1910 aan de editie begonnen.Inmiddels is de periode tot 1630ontsloten, met behulp van nieuwetechnieken kan dat tempo behoorlijkworden opgeschroefd. In eerste in-stantie gebeurt dat door gescandepagina’s ter beschikking te stellenaan onderzoekers.

EditeerwerkMaar de échte uitdaging ligt in hetediteerwerk. Huygens ING-senior-onderzoeker Ida Nijenhuis: “HetNationaal Archief verstrekt de ge-scande pagina’s van de Resoluties;wij zorgen voor verdere ontsluiting.In eerste instantie vinden twee pilotsplaats: één met handschriftherken-ning, waarvoor de samenwerkingmet de Rijksuniversiteit Groningenis gezocht, en één waarin, in samen-

werking met partners in Polen, ge-tracht wordt karakterherkenning toete passen op de gedrukte uitgavenvan de Resoluties. We zijn nog nietzover, maar uiteindelijk willen wealles online ontsluiten.”

resources.huygens.knaw.nl

Pagina uit gedrukte Resolutienvan de Hoogh Mogende Heerender Vereenighde Nederlanden,1740 credit Nationaal Archief

Oorkonden en resolutiesuit 15e en 16e eeuw online

Nederland week lang internationaal toneel voor onderzoeksdata

4e plenaire bijeenkomstResearch Data Alliance

500 Wetenschappers en data-experts uit vele landen en zomogelijk nog meer disciplines kwamen van 22 tot 24 septem-ber naar Amsterdam voor de vierde plenaire bijeenkomst vande Research Data Alliance (RDA). Een keynotespreker sugge-reerde dat binnenkort een wetenschappelijk artikel een bijlagezal zijn bij de onderzoeksdata in plaats van andersom. Maartechnisch, organisatorisch en juridisch moet er nog veelgebeuren – dus ook in de vele werkgroepen van de RDA.De resultaten van de conferentie staan op rd-alliance.org.tekst en foto’s Inge Angevaare

CLAPOP toontresultaten CLARIN-NL

CLARIN-NL heeft alle data entools die de afgelopen jaren bin-nen het project zijn ontwikkeld,samengebracht in CLAPOP.Via deze portal hebbenonderzoekers met één logintoegang tot alle resultaten vanhet project dat komend voor-jaar zal worden afgerond. Degebruiker kan filteren op onderandere vakgebied, taal enfunctionaliteit, zodat relevantedata en tools worden voor-gesteld. Ingelogde gebruikershebben toegang tot dezebronnen en kunnen in contactkomen met collega’s die ookgebruikmaken van de CLARIN-infrastructuur. (ER)dev.clarin.nl

Digital Humanitiescursussen op een rijEén interactief overzicht metalle cursussen Digital Humani-ties die aan Europese universi-teiten worden gegeven. Dat isDODH (Dutch Overview ofDigital Humanities), een onlineapplicatie ontwikkeld doorCLARIAH en DARIAH EU.Geïnteresseerden kunnen dedatabase doorzoeken op loca-tie en opleidingsniveau, waarnade cursussen op de kaart wor-den weergegeven. Momenteelis het overzicht voor Neder-land, Vlaanderen en Duitslandzo goed als compleet; gebrui-kers kunnen zelf ontbrekendecursussen toevoegen. Binnen-kort verschijnt er ook een over-zicht van lopende en afgerondeprojecten op het gebied vanDigital Humanities in Europa.(ER)clariah.nl/en/dodh

DSA-seal voor DNBHousehold Survey

Het internationale datakeur-merk Data Seal of Approval(DSA) is toegekend aan deDNB Household Survey (DHS).De DHS is een longitudinaalonderzoek over psychologi-sche en economische aspec-ten van spaargedrag en wordtsinds 1993 afgenomen in hetCentERpanel van CentERdata.Naast het bestuderen van fi-nancieel gedrag, worden dedata ook gebruikt om anderestudies te verrijken. De data-sets bevatten informatie overwerk, pensioen, wonen, hypo-theken, inkomen, bezittingen,leningen, gezondheid, econo-mische en psychologische con-cepten en persoonlijke eigen-schappen. Het keurmerk geeftaan dat de DHS-data op eenbetrouwbare wijze wordenontsloten en bewaard. Om delangetermijnopslag te garande-ren, wordt samengewerkt metDANS. (MdB)dhsdata.nl

KORT

Page 8: E DATA RESEARCH oktober Twitteronderdeloep · in kaart. Hiervoor maakte hij gebruik van een eigenhandig samengestelde lijst met ... van typische dialectwoorden in de lijst. brondeVolkskrant

Hoe haal je de banden tus-sen Wikipedia en de Neder-landse erfgoedwereld aan?Wikipedia’s Hay Kranen trokeen jaar geleden in bij hetNationaal Archief en deKoninklijke Bibliotheek.En nu zwaait deze eersteNederlandse Wikipedian-in-Residence weer af.Steven Claeyssens

Hij bracht Wikipedianen naar bibli-otheek en archief en gaf aan archi-varissen en bibliothecarissen meerdan tien Wikipedia-workshops.Maar hij deed nog veel meer. Kra-nen is trots op wat er is bereikt.“Gaandeweg ontdekte ik dat ik er opeen tweeledige manier in stond: eenevangeliserende en een pragmati-sche. Het eerste is beter geslaagd,dan het laatste.”

90.000 views“We hebben veel gedigitaliseerd Pu-bliek Domein-materiaal van het NAen de KB toegevoegd aan Wiki-media Commons.” En uit alles blijktdat van de vele scans van Neder-lands historisch erfgoed duchtig ge-bruik gemaakt wordt. Enthousiast:“Het interessantst vond ik het VOC-materiaal uit de Atlas of MutualHeritage. Een kaart uit deze collec-tie sierde intussen al de hoofd-pagina van de Duitse Wikipedia enkreeg daar in één dag maar liefst90.000 views.”

Dat enorme bereik raakt aan de kernvan Kranens evangeliserende mis-sie: “In elke lezing of cursus voormedewerkers wees ik erop dat maaréén procent van de Nederlandsebevolking gebruikmaakt van eenbibliotheek voor het opzoeken vanfeitelijke informatie. Mensen zoe-

ken informatie op Wikipedia of an-dere digital native-projecten, nietin de bibliotheek. Die boodschapkwam bij sommigen toch nog hardaan, maar het is wel de realiteit.”Die digitale realiteit is volgens Kra-nen nu wel doorgedrongen. Daar-naast zijn er ook de nodige plannengesmeed om de verse banden tussenWikipedia en de bibliotheek en hetarchief te bestendigen. Bovendiengingen intussen ook bij andereNederlandse erfgoedinstellingenWikipedians-in-Residence aan deslag.

Interessante dingenWat wetenschappers met de Wiki-projecten kunnen? “Veel. Ik ont-moet regelmatig onderzoekers die

8 oktober 2014 E-DATA&RESEARCH

COLUMN

GELEZEN

Onlangs bezocht ik een bij-eenkomst van de Universi-

teitsbibliotheek Leiden over ‘Di-gital Scholarship and the Role ofthe Library’.Een van de conclusies van de bij-eenkomst was dat academischebibliotheken studenten en onder-zoekers in de e-humanities betermoeten leren omgaan met digitalehulpmiddelen om patronen ingrote datacollecties te ontdekken.De toverwoorden die hierbij ho-ren zullen de meeste lezers vandit blad bekend zijn. Men heefthet niet over computerprogram-ma’s of software, maar over tools.Die moet je loslaten op een data-set. De meeste datasets zijn zogroot dat onderzoekers ze onmo-gelijk grondig kunnen bekijken.Maar gelukkig kunnen tools auto-matisch patronen uit die data vis-sen – wat distant reading wordtgenoemd. Het liefst vindt menonbekende of nieuwe patronen.Alle aanwezigen, een internatio-naal publiek van zo’n zestig men-sen, konden zich goed in die con-clusie vinden. Wereldwijd steltmen vast dat veel studenten en

onderzoekers slimmer gebruikwillen maken van datasets, maarwelke tools werken het best voorbepaalde taken? En hoeveel toolszijn er eigenlijk?

Dat weet niemand. Nergens iseen overzicht te vinden van

alle tools die zijn of worden ont-wikkeld – althans niet voor degeesteswetenschappen. Institutenkrijgen nauwelijks geld voor hetaanleggen van goede datasets,want subsidiegevers beschouwendat niet als wetenschappelijkwerk. Wel worden er bakken geldgegeven aan het bouwen vannieuwe tools, want daarmee be-geef je je volgens de subsidiege-vers juist in de frontlinie van dewetenschap.Of er elders in de wereld al een

vergelijkbare tool is ontwikkeld,doet niet ter zake. Leiden heeftonlangs een eigen instituut voor e-humanities opgezet, maar werktniet samen met Amsterdam ofUtrecht, waar ze ook dergelijkecentra hebben. In de frontlinie vande geesteswetenschappen knoktieder voor zich – dat is nou een-maal de traditie.Of de tools vaak worden gebruikt,lijkt men niet belangrijk te vinden

– het gaat erom dat ze er zijn.Men ziet het ook niet als taak omze te onderhouden. Ze zijn er, wieze verder wil ontwikkelen kan datdoen. Dat er soms heel weinigdata aan de tool gekoppeld zijn,beschouwt men niet als probleem.In principe zou je er veel data aankunnen hangen.

In de zaal had dit alles, als ik hetgoed heb gezien, een enigszins

verlammend effect. Vele van degedemonstreerde tools waren deaanwezigen onbekend. Ze steldenvragen als: ‘Waarom laat je onsspeciaal deze tool zien voor dezefunctie? Zijn er ook andere be-schikbaar?’ Of: ‘Werkt dit ookvoor andere talen dan het En-gels?’Ik zag iemand fronsen toen een

foto Leo van Velzen

‘Using Linked Data Effectively’,eBook, diverse auteurs.Uitgever: The Open University2013. Gratis via Apple iTunesen euclid-project.euRené van Horik

Er is groeiendebelangstellingvoor het seman-tic web, waarinhet ‘web vandocumenten’

transformeert naar een ‘webvan data’. De onderliggendestandaarden en technieken dievoor deze transformatie nodigzijn, zijn bekend onder de naam‘Linked Data’.Recentelijk verscheen het elek-tronische boek ‘Using LinkedData Effectively’. Dit boek geeftonderzoekers een overzicht vande mogelijkheden van de LinkedData standaarden en technieken.Het boek bestaat uit zes hoofd-stukken over aspecten zoals hetcreëren, het gebruiken en hetbouwen van applicaties op ba-sis van Linked Data. Het bevatfilmpjes met achtergrondinfor-matie bij de informatie.Het boek is ontwikkeld doorEUCLID (EdUcational Curricu-lum for the usage of LInkedData), een Europees projectwaarbinnen kennisoverdrachtaan ‘data-beoefenaars’ centraalstaat. De visie van EUCLID isdat het gebruik van Linked Datahet dagelijks werk van onder-zoekers vergemakkelijkt.EUCLID biedt een combinatievan leermiddelen en activiteitenzoals eBooks, webinars entrainingen. Op de website vanEUCLID staat meer informatie.euclid-project.eu

onderzoeker vertelde dat er nau-welijks tijd was geweest om eentool (die in twee jaar tijd 700.000euro had gekost), met data te vul-len. Het bekende verhaal: de toolwas nu voor iedereen beschik-baar, maar werd niet onderhou-den. Gelukkig was er wel subsidievoor een nieuwe tool.

Het beste nieuws vond ik datde Universiteitsbibliotheek

Leiden, in samenwerking met stu-denten, een nuttig lijstje op inter-net heeft gezet met tools waarvanis vastgesteld dat ze bepaalde din-gen goed doen. Dat andere uni-versiteiten in de wereld al tiental-len vergelijkbare lijsten op inter-net hebben gezet, slechts deelsmet dezelfde tools, bewijst mijnsinziens dat niemand in de e-hu-manities door de bomen het bosmeer ziet.

Ewoud SandersTaalhistoricus en journalist.Sanders is vaste medewerker vanonder meer NRC Handelsblad enOnze Taal.

Hay Kranen foto KB

In de e-humanities ziet niemanddoor de bomen het bos meer

Wikipedian-in-Residence Hay Kranen:

‘Wikidata kan goudmijnzijn voor onderzoekers’

interessante dingen doen op basisvan ons materiaal. Alle teksten endata hebben een open licentie. Wiki-media Commons, bijvoorbeeld, iseen gigantische, constant groeiendeverzameling van meer dan 22 mil-joen encyclopedisch relevante af-beeldingen en andere media. Demetadata is jammer genoeg nog nietgestructureerd, maar daar gaat in detoekomst verandering in komen.”

15 miljoen gegevensVooral over de jongste telg van deWiki-familie raakt Kranen moeilijkuitgepraat. “Wikidata kan een goud-mijn zijn voor onderzoekers. In eenpaar jaar tijd hebben we al meer dan15 miljoen gegevens verzameld endat aantal zal de komende jaren erghard groeien. Wikidata bestaat vol-ledig uit gestructureerde data. Daarkan je ontelbare queries op los-laten. Mijn favoriete voorbeeld isde vraag naar alle burgemeesters terwereld die niet mens zijn. Dan leerje dat in een klein plaatsje in Alaskaeen kat de burgemeesterssjerpdraagt. Waar anders ontdek je dit?”Ook complete datasets kunnen sindskort batch-gewijs worden toe-gevoegd. “Onlangs zijn zo alleNederlandse rijksmonumenten métgeo-coördinaten geüpload. Het zoutoch mooi zijn als we ook de volle-dige nationale bibliografie kunnentoevoegen en deze dan met crowdsourcing kunnen verbeteren en ver-rijken.”Andersom kan ook Wikidata veelhebben aan onderzoekers, geeftKranen tot slot mee. “Als onder-zoekers interessante datasets heb-ben die passen in het Wikidata-project, laat ze zich vooral melden.We voegen de data graag toe.”www.wikidata.orgcommons.wikimedia.org

FOCUS

‘Een hardeboodschap,maar welde realiteit’