E DATA RESEARCH 1 OA -tijdschrift JOPD laatzienhoehetmoetdoor DANS verder ontwikkeld zal worden.”...

8
INHOUD Wat doe je, als tijdschriften in jouw vakgebied vrijwel onverschillig staan tegenover vrij toegankelijke data? Dan start je zelf een open access journal. Marika de Bruijne, Heidi Berkhout “Ik begon het tijdschrift uit frustratie.” Aan het woord is Jelte Wicherts, Universitair Hoofd- docent aan Tilburg University, fervent aanhanger van open access en inmiddels ook hoofdredacteur van ‘zijn’ Journal of Open Psychology Data (JOPD). “Tijdens het schrijven van mijn proef- schrift had ik historische IQ-data nodig. Ik was verbijsterd dat de data wel waren verzameld, maar dat vrijwel niemand ze kon leveren. Voor mij zijn netjes werken, open zijn naar andere we- tenschappers en data hergebruiken standaarden. Maar voor velen leek het eigen cv belangrijker”, zucht hij. “Natuurlijk mag degene die de data verzamelt, de eerste vruchten plukken, dat is normaal. Maar het risico bestaat dat men de data op de eigen computer bewaart en dat men denkt er ooit nog een publicatie over te schrijven. Maar de tijd gaat voorbij, er komt een nieuwe compu- ter, en weg zijn de data. Ze zijn niet netjes gedo- cumenteerd, want dat hebben de onderzoekers ook niet geleerd.” Iets niet helemaal goed Uit onderzoek van Marjan Bakker, in april 2014 gepromoveerd aan de Universiteit van Amster- dam, blijkt dat in ongeveer de helft van de bestudeerde psychologische artikelen fouten stonden in het rapporteren van resultaten. Ze ont- dekte ook dat wetenschappers die data niet delen, meer fouten maken. Het is volgens Wicherts nog veel erger. Als voorbeeld van dubieus onderzoek noemt hij een artikel dat in 2011 in Journal of Personality and Social Psychology verscheen dat bewees dat we in de toekomst kunnen kijken. “Dan is er toch iets niet helemaal goed in de psy- chologie”, denkt Wicherts. Beloon het delen van data “Het is verbazingwekkend hoeveel weerstand er is tegen het wetenschappelijk belang: alles delen. Zowel vanuit uitgevers, universiteiten en subsi- dieverstrekkers als wetenschappers zelf in mach- tige posities. Gelukkig is er inmiddels een ten- dens gaande om de beloningsstructuur te veran- deren. Zo is kwantiteit geen hoofdcriterium meer binnen de VSNU-criteria bij onderzoekvisitaties. En verplicht de VSNU-gedragscode onderzoe- kers om data te delen als erom gevraagd wordt. Ook de American Psychological Association (APA) heeft een vergelijkbare gedragscode.” Toch worden onderzoekers nog steeds niet beloond voor het delen van hun data. “En dus is het niet zo gek, dat data niet gedeeld worden”, zegt Wicherts. “Het idee voor het JOPD was heel sim- pel: we moeten het delen van data belonen.” Het wauw-effect Met het JOPD hoopt hij verandering te brengen. Het tijdschrift publiceert artikelen die onder- zoeksdata beschrijven. “De artikelen die we nu krijgen, zijn van de voortrekkers van open data. Zij zijn enthousiast. Het verkeer op de website is boven verwachting, alle artikelen zijn meer dan 200 keer bekeken. We hebben verder de data op- gevraagd van alle ‘meest geciteerde artikelen uit de psychologie van de afgelopen 25 jaar’. We gaan zelf achter auteurs aan. We geven presenta- ties en via-via proberen we de talk of the town te worden. Over een jaar wil ik elke maand twee à drie artikelen publiceren, meer (studerende) bezoekers op de website hebben en een paar data papers met een wauw-effect waaruit geciteerd wordt.” Maar nog liever ziet hij zijn tijdschrift overbodig worden. “De dag dat de APA met haar 50 tijd- schriften besluit dat data verplicht bij publicaties moeten staan, op die dag stop ik ermee”, belooft Wicherts en hij legt uit waarom. “Want dan is het niet meer nodig. Tot die tijd, en zo lang er onderzoekers zijn die hun data bij zich willen houden, is ons werk waardevol. Simpelweg omdat we laten zien hoe het moet.” openpsychologydata.metajnl.com 3 Een kennismaking met Linked Open Data 4 Deze datasets zijn sinds kort beschikbaar 5 Toine Pieters: “Het gaat om digital empowerment” 6 NPSO adviseert over goed onderzoek doen 6 Over vrouwen en het literaire veld 7 MigMap brengt verhuisgedrag in kaart 7 KB: open toegang tot ieder wetenschappelijk artikel 8 Piek Vossen over machines en mensentaal 8 Ewoud roept op tot een digitaliseringsregister Jaargang 8 | nummer 3 Nieuwsbrief over data en onderzoek in de alfa- en gamma- wetenschappen. E-data & Research verschijnt drie keer per jaar en wordt mogelijk gemaakt door: CentERdata, CLARIAH, DANS, Huygens ING, de Koninklijke Bibliotheek en het RIVM. E - DATA & RESEARCH E - DATA & RESEARCH juni 2014 1 Scan deze QR code met een smartphone om de website van E-data te bezoeken. www.edata.nl Het JOPD wordt uitgebracht door uitgever Ubiquity Press van University College London. De voordelen van het delen van open data worden in deze afbeelding in beeld gebracht bron Ubiquity Press Ltd. ‘Wetenschappers die data niet delen, maken meer fouten’ OA -tijdschrift JOPD laat zien hoe het moet Wint u de Nederlandse Dataprijs 2014? Op 24 september wordt de Nederlandse Dataprijs uitgereikt. Een prijs voor een onderzoeker of onder- zoeksgroep die bijdraagt aan de wetenschap door onderzoeksdata beschikbaar te maken voor aanvul- lend of nieuw onderzoek. Bent of kent u zo’n onder- zoeker met een goed voorbeeld van gedeelde data? U kunt tot 1 juli uzelf of een ander via researchdata.nl nomineren. De winnaars van de voorgaande edities zijn in ieder geval enthousiast: “Het winnen van de Dataprijs, en zelfs al de nominatie daarvoor, onderstreept het be- lang van je werk. Dat voelt goed,” aldus Maarten Marx, en: “Het winnen van de Dataprijs geeft aan dat we de goede weg zijn ingeslagen,” aldus Mark van Koningsveld, winnaars van de Dataprijs 2012. Kees Mandemakers, winnaar in 2010: “Laat maar zien hoe goed je database of dataset al is! De Dataprijs is een kroon op ons werk.” De organisatie van de Nederlandse Dataprijs is in handen van Research Data Netherlands (RDNL), een samenwerkingsverband tussen 3TU.Datacen- trum en DANS. Kijk voor meer informatie over de prijs, zoals de twee categorieën, de prijzenpot en de criteria op de website van RDNL. researchdata.nl OPROEP

Transcript of E DATA RESEARCH 1 OA -tijdschrift JOPD laatzienhoehetmoetdoor DANS verder ontwikkeld zal worden.”...

Page 1: E DATA RESEARCH 1 OA -tijdschrift JOPD laatzienhoehetmoetdoor DANS verder ontwikkeld zal worden.” Peter Doorn, directeur van DANS : “ DANS bevordert de duurzame toegang tot digitale

INHOUD

Wat doe je, als tijdschriften

in jouw vakgebied vrijwel

onverschillig staan tegenover

vrij toegankelijke data? Dan start

je zelf een open access journal.

Marika de Bruijne, Heidi Berkhout

“Ik begon het tijdschrift uit frustratie.” Aan hetwoord is Jelte Wicherts, Universitair Hoofd-docent aan Tilburg University, fervent aanhangervan open access en inmiddels ook hoofdredacteurvan ‘zijn’ Journal of Open Psychology Data(JOPD). “Tijdens het schrijven van mijn proef-schrift had ik historische IQ-data nodig. Ik wasverbijsterd dat de data wel waren verzameld,maar dat vrijwel niemand ze kon leveren. Voormij zijn netjes werken, open zijn naar andere we-tenschappers en data hergebruiken standaarden.Maar voor velen leek het eigen cv belangrijker”,zucht hij. “Natuurlijk mag degene die de dataverzamelt, de eerste vruchten plukken, dat isnormaal. Maar het risico bestaat dat men de dataop de eigen computer bewaart en dat men denkter ooit nog een publicatie over te schrijven. Maarde tijd gaat voorbij, er komt een nieuwe compu-ter, en weg zijn de data. Ze zijn niet netjes gedo-cumenteerd, want dat hebben de onderzoekersook niet geleerd.”

Iets niet helemaal goedUit onderzoek van Marjan Bakker, in april 2014gepromoveerd aan de Universiteit van Amster-dam, blijkt dat in ongeveer de helft van debestudeerde psychologische artikelen foutenstonden in het rapporteren van resultaten. Ze ont-dekte ook dat wetenschappers die data niet delen,meer fouten maken. Het is volgensWicherts nogveel erger. Als voorbeeld van dubieus onderzoeknoemt hij een artikel dat in 2011 in Journal ofPersonality and Social Psychology verscheendat bewees dat we in de toekomst kunnen kijken.“Dan is er toch iets niet helemaal goed in de psy-chologie”, denkt Wicherts.

Beloon het delen van data“Het is verbazingwekkend hoeveel weerstand eris tegen het wetenschappelijk belang: alles delen.Zowel vanuit uitgevers, universiteiten en subsi-

dieverstrekkers als wetenschappers zelf in mach-tige posities. Gelukkig is er inmiddels een ten-dens gaande om de beloningsstructuur te veran-deren. Zo is kwantiteit geen hoofdcriterium meerbinnen de VSNU-criteria bij onderzoekvisitaties.En verplicht de VSNU-gedragscode onderzoe-kers om data te delen als erom gevraagd wordt.Ook de American Psychological Association(APA) heeft een vergelijkbare gedragscode.” Tochworden onderzoekers nog steeds niet beloondvoor het delen van hun data. “En dus is het nietzo gek, dat data niet gedeeld worden”, zegtWicherts. “Het idee voor het JOPD was heel sim-pel: we moeten het delen van data belonen.”

Het wauw-effectMet het JOPD hoopt hij verandering te brengen.Het tijdschrift publiceert artikelen die onder-zoeksdata beschrijven. “De artikelen die we nukrijgen, zijn van de voortrekkers van open data.Zij zijn enthousiast. Het verkeer op de website is

boven verwachting, alle artikelen zijn meer dan200 keer bekeken. We hebben verder de data op-gevraagd van alle ‘meest geciteerde artikelen uitde psychologie van de afgelopen 25 jaar’. Wegaan zelf achter auteurs aan. We geven presenta-ties en via-via proberen we de talk of the townte worden. Over een jaar wil ik elke maand tweeà drie artikelen publiceren, meer (studerende)bezoekers op de website hebben en een paar datapapers met een wauw-effect waaruit geciteerdwordt.”Maar nog liever ziet hij zijn tijdschrift overbodigworden. “De dag dat de APA met haar 50 tijd-schriften besluit dat data verplicht bij publicatiesmoeten staan, op die dag stop ik ermee”, belooftWicherts en hij legt uit waarom. “Want dan is hetniet meer nodig. Tot die tijd, en zo lang eronderzoekers zijn die hun data bij zich willenhouden, is ons werk waardevol. Simpelwegomdat we laten zien hoe het moet.”openpsychologydata.metajnl.com

3Een kennismaking metLinked Open Data

4Deze datasets zijnsinds kort beschikbaar

5Toine Pieters: “Het gaatom digital empowerment”

6NPSO adviseert overgoed onderzoek doen

6Over vrouwen enhet literaire veld

7MigMap brengtverhuisgedrag in kaart

7KB: open toegang tot iederwetenschappelijk artikel

8Piek Vossen overmachines en mensentaal

8Ewoud roept op tot eendigitaliseringsregister

Jaargang 8 | nummer 3

Nieuwsbrief overdata en onderzoekin de alfa- en gamma-wetenschappen.

E-data & Research verschijntdrie keer per jaar en wordtmogelijk gemaakt door:CentERdata, CLARIAH,DANS, Huygens ING,de Koninklijke Bibliotheeken het RIVM.

E-DATA&RESEARCH

E-DATA&RESEARCH juni 2014 1

Scan dezeQR code met eensmartphone om dewebsite van E-datate bezoeken.www.edata.nl

Het JOPD wordt uitgebracht door uitgever Ubiquity Press van University College London.De voordelen van het delen van open data worden in deze afbeelding in beeld gebrachtbron Ubiquity Press Ltd.

‘Wetenschappers die data niet delen, maken meer fouten’

OA-tijdschrift JOPDlaat zien hoe het moet

Wint u de Nederlandse Dataprijs 2014?Op 24 september wordt de Nederlandse Dataprijsuitgereikt. Een prijs voor een onderzoeker of onder-zoeksgroep die bijdraagt aan de wetenschap dooronderzoeksdata beschikbaar te maken voor aanvul-lend of nieuw onderzoek. Bent of kent u zo’n onder-zoeker met een goed voorbeeld van gedeelde data?U kunt tot 1 juli uzelf of een ander viaresearchdata.nl nomineren.De winnaars van de voorgaande edities zijn in iedergeval enthousiast: “Het winnen van de Dataprijs, enzelfs al de nominatie daarvoor, onderstreept het be-lang van je werk. Dat voelt goed,” aldus Maarten

Marx, en: “Het winnen van de Dataprijs geeft aan datwe de goede weg zijn ingeslagen,” aldus Mark vanKoningsveld, winnaars van de Dataprijs 2012. KeesMandemakers, winnaar in 2010: “Laat maar zien hoegoed je database of dataset al is! De Dataprijs is eenkroon op ons werk.”De organisatie van de Nederlandse Dataprijs is inhanden van Research Data Netherlands (RDNL),een samenwerkingsverband tussen 3TU.Datacen-trum en DANS. Kijk voor meer informatie over deprijs, zoals de twee categorieën, de prijzenpot en decriteria op de website van RDNL. researchdata.nl

OPROEP

Page 2: E DATA RESEARCH 1 OA -tijdschrift JOPD laatzienhoehetmoetdoor DANS verder ontwikkeld zal worden.” Peter Doorn, directeur van DANS : “ DANS bevordert de duurzame toegang tot digitale

E-humanities ook voorhistorische taalkundeErica RenckensOude teksten vormen voor de com-puter een grote uitdaging, vooralvanwege de enorme spellingvaria-tie. Dat is echter geen argument omdigitale onderzoeksmethoden linkste laten liggen in de historische taal-kunde, zo betoogde prof. dr. Nico-line van der Sijs tijdens haar oratieop 27 maart jongstleden aan de Rad-boud Universiteit. Ter ondersteu-ning van dit standpunt besprak zeverschillende mogelijkheden vande toepassing van computationeletechnieken in haar vakgebied. Zobewijst een vergelijking tussen ver-schillende corpora dat de Staten-vertaling al bij zijn verschijnen in1637 archaïsch was: de tekst bevatmeer verbogen naamvallen danandere teksten uit dezelfde periode.Ook kan de computer taalverande-ringen als neologismen en nieuwegrammaticale constructies opsporendoor twee corpora te analyseren.

Om onderzoeksvragen met behulpvan een computer te kunnen beant-woorden, moeten wetenschappersdie juist formuleren. Om dat tetrainen, organiseren faculteiten cur-sussen en workshops e-humanities.Daarnaast zal Van der Sijs in deloop van volgend jaar met collega’seen handboek voor de digitale gees-teswetenschappen publiceren.ru.nl/nederlands/wie_wat_waar/medewerkers/nicoline-sijs

Nieuwe tools voorEuropees onderzoekTom van NuenenDe universiteit van Würzburg ont-ving op 1 en 2 april jongstleden eentwintigtal jonge wetenschappers uitEuropa enAmerika voor de tweedeworkshop van het Network for Di-gital Methods in the Arts and Hu-

manities (NeDiMAH). Het netwerk,dat in 2011 werd opgericht, richtzich op computationeel onderzoekin de Europese humaniora.Er was ruimte voor kennismakingmet nieuwe tools – zoals Stylo, eenstilometrische tool die verschillendeclassificatie- en clusteringalgorit-men combineert. Maar vooral hetaccent op samenwerking bleef terug-keren. De verschillende sprekersbleken in elk van hun landen bezigmet vergelijkbare projecten om grotehoeveelheden literaire teksten teindexeren en analyseren. In Neder-land wordt bijvoorbeeld NederLabontwikkeld: een website die Neder-landstalige tekstcollecties onder ééndak bijeen brengt en tekstanalyse-software aanbiedt om die collectieste ontleden. In Duitsland, Polen enAmerika bleken soortgelijke pro-jecten gaande. De vraag die daarbijtelkens opnieuw aan de orde kwam:hoe zorg je ervoor dat die corporageformaliseerd en uitwisselbaar zijntussen die landen en talen?Een eerste stap werd alvast gezetop de tweede dag, toen een op han-den zijnde ‘benchmark corpus’ vanNeMiDAH werd besproken. Organi-satrice Karina van Dalen-Oskam(Huygens ING) legt uit: “Het gaatom een corpus van honderd Engels-talige romans, waaronder één romanwaarvan het auteurschap betwist isen aan sommige van de andereauteurs in het corpus is toegeschre-ven. Doel van dit corpus is omauteursherkenningssoftware te kun-nen testen en de resultaten te kun-nen vergelijken. Als iemand eennieuwe tool ontwikkelt, en die opexact dezelfde data toepast, kun jemeten hoe goed hij werkt.”nedimah.eu

EACL toont ook de muziekvan de literatuurMike KestemontDe Conference of the EuropeanChapter of the Association for Com-putational Linguistics (EACL) is eenprestigieuze conferentie binnen decomputerlinguïstiek, waar onder-zoekers de recente vooruitgang inde (vooral Europese) taaltechnolo-gie laten zien. Naast het relatieftechnische hoofdprogramma kentde EACL een vruchtbare traditie vankleinere workshops die aan de con-ferentie voorafgaan. Deze studie-dagen zijn meestal georganiseerdrond een nieuw en uitdagend on-derzoeksthema binnen de computer-linguïstiek en haar toepassingen. Zoook de workshop ComputationalLinguistics for Literature (CLfL), in-middels al aan de derde editie toe.

Aan deze workshop nam een groepvan enthousiastelingen deel die zichinteresseren voor taaltechnologischetoepassingen binnen de heden-daagse literatuurstudie.De deelnemers rapporteerden overonderzoek in uiteenlopende gebie-den, zoals een sociolinguïstischeanalyse van personages in hetoeuvre van Ibsen, intertekstuele ver-banden in middeleeuwseArabischeliteratuur of de modellering van hetlineair verloop in literaire teksten.Keynotesprekers waren de Ham-burgse narratoloog Jan ChristophMeister en de visuele artieste MaríaMencía. Hoogtepunt van de dag wasde innovatieve bijdrage van Han-nah Davis en Saif Mohammad,waarin zij TransProse presenteerden,een systeem dat automatisch mu-ziek op basis van tekst genereert.Binnen hun intuïtieve aanpak wordthet overheersende sentiment vaneen tekst eerst benaderd op basisvan een emotielexicon. De analysevan deze sentimentanalyse wordtvervolgens omgezet in muzikalepatronen waarvan de toonhoogtesen het ritme de gevoelens van detekst nabootsen. Het verbluffenderesultaat van TransProse kan onlineworden geraadpleegd (transprose.weebly.com). Laat u ontroeren doorde tragische tonen die het systeemdistilleerde uit Heart of Darkness.aclweb.org/anthology/W/W14/#0900

Patronen en betekenisin grote tekstcollectiesPeter BootHoe kunnen geesteswetenschappe-lijke projecten met big questions hetbeste omgaan met de big data vande grote tekstcollecties waarmee zehun vragen willen beantwoorden?Dat was de centrale vraag tijdens

de workshopMining digital reposi-tories, gehouden op 10 en 11 april inde Koninklijke Bibliotheek. Deworkshop was mede georganiseerddoor de projecten Translantis enASYMENC (zie ook het interview metToine Pieters op pagina 5).Debora Thomas toonde de digitalekrantencollectie van de Library ofCongress (USA). De verzamelingop zich is al een klein kunststuk,omdat collecties uit vijftig statenmoesten worden geïntegreerd. Dekranten kunnen online wordendoorzocht en gelezen, maar zijn ookbenaderbaar via een applicationprogramming interface (api): onder-zoekers kunnen de krantentekstenanalyseren met hun eigen program-matuur en zo onder andere topicmodelling of sentiment mining doen.Zo is bijvoorbeeld bestudeerd hoede kranten in 1918 verslag dedenvan de Spaanse griep.Alistair Dun-ning toonde vergelijkbare moge-lijkheden in de Europeana Cloud,en Hildelies Balk gaf een previewvan het researchlab dat de Konink-lijke Bibliotheek aan het bouwen is.Ook de aanbieders van commerciëlecollecties hebben begrepen dat veelonderzoekers van zulke mogelijk-heden gebruik willen maken.Toch toonden veel geestesweten-schappelijke onderzoekers zichsceptisch. Wat is de status van eengrafiek of een word cloud? Kunnengeesteswetenschappelijke vragenbeantwoord worden met een beroepop getallen? Kunnen ze überhauptworden beantwoord? En hoe be-trouwbaar en representatief zijn derepositories? Organisator Joris vanEijnatten besloot dat er nog heel watfooling around met de data nodigzou zijn voor we hierop een ant-woord hebben.tinyurl.com/ketqa9m

2 juni 2014 E-DATA&RESEARCH

GEHOORD & BIJGEWOOND

Nicoline van der Sijs tijdens haaroratie foto Gert Janssen

Debora Thomas: “This digital age is like the Wild West: opportunitiesand unruly’’ foto Inge Angevaare

COLOFON Uitgever: Stichting Uitgeverij E-data & Research Den Haag. Redactieadres: Postbus 93067, 2509 AB Den Haag, 070-3494450, [email protected], www.edata.nl. Redactie: Inge Angevaare, Heidi Berkhout(hoofd-/eindredacteur), Peter Boot, Marika de Bruijne, René van Horik, Rutger Nugteren, Erica Renckens. Redactiesecretariaat: Lucas Pasteuning. Aan dit nummer werkten mee: Richard Cyganiak, Suzan van Dijk, ValentijnGilissen, Hella Hollander, Gert Janssen, Anja Jentzsch, Mike Kerstemont, Emilie Kraaikamp, Jan Pieter Kunst, Jorna Leenheer, lja Nieuwland, Tom van Nuenen, Walter Ravenek, Leo van Velzen, Bart van Vliet, Huib Zuidervaart.Opmaak: Colette Sloots, Haarlem. Productie: Amsterdam University Press. Druk: Ten Brink, Meppel. Webmaster: Sonja Duijkers Oplage: 7500 papier, 1900 digitaal. ISSN: 1872-0374. We hebben getracht alle belanghebben-den met betrekking tot het gebruikte beeldmateriaal te benaderen. Degenen die menen rechten te kunnen doen gelden, kunnen zich tot ons wenden. Toezending papieren en/of digitale versie is kosteloos aan relaties van destakeholders en studenten in de alfa- en gammarichtingen. Wilt u een artikel uit E-data overnemen? Neem dan contact op met de hoofdredacteur. Overname van artikelen geschied altijd onder vermelding van de bron E-data &Research en de naam van de auteur van het artikel.

Maak kans op deDigital PreservationAwards 2014

De Digital Preservation Awardsworden uitgereikt aan initiatievendie bijdragen aan het duurzaamtoegankelijk houden van digitaalerfgoed. Organisaties, projec-ten, personen en initiatieven kun-nen worden genomineerd vooréén van de prijzen. De prijsuitrei-king vindt op 17 november plaatsin Londen. De finalisten en win-naars begeven zich onder debeste projecten en initiatievenin een groeiende internationalecommunity en zullen veel publici-teit krijgen.De Digital Preservation Coalition(DPC) en de Nationale CoalitieDigitale Duurzaamheid (NCDD)organiseren samen de DigitalPreservation Awards. Nominatievoor de Awards is open tot 28juli via de website van de DPC.Kijk voor meer informatie op dewebsite van de DPC. (HB)dpconline.org

Beheer DutchDataverse Networknaar DANS

DANS heeft het beheer van hetDutch Dataverse Network (DVN)overgenomen van de UniversiteitUtrecht. Het DVN is bedoeldvoor onderzoekers en docentenvan universiteiten en andere aca-demische instituten in Neder-land. Zij kunnen met deze diensteen grote verscheidenheid aanwetenschappelijke data digitaalopslaan in een online omgeving,op een zeer veilige en duurzamewijze. Anja Smit, directeur Uni-versiteitsbibliotheek van de Uni-versiteit Utrecht: “Het DVN is eenwetenschappelijk platform ont-wikkeld door Harvard. Na deinstallatie binnen de UniversiteitUtrecht in 2010 werd de dienstin zeer korte tijd een gedeeldedienst van zeven instellingen.Dit succesvolle samenwerkings-verband is nu klaar voor de vol-gende stap. Wij hebben er allevertrouwen in dat Dataversedoor DANS verder ontwikkeld zalworden.” Peter Doorn, directeurvan DANS: “DANS bevordert deduurzame toegang tot digitaleonderzoeksgegevens. Onze be-staande diensten (zoals NARCIS

en EASY) faciliteren onderzoe-kers al voorafgaande aan en naafronding van hun onderzoek.Met de komst van Dataversekunnen we onderzoekers ooktijdens hun onderzoek onder-steunen op datamanagement-gebied. Bovendien zijn we ver-heugd met het gestelde vertrou-wen in DANS door de deelne-mers van Dataverse.” (HB)dataverse.nl/dvn

KORT

Page 3: E DATA RESEARCH 1 OA -tijdschrift JOPD laatzienhoehetmoetdoor DANS verder ontwikkeld zal worden.” Peter Doorn, directeur van DANS : “ DANS bevordert de duurzame toegang tot digitale

Om Linked Open Data in de praktijk toe tekunnen passen en de uitdagingen het hoofd tebieden, is het essentieel dat betrokkenen ge-bruik maken van dezelfde standaarden.Het internationale orgaan voor webstandaar-den, hetWorldWideWeb Consortium (W3C),geeft leiding aan de ontwikkeling van dezestandaarden. Op de website linkeddata.orgstaan informatiebronnen die als Linked OpenData beschikbaar en met elkaar verbondenzijn.

LangetermijntoegangOok op projectniveau wordt onderzoek ge-daan naar de werkbaarheid van Linked OpenData. Een voorbeeld van zo’n project is PRE-serving LInked DAta (PRELIDA). Dit projectricht zich op het verbeteren van de langeter-mijntoegang tot Linked Open Data en brengtonderzoekers bij elkaar die actief zijn op hetgebied van digitale duurzaamheid en het se-mantisch web.linkeddata.orgprelida.eu

Linked Open Data in hetjuridische domein: hoetoegankelijk zijn rech-terlijke uitspraken?We spreken Frank vanHarmelen, hoogleraarkennisrepresentatie.Rutger Nugteren

“Onze vakgroep heeft enkeleLinked Open Data-projectengedaan op het gebied van toe-gankelijkheid van data binnende rechtspraak. Het bleekhondsmoeilijk om binnen hetdomein van de rechtspraak teformaliseren en standaardise-ren.”

Regels van de taalDit blijkt ook uit het proef-schrift van Marc van Opijnen.Hij stelt dat wetsteksten on-gestructureerd zijn en in aller-lei combinaties en stijlen voor-komen. Er zijn wel standaar-den om te structureren, maardie worden niet overal toege-past. Dit komt mede doordatgerechtelijke uitspraken zijnopgesteld in de natuurlijketaal. De regels van deze taal

zijn afgeleid uit het gangbaregebruik, in plaats van opge-steld op formele wijze, zoalsbij computertaal. En de schrij-vers van wetsteksten nemenaan dat de lezers allerlei voorde hand liggende zaken zelfweten. Voor een computer isdat echter niet duidelijk.Wan-neer je bijvoorbeeld in eenformele taal moet definiërenwat een voertuig is, dan moetje vastleggen dat een voertuiggebruikt kan worden door eenmens, voordat je een ongelukmet een mens in een voertuigkan beschrijven. In het medi-sche domein zijn dit soortformele relaties vastgelegd inbestaande taxonomieën, ter-minologieën en classificaties.De mate van standaardisatieis daar veel groter, toch is hetniet fundamenteel anders.

Nog hooguit 5 jaarVolgens Van Harmelen zijnsemantische webtechniekendan ook toepasbaar binnenrechterlijke uitspraken, hetzal alleen aanzienlijk meermoeite en tijd kosten. Dat is

ook het beeld dat Van Opijnenoproept.Een ander obstakel bij rech-terlijke uitspraken is de be-schikbaarheid van brongege-vens. In het proefschrift vanVan Opijnen staat: “door deaanwezigheid van steeds meerdata, en de beschikbaarheidervan in voor hergebruikgeschikte formaten, zijn deonderzoeksmogelijkheden ineen paar jaar explosief toege-nomen.” “Echter,” merkt VanHarmelen op: “we zijn er noglang niet. Juist de beschik-baarheid van Linked OpenData laat nog zeer te wensenover. Veel context ontbreektdoordat uitgevers hun artike-len nog niet ‘open’op internetzetten. De verwachting is datdit snel zal veranderen. Onzevakgroep ontwikkelt voorElsevier prototypes die hetmogelijk maken om van arti-kelen naar data te linken. Hetzal nog hooguit vijf jaar durenvoordat de uitgeverswereldom is, en artikelen en data be-schikbaar stellen en aan elkaarlinken,” aldus Van Harmelen.

Het Linked Open Data-principe

is niet bij iedereen bekend.

Een eerste kennismaking met

voorbeelden uit de theorie en

de praktijk. René van Horik

Een ‘bank’ kan verwijzen naar een financiëleinstelling of naar een meubelstuk.Wat de termbetekent, wordt bepaald door de context. Alsde term en de context volgens eenzelfde stan-daard zijn geformuleerd, kunnen deze infor-matiebronnen aan elkaar worden gekoppeld.En kunnen ze worden gebruikt voor bijvoor-beeld een nauwkeurigere zoekopdracht. Dit ishet principe achter Linked Open Data. Doorverbanden tussen informatie aan te brengen,ontstaan nieuwe (wetenschappelijke) inzichten.En dat biedt mogelijkheden voor archieven,bibliotheken en andere informatiebeheerdersom de kwaliteit van informatiebronnen te ver-hogen.

Niet alleen maar rozengeurLinked Open Data zorgen ook voor nieuweuitdagingen. Door de vele koppelingen tussenen doorverwijzingen naar verschillende in-formatiebronnen is de kwaliteitsgarantie en deverantwoordelijkheid voor die kwaliteit nietaltijd even duidelijk. Ook veranderen infor-matiebronnen van inhoud, waardoor versie-beheer een punt van aandacht wordt. En erontstaat nieuwe kennis. De vraag dient zichaan, wie de actualiteit van deze kennis be-waakt en garanties geeft voor de correctheidvan de kennis. De reputatie van de dataleve-rancier komt hierbij in het geding.

E-DATA&RESEARCH juni 2014 3

Linked Open Data nader bekeken

De afbeeldingtoont datasets die in2011 waren gepubliceerdin Linking Data formaat. Desituatie anno 2014 zou niet meerop de pagina passen. Iedereen kan data-sets toevoegen, een instructie staat op de sitelod-cloud.net credits Richard Cyganiak en Anja Jentzsch

Een praktijkvoorbeeld:‘hondsmoeilijk maar de moeite waard’

Page 4: E DATA RESEARCH 1 OA -tijdschrift JOPD laatzienhoehetmoetdoor DANS verder ontwikkeld zal worden.” Peter Doorn, directeur van DANS : “ DANS bevordert de duurzame toegang tot digitale

Huygens ING• Database verzekeringsfondsen 19e eeuw

online

In de 19e eeuw organiseerden de burgers,en niet de overheid, de Nederlandse socialezekerheid. Ze richtten duizenden instellin-gen van onderlinge hulp op, zoals zieken-fondsen, begrafenisfondsen en weduwe-fondsen. De gegevens van 1.500 van dezeverzekeringsinstellingen uit de periode1827-1890 zijn uit zeer diverse bronnen bij-eengebracht in jarenlang research door on-derzoekster Loes van der Valk. Ze zijn nuonline gepubliceerd in de Database zieken-en begrafenisfondsen, weduwefondsen enlevensverzekeringen, een website van hetHuygens ING. De database bevat voor elkfonds basisgegevens zoals de plaats vanvestiging, jaar van oprichting, de bestaans-duur en de voorzieningen voor hun leden.resources.huygens.knaw.nl/verzekeringsfondsen

Deze publicaties zijn beschik-baar via www.historici.nl. Bezoekdeze site of scan de QR code.

4 juni 2014 E-DATA&RESEARCH

SINDS KORT BESCHIKBAAR

• Dalen, H. van; Henkens, K., januari/april2013, Changing images of older workers• Evers, E.R.K.; Lindenberg, S.M.,augustus/september 2013, Collecting asSelf-Regulation• Landsheer, J.A., januari 2011, Prosocialand Antisocial Behavior• Swan, E.; Koelen, M.; Bouwman, L.; Aarts,N., januari 2013, How is obesity perpetuatedor resisted in different contexts?• Boekel, L. van; Garretsen, H.F.L.; Brouwers,E.P.M.; Goor, L.A.M. van de, februari 2012,Perceptions and beliefs about people with asubstance use disorder• CentERdata, mei/juni 2013, Personality -Wave 6• CentERdata, januari/februari 2013, Religionand Ethnicity - Wave 6• CentERdata, maart/april 2013, Family andHousehold - Wave 6• CentERdata, juni/juli 2013, Economic Situa-tion: Income - Wave 6• CentERdata, april/mei 2013, Work andSchooling - Wave 6• Pieters, R.; Leenheer, J., maart 2013, TilburgConsumer Outlook MonitorStudies Immigrant panel• Zavala-Rojas, D.; Saris, W., maart/mei2013, Method Effects of Language ina Survey

Deze bestanden zijn kosteloosbeschikbaar via www.lissdata.nl/ dataarchive. Bezoek dezesite of scan de QR-code

Dit overzicht toont databestanden die recent beschikbaar zijn gekomen bijCentERdata, Data Archiving and Networked Services en Huygens ING.

CentERdata• Morele bezwaren bij aankoopbeslissingen

Hoe en waarom consumenten morele be-zwaren over dierenwelzijn meenemen bijhun aankoopbeslissingen, bestudeerdeJanneke de Jonge in haar postdoctoraalonderzoek aan Wageningen Universiteit.In de studie ‘Consumer heterogeneity withrespect to morality in consumption decisi-ons and perceptions of animal welfare’ zijnverschillen tussen consumenten in hunpercepties en voorkeuren ten aanzien vandiervriendelijk vlees geïdentificeerd. Hetonderzoek beoogt bij te dragen aan de ont-

wikkeling van nieuwe welzijnsconceptendie voldoen aan de behoeften van de ge-identificeerde consumentensegmenten.Het project bestaat uit meerdere keuze-experimenten en vragenlijsten die zijnafgenomen in de maanden oktober 2012,november 2012 en mei 2013 in het LISS pa-nel. De eerste twee delen van het onderzoekzijn beschikbaar via LISS Data Archive.

Ook sinds kort beschikbaar:Studies LISS panel• Antoun, C., september 2013, Nonresponseand Measurement Error in Mobile Web Surveys- Baseline

De begrafenisfondsen refereerden heeldirect aan de dood, zoals blijkt uit het em-bleem van het Haarlemse Mijn glas loopt rasbron B. Sliggers, ‘In alles ghetrou’(Haarlem 1994) 14

Zo is de data, waaronder veldtekeningen,dia’s, foto’s en analyses, duurzaam en onlinetoegankelijk via https://easy.dans.knaw.nl/ui/datasets/id/easy-dataset:34359.Het overzicht van de resterende onuitge-werkte opgravingen, de werkvoorraad, isdoor DANS in kaart gebracht binnen hetproject Odyssee in de breedte waardooronderzoekers en studenten zich nu over hetuitwerken van oud archeologisch onder-zoek kunnen ontfermen.

Ook sinds kort beschikbaar:Sociale Wetenschappen• Karsten, Dr. MAN., Tilburg University,Majesteitelijk en magistratelijk: De Nederlandseburgemeester en de staat van het ambt.Persistent Identifier: urn:nbn:nl:ui:13-5w9g-ga• Stichting Kiezersonderzoek Nederland;Centraal Bureau voor de Statistiek; Kolk, Dr.H. van der; Tillie, Prof.dr. J.N.; Erkel, P. van;Velden, M. van der; Damstra, A., 2012, DutchParliamentary Election Study 2012; NationaalKiezersonderzoek 2012. Persistent Identifier:urn:nbn:nl:ui:13-93iu-8p• Sociaal en Cultureel Planbureau, 2012,Vrouwen In Besluitvorming 2012. PersistentIdentifier: urn:nbn:nl:ui:13-gkpo-8j

Via easy.dans.knaw.nl zijndeze bestanden beschikbaar.Bezoek deze site of scan deQR code.

Odyssee brengt nieuwe wetenschappelijkeinzichten foto Evert van Ginkel

12 - 13 juni • Den HaagDHBenelux – Conference forDigital Humanities ResearchDeze conferentie op het gebied vandigitale geesteswetenschappenwordt voor het eerst georganiseerd.De call for proposals meldt dat ookonderzoekers van buiten de Beneluxvoorstellen kunnen indienen.dhbenelux.org/dhbenelux-2014-conference

2 - 5 juli • Riga (Litouwen)LIBER ConferenceLIBER is de Europese organisatievan onderzoeksbibliotheken. Haarjaarlijkse conferentie is in Riga. Hetthema luidt: Research libraries inthe 2020 information landscape.lnb.lv/en/liber2014

8 - 12 juli • LausanneDigital HumanitiesDit is de jaarlijkse internationale

conferentie van de Alliance of DigitalHumanities Organizations. Het themavan DH2014 is Digital Cultural Empo-werment. Naast het wetenschappe-lijke programma worden ook work-shops en tutorials georganiseerd.dh2014.org

6 - 11 september • DresdenCIDOC 2014CIDOC is een internationale organi-satie op het gebied van museum-documentatie. De conferentie richtzich op de toegang tot museum-collecties en heeft als thema: Ac-cess and Understanding. Networ-king in the Digital Era.cidoc2014.de

8 - 12 september • LondenDigital Libraries 2014DL2014 is het podium voor de belang-rijkste uitkomsten van Digital Library-onderzoek. De conferentie wordtgeorganiseerd door de Joint Confe-rence on Digital Libraries en Theoryand Practice of Digital Libraries.dl2014.org

AGENDA

Respondenten maakten in het onderzoekeen serie keuzes voor kipfilet met wisse-lend dierenwelzijn en prijsniveau fotoJanneke de Jonge

Pirate Bay-blokkadeheeft weinig effect opdownloadenDe Universiteit van Amsterdam enCentERdata hebben longitudinaal on-derzoek uitgevoerd naar de effecten vanhet blokkeren van The Pirate Bay ophet downloaden van films uit illegalebron (Poort, Joost, Jorna Leenheer, Je-roen van der Ham & Cosmin Dumitru(2014). Baywatch: Two approaches tomeasure the effects of blocking accessto The Pirate Bay. TelecommunicationsPolicy. 38(4), 383–392). Daarbij zijnmetingen gedaan onder consumenten inhet CentERpanel (zelfrapportages) endeze zijn vergeleken met gedragsdatadie zijn verzameld via een nieuw ont-wikkelde technologie om BitTorent-activiteit direct te monitoren. De bevin-ding dat de Pirate Bay-blokkade nau-welijks effecten genereert, is in eenrechtszaak actief gebruikt bij de argu-mentatie van een rechterlijke uitspraak.Inmiddels mogen Ziggo en XS4ALL deblokkade opheffen. (JL)

–––––––––––––––––––––––––––

DANS• Wat deden archeologen 100 jaar gele-

den?

Vanuit het Odyssee-project, een initiatiefvan NWO, worden vele archeologischevondsten uit de periode 1900 tot 2000 inkaart gebracht en in historisch perspectiefgeplaatst. Dit leidt tot nieuwe wetenschap-pelijke inzichten binnen de archeologie.De digitale archivering van de opgravings-documentatie vindt plaats via het e-depotvoor de Nederlandse archeologie (EDNA).

22 - 24 september • AmsterdamResearch Data Alliance Plenary 4Tijdens plenaire bijeenkomsten vande RDA worden resultaten en acti-viteiten met betrekking tot onder-zoeksdata besproken. Deze vierdeplenaire bijeenkomst van de RDA

vindt plaats in Amsterdam.rd-alliance.org/rda-fourth-plenary-meeting.html

24 september • AmsterdamUitreiking Nederlandse DataprijsDe Nederlandse Dataprijs geeftwaardering aan onderzoekers diedata bij elkaar brengen, documen-teren en toegankelijk maken vooranderen. Op 24 september wordtde prijs uitgereikt.researchdata.nl/nl/activiteiten/dataprijs

6 - 10 oktober • MelbourneInternational Conference onPreservation of Digital ObjectsiPRES is een jaarlijkse conferentieop het gebied van digitale duur-zaamheid. In 2014 wordt deze

conferentie voor het eerst in Aus-tralië gehouden.ipres2014.org

8 - 11 oktober • AustinInternational conference onDublin Core and metadataapplicationsDe jaarlijkse conferentie gerela-teerd aan de Dublin Core stan-daard heeft als thema: MetadataIntersections: Bridging the Archi-pelago of Cultural Memory.dcevents.dublincore.org/IntConf/dc-2014

11 - 15 oktober • GironaArchives and Cultural IndustriesDeze conferentie is een bundelingvan bijeenkomsten, waaronder deEuropese conferentie van de Inter-national Council on Archives (ICA)en een gerenommeerd seminar ophet gebied van beeldcollecties.girona.cat/web/ica2014/eng

Page 5: E DATA RESEARCH 1 OA -tijdschrift JOPD laatzienhoehetmoetdoor DANS verder ontwikkeld zal worden.” Peter Doorn, directeur van DANS : “ DANS bevordert de duurzame toegang tot digitale

“Wij bestuderen referentieculturen, dat zijnculturen die over nationale grenzen heen eenvoorbeeldfunctie hebben. In de zeventiende enachttiende eeuw fungeerde de Republiek derNederlanden als een belangrijke referentie-cultuur voor Europa en de Verenigde Staten.In de twintigste eeuw groeiden de VS zelf uittot een invloedrijke voorbeeldcultuur.Wat onsinteresseert, is hoe wij onze eigen (Neder-landse of Europese) identiteit ontwikkelenmet verwijzing naar voorbeeldculturen. Degrote databanken met gedigitaliseerde krantenzijn een onmisbare bron voor dit onderzoek.Kranten kunnen beschouwd worden als eenklankbord voor wat wij ‘de publieke sfeer’noemen. Niet alleen artikelen, maar ook in-gezonden brieven, cartoons en advertentiesleveren ons belangrijke informatie over dewisselwerking tussen wetenschap, cultuur eneconomie.”“In het Europese HERA-project AsymEnc(Asymmetrical Encounters) zoeken we naarde historische dynamiek van culturele con-cepten zoals ‘metropolis’ in grote digitalekrantenbanken in Nederland, Duitsland enEngeland. Voor het eerst proberen we syste-matisch een grootschalig longitudinaal onder-zoek te doen in diverse landen. Zonder big dataen text mining zou dat bijzonder lastig zijn.”

Big data, new questions“Maar we lopen ook tegen grote nieuwe vra-gen aan. Over hoe we dit materiaal weten-schappelijk kunnen en mogen gebruiken.Want er zitten grote gaten in de digitale kran-tencollecties. Wat heb-ben die voor effect oponze onderzoeksresul-taten? Ook de uitgele-zen teksten (OCR) zijnvaak van slechte kwa-liteit. Kunnen de biblio-theken daar iets aandoen of moeten wedaarmee leren leven?En hoe dan?”“Afgelopen april orga-niseerde ik met collegaJaap Verheul de workshop ‘Mining digital re-positories: challenges and horizons’ in de Ko-ninklijke Bibliotheek. Daar zijn die vragenuitgebreid aan de orde gekomen. Tussen on-derzoekers onderling, maar ook in een dialoogmet de bibliotheken en commerciële partijendie de krantencollecties beheren en ontwik-kelen.”“Tijdens die workshop hebben we natuurlijkniet alle vragen kunnen beantwoorden. Maarwat mij betreft was het een uitstekend beginvan de dialoog die moet leiden tot een nieuwewetenschappelijke cultuur rond big data. Enook tot goede afspraken met bibliotheken. Zowillen wij als onderzoekers méér informatieover wat er in de databanken zit en wat niet,en over de wisselende kwaliteit van de OCR.

Zodat we daar rekening mee kunnen houdenbij ons onderzoek.”

Crowdsourcing belangrijk“Bibliotheken zijn openbare instellingen metbeperkte budgetten. Dat is natuurlijk een ge-geven. En technisch verandert de situatievoortdurend. De machines waarmee nu OCRwordt gemaakt, zijn veel beter dan een jaar oftien geleden. Maar dat oudere OCR-spul zitnog steeds in de databanken. Ik denk dat er

maar één betaalbaremanier is om die situ-atie te verbeteren:crowdsourcing. On-derzoekers, studentenen amateurhistoricitoestaan om de uitge-lezen teksten te verbe-teren. Bibliothekenhebben daar niet altijdopen voor gestaan.Maar nu lijkt het tijvoorzichtig te keren.

Ik bespeurde tijdens de workshop bij de KBalthans een positieve grondhouding.”“En dan natuurlijk het auteursrecht. Er is zo-

veel materiaal waar we als onderzoekers nogniet bij kunnen, dat is doodzonde. Het kran-tenarchief van de British Library, bijvoor-beeld, is helemaal incommerciële handen.Persoonlijk vind ik datje individuele onder-zoekers niet lastigmoet vallen met al dieauteursrechtenkwes-ties. Dat bibliothekenhet op zich moeten ne-men om toegang voorwetenschappelijk on-derzoek te regelen metde rechthebbenden.Liefst in Europees verband. En als het moetonder strikte voorwaarden dat het materiaalniet verder verspreid wordt. Daar staan webest open voor.”

Omgaan met taalkwesties“Taalkwesties zijn een andere factor in trans-nationaal onderzoek waarmee we moeten le-ren werken. Je kunt concepten niet zomaarvertalen en er dan van uitgaan dat die ver-taalde termen dezelfde lading hebben als hetorigineel. Woordbetekenissen veranderen ookvoortdurend.Wat op het ene moment een neu-traal woord is, kan tien jaar later een positieveof een negatieve bijklank hebben.We moetentools ontwikkelen om die finesses uit de da-tabestanden te kunnen halen. Tijdens onzeworkshop vroeg iemand of je kunt analyserenwaarover niet gesproken wordt in kranten.Tja, dat gaat nog weer een stap verder.”“We vroegen tijdens de workshop ook aancollega’s hoe hun ‘digitale utopia’ eruit zouzien. De een wilde vooral de OCR verbeteren,de ander wilde méér materiaal. Het mooistevergezicht kwam denk ik van mijn Utrechtse

‘digital history’ collega Joris van Eijnatten.Hij sprak van een ‘Globiana 5.0’: een wereld-wijd, transnationaal digitaal archief vol mate-

riaal in standaard-formaten en gekop-peld aan tweetalige enmeertalige woorden-boeken. Die moetenwe dan wel kunnenonderzoeken met eennetwerk van weten-schappers die goedkunnen omgaan metbig data. Collega RensBod van het Amster-damse Centre for Digi-

tal Humanities benadrukte dat hier nog veelwerk te verrichten is. Veel onderzoekers mis-sen nog big data-vaardigheden, en dat zijnlang niet alleen de ouderen onder ons. Hetgaat hier letterlijk om capacity building metals doel ‘digital empowerment’ in de geestes-wetenschappen.”

Datalabs“Onderdeel van die ‘digital empowerment’ isook dat bibliotheken een andere rol nemen tenopzichte van de data die ze beheren. De Bri-tish Library heeft daarin het voortouw geno-men en de Koninklijke Bibliotheek volgt bin-nenkort. Ze stellen zich niet langer op als pas-sieve leverancier van hun digitale data, maarzoeken actief de samenwerking met weten-schappers om méér met die data te kunnendoen. In zogenaamde ‘datalabs’ werken we-tenschappers samen met data-experts van debibliotheken. Met voornamelijk opensource-tools worden de mogelijkheden van big dataverkend. Van die samenwerking worden beidepartijen rijker.”tinyurl.com/ketqa9m

E-DATA&RESEARCH juni 2014 5

Toine Pieters in zijn werkkamer foto Inge Angevaare

Toine PietersToine Pieters is verbonden aan het Descar-tes Centrum voor Wetenschapsgeschiede-nis en -filosofie van de Universiteit Utrecht.In april maakte hij de overstap van de afde-ling Metamedica van het VU Medisch Cen-trum naar een aanstelling als hoogleraar/directeur van het Freudenthal Institute forScience and Mathematics Education.Hij is projectcoördinator van Translantis,ASYMENC en projectleider van het digitaleerfgoedproject Timecapsule.

“Hoe zietuw digitale

utopiaeruit?”

“Het gaat om‘digital empowerment’

in de geestes-wetenschappen”

Toine Pieters doet samen

met collega’s in Utrecht

grootschalig transnationaal

onderzoek. Big data maken

dat mogelijk. Maar er

doemen nieuwe grenzen op:

gaten in collecties, slecht

leesbare teksten.

Hoe gaat de wetenschap

daarmee om? Inge Angevaare

Toine Pieters over grootschalig transnationaal onderzoek:

‘We moeten nog lerenwerken met big data’

INTERVIEW

Page 6: E DATA RESEARCH 1 OA -tijdschrift JOPD laatzienhoehetmoetdoor DANS verder ontwikkeld zal worden.” Peter Doorn, directeur van DANS : “ DANS bevordert de duurzame toegang tot digitale

6 juni 2014 E-DATA&RESEARCH

Over vrouwen en het literaire veld

Een database vanwetenschappelijkeinstrumentmakers

Het Digitaal Wetenschaps-historisch Centrum van Huy-gens ING heeft samen metMuseum Boerhaave biografi-sche gegevens over Neder-landse makers van weten-schappelijke instrumentenbijeengebracht.Eén van de verworven inzich-ten in de wetenschapsgeschie-denis van de laatste decenniais het gegeven dat in de vroeg-moderne tijd de kruisbestuivingtussen ambachtslieden en ge-leerden van vitale betekenis isgeweest voor de ontwikkelingvan de natuurwetenschap.Instrumentmakers, bijvoor-beeld, opereerden op het snij-vlak van ambachtelijke en ge-leerde kennis en hebben doorhun specifieke expertise somsbelangrijke bijdragen geleverdaan de ontwikkeling van weten-schappelijke instrumenten.Hun inbreng is echter vaakonderbelicht, reden waaromde Amerikaanse wetenschaps-historicus Steven Shapin zeals invisible technicians heeftaangeduid.De database borduurt voort ophet werk van Maria Rooseboom(1909-1978), directrice van devoorganger van het huidigeMuseum Boerhaave. In deinstrumentenmakersdatabankworden deze gegevens aange-vuld en ontsloten. Zo wordtonderzoek gefaciliteerd naarmensen die traditioneel nietbinnen de categorie van‘wetenschappers’ wordengerekend. De database is eenonderdeel van het BiografischApparaat, een database vanwetenschappelijk actieve per-sonen in Nederland, die laterdit jaar zal worden gepubli-ceerd. (HZ, IN)

www.dwc.knaw.nl/biografie/scientific-instrument-makers/

KORTHet NPSO adviseert over hoeje survey-onderzoek goeduitvoert. Met voorzitsterVera Toepoel spreken weover de status en toekomstvan survey-onderzoek.Marika de Bruijne

“Iedereen kan tegenwoordig eensurvey doen, en doet dat ook”, be-gint Toepoel nadrukkelijk. Ze heefter een reden voor. Er worden tegen-woordig te veel vragenlijsten afge-nomen van wisselende kwaliteitwaardoor mensen moe worden vanenquêtes. “Do-it-yourself-surveyskunnen door iedereen worden afge-nomen, zoals de buurvrouw of men-sen van de sportvereniging. Vervol-gens worden algemene uitsprakengedaan, terwijl er geen kanssteek-proef is gebruikt”, legt Toepoel uit.“Wat is nu het verschil tussen goedeen slechte onderzoeken?”

ChecklistAls antwoord op deze vraag heefthet NPSO een checklist ontwikkeld.Met deze checklist kunnen geïnte-resseerden inschatten of een onder-zoek deugt of niet. De checklist isbeschikbaar op de NPSO-website.Ook organiseert het NPSO regelma-tig bijeenkomsten en lezingen; deel-name is kosteloos. Dergelijke actiesvormen de kernvanhetNPSO.“Wewillen onderzoe-kers en iedereendie te maken heeftmet survey-onder-zoek helpen enadvies geven overhoe je goed onder-zoek kunt doen.Op onze websitestaat bijvoorbeeldwie je met welke expertise kunt be-naderen bij vragen. Ook is er eenLinkedIn-groep waar je je voor kuntaanmelden.”

DriehoekHet NPSO is een initiatief van par-tijen uit de wetenschap, overheid encommercieel onderzoek. Zo’n drie-

hoek biedt een kans om van elkaarte leren en kennis te verspreiden.Toepoel: “Hoewel de wetenschap-pers vaak achter de nieuwste ont-

wikkelingen aanlopen, kunnen zede markt helpenbij het validerenvan onderzoeks-methoden of dooropleidingen te bie-den. Het markt-onderzoek kanweer ervaringenvanuit de prakti-sche uitvoering

delen. Overheid en semi-overheidkunnen vertellen wat hun behoeftenzijn en wat er in de maatschappijspeelt, en bovendien advies van deandere groepen gebruiken.”

Toekomst surveysMaar terug naar de respondent. Hoekun je hem of haar tegenwoordig

nog bereiken? Toepoel denkt na.“Het invullen van een survey is eenkosten-batenafweging. Als onder-zoeker moet je beseffen dat je metelke survey de kostbare tijd van derespondent claimt”, zegt ze. “Omervoor te zorgen dat een respondentdeelneemt, is het van belang omsurveys interessanter en vermake-lijker te maken en uit te leggen wathet belang is van een onderzoek.”

Meer vooronderzoekVerder ziet ze nieuwe techniekenzoals mobiele surveys als een nood-zakelijke toepassing voor deze tijd.“Over een aantal jaar heeft bijnaiedereen een mobiele telefoon. Hetvolstaat dan niet meer om vragen-lijsten alleen voor desktops te ont-wikkelen. Een respondent zit nietmeer achter een scherm, maar staatbij een bushalte een korte vragen-lijst in te vullen.”Volgens Toepoel moeten we ons bij

het afnemen van een onderzoek ooksteeds kritischer afvragen hoe wedat doen en of er al data beschikbaarzijn, maar de praktijk laat vaak hettegenovergestelde zien. “Juist om-dat het maken van een online surveytegenwoordig zo verleidelijk een-voudig is, zet men eerder zelf eennieuwe vragenlijst uit dan te zoekennaar bestaande data.”Het lastige is wel, dat het vindenvan de juiste bronnen steeds moei-lijker wordt. “Daarom is het essen-tieel om het zo makkelijk mogelijkte maken om goede bestaande datate vinden. Surveydata moeten opeen gecentraliseerde plaats wordenopgeslagen, zodat een onderzoekermet één druk op de knop weet water over een bepaald onderwerp be-schikbaar is. Instituten zoals DANSen CentERdata spelen daarbij eenbelangrijke rol”, besluit Toepoel.

npso.net

NPSO adviseert in goedsurvey-onderzoek

FOCUS

“Wat is hetverschil tussen

goede en slechteonderzoeken?”

Nederlandstalig PlatformSurvey Onderzoek

Doel: adviseren over hoe jesurvey-onderzoek goed uitvoert.

Middel: het NederlandstaligPlatform voor Survey Onderzoek(NPSO).

Idee: een initiatief van weten-schappers, marktonderzoeks-bureaus en overheidsinstellingen.

Voorzitster: Vera Toepoel,Universitair docent bij Methodenen Statistiek aan de UniversiteitUtrecht.

Meer informatie: wil je op dehoogte blijven van de activiteitenvan het NPSO? Meld je dan aanop npso.net.

Binnen het literatuurhisto-risch onderzoek ontbreekthet aan een digitale structuurwaarbinnen de receptie vanauteurs kan worden geanaly-seerd. Twee projecten werkenaan een oplossing. Suzan vanDijk en Walter Ravenek

Het ontbreken van zo’n structuurwas vooral een probleem met be-trekking tot vrouwelijke auteurs.Voor velen van hen zijn recensies tevinden in de achttiende- en negen-tiende-eeuwse pers, maar hun na-men zijn vaak afwezig in moderneliteratuurgeschiedenissen. Biogra-fieën bieden geen oplossing, dielichten ons niet in over de belang-

rijkste vragen inzake het vrouwelijkauteurschap: de vragen naar (1) demate van integratie van de dames inde literaire wereld en (2) de repre-sentativiteit van individuele geval-len.

Database WomenWritersDe behoefte aan een brede aanpakvan deze problematiek werd ruimtien jaar geleden al duidelijk. NWOdigitaliserings- en internationalise-ringsgelden leidden tot de EuropeseCOST Action Women Writers in His-tory (geleid vanuit Huygens ING,2009-2013) en tot het doorontwikke-len van een aanvankelijk simpeledatabase getiteld WomenWriters.COST Action-leden uit 25 landenhebben deze gebruikt en uitgetest

met het oog op voor hen relevantevraagstellingen. Dit leidde tot tweeEuropese samenwerkingsprojecten:Travelling TexTs 1790-1914. TheTransnational Reception of Women’sWriting at the Fringes of Europe(2013-2016) en COBWWWEB: Con-nections Between Women and Wri-tings Within European Borders(2013-2014).

Europese schrijfstersHet HERA-project Travelling TexTsbestudeert de internationale invloedvan Europese schrijfsters aan dehand van hun receptie in vijf landen(Finland, Nederland, Noorwegen,Slovenië, Spanje). Gegevens overde interesse van lezers voor hunwerk - blijkend uit bijvoorbeeld de

aankoop van boeken, uit commen-taren in pers of privé-corresponden-tie, uit vertalingen - vormen de basisvoor het onderzoek naar het functio-neren van schrijfsters in hun eigentijd en naar hun historische belang.

GendersolidariteitDoor dit op internationale schaal tebestuderen, kan duidelijk wordengemaakt dat transnationale gender-solidariteit als een motor kan hebbengefunctioneerd. Het CLARIN-projectCOBWWWEB (Nederland, Noorwe-gen, Servië, Zweden en Zwitserland)bekijkt hoe het technisch mogelijk isom vrouwelijke auteurs te behande-len als onderdeel van het totale lite-raire veld (m/v).Het onderzoeksmateriaal wordt op-

geslagen in een CLARIN-compliantdata-repository, gebruik makend vande door Huygens ING ontwikkeldesoftware Timbuctoo. Hierin kunnenverschillende projecten verschil-lende varianten van gegevens op-slaan. Zo kunnen bijvoorbeeld meer-dere interpretaties van recensies vanromans naast elkaar bestaan; elk pro-ject heeft zijn eigen versie en kan in-terpretaties van andere onderzoekersal dan niet overnemen. De repositorybevindt zich in de opbouwfase; naastde gegevens uit de oude databaseworden nu Noorse en Servische ge-gevens toegevoegd. Na datacuratiezullen de gegevens voor iedereen teraadplegen zijn.databasewomenwriters.nlhuygens.knaw.nl/timbuctoo

Vera Toepoel: “Met de door ons ontwikkelde checklist kunnen geïnteresseerden inschatten of een onderzoekdeugt of niet” foto Bart van Vliet

Page 7: E DATA RESEARCH 1 OA -tijdschrift JOPD laatzienhoehetmoetdoor DANS verder ontwikkeld zal worden.” Peter Doorn, directeur van DANS : “ DANS bevordert de duurzame toegang tot digitale

E-DATA&RESEARCH juni 2014 7

De Migmap-applicatie van het

Meertens Instituut brengt het

verhuisgedrag van de Neder-

landse bevolking van de afge-

lopen honderd jaar in kaart.

Erica Renckens

Volgens onderzoeker Gerrit Bloothooft isdit het opvallendste resultaat dat is gevondenmet behulp van de Migmap-applicatie. “Deverspreiding van de bevolking is beperkt; menhecht blijkbaar aan de eigen sociale omge-ving.”Migmapmaakt gebruik van de gegevens over

De herkomstkaarten uit Migmap geven de geboorteplaats aan van de huidige inwoners van de gemeente Groningen in de leeftijd 30 tot en met 50 jaar(kaart A), de herkomst van hun ouders (kaart B), van hun grootouders (kaart C) en van hun overgrootouders (kaart D). Op deze kaarten is duidelijk te ziendat de voorouders van de huidige Groningers tussen de 30 en 50 jaar hoofdzakelijk uit dezelfde regio komen. In de online applicatie geeft een mouse-overhet exacte percentage per gemeente aan en is in een tabel de herkomst van Nederlanders uit het buitenland opgenomen. credit Jan Pieter Kunst

Vier generaties migratie in beeld

Hoe honkvast zijn Groningers?

geboorteplaats, woonplaats en generatie uitde Gemeentelijke basisadministratie per-soonsgegevens (GBA). Op basis hiervan gene-reert de online applicatie kaarten waarop staathoe generaties uit een bepaald gebied zichverspreid hebben. De gebruiker kan kiezenvoor een gemeente, regio, dialectgebied ofprovincie, waarna de resultaten in percentagesper gemeente getoond worden. Eventueel kanhij er ook voor kiezen alleen de vrouwelijke ofjuist de mannelijke lijn te volgen.

Twee soorten online kaartenHerkomstkaarten geven aan waar de huidigebewoners oorspronkelijk vandaan komen, ver-spreidingskaarten tonen waar de nakomelin-gen van de bewoners van een eeuw geleden te-

recht zijn gekomen. “Het pluspunt van Mig-map is dat de resultaten niet op een steekproefgebaseerd zijn, maar op de hele bevolking,” al-dus Bloothooft, die de algehele leiding hadover het door CLARIN-NL gesubsidieerde pro-ject.“Heel bijzonder is dat de verspreiding is ge-koppeld aan familierelaties tot vier generatiesdiep.” Het door de GBA geleverde gegevens-bestand komt uit 2006 en bevat de gegevensvan ruim 22 miljoen mensen met de Neder-landse nationaliteit. De GBA is sinds 1994 di-gitaal. “Omdat we niet verwachten dat er vanvóór 1994 betere woon- en verhuisgegevensbeschikbaar komen, is de applicatie voorlopigafgerond,” licht Bloothooft toe. Migmap isvoor iedereen online te gebruiken, maar de

applicatie is hoofdzakelijk bedoeld voor taal-kundigen en sociaal-economische onderzoe-kers, aldus de projectleider. “Voor hen kan hetvan belang zijn inzicht te krijgen in bevol-kingsveranderingen, zoals de herkomst vande huidige bevolking of de verspreiding van debevolking van een eeuw geleden. Een gebiedmet een stabiele bevolking kan duiden op be-houd van tradities, bijvoorbeeld in dialect, eneen stabiele werkgelegenheid.”De kaarten dieMigmap genereert zijn in grootformaat te downloaden en af te drukken. Daar-naast kan de gebruiker de kaarten ook alsKML-bestand downloaden zodat de migratie-kaart gecombineerd kan worden met anderekaarten in Google Earth.meertens.knaw.nl/migmap

Astrid van Wesenbeeck foto Inge Angevaare

De Koninklijke Bibliotheekheeft de behoefte aan weten-schappelijke informatie onderde Nederlandse bevolkingonderzocht. ProjectleiderAstrid van Wesenbeeck verteltover de resultaten van ditonderzoek. Inge Angevaare

“Veel wetenschappelijke artikelenzijn momenteel alleen tegen betalingaan de uitgevers beschikbaar, tenzij jetoegang hebt via de bibliotheek vanje universiteit. In het licht van deopen access-discussie wilden we we-ten of er ook buiten de wetenschapbehoefte is aan die informatie.”

Voor eigen interesseDe KB peilde in samenwerking metTNS NIPO de mening van 44.000Nederlanders van 25 jaar en ouder.VanWesenbeeck: “13% van de onder-

vraagden gaf aan interesse te hebbenin het lezen van wetenschappelijkeartikelen en 61% van deze groep leestal circa tien wetenschappelijke arti-kelen per jaar. Men gaf aan voorna-melijk voor eigen interesse te lezen;daarna volgden werk en studie. Medi-sche wetenschappen en sociale we-tenschappen werden als meest popu-laire vakgebieden genoemd door delezer die voor eigen interesse leest,gevolgd door geschiedenis. Belang-stellenden die lezen voor hun werkwaren opvallend vaak geïnteresseerdin exacte wetenschappen.”

Belanghebbenden“Nu Staatssecretaris Sander Dekkervan Onderwijs, Cultuur en Weten-schap heeft aangedrongen op vrijetoegang tot wetenschappelijke arti-kelen, zijn verschillende belang-hebbenden, zoals uitgevers, biblio-

theken en universiteiten, met elkaarin gesprek hoe de overgang naar vrijetoegang kan worden gerealiseerd.Ook de KB is hierbij betrokken,mede omdat vanaf 2015 een deel vanhet werkterrein van de openbarebibliotheken onder het mandaat vande KB valt. In Engeland heeft eensoortgelijke ontwikkeling geleid totde website Access to Research, eentweejarige pilot waarin vrije toegangtot wetenschappelijke artikelen doorde uitgevers wordt aangeboden inopenbare bibliotheken.”“Het zou mooi zijn als Nederlandzo’n voorbeeld zou volgen. Maar wemoeten niet uit het oog verliezen datde echte meerwaarde bestaat inplaats- en apparaatonafhankelijketoegang. 100% open access dus. Alsde ambities van Dekker waar wordengemaakt, zijn we in 2024 zo ver.”accesstoresearch.org.uk

De Koninklijke Bibliotheek onderzocht informatiebehoefte

Vrije toegang tot dewetenschap voor iedereen?

A B C D

Page 8: E DATA RESEARCH 1 OA -tijdschrift JOPD laatzienhoehetmoetdoor DANS verder ontwikkeld zal worden.” Peter Doorn, directeur van DANS : “ DANS bevordert de duurzame toegang tot digitale

Vrijdag 6 juni zijn de

Spinoza-premies 2014

uitgereikt, de hoogste

onderscheiding in de

Nederlandse weten-

schap. Taaltechnoloog

Piek Vossen was

vorig jaar één van de

laureaten. Erica Renckens

Naast eeuwige roem ontvangt dewinnaar van de Spinoza-premieook 2,5 miljoen euro. “Daarmeeheb ik vier projecten gedefinieerdmet als rode draad de vraag hoecomputers natuurlijke taal kunnenbegrijpen,” vertelt Piek Vossen, diesinds 2006 werkzaam is aan deVrije Universiteit. “Het is nog eengroot mysterie hoe we dat compu-ters kunnen leren, terwijl wij men-sen er ogenschijnlijk geen moeitemee hebben.”Eerder maakte Vossen voor de Eu-ropese Unie wordnets in acht talen:netwerken van woorden die op ba-sis van hun betekenis met elkaarverbonden zijn. Soms zijn de woor-den synoniemen van elkaar, somsjuist tegenstellingen, en soms heb-ben ze alleen met elkaar gemeendat ze met dezelfde kleur geasso-cieerd worden. Met behulp vanzulke wordnets kan een computerbetekenis afleiden en zo spellingcontroleren, zoekresultaten verbe-

teren en teksten interpreteren.Betekenis is voor computers eenlastig aspect van taal. “Een woordals ‘slag’ kan in het Nederlandsachttien verschillende betekenis-sen hebben, maar als we een tekstlezen zien we er maar één,” aldusVossen. Mensen leiden aan de handvan zinsbouw en context moeite-loos af welke betekenis bedoeld is,maar een computer heeft deze ken-nis niet.

Semantiek centraal“In het eerste project gaan we hetprobleem van de meerduidigheidvan woorden aanpakken.” Ook in

de overige drie projecten staat desemantiek van natuurlijke taal cen-traal. “Het is de bedoeling dat wemeer fundamenteel inzicht krijgenin de manier waarop taal betekeniskrijgt,” legt Vossen uit. Daarvoorkijken de onderzoekers in zijngroep onder andere naar de relatietussen woorden, concepten, per-ceptie en het brein, naar de invloedvan het wereldbeeld van de auteurop teksten en naar de rol van de le-zer bij het begrijpen van teksten.“Uiteindelijk hopen we machineste kunnen maken die met mensenkunnen communiceren aan dehand van natuurlijke taal. Daarbij

richten we ons niet direct opspraak, maar wel op de betekenis.”

Resultaten delenVossen: “Ieder project kijkt naarandere deelaspecten, maar er zijnook veel verbanden waarbij pro-jecten elkaars deelresultaten kun-nen gebruiken. We hebben tienmensen aangesteld, onze groep isverdubbeld. We werken enthou-siast samen aan een grote uitda-ging, ik hoop dat de goede sfeer ensamenwerking die we nu hebbenook in een grotere groep blijft be-staan.”vossen.info

8 juni 2014 E-DATA&RESEARCH

COLUMN

GELEZEN

In 2004 was ik bij een bijeen-komst in de Koninklijke Biblio-

theek over massadigitalisering.Eén van de sprekers was AstridVerheusen, programmaleiderdigitale bibliotheek. Met enigegêne stipte Verheusen één van decentrale problemen van massa-digitalisering aan, namelijk hetontbreken van een register waarinwordt vastgelegd wie wat aan hetdigitaliseren is.Zij liet afbeeldingen zien van en-kele reeksen die door diverse bi-bliotheken en instellingen warengedigitaliseerd. Steeds dezelfdereeks, steeds met overheidssub-sidie.In de zaal ging een besmuiktgelach op – het probleem wasalgemeen bekend.Dat was tien jaar geleden.Een paar maanden geleden was ikbij een internationale bijeenkomstin de Koninklijke Bibliotheekover textmining. EenAmerikaansespreker vroeg onder meer: ‘Weetiemand of er een centraal registerbestaat waarin je kunt nazien wiewat heeft gedigitaliseerd? Ik hebde indruk dat er veel dubbel werk

wordt gedaan en dat lijkt mijzonde van het geld en van deinspanning.’In de zaal bleef het stil.

Is het werkelijk van belang dat erzo’n register komt? Ja, en niet

alleen omdat het zonde is vangeld en tijd dat er – nog steeds –zoveel veel dubbel werk wordtverricht. Een andere reden houdtverband met een voortkabbelendediscussie in E-data.In oktober schreef ik in E-data datik iemand ken die af wil van eencollectie van 13.000 boeken. Hetgaat om een met smaak en kennisopgebouwde collectie boeken uiten over de 19de eeuw. Je zou zo’nspecialistische collectie aan deKB moeten kunnen schenken,stelde ik, onder voorwaarde dat je

’m binnen een bepaalde tijd indigitale vorm terugkrijgt.De redactie van E-data legde ditidee voor aan Jan Bos, hoofd col-lecties van de KB. Zijn antwoord,kort samengevat: de KB zou diedienst graag willen leveren, maarkan dit niet. Bos: “Met name deselectie is veel duurder dan je zoudenken. Je moet eerst nagaan watwe al gedigitaliseerd hebben, envan wat er overblijft moet je allerechten napluizen.’’Inderdaad, het napluizen vanrechten kan een tijdrovende endus kostbare zaak zijn. Maar na-zien wat er al gedigitaliseerd is,zou een fluitje van een cent moe-ten zijn. Niet alleen de KB, maaralle instellingen die digitaliseren,zouden dit met bepaalde techni-sche specificaties moeten vastleg-

gen in een register. In PiCarta ofWorldCat bijvoorbeeld. Als nietalleen bibliotheken dat wereld-wijd zouden doen, maar bijvoor-beeld ook Google, zou dit heel veeldubbel werk kunnen voorkomen.

W aarom is het in tien jaarniet gelukt om zo’n cen-

traal register op poten te zetten?Desinteresse, eigenwijsheid enonwil, vermoed ik. ‘Eigen instel-

foto Leo van Velzen

Managing and Sharing ResearchData. A guide to good practice.Louise Corti, Veerle van denEynden, Libby Bishop & MatthewWoollard. Uitgeverij Sage. 2014.René van Horik

Vier auteurs, allen werkzaam bijhet UK Data Archive, schreven dithandboek over het beheren endelen van onderzoeksdata. Menricht zich zowel op de onderzoe-ker (van student tot professor) alsop de dataprofessionals, de on-dersteuners.Het handboek biedt een actueelen compleet overzicht. Jammerdat het niet als open access publi-catie beschikbaar is. Het zou danveel meer lezers bereiken. Nietalle elf hoofdstukken zijn van be-lang voor alle doelgroepen. Dushet is zaak goed de inhoudsop-gave te bekijken en te bepalenwelk onderdeel bruikbaar is. Elkhoofdstuk bevat een aantal prakti-sche oefeningen en een uitge-breide literatuurlijst. Ook is er eenbegeleidende website met achter-grondinformatie en databronnendie behandeld worden. Het boekis sterk gericht op de Engelsspre-kende wereld en mist daarom eenaantal belangrijke niet-Engelstaligeinitiatieven. Er is relatief veel aan-dacht voor legal and ethical issuesin sharing data, met goed uitge-werkte oefeningen, bijvoorbeeldmanieren om onderzoeksdata teanonimiseren. Voor de onderzoe-ker zijn met name de laatste driehoofdstukken interessant.Ze hebben betrekking op collabo-rative research, gebruik van onder-zoekdata van anderen en hetpubliceren en citeren van onder-zoeksdata.ukdataservice.ac.uk/manage-data/handbook

ling eerst’ is het motto van velen,het algemeen belang staat veellager op de ladder.Ik heb weleens voorgesteld ominstellingen alleen geld voor digi-talisering te geven als ze kunnenaantonen dat ze meewerken aaneen centraal register. Dat was in2011, naar aanleiding van eenstuk in NRC Handelsblad getiteld‘Het digitale drama’. Uit dat stukbleek onder meer dat niemandwist hoeveel geld er tussen 2004en 2011 aan digitalisering wasuitgegeven. De schattingen liepenuiteen van 50 tot 200 miljoeneuro.En waarom was en is daar zoslecht zicht op te krijgen? U voelt’m al aankomen: mede vanwegehet ontbreken van een centraalregister.Stuitend hoe lang het soms duurtvoordat een idee dat zo voor dehand ligt, wordt ingevoerd.

Ewoud SandersTaalhistoricus en journalist.Sanders is vaste medewerker vanonder meer NRC Handelsblad enOnze Taal.

Taaltechnoloog Piek Vossen, winnaar van de Spinozapremie 2013 foto Studio VU

Waarom is er nog steeds geendigitaliseringsregister?

Communiceren machinesstraks in mensenlijke taal?