Dendro4Artcombineertdendrochronologieenkunsthistorie ...Aanditnummerwerktenmee: Valentijn Gilissen,...

8
Het RKD - Nederlands Instituut voor Kunst- geschiedenis stelt een grote database over houtonderzoek in kunst- historische context beschikbaar. Sytske Weidema Door het meten van jaarringen in hout stellen dendrochronologen vast vanaf wanneer een kunstwerk kan zijn gemaakt. De gemeten gegevens tonen de breedtes van iedere waar- genomen jaarring in een plank die is verwerkt in het kunstobject. De jaar- ringbreedte verschilt per boomsoort en wordt bovendien beïnvloed door het klimaat tijdens de groei van een boom. Daardoor ontstaan unieke variaties in de jaarringbreedtes per periode en houtsoort. Dit jaar- ringenpatroon wordt vergeleken met jaarringchronologieën, referentie- kalenders van duizenden bomen. Zo worden de leeftijd en herkomst van het hout bepaald. Wood for Goods Duizenden van deze dendrochrono- logische gegevens zijn nu bijeen- gebracht en gecombineerd met achtergrondinformatie en literatuur. Het resultaat is online beschikbaar gemaakt in Dendro4Art, een inter- nationale samenwerking van het RKD - Nederlands Instituut voor Kunstgeschiedenis, het Center for Art Technological Studies and Con- servation van de National Gallery of Denmark en verschillende onder- zoekers. De basis wordt gevormd door dendrochronologie-rapporten, meetreeksen en -werktekeningen van em. prof. Peter Klein van de Universität Hamburg vanaf de jaren 70 tot heden. Dr. Marta Domínguez Delmás leidt aan de UvA het NWO Veni-project Wood for Goods en is als weten- schappelijk adviseur verbonden aan Dendro4Art: “De combinatie van dendrochronologische en kunsthis- torische data maakt de RKD-data- base uniek. In andere dendrochro- nologische databases ontbreekt de relatie met de historische context. Deze combinatie geeft ons een waardevol gereedschap om bredere onderzoeksvragen te beantwoorden, bijvoorbeeld over historische hout- handel in Noord-Europa en de ont- wikkeling daarvan door de tijd heen.” Nieuwe data Het portaal is gekoppeld aan RKD- technical, een database met uiteen- lopende technische onderzoeks- gegevens over kunstwerken. Ieder ‘dendro-record’ bevat per kunst- werk gegevens zoals houtsoort, jongste-, en aantal jaarring(en), mogelijke boom-veldatum, vanaf wanneer het kunstwerk kan zijn vervaardigd, enzovoort. Via het RKD wordt continu nieuwe data toe- gevoegd aan Dendro4Art. Bij dendrochronologie is diversiteit en duurzaamheid van de data belangrijk. Domínguez Delmás: “Digitale repositories zoals Dendro- 4Art zijn nodig om data en metadata over kunsthistorische objecten voor de lange-termijn te kunnen borgen. Dat bevordert de transparantie van onderzoeksresultaten en bevordert het hergebruik van deze data voor verder onderzoek. Dat is belangrijk, want toegang tot kunstobjecten is beperkt.” dendro4art.org INHOUD 3 Hoe zoekt de onderzoeker naar secundaire data? 4 Ook deze datasets zijn sinds kort beschikbaar 4 Teamwork verbetert OCR gotische druk 5 Van Eijnatten wil research community versterken 6 Jong Talent Stork maakt data machine-leesbaar 7 ODISSEI meet sociale hartslag Nederlanders 8 Met AI naar algoritme met 90% score 8 Gastcolumnist Marieke over tijd voor nieuwe app Jaargang 14 | nummer 3 Nieuwsbrief over data en onderzoek in de alfa- en gamma- wetenschappen. E-data & Research verschijnt drie keer per jaar en wordt mogelijk gemaakt door: CentERdata, CLARIAH,DANS, KNAW Humanities Cluster, de Koninklijke Bibliotheek, ODISSEI en het Rijksmuseum. E - DATA & RESEARCH E - DATA & RESEARCH juni 2020 1 Scan deze QR-code om edata.nl te bezoeken. Dendro4Art combineert dendrochronologie en kunsthistorie Houtonderzoek verrijkt kennis over kunst Dendrochronoloog dr. Domínguez Delmás (UvA) bestudeert het hout van het schilderij Groentenmarkt van Joachim Beuckelaer (KMSK Antwerpen). Onderzoek naar het hout in kunstwerken kan extra informatie blootleggen over deze objecten. Credits: Dr. Marta Domínguez Delmás E-data wordt gratis toegezonden aan relaties van de stakeholders. Ook een uitgave ontvangen? Mail de redactie: [email protected]. De minor Data Wise aan de Rijksuniversiteit Groningen leert studenten om vanuit verschillende disciplines met data te werken. Lucas van der Meer “Studenten breken hun hoofd over vragen als: hoe kan data worden ge- bruikt als bewijs? Is het ethisch ver- antwoord om algoritmen toe te passen op een maatschappelijk pro- bleem? Hoe kunnen we inzicht krij- gen met behulp van visualisaties?” Aan het woord is Gert Stulp, socio- loog aan de Rijksuniversiteit Gro- ningen (RUG) en mede-initiator van de minor Data Wise. “De minor is opgezet om studenten in aanraking te brengen met verschillende in- valshoeken van verantwoord data- gebruik, zodat ze in hun carrière met relevante experts kunnen com- municeren.” Leren van elkaar In september 2019 startte de minor met het maximum van 60 studenten. Programmadirecteur Anne Beau- lieu: “De kern van de minor is een collaborative data project waarin een team van vijf studenten werkt aan een data gerelateerde casus van een externe organisatie zoals Philips of het Nederlandse Rode Kruis. Ter voorbereiding op het dataproject krijgen de studenten de vakken in- troduction to data, waarin ze een basis en ‘gezamenlijke taal’ worden bijgebracht en dynamics of multi- disciplinary teamwork, waarin stu- denten leren in teams te werken en elkaars vaardigheden te herkennen en waarderen. Het is prachtig om te zien dat elke student vanuit diens eigen expertise kijkt – van bedrijfs- kunde tot psychologie en astrono- mie tot geschiedenis – maar dat ze alleen gezamenlijk tot een oplos- sing komen. Hierdoor leren de studenten de taal van elkaars disci- pline te spreken.” Gert vult aan: “Een student sociale wetenschap- pen heeft meer ervaring met een kri- tische kijk naar data over mensen en het trekken van gerechtvaardigde conclusies, een student informatica zal vaardiger zijn in het verwerken en analyseren van data.” Studenten kiezen ook nog drie uit zes verdie- pende keuzevakken. Voor onderzoekers Op de vraag of elke sociale- of gees- teswetenschapper goed moet kun- nen programmeren, antwoorden beide ontkennend. Anne: “Niet ieder- een hoeft te kunnen programmeren om iets zinnigs met data te kunnen doen, net zoals niet iedereen weet Rijksuniversiteit Groningen brengt studenten de basis van data bij Succesvolle minor Data Wise Lees verder op pagina 2

Transcript of Dendro4Artcombineertdendrochronologieenkunsthistorie ...Aanditnummerwerktenmee: Valentijn Gilissen,...

Page 1: Dendro4Artcombineertdendrochronologieenkunsthistorie ...Aanditnummerwerktenmee: Valentijn Gilissen, Kathleen Gregory, Marjan Grootveld, Marieke Houben-Van Her ten, Janno de Jong, Rutger

Het RKD - Nederlands

Instituut voor Kunst-

geschiedenis stelt een

grote database over

houtonderzoek in kunst-

historische context

beschikbaar. Sytske Weidema

Door het meten van jaarringen inhout stellen dendrochronologen vastvanaf wanneer een kunstwerk kanzijn gemaakt. De gemeten gegevenstonen de breedtes van iedere waar-genomen jaarring in een plank die isverwerkt in het kunstobject. De jaar-ringbreedte verschilt per boomsoorten wordt bovendien beïnvloed doorhet klimaat tijdens de groei van eenboom. Daardoor ontstaan uniekevariaties in de jaarringbreedtesper periode en houtsoort. Dit jaar-ringenpatroon wordt vergeleken metjaarringchronologieën, referentie-kalenders van duizenden bomen. Zoworden de leeftijd en herkomst vanhet hout bepaald.

Wood for GoodsDuizenden van deze dendrochrono-logische gegevens zijn nu bijeen-gebracht en gecombineerd metachtergrondinformatie en literatuur.Het resultaat is online beschikbaargemaakt in Dendro4Art, een inter-nationale samenwerking van hetRKD - Nederlands Instituut voorKunstgeschiedenis, het Center forArt Technological Studies and Con-servation van de National Gallery ofDenmark en verschillende onder-zoekers. De basis wordt gevormddoor dendrochronologie-rapporten,meetreeksen en -werktekeningen

van em. prof. Peter Klein van deUniversität Hamburg vanaf de jaren’70 tot heden.Dr. Marta Domínguez Delmás leidtaan de UvA het NWO Veni-projectWood for Goods en is als weten-schappelijk adviseur verbonden aanDendro4Art: “De combinatie vandendrochronologische en kunsthis-torische data maakt de RKD-data-base uniek. In andere dendrochro-nologische databases ontbreekt derelatie met de historische context.Deze combinatie geeft ons eenwaardevol gereedschap om bredereonderzoeksvragen te beantwoorden,

bijvoorbeeld over historische hout-handel in Noord-Europa en de ont-wikkeling daarvan door de tijdheen.”

Nieuwe dataHet portaal is gekoppeld aan RKD-technical, een database met uiteen-lopende technische onderzoeks-gegevens over kunstwerken. Ieder‘dendro-record’ bevat per kunst-werk gegevens zoals houtsoort,jongste-, en aantal jaarring(en),mogelijke boom-veldatum, vanafwanneer het kunstwerk kan zijnvervaardigd, enzovoort. Via het

RKD wordt continu nieuwe data toe-gevoegd aan Dendro4Art.Bij dendrochronologie is diversiteiten duurzaamheid van de databelangrijk. Domínguez Delmás:“Digitale repositories zoals Dendro-4Art zijn nodig om data en metadataover kunsthistorische objecten voorde lange-termijn te kunnen borgen.Dat bevordert de transparantie vanonderzoeksresultaten en bevorderthet hergebruik van deze data voorverder onderzoek. Dat is belangrijk,want toegang tot kunstobjecten isbeperkt.”dendro4art.org

INHOUD

3Hoe zoekt de onderzoekernaar secundaire data?

4Ook deze datasets zijnsinds kort beschikbaar

4Teamwork verbetertOCR gotische druk

5

Van Eijnatten wil researchcommunity versterken

6Jong Talent Stork maaktdata machine-leesbaar

7ODISSEI meet socialehartslag Nederlanders

8Met AI naar algoritmemet 90% score

8Gastcolumnist Mariekeover tijd voor nieuwe app

Jaargang 14 | nummer 3

Nieuwsbrief overdata en onderzoekin de alfa- en gamma-wetenschappen.

E-data & Research verschijntdrie keer per jaar en wordtmogelijk gemaakt door:CentERdata, CLARIAH, DANS,KNAW Humanities Cluster,de Koninklijke Bibliotheek,ODISSEI en het Rijksmuseum.

E-DATA &RESEARCH

E-DATA & RESEARCH juni 2020 1

Scan dezeQR-code omedata.nlte bezoeken.

Dendro4Art combineert dendrochronologie en kunsthistorie

Houtonderzoek verrijktkennis over kunst

Dendrochronoloog dr. Domínguez Delmás (UvA) bestudeert het hout van het schilderij Groentenmarkt vanJoachim Beuckelaer (KMSK Antwerpen). Onderzoek naar het hout in kunstwerken kan extra informatieblootleggen over deze objecten. Credits: Dr. Marta Domínguez Delmás

E-data wordt gratistoegezonden aan relatiesvan de stakeholders. Ookeen uitgave ontvangen?Mail de redactie:[email protected].

De minor Data Wise aan deRijksuniversiteit Groningenleert studenten om vanuitverschillende disciplinesmet data te werken.Lucas van der Meer

“Studenten breken hun hoofd overvragen als: hoe kan data worden ge-bruikt als bewijs? Is het ethisch ver-antwoord om algoritmen toe tepassen op een maatschappelijk pro-bleem? Hoe kunnen we inzicht krij-gen met behulp van visualisaties?”Aan het woord is Gert Stulp, socio-loog aan de Rijksuniversiteit Gro-ningen (RUG) en mede-initiator vande minor Data Wise. “De minor is

opgezet om studenten in aanrakingte brengen met verschillende in-valshoeken van verantwoord data-gebruik, zodat ze in hun carrièremet relevante experts kunnen com-municeren.”

Leren van elkaarIn september 2019 startte de minormet het maximum van 60 studenten.Programmadirecteur Anne Beau-lieu: “De kern van de minor is eencollaborative data project waarineen team van vijf studenten werktaan een data gerelateerde casus vaneen externe organisatie zoals Philipsof het Nederlandse Rode Kruis. Tervoorbereiding op het dataproject

krijgen de studenten de vakken in-troduction to data, waarin ze eenbasis en ‘gezamenlijke taal’wordenbijgebracht en dynamics of multi-disciplinary teamwork, waarin stu-denten leren in teams te werken enelkaars vaardigheden te herkennenen waarderen. Het is prachtig om tezien dat elke student vanuit dienseigen expertise kijkt – van bedrijfs-kunde tot psychologie en astrono-mie tot geschiedenis – maar dat zealleen gezamenlijk tot een oplos-sing komen. Hierdoor leren destudenten de taal van elkaars disci-pline te spreken.” Gert vult aan:“Een student sociale wetenschap-pen heeft meer ervaring met een kri-

tische kijk naar data over mensen enhet trekken van gerechtvaardigdeconclusies, een student informaticazal vaardiger zijn in het verwerkenen analyseren van data.” Studentenkiezen ook nog drie uit zes verdie-pende keuzevakken.

Voor onderzoekersOp de vraag of elke sociale- of gees-teswetenschapper goed moet kun-nen programmeren, antwoordenbeide ontkennend.Anne: “Niet ieder-een hoeft te kunnen programmerenom iets zinnigs met data te kunnendoen, net zoals niet iedereen weet

Rijksuniversiteit Groningen brengt studenten de basis van data bij

Succesvolle minor Data Wise

Lees verder op pagina 2

Page 2: Dendro4Artcombineertdendrochronologieenkunsthistorie ...Aanditnummerwerktenmee: Valentijn Gilissen, Kathleen Gregory, Marjan Grootveld, Marieke Houben-Van Her ten, Janno de Jong, Rutger

SURF VREinformatiebijeenkomstLucas van der MeerIn het huidige onderzoekslandschapwordt interdisciplinair en internati-onaal samenwerken, het delen vandata en het beschikken over highperformance rekenkracht steeds be-langrijker. Een Virtual Research En-vironment (VRE), of virtuele onder-zoeksomgeving, biedt hiervoor eenuitkomst. Hoger onderwijsinstellin-gen kunnen eenvoudig hun eigenschaalbare VRE opzetten met dedoor SURF ontwikkelde ResearchCloud. Kennis hierover werd op 7april gedeeld via Zoom, met een re-cordaantal van 90 deelnemers.Rogier de Jong, Ivar Janmaat enHylke Koers (allen SURF) lichttenenkele componenten van SURF Re-search Cloud toe: SURF ResearchDrive, SURF Research Access Ma-nagement (SRAM) en iRODS. SURFResearch Drive stelt onderzoekersin staat om op een veilige manierbestanden met elkaar te delen.SRAM, voorheen Science Collabo-ration Zone, biedt mogelijkhedenom de identiteit van gebruikers vastte stellen, deze in groepen in te de-len en toegang te verlenen. SRAMwordt naar verwachting in het derdekwartaal van 2020 beschikbaar ge-steld. iRODS biedt oplossingen voorresearchdatamanagement, waaron-der annotatie en herleidbaarheid vanonderzoeksgegevens. De recentaangebrachte koppeling tusseniRODS en Research Drive wordt dekomende periode getest en uitge-breid. SURF verwacht dat het ookiRODS binnenkort kan aanbieden.Andere componenten van SURF Re-search Drive zijn het centraal ad-ministreren van gebruik en het vir-tualiseren van omgevingen. De or-ganisatoren benadrukten dat hetVRE-ecosysteem continue in ont-wikkeling is en dat SURF-leden hierinspraak in hebben. Ten slotte lichtteElo Bosma toe hoe het Erasmus MC(EMC) VRE’s heeft ingericht, waar-bij is gekozen voor een combinatievan Microsoft Azure plus compo-

nenten van SURF. Hierin werkt hetEMC in het consortium anDREanauw samen met het RadboudUMC. Het EMC had gepland eind2020 zo’n 100 VRE’s te hebbeningericht, maar verwacht door thuis-werken dat punt veel eerder tebereiken.Meer informatie over de volgendeVRE-bijeenkomst staat op de web-site van SURF.surf.nl

Trainingsworkshopover aanbod in EOSCEllen LeenartsIn allerlei Europese projecten enonderzoeksinfrastructuren wordtgewerkt aan het ontwikkelen enaanbieden van services in de Euro-pean Open Science Cloud (EOSC)voor onderzoekers en onderzoeks-instellingen, services op het gebiedvan dataopslag, open en FAIR data,maar bijvoorbeeld ook voor de ana-lyse van big data. Om deze servicesgoed te kunnen gebruiken, wordteen scala aan trainingen georgani-seerd voor verschillende doelgroe-pen, variërend van service provi-ders tot onderzoekers. Zo kwameneind februari dertig trainingscoördi-natoren uit verschillende Europeseprojecten en onderzoeksinfra-structuren in Den Haag bijeen omte zorgen dat trainingsmaterialen endiensten op het gebied van trainin-

gen, net als services en data, ge-makkelijker toegankelijk worden.In samenwerking met de Europeseinfrastructuren OpenAIRE, EGI enEUDAT en met subsidie van hetEOSC-secretariaat was een twee-daags programma opgezet. Na korteintroducties door Rene Belsø vande EOSC Working Group on Rulesof Participation en Iryna Kuchmavan de EOSC Skills and TrainingWorking Group was het tijd voorde trainingscoördinatoren om geza-menlijk aanbevelingen te formu-leren op het gebied van Rules ofParticipation voor het geven vantrainingen in de EOSC en om prak-tische richtlijnen op te stellen vooraankomende trainers en trainings-organisaties die willen deelnemenaan de EOSC.Gedurende de talrijke breakout ses-sies werd gewerkt naar een rapportmet aanbevelingen. Dit rapport isaan de EOSC-werkgroepen gepre-senteerd en openbaar gemaakt viaZenodo.DOI: 10.5281/zenodo.3739055

Webinar SSHOC overdataopslagdienst voor SSHMariekeWillemsOp 18 maart organiseerde SSHOCeen webinar voor serviceprovidersvan het Consortium van EuropeanSocial Science Data Archives(CESSDA), om te bespreken wat hun

ideeën zijn over een SSHOC Data-verse service.SSHOC staat voor Social Sciences &Humanities Open Cloud. SSHOCheeft als doel om initiatieven van dehuidige Europese onderzoeksinfra-structuren op het gebied van Soci-ale- en Geesteswetenschappen(SSH) beter op elkaar en op de Eu-ropese Open Science Cloud (EOSC)te laten aansluiten, om zo onder-zoekers binnen het SSH-domein be-ter van dienst te zijn.Eén van de diensten die SSHOC ont-wikkelt, is een dataopslagdienstvoor SSH-instellingen. Deze nieuwedienst, gebaseerd op Dataverse-soft-ware, zal worden aangepast aan debehoeften van de Europese onder-zoeksinfrastructuren, denk hierbijaan vertalingen van de User Inter-face, aanpassing van het metadataformaat en de ontwikkeling van dataviewers. Dataverse (dataverse.org)is open source software, ontwikkelddoor het instituut voor kwantitatievesociale wetenschappen (IQSS) vande Universiteit van Harvard. SSHOCDataverse wordt ontwikkeld onderleiding van DANS.SSHOC’s virtuele discussie starttemet een presentatie van de huidigefunctionaliteit, gevolgd door eenoverzicht van nieuw te ontwikke-len features. Na deze presentatieswerd input van de deelnemers ver-zameld, en richtte de geëngageerdediscussie zich op essentiële vereis-ten voor een dergelijke service,voorkeuren, organisatie en noodza-kelijke training. Bijna alle CESSDAserviceproviders waren vertegen-woordigd. In totaal namen 47 men-sen deel aan de discussie.De volgende stap in de SSHOC Da-taverse ontwikkeling zijn virtuelediscussies met drie andere Europeseonderzoeksinfrastructuren binnenhet project: DARIAH, CLARIN enE-RIHS. De opnamen en presentatievan de virtuele discussie staan op dewebsite van SSHOC.sshopencloud.eu/sshoc-webinar-cessda-service-providers-dataverse

2 juni 2020 E-DATA & RESEARCH

GEHOORD & BIJGEWOOND

gniniart COSEhetnig

w

noitipacitraPfs oeluR

stlusrehopskrow am

fs oeluRWGCSOE

sarieiicfenebnai

gniniartrofoipaca

noitipacitraPs oe

ofP

sderivoprecvirsegniniartroecdaniuglacitcar

gniniarTndaslilkS

WGCSOE

Tijdens de EOSC Training workshop brainstormden dertig trainings-coördinatoren over de vraag hoe trainingsmaterialen en diensten ophet gebied van trainingen gemakkelijker toegankelijk kunnen worden.Credits: Janno de Jong

COLOFON Uitgever: E-data & Research. Redactieadres: Anna van Saksenlaan 51, 2593 HW Den Haag, 070-3494450, [email protected], edata.nl.Hoofd-/eindredacteur: Heidi Berkhout. Redactie: Marika de Bruijne, Steven Claeyssens, Maarten Heerlien, Mathilde Jansen, Lucas van der Meer, Erica Renckens, MarionWittenberg. Redactiesecretariaat: Lucas Pasteuning. Aan dit nummer werkten mee: Valentijn Gilissen, Kathleen Gregory, Marjan Grootveld, Marieke Houben-Van Herten,Janno de Jong, Rutger van Koert, Ellen Leenarts, Iris Muste, Steamwork Graphics, Thijs Stork Photography, Jerry de Vries, Sytske Weidema, Marieke Willems.Opmaak: Colette Sloots, Haarlem. Productie: Amsterdam University Press. Druk: Ten Brink, Meppel. Webmaster: Sonja Duijkers Oplage: 5200 papier, 5000 digitaal.ISSN: 1872-0374. We hebben getracht alle belanghebbenden met betrekking tot het gebruikte beeldmateriaal te benaderen. Degenen die menen rechten te kunnen doengelden, kunnen zich tot ons wenden. Toezending papieren en/of digitale versie is kosteloos aan relaties van de stakeholders en studenten in de alfa- en gammarichtingen.

OVERNEMEN ARTIKELENWilt u een artikel uit dit blad overnemen?Dat mag altijd, maar vermeld wel de bron (E-data& Research) en de naam van de auteur van hetartikel. Neem ook contact op met de hoofd-redacteur (zie colofon) om door te geven waarartikelen geplaatst worden.

Rust zachtMachteld Maris (1970-2020)

Stil en verdrietig zijn we om hetoverlijden van Machteld Maris.Machteld was redactielid van ditblad namens het KNAW HumanitiesCluster in de periode 2017-2019.We hebben haar leren kennen alseen bevlogen mens, met hart voorhet blad en aandacht voor iedereen.We wensen haar naasten veelkracht in deze moeilijke tijd.

EC geeft 5 miljoeneuro aan ESSEuropean Social Survey (ESS)heeft van de Europese Commis-sie zo’n 5 miljoen euro aan fi-nanciering ontvangen. Daarmeekan ESS sinds begin dit jaar hetproject ‘SUSTAIN 2’ uitvoeren.ESS is een tweejaarlijks onder-zoek in verschillende Europeselanden. Duizenden burgers be-antwoorden tijdens persoonlijkeinterviews een gestandaardi-seerde vragenlijst, met vragenover bijvoorbeeld menselijkewaarden, immigratie en klimaat-verandering. Een groot deel vande nieuwe financiering komt tengoede aan centrale ondersteu-nende tooling voor de dataver-zameling in 12 landen. ESSwerkt hierbij nauw samen metCentERdata. CentERdata gaatverschillende nationale teamsvoorzien van software voorcomputer-assisted personal in-terviewing (CAPI), managementvan vertalingen, steekproefbe-heer en data-oplevering. (MdB)

europeansocialsurvey.org

Tool voor verhogenFAIRness dataIn het kader van het FAIRsFAIR-project werkt DANS aan eenFAIR self-assessment tool voordata deponeerders. De toolbiedt zo’n vijftien assessment-vragen die alle aspecten vanFAIR reflecteren. Door deze vra-gen te beantwoorden, ontvangtde deponeerder een score, metbijbehorende tips voor het ver-hogen van de FAIRness van dedataset. De deponeerder kandeze tips opvolgen alvorens dedata bij DANS te deponeren.Een eerste versie van de toolgenaamd SATIFYD bevindt zichmomenteel in de testfase. NaastSATIFYD werkt DANS aan eengenerieke versie van de tool,die door andere repositorieseenvoudig aangepast en geïm-plementeerd kan worden. (JdV)satifyd.dans.knaw.nl/

KORT

hoe een auto precies werkt om goedte kunnen rijden.” Gert voegt toe:“Maar het is wel nuttig omminstenseen beetje te weten wat program-meren precies inhoudt om zinvolmet computerexperts te kunnenspreken.” Toch vindt Gert het jam-

mer dat studenten in de sociale- engeesteswetenschappen niet meer inaanraking komen met programme-ren: “Opleidingen kunnen helpenom de drempel van het werken metcomputercode te verlagen door voorstatistiekonderwijs het technischeprogramma R te gebruiken in plaatsvan een programma met een volle-dige grafische interface als SPSS.Hierdoor leren ze iets van program-meren, maar krijgen ze als bonusook meer inzicht in hun data.”

Anne: “Onze studenten krijgen eengoede basis om in de wetenschap tewerken. Onderzoek wordt steedsmeer in teams en in gesprek met demaatschappij gedaan. Het zou mooizijn als de aanpak van dit pro-gramma uitgebreid kan worden naargraduate programmes voor onder-zoekers. Er is behoefte aan innova-tie én verantwoord gebruik van data,en dat leer je bij Data Wise.”rug.nl/gmw/education/minor/datawise

Vervolg van pagina 1

Minor RUGData Wise

Machteld Maris.Credits: Martin van Welzen

Page 3: Dendro4Artcombineertdendrochronologieenkunsthistorie ...Aanditnummerwerktenmee: Valentijn Gilissen, Kathleen Gregory, Marjan Grootveld, Marieke Houben-Van Her ten, Janno de Jong, Rutger

Hergebruik van door anderen

gecreëerde data kan een veel-

belovende onderzoeksstrategie

zijn, maar er is weinig bekend

over de manier waarop

gebruikers naar dergelijke

data zoeken. Kathleen Gregory

Data-archieven spelen een belangrijke rol bijhet ontsluiten van zogenoemde secundairedata. Toch is er maar weinig bekend over demanier waarop gebruikers naar deze data zoe-ken. Wat zijn hun motieven? Waarvoor heb-ben ze de data nodig?Wat voor soort data zoe-ken ze?

1.677 respondentenOnlangs hebben onderzoekers van DANS, deUniversiteit Maastricht en de Universiteit vanAmsterdam de resultaten van het grootste be-kende onderzoek naar deze vragen gepubli-ceerd in het kader van een project gefinancierddoor NWO creative Industries Grant insamenwerking met Elsevier 1.677 responden-ten uit 105 landen, uit verschillende discipli-nes, met verschillende rollen en in verschil-lende fasen in hun academische loopbaan,vulden de vragenlijst in. De uitkomsten vanhet onderzoek, gepubliceerd in het artikel

Lost or found? Discovering data needed forresearch (Gregory, K., Groth, P., Scharnhorst,A. &Wyatt, S. (2020). Harvard Data ScienceReview. DOI: 10.1162/99608f92.e38165eb),geven inzicht in de databehoeften van de res-pondenten, de bronnen en strategieën die zegebruiken om data te vinden en de criteria die

ze hanteren om die data te evalueren.

De onderzoeksgegevens zijn vrij toeganke-lijk via EASY: Gregory, K.M (Data Archiveand Networked Services) (2020): DataDiscovery and Reuse Practices in Research.Dit artikel is een vertaling van het

Engelstalige artikel van Kathleen Gregory,M.A., MSLIS, PhD-kandidaat, werkzaambij het project Re-SEARCH bij Research& Innovatie binnen DANS.

DOI: 10.17026/dans-xsw-kkeq

E-DATA & RESEARCH juni 2020 3

Biochemie

Observationeel/empirisch

Experimenteel

Gesimuleerd

Afgeleid/samengesteldOverig

BiologieChemische technologie

ChemieMateriaalwetenschap

Sociale wetenschappenLandbouw

BedrijfskundeGeneeskunde

NatuurkundeImmunologie

FarmacologieDiergeneeskunde

EconomieAstronomie

Aardwetenschap en planetologieEnergie

Bouwkunde en technologieMilieuwetenschap

Kunst en geesteswetenschappen

WiskundeComputerwetenschapInformatiewetenschap

Tandheelkunde

De cruciale rol van data-archieven

Hoe zoeken gebruikers naardata van andere onderzoekers?

Uit ‘Diversiteit van de data’ (linker grafiek) blijkt de diversiteit van de data die onderzoekers uit verschillende disciplines nodig hebben.Iets meer dan de helft van de respondenten geeft aan data van buiten de eigen discipline nodig te hebben.‘Gebruik van data’ (rechter grafiek) toont het kerngebruik van de data door de respondenten; 71% zei data te gebruiken als basis vooreen nieuwe studie. De grafiek laat zien dat het datagebruik wordt bepaald door disciplinaire domeinen en methoden; zo worden domeinendie doorgaans gebruikmaken van computeronderzoeksmethoden, geassocieerd met het gebruik van data voor model- en algoritme-input.Voor beide afbeeldingen geldt: statistisch significante associaties gedetecteerd met Bonferroni-correctie voor gelijktijdige paarsgewijzemarginale onafhankelijkheid; n = 1677; significantieniveau: p <0,05). Credits: Kathleen Gregory en Steamwork Graphics

ComputerwetenschapNieuwe studieNieuwe methoden

Benchmarking

Calibratie

Verificatie

Invoer

Trends

Vergelijkingen

Samenvattingen,visualisaties en tools

Integratie

AstronomieChemische technologie

Bouwkunde en technologie

Energie

BiochemieMateriaalwetenschap

NatuurkundeAardwetenschap en

planetologieBesliskunde

WiskundeSociale wetenschappen

Bedrijfskunde

Milieuwetenschap

Multidisciplinair

Biologie

Informatiewetenschap

Gebruik van dataDiversiteit van de data

Benieuwd naar informa-

tie over de Nederlandse

wetenschap? De portal

NARCIS.nl biedt steeds

meer informatie door de

automatische koppeling

van persistent identifiers

in een PID Graph.

Ricarda Braukmann

Een persistent identifier (PID) isvergelijkbaar met een Burgerser-vicenummer voor digitale objecten;het is een uniek en blijvend nummerwaaraan allerlei informatie is ge-koppeld. Het gebruik van PIDs isvan groot belang om op een be-trouwbare manier te kunnen ver-wijzen naar het juiste artikel of dejuiste persoon of organisatie. Aanveel wetenschappelijke informatieis dan ook zo’n PID toegekend.Door deze PIDs en door de koppe-ling van een PID aan een anderePID, verbetert de vindbaarheid, toe-gankelijkheid en navigatie van on-derzoeksgegevens. Het koppelen

van PIDs kan automatisch doordatPIDs ook leesbaar zijn voor compu-ters. Het Europese project FREYAonderstreept de kracht van PIDs enbouwt aan een infrastructuur voorPIDs als essentieel onderdeel van de

European Open Science Cloud(EOSC).De nationale portal NARCIS.nl biedtinformatie over (open access) pu-blicaties, datasets, onderzoekspro-jecten, wetenschappers en onder-

zoeksinstituten. Onlangs is de in-formatie in NARCIS verrijkt met be-hulp van bestaande en nieuwe PIDs.Zo zijn onderzoeksorganisaties nueenduidig identificeerbaar in NAR-CIS doordat ze nu de nieuwe PIDresearch organisation identifier(ROR) bevatten.

Relaties zichtbaarDoor PIDs met elkaar te verbindenin een PID Graph kunnen meer re-laties zichtbaar gemaakt worden inNARCIS. Zo vergelijkt NARCIS bij-voorbeeld de informatie van hetportaal van ORCID (een PID vooronderzoekers) met de beschikbareinformatie in NARCIS en linkt pu-blicaties aan de onderzoeker alsdeze nog niet als auteur was her-kend. Op dezelfde manier is eenlink gemaakt met unpaywall.org,waardoor NARCIS nu ook informa-tie geeft over open access versiesvan bepaalde wetenschappelijke ar-tikelen. Een laatste voorbeeld is debeschikbaarheid via NARCIS van deinformatie van altmetric.com, eenwebservice over de online impactvan papers of datasets op bijvoor-beeld twitter of facebook. De NAR-

CIS PID Graph maakt het ook mo-gelijk om resultaten te verzamelenvan bepaalde onderzoeksprojecten.In een pilot project hebben hetDonders Instituut, de Radboud Uni-versiteit en DANS publicaties en da-tasets uit het NWO-gefinancierdeproject Language in Interaction aanelkaar gekoppeld.De PID Graph biedt dus veel moge-lijkheden om de informatie in NAR-CIS te verrijken. Hiervoor is het welvan belang dat PIDs door onderzoe-kers en instellingen worden gebruikten meegeleverd in de metadata.narcis.nlproject-freya.eu

Door het coronavirus zijn veelevenementen geannuleerdof is het onduidelijk of evene-menten doorgaan.Veel organisaties bieden digi-tale alternatieven, minstenszo interessant. We adviserenu om online te zoeken naaractuele informatie.

AGENDA

DANS verbindt en verrijkt beschikbare informatie in NARCIS

PID Graph van de Nederlandse wetenschap

PID Graph maakt relaties zichtbaar. In dit voorbeeld zijn twee papersvan 1 onderzoeker via NARCIS beschikbaar. Van 1 paper is bekend dathet hoort bij deze onderzoeker. Omdat NARCIS eigen informatie linktmet informatie uit externe bronnen (bijvoorbeeld ORCID), wordt ook delink met het tweede paper bekend. De NARCIS PID Graph haalt deze ex-terne informatie op en integreert het in NARCIS, waardoor de link tus-sen het tweede paper en de onderzoeker ook zichtbaar wordt, gevisuali-seerd met het blauwe PID Graph symbool. Credits: Ricarda Braukmann

Page 4: Dendro4Artcombineertdendrochronologieenkunsthistorie ...Aanditnummerwerktenmee: Valentijn Gilissen, Kathleen Gregory, Marjan Grootveld, Marieke Houben-Van Her ten, Janno de Jong, Rutger

4 juni 2020 E-DATA & RESEARCH

SINDS KORT BESCHIKBAAR

Dit overzicht toont databestanden die recent beschikbaar zijn gekomen bijCentERdata en Data Archiving and Networked Services.

CentERdata• Denkend aan Nederland

Wat zijn de meest typerende kenmerkenvoor Nederland? En welke factoren dragenbij aan het gevoel van verbondenheid metNederland? Dit heeft het Sociaal en Cultu-reel Planbureau (SCP) onderzocht in 2019.Het doel was om de Nederlandse identiteit

in beeld te brengen.Daartoe is gebruik-gemaakt van hetLISS panel. Van-wege de omvangvan het onderzoekwerden de vragen intwee metingen afge-nomen van juli toten met september2019. Mede op basis

van deze data is het ‘Sociaal en CultureelRapport 2019 - Denkend aan Nederland' ge-publiceerd. De data zijn beschikbaar viaLISS Data Archive.lissdata.nl

Ook sinds kort beschikbaar:Studies LISS panel• Abidi, L.; Nilsen, P., april 2017,Implementation of alcohol prevention inhealthcare in the Netherlands• Kok, L., april 2017, Pension designs andcontinued working after retirement• Portegijs, W., juni 2018,Emancipatiemonitor 2018• CentERdata, oktober-november 2018,

DANS• Nieuw in EASY:

Maritieme opgravingsdossiers

Sinds de inpoldering van de Wieringermeerzijn honderden scheepswrakken aangetrof-fen, vergaan op de voormalige Zuiderzee.De documentatie hiervan varieert van een-voudige meldingen tot volledig uitgevoerdearcheologische opgravingen. Het gaat omwaardevolle en unieke brondocumentatievoor (scheeps)archeologisch onderzoek.Stichting Batavialand beheert zowel de ar-

cheologische objecten als het bijbehorendearchief van de maritieme rijkscollectie na-mens de Rijksdienst voor het Cultureel Erf-goed. Onlangs heeft de Stichting de papie-ren (scheeps)archeologische opgravingsdo-cumentatie gedigitaliseerd. Deze bijzonderecollectie wordt nu toegankelijk gemaakt viaEASY. DOI: 10.17026/dans-x6z-3dnp.

Ook sinds kort beschikbaar:De volgende datasets zijn open accessbeschikbaar via het online archiverings-systeem EASY van DANS:• Berkel, dr. R. van (Utrecht University)(2020): Versterking methodisch werken viaHRM.DANS. DOI: 10.17026/dans-x3w-7q4b.• Farace, dr. D. (GreyNet International)(2020): Grey Literature Resources generateand drive Awareness to the Circular Economy.DANS. DOI: 10.17026/dans-zhz-kg3z.• Frankena, dr. K. (Wageningen University)(2020): ROMAN, Few-Foods-Diet and ADHDin Practice.DANS. DOI: 10.17026/dans-xn4-6pjh.• Gregory, K.M. (Data Archive andNetworked Services) (2018): Data Discoveryand Reuse Practices in Research.DANS. DOI: 10.17026/dans-xsw-kkeq.• Heine, F.A. (Tilburg University) (2020):Using Moral Foundations in GovernmentCommunication to reduce Vaccine Hesitancy.DANS. DOI: 10.17026/dans-xuv-vyzk.• Jordanov, drs. M.S. (RAAP) (2020):Kasteelpark IJsselstein, gemeente IJsselstein,een archeologische opgraving.DANS. DOI: 10.17026/dans-z33-gtvv.

Credits: SCP

Social Integration and Leisure - Wave 11• CentERdata, juni-juli 2019, EconomicSituation: Income - Wave 12• CentERdata, juli-augustus 2019, EconomicSituation: Housing - Wave 12

Deze bestanden zijn kosteloosbeschikbaar via lissdata.nlBezoek deze site of scan deQR-code.

Credits: DOI: 10.17026/dans-2z5-jmy2

• Leemans, L.H. (Radboud University)(2020): A mutualism between unattachedcoralline algae and seagrasses preventsovergrazing by sea turtles. Ecosystems.DANS. DOI: 10.17026/dans-25p-82rx.• Lutkie, T. (2019): De pot en de ketel:Nederlandse dagbladen en hun oordeel overcommunisme en fascisme, 1918 - 1939.DANS. DOI: 10.17026/dans-zeq-tnzx.• Moretta, dr. T.M. (Department of GeneralPsychology, University of Padova) (2019):Data from problematic and non-problematicFacebook users who performed a Go/Nogotask with Facebook-related, pleasant,unpleasant, and neutral pictures and a selfassessment manikin (SAM).DANS. DOI: 10.17026/dans-zqm-d9zh.• Nollen, drs. J.H. (Gemeente Breda) (2020):Breda Kasteelplein (AO).DANS. DOI: 10.17026/dans-zxr-3xtd.• Scholtens, J. (Commissariaat voor deMedia) (2019): Representatie van mannen envrouwen in Nederlandse non-fictietelevisieprogramma’s 2019.DANS. DOI: 10.17026/dans-27s-4q6g.• Sociaal en Cultureel Planbureau (SCP)(2018): Vrouwen in besluitvorming 2018 -VIB2018.DANS. DOI: 10.17026/dans-26j-7rw8.• Westen, dr. C.J. van (University of Twente)(2020): Landslide inventory of the 2018monsoon rainfall in Kerala, India.DANS. DOI: 10.17026/dans-x6c-y7x2.

Via easy.dans.knaw.nl zijndeze bestanden open accessbeschikbaar. Bezoek deze siteof scan de QR-code.

OCR is een interessante tool met veletoepassingen. Of het ook werkt voorNederlandse gotische druk, werdtijdens de workshop ICT with Industryonderzocht. Rutger van Koert

Optical Character Recognition (OCR) staat vooroptische tekenherkenning: een methode waarbijeen computer door middel van patroonherken-ning tekens uit een afbeelding haalt. OCR werktover het algemeen vrij goed op modern materiaal.Helaas gaat de kwaliteit van de herkenning ach-teruit naarmate het materiaal ouder is. Ook bij‘vreemde’ fonts, vlekken en vervuiling verslech-tert de kwaliteit. Genoeg motivatie om tijdens dejaarlijkse, door het ICT Research Platform Ne-derland (IPN) georganiseerde workshop ICT withIndustry afgelopen februari aan deze weten-schappelijke uitdaging te werken.

Vier subproblemenDoor het team werden vier subproblemen gede-finieerd: preprocessing inclusief voorbewerkenvan de scans, segmentatie van de scans op woord-of zinsniveau, herkenning (de daadwerkelijkeOCR) en postprocessing, het automatisch corri-geren van fouten van de herkenning. Samen metMirjam Cuper (KB) zorgde ik voor scans, trans-cripties en rekenkracht voor de machinelearning,Jerry Guo (TU Delft) probeerde diverse algorit-mes uit. Visueel was de verbetering goed zicht-baar, maar de resulterende OCR-output verbe-

terde nauwelijks. Voor de segmentatie, het tweedesubprobleem, gebruikten we ARU-net. Samenmet XueWang (CS, Leiden University) trainde ikhet systeem op het detecteren van spaties enwoorden met hulp van data van de ALTO-xml vaneen commerciële OCR-provider. We controleer-den de resultaten weer visueel, op sommige pun-

ten was er zelfs een verbetering ten opzichte vande commerciële provider. Vervolgens werdMonkdoor Lambert Schomaker (AI/ML RuG) ingezetom data te labelen en ging Mahya Ameryan (AI,RuG) woorden herkennen met machinelearning.88% van de woorden bleek correct te zijn her-kend, een mooie score! Als laatste namen KoenDercksen (Radboud Universiteit) en KonstantinTodorov (ILLC, UvA) het nabewerken op zichdoor gebruik te maken van BERT, gefinetuned ophet tekstcorpus van de Meertens Kranten (1662-1795) en aansluitend een LSTM encoder-decodernetwerk. Met het softwareplan van AdriënneMendrik (e-Science Center) kunnen we resulta-ten kwantificeren en meten wat daadwerkelijk debeste opties zijn voor specifieke onderdelen.

Flinke verbeteringVia ICT with Industry hebben we, naast een leukeweek met slimme mensen uit de wetenschap enhet bedrijfsleven, mooie resultaten bereikt. Sa-men concluderen we trots dat het mogelijk is omde herkenning van Nederlands gotisch drukwerkflink te verbeteren. Het KNAWHumanities Clus-ter en de KB gaan kijken hoe deze pijplijn voorvroegmoderne druk verder kan worden ontwik-keld.ict-research.nl/ict-with-industry

Rutger van Koert is Lead Engineer Team Imagesbij het KNAW Humanities Cluster.

Mooie resultaten met Optical Character Recognition

Teamwork verbetert OCR gotische druk

Titel-scan van het boek ‘Gelegentheyt vans Hertogen-Bosch’ door Pieter Bor, geschre-ven in 1630. De binnenzijde van dit boek bevatteksten in gotisch schrift, OCR-techniekenmaken het onderzoekers makkelijker om deteksten te gebruiken. Credits: KB

Nieuwe directeurDANS omarmtopen scienceSinds 1 april is Henk Walsdirecteur van DANS. Zijn visieis helder: “Waar het om draait,is de beweging richting openscience. Naarmate onderzoeks-data en -resultaten sneller enbeter gedeeld worden, versneltde kenniscirculatie en boekt dewetenschap in een hoger temporesultaten. In Nederland houdenruim honderd organisaties zichbezig met data, opslag, infra-structuren, etc. Hoe ordenenwe dat landschap, welke afspra-ken maken we over het verbin-den van onderzoeksgegevensen hoe voorkomen we duplica-tie van services? Gelukkig zijner initiatieven als het NationaalPlatform Open Science en deEuropean Open Science Cloud.Samen bewegen we richting eennetwerkorganisatie met goedetaakverdeling, coördinatie enafspraken. DANS heeft alles inzich om een nuttig knooppuntte vormen in een netwerk vanNederlandse en Europese in-stellingen die bijdragen aan dedata-infrastructuur. Wij zijn be-reid ons aan zo’n rol te commit-teren. En KNAW en NWO steu-nen deze gedachte, is mij verze-kerd.” (HB)dans.knaw.nl

KORT

Page 5: Dendro4Artcombineertdendrochronologieenkunsthistorie ...Aanditnummerwerktenmee: Valentijn Gilissen, Kathleen Gregory, Marjan Grootveld, Marieke Houben-Van Her ten, Janno de Jong, Rutger

Per 1 januari 2020 trad cultuur-

historicus Joris van Eijnatten aan

als nieuwe directeur van het

Netherlands eScience Center,

het nationale research software-

instituut. Komend najaar presen-

teert hij een nieuw strategisch

plan voor het instituut.

Steven Claeyssens

Het gaat goed met het Netherlands eScience Cen-ter. Opgericht in 2011 om ‘multidisciplinair endata-intensief wetenschappelijke onderzoek inNederland te versterken en het gebruik van in-novatieve ICT voor onderzoek te stimuleren’,groeide het uit tot de belangrijkste organisatie opdat terrein voor wetenschappelijk Nederland. On-derzoekers uit alle wetenschapsdisciplines kun-nen meedingen naar de calls van het eScienceCenter. Honorering levert financiering en de bij-stand van een ervaren Research Software Engi-neer (RSE) van het eScience Center op. In enkelejaren groeide het instituut van 25 naar 70 mensen,een internationale evaluatiecommissie publi-ceerde vorig jaar een lovend rapport.

KennisoverdrachtBij de start van Van Eijnatten vielen hem een aan-tal zaken op. “Er was een evaluatierapport, eenzelfevaluatie en input uit interviews met interneen externe betrokkenen en belanghebbenden.Maar toen ik de stukken las, viel me op dat heteScience Center erg missie-gedreven was. Demissie Enabling digitally enhanced research ishelder, maar gaf geen richting. In de nieuwestrategie staat nu een heldere visie, die maaktdat we keuzes kunnen maken. Het hoofddoel iseen robust research community die in staat isdigitale tools en methoden toe te passen. Hiervoorwillen we veel meer onze kennis gaan delen metanderen.”“Vorig jaar hebben we community officers aan-gesteld, mensen die naar buiten treden om te kij-ken waar we trainingen kunnen verzorgen, waarwelke vragen leven en hoe we daarop in kunnenspelen. Begin dit jaar organiseerden we een ma-chine learning-cursus. We hadden 100 aanmel-dingen, uit alle vakgebieden, maar konden ermaar 25 accommoderen. In een week tijd hielpenwe de cursisten zodanig op weg dat ze zelf ver-der konden. Ik voorzie dat we dat nog veel vakerzullen doen. Er is een enorme vraag hiernaar enwe kunnen op dat vlak goed werk doen.”

Digital Competence CentersNWOwil dat kennisinstellingen hun expertise ophet gebied van researchdatamanagement en on-derzoekssoftware op één plek bundelen: in eenDigital Competence Center (DCC). Van Eijnatten:“Bij universiteiten en onderzoeksinstituten wer-ken mensen aan de digitale infrastructuur en men-sen aan het beheren van data, de datastewards.Daar investeren ze fors in. Maar de derde com-ponent zie je nog amper: de software engineers.Zij zitten te vaak verscholen in onderzoeksgroe-pen. Voor het eScience Center is het van belang

om onze kennis onder meer via die DCC’s onderonderzoekers te verspreiden. Zo wordt ook dedisseminatie geregeld.”“Het verhaal van het eScience Center is ook eenhistorisch verhaal. Er is een infrastructuur neer-gelegd vanaf de TweedeWereldoorlog, met groteIBM-machines, computers, het internet, gevolgddoor een enorme datagolf. Nu zitten we in de vol-gende fase: wat doen we met de software? Zowelvanuit de data-kant als vanuit de ICT-kant zie jeeen beweging richting de toegepaste kant. Datmoet ergens bij elkaar komen. Het eScience Cen-ter wordt zo heel actueel.”

Software sustainability“Onze engineers hebben ideeën over hoe je soft-ware kunt verduurzamen, maar ook ideeën over

hoe je de kwaliteit van software kunt garanderen.Ook dat is kennisoverdracht. Daarmee hangt sa-men dat we eigenlijk meer zichtbaar willen zijnen meer zicht ook willen hebben op wat er preciesgebeurt met software als we die eenmaal ge-maakt hebben. Software blijft nu te vaak op deplank liggen. Dat zie je wereldwijd in heel veelprojecten. Dat is erg inefficiënt, het gevaar is datje een herhaling van zetten krijgt. We willendaarom commitment vragen van universiteiten.We blijven onderzoekers rechtstreeks bedienenbij het beantwoorden van onderzoeksvragen –dat is de kern van ons bestaan en dat gaat niet ver-anderen – maar we gaan onderzoekers die reage-ren op een call ook vragen om commitment vanhun eigen instelling. Denk aan het inzetten vansoftware in het onderwijs, een manier om de soft-ware een paar jaar te verduurzamen.”

Software en de FAIR-principes“Open science leeft heel sterk in het Center. Onzewetenschappers staan vierkant achter open sci-ence, daar zijn ze mee opgeleid.Al onze softwareis open source. Waar dat nuttig is, willen we desoftware ook op een kwalitatief hoogwaardigniveau wegzetten: dusdanig gedocumenteerd datanderen er meteen mee aan de slag kunnen. In datverband hebben we samen met DANS fair-soft-ware.eu opgezet. Op dit moment worden deFAIR-principes vooral toegepast op data, maareen aantal FAIR-principes kun je zeker vertalennaar software.”“Er werd bij het eScience Center veel gesprokenover ‘scientific breakthroughs’. Als geesteswe-tenschapper let ik ook op de retorica. ‘Scientific’is gericht op de ‘sciences’. Daar kom je bij de ‘so-cial sciences’ misschien nog mee weg, maar bijde ‘humanities’wordt deze taal niet gebruikt. Eneen ‘breakthrough’ binnen de geestesweten-schappen? Misschien op bepaalde gebieden enmisschien dat methodologieën doorbraken kun-nen zijn, maar kennisdoorbraak? Nee, het is meerverschuiving van perspectief wat wij zien. Ditsoort termen probeer ik te vervangen, zodanig datiedereen zich herkent in onze nieuwe strategie enzich uitgedaagd en welkom voelt bij het eScienceCenter.”esciencecenter.nl

E-DATA & RESEARCH juni 2020 5

Joris van Eijnatten, directeur eScience Center: “Als je vijf jaar software in het onderwijs kanlaten draaien, dan bereik je meerdere dingen tegelijk: verduurzaming én disseminatie. Dat zijnhet soort constructies waar we heen willen.” Credits: Bart van Vliet

‘Research isvoor ons

het toverwoord.Wij bedienenhet onderzoek’

INTERVIEW

Joris van EijnattenJoris van Eijnatten (1964) is een Nederlandshistoricus gespecialiseerd in de Europese enNederlandse cultuurgeschiedenis en met eenbijzondere belangstelling voor Digital Humani-ties. Van Eijnatten was aan de Vrije UniversiteitAmsterdam werkzaam als universitair hoofd-docent. In oktober 2007 werd hij benoemd tothoogleraar cultuurgeschiedenis aan dezelfdeuniversiteit, in juli 2009 tot hoogleraar cultuur-geschiedenis aan de Universiteit Utrecht.In 2020 werd Van Eijnatten directeur bij heteScience Center in Amsterdam.

Platform DigitaleInfrastructurenSSH gelanceerdIn het najaar van 2019 is hetPlatform Digitale InfrastructurenSSH (PDI-SSH) gelanceerd.PDI-SSH is een initiatief van hetSSH-beraad en de digitale infra-structuren CLARIAH en ODISSEI.Het platform heeft drie taken:het ontwikkelen van een strate-gie voor digitale infrastructuur inNederland, middelen toekennenaan digitale infrastructurelevoorzieningen en de afstemmingvan die voorzieningen. De eerstecall for proposals is recentelijkgesloten. De uitslag wordt injuni verwacht. (LvdM)

pdi-ssh.nl

Let’s play FAIR:DANS Data GameSpeciaal voor onderzoekendNederland is de DANS DataGame ontwikkeld. Het kwartetgeeft een indruk van het onder-zoeksdatalandschap en is spe-ciaal voor het 15-jarig bestaanvan DANS geproduceerd. Hetspel wordt op verzoek per postbezorgd, maar omdat Coronahet fysiek spelen niet toestaat,is ook een online versie van hetspel ontwikkeld. Meer informa-tie staat op de website vanDANS. (HB)

dans.knaw.nl

Het kwartet kan fysiek enonline worden gespeeld.Credits: DANS

Inschrijving gebruikODISSEI SecureSupercomputer openDe ODISSEI Secure Super-computer (OSSC) biedt onder-zoekers de mogelijkheid om hungekoppelde CBS Microdata teanalyseren met behulp van deSURFsara supercomputerCartesius. Na een succesvollepilotfase wordt de OSSC bin-nenkort voor ODISSEI-deelne-mers opengesteld. Iedereen diegoed gebruik kan maken van deOSSC kan een project op dewachtlijst plaatsen. (LvdM)

edu.nl/7jh9q

De OSSC maakt gebruik vande rekenfaciliteiten van deCartesius supercomputer vanSURFsara. Credits: SURFsara

KORTJoris van Eijnatten, directeur eScience Center:

‘Je ziet dat het eScienceCenter heel actueel wordt’

Page 6: Dendro4Artcombineertdendrochronologieenkunsthistorie ...Aanditnummerwerktenmee: Valentijn Gilissen, Kathleen Gregory, Marjan Grootveld, Marieke Houben-Van Her ten, Janno de Jong, Rutger

Lise Stork helpt onderzoe-kers om moeilijk toeganke-lijke gegevens te verwerkenmet computationele tech-nieken. Eind 2019 ontving zehiervoor de Young eScientistAward. Maarten Heerlien

Onderzoeksinstellingen en natuur-musea herbergen veel archievenwaarin gegevens over historischebiodiversiteit zijn vastgelegd. Dezedata zijn nog altijd relevant, maar detoepassing ervan wordt bemoeilijktdoor het complexe, vaak ondoor-dringbare karakter van deze archie-ven. Lise Stork, PhD kandidaat aanhet Leiden Institute of AdvancedComputer Science (LIACS), combi-neert in haar onderzoek verschil-lende computationele modellen omdergelijke archieven toegankelijk temaken en zo het wetenschappelijkonderzoek te accelereren.

Digitaal vindbaarEr zitten verschillende uitdagingenaan het ontsluiten van de informatiein het soort manuscripten dat Storkgebruikt, veelal soortbeschrijvingenen -schetsen van wetenschappers op

onderzoeksexpedities in gebiedenmet een rijke flora en fauna. Voor-beelden van uitdagingen zijn bij-voorbeeld de kwaliteit van het hand-schrift, meertaligheid en verouderdeterminologie. Stork gebruikt een in-novatieve mix van methoden entechnieken om belangrijke stukjes

informatie in de manuscripten ma-chine-leesbaar, en daarmee digitaalvindbaar te maken. “Eerst model-leer ik elementen die in de manu-scripten voorkomen aan de handvan achtergrondkennis uit het do-mein, bijvoorbeeld taxonomie, ana-tomie en geografie. Vervolgens ge-

bruik ik beeldherkenning om dezespecifieke elementen - soortnamen,anatomische kenmerken en locaties- automatisch terug te vinden. Dezeelementen maak ik vindbaar aan dehand van de standaarden van hetkennisdomein, met behulp van se-mantische webtechnieken.”

Naar een webomgevingHaar onderzoek maakt deel uit vanhet NWO-project Making Sense ofIllustrated Handwritten Archives.Stork heeft een workflow ontwik-keld waarmee onderzoekers relatiefeenvoudig historische manuscrip-

ten kunnen omzetten in machine-leesbare data. De volgende stap isde ontwikkeling van een schaalbareen duurzame webomgeving, waarinwetenschappers historische onder-zoeksarchieven betekenisvol kun-nen ontsluiten. Zo kan er efficiëntdoor deze manuscripten worden ge-zocht en kunnen relaties wordenblootgelegd. De ontwikkeling vandeze omgeving wordt ondersteunddoor het eScience Center, dat in no-vember 2019 de Young eScientistAward toekende aan Stork voor ditidee.

Mens centraalHoewel de focus in het onderzoekligt op historische biodiversiteits-data, zijn de resultaten van het on-derzoek van Stork en haar mede-onderzoekers breder toepasbaar:“De essentie van deze techniekenen workflow is dat de mens cen-traal staat: we helpen mensen bijlastige keuzes door ze van de juisteinformatie te voorzien en sugges-ties te doen, daar waar beelddatamet gestructureerde, terugkerendeinformatie een rol speelt.”liacs.leidenuniv.nl/~storkl/

6 juni 2020 E-DATA & RESEARCH

Tool voor omzetten in machine-leesbare data

Historische biodiversiteit digitaal ontsluiten

De online tool UDPipe Fryskkent woordsoorten toe aanteksten in het Fries. Een der-gelijke basistool ontbrak nogvoor de tweede rijkstaal.Erica Renckens

Onlangs verscheen de eerste updatevan de webapp UDPipe Frysk, dieeind januari werd gelanceerd. Dezetool maakt taalkundige analyse vanFriese teksten mogelijk. In de inge-voerde tekst worden de losse tokens(woorden) herkend en voorzien vanlemma’s enwoordsoorten (POS-tags).

Webapp“Een dergelijke basistool voor taal-kundig onderzoek bestond nog nietvoor de tweede rijkstaal in Neder-land, het Fries”, vertelt Hans Van deVelde, die als projectleider aan deFryske Akademy verantwoordelijkwas voor de ontwikkeling van detool. “POS-tags zijn belangrijk, om-dat woordsoorten soms contextaf-hankelijk zijn. In de zin ‘De bernkrige iisfrij’ (‘De kinderen krijgenijsvrij’) is iisfrij bijvoorbeeld eenzelfstandig naamwoord, maar in dezin ‘De mar is hielendal iisfrij’ (‘Hetmeer is volledig ijsvrij’) een bij-voeglijk naamwoord.”Onderzoekers kunnen de webappgebruiken voor onderzoek naar bij-voorbeeld taalverandering, syntac-tische verhoudingen, auteursher-

kenning, sentiment-analyse of voorde ontwikkeling van automatischevraag-antwoordsystemen. Van deVelde: “De gebruiker typt zelf eenFriese tekst in, uploadt deze of voerteen Friese website in.” Hierna ver-schijnt een tabel met voor elk tokenhet lemma en de woordsoort. Dezeoutput kan vervolgens in verschil-lende formaten (txt, excel, CoNLL-U)gedownload worden voor verdereanalyse.”Wilbert Heeringa, programmeur bijde Fryske Akademy, ontwikkelde

de pijplijn, samen met GosseBouma van de RijksuniversiteitGroningen. Martha Hofman (FryskeAkademy) helpt bij het handmatigannoteren van het trainingscorpus.Heeringa gebruikte het projectUni-versal Dependencies (UD). “Datproject ontwikkelt een universeelannotatieschema dat cross-linguï-stisch vergelijken mogelijk maakt.Zo kunnen vergelijkbare construc-ties in verschillende talen op eenconsistente manier worden geanno-teerd, terwijl ook taalspecifieke an-

notaties worden toegestaan als dienodig zijn.”

1.547 zinnenHeeringa trainde de UDPipe Fryskmet 1.547 zinnen uit het Oersetter-corpus. Dit corpus is in 2012 ont-wikkeld voor Oersetter, een auto-matische vertaalservice voor hetFries en het Nederlands. Het bevatonder andere nieuwsberichten, ro-mans, wetenschappelijke teksten enhistorisch-culturele teksten.In de eerste update, die half mei ver-

scheen, is dit trainingscorpus verderuitgebreid met meer zinnen. Bo-vendien zijn er data toegevoegd diedependency parsing mogelijk ma-ken, zodat ook de grammaticalestructuur van een zin met de onder-linge relaties tussen woorden inkaart gebracht kan worden. Tenslotte wordt ook gewerkt aan eenanalyse van de kwaliteit van dePOS-tagging. UDPipe Frysk is medetot stand gekomen dankzij financie-ring van CLARIAH-PLUS.fryske-akademy.nl

Friese teksten door online pijplijn

Tool voor taalkundig onderzoek Fries

frequentie

3

4

5

6

7

8

dialekten

grutte

lytse

griene folchoardernijere

brekkingoffisjele

statuspart

grut

tal

sterkte

ynfloed

tekens

diakrityske

earste

Frysktaligejier

eigen

taal

twaddekultuer

Beweging

skriuwers

dichtersnjoggentjinde

iuw

santjindetweintichste

literatuerferzje

oare

Fryske

Frysk

memmetaalrepresintative

enkête

reade

talen

boeken

letter

PUNCT

0 500 1000 1500 2000 2500

NOUN

ADP

DET

VERB

PROPN

ADJ

ADV

AUX

PRON

CCONJ

NUM

SCONJ

SYM

INTJ

X

Op basis van het Wikipedia-artikel ‘Frysk’ (nl.wikipedia.org/wiki/Westerlauwers_Fries) kan UDPipe Frysk teksten analyseren. Zo laat de rechterafbeelding zien dat zelfstandige naamwoorden (NOUN) het meest frequent zijn gebruikt, gevolgd door voorzetsels (ADP) en lidwoorden (DET).De linker grafiek laat de combinaties zien van bijvoeglijk naamwoord (ADJ) en zelfstandig naamwoord (NOUN). Uit de tekst zijn wel de titels, op-schriften, bijschriften, tabellen, links en referenties weggelaten. Credits: UDPipe Frysk

‘Relatief eenvoudighistorische

manuscriptenomzetten naar

machine-leesbaredata’

JONG TALENT

Winnaar van de Young eScientist Award 2019 Lise Stork helpt onder-zoekers om moeilijk toegankelijke gegevens te verwerken met computa-tionele technieken. Credits: Thijs Stork Photography

Frequentie van voorkomen UPOS (Universal Parts of Speech)Opeenvolgende woorden UPOS: ADJ & NOUN

Page 7: Dendro4Artcombineertdendrochronologieenkunsthistorie ...Aanditnummerwerktenmee: Valentijn Gilissen, Kathleen Gregory, Marjan Grootveld, Marieke Houben-Van Her ten, Janno de Jong, Rutger

E-DATA & RESEARCH juni 2020 7

Wat zijn de gevolgen van de

coronacrisis? Hoe staan Neder-

landse patiënten tegenover

kunstmatige intelligentie?

Een verslag van 12 actuele

dataverzamelingen

gehonoreerd door ODISSEI.

Marika de Bruijne

In het najaar van 2019 konden ODISSEI-deel-nemers een verzoek indienen om kosteloosdata te verzamelen in het LISS panel vanCentERdata. Dit panel is een representatieveafspiegeling van het bevolkingsregister vanhet CBS. De tien gehonoreerde onderzoeks-projecten variëren in onderwerpen van dementale gezondheid van Nederlanders tot po-litieke onvrede. In totaal waren er 39 aanmel-dingen. De vragenlijsten worden in de loopvan 2020 afgenomen.In maart 2020 veranderde het leven door deCOVID-19 pandemie. Sociale wetenschappersvolgen de maatschappelijke veranderingen opde voet. Om actueel onderzoek naar de soci-ale impact te ondersteunen, opende ODISSEIeen extra call. Hiermee konden ODISSEI-deel-

nemers een korte vragenlijst afnemen in hetLISS panel over het coronavirus. Deze callhad een verkort tijdschema. Begin april zijntwee van de 43 voorstellen geaccepteerd en dedataverzamelingen zijn gelijk in april gestart.

De 12 gehonoreerde voorstellen staan op dezepagina weergegeven. Op termijn krijgen we-tenschappers toegang tot de data van deze 12voorstellen via het LISS Data Archive. Ditdraagt bij aan het doel van ODISSEI om een

nationale data-infrastructuur voor de socialewetenschappen in Nederland te bieden. Laterdit jaar wordt nog een nieuwe reguliere callgeopend.odissei-data.nl

LISS Data Archive vernieuwd

Het LISS Data Archive is recent vernieuwd.De website van deze data repository isgebruiksvriendelijker en beter geschiktgemaakt voor mobiele devices.De zoekfunctie is verbeterd en men kanweer een eigen ‘winkelmand’ metvariabelen vullen. Ook is de beveiligingaangescherpt door tweefactor-authenticatie. Het LISS Data Archive biedtzo’n 12 jaar aan data aan, afkomstig uitonderzoeken in het LISS panel. Devragenlijsten, codeboeken en gerelateerdepublicaties zijn vrij beschikbaar. Na gratisinschrijven zijn de data vrij toegankelijk voorwetenschappelijk en maatschappelijkrelevant onderzoek.

dataarchive.lissdata.nl

Twaalf onderzoeken ODISSEI Call 2020 in beeld

ODISSEI meet sociale hartslag vanNederlanders met dataverzameling

De twaalf onderzoeken op een rij

Retrospective informalcaregiving careersEllen VerbakelIn dit onderzoek staat de vraag centraal hoede zorg van mantelzorgers zich ontwikkeltgedurende de mantelzorgperiode en welkelangetermijneffecten dat heeft op hunarbeidsmarktpositie. Dit onderzoektcombineert een survey in het LISS panelmet bestaande data uit de LISS kernstudie.

What is the relation betweenfinancial scarcity, decision-making and social exclusion?Leon P. Hilbert, Frank T. Doolaard,Marret K. Noordewier, Wilco W. van DijkDit onderzoek analyseert hoe financiëleproblemen zich in de tijd ontwikkelen enhoe dit relateert aan het nemen vanfinanciële beslissingen en gevoelens vansociale uitsluiting.

How to reduce the educationgap in participation in citizens’initiatives?Vivian Visser, Willem de Koster,Jeroen van der WaalIn dit onderzoek wordt aan de hand van eenvignettenstudie gekeken of de welbekendeopleidingsverschillen in bereidheid totdeelname aan burgerinitiatieven afhangenvan de manier waarop de uitnodiging wordtgeformuleerd.

Understanding attitudestowards refugees as comparedto immigrantsInge Hendriks, Marcel Lubbers,Michael SavelkoulDit onderzoek richt zich op de vraag inwelke mate de houding van mensentegenover vluchtelingen enerzijds enmigranten anderzijds verschilt, en of dit ookgeldt voor de verklaringen voor de houding.

The Dutch Mental HealthContinuum Short FormGerben J. Westerhof, Peter ten KloosterGGZ-cliënten hebben soms moeite met hetinvullen van vragenlijsten om hun mentalegezondheid te meten middels hetinstrument MHC-SF. Om dit te voorkomen,is een herziene versie van het instrumentontwikkeld die in het LISS panel getestwordt.

The Willingness, Opportunity andAbility to Prepare for Automationat the WorkplaceGiedo Jansen, Suzanne Janssen,Mark LevelsDit onderzoek gaat onder meer na welkearbeidsmarktkenmerken samenhangen metde bereidheid van mensen om nieuwevaardigheden te leren voor het omgaan mettoenemende automatisering en robotiseringop de werkplek.

Who is politically intolerant?Linda BosDit onderzoek naar politieke moraliteit,extremisme en intolerantie bouwt voort opeen studie die in de vorige ronde van deODISSEI-call is gehonoreerd. Hetonderzoek maakt gebruik van de LISSkernstudie om verklarende factoren voorverschillende vormen van politiekeintolerantie te analyseren.

What affects individualoutcomes? Objectiveneighborhood characteristicsor perceptions?Heleen Janssen, Maarten van HamDoor een combinatie van LISS panel dataen CBS microdata wordt onderzocht inhoeverre objectieve kenmerken van eenbuurt of juist subjectieve ervaringen van eenbuurt invloed hebben op de beleving enopvattingen van mensen.

An algorithm a daykeeps the doctor away?Marieke HaanKunstmatige intelligentie en algoritmesworden steeds meer toegepast in degeneeskunde en in de klinische praktijk. Indit onderzoek wordt 1) via een survey naderonderzocht hoe de algemene Nederlandsepopulatie hier tegenover staat en 2) middelseen experimenteel design uitgezocht wat deeffecten van verschillende schalen zijn ophet antwoordgedrag van deze populatie.

The Corona outbreakand the school shutdownThijs BolEen van de maatregelen om het coronaviruste bestrijden, is het sluiten van de scholenwaardoor kinderen thuis onderwijs moetenvolgen. Aan ouders in het LISS panel wordtgevraagd hoe hun kinderen dit doen. Dezedata worden gekoppeld met registerdataom effecten op de lange termijn te volgen.

Gender inequalities in timesof the COVID-19 pandemicMara A. Yerkes et al.Het thuiswerken in verband met decoronacrisis brengt een nieuwe dynamiekvoor ouders met zich mee. Dit onderzoekricht zich op de veranderingen die daarmeegepaard gaan in de taakverdeling vanbetaald en onbetaald werk tussen mannenen vrouwen. De data wordengecombineerd met de LISSkernvragenlijsten over arbeid enhuishouden.

Measuring identification withmultiple political partiesMartin RosemaDe mate waarin mensen zich met één ofmeerdere politieke partijen identificeren, ishet onderwerp van deze studie. In eenlongitudinaal onderzoek met drie metingenwordt gekeken in hoeverre deze identificatiestabiel is en met welke kenmerken ditsamenhangt.

Het LISS panel van CentERdata is een representatieve afspiegeling van het bevolkings-register van het CBS. Credits: Eak K. via Pixabay

Page 8: Dendro4Artcombineertdendrochronologieenkunsthistorie ...Aanditnummerwerktenmee: Valentijn Gilissen, Kathleen Gregory, Marjan Grootveld, Marieke Houben-Van Her ten, Janno de Jong, Rutger

Het Nederlandse foto-

grafische geheugen is in

toenemende mate online

beschikbaar. Hoe zorg

je ervoor dat je daarin

doeltreffend kunt zoe-

ken? Artificial Intelli-

gence-technieken kun-

nen helpen.

Mathilde Jansen

De meeste beeldherkenningsalgo-ritmes zijn getraind op modern fo-tomateriaal en presteren daaromminder goed op historische beelden.Door de algoritmes te trainen ophistorisch materiaal kan het foto-grafisch geheugen aanzienlijk wor-den verbeterd. Melvin Wevers vanhet KNAW Humanities Clusterwerkt aan zo’n algoritme voor detwee miljoen foto’s uit de periode1945-2004 van Fotopersbureau DeBoer. De foto’s liggen in de depotsvan het Noord-Hollands Archief.Een deel is gedigitaliseerd en wordtvanaf deze zomer door vrijwilligersvan velehanden.nl van labels voor-zien. Het door Wevers ontwikkeldealgoritme is daarbij leidend.

Sneeuw of zand?Bestaande beeldherkenningstech-nieken werken soms al heel goed,legt Wevers uit, omdat de algorit-mes getraind zijn op specifieke da-tasets voor specifieke taken. “Zelf-rijdende auto’s zijn bijvoorbeeldheel goed in het herkennen van ver-keersborden. Maar veel objectenverschillen door de tijd heen te veel:een telefoon ziet er anders uit dantien jaar geleden. Bovendien bevat-

ten veel datasets geen historisch ma-teriaal. “En dan hebben we het nogniet over de kwaliteit van de af-beelding of de techniek. Veel oudefoto’s zijn in grijstinten; eensneeuwlandschap en een strand zijnmoeilijk van elkaar te onderschei-den. Mogelijke oplossingen zijn ommet AI oude afbeeldingen automa-tisch te laten inkleuren, of bestaandtrainingsmateriaal juist zwart-wit temaken.”

Toch werkt Wevers met bestaandealgoritmes voor een eerste indicatie.

“Een bestaand model is op heel veelafbeeldingen getraind. Sportwed-strijden worden bijvoorbeeld mak-kelijk herkend. Maar veel van dieafbeeldingen komen van websitesals Flickr, en hebben een sterkeAmerikaanse bias.” Het labelen vande afbeeldingen gebeurt daaromdeels handmatig. Ook maakt de on-derzoeker gebruik van labels dieeerder zijn toegevoegd door de fo-tografen van persbureau De Boer. Insamenspraak met het Noord-Hol-lands Archief komt Wevers zo toteen lijst met labels. Dat wordt de in-

put voor het Vele Handen-project:mensen kunnen straks kiezen uit delabels die het computeralgoritmegenereert.

Naar 90 procentHet algoritme heeft nu een correctescore van 85 procent,Wevers streeftnaar 90 procent. “Ik hoop uiteinde-lijk een algoritme te ontwikkelendat niet alleen toepasbaar is op dezecollectie, maar ook op andere col-lecties, zoals die van het NationaalArchief.”velehanden.nl

8 juni 2020 E-DATA & RESEARCH

COLUMN

GELEZEN

23:30 - 07:00Slapen, met partner07:00 - 07:10Snoozen, alleen07:10 - 07:20Douchen, alleen; nevenactiviteit:zingen.

V oor het tijdsbestedings-onderzoek (TBO) dat het

CBS samen met het SCP eens per5 jaar uitvoert, vullen responden-ten naast een algemene vragen-lijst ook 7 dagen lang een papie-ren dagboek in. Per 10 minutengeven zij aan welke activiteit zijhebben gedaan, of zij daarnaastnog iets deden en met wie ze datdeden. Hoe mensen hun tijd be-steden, zegt iets over hun interes-ses, mogelijkheden en beperkin-gen. Het TBO geeft daarmee ookeen mooi zicht op maatschappe-lijke verschijnselen en hoe dieveranderen in de tijd. Zo komthet, vergeleken met tien jaar eer-der, bijvoorbeeld vaker voor datmensen meerdere activiteiten ophetzelfde moment uitvoeren, het‘multitasken’. SCP heeft een mooioverzicht gemaakt in de vorm van

een ‘card stack’, een verzamelingdigitale kaarten die ingaan op eenaspect van de tijdsbesteding vanNederlanders. We zijn onze res-pondenten dankbaar dat ze de tijd(!) nemen om een hele week hunactiviteiten bij te houden, wantdat is heel veel werk.

M aar ook het verwerkenvan al die papieren boekjes

op dusdanig wijze dat de privacywordt geborgd, kost de nodigeuren: inscannen, coderen, opscho-nen, het maken van een databe-stand bruikbaar voor onderzoe-kers. Redenen om samen met hetSCP een app te ontwikkelen diedigitaal veilig is, en die het de res-pondent gemakkelijker maakt zijnof haar tijdsbesteding bij te hou-den. Eerder voerde het SCP ook alexperimenten met CentERdata op

dit terrein uit. Het bijkomendvoordeel van een app is dat het dekwaliteit van de invoer verbetert(je kunt controleregels inbouwenals tijdsslots worden vergeten) ende verwerking vereenvoudigt (jehebt immers alles al digitaal bin-nen). Het CBS is al aan het experi-menteren met een app die ver-plaatsingen meet voor het onder-zoek Onderweg in Nederland, enook wordt er gewerkt aan een appdie het inscannen van bonnetjes

van je boodschappen mogelijkmaakt, voor het Budgetonderzoek.Beide zijn onderzoeken die metslimme apps het voor responden-ten minder tijdrovend kunnen ma-ken en zo hopelijk de respons ophet onderzoek kunnen verhogen.

N atuurlijk zijn er mitsen enmaren, zoals: ‘Willen men-

sen wel een app installeren?’ of‘Is het niet een hele selectievegroep die meedoet?’. Om dit soortvragen te beantwoorden, wordt deapp eerst getest in een veldtest.Voor het TBO hopen we dit einddit jaar te kunnen doen. Als detest positief is, wordt de app ver-der ontwikkeld. In eerste instantievoor het TBO, en met wat aanpas-singen ook voor andere onderzoe-ken die tijd meten, zoals onder-zoeken naar vrije tijd en naar het

Recommendations forServices in a FAIR dataecosystemD. Bangert, E. Hermans,R. van Horik, M. de Jong,H. Koers, M. Mokrane

FAIR data ontstaan en wordengebruikt in een complex weten-schappelijk landschap (FAIRecosysteem); het omvat ICT-diensten, data stewardship ensamenwerking binnen en buiteninstellingen en disciplines.Daarbij is de vraag: hoe FAIR-aligned zijn de diensten? Dezevraag hebben de Europeseinitiatieven FAIRsFAIR, RDAEurope, OpenAIRE, EOSC-huben FREYA gesteld in een reeksworkshoppen. In het heldereeindrapport Recommendationsfor services in a FAIR data eco-system springen vier aanbeve-lingen eruit: gebruik servicesvoor persistent identifiers (ookvoor organisaties en instrumen-ten); op standaarden geba-seerde metadata worden idea-liter automatisch gegenereerd;maak FAIR-alignment en het de-len van data onderdeel van on-derzoeksevaluaties; werk inter-nationaal samen aan de uitda-gingen voor het uitvoeren vande FAIR-principes. Ook zijn aaneen aantal aanbevelingen actiesverbonden: bibliotheken willende waardering voor FAIR-alignment en FAIR data aan-wakkeren, onderzoeksinstellin-gen zetten in op datasteward-ship en service providers opdomeinspecifieke ontologieënen tools voor repositories.“Work in progress”, aldus deauteurs, en belangrijk om voortte zetten in beleid, infrastruc-tuur en onderzoekspraktijk.DOI: 10.5281/zenodo.3585742

gebruik van social media. Er zijngenoeg mogelijkheden, bijvoor-beeld door slim gebruik te makenvan de sensoren die standaard indeze apparaten aanwezig zijn.Een walhalla voor een onderzoe-ker, uiteraard met een uiterstscherp oog voor privacy, doelma-tigheid en informatiebeveiliging.

22:50 - 23:00Tandenpoetsen, alleen; nevenacti-viteit: whatsappen23:00 - 23:20Nog even lezen, alleen23:20 - 07:00Slapen, met partner

Marieke Houben-Van Herten

Marieke is projectmanager/statis-tisch onderzoeker bij het CBS. Alsclustercoördinator Leefsituatieheeft zij zicht op alle persoons-enquêtes die het CBS doet op hetgebied van leefsituatie, socialesamenhang en welzijn. Daarnaastwerkt Marieke mee aan de gezond-heidsstatistieken van het CBS.Marieke geeft de pen door aanKarin Hagoort.

Tijd voor een nieuw tijdsbestedingsonderzoek

Het labelen van afbeeldingen gebeurt deels handmatig. Ook wordt gebruikgemaakt van labels die eerder zijntoegevoegd. In samenspraak met het Noord-Hollands Archief komt Wevers zo tot een lijst met labels.Credits: Noord-Hollands Archief

2 miljoen foto’s online doorzoekbaar

Met AI zoeken inhistorisch fotomateriaal