Utrecht Data School onderzoekt vluchtelingendebat op ... · Bijzonderfoto St.BMP 10JAARE-DATA...

8
Hoe haal je betekenis uit tweets? De Utrecht Data School analy- seert de vluchtelingencrisis op Twitter door netwerkanalyse te koppelen aan semantische indi- catoren. Paul Verhaar en Mirko Tobias Schäfer Door het toenemende aantal vluchtelingen nam ook het aantal gerelateerde berichten op social media toe. Talloze berichten werden verspreid over het internet, waarin gebruikers hun mening uitten. Een van de grootste uitdagingen is om be- tekenis uit deze berichten te halen. “Ons onderzoek focust zich op het in kaart bren- gen van het vluchtelingendebat met behulp van netwerkanalyses en linguïstische analyses. Onze totale dataset bestaat uit 561.179 tweets, waarvan 198.100 retweets, met het woord ‘gelukszoeker’. Dit woord brengt een dubbele connotatie met zich mee en is een interessante invalshoek voor onze analyse.” 561.179 tweets Dit Retweet-netwerk laat (re)tweets van politiek- Nederland zien. Rood staat voor politiek rechts (38% van het totaal aantal retweets), blauw staat voor politiek links (24% van het totaal aantal ret- weets). De visualisatie laat zien dat het debat duidelijk verdeeld is. De media staan in het mid- den: hun berichten worden vanuit de twee clusters geretweet. Het Twitter-account van Geert Wilders is het account met de meeste retweets binnen het rechtse cluster. Maar ook PVV-fractievoorzitter René Dercksen is een hoogactieve opinieleider in dit gebruikerscluster. In het linkse cluster is het debat veel diverser, een grotere groep aan opi- nieleiders is zichtbaar. “De netwerkanalyse biedt veel potentie voor lin- INHOUD 2 Verslagen van events in Gehoord en bijgewoond 3 Metadata van Clusius’ brieven in eLaborate 3 RIS Radboud helpt bij duurzaam archiveren 4&5 Mijlpaal! Alweer 10 jaar E-data & Research 4&5 ‘Zorgen om de toekomst van data en software’ 6 Alliantie strijd voor Text & Data Mining 7 Deze datasets zijn ook sinds kort beschikbaar 8 Patiëntenvolgsysteem: data online beschikbaar 8 Ewoud Sanders: een overdaad aan bronnen Jaargang 10 | nummer 3 Nieuwsbrief over data en onderzoek in de alfa- en gamma- wetenschappen. E-data & Research verschijnt drie keer per jaar en wordt mogelijk gemaakt door: CentERdata, CLARIAH, DANS, Huygens ING, de Koninklijke Bibliotheek en het RIVM. E - DATA & RESEARCH E - DATA & RESEARCH juni 2016 1 Scan deze QR code met een smartphone om de website van E-data te bezoeken. www.edata.nl Onze totale dataset bestaat uit 561.179 tweets, waarvan 198.100 retweets, met #gelukszoeker. De blauwe en rode nodes geven 38% en 24% weer van het totaal aantal retweets. Het debat is verdeeld; het netwerk laat een duidelijke polarisatie zien. Ook de positie van de media in de discussie is dui- delijk. Bovendien valt op dat het rechtse cluster relatief klein is. Het politiek linkse kamp laat veel verschillende opinieleiders zien, in het rechtste kamp domineert de leider van de PVV. credits UDS Utrecht Data School onderzoekt vluchtelingendebat op Twitter Onderzoek naar tweets met #gelukszoeker Ook dit jaar wordt de Nederlandse Data- prijs uitgereikt. Een prijs voor een onder- zoeker of onderzoeksgroep die extra bij- draagt aan de wetenschap door onder- zoeksdata beschikbaar te maken voor aanvullend of nieuw onderzoek. Heidi Berkhout Bent u of kent u zo’n onderzoeker met een goed voorbeeld van gedeelde data? U kunt uzelf of een ander via researchdata.nl nomineren. De winnaars van de voorgaande edities zijn in ieder geval en- thousiast. Martine de Bruin, winnaar Dataprijs 2014: “De Dataprijs is een bevestiging dat we op het goede spoor zitten” en Marijke Dekker, winnaar Dataprijs 2014: “Door het winnen van de Dataprijs kunnen we nu ook een paar grotere, al langer ge- wenste verbeterslagen maken.” De prijsuitreiking is op 9 november bij NWO in Den Haag. Ook aan- melden kan online. researchdata.nl/diensten/dataprijs Kijk voor meer informatie over de prijs, zoals de drie categorieën, de prijzenpot en de criteria op de website van RDNL. credits RDNL Wint u de Dataprijs ’16? De Stichting Bevordering Maatschappelijke Participatie (BMP) legt verhalen met vluchte- lingen van toen en nu vast in het Oral History project ‘Ongekend Bijzonder’. Deze per- soonlijke getuigenissen verdienen het om voor de toekomst bewaard te worden. De focus van de interviews ligt op het opbou- wen van een nieuw leven in de vier grote steden. Enkele tientallen interviews zijn beschikbaar via EASY, het online archiveringssysteem van DANS. Een over- zicht hiervan met links naar enkele interviews staat in de thematische collectie: Ongekend Bijzonder - Oral History project. (HB) ongekendbijzonder.nl DOI: 10.17026/dans-zbd-b88x 248 levensverhalen van vluchtelingen Interview Ongekend Bijzonder foto St. BMP 10 JAAR E-DATA Please find more information about the Dutch Data Prize on researchdata.nl/en/services/data-prize The 2016 Dutch Data Prize is awarded to a researcher or research group that has made a special contribu- tion by making research data accessible for new or additional research.Are you such a researcher or do you want to nominate a research group? Please fill in the nomination form at researchdata.nl. Prizes are awarded in three categories: humanities and social sciences; exact and technical sciences; medical and life sciences. The prize is: • a sculpture and • € 5,000 to make the dataset (more) accessible. research data netherlands Who’ll win the 2016 Dutch Data Prize? “Show how good your database or datasetis!Forus,theDataPrizehas beenajewelinourcrown.” Kees Mandemakers, 2010 Data Prize winner “Being awarded the Data Prize, even being nominated, underlines the importance of your work. It feels good.” Maarten Marx, 2012 Data Prize winner “Winning the Data Prize indicates that weareontherighttrack.” Mark van Koningsveld, 2012 Data Prize winner “The Data Prize is a confirmation that we’re heading in the right direction.” Martine de Bruin, 2014 Data Prize winner “Winning the Data Prize allows us to make important improvements we have long desired.” Marijke Dekker, 2014 Data Prize winner guïstische analyse. Tot op heden zijn er nog geen onderzoeken geweest die netwerkanalyses en lin- guïstische analyses samenvoegen. Een netwerk kan dienen als basis voor taalanalyse waarin taal- patronen onderzocht en gekoppeld kunnen wor- den aan de uitkomsten van het netwerk. Natural language processing maakt het mogelijk om die- per naar taalrelaties binnen netwerken te kijken met behulp van computationele technieken. De kracht ligt in de combinatie: nieuwe mogelijkhe- den om taal online beter te begrijpen en beter te kunnen minen. Door deze en andere onder- zoekservaringen met grote corpora, zoals twit- terberichten, hopen we op termijn specifieke lin- guïstieke kenmerken van extremistische posities te kunnen traceren, onafhankelijk van netwerka- nalyse.” dataschool.nl Contra vluchtelingen Pro vluchtelingen Media Belgisch contra vluchtelingen

Transcript of Utrecht Data School onderzoekt vluchtelingendebat op ... · Bijzonderfoto St.BMP 10JAARE-DATA...

Page 1: Utrecht Data School onderzoekt vluchtelingendebat op ... · Bijzonderfoto St.BMP 10JAARE-DATA Please find more information about the Dutch Data ... (1526-1609)hieldzichbezigmet wat

Hoe haal je betekenis uit tweets?

De Utrecht Data School analy-

seert de vluchtelingencrisis op

Twitter door netwerkanalyse te

koppelen aan semantische indi-

catoren. Paul Verhaar en Mirko Tobias

Schäfer

Door het toenemende aantal vluchtelingen namook het aantal gerelateerde berichten op socialmedia toe. Talloze berichten werden verspreidover het internet, waarin gebruikers hun meninguitten. Een van de grootste uitdagingen is om be-tekenis uit deze berichten te halen.“Ons onderzoek focust zich op het in kaart bren-gen van het vluchtelingendebat met behulp vannetwerkanalyses en linguïstische analyses. Onzetotale dataset bestaat uit 561.179 tweets, waarvan198.100 retweets, met het woord ‘gelukszoeker’.Dit woord brengt een dubbele connotatie metzich mee en is een interessante invalshoek vooronze analyse.”

561.179 tweetsDit Retweet-netwerk laat (re)tweets van politiek-Nederland zien. Rood staat voor politiek rechts(38% van het totaal aantal retweets), blauw staatvoor politiek links (24% van het totaal aantal ret-weets). De visualisatie laat zien dat het debatduidelijk verdeeld is. De media staan in het mid-den: hun berichten worden vanuit de twee clustersgeretweet. Het Twitter-account van GeertWildersis het account met de meeste retweets binnen hetrechtse cluster. Maar ook PVV-fractievoorzitterRené Dercksen is een hoogactieve opinieleider indit gebruikerscluster. In het linkse cluster is hetdebat veel diverser, een grotere groep aan opi-nieleiders is zichtbaar.“De netwerkanalyse biedt veel potentie voor lin-

INHOUD

2Verslagen van events inGehoord en bijgewoond

3Metadata van Clusius’brieven in eLaborate

3RIS Radboud helpt bijduurzaam archiveren

4 & 5Mijlpaal! Alweer 10 jaarE-data & Research

4 & 5‘Zorgen om de toekomstvan data en software’

6Alliantie strijd voorText & Data Mining

7Deze datasets zijn ooksinds kort beschikbaar

8Patiëntenvolgsysteem:data online beschikbaar

8Ewoud Sanders: eenoverdaad aan bronnen

Jaargang 10 | nummer 3

Nieuwsbrief overdata en onderzoekin de alfa- en gamma-wetenschappen.

E-data & Research verschijntdrie keer per jaar en wordtmogelijk gemaakt door:CentERdata, CLARIAH,DANS, Huygens ING,de Koninklijke Bibliotheeken het RIVM.

E-DATA&RESEARCH

E-DATA&RESEARCH juni 2016 1

Scan dezeQR code met eensmartphone om dewebsite van E-datate bezoeken.www.edata.nl

Onze totale dataset bestaat uit 561.179 tweets, waarvan 198.100 retweets, met #gelukszoeker. Deblauwe en rode nodes geven 38% en 24% weer van het totaal aantal retweets. Het debat is verdeeld;het netwerk laat een duidelijke polarisatie zien. Ook de positie van de media in de discussie is dui-delijk. Bovendien valt op dat het rechtse cluster relatief klein is. Het politiek linkse kamp laat veelverschillende opinieleiders zien, in het rechtste kamp domineert de leider van de PVV. credits UDS

Utrecht Data School onderzoekt vluchtelingendebat op Twitter

Onderzoek naar tweetsmet #gelukszoeker

Ook dit jaar wordt de Nederlandse Data-prijs uitgereikt. Een prijs voor een onder-zoeker of onderzoeksgroep die extra bij-draagt aan de wetenschap door onder-zoeksdata beschikbaar te maken vooraanvullend of nieuw onderzoek.Heidi Berkhout

Bent u of kent u zo’n onderzoeker met een goedvoorbeeld van gedeelde data? U kunt uzelf of eenander via researchdata.nl nomineren. De winnaarsvan de voorgaande edities zijn in ieder geval en-thousiast. Martine de Bruin, winnaar Dataprijs 2014:“De Dataprijs is een bevestiging dat we op hetgoede spoor zitten” en Marijke Dekker, winnaarDataprijs 2014: “Door het winnen van de Dataprijskunnen we nu ook een paar grotere, al langer ge-wenste verbeterslagen maken.” De prijsuitreiking isop 9 november bij NWO in Den Haag. Ook aan-melden kan online.researchdata.nl/diensten/dataprijs

Kijk voor meer informatie over de prijs, zoals dedrie categorieën, de prijzenpot en de criteria op dewebsite van RDNL.credits RDNL

Wint u deDataprijs ’16?

De Stichting Bevordering MaatschappelijkeParticipatie (BMP) legt verhalen met vluchte-lingen van toen en nu vast in het Oral Historyproject ‘Ongekend Bijzonder’. Deze per-soonlijke getuigenissen verdienen het om voorde toekomst bewaard te worden. De focusvan de interviewsligt op het opbou-wen van eennieuw leven in devier grote steden.Enkele tientalleninterviews zijnbeschikbaar viaEASY, het onlinearchiveringssysteem van DANS. Een over-zicht hiervan met links naar enkele interviewsstaat in de thematische collectie: OngekendBijzonder - Oral History project. (HB)

ongekendbijzonder.nlDOI: 10.17026/dans-zbd-b88x

248 levensverhalenvan vluchtelingen

Interview OngekendBijzonder foto St. BMP

❚❚ 10 JAAR E-DATA ❚❚

Please find more information about the Dutch Data

Prize on researchdata.nl/en/services/data-prize

The 2016 Dutch Data Prize is awarded to a researcheror research group that has made a special contribu-tion bymaking research data accessible for new oradditional research. Are you such a researcher ordo you want to nominate a research group?Please fill in the nomination form at researchdata.nl.

Prizes are awarded in three categories: humanitiesand social sciences; exact and technical sciences;medical and life sciences.

The prize is:

• a sculpture and

• € 5,000 to make

the dataset (more)

accessible.

researchdatanetherlands

Who’ll winthe 2016Dutch DataPrize?

“Show how good your database ordataset is! For us, the Data Prize hasbeen a jewel in our crown.”Kees Mandemakers, 2010 Data Prize winner

“Being awarded the Data Prize, evenbeing nominated, underlines theimportance of your work. It feels good.”Maarten Marx, 2012 Data Prize winner

“Winning the Data Prize indicates thatwe are on the right track.”Mark van Koningsveld, 2012 Data Prize winner

“The Data Prize is a confirmation thatwe’re heading in the right direction.”Martine de Bruin, 2014 Data Prize winner

“Winning the Data Prize allows us tomake important improvements we havelong desired.”Marijke Dekker, 2014 Data Prize winner

guïstische analyse. Tot op heden zijn er nog geenonderzoeken geweest die netwerkanalyses en lin-guïstische analyses samenvoegen. Een netwerkkan dienen als basis voor taalanalyse waarin taal-patronen onderzocht en gekoppeld kunnen wor-den aan de uitkomsten van het netwerk. Naturallanguage processingmaakt het mogelijk om die-per naar taalrelaties binnen netwerken te kijkenmet behulp van computationele technieken. De

kracht ligt in de combinatie: nieuwe mogelijkhe-den om taal online beter te begrijpen en beter tekunnen minen. Door deze en andere onder-zoekservaringen met grote corpora, zoals twit-terberichten, hopen we op termijn specifieke lin-guïstieke kenmerken van extremistische positieste kunnen traceren, onafhankelijk van netwerka-nalyse.”dataschool.nl

Contra vluchtelingen

Pro vluchtelingen

Media

Belgisch contra vluchtelingen

Page 2: Utrecht Data School onderzoekt vluchtelingendebat op ... · Bijzonderfoto St.BMP 10JAARE-DATA Please find more information about the Dutch Data ... (1526-1609)hieldzichbezigmet wat

Essentials 4 Data Supportverdiept en verbreedtFrank de Jong,medewerker afdeling Collectie-vorming, Internationaal Instituutvoor Sociale GeschiedenisGetipt door mijn KNAW-collega vanhet NIOD heb ik in het najaar van2015 de cursus Essentials 4 DataSupport gevolgd. Mijn werkzaam-heden bij de afdeling Collectie-vorming van het IISG staan voor eengroot deel in het teken van het aan-gaan van nieuwe en onderhoudenvan bestaande relaties met archief-vormers. Denk daarbij aan de ar-chieven die gevormd worden doorvakbonden (FNV en CNV) en poli-tieke partijen (PvdA en GroenLinks). Bij recente aanvullingengaat het om digitaal geboren archief.In onze aanpak hanteren we eenaantal basisbegrippen van goed be-heer: vertrouwelijkheid (open als hetkan, gesloten als het moet), duur-zaamheid en terugvindbaarheid.De RDNL-cursus viel samen met in-terne ontwikkelingen op het gebiedvan opslaan, beschikbaar stellen endelen van gestructureerde datasets.

Ruim 100 datasets uit afgesloten ennog lopende onderzoeksprojectenworden sinds kort aangeboden opde Dataverse-repository. Dankzij decursus kon ik me goed verdiepen ineen aantal technische, juridische enorganisatorische zaken rondom da-tamanagement. Uiterst praktischvond ik de geboden handreikingenvoor de event-gerichte acquisitievan datasets. Zo zag ik uitstekendenieuwe kansen voor het verzamelenvan datasets die ik op de EuropeanSocial Sciences History Conference(ESSHC) in Valencia van 30 maarttot en met 2 april 2016 met succes inde praktijk heb kunnen brengen.Een groot deel van de onderzoekersdie de ESSHC bezoeken of hun pa-pers presenteren, vindt aansluitingbij het onderzoeksprogramma vanhet IISG: de geschiedenis van werk,werkenden en arbeidsverhoudingenwereldwijd. Een toenemend aantalonderzoekers legt hun onderzoeks-gegevens vast in gestructureerde

datasets. Nieuw verworven datasetszouden idealiter ingezet kunnenworden in de bestaande wereld-wijde collaboratories bijvoorbeeldrondom stakingen, beroepsstructuurof arbeidsverhoudingen.Ik probeer onderzoekers met data-sets naar de best geschikte reposi-tory te verwijzen. Niet alles hoeftimmers naar het IISG, doorverwij-zen naar DANS, of equivalente bui-tenlandse instellingen, kan een be-tere optie zijn.datasupport.researchdata.nl

NPSO-themamiddag overrelatie surveys en beleidFrans Louwen,senior consultant, marktonder-zoekbureau GfKSurveydata worden door overhedengebruikt om beleid te ontwikkelenof te evalueren, maar ook als ther-mometer van de maatschappij.Tijdens de NPSO-bijeenkomst van22 maart schetsten vijf onderzoekers

een beeld van de relatie tussen sur-veys en beleid van concrete onder-zoeksprojecten.Rogier van Kalmthout (TNS-NIPO)trapte af en sprak over het metenvan de effectiviteit van overheids-campagnes (zoals Veilig vrijen, NL-alert, NIX18). Het doel van dezeeffectmetingen is vooral gelegen inevaluatie en verantwoording. Devraag bleef wel of deze campagnestot feitelijke gedragsveranderingleiden.Peteke Feijten (SCP) behandeldeonderzoek naar de hervorming vanlangdurige zorg. Conclusie was datde combinatie van een kaderwet engedecentraliseerd beleid zich moei-zaam laat sturen door onderzoek.Ook is er sprake van verminderdeaandacht voor de kwaliteit van data-verzameling. Positief was de beteresamenwerking tussen gemeenten.Na de koffiepauze gingAnn Carton(Studiedienst van de Vlaamse Re-gering) in op de implicaties van de

survey Sociaal-Culturele Verschui-vingen in Vlaanderen. Hiermeewordt trendmatig de relatie van deVlaamse burgers met regionale in-dicatoren in kaart gebracht. Aan-dacht voor de resultaten vanuit persen politiek is er zeker, maar het ge-bruik is vrij selectief.Gerben Huijgen (I&O) en Susan vanden Berge (gemeente Rotterdam)belichtten als laatste sprekers vande bijeenkomst de Veiligheids-monitor Rotterdam en hoe dezewordt ingezet bij lokaal beleid. Sur-veydata worden gecombineerd metpolitiegegevens om te komen totwijkprofielen en verschillende in-dexen. Op wijkniveau ontstaat er opdeze wijze een signaleringsinstru-ment.Voorzitter Vera Toepoel trok samenmet de aanwezigen de conclusie dater een duidelijke, maar niet ergdirecte relatie is tussen surveys enbeleid. Deze relatie wordt versterktdoor meer (harde) gegevens uitandere bronnen te combineren metsurveydata en meer te focussen opfeitelijk gedrag.npso.net

2 juni 2016 E-DATA&RESEARCH

GEHOORD & BIJGEWOOND

COLOFON Uitgever: Stichting Uitgeverij E-data & Research Den Haag. Redactieadres: Postbus 93067, 2509 AB Den Haag, 070-3494450, [email protected],www.edata.nl. Hoofd-/eindredacteur: Heidi Berkhout. Redactie: Marika de Bruijne, Steven Claeyssens, Marieke Willems, Rutger Nugteren, Erica Renckens, Marion Wit-tenberg. Redactiesecretariaat: Lucas Pasteuning. Aan dit nummer werkten mee: Reinoud Bosch, Merlin Daleman, Mijke Jetten, Frank de Jong, Emilie Kraaikamp, FransLouwen, Jan-Joost de Man, Ilja Nieuwland, Wido van Peursen, Mirko Schäfer, Paul Verhaar, Bart van Vliet, Kees Waterman. Opmaak: Colette Sloots, Haarlem.Productie: Amsterdam University Press. Druk: Ten Brink, Meppel. Webmaster: Sonja Duijkers Oplage: 6500 papier, 4500 digitaal. ISSN: 1872-0374.We hebben getracht alle belanghebbenden met betrekking tot het gebruikte beeldmateriaal te benaderen. Degenen die menen rechten te kunnen doen gelden, kunnenzich tot ons wenden. Toezending papieren en/of digitale versie is kosteloos aan relaties van de stakeholders en studenten in de alfa- en gammarichtingen.

OVERNEMEN ARTIKELENWilt u een artikel uit dit blad overnemen?Dat mag altijd, maar vermeld wel de bron (E-data& Research) en de naam van de auteur van het arti-kel. Neem ook contact op met de hoofdredacteur(zie colofon) om door te geven waar artikelen ge-plaatst worden.

Dankzij de Clusius-corresponden-

tie zijn honderden brieven van

deze Vlaamse geleerde volledig

digitaal doorzoekbaar.

Ilja Nieuwland

Carolus Clusius (1526-1609) hield zich bezig metwat destijds ‘natuurlijke historie’ heette. Hij isvooral bekend geworden dankzij honderden be-schrijvingen van nieuwe plantensoorten en hetoprichten van de Leidse hortus botanicus. Hoewelveel van Clusius’ publicaties al digitaal kondenworden bestudeerd via de website van de Missou-ri Botanical Garden Library, was zijn omvang-rijke correspondentie nog niet toegankelijk endoorzoekbaar. Namens Huygens ING (KNAW)en het Scaliger Instituut (UniversiteitsbibliotheekLeiden) ontwikkelde Esther van Gelder daaromeen online editie van deze rijke correspondentie.

Netwerk van correspondenten“Aandacht voor het netwerk van correspondentenrondom een bekende geleerde als Clusius kaneen ander perspectief bieden op de ontwikkelingvan wetenschappelijke kennis. Clusius werktesamen met honderden mensen die allemaal huneigen sociale en intellectuele bagage meebrach-ten bij het bestuderen van de natuurlijke wereldin Europa en daarbuiten. Hun brieven, illustraties,objecten en beschrijvingen laten ons zien hoenatuurlijke historie zich ontwikkelde tot een be-langrijk veld in de late zestiende eeuw.”

Het Clusius-project, dat van 2004 tot 2011 werduitgevoerd door de Universiteit Leiden, storttezich op deze uitwisselingen. Tijdens dit onder-zoek kwam Van Gelder op het spoor van hon-derden ongepubliceerde transcripties van de brie-ven van Clusius in twintigste-eeuwse onder-zoeksarchieven van de UB Leiden.Huygens ING en Scaliger maakten een grote stapin de richting van een complete digitale editie van

Clusius’ correspondentie door het verzamelen endigitaliseren van alle bestaande brieven en tran-scripties in eLaborate, een collaboratieve tran-scriptietool ontwikkeld door Huygens ING.De eerste versie van deze edition in progress be-vat metadata van alle 1.600 bekende brieven,scans van 1.170 brieven en transcripties van bijnaduizend brieven. Voor de eerste keer zijn dezebrieven nu volledig digitaal doorzoekbaar, waar-door onderzoekers in één klap de introductie encirculatie van nieuwe plantensoorten kunnen vol-gen. Bovendien is er een inleiding geschrevenwaarin het collaboratieve editieproces en deherkomst en kwaliteit van de teksten toegelichtworden.

Samen verder“Vanwege de grote verscheidenheid aan bron-nen van gepubliceerde en ongepubliceerde tran-scripties is er (nog) geen uniforme kwaliteit. Bo-vendien is er nauwelijks enige annotatie toege-voegd. We presenteren deze editie dan ook alswork in progress en nodigen onderzoekers enstudenten uit om de online editie te doorzoekenen vervolgens nieuwe scans, transcripties en an-notaties toe te voegen, bijvoorbeeld via de Clu-sius Community 2.0. Er ontbreken bijvoorbeeldnog zo’n 600 brieven.”De Clusiusbrieven zullen uiteindelijk opgeno-men worden in het Epistolarium, een onlinedatabank van zeventiende-eeuwse geleerden-correspondentie ontwikkeld door Huygens ING.

clusiuscorrespondence.huygens.knaw.nl

eLaborate bevat metadata van honderden brieven

Correspondentie Clusiusnu ook online beschikbaar

Portret van Carolus Clusius, prentmaker:Cornelis Galle (I) credits Rijksmuseum,hdl.handle.net/10934/RM0001.COLLECT.345840

Het Amsterdamsch Dagblad staatnu ook online credits KB

3 miljoen extrapagina’s inonline DelpherDe landelijke website voor gedigi-taliseerde boeken, kranten en tijd-schriften Delpher heeft er drie mil-joen krantenpagina’s bij. Ruimtwintig krantentitels zijn voor heteerst opgenomen in Delpher. Hetgrootste deel van de nieuwe aan-winst bestaat uit aanvullende jaar-gangen van titels die al in Delpherwaren te vinden. Helemaal nieuwvoor Delpher zijn 450 zogenaamde‘overgangsbladen’. Dat zijn kran-ten uit de veelbewogen jaren 1945-1947, de periode waarin de Neder-landse bevolking overeind krab-belde na de Bevrijding. De weerslagis te vinden in tientallen nieuwe, her-opgerichte en ‘bovengronds’ geko-men verzetskranten. (HB)delpher.nl

Page 3: Utrecht Data School onderzoekt vluchtelingendebat op ... · Bijzonderfoto St.BMP 10JAARE-DATA Please find more information about the Dutch Data ... (1526-1609)hieldzichbezigmet wat

Op zoek naar literaire

personages en hun

onderlinge relaties

verruilt literatuur-

wetenschapper Puck

Wildschut een paar

maanden de universiteit

voor de bibliotheek.

Steven Claeyssens

Bij de afdeling Algemene Cultuur-wetenschappenvan de RadboudUniversiteit Nij-megen werktWildschut aan een proefschrift overLolita en Pale Fire, twee romansvan de Russisch-Amerikaanse au-teur Vladimir Nabokov. “In mijnonderzoek probeer ik narratologi-sche en taalwetenschappelijke ana-lytische invalshoeken met elkaar te

verbinden. Daar komen ook kwan-titatieve en computationele metho-den bij kijken.” Daar houdt ze hetechter niet bij. “Ook werk ik samenmet enkele taalwetenschappers aande Radboud Universiteit aan eenonderzoeksproject over sprookjes.We proberen om semantische rollen– dat zijn simpel gezegd personagesen andere actanten – en de onder-linge relaties tussen die rollen auto-matisch te laten bepalen, dus metbehulp van een computersoftware.”Wildschut is de eerste literatuur-wetenschapper die als researcher-in-residence bij de KB aan de slag

gaat. “Het onderzoek dat ik samenmet het Digital Humanities-teamvan de KB uitvoer, ligt in het ver-lengde van het sprookjesproject.Wehebben een paar centrale vragen. Ishet mogelijk om semantische rol-len automatisch in langere narra-

tieve teksten te herkennen? Enwerkt een dergelijke analyse ookadequaat op grotere tekstcorpora,zoals de Digitale Bibliotheek voorde Nederlandse Letteren (DBNL)?”De vraag die voorafgaat aan dezevragen luidt: is het mogelijk be-staande analysesoftware, die veelalvoor het Engels ontwikkeld is,werkbaarder te maken voor deNederlandse taal?

Onmiddelijke toegangHet zijn taaie vragen die zeker nietin een paar maanden volledig vantafel zullen zijn, maar dat tempert

Wildschuts en-thousiasme niet:“De KB biedt on-middellijke toe-

gang tot veel interessant materiaalom deze kwesties aan te pakken.Bovendien geeft het een grotemeerwaarde om samen met eenonderzoeksprogrammeur en eencollectiespecialist het vraagstuk inte duiken.”

De resultaten van het onderzoek vanWildschut komen beschikbaar ophet KB Research Lab en blog. NaWildschut is Frank Harbers (RUG)te gast.kb.nl/organisatie/onderzoek-expertise/researcher-in-residence

E-DATA&RESEARCH juni 2016 3

“Ik wil narratologie en taalweten-schap verbinden” foto KB Beeld-studio

Eerste researcher-in-residence van 2016 aan de slag in de KB

‘Samen een vraagstuk induiken’

JONG TALENT

Researcher-in-residenceSinds 2014 nodigt de KoninklijkeBibliotheek (KB) jonge,beloftevolle onderzoekers uit omin de bibliotheek met behulp vandigitale technieken een vraagstuknaar keuze te lijf te gaan.Van de samenwerking profiteertzowel de onderzoeker als debibliotheek: de researcher-in-residence krijgt hulp van pro-grammeurs en collectiespecia-listen, de KB leert van dewensen en methoden van deonderzoeker om zo collectiesen dienstverlening te kunnenverbeteren.Bestaande of speciaal ontwikkel-de tools die daarbij hun dienstenbewijzen, worden opgenomen inhet KB Research Lab zodat ookandere onderzoekers ze kunnengebruiken en eventueel uitbrei-den.Een nieuwe Call for Proposalsvoor researchers-in-residencevan 2017 wordt begin juni doorde KB gepubliceerd.

Een team van data librariansondersteunt Nijmeegse on-derzoekers bij het duurzaamarchiveren en toegankelijkmaken van hun onderzoeks-data via het CRIS van de in-stelling. Marion Wittenberg enMijke Jetten

Elke onderzoeker van de RadboudUniversiteit heeft een persoonlijkeRIS-pagina, waarmee data kunnenworden geregistreerd en geüploadvia het Current Research Informa-tion System (CRIS) van de instel-ling. Ook de full text van bijbeho-rende publicaties kan geüpload wor-den. De link tussen dataset en pu-blicatie, inclusief full text, wordtzichtbaar in de Radboud Reposi-tory.

Ondersteuningdoor data-librarianWanneer de dataset door de onder-zoeker geüpload is, controleert dedata librarian van de Research In-formation Services (RIS) de meta-data op duidelijkheid en begrijpe-lijkheid. Daarnaast wordt nagegaanof de data voldoende gedocumen-teerd zijn, geen privacygevoeligeinformatie bevatten en of de be-standen het juiste formaat hebben.Als alles in orde is, stuurt de data-librarian de dataset naar het onlinearchiveringssysteem EASY vanDANS. Via een SWORD-interface

komen metadata en onderzoeksdataautomatisch in EASY terecht. EenDANS-datamanager doet een laat-ste controle en publiceert de dataset.Bovendien krijgt de dataset auto-matisch een DOI. De data zijn nuduurzaam gearchiveerd én toegan-kelijk voor hergebruik.

Samenwerking FrontOffice en Back OfficeMet deze werkwijze implemente-ren Radboud Universiteit en DANShet Front Office-Back Office-mo-

del (FO-BO) van datacuratie. DANSvervult de rol van backoffice endraagt zorg voor de duurzame ar-chivering en beschikbaarstellingvan onderzoeksdata. Het RIS van deRadboud Universiteit, operationeelsinds begin 2016, staat als front-office in direct contact met de on-derzoeker en zorgt dat onderzoeks-data goed gedocumenteerd wordenen voorbereid zijn op hergebruik.

Integriteit en kwaliteitvan onderzoekBij de Radboud Universiteit is hetbestaande CRIS-systeem, Metis, ge-schikt gemaakt voor de registratievan de metadata van datasets als-mede de upload van de databestan-den zélf. Onderzoekers hoeven hier-door maar van één interface gebruikte maken om informatie over hunonderzoek, publicaties en data te re-gistreren. Data en publicaties kun-nen op deze manier ook direct (inhet CRIS) aan elkaar gekoppeldworden. Deze oplossing faciliteertniet alleen de onderzoeker, maarzorgt ook dat op organisatieniveauinzicht en controle mogelijk is metbetrekking tot de integriteit en dekwaliteit van het onderzoek. Im-mers: alle gegevens over het onder-zoek worden in één primair CRIS-systeem geregistreerd, dat ook alsbron functioneert voor de instel-lingsrepository.ris.ru.nl

Het Front Office-Back Office-model van Research Data Nether-lands: de datasupporters in deonderzoeksinstelling (het frontof-fice) vormen een essentiële scha-kel tussen onderzoekers en hetduurzame archief (het backoffice)bron RDNL

FOCUS

FO-BO-model van datacuratie in de praktijk

RIS Radboud ondersteuntbij duurzaam archiveren

De Nederlandse Gouden Eeuw iswereldberoemd, maar hoe verklarenwe de creatieve explosie? We heb-ben verbrokkelde kennis over deproductie en weten weinig over deconsumptie in de creatieve indus-trie. Dit verandert door het projectGolden Agents: creatieve industrieen de creatie van de NederlandseGouden Eeuw. Met hulp van een

NWO-groot investering verbindt hetproject bestaande datasets met ge-gevens over de productie metnieuwe archiefbronnen over de con-sumptie in de Gouden Eeuw, zoalsde notariële akten uit de GoudenEeuw van het stadsarchief Amster-dam. Interdisciplinair onderzoeknaar de creatieve dynamiek van deGouden Eeuw is zo mogelijk. (MW)

Allegorische voorstelling van Amsterdam als centrumvan de wereldhandel credits Pieter Isaacsz.,

Rijksmuseum, http://hdl.handle.net/10934/RM0001.COLLECT.358158

Golden Agents verbindt bronnen

De discussie over open access wordtvooral gevoerd door bestuurders, bi-bliothecarissen, overheidsdienarenen uitgevers. Maar wat vinden on-derzoekers van open access?De KNAW liet een bont gezelschaponderzoekers aan het woord: jong enouder; alfa, bèta en gamma. Het pa-let dat uit de 21 interviews oprijst isinderdaad bont. Hoewel niemand

het belang van kwalitatief hoog-staand wetenschappelijk onderzoekbetwist, blijkt open access geen mid-del om die kwaliteit te bevorderen,en soms zelfs belemmerend te wer-ken. Lees het resultaat in de inter-viewbundel Open boek over openaccess, kosteloos te downloaden viade KNAW-website. (HB)knaw.nl

Open access interview-bundel

Het Europese Parlement heeft, na ja-ren van intensieve onderhandelingenmet de Europese Commissie en deEU-lidstaten, de nieuwe privacywetGeneral Data Protection Regulation(GDPR) aangenomen. Deze nieuwewet heeft ook voor wetenschappelijkonderzoek gevolgen: het beheer van

persoonsdata van proefpersonen enpatiënten wordt strenger. De nieuweregels gaan over twee jaar in. Opnationaal niveau moeten nog aan-vullende regelingen worden ont-wikkeld, bijvoorbeeld met betrek-king tot informed consent. (HB)europarl.europa.eu/news/en

Nieuwe privacywet is een feit

Page 4: Utrecht Data School onderzoekt vluchtelingendebat op ... · Bijzonderfoto St.BMP 10JAARE-DATA Please find more information about the Dutch Data ... (1526-1609)hieldzichbezigmet wat

❚❚ 10 JAAR E-DATA ❚❚❚❚ 10 JAAR E-DATA ❚❚❚❚ 10 JAAR E-DATA ❚❚❚❚ 10 JAAR E-DATA ❚❚❚❚ 10 JAAR E-DATA ❚❚❚❚ 10 JAAR E-DATA ❚❚❚❚ 10 JAAR

❚❚ 10 JAAR E-DATA ❚❚❚❚ 10 JAAR E-DATA ❚❚❚❚ 10 JAAR E-DATA ❚❚❚❚ 10 JAAR E-DATA ❚❚❚❚ 10 JAAR E-DATA ❚❚❚❚ 10 JAAR E-DATA ❚❚❚❚ 10 JAAR

4 juni 2016 E-DATA&RESEARCH

25 jaar geleden stapte ik bijStichting Telepanel aan deUvA binnen. De bakermat vanonline survey-onderzoek inNederland, zeggen velen nu.We werkten met een Sinclair-computer zonder harde schijfmet modem, het scherm wasde eigen TV van de respon-dent. Corrie Vis

De surveys werden elke vrijdag viahet modem opgestuurd aan de panel-leden. Men deed graag mee, uitnieuwsgierigheid en om de weten-schap te helpen. Het interviewpro-gramma was robuust en klein ge-noeg voor een floppy. Voor het aan-sluiten van de apparatuur kwam een

medewerker bij de panelleden langs.Onderzoek dat schriftelijk eigenlijkniet of nauwelijks te doen was,kwam met deze nieuwe techniekbinnen handbereik. Een voorbeeldhiervan is onderzoek naar de levens-loop, met onderwerpen als wonen,relaties, opleidingen, arbeid en in-komen. Deze computergestuurdesurveys waren gebaseerd op de wer-king van het geheugen met her-haalde vraagblokken en complexerouting. Ze waren weldoordacht,maar de resulterende databestandenhielden in het begin geen gelijketred. Soms zaten ze zo ingewikkeldin elkaar dat ze niet zomaar te ana-lyseren waren.De technische verandering in data-

verzameling leverde ook nieuweaandachtsgebieden op zoals: de tijd-belasting van de respondent, de cog-nitieve eisen die worden gesteld enhet experimentele design. Compu-tergestuurd survey-onderzoek heeftzich bewezen en is inmiddels eenzelfstandige richting in de socialewetenschappen.

Te veel, te langInmiddels is het afnemen van eensurvey via internet eenvoudig. Dedoe-het-zelf-softwarepakketten zijnlegio. Wat vond u van onze service?Heeft u kleding op internet gekocht?Wat vindt u van onze website? Dezewijze van dataverzameling is snelen kostenefficiënt, maar het is geen

wonder dat steeds minder mensenzin hebben om vragen te beant-woorden.Ook voor sociaalwetenschappelijkonderzoek worden te veel lange,computergestuurde surveys ontwik-keld. Er zijn echter goede initiatie-ven gaande om het aantal en delengte van surveys te verminderen.Bijvoorbeeld door surveydata tekoppelen aan administratieve data,verzamelde data te archiveren entoegankelijk te maken voor andereonderzoekers en data scientists op teleiden om big data te analyseren ente interpreteren.

Op waarde schattenSurveys in de sociale wetenschap-

pen blijven nodig. Zelfs als iedereeneen chipje heeft om zijn gezond-heidstoestand te monitoren, zullenwe willen weten hoe iemand zichvoelt. Met name longitudinaal on-derzoek vereist dat we als onder-zoekers de respondenten weer opwaarde moeten schatten. Een effec-tieve manier hiervoor is aandachtgeven aan de mensen van wie weiets willen weten en een betrouw-bare relatie met hen opbouwen. Zorgervoor dat het beantwoorden vanvragen interessant en zinvol is.Alleen dan kunnen we ook in detoekomst goede antwoorden ver-wachten.

credits nachtblauw.com

E-data &Researchbestaat 10 jaar

Op deze twee pagina’s

blikken we terug en

vooruit met toonaan-

gevende personen en

projecten binnen de

alfa- en gammaweten-

schappen en laten we

de uitkomsten van ons

lezersonderzoek zien.

E-data & Research

wordt mogelijk gemaakt

door CentERdata,

CLARIAH, DANS,

Huygens ING, de KB

en het RIVM. Meedoen

kan! Als stakeholder

en als redactielid.

Neem contact met de

hoofdredacteur (zie

colofon pagina 2) op

voor de mogelijkheden.

Twee grote programma’s op

het snijvlak van geestesweten-

schappen en informatica zijn

recent afgerond. De program-

madirecteuren maken zich zor-

gen over de toekomst van data

en software. Erica Renckens

“Toen we in 2009 begonnen, was er nog eengrote kloof tussen de geesteswetenschappersen de taaltechnologen die grote corporasamengesteld hadden,” memoreert Jan Odijk,programmadirecteur van CLARIN-NL. “Dedata waren er wel, maar onderzoekers moes-ten die zelf downloaden, query’s maken, stuk-jes programmeren. Ons hoofddoel was omdat makkelijker te maken.” In 2015 werdCLARIN-NL afgesloten - de verdere ontwik-keling van een digitale onderzoeksinfrastruc-tuur voor de geesteswetenschappen is inmid-dels overgenomen door CLARIAH.“Bij ons was er nog niks toen we begonnen,”aldus Jaap van den Herik, programmadirec-teur van CATCH, dat afgelopen januari werdafgerond. “Ik vond dat kunstmatige intelli-gentie niet alleen bij wiskunde en informaticathuishoorde, maar juist ook het toepassings-gebied moest bestrijken. Daarom hebben weeen samenwerking tussen de exacte weten-schappen en de gamma’s bewerkstelligd, uit-gevoerd op de plaats van het cultureel erfgoeddoor een team van een aio, een postdoc en eenprogrammeur.” In tien jaar tijd zijn zo bijnatwintig projecten bij erfgoedinstellingen af-gerond.

Voorlopers als paradepaardjes“In het begin moesten we de erfgoedinstel-lingen natuurlijk nog wel enthousiast maken,”vertelt Van den Herik. “Van nature hadden ze

geen affiniteit met kunstmatige intelligentie.Maar met twee voorbeeldprojecten kwam deboel al snel op gang.”Odijk: “Wij hebben precies dezelfde erva-ring. Wij gingen iets doen voor geesteswe-tenschappers die daar helemaal niet om ge-vraagd hadden. Maar elk vakgebied kent weleen paar voorlopers, daar moet je overtui-gende projecten mee doen om de rest mee tekrijgen. Zo hebben we naast de taalkunde ookveel andere disciplines in de geestesweten-schappen weten te bereiken, zoals geschiede-nis, literatuurstudies, filosofie. Daar ben ikwel trots op.”Van den Herik: “Helemaal mee eens. Je moetvan de voorlopers in een vakgebied je parade-paardjes maken.”

Proefschrift als hoogtepuntZowel CATCH als CLARIN-NL kunnen terug-kijken op een mooi programma met innova-tieve resultaten. “Van 2000 tot 2015 hebbenCATCH en CLARIN-NL een duidelijke land-mark gezet op de mondiale onderzoekskaart,”aldus Van den Herik. “Ik ben erg blij met watwe bereikt hebben, maar dat neemt niet wegdat je je af kunt vragen wat beter had gekund.Dat is wat mij betreft met name de valorisa-tie. Het proefschrift was het hoogtepunt in deafronding van een project. Daarna zeiden ze‘dankjewel’ en dat was het dan. Musea wildenwel verder met wat we ontwikkeld hadden,maar daar was aanvankelijk geen geld voor.”Dit inzicht leidde tot het project CATCH-Plus, waarin de succesvolste resultaten uitCATCH werden doorontwikkeld. Daarnaaststapte Van den Herik naar NWO, die vervol-gens elk project een half jaar extra gaf voorvalorisatie.

Managen van data en software“Vervolgens had je natuurlijk in Tilburg deStapel-affaire, waardoor het duidelijk werddat er iets aan datamanagement gedaan moest

worden,” stelt Van den Herik. “Inmiddelsmoet dat wel in elke NWO-aanvraag zijn op-genomen, maar daar was toen nog geen geldvoor beschikbaar.” Odijk: “Dat is ook een vanmijn grootste zorgen. We hebben nu een net-werk van datacentra in Nederland die vol-doen aan allerlei voorwaarden om data goeden veilig te bewaren en ter beschikking testellen. Maar die doen dat nu eigenlijk gratisof in de context van een lopend project. Ge-lukkig zitten we dankzij CLARIAH wat ditbetreft de komende tien jaar goed, maar voordaarna moet er wel een concreet plan liggen.

CATCHCATCH staat voor Continuous Access toCultural Heritage. Met de methoden entechnieken die zijn ontwikkeld binnen CATCHworden erfgoedcollecties beter toegankelijk voorpubliek, professionals en wetenschappers. Eenvoorbeeld hiervan is SCRATCH, een gebruikers-interface voor software die handgeschreventeksten doorzoekbaar kan maken. Of ZieOok,een applicatie die bezoekers aanbevelingen doetop basis van hun persoonlijke profiel.

CLARIN-NLCLARIN-NL staat voor Common LanguageResources and Technology Infrastructure.Binnen CLARIN-NL zijn bestaande datasets entools omgezet naar duurzame standaarden, zodathet geheel interoperabel wordt en nieuwonderzoek mogelijk maakt. Dit heeft bijvoorbeeldin het War in Parliament-project tot een applicatiegeleid waarin de Handelingen der Staten-Generaal doorzoekbaar zijn. De Mimore-toolmaakt het mogelijk om in drie verschillendedialectologische databanken tegelijk te zoeken.De resultaten van CLARIN-NL zijn beschikbaarvia de portal.clarin.nl.

Online dataverzameling in Nederland

Een kwart eeuw survey-onderzoek

In gesprek met programmadirecteuren Jaap van den Herik (CATCH) en Jan Odijk (CLA

‘Datamanagement is reger

Page 5: Utrecht Data School onderzoekt vluchtelingendebat op ... · Bijzonderfoto St.BMP 10JAARE-DATA Please find more information about the Dutch Data ... (1526-1609)hieldzichbezigmet wat

E-DATA ❚❚❚❚ 10 JAAR E-DATA ❚❚❚❚ 10 JAAR E-DATA ❚❚❚❚ 10 JAAR E-DATA ❚❚❚❚ 10 JAAR E-DATA ❚❚❚❚ 10 JAAR E-DATA ❚❚❚❚ 10 JAAR E-DATA ❚❚

E-DATA ❚❚❚❚ 10 JAAR E-DATA ❚❚❚❚ 10 JAAR E-DATA ❚❚❚❚ 10 JAAR E-DATA ❚❚❚❚ 10 JAAR E-DATA ❚❚❚❚ 10 JAAR E-DATA ❚❚❚❚ 10 JAAR E-DATA ❚❚

E-DATA&RESEARCH juni 2016 5

Met financiële afspraken over hoe de data dievoortkomen uit nieuw onderzoek terecht gaankomen op die centra en beheerd gaan wor-den.”“Naast een datamanagementplan willen weeigenlijk ook een softwaremanagementplan,”vervolgt Odijk. “Het laten draaien en onder-houden van applicaties op servers kost geld.Niet alleen de fysieke opslag, maar meer nogde mensen die dat draaiende moeten houden.Daar moet je geld voor reserveren, want erkomt alleen maar meer bij. Het vraagt ook omeen life cycle-plan voor data en software: hoe

lang houd je iets direct beschikbaar voor deonderzoeksgemeenschap?”Wie moet voor zo’n plan zorgen? “De BVNederland,” stelt Van den Herik. “We moetende omslag maken van incidentele ondersteu-ning naar structurele ondersteuning.Wij moe-ten als onderzoekers de regering overtuigenvan het belang van onze wetenschappelijkepositie in de wereld. We moeten de volksver-tegenwoordigers uitleggen dat Nederland an-ders achter komt te liggen en dat zij daar nietverantwoordelijk voor willen zijn. De enigepartij die onze opmerkingen in hun pro-

gramma meeneemt, is D66. Ik wil die anderepartijen uitdagen om zich hier ook voor in tezetten. In 2018 zou hierover iets in het rege-ringsakkoord moeten staan.”Odijk: “Dat is een ambitieuze doelstelling,maar het zou wel heel goed zijn.”

Trots op wat is bereiktVoorlopig zijn de resultaten van CLARIN-NLen CATCH dus nog volop bruikbaar. Zijn deprogrammadirecteuren tevreden over het ge-bruik van de tools en data? “Sinds kort hebbenwe in Europees verband een monitor die datbijhoudt, maar daar heb ik geen goed zichtop,” vertelt Odijk. “Wel zie ik hoeveel men-sen werkelijk onderzoek doen met de CLA-RIN-infrastructuur. En hoeveel mensen metvragen bij ons komen als er weer een nieuweaanvraagronde is. Daarnaast zie je ook veelprojecten die weer voortkomen uit CLARIN-projecten. En ik zie dat het meer en meer inhet onderwijs gebruikt gaat worden. Zo rakenook nieuwe onderzoekers ermee vertrouwd.”Van den Herik: “Vergeet inderdaad de mensenniet. Bij CATCH hebben we natuurlijk mooieproducten opgeleverd, maar bij elk projectwaren ook een hoogleraar en mensen van deerfgoedinstelling betrokken. Zo hebben weruim honderd mensen intensief bij het procesbetrokken en die komen ook allemaal weerergens terecht, met hun kennis.We hebben opdie manier veel bereikt en daar kunnen wetrots op zijn. En ik ben ook trots op NWO datze zo receptief zijn geweest voor onze argu-menten voor de noodzaak van deze ontwik-kelingen, dat ze die hebben opgenomen en uit-gedragen.”catchplus.nlclarin.nl

Jaap van den Herik (links) en Jan Odijk zien veel positieve ontwikkelingen: “We kunnen terugkijken op mooie projecten met innovatieveresultaten”, maar ze delen ook hun zorgen: “We moeten de omslag maken van incidentele naar structurele ondersteuning”foto Bart van Vliet

ARIN-NL)

ringsakkoord waardig’Lezers van dit blad waarderen deinhoud gemiddeld met een 7,18.De inhoud voldoet voor 96% vande ondervraagden. Mooie cijfersdie blijken uit het onlangs gehou-den lezersonderzoek.Marika de Bruijne

E-data & Research verschijnt in het Ne-derlands en een ruime meerderheid van85% heeft ook de voorkeur voor deze taalboven het Engels. De meerderheid (57%)van de respondenten zegt het blad per postte ontvangen. 39% ontvangt (ook) de di-gitale variant of gaat naar de website naaraanleiding van deze e-mail (8%). Voortweederde was dit al de gewenste manier,19% gaf tijdens het onderzoek aan het bladliever digitaal te willen ontvangen, waarze meteen voor konden kiezen. Ongeveer38% zegt weleens de website edata.nl tebezoeken.

Hoe wordt het gelezen?Al lezend kiest men de meest interessanteonderdelen eruit. Zo’n 41% leest een enkelartikel uit het blad, 17% bladert het bladdoor en 19% leest veel artikelen. De ru-briek ‘Sinds kort beschikbaar’ wordt hetmeest gelezen (63%). Ook leest de helfthet paginagrote interview.De overgrote meerderheid van de onder-vraagde abonnees vindt dat de thema’sdie aan bod komen goed verdeeld zijn(84%). Degenen die vinden dat bepaaldethema’s te weinig aan bod komen, zoudenmeer willen lezen over bijvoorbeeld ar-cheologie, sociale wetenschappen, en his-torische wetenschappen / geschiedenis.

Uw mede-lezersHet blad bedient meerdere disciplines.Ongeveer een derde (32%) van de lezersheeft een achtergrond in de geestesweten-schappen, 18% in de sociale wetenschap-pen. De rest van de lezers komt uit anderedisciplines. Bijna een kwart (24%) is on-derzoeker, 18% werkt in een ondersteu-nende functie, 17% werkt als hoogleraar ofuniversitair (hoofd)docent en 11% in ma-nagement-, bestuurlijke of beleidsfuncties.

Meerdere doeleindenRuim de helft (52%) zegt informatie uiteen artikel weleens te hebben gebruikt.Vaak heeft de informatie de lezer op hetidee gebracht voor het (her)gebruiken vandata (24%) of heeft de lezer de informatiegebruikt voor onderzoek (23%). Verderwordt de informatie uit het blad gebruiktvoor bijvoorbeeld presentaties (13%) ofonderwijs (8%).

Alle resultaten uit dit onderzoek zijnindicatief; 525 mensen (7%) hebben devragenlijst volledig ingevuld. Mocht uniet hebben meegedaan aan het onder-zoek maar toch nog een suggestie heb-ben, mail dan naar [email protected]

Mooie cijferslezersonderzoekE-data & Research

panelsurveysvia modem, tven computer

1990

2016 e.v.

nieuwemogelijkhedenvoor onderzoek

aandacht voorde respondent;hoge respons

online surveysbooming

online surveysgoedkoop

groei van internet

dalende respons:minder kwaliteit

heroverwegingopzet surveyonderzoek

surveys korter,interessanter,meer aandachtvoor derespondent

25 jaar online survey onderzoek

Page 6: Utrecht Data School onderzoekt vluchtelingendebat op ... · Bijzonderfoto St.BMP 10JAARE-DATA Please find more information about the Dutch Data ... (1526-1609)hieldzichbezigmet wat

Pearl Dykstra, hoogleraarSociologie aan de ErasmusUniversiteit Rotterdam, legthart en ziel in de toekomstigeNationale Data-infrastructuurvoor de Sociale Wetenschap-pen (NDSW). Jan-Joost de Man

Verbinden, samenwerken, overgrenzen heen kijken, efficiëntie envooral ongekende mogelijkheden,dat zijn de sleutelbegrippen voorPearl Dykstra. Samen met onder-zoekers van alle 14 Nederlandse uni-versiteiten zet zij haar schoudersonder de investeringsaanvraag in deNationale Roadmap GrootschaligeInfrastructuur voor discipline-over-stijgende dataverzamelingen in desociale wetenschappen. Dykstra:“De focus ligt op de uitdaging: watkun jíj bijdragen aan het werk vaneen ander? De tijd van afzonderlijkestructuren per discipline ligt achterons. De toekomst is er een van een-dracht, niet van aparte hokjes.”

Virtueel netwerkDe komende maanden zijn span-nend, rond de zomer wordt de uit-slag verwacht. Dan komt er ant-woord op de vraag of het de initia-tiefnemers, met de EUR als indienervan de nationale aanvraag en PearlDykstra als wetenschappelijk trek-ker, gelukt is de handen op elkaar tekrijgen voor deze eerste stap op weg

naar een miljoeneninvestering.Dykstra: “Nederlandse survey-onderzoekers behoren sinds de jarentachtig al tot de wereldtop, zowelmethodologisch als inhoudelijk.Maar het zijn afzonderlijke dataver-zamelingen: denk aan de grote driesurveys ESS, GGP en SHARE. Doelis om deze dataverzamelingen, énvele andere, te koppelen. Je creëerthiermee een kolossaal virtueel net-werk, met een groeimodel, dat ons instaat stelt nieuwe vragen te beant-

woorden of oude vragen op eennieuwe manier te onderzoeken.” DeNDSW biedt zo ongekende moge-lijkheden om vraagstukken als mi-gratie, werkgelegenheid, veiligheiden gezondheid aan te pakken, langsempirische weg, vanuit verschil-lende disciplines, met behulp vanactuele bevolkingsgegevens, die inveel grotere mate dan nu voor cross-referenties openstaan.

Met een reuzenstapDykstra: “De urgentie én de wense-lijkheid van de NDSW is voelbaar.De wetenschap staat in steeds gro-tere mate in het teken van samen-werken, tussen universiteiten éndisciplines. Inmiddels zijn er flinkestappen gezet. Dat geeft energie, bij-voorbeeld om jonge onderzoekersop te leiden.” Het breed gedeeldeinitiële commitment wordt de ko-mende tijd verder vormgegeven. Hetgaat daarbij om een nauwe samen-werking tussen de universiteiten(eerste geldstroom), NWO (tweedegeldstroom), de ministeries, CBS,DANS en andere kennisinstellingenzoals bijvoorbeeld de planbureaus.Met de financiële armslag die op-name in de Nationale RoadmapGrootschalige Infrastructuur metzich mee zal brengen, kunnen desociale wetenschappen met een reu-zenstap een nieuw tijdperk binnen-treden.

6 juni 2016 E-DATA&RESEARCH

Pearl Dykstrafoto Angelique van Woerkom

Pearl Dykstra, trekker NDSW

‘Wat kun jij bijdragenaan andermans werk?’ Nieuwe boost voor

LISS panel tot 2017Door een gezamenlijke investe-ring van NWO, Tilburg Univer-sity en CentERdata kan de da-taverzameling in het LISS pa-nel worden voortgezet. De fi-nanciering dekt de vaste lastenvan de infrastructuur in 2016en 2017. In het LISS panelkunnen academische onder-zoekers in Nederland en daar-buiten hun vragenlijsten of ex-perimenten afnemen. De dataverkregen uit deze studies wor-den gepubliceerd opdat ookandere onderzoekers er ge-bruik van kunnen maken. Mo-menteel kent het LISS Data Ar-chief meer dan 1.600 gebrui-kers. Voor de lange termijn wilCentERdata het LISS panelonderbrengen in een nationaledata-infrastructuur voor de so-ciale wetenschappen. Hierbijzal CentERdata samenwerkenmet universiteiten, het CBS enNWO Maatschappij- en Ge-dragswetenschappen. (MdB)lissdata.nl

DANS-subsidie voorkleine dataprojectenTot 1 oktober is het mogelijkom een subsidie bij DANS aante vragen voor kleine datapro-jecten (KDP’s). Deze zoge-noemde KDP-subsidie wordtverstrekt aan haalbaarheidsstu-dies, verkenningen op het ge-bied van data-archivering enprojecten waarbinnen belang-rijke datasets worden beschre-ven en toegankelijk worden ge-maakt. De subsidies zijn vooralbedoeld voor deelgebiedenwaar nog niet tot nauwelijksaan data-archivering wordt ge-daan, en waarbij de subsidievan DANS een stimulans kanzijn om dit juist wel te doen.(HB)dans.knaw.nl

450.000 openaccess publicatiesin NARCIS

In de nationale wetenschaps-portal NARCIS zijn nu meerdan 450.000 open access-publicaties toegankelijk. Dezepublicaties zijn afkomstig uitde repositories van de universi-teiten, KNAW, NWO, HBO(lectoren) en andere weten-schappelijke instellingen, zoalsNaturalis Biodiversity Centre,RIVM en TNO. De open accesspublicaties zijn voor een grootdeel wetenschappelijke artikelen(187.000), rapporten (67.000)en proefschriften (65.000).Naast de open access-publica-ties wordt in NARCIS eenoverzicht gegeven van 785.000publicaties die voor een grootdeel van de academischewereld wel full text toegankelijkzijn via de universitaire biblio-theken. (HB)narcis.nl

KORT

7 - 9 juni • GöttingenInternationale conferentieover elektronisch publicerenWetenschappers, uitgevers,docenten, librarians, ontwikke-laars en andere belanghebben-den komen samen tijdens ditevent en delen ervaringen.meetings.copernicus.org/elpub2016

8 - 11 juni • St AndrewsCRIS2016Een door EuroCRIS georgani-seerde bijeenkomst met alsthema ‘Communicating andMeasuring Research Responsi-bly:Profiling, Metrics, Impact,Interoperability’.eurocris.org

9 - 10 juni • BelvalDigital Humanities BeneluxConferenceDe jaarlijkse grote DH-conferen-tie van de lage landen.dhbenelux.org

13 - 16 juni • DublinInternational Conferenceon Open RepositoriesEen conferentie georganiseerdvoor en door de Open Reposi-tories gemeenschap.or2016.net

6 - 7 juli • ValenciaCARMATijdens deze eerste InternationalConference on AdvancedResearch Methods and Analy-tics (CARMA) kunnen onder-zoekers ervaringen delen overhet gebruiken van onderzoeks-methoden in de sociale weten-schappen.carmaconf.org

11 - 16 juli • KrakówDigital HumanitiesHet thema van deze DigitalHumanities-conferentie is‘Digital Identities: the Pastand the Future’.dh2016.adho.org

3 - 6 oktober • BerniPRES 2016Deze editie van iPRES wordtgeorganiseerd door de Zwit-serse nationale bibliotheek.ipr16.organizers-congress.org

13 oktober • AmsterdamNationaal eScienceSymposiumHet Netherlands eScience Cen-ter organiseert voor de vierdekeer een nationaal eSciencesymposium. Het thema is‘Science in a Digital World’.esciencecenter.nl

9 november • Den HaagPrijsuitreiking DataprijsWie wint de Nederlandse Data-prijs 2016? Kom naar de prijs-uitreiking op 9 november.researchdata.nl/diensten/dataprijs

AGENDA

Een omvangrijke internatio-nale alliantie van universitei-ten, bibliotheken en bedrijvenijvert voor meer toepassings-mogelijkheden van Text &Data Mining (TDM) in Europa.Steven Claeyssens

Digitale data zijn essentiële grond-stoffen van industrie en wetenschapgeworden. Data zijn de virtuele half-fabricaten waarop volwaardige be-drijfstakken en wetenschappelijkedisciplines drijven. Data zijn alom-tegenwoordig en de technologieënom data te verwerken, wordensteeds krachtiger en verfijnder.Europa kampt echter met een pro-bleem: we benutten dat data-poten-tieel veel minder effectief dan deVS ofAzië. Het FutureTDM-projectprobeert hier oplossingen voor tevinden.

Drempels slechtenFutureTDM wordt gefinancierd uithet Europese programma voor on-derzoek en innovatie, Horizon 2020.Uit Nederland nemen onder meer

de Radboud Universiteit, de Uni-versiteit van Amsterdam en LIBER(de koepel van Europese onder-zoeksbibliotheken) deel.FutureTDM beijvert zich voor hetslechten van zoveel mogelijk (juri-dische) drempels die het gebruik vanText & Data Mining-technieken inEuropa in de weg staan.

Europese wetgevingMelanie Imming (LIBER): “De Eu-ropese wetgeving zou aangepastmoeten worden om het potentieelvan TDM in Europa ten volle te kun-nen benutten.We analyseren daarombestaande regelgevingen en beleid inEuropa en gaan na hoe deze zichverhouden tot de bredere internatio-nale context.”“We werken ook samen met andereHorizon 2020-TDM-projecten zoalsOpenminted.eu, dat meer gericht isop de technische aspecten van TDM.En we proberen zoveel mogelijk be-langhebbenden te betrekken in dediscussie: de overheid en de weten-schap, maar ook bijvoorbeeld uitge-vers en KMO’s, gezamenlijk probe-

ren we tot oplossingen te komen.”

TDM-landschap“In het eerste jaar van het projectbrengen we het TDM-landschap inkaart door feedback van alle betrok-kenen te verzamelen. Daar zitten wenu middenin. Dat doen we bijvoor-beeld door middel van KnowledgeCafés, zoals eerder dit jaar in hetLeidse academiegebouw samen methet Leiden Centre of Data Science,maar ook met enquêtes en inter-views. In het tweede jaar brengenwe de vergaarde kennis en praktijk-voorbeelden bijeen op een Collabo-rative Knowledge Base en vertalenwe dit naar beleidsadviezen enpraktische richtlijnen. Uiteraardorganiseren we ook een workshop inBrussel om ons werk daar onderde aandacht te brengen.”Imming: “Alle feedback is welkom.Iedereen kan bijdragen aan Futu-reTDM: blog, tweet, neem deel aanhet Knowledge Café, vul onze vra-genlijsten in. Het helpt allemaal.”

FutureTDM.eu

Text & Data Mining: Europa loopt achter op de VS en Azië

FutureTDM goed op weg

‘Geen hokjesmaar

samenwerken’

Page 7: Utrecht Data School onderzoekt vluchtelingendebat op ... · Bijzonderfoto St.BMP 10JAARE-DATA Please find more information about the Dutch Data ... (1526-1609)hieldzichbezigmet wat

E-DATA&RESEARCH juni 2016 7

Van een enkele compu-

terondersteunde analyse

tot het online kunnen

raadplegen van rijk ge-

annoteerde Hebreeuwse

teksten: het Eep Talstra

Centre for Bible and

Computer timmert al

bijna 50 jaar aan de digi-

tale weg. Wido van Peursen

In de 70’er jaren van de vorige eeuwexperimenteerden enkele pioniersaan de Vrije Universiteit met decomputerondersteunde analyse vande Hebreeuwse Bijbel onder de pa-raplu van de ‘Werkgroep Informa-tica Vrije Universiteit (WIVU)’. De

WIVU stond onder leiding van EepTalstra, bijbelwetenschapper meteen bijzondere interesse in ‘alfa-informatica’, zoals dat toen genoemdwerd. Sindsdien is er een prachtigproduct opgebouwd: een rijk ge-annoteerde databankmet taalkundigeinformatie over morfemen, woor-den, woordgroepen, zinnen en zins-verbindingen. Talstra ging in 2012met emeritaat, de naam veranderdein het Eep Talstra Centre for Bibleand Computer (ETCBC), om daar-mee het pionierswerk te eren.

Tijd ver vooruitDe WIVU was zijn tijd ver vooruit.Op den duur kreeg zij echter te kam-pen met de wet van de remmendevoorsprong. Zo was de databankontstaan lang voordat Unicode ofTEI het licht zagen. Voor de weer-gave van het Hebreeuws en de taal-

kundige codering werden alleen AS-CII-tekens gebruikt. De balans: eengeweldig waardevol product, maarwel enigszins idiosyncratisch en on-toegankelijk. Vernieuwingsslagenhebben geleid tot een grotere toe-gankelijkheid en gebruikersvriende-lijkheid van de databank. Zo heefteen Deense collega op basis van dedatabank de Bible Online Learnergebouwd, die op zeer uiteenlopendeplaatsen in de wereld wordt ingezetvoor het onderwijs in het Bijbels He-breeuws. En bijvoorbeeld in hetCLARIN-NL-project SHEBANQ(System for HEBrew Text:ANnota-tions for Queries and Markup) heefthet ETCBC samen met DANS eenwebapplicatie en een query saverrondom de databank gebouwd. Hetis nu voor iedereen mogelijk om deHebreeuwse tekst online te raad-plegen, de taalkundige informatie te

zien, zoekopdrachten uit te voerenen op te slaan en hiernaar te ver-wijzen met een URI en de zoekop-drachten van anderen te raadplegen.In het SHEBANQ-project is de data-bank geconverteerd naar het LAF-format (LinguisticAnnotation Frame-work), een ISO standaard voor taal-kundige annotaties. De uitvoerder

van het SHEBANQ-project, DirkRoorda, heeft LAF fabric gebouwd:een Python-tool om Python-note-books te draaien en zeer complexeanalyses van de Hebreeuwse data-bank uit te voeren.

Honderden gebruikersInmiddels heeft de SHEBANQ-web-site honderden geregistreerde ge-bruikers, wordt de dataset gebruiktin projecten van gerenommeerde on-derzoekers (bijvoorbeeld het Tibe-rias-project van de Bar-Ilan Univer-sity), heeft zich een communitygevormd van promovendi en andereonderzoekers die LAF fabric gebrui-ken en wordt SHEBANQ in binnen-en buitenland ingezet in het onder-wijs. Vanaf september 2016 verzorgthet ETCBC een MA-track BiblicalStudies and Digital Humanities.bit.ly/ETCBC

SINDS KORT BESCHIKBAAR

Dit overzicht toont databestanden die recent beschikbaar zijn gekomen bijCentERdata, Data Archiving and Networked Services en Huygens ING.

CentERdata• Inschattingen van risico’s en het effect op

investeringsgedrag in aandelen

In 2013 en 2014 is een onderzoek over per-soonlijke inschattingen van risico’s en heteffect op investeringsgedrag in aandelen af-

genomen in het LISSpanel door onderzoe-kers B. Enke en H.M.Gaudecker, Universityof Bonn. De respon-denten werden onderandere uitgenodigd om

een inschatting te doen van de waarde vanbepaalde aandelen over een half jaar. Naeen jaar werden de respondenten op dehoogte gebracht van de actuele AEX-standen kregen zij de kans om hun antwoord vanhet voorgaande jaar aan te passen. De data-sets ‘Subjective Beliefs and Individual RiskPreferences in a Structural Model of Port-folio Choice - 4 parts’ zijn beschikbaar viahet LISS Data Archive van CentERdata.lissdata.nl/dataarchive

Ook sinds kort beschikbaar:Studies LISS panel• CentERdata, november 2015 - december2015, Personality - Wave 8• Tooren, M. van den; Rutte, C.G., juli 2012,Type D personality and job resources - Wave 2• CentERdata, december 2015 - januari2016, Politics and Values - Wave 8• Rosema, M.; Huddy, L., augustus 2012,Attachment to political parties• Choi, S.; Müller, W.; Kariv, S.; Silverman, D.,mei 2014 - juni 2014, Consistency andheterogeneity of individual behavior underuncertainty with a special attention to theelderly

Deze bestanden zijn kosteloosbeschikbaar via www.lissdata.nl/dataarchive. Bezoek deze siteof scan de QR-code

voor de Statistiek (CBS) (2016): WoON2015:release 1.0 - WoonOnderzoek Nederland2015. DOI: 10.17026/dans-xbt-qc5c• Putmans, drs. J.L.C. (2016): Hendrik vanVeldeke / Heinrich von Veldeke - Eneïde -Eneasroman - Transkriptionen der Hand-schriften. DOI: 10.17026/dans-xnu-ukak• Rieffe, E.C. (Gemeente Den Haag,Dienst Stadsbeheer, Afdeling Archeologie enNatuur- en Milieueducatie) (2016): Laan vanPoot - HALO-terrein gemeente Den Haag.DOI: 10.17026/dans-xf9-nybw• Stoepker, Drs. H. (ARCHEOCOACH)(2016): De middeleeuwse parochiekerk vanBrunssum (Limburg).DOI: 10.17026/dans-xqt-uqzc• Stokkel, P.J.A. (Gemeente Den Haag,Dienst Stadsbeheer, Afdeling Archeologie)(2012): Steynhof gemeente Den Haag.DOI: 10.17026/dans-xf8-u8u8• Wolters, Mr. Dr. P.T.J. (OnderzoekcentrumOnderneming & Recht, Radboud Universiteit)(2016): De invloed van de verhouding tussenschade en boete op de matiging vanboetebedingen. Een empirische analyse.DOI: 10.17026/dans-xxz-q9ke

Via easy.dans.knaw.nl zijndeze bestanden beschikbaar.Bezoek deze site of scan deQR code.

DANS• Data landelijk artrose-onderzoek in EASY

Tot eind 2015 coördineerde het UniversitairMedisch Centrum Utrecht een landelijkartrose-onderzoek, Cohort Heup en CohortKnie (CHECK). Tien jaar lang werden 1.000individuen met vroege symptomen vanartrose onderzocht in ziekenhuizen door hethele land. De uitval van deelnemers tijdensde studie was uitermate laag. ZowelCHECK als projectfinancier Reumafondsbesloten de resultaten van deze cohortstu-die via DANS beschikbaar te stellen. Devier datasets betreffen de baseline-collectie(T0) en follow up-materiaal uit de 10 jaar inaanvullende T-series. De datasets bevattenzowel longitudinale enquêtegegevens overde gezondheidssituatie en -beleving van dedeelnemers, alsook klinische data en dui-zenden röntgenopnames. CHECK en DANShebben bijzonder veel aandacht besteed aanhet anonimiseren van gegevens en beeld-materiaal. Een dataset is open access (forregistered users), de anderen zijn beschik-baar op aanvraag.DOI: 10.17026/dans-252-qw2n

Ook sinds kort beschikbaar:• Allema, Dr. A.B. (Wageningen University)(2010): Dispersal and interface behaviour ofcarabid beetles in a landscape mosaic: Fieldstudy plus model selection.DOI: 10.17026/dans-zd5-uufj• Centraal Bureau voor de Statistiek (CBS)(2014): Gezondheidsenquête 2014.DOI: 10.17026/dans-xcm-u69z• Faun, drs. H. (Panteia) (2016): Archiveringen digitalisering door cultuurproducerendeinstellingen. DOI: 10.17026/dans-xtp-djgt• Hendriks, Dr. M. (NIVEL) (2013):Healthcare professionals’ views on feedbackof a patient safety culture assessment.DOI: 10.17026/dans-2ae-h7kc• Ministerie van Binnenlandse Zaken enKoninkrijksrelaties (BZK); Centraal Bureau

Röntgenfoto uit het onderzoekcredits CHECK

Huygens ING• BoschDoc: bijna 1.000 documenten over

Jheronimus Bosch

BoschDoc ontsluit bijna 1.000 schriftelijkedocumenten over Jheronimus Bosch, zijnnaaste familie, zijn leven en zijn werk. Dedatabank bevat facsimiles, transcripties envertalingen van handgeschreven en enkelegedrukte teksten tot 1.800. Elk document isvoorzien van een informerende tekst overde context, de bron en de relatie tot anderedocumenten in de databank. De databank isgebouwd binnen de digitale infrastructuureLaborate van Huygens ING en mede mo-gelijk gemaakt door de Radboud Universi-teit en het Stadsarchief ’s-Hertogenbosch.boschdoc.huygens.knaw.nl

Ook sinds kort beschikbaar:• Clusius: http://clusiuscorrespondence.huygens.knaw.nl/• Ystroom: http://deystroom.huygens.knaw.nl/edition/

Deze publicaties zijnbeschikbaar via www.historici.nl.Bezoek deze site of scan deQR code.

Eep Talstra Centre forBible and ComputerHet Eep Talstra Centre for Bibleand Computer (ETCBC) beheertde WIVU-databank. Dezedatabank bevat de completetekst van de Hebreeuwse Bijbelcoderingen op woord-, woord-groep-, zins- en tekstniveau.De databank wordt voor diversedoeleinden gebruikt, onderandere voor onderzoeksdoel-einden bij DANS.

Detail uit ‘Wapenboek van Illustre lievevrouwe broederschap in Den Bosch’, metrechtsonder het wapen van ‘HieronimusAquensis alias Bosch’ credits BrabantsHistorisch Informatie Centrum

Eep Talstra Centre for Bible and Computer haalt zichzelf weer in

Databank voor bijbelwetenschappen

foto ANP

Page 8: Utrecht Data School onderzoekt vluchtelingendebat op ... · Bijzonderfoto St.BMP 10JAARE-DATA Please find more information about the Dutch Data ... (1526-1609)hieldzichbezigmet wat

Hoe gaat het leven

verder na een kanker-

diagnose? Patiënten-

volgsysteem PROFILES

stelt data van een longi-

tudinaal onderzoek on-

der (ex-)kankerpatiën-

ten beschikbaar.

Marika de Bruijne

PROFILES (PROFIELstudie in hetNederlands) is een patiëntenvolg-systeem waarbij (ex-)kankerpatiën-ten vragen beantwoorden over dekwaliteit van hun leven. Nicole Ho-revoorts, onderzoekscoördinatorPROFILES, vertelt: “We volgen per-sonen vanaf vlak na de kanker-diagnose tot soms wel 20 jaar erna.Via de PROFILES-registratie kun-nen we de antwoorden die patiëntengeven, koppelen aan klinische ge-gevens en zo meer inzicht krijgenin wat er met een patiënt gebeurt nade diagnose en tijdens de behande-ling van kanker.”

Waardevol data delenDe surveydata zijn kosteloos onlinebeschikbaar voor wetenschappelijkeonderzoekers en bevatten momen-teel 23 datasets van 2004 tot en met2014. Om de datapublicatie te be-werkstelligen, moest eerst een aan-

tal zaken worden opgelost. “Het be-langrijkste is het beschermen vande privacy van de patiënten en hoeje de data anoniem maakt. Tevensmoest er een keuze gemaakt wordenover de manier waarop je data vrij-geeft. Voor veel van onze dilem-ma’s zijn we in overleg gegaan metCentERdata. Zij hebben het systeemgebouwd en hebben veel ervaringop het gebied van het delen vandata,” vertelt Horevoorts.Een belangrijke keuze was ook hoede data worden overgedragen. “Jewilt dat de data op een juiste wijzegeïnterpreteerd worden, maar ookdat onderzoekers zich vrij voelenom de data te gebruiken,” legt Ho-revoorts uit. “We hebben gekozenvoor een tussenoplossing. We vra-gen wetenschappers om een formu-lier in te vullen met hun gegevens

en de onderzoeksvraag. Wanneeriemand anders al bezig blijkt te zijnmet een soortgelijke onderzoeks-vraag, brengen we de personen incontact met elkaar. Tevens vragenwe bij publicaties om een PROFILES-onderzoeker te betrekken, zodat diekan helpen bij juiste interpretatie enkeuze voor analysetechnieken.”

Compleet profiel“Met de huidige data weten we datglobaal een op de drie mensen(lang) na kanker en de behandelingnog allerlei klachten heeft. Deze be-vindingen hebben zelfs geleid totaanpassingen in bepaalde kanker-behandelingen voor mensen metlymfeklier- of baarmoederkanker.We weten echter niet goed waaromde ene patiënt bepaalde klachtenwel krijgt en de andere patiënt met

8 juni 2016 E-DATA&RESEARCH

COLUMN

GELEZEN

O nlangs gaf ik een kortelezing voor historisch let-

terkundigen. Op een gegeven mo-ment kwamen mijn bronnen tersprake. Ik noemde enkele web-sites waar ik die bronnen hadgevonden, waaronder Delpher.Zonder twijfel zullen alle lezersvan E-data bekend zijn metDelpher, een website die toeganggeeft tot onder meer 11 miljoenkrantenpagina’s, maar bij die le-zing vroeg ik voor de zekerheid:‘Wie is er niet met Delpher be-kend?’Tot mijn opluchting stak slechtséén aanwezige zijn hand op.Toen ik vervolgens wees op demogelijkheid om in Delpherwoorden in elkaars nabijheid tezoeken (met het trucje zoektermPROX ), zag ik enkele toehoor-ders snel een aantekening maken.Kennelijk waren ze niet op dehoogte van deze geavanceerdezoekmogelijkheid, waar ik vrij-wel dagelijks enorm veel baat bijheb.Alles bij elkaar was het eengoede score: slechts één toehoor-der die Delpher niet kende en

slechts enkele toehoorders, zoleek het althans, die niet op dehoogte waren van een van de ge-avanceerde zoekmogelijkheden indeze belangrijke bronnenverzame-ling.

I k heb slechtere scores gezien.Sterker nog, onlangs zei

iemand van het NIOD (Instituutvoor Oorlogs-, Holocaust- en Ge-nocidestudies) tegen mij: wij krij-gen hier soms professionele histo-rici over de vloer die niet wetendat vrijwel alle oorlogskrantenonline te doorzoeken zijn. Totzo’n vijftien jaar geleden diendeje als onderzoeker bepaalde stan-daardwerken te kennen. Zo kon jeniks over de Tweede Wereldoor-log schrijven zonder ‘Lou deJong’ te raadplegen.

Standaardwerken zijn nog steedsbelangrijk, maar het belang vangrote datacollecties op internet iszo sterk toegenomen dat je des-kundigheid als onderzoeker inhoge mate wordt bepaald door jekennis van dergelijke bronnencol-lecties.Ik krijg het daar weleens benauwdvan. Ja, ik durf te beweren dat iksommige digitale collecties, zoals

Delpher, goed ken en dat ik opti-maal gebruikmaak van de zoek-mogelijkheden. Maar welke sitesmis ik? Net als de meeste mensenheb ik de neiging om steeds naardezelfde sites terug te keren. Maarhet zijn er zo verschrikkelijk veel,er komt nog steeds zoveel bij, datook ik zonder twijfel echt belang-rijke sites over het hoofd zie.

Z o is het bijvoorbeeld hele-maal niet verstandig om

voor oude kranten alleen in Delp-her te kijken. Dat is weliswaar degrootste en best ontsloten collec-tie van oude Nederlandse kranten,maar lang niet alle krantentitelsstaan erin. Zelf maak ik ook gere-geld gebruik van de ‘KrantenbankZeeland’. En van de krantencol-lecties die je kunt doorzoeken via

foto Leo van Velzen

KWALON special issue:Qualitative research in thedigital humanitiesReinoud Bosch

KWALON is het tijdschrift vanhet gelijknamige platform voorkwalitatief onderzoek. Het tijd-schrift biedt ruimte voor de pre-sentatie van en discussie overde ontwikkeling van kwalitatievesociaalwetenschappelijke on-derzoeksmethoden en de toe-passing daarvan in alle moge-lijke varianten en op alle rele-vante onderzoeksterreinen.In deze special omschrijvenJosé van Dijck, Piek Vossen,Reinoud Bosch, Ruben Ver-borgh, Susanne Friese, Renévan Horik en Julia Noordegraafmogelijkheden voor kwalitatiefonderzoek in de digitale gees-teswetenschappen. Voorbeel-den zijn: breder en complexeronderzoek, nabootsen van men-selijke interpretaties, coderenvan stappen van kwalitatief on-derzoek en ondersteuning van-uit trusted digital repositories.De auteurs zien ook uitdagin-gen. Methoden, annotaties enalgoritmes moeten worden ver-beterd, verhelderd en geëxplici-teerd, en er is behoefte aan eenrespectvolle multidisciplinairesamenwerking en experimentenmet grote onderzoeksvragen.Het interpretatieproces moetexpliciet en controleerbaar wor-den gemaakt.De auteurs stellen: kwalitatiefonderzoek in de digitale gees-teswetenschappen gaat eenmooie toekomst tegemoet alsop de juiste manier wordt ge-reageerd op bestaande uitda-gingen.tijdschriftkwalon.nl

archieven.nl, via digibron.nl (echteen prachtige collectie!), via hetUtrechts Archief en via hetArchief Eemland. Maar dat blijftslechts een kleine greep, want eris veel en veel meer (zie voor eengoed overzicht: kranten-histo-risch.startpagina.nl).Mijn ervaring is dat je zelfs goedesites, met enorme bronnencollec-ties, helemaal kunt vergeten als jeze niet geregeld gebruikt. Ik vinddat onuitstaanbaar, maar het iswel de praktijk. Natuurlijk maakook ik gebruik van lijstjes met‘favorieten’ of ‘bladwijzers’,maar die worden al snel zo langdat ik alleen de aller-aller-belang-rijkste gebruik.Het is een onvoorstelbare luxe omzoveel nuttige bronnen online tekunnen raadplegen, maar hetvergt veel tijd en discipline om zevolop en op een gestructureerdemanier te benutten.

Ewoud SandersTaalhistoricus en journalist.Sanders is vaste medewerker vanonder meer NRC Handelsblad enOnze Taal.

Het PROFILES-onderzoeksteam foto Merlin Daleman

Een overdaad aan bronnen

exact dezelfde kenmerken nauwe-lijks. Om dat te kunnen verklaren,gaan we nog meer zaken meten.Hiervoor heeft de PROFILES-onderzoeksgroep (hoofdonderzoe-ker, Lonneke van de Poll-Franse)recentelijk een nieuwe NWO-inves-teringssubsidie ontvangen.We gaanbloed afnemen, de leefstijl van men-sen bekijken door middel van voe-dings-apps en internetweegschalen,lichaamsfuncties meten door middelvan zogeheten health patches(slimme pleisters) en cognitievetesten doen,” vertelt Horevoorts.“Met deze aanvullende data kunnenwe een completer profiel van eenpatiënt maken. Dat zal ons helpenom te begrijpen waarom de ene pa-tiënt wel klachten ontwikkelt en deandere niet.”profilesregistry.nl

Surveydata kosteloos online beschikbaar

PROFILES: onderzoeksdataover leven met kanker

PROFILESPROFILES (PROFIELstudie) iswetenschappelijk onderzoeknaar kwaliteit van leven bijmensen die kanker hebben ofhebben gehad. Hiervoor werkenonderzoekers van het IntegraalKankercentrum Nederland(IKNL) en Tilburg University(TiU) samen met medischspecialisten van ziekenhuizen inheel Nederland. Kijk voor meerinformatie op profilesregistry.nlof neem contact op [email protected].