DANS en de sociale wetenschappen · Voor de opslag en documentatie van de onderzoeksdata zijn...

20
DANS en de sociale wetenschappen Beleidsnota >>> doi.org/10.17026/dans-zxv-qjvr Auteur: Ricarda Braukmann Januari 2019

Transcript of DANS en de sociale wetenschappen · Voor de opslag en documentatie van de onderzoeksdata zijn...

Page 1: DANS en de sociale wetenschappen · Voor de opslag en documentatie van de onderzoeksdata zijn verder niet altijd duidelijke processen en controlemaatregelen binnen onderzoeksinstellingen.

DANS en de socialewetenschappenBeleidsnota

>>>

doi.org/10.17026/dans-zxv-qjvr

Auteur:Ricarda Braukmann

Januari 2019

Page 2: DANS en de sociale wetenschappen · Voor de opslag en documentatie van de onderzoeksdata zijn verder niet altijd duidelijke processen en controlemaatregelen binnen onderzoeksinstellingen.

DANS Sociale Wetenschappen - Beleidsnota januari 2019 1

1. Inhoud1. Inhoud 1

2. Introductie 2

3. Het Sociaalwetenschappelijke Data Landschap 3

3.1 Definitie en data types 3

3.2 Data archivering en management 3

4. De rol van DANS in de Sociale Wetenschappen 6

4.1 Gebruik van de DANS-datadiensten 6

4.2 Projecten & Research Infrastructures 8

4.2.1 Nationale projecten & infrastructuren 8

4.2.2 Internationale projecten & infrastructures 9

5. Samenvatting en vooruitblik 12

5.1 Projecten voortzetten en verdiepen 13

5.2 Nieuwe activiteiten 14

5.2.1 Benaderen van specifieke disciplines 14

5.2.2 Beschikbaar stellen van andere typen data 14

5.2.3 Training 16

Appendix 17

Beschrijving van afgeronde sociaalwetenschappelijke projecten 17

Page 3: DANS en de sociale wetenschappen · Voor de opslag en documentatie van de onderzoeksdata zijn verder niet altijd duidelijke processen en controlemaatregelen binnen onderzoeksinstellingen.

DANS Sociale Wetenschappen - Beleidsnota Januari 2019 2

2. IntroductieDe missie van DANS is het bevorderen van duurzame toegang tot digitaleonderzoeksgegevens. De kerndiensten van DANS zijn EASY (het data archiefvoor duurzame opslag en hergebruik van onderzoeksdata), NARCIS (hetnationale portaal voor informatie over de Nederlandse wetenschap) enDataverseNL (het platform voor het opslaan van data tijdens hetonderzoeksproces). Naast deze kerndiensten biedt DANS consultancy entraining voor onderzoeksinstellingen, en is DANS betrokken bij veelverschillende projecten rondom data management, certificering en onderwerpenzoals FAIR, Open Access en software sustainability.

DANS maakt onderdeel uit van een Nederlandse data-infrastructuur die werkt volgens het frontoffice-backoffice model.1 De frontoffices bij de onderzoeksinstellingen zijn het eerste aanspreekpunt voor de onderzoekers. Zij onderhouden het contact met de wetenschappers en leveren training en ondersteuning tijdens het onderzoeksproces. De frontoffices werken samen met de backoffices - organisaties met een landelijke rol, zoals DANS, 4TU Centre for Research Data of SURFsara - die zorgdragen voor lange termijn archivering en toegang tot de onderzoeksdata. De backoffices leveren expertise rondom data governance en data stewardship en geven advies en training aan de front-officemedewerkers (en onderzoekers).

Hoewel de diensten van DANS beschikbaar zijn voor alle wetenschappelijke disciplines liggen de wortels van DANS in de sociale en geesteswetenschappen. DANS heeft op deze gebieden veel contacten en expertise en is betrokken bij verschillende projecten in deze domeinen. Dit document is bedoeld om de huidige positie van DANS binnen de sociale wetenschappen te beschouwen en aandachtspunten en richtingen voor de toekomst te identificeren. Dit document begint met een overzicht van de sociale wetenschappen en de staat van data archivering en datamanagement (hoofdstuk 3). Vervolgens wordt de rol van DANS voor de sociale wetenschappen beschreven (hoofdstuk 4) door te kijken naar de diensten die DANS levert aan deze gemeenschap (4.1), en de (inter)nationale projecten waar DANS bij betrokken is (4.2). Het laatste deel van dit document (hoofdstuk 5) identificeert vervolgens mogelijke uitbreidingen die DANS zou kunnen maken om de rol in de sociale wetenschappen nog verder te versterken. Hoofdstuk 5.1 beschrijft een aantal belangrijke aankomende projecten die voortbouwen op de lopende projecten en in hoofdstuk 5.2 worden een aantal stappen beschreven waarmee DANS uit wil breiden naar andere (sub)disciplines en type data binnen de sociale wetenschappen.

1 https://researchdata.nl/fileadmin/pdf-documents/RDNL-FOBOmodel-NL-web.pdf

Page 4: DANS en de sociale wetenschappen · Voor de opslag en documentatie van de onderzoeksdata zijn verder niet altijd duidelijke processen en controlemaatregelen binnen onderzoeksinstellingen.

3

3. Het Sociaalwetenschappelijke Data Landschap

3.1 Definitie en data types Dit document richt zich op alle wetenschappelijke vakgebieden die betrekking hebben op onderzoek naar ”de mens en zijn sociale omgeving”.2 In het nationale wetenschappelijke portaal NARCIS zijn deze vakgebieden onderverdeeld in vier hoofdcategorieën: sociale wetenschappen, gedragswetenschappen en onderwijskunde, economie en bedrijfskunde, en recht en bestuur (zie tabel). De sociale wetenschappen omvatten dus diverse vakgebieden, zoals sociologie, communicatiewetenschappen, psychologie, onderwijskunde, economie en politicologie.

Binnen de sociale wetenschappen wordt met veel verschillende typen data gewerkt, afhankelijk van het vakgebied en de onderzoeksvraag. Sociaalwetenschappelijke onderzoekers werken vaak met kwantitatieve data, zoals bijvoorbeeld survey data of register data, maar ook reactietijden of andere kwantitatieve gedragsmetingen worden verzameld binnen dit domein. Daarnaast wordt ook met kwalitatieve data gewerkt zoals interviews, observaties, video en audio-opnames. Steeds vaker worden ook nieuwe type data - zoals fMRI-data, big data, data afkomstig uit sociale media (twitter, facebook) en gecombineerde datasets, waarbij verschillende type data samen worden gebracht - gebruikt binnen de sociale wetenschappen. Binnen de computational social sciences worden bovendien computersimulaties, algoritmes en specifieke software gebruikt om sociaalwetenschappelijke vraagstukken te bestuderen.

In de sociale wetenschappen wordt vaak gewerkt met proefpersonen en persoonsgegevens waardoor privacyregelgeving, zoals de Europese Algemene Verordening Gegevensbescherming (AVG), en ethische vraagstukken rondom data verzameling, opslag, management, en het delen van data een belangrijke rol spelen voor sociale wetenschappers.

3.2 Data archivering en management In Nederland wordt door verschillende instanties sociaalwetenschappelijk onderzoek uitgevoerd. Bijna elke Nederlandse universiteit heeft een of meerdere sociaalwetenschappelijke studierichtingen en vakgroepen waar onderzoek wordt verricht. Naast universiteiten doet de overheid ook sociaalwetenschappelijk onderzoek via ministeries, instituten en (commerciële) onderzoeksbureaus. Ook

2 https://nl.wikipedia.org/wiki/Sociale_wetenschappen

DANS Sociale Wetenschappen - Beleidsnota januari 2019

Page 5: DANS en de sociale wetenschappen · Voor de opslag en documentatie van de onderzoeksdata zijn verder niet altijd duidelijke processen en controlemaatregelen binnen onderzoeksinstellingen.

DANS Sociale Wetenschappen - Beleidsnota januari 2019 4

gemeenten verzamelen en verwerken sociaalwetenschappelijke data. Het veld van sociaalwetenschappelijk onderzoek is dus erg divers en omvangrijk.

DANS heeft als Nederlands instituut voor permanente toegang tot digitale onderzoeksgegevens een belangrijke rol als dienst en informatiebron over duurzame dataopslag en datamanagement voor de sociale wetenschappen. DANS biedt ook diensten voor onderzoekers en onderzoeksinstellingen voor de opslag en het delen van onderzoeksgegevens, zowel tijdens het onderzoek (DataverseNL), alsook na afloop voor lange termijn archivering (EASY). Verder stellen sommige (landelijke) instellingen hun data zelf beschikbaar via eigen data portalen. Het CBS geeft bijvoorbeeld toegang tot geaggregeerde afgeleide van hun data via StatLine3 en kunnen onderzoekers, onder bepaalde voorwaarden, toegang krijgen tot CBS-microdata. De Nederlandse overheid heeft een eigen dataportaal4 waar data beschikbaar worden gesteld. Daarnaast hebben sommige sociaalwetenschappelijke projecten en surveys een eigen dataportaal. Het LISS-panel (Longitudinal Internet Studies for the Social sciences)5 publiceert hun data bijvoorbeeld via een eigen dataportaal, al wordt de duurzame opslag van de data wel verzorgd door DANS.

Onderzoek naar data archivering bij sociale wetenschappers In het verleden heeft DANS een aantal onderzoeken uitgevoerd om de status van duurzame data archivering binnen de sociale wetenschappen (en andere gebieden) in kaart te brengen. Er is specifiek gekeken naar wetenschappers die werken met jeugd data (Vinken, 2009)6, psychologen (Voorbrood, 2010)7 en sociologen (Oldenburg,2015)8 (zie Appendix voor een gedetailleerde beschrijving van deze studies). Daarnaast heeft DANS in 2011 de resultaten van een omvangrijke analyse gepubliceerd, waarin onderzoekers uit heel Nederland zijn geïnterviewd en een survey is afgenomen om te beschouwen hoe wetenschappers het delen van data in hun onderzoeksveld ervaren.9

Uit deze rapporten kwam naar voren dat sociale wetenschappers over het algemeen positief lijken te zijn over het delen van data, maar dat dit uiteindelijk in de praktijk niet altijd gebeurt. Data wordt nu met name gedeeld via bestaande samenwerkingen of op aanvraag van andere onderzoekers. DANS is vaak wel bekend bij de onderzoekers. Als onderzoekers bereid zijn hun data te archiveren en te delen, wordt dan ook gebruik gemaakt van de DANS-diensten. Voor de opslag en documentatie van de onderzoeksdata zijn verder niet altijd duidelijke processen en controlemaatregelen binnen onderzoeksinstellingen. Veel onderzoekers slaan hun data op hun eigen computer op, of maken gebruik van faciliteiten die door universiteiten of onderzoeksinstituten worden aangeboden. In sommige gevallen wordt door de universiteiten verwacht dat onderzoekers

3 http://statline.cbs.nl/Statweb/ 4 https://data.overheid.nl/ 5 https://www.dataarchive.lissdata.nl/ 6 Vinken, H. (2009) Verkenning Jeugddata. https://dans.knaw.nl/nl/over/organisatie-beleid/publicaties/DANSstudiesindigitalarchiving3verkenningjeugddataNL.pdf 7 Data Archiving and Networked Services (DANS); Caroline Voorbrood; Heleen van Luijn; (2010): Data - Voer voor psychologen. Archivering, beschikbaarstelling en hergebruik van onderzoeksdata in de psychologie. DANS. https://doi.org/10.17026/dans-x76-2tsh 8 Oldenburg, B. (2015) Integriteit en duurzaamheid in het digitale tijdperk.http://hdl.handle.net/11370/b70cf0ae-4bdc-4247-ab34-3f5c516cb5bc 9 Dillo, I., & Doorn, P. K. (2011). The Dutch data landscape in 32 interviews and a survey.

Page 6: DANS en de sociale wetenschappen · Voor de opslag en documentatie van de onderzoeksdata zijn verder niet altijd duidelijke processen en controlemaatregelen binnen onderzoeksinstellingen.

DANS Sociale Wetenschappen - Beleidsnota januari 2019 5

hun data na afloop van het onderzoek als publication package opslaan en voorzien van aanvullende documentatie.

Omdat de rapporten een aantal jaren geleden zijn opgesteld en de aandacht voor Open Science, duurzame dataopslag en FAIR-data de laatste jaren sterk is gegroeid, is het waarschijnlijk dat er inmiddels vaker, en betere, procedures voor dataopslag en documentatie zijn opgesteld en dat onderzoekers opener zijn geworden over het delen van hun data. Het gebruik van de DANS-diensten groeit ieder jaar en dit onderstreept het toegenomen belang van dataopslag en hergebruik. Financiers en instituten verplichten onderzoekers inmiddels vaker om Data Management Plannen (DMPs) op te stellen, hun data als publication package op te slaan en de data, waar mogelijk, open te stellen voor hergebruik. Ook eisen uitgevers vaker dat de data die bij een wetenschappelijk artikel hoort beschikbaar wordt gesteld. Uitgevers bieden dan soms ook een eigen archief aan waar onderzoekers gebruik van kunnen maken. In hoeverre deze maatregelen ertoe hebben geleid dat sociaalwetenschappelijke onderzoekers hun data vaker delen zou verder vastgesteld moeten worden. Ook zou gekeken kunnen worden van welke services onderzoekers gebruik maken en welke factoren een rol spelen in hun keuze voor bepaalde diensten.

Page 7: DANS en de sociale wetenschappen · Voor de opslag en documentatie van de onderzoeksdata zijn verder niet altijd duidelijke processen en controlemaatregelen binnen onderzoeksinstellingen.

DANS Sociale Wetenschappen - Beleidsnota januari 2019 6

4. De rol van DANS in de Sociale Wetenschappen4.1 Gebruik van de DANS-datadienstenZoals hierboven beschreven heeft DANS een centrale rol binnen de socialewetenschappen als dienst en informatiebron over duurzame dataopslag,hergebruik en datamanagement. Er wordt binnen de sociale wetenschappen veelgebruik gemaakt van DataverseNL, een platform voor het online opslaan, delenen registreren van onderzoeksgegevens tijdens de onderzoeksperiode. Van de1027 datasets die op dit moment in DataverseNL staan komt ruim een derdevanuit de sociale wetenschappen (383, cijfers 22 oktober 2018).In het lange termijn archief EASY staan 5772 datasets uit de socialewetenschappen (NARCIS-cijfers, stand 31 oktober 2018: 1185gedragswetenschappen en onderwijskunde, 243 economie en bedrijfskunde,3590 sociale wetenschappen, 754 recht en bestuur). Binnen de socialewetenschappen zijn er echter grote verschillen tussen de vakgebieden. Defiguren op pagina 7 geven een overzicht van de onderzoekers en de datasets diegeregistreerd staan in NARCIS uit de vier categorieën (sociale wetenschappen,economie en bedrijfskunde, gedragswetenschappen en onderwijskunde, recht enbestuur, NARCIS-cijfers, stand 31 oktober 2018).Deze figuren laten zien dat verdeling van onderzoekers over de vier categorieënongeveer gelijk is. DANS heeft echter in verhouding veel meer datasets uit decategorie sociale wetenschappen, terwijl met name de economie enbedrijfskunde en recht en bestuur ondervertegenwoordigd zijn. Binnen de socialewetenschappen heeft DANS met name sociologie datasets. De verdeling van hetaantal datasets en het aantal onderzoekers wijken dus van elkaar af en datasetsuit de sociale wetenschappen, en met name sociologie, zijnoververtegenwoordigd het EASY-archief, ten opzichte van andere deelgebieden.Een deel van dit fenomeen kan worden verklaard door verschillen in het soortonderzoek tussen deze sub-disciplines en door verschillen in het (her)gebruik endelen van data: sociologen en politicologen maken bijvoorbeeld vaak gebruikvan al bestaande data en gebruiken EASY om die data te delen. In andere sub-disciplines, zoals bijvoorbeeld de psychologie wordt data vaker zelf verzameld enis het delen van data minder gewoon. Naast deze verschillen is het echter ook zodat veel van het werk en de projecten van DANS gericht zijn op de socialewetenschappen en de sociologie (zie 3.2). Zoals in sectie 4 van dit rapportverder wordt beschreven, zou DANS zich erop kunnen richten om onderzoekersuit ondervertegenwoordigde disciplines meer te stimuleren in het opslaan, delenen hergebruiken van data door extra aandacht aan deze disciplines te besteden.

Page 8: DANS en de sociale wetenschappen · Voor de opslag en documentatie van de onderzoeksdata zijn verder niet altijd duidelijke processen en controlemaatregelen binnen onderzoeksinstellingen.

DANS Sociale Wetenschappen - Beleidsnota januari 2019 7

Page 9: DANS en de sociale wetenschappen · Voor de opslag en documentatie van de onderzoeksdata zijn verder niet altijd duidelijke processen en controlemaatregelen binnen onderzoeksinstellingen.

8

4.2 Projecten & Research Infrastructures Naast het bieden van datadiensten voor de sociale wetenschappen werkt DANS ook mee aan verschillende projecten op dit gebied. Hieronder staan de lopende sociaalwetenschappelijke projecten van DANS beschreven. Veel van deze projecten zullen de komende jaren nog doorlopen (zie 4.1) en bieden DANS de mogelijkheid om de positie binnen de sociale wetenschappen verder te versterken en uit te bouwen. Een overzicht van alle lopende en geplande projecten is te vinden in sectie 4.

4.2.1 Nationale projecten & infrastructuren CBS Microdata DANS heeft een samenwerking met het Centraal Bureau voor de Statistiek (CBS) waarbij beveiligde microdatabestanden van het CBS via EASY beschikbaar worden gemaakt in een thematische collectie10. Het CBS en DANS werken ook samen in andere projecten en netwerken zoals bijvoorbeeld het NPSO en ODISSEI (zie onder).

ODISSEI: Open Data Infrastructure for Social Science and Economic Innovation11 Het dataplatform ODISSEI is opgericht in 2016 met als doel het mogelijk maken van een nationale data-infrastructuur voor de sociale wetenschappen in Nederland. Veel van het werk van ODISSEI richt zich op het toegankelijk maken van CBS-data en faciliteiten voor onderzoekers die bijvoorbeeld hun survey data willen koppelen aan CBS-register data. Een onderdeel van ODISSEI is de ODISSEI Data Facility (ODF), een virtuele IT-omgeving waar onderzoekers (gekoppelde) grote databestanden kunnen analyseren in een high performance computing-omgeving. SURFsara heeft in de ontwikkeling van de ODF samen met het CBS een grote rol gespeeld. DANS is sinds het begin van ODISSEI-partner en onderdeel van de klankbordgroep. Sinds 2018 is DANS ook (betalende) deelnemer en daarmee onderdeel van de ODISSEI-raad.

NPSO: Nederlandstalig Platform Survey-onderzoek12 DANS is een van de kerngroep-leden van het NPSO en bemant het NPSO-secretariaat. Binnen dit netwerk worden bijeenkomsten georganiseerd voor survey-onderzoekers in Nederland en Vlaanderen. Naast DANS zijn onder meer het CBS, CentERdata, SCP en (commerciële) onderzoeksbureaus hierbij betrokken.

Survey Data Netherlands13 In samenwerking met CentERdata heeft DANS Survey Data Netherlands opgericht. Op deze website worden data en metadata van verschillende longitudinale surveys samengebracht en kunnen gebruikers deze doorzoeken. Het is de bedoeling dat surveydata.nl wordt gekoppeld aan de European Question Bank (EQB) van CESSDA (zie onder) zodat de data beter vindbaar wordt voor internationale onderzoekers.

10 https://easy.dans.knaw.nl/ui/datasets/id/easy-dataset:45898 11 http://www.odissei-data.nl/ 12 https://www.npso.net/ 13 https://www.surveydata.nl/

DANS Sociale Wetenschappen - Beleidsnota januari 2019

Page 10: DANS en de sociale wetenschappen · Voor de opslag en documentatie van de onderzoeksdata zijn verder niet altijd duidelijke processen en controlemaatregelen binnen onderzoeksinstellingen.

9

M·3: Molecuul, Mens en Maatschappij (KNAW-droomproject)14 DANS is betrokken geweest bij de opzet voor het KNAW-droomproject M·3: Molecuul, Mens Maatschappij15. De visie van het M·3-project is het opzetten van een infrastructuur voor grootschalige interdisciplinaire onderzoeksprojecten, waarbij data van verschillende niveaus (biologie, omgeving, gedrag, cultuur, maatschappij) met elkaar gecombineerd kunnen worden. Het project slaat de brug tussen de sociale wetenschappen en de levenswetenschappen.

ESS-Neth DANS is als adviseur lid van het bestuur van de ESS-Netherlands commissie van de NWO. Het gaat hierbij om advisering over de data-verzameling, documentatie en beschikbaarstelling van de Nederlandse European Social Survey; ook organiseert DANS in samenwerking met ESS-Neth onderzoekssymposia en publiceert DANS de werkzaamheden daarvan. De ESS-Neth commissie wordt mogelijk een commissie van ODISSEI.16

Training voor de sociale wetenschappen Naast EASY, DataverseNL en NARCIS biedt DANS ook training en consultancy voor onderzoeksinstellingen op het gebied van FAIR Data Management. In het verleden zijn er een aantal trainingsactiviteiten geweest die speciaal gericht waren op onderzoekers in de sociale wetenschappen. Zo heeft DANS in het verleden een aantal keren meegewerkt aan een Data Managementtraining voor promovendi politicologen van het Netherlands Institute of Government. Binnen het Europese consortium CESSDA (zie onder) heeft DANS verder gewerkt aan een online RDM-training voor sociaal-wetenschappers17. Op basis van de module werd eind 2018 een workshop georganiseerd over Research Data Management in the Time of the GDPR, gericht op jonge onderzoekers binnen de sociale wetenschappen.

4.2.2 Internationale projecten & infrastructures CESSDA ERIC (Consortium of Social Science Data Archives - European Research Infrastructure Consortium)18 DANS is de Nederlandse Service Provider van CESSDA ERIC en werkt actief mee binnen verschillende werkgroepen en projecten van het consortium. Ook is DANS-directeur Peter Doorn voorzitter van de CESSDA General Assembly. Anders dan DANS, die diensten aanbiedt voor alle disciplines, hebben de meeste CESSDA Service Providers (SPs) een sterke focus op het verwerken en beschikbaar stellen van survey onderzoeksdata. Veel van het werk van CESSDA maakt daarom ook gebruik van domein-specifieke standaarden zoals de European Language Social Science Thesaurus (ELSST)19 of de Data Documentation Initiative (DDI) metadata standaard20. De DDI metadata standaard vormt de basis voor de CESSDA Metadata Model (CMM).

14 https://www.knaw.nl/shared/resources/adviezen/bestanden/KNAWAgendaM3.pdf 15 voor meer informatie over de droomprojecten zie: https://www.knaw.nl/nl/adviezen/knaw-agenda-grootschalige-onderzoeksfaciliteiten-13-geselecteerde-faciliteiten 16 http://www.onderzoeksfaciliteiten.nl/facility/european-social-survey-netherlands 17 www.cessda.eu/DMGuide 18 https://www.cessda.eu/ 19 https://elsst.ukdataservice.ac.uk/ 20 https://www.ddialliance.org/

DANS Sociale Wetenschappen - Beleidsnota januari 2019

Page 11: DANS en de sociale wetenschappen · Voor de opslag en documentatie van de onderzoeksdata zijn verder niet altijd duidelijke processen en controlemaatregelen binnen onderzoeksinstellingen.

10

De afgelopen jaren heeft CESSDA gewerkt aan een gezamenlijke Data Catalogus21 voor sociaalwetenschappelijke (survey) data in Europa, waarin data van alle SPs vindbaar worden. DANS heeft meegewerkt aan de ontwikkeling van de catalogus en de sociaalwetenschappelijke datasets uit EASY zullen hier binnenkort in worden opgenomen. DANS is verder in 2018 projectleider van het DataverseEU project dat ondersteuning en ontwikkeling verricht voor het gebruik van Dataverse als archief voor (beginnende) SPs. Daarnaast is DANS actief binnen de Training Working Group van CESSDA en heeft DANS in 2017 de ontwikkeling van de CESSDA Data Management Expert Guide22 geleid. DANS werkt verder mee/heeft meegewerkt als partner aan de CESSDA werkplannen rondom Technical Framework, Trust en certificering, PID-policy, Widening, de European Question Bank (EQB), Vocabulary Services Multilingual Content Management, en een pilot over een European remote access network for sensitive data (ERAN). Het komende jaar zal DANS bovendien betrokken zijn bij het verder ontwikkelen van Capability Development Models voor CESSDA (CDM) en begin 2019 zal het EU-project Social Sciences and Humanities Open Cloud (SSHOC) van start gaan waar DANS als CESSDA-partner aan mee werkt (zie 4.1).

Ontwikkeling van GDPR DataTags voor datasets23 DANS is binnen het EUDat project begonnen met het ontwikkelen van een prototype voor een tool die onderzoekers helpt om gevoelige data te classificeren volgens de Algemene verordening gegevensbescherming (AVG, Engels: GDPR). Sociaalwetenschappelijk onderzoek maakt vaak gebruik van privacygevoelige data en data die persoonsgegevens bevatten. Hierdoor krijgen wetenschappers te maken met de AVG. De GDPR DataTags tool zal in de komende tijd verder worden uitgewerkt en uiteindelijk een belangrijke tool kunnen worden voor sociaalwetenschappelijke onderzoekers die willen weten hoe hun data beschermd moet worden en gedeeld kan worden.

Science Europe Domain-Specific Data Management Protocols DANS is betrokken bij de Science Europe Working Group die domein-specifieke datamanagementprotocollen wil gaan ontwikkelen en is gevraagd om mee te werken aan de protocollen voor de sociale wetenschappen.

ICPSR (Inter-university Consortium for Political and Social Research) ICPSR is een internationaal consortium van meer dan 750 academische instellingen en onderzoeksorganisaties. ICPSR beheert een data archief (met 9600 studies) en verzorgt cursussen en trainingen voor analyse en management van sociaalwetenschappelijke data. DANS is de officiële vertegenwoordiger van de Dutch National Membership van het ICPSR.24 Via dit lidmaatschap kunnen medewerkers van Nederlandse universiteiten en onderzoeksinstituten gratis gebruikmaken van de datacollectie van het ICPSR. Ook stelt DANS jaarlijks een beurs ter beschikking voor PhD’s en research master studenten aan Nederlandse universiteiten voor de deelname aan de ICPSR summerschool25.

21 https://datacatalogue.cessda.eu/ 22 cessda.eu/DMGuide 23 https://dans.knaw.nl/en/current/first-gdpr-datatags-results-presented-in-workshop 24 https://www.icpsr.umich.edu/icpsrweb/membership/administration/institutions/213 25 https://dans.knaw.nl/nl/actueel/subsidie-beschikbaar-voor-summer-program-icpsr-2018

DANS Sociale Wetenschappen - Beleidsnota januari 2019

Page 12: DANS en de sociale wetenschappen · Voor de opslag en documentatie van de onderzoeksdata zijn verder niet altijd duidelijke processen en controlemaatregelen binnen onderzoeksinstellingen.

11

Sociale wetenschappen binnen andere projecten Er zijn een aantal (internationale) projecten waarbinnen DANS een rol als vertegenwoordiger voor de sociale wetenschappen vervult. Binnen het FREYA-project26 is DANS bijvoorbeeld de aangewezen contactpersoon voor de sociale wetenschappen en zoekt DANS de samenwerking op met sociaalwetenschappelijke initiatieven op het gebied van Persistent Identifiers (PIDs), bijvoorbeeld via CESSDA. Binnen het RDA Europe 4.027 project is DANS ambassadeur voor de sociale wetenschappen en dient DANS het werk van de RDA bij deze doelgroep te verspreiden.

26 https://www.project-freya.eu/en 27 https://www.rd-alliance.org/rda-europe

DANS Sociale Wetenschappen - Beleidsnota januari 2019

Page 13: DANS en de sociale wetenschappen · Voor de opslag en documentatie van de onderzoeksdata zijn verder niet altijd duidelijke processen en controlemaatregelen binnen onderzoeksinstellingen.

DANS Sociale Wetenschappen - Beleidsnota januari 2019 12

5. Samenvatting en vooruitblikDe wortels van DANS liggen in de sociale en geesteswetenschappen en deze disciplines spelen een centrale rol in de diensten die DANS levert en de projecten waar DANS bij betrokken is. Veel van de sociaalwetenschappelijke projecten (zie 3.2) zal DANS het komende jaar blijven voortzetten en verdiepen. Een aantal belangrijke ontwikkelingen binnen deze lopende samenwerkingen zijn beschreven in sectie 4.1. Echter zijn er ook mogelijkheden om het werk van DANS in de sociale wetenschappen nog verder uit te breiden in aanvulling op de doorlopende projecten. De focus van het werk van DANS binnen de sociale wetenschappen is op dit moment namelijk sterk gericht op het gebied van de sociologie (voornamelijk surveyonderzoek) en oral history, terwijl andere domeinen binnen de sociale wetenschappen, zoals de gedragswetenschappen en economie minder in de aandacht staan. Deze verdeling is te zien in de projecten die zich vaak richten op surveyonderzoek (zoals ODISSEI, CESSDA, NPSO), maar ook in de verdeling van de beschikbare datasets in EASY (zie 3.1). Niet alle (sub)disciplines en niet alle type data zijn gelijk vertegenwoordigd in het DANS-archief. Door extra aandacht te besteden aan deelgebieden die op dit moment minder sterk vertegenwoordigd zijn bij DANS kan DANS-data archivering en hergebruik in deze disciplines extra stimuleren.

Figuur 2. De projecten zijn geordend op basis van een inschatting van de uren die vanuit DANS per project worden besteed. Het M3 project (zie 3.1) is niet opgenomen in dit overzicht omdat er op dit moment geen concrete plannen zijn voor dit KNAW “droomproject”. SW= Sociale Wetenschappen

Hierdoor kan DANS ervoor zorgen dat ook andere type data meer gearchiveerd en vaker beschikbaar gesteld worden voor de bredere wetenschappelijke gemeenschap. Sectie 4.2 beschrijft een aantal nieuwe projecten waarin DANS zich actief in wil zetten om de beschikbare data en diensten uit te breiden naar andere (sub)disciplines en type data in de sociale wetenschappen. Figuur 2 hierboven geeft een overzicht van alle huidige en (mogelijke) toekomstige projecten.

Page 14: DANS en de sociale wetenschappen · Voor de opslag en documentatie van de onderzoeksdata zijn verder niet altijd duidelijke processen en controlemaatregelen binnen onderzoeksinstellingen.

DANS Sociale Wetenschappen - Beleidsnota januari 2019 13

5.1 Projecten voortzetten en verdiepen Alle projecten die onder 3.2 zijn genoemd zijn langer lopende projecten waarin DANS werk verricht dat van belang is voor de sociale wetenschappen. Binnen deze bestaande samenwerkingen zijn er drie belangrijke activiteiten die het komende jaar zullen starten die wij hier nader toe willen lichten. Op nationaal niveau zullen de faciliteiten van ODISSEI verder worden uitgebreid en zal DANS meewerken aan de ontwikkeling van het datamanagementbeleid van ODISSEI. Op internationaal niveau zal DANS betrokken zijn bij het Europese Social Sciences and Humanities Open Cloud (SSHOC) project dat in januari 2019 van start zal gaan. Het project is een samenwerking van meerdere grote infrastructuren binnen de sociale wetenschappen en de geesteswetenschappen die samen verder willen werken richting de European Open Science Cloud (EOSC). Het samenbrengen van verschillende disciplines en de rol als ambassadeur voor de sociale wetenschappen zal DANS verder ook op andere plekken waarnemen. Internationale initiatieven zoals de ESOC en ontwikkelingen rondom FAIR data zijn gebaat bij cross-disciplinaire integratie en DANS kan hier een belangrijke rol in gaan spelen.

ODISSEI DANS wil de komende tijd meewerken aan het ontwikkelen van FAIR Data Policies voor ODISSEI-projecten en de ODISSEI Data Facility (ODF). De ODF is de afgelopen tijd ontwikkeld door het CBS en SURFsara, en een aantal pilotprojecten zijn gestart. Om de faciliteiten uit te breiden en voor meer onderzoekers toegankelijk te maken moet aanvullend beleid worden ontwikkeld voor het gebruik van de faciliteit en het management van de data en metadata in de ODF. DANS kan hier expertise leveren en wil zich ervoor inzetten om de ODISSEI-data FAIR te maken en - waar mogelijk - beschikbaar te stellen. Het beleid kan bovendien als basis worden genomen voor een geplande aanvraag voor de nationale roadmap van NWO om ODISSEI als nationale infrastructuur verder uit te bouwen. Overwogen kan worden om de aanschaf van CBS-data via ODISSEI te organiseren.

SSHOC Het Social Sciences & Humanities Open Cloud (SSHOC) project is een project van 40 maanden (met startdatum 1 januari 2019) dat gefinancierd wordt binnen het Horizon 2020 Framework Programma. SSHOC is erop gericht om initiatieven van de huidige Europese onderzoeksinfrastructuren op het gebied van sociale wetenschappen en geesteswetenschappen beter op elkaar en op de Europese Open Science Cloud (EOSC) aan te laten aansluiten. Betrokken sociaalwetenschappelijke infrastructuren zijn onder meer CESSDA, ESS (European Social Survey) en SHARE (Survey of Health, Ageging and Retirement in Europe). DANS is partner vanuit CESSDA en is verantwoordelijk het opzetten van een data repository service op het EOSC-cloud platform, en voor het opzetten van een duurzaam cross-disciplinair trainersnetwerk en een train-the-trainer toolkit op het gebied van research data management.

Cross-disciplinaire integratie DANS is al betrokken bij verschillende cross-disciplinaire projecten waarin wij als ambassadeur voor de sociale wetenschappen functioneren (zoals in FREYA en RDA Europe, en Science Europe, zie 3.2). Voor veel van de grote internationale

Page 15: DANS en de sociale wetenschappen · Voor de opslag en documentatie van de onderzoeksdata zijn verder niet altijd duidelijke processen en controlemaatregelen binnen onderzoeksinstellingen.

14

initiatieven zoals de EOSC en het GO-FAIR28 initiatief - dat zich inzet voor het standaardiseren en coördineren van verschillende initiatieven binnen de ontwikkeling van de EOSC - is meer samenwerking en standaardisatie nodig, zowel binnen disciplines als cross-disciplinair. DANS kan hier een belangrijke rol in spelen door kennis in te brengen van verschillende disciplines. Ook kan DANS helpen om een brug te slaan tussen de sociale wetenschappen en de geesteswetenschappen, omdat DANS bij zowel geesteswetenschappelijke, alsook sociaalwetenschappelijke, projecten en infrastructuren betrokken is. Daarnaast heeft DANS de afgelopen jaren ook uitgebreid richting de levenswetenschappen en kan DANS een verbindende rol aannemen in projecten en initiatieven die tussen levenswetenschappen en sociale wetenschappen in zitten. Het M3 project (zie 3.2) is hier een voorbeeld van waar de komende jaren mogelijk verder naar toegewerkt zou kunnen worden.

5.2 Nieuwe activiteiten Naast de lopende projecten wil DANS zich de komende tijd ook in gaan zetten om het werk binnen de sociale wetenschappen uit te breiden naar andere subdisciplines (sectie 4.2.1) en type data (sectie 4.2.2) die op dit moment minder sterk vertegenwoordigd zijn in de DANS diensten. Hieruit kunnen ook nieuwe trainingsactiviteiten voortkomen die speciaal gericht zijn op de sociale-wetenschappen (sectie 4.2.3).

5.2.1 Benaderen van specifieke disciplines Terwijl de sociologie goed vertegenwoordigd is, zou DANS de invloed op andere disciplines kunnen vergroten. Economie, psychologie en pedagogiek vormen grote disciplines in Nederland waar DANS nu relatief weinig mee doet en waar dus veel potentie in zit. Deze disciplines zijn dan ook het startpunt om het sociaalwetenschappelijke werk van DANS uit te breiden. DANS is van plan om binnen deze disciplines het werk en de diensten van DANS extra onder de aandacht brengen, bijvoorbeeld door specifieke workshops, trainingen of evenementen te organiseren die specifiek gericht zijn op deze doelgroep. De doelstelling is hierbij om de onderzoekers en instellingen bekend te maken met de services van DANS en het belang van duurzame data archivering en FAIR-data. Omdat DANS eerder werk heeft verricht om datagebruik en management praktijken onder psychologen in kaart te brengen (zie Appendix), zal DANS zich het komende jaar eerst gaan richten op de discipline Psychologie.

5.2.2 Beschikbaar stellen van andere typen data Naast het benaderen van onderzoekers uit minder goed vertegenwoordigde disciplines wil DANS verder investeren in het beschikbaar stellen van verschillende type data binnen de sociale wetenschappen. Hierbij kan gedacht worden aan het integreren van sociaalwetenschappelijke data in NARCIS of EASY, en die nu zijn opgeslagen in andere portalen, zoals bijvoorbeeld overheidsdata die beschikbaar zijn via het dataportaal van de Nederlandse overheid29. Daarnaast wordt in de sociale wetenschappen veel gebruik gemaakt van kwalitatieve data, zoals interviews of video- en audio-opnames die via DANS beschikbaar gesteld zouden kunnen worden. Verder zijn ook geologische data en data over ontwikkelingslanden denkbare databronnen waar DANS zich in de

28 https://www.go-fair.org/go-fair-initiative/mission/ 29 Data.overheid.nl

DANS Sociale Wetenschappen - Beleidsnota januari 2019

Page 16: DANS en de sociale wetenschappen · Voor de opslag en documentatie van de onderzoeksdata zijn verder niet altijd duidelijke processen en controlemaatregelen binnen onderzoeksinstellingen.

15

toekomst meer op zou kunnen gaan richten. Bovendien zijn er nog veel open vragen op het gebied van (her)gebruik en opslag van nieuwe typen data zoals sociale media data (twitter, facebook) of andere grootschalige datasets waar DANS in de toekomst aan zou kunnen werken. Voortbouwend op eerdere initiatieven en projecten, wil DANS op dit gebied de komende tijd een begin maken met een pilot-project voor het integreren van overheidsdata in NARCIS (en EASY) en het archiveren en beschikbaar stellen van kwalitatieve audiovisuele (AV) data uit de sociale wetenschappen. Deze twee projecten zijn hieronder nader beschreven.

Overheidsdata Veel (sociaalwetenschappelijke) overheidsdata worden open beschikbaar gesteld via het Dataportaal van de Nederlandse overheid. Het gaat hierbij om een grote hoeveelheid datasets (12.805 op 19 november 2018) die voor veel (sociale) wetenschappers en andere gebruikers interessant zijn. Echter kan de vindbaarheid en FAIRness van deze data verbeterd worden en hierin zou DANS een actieve rol in kunnen spelen. DANS heeft in het verleden eerder geïnventariseerd of de beschikbare data via EASY gearchiveerd kan worden en beschikbaar kan worden gemaakt door DANS, maar destijds was hier geen behoefte aan. Door de recente ontwikkelingen op het gebied van open data en het groeiende bewustzijn voor het belang van FAIR-data ziet DANS een kans om opnieuw het gesprek te zoeken en de mogelijkheden te bespreken. DANS wordt bijvoorbeeld ook expliciet genoemd in de Nadere overeenkomst beleidsgericht onderzoek van de Algemene Rijksvoorwaarden voor het verstrekken van opdrachten tot het verrichten van diensten (ARVODI-2018)30. Hierin staat dat databestanden die zich lenen tot hergebruik via DANS-EASY beschikbaar gesteld dienen te worden. Dit gebeurt in de praktijk niet of nauwelijks. De focus van dit pilot-project zal in eerste instantie liggen op het beschikbaar stellen van de metadata in NARCIS zodat de overheidsdata via NARCIS gevonden kunnen worden. Daarnaast zou ook gekeken kunnen worden naar wat de mogelijkheden zijn om de onderliggende data via EASY duurzaam te archiveren.

Audiovisuele data Naast kwantitatieve data (zoals surveydata of reactietijden) werken veel sociale wetenschappers ook met kwalitatieve data zoals audiovisuele data, bijvoorbeeld van interviews. DANS heeft in het verleden gewerkt aan opslag en toegang tot AV-data voor andere domeinen en zou deze kennis en services uit kunnen breiden naar de sociale wetenschappen. DANS zou hierbij kunnen gaan kijken naar wat de behoeftes zijn van sociale wetenschappers op het gebied van AV-opslag en toegankelijkheid. Belangrijke aspecten die bestudeert kunnen worden zijn privacy kwesties met betrekking tot het opslaan en delen van AV-materiaal, met name in relatie tot de AVG. Ook zou gekeken kunnen worden naar de verschillende data formats van AV-materiaal die in de sociale wetenschappen worden gebruikt en de duurzame opslag hiervan. DANS wil de komende tijd gaan kijken of bestaande services uitgebreid kunnen worden naar de sociale wetenschappen en waar de behoeftes liggen op het gebied van het opslaan en delen van AV-materialen.

30 www.pianoo.nl/nl/regelgeving/voorwaarden/rijksoverheid/algemene-rijksvoorwaarden-voor-diensten-2018-arvodi-2018-5

DANS Sociale Wetenschappen - Beleidsnota januari 2019

Page 17: DANS en de sociale wetenschappen · Voor de opslag en documentatie van de onderzoeksdata zijn verder niet altijd duidelijke processen en controlemaatregelen binnen onderzoeksinstellingen.

DANS Sociale Wetenschappen - Beleidsnota januari 2019 16

5.2.3 Training Naast NARCIS, EASY en DataverseNL biedt DANS ook training en consultancy. DANS heeft in het verleden eerder trainingen gegeven specifiek voor de sociale wetenschappen (zie 3.2), maar wil dit de komende tijd gaan versterken. Trainingsactiviteiten kunnen met name aan gaan sluiten op materialen die worden ontwikkeld binnen de projecten waar DANS bij betrokken is. DANS heeft bijvoorbeeld meegewerkt aan de online training CESSDA Data Management Expert Guide31. Naast de guide zelf, is deze ontwikkeld voor onderzoekers en zijn ook train-the-trainer materialen voor datasupporters beschikbaar. DANS geeft eind 2018 een workshop voor sociale wetenschappers die gebaseerd is op deze module en zich richt op ethische aspecten en de AVG32. De komende tijd zou DANS de beschikbare materialen nog verder kunnen gebruiken om meer workshops te organiseren die ook gebruik maken van het train-the-trainer pakket dat is samengesteld. Ook kunnen toekomstige trainingsactiviteiten aansluiten bij de verbreding van de DANS-diensten naar andere subdisciplines en typen data die hierboven is beschreven. De trainingsactiviteiten voor de sociale wetenschappen zullen gaan aansluiten bij het trainingsprogramma van DANS en worden uitgevoerd in samenwerking met de programmaleider trainingen.

31 https://www.cessda.eu/Training/Training-Resources/Library/Data-Management-Expert-Guide 32 https://dans.knaw.nl/nl/actueel/agenda/workshop-research-data-management-in-the-time-of-the-gdpr

Page 18: DANS en de sociale wetenschappen · Voor de opslag en documentatie van de onderzoeksdata zijn verder niet altijd duidelijke processen en controlemaatregelen binnen onderzoeksinstellingen.

17

Appendix Beschrijving van afgeronde sociaalwetenschappelijke projecten In de afgelopen jaren zijn er vanuit DANS een aantal initiatieven geweest om te kijken naar het delen van data en datamanagement binnen verschillende deelgebieden van de sociale wetenschappen (jeugd data, psychologie en sociologie). Hieronder zijn deze drie studies kort samengevat. Daarnaast is een korte omschrijving van het EconData project toegevoegd, waarbij gewerkt werd aan het toegankelijk maken van economische data.

2015: Integriteit en duurzaamheid in het digitale tijdperk - Het bewaren, delen, hergebruiken en documenteren van digitale onderzoeksdata door sociologen in Nederland (Beau Oldenburg)33 Uit dit onderzoek kwam naar voren dat er een aantal positieve ontwikkelingen zijn als het gaat om integriteit en duurzaamheid van digitale onderzoeksdata. Zo zijn vaak digitale omgevingen beschikbaar waar data veilig kunnen worden opgeslagen en is er controle van de data via publication packages. Er is echter ook nog ruimte voor ontwikkeling. Zo slaan onderzoekers hun data vaak op, op onveilige media en lijken onderzoekers welwillend te zijn om data op te slaan en te delen, maar gebeurt dit in de praktijk weinig. Ook worden Data Management Plannen vaak niet of pas laat op papier gezet. Meer stimulansen om data te delen, bewustwording en strikter beleid zijn nodig.

2010: Data voer voor psychologen - Archivering, beschikbaarstelling en hergebruik van onderzoeksdata in de psychologie (Caroline Voorbrood)34 Uit dit onderzoek kwam naar voren dat psychologen hun data over het algemeen niet systematisch archiveren. De behoeftes voor systematische archivering is wisselend en afhankelijk van het type onderzoek. Psychologische data wordt regelmatig gedeeld maar in veel gevallen binnen bestaande samenwerkingen. De behoefte om data te delen is wel aanwezig, terwijl verdeeldheid bestaat onder de respondenten aan dit onderzoek over de behoefte tot toegang van data van andere onderzoekers.

2009: Rapport Verkenning Jeugddata (Henk Vinken)35 In dit onderzoek is bekeken welke behoeften onderzoekers hebben bij het verzamelen en beschikbaar stellen van data op het gebied van jeugdonderzoek en welke rol DANS hierin zou kunnen spelen. Data moeten onderling kunnen worden gekoppeld en is er met name vraag naar grote longitudinale datasets. DANS zou een rol kunnen spelen in het beschikbaar stellen van informatie over de kennis die er is en welke groepen waarmee bezig zijn binnen dit onderzoeksveld. Met betrekking tot het delen van data wordt het kerndilemma genoemd: de tijd die nodig is om data beschikbaar te maken voor hergebruik weegt niet op tegen de verwachte opbrengsten van het delen.

1998: EconData - Project voor het ontwikkelen van datadiensten voor economisch onderzoek (NIWI) In het EconData project werkte het NIWI (Nederlands Instituut voor Wetenschappelijke Informatiediensten) aan de registratie en archivering van

33 http://hdl.handle.net/11370/b70cf0ae-4bdc-4247-ab34-3f5c516cb5bc 34 https://doi.org/10.17026/dans-x76-2tsh 35https://dans.knaw.nl/nl/over/organisatie-beleid/publicaties/DANSstudiesindigitalarchiving3verkenningjeugddataNL.pdf

DANS Sociale Wetenschappen - Beleidsnota januari 2019

Page 19: DANS en de sociale wetenschappen · Voor de opslag en documentatie van de onderzoeksdata zijn verder niet altijd duidelijke processen en controlemaatregelen binnen onderzoeksinstellingen.

DANS Sociale Wetenschappen - Beleidsnota januari 2019 18

economische databestanden om deze beschikbaar te stellen voor hergebruik. Het EconData project was binnen het NIWI ondergebracht bij de productiegroep digitale data-archieven. Deze groep beheerde twee collecties van digitale databestanden: Het Steinmetz-archief (maatschappijwetenschappelijk onderzoek) en het Nederlands Historisch Data Archief (NHDA) –beide collecties worden sinds 2005 door DANS beheerd.

Page 20: DANS en de sociale wetenschappen · Voor de opslag en documentatie van de onderzoeksdata zijn verder niet altijd duidelijke processen en controlemaatregelen binnen onderzoeksinstellingen.

Dit document is bedoeld om de huidige positie van DANS binnen de sociale wetenschappen te beschouwen, en aandachtspunten en richtingen voor de toekomst te identificeren. Het document geeft een overzicht van de sociale wetenschappen en de staat van data archivering en datamanagement. Daarbij wordt de rol van DANS hierin beschreven, door te kijken naar de diensten die DANS levert aan deze gemeenschap en de projecten waar DANS bij betrokken is. Verder gaat dit document in op de mogelijke uitbreidingen die DANS zou kunnen maken om diens rol in de sociale wetenschappen verder te kunnen versterken. Data Archiving and Networked Services (DANS)DANS (Data Archiving and Networked Services) is het Nederlands instituut voor permanente toegang tot digitale onderzoeksgegevens. DANS stimuleert onderzoekers om hun digitale onderzoeksgegevens vindbaar, toegankelijk, interoperabel en herbruikbaar te maken. Dit doen wij door deskundig advies en gecertificeerde diensten aan te bieden. Onze kerndiensten zijn: DataverseNL voor databeheer op de korte termijn, EASYvoor archivering op de lange termijn en NARCIS, het nationale portaal voor wetenschappelijke informatie. Door deelname aan (inter)nationale projecten, netwerken en onderzoek draagt DANS bij aan de innovatievan de mondiale wetenschappelijke data-infrastructuur. Open als het kan, beschermd als het moet. DANS is een instituut van KNAW en NWO.

DANS is een instituut van KNAW en NWO

Door data gedreven

Data Archiving and Networked Services (DANS)Anna van Saksenlaan 512593 HW Den Haag+31 70 349 44 50 [email protected] | dans.knaw.nl

<<<