Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor...

Post on 13-May-2015

217 views 0 download

Transcript of Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor...

Data opslaan &bewaren

Bibliotheek – Project RDM Ondersteuning

Basistraining voor informatiespecialisten

RDMO Data opslaan & bewaren 2

Manieren om data te verliezen

Bestand of drager verdwijnt: bestand per ongeluk

verwijderd, computer gestolen

Bestand of drager raakt beschadigd: bit rot, brand

Documentatie gaat verloren: data verliest context

Benodigde soft- of hardware raakt buiten gebruik

RDMO Data opslaan & bewaren 3

Manieren om data te behouden

Goed opslagmedium

Back-ups

Regelmatige controle (opslagmedium, bestand)

Beveiliging

Duurzame bestandsformaten

RDMO Data opslaan & bewaren 4

Opslagmedia

RDMO Data opslaan & bewaren 5

Digitale opslagmogelijkheden

Schijf (netwerk, pc, extern)

Onderzoeksapparatuur of softwarepakket (CAQDAS)

Virtual Research Environment (VRE)

Cloud (Dropbox, Google Drive e.a.)

Repository

RDMO Data opslaan & bewaren 6

Overwegingen

Beschikbare ruimte

Prijs

Gebruiksgemak

Veiligheid

RDMO Data opslaan & bewaren 7

Aandachtspunten

Exportmogelijkheden kan ik wat ik erin stop, er ook weer uit halen? In welk formaat?

Veiligheid waar staan mijn data precies en welke wetgeving geldt daar?

Betrouwbaarheid kan ik erop vertrouwen dat mijn data niet wegraken, ik er altijd bij kan en ik vorige versies kan herstellen?

RDMO Data opslaan & bewaren 8

Back-ups

RDMO Data opslaan & bewaren 9

Back-ups maken

handmatig

met behulp van software

laten doen (opslag op UvA-netwerkschijf = back-up

door ICT Services)

RDMO Data opslaan & bewaren 10

Back-ups

Full:

integrale kopie van alle bestanden

Incremental:

kopie van wijzigingen sinds laatste back-up

Differential:

kopie van wijzigingen sinds laatste full back-up

RDMO Data opslaan & bewaren 11

Back-ups

Aantal: ten minste 1, liever 2 op div. locaties

Frequentie: hoe vaak wijzigen de bestanden?

Identificatie: datum, inhoud?

Controle: compleet en toegankelijk?

RDMO Data opslaan & bewaren 12

Beveiliging

RDMO Data opslaan & bewaren 13

Fysieke beveiliging

Vergrendel je desktop als je even weggaat ( + L)

Doe je kamerdeur op slot

Hou een oogje op je laptop

Vervoer je usb-stick verliesbestendig

RDMO Data opslaan & bewaren 14

Virtuele beveiliging

Firewall

Anti-virus software

Updates van software en besturingssysteem

Wachtwoorden (netwerk, pc, bestand)

Encryptie (bestand, schijf, usb-stick)

Kwaliteitscontrole

Zelf kijken: ziet het eruit

zoals het moet?

Laten rekenen: klopt de

checksum?

RDMO Data opslaan & bewaren 15

Jorge Stolfi, Checksum, Wikimedia Commons http://en.wikipedia.org/wiki/File:Checksum.svg

Oefening

RDMO Data opslaan & bewaren 16

De UK Data Service heeft 10 situaties waarin het

misging met de veiligheid en beveiliging van

onderzoeksdata op een rijtje gezet. Met welke

voorzorgsmaatregelen hadden deze scenario’s

voorkomen kunnen worden?UK Data Archive (UK Data Service), Managing and sharing data. Training resources (2011), 63-65

http://ukdataservice.ac.uk/manage-data/training.aspx

RDMO Data opslaan & bewaren 17

Bestandsformaten

RDMO Data opslaan & bewaren 18

Bestanden

Bestand wordt gemaakt m.b.v. software

Bestandsnaam heeft een extensie (.docx, .pdf etc.)

Bestandsextensie zegt iets over bestandsformaat

Bestandsformaat bepaalt of (andere) software er

iets (zinnigs) mee kan

RDMO Data opslaan & bewaren 19

RDMO Data opslaan & bewaren 20Foto: Monique Kooijmans

RDMO Data opslaan & bewaren 21

Uh-oh…

Bestand met de verkeerde software geopend…

maar weten we zeker dat de goede software blijft

bestaan? En het besturingssysteem waaronder die

software werkt?

RDMO Data opslaan & bewaren 22

Drie variabelen, één beïnvloedbare

Bestandsformaat

Software

Besturingssysteem

RDMO Data opslaan & bewaren 23

Duurzame bestandsformaten

zijn onafhankelijk van specifieke betaalde software,

ontwikkelaars of leveranciers (non-proprietary),

hebben open specificaties (open format), of

worden veel gebruikt (bijv. MS Office-formaten)

.docx (MS Office Worddocument)

RDMO Data opslaan & bewaren 24

.txt (text)

RDMO Data opslaan & bewaren 25

.pdf (portable document format, PDF/A)

RDMO Data opslaan & bewaren 26

.xlsx (MS Office Excelbestand)

RDMO Data opslaan & bewaren 27

.csv (comma separated values)

RDMO Data opslaan & bewaren 28

RDMO Data opslaan & bewaren 29

Overwegingen bij het kiezen van een formaat

Welk bestandsformaat werkt met de software die ik

ga gebruiken voor analyse van de data?

Welk bestandsformaat werkt voor soortgelijke data?

Is er een standaard?

Wat wil mijn (beoogd) data-archief?

Data-archieven

beoordelen bestands-

formaten op

1) duurzaamheid

2) geschiktheid voor

hergebruik

RDMO Data opslaan & bewaren 30

RDMO Data opslaan & bewaren 31

Omzetten in ander formaat: risico’s

verlies van data of interne metadata

verlies van opmaak (bijv. bij tekstbestanden)

kwaliteitsverlies (bijv. bij grafische bestanden)

>>> bewaar originele bestand

>>> raadpleeg deskundige

RDMO Data opslaan & bewaren 32

Inventarisatie

Welke bestandsformaten worden in jouw vakgebied het

meest gebruikt?

Welke software wordt in jouw vakgebied het meest

gebruikt?

Kun je onderzoekers adviseren over de voors en tegens?

RDMO Data opslaan & bewaren 33

Selectie &vernietiging

RDMO Data opslaan & bewaren 34

Bewaren voor de lange termijn: redenen

1) Verplichting in verband met verificatie van

onderzoek, opgelegd door wet, financier, instituut of

journal

RDMO Data opslaan & bewaren 35

Bewaren voor de lange termijn: redenen

1) Verplichting (wet, financier, instituut, journal)

2) Ten behoeve van het vakgebied i.v.m. waarde (productiekosten, hergebruik, innovatie),

uniciteit (niet-herhaalbare waarnemingen) en/of

belang voor (wetenschaps)historisch onderzoek

RDMO Data opslaan & bewaren 36

Bewaren voor de lange termijn: redenen

1) Verplichting (wet, financier, instituut, journal)

2) Ten behoeve van het vakgebied

3) Voor niet-wetenschappelijke doelen (bijv. cultureel

erfgoed, musea, presentaties etc.)

RDMO Data opslaan & bewaren 37

Vernietiging: redenen

De onderzoeksdata vallen niet onder één van de

bewaarredenen, en de kosten van bewaren voor de

lange termijn zijn (te) hoog

Vernietiging van de onderzoeksdata is verplicht (bijv.

persoonsgegevens medisch onderzoek)

RDMO Data opslaan & bewaren 38

Veilige vernietiging: manieren

harde schijf: overschrijven m.b.v. software

usb-sticks, cd’s, dvd’s: fysiek vernietigen

RDMO Data opslaan & bewaren 39

Bewaren voor de lange termijn: hoe lang?

Medische data met persoonsgegevens: ten hoogste

15 jaar, tenzij geanonimiseerd

Andere data: ten minste 5 jaar (Gedragscode VSNU)

RDMO Data opslaan & bewaren 40

Bewaren voor de lange termijn: waar?

eigen harde schijf

repository: gespecialiseerd data-archief (wordt vervolgd in ‘Data delen & hergebruiken’)

De praktijk…

RDMO Data opslaan & bewaren 41

http://news.ubc.ca/2013/12/19/scientific-data-lost-at-alarming-rate/

http://www.nature.com/news/scientists-losing-data-at-a-rapid-rate-1.14416

De praktijk…

RDMO Data opslaan & bewaren 42

Edinburgh University Data Library [Data Library]. (2013, November 8). MANTRA – Jeff Haywood – RDM Legacy access and data reuse [. Retrieved from http://youtu.be/BRwcPhavElI

RDMO Data opslaan & bewaren 43

Informatiebronnen

UK Data Archive (UK Data Service), Managing and sharing data. Best practice for researchers (2011)http://ukdataservice.ac.uk/manage-data/training.aspx

DANS, DANS Preferred Formats (2013)http://www.dans.knaw.nl/content/data-archief/data-deponeren#voorkeursbestandsformaten

Tjalsma, H. en J. Rombouts, Selection of Research Data. Guidelines for appraising and selecting research data. DANS Studies in Digital Archiving 6 (Den Haag en Delft 2011)http://www.dans.knaw.nl/content/categorieen/publicaties/dans-studies-digital-archiving-6

Vereniging van Nederlandse Universiteiten (VSNU), De Nederlandse gedragscode wetenschapsbeoefening (2012)http://www.vsnu.nl/wetenschappelijke_integriteit.html

Nederlandse Federatie van Universitair Medische Centra (NFU), Kwaliteitsborging mensgebonden onderzoek 2.0 (2012)http://www.nfu.nl/img/pdf/NFU-12.6053_Kwaliteitsborging_mensgebonden_onderzoek_2.0.pdf

RDMO Data opslaan & bewaren 44

Colofon

Presentatie:

Mariëtte van Selm | selm@uva.nl

Beeld, tenzij anders vermeld bij afbeelding:

Jørgen Stamp | http://www.digitalbevaring.dk/

M. van Selm, RDM Ondersteuning - basistraining voor informatiespecialisten, lesmateriaal sessie 3. Februari 2014.Dit werk is gelicenseerd onder de licentie Creative Commons Naamsvermelding-GelijkDelen 4.0 Internationaal