Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor...

44
Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten

Transcript of Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor...

Page 1: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

Data opslaan &bewaren

Bibliotheek – Project RDM Ondersteuning

Basistraining voor informatiespecialisten

Page 2: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

RDMO Data opslaan & bewaren 2

Manieren om data te verliezen

Bestand of drager verdwijnt: bestand per ongeluk

verwijderd, computer gestolen

Bestand of drager raakt beschadigd: bit rot, brand

Documentatie gaat verloren: data verliest context

Benodigde soft- of hardware raakt buiten gebruik

Page 3: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

RDMO Data opslaan & bewaren 3

Manieren om data te behouden

Goed opslagmedium

Back-ups

Regelmatige controle (opslagmedium, bestand)

Beveiliging

Duurzame bestandsformaten

Page 4: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

RDMO Data opslaan & bewaren 4

Opslagmedia

Page 5: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

RDMO Data opslaan & bewaren 5

Digitale opslagmogelijkheden

Schijf (netwerk, pc, extern)

Onderzoeksapparatuur of softwarepakket (CAQDAS)

Virtual Research Environment (VRE)

Cloud (Dropbox, Google Drive e.a.)

Repository

Page 6: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

RDMO Data opslaan & bewaren 6

Overwegingen

Beschikbare ruimte

Prijs

Gebruiksgemak

Veiligheid

Page 7: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

RDMO Data opslaan & bewaren 7

Aandachtspunten

Exportmogelijkheden kan ik wat ik erin stop, er ook weer uit halen? In welk formaat?

Veiligheid waar staan mijn data precies en welke wetgeving geldt daar?

Betrouwbaarheid kan ik erop vertrouwen dat mijn data niet wegraken, ik er altijd bij kan en ik vorige versies kan herstellen?

Page 8: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

RDMO Data opslaan & bewaren 8

Back-ups

Page 9: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

RDMO Data opslaan & bewaren 9

Back-ups maken

handmatig

met behulp van software

laten doen (opslag op UvA-netwerkschijf = back-up

door ICT Services)

Page 10: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

RDMO Data opslaan & bewaren 10

Back-ups

Full:

integrale kopie van alle bestanden

Incremental:

kopie van wijzigingen sinds laatste back-up

Differential:

kopie van wijzigingen sinds laatste full back-up

Page 11: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

RDMO Data opslaan & bewaren 11

Back-ups

Aantal: ten minste 1, liever 2 op div. locaties

Frequentie: hoe vaak wijzigen de bestanden?

Identificatie: datum, inhoud?

Controle: compleet en toegankelijk?

Page 12: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

RDMO Data opslaan & bewaren 12

Beveiliging

Page 13: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

RDMO Data opslaan & bewaren 13

Fysieke beveiliging

Vergrendel je desktop als je even weggaat ( + L)

Doe je kamerdeur op slot

Hou een oogje op je laptop

Vervoer je usb-stick verliesbestendig

Page 14: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

RDMO Data opslaan & bewaren 14

Virtuele beveiliging

Firewall

Anti-virus software

Updates van software en besturingssysteem

Wachtwoorden (netwerk, pc, bestand)

Encryptie (bestand, schijf, usb-stick)

Page 15: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

Kwaliteitscontrole

Zelf kijken: ziet het eruit

zoals het moet?

Laten rekenen: klopt de

checksum?

RDMO Data opslaan & bewaren 15

Jorge Stolfi, Checksum, Wikimedia Commons http://en.wikipedia.org/wiki/File:Checksum.svg

Page 16: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

Oefening

RDMO Data opslaan & bewaren 16

De UK Data Service heeft 10 situaties waarin het

misging met de veiligheid en beveiliging van

onderzoeksdata op een rijtje gezet. Met welke

voorzorgsmaatregelen hadden deze scenario’s

voorkomen kunnen worden?UK Data Archive (UK Data Service), Managing and sharing data. Training resources (2011), 63-65

http://ukdataservice.ac.uk/manage-data/training.aspx

Page 17: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

RDMO Data opslaan & bewaren 17

Bestandsformaten

Page 18: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

RDMO Data opslaan & bewaren 18

Bestanden

Bestand wordt gemaakt m.b.v. software

Bestandsnaam heeft een extensie (.docx, .pdf etc.)

Bestandsextensie zegt iets over bestandsformaat

Bestandsformaat bepaalt of (andere) software er

iets (zinnigs) mee kan

Page 19: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

RDMO Data opslaan & bewaren 19

Page 20: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

RDMO Data opslaan & bewaren 20Foto: Monique Kooijmans

Page 21: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

RDMO Data opslaan & bewaren 21

Uh-oh…

Bestand met de verkeerde software geopend…

maar weten we zeker dat de goede software blijft

bestaan? En het besturingssysteem waaronder die

software werkt?

Page 22: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

RDMO Data opslaan & bewaren 22

Drie variabelen, één beïnvloedbare

Bestandsformaat

Software

Besturingssysteem

Page 23: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

RDMO Data opslaan & bewaren 23

Duurzame bestandsformaten

zijn onafhankelijk van specifieke betaalde software,

ontwikkelaars of leveranciers (non-proprietary),

hebben open specificaties (open format), of

worden veel gebruikt (bijv. MS Office-formaten)

Page 24: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

.docx (MS Office Worddocument)

RDMO Data opslaan & bewaren 24

Page 25: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

.txt (text)

RDMO Data opslaan & bewaren 25

Page 26: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

.pdf (portable document format, PDF/A)

RDMO Data opslaan & bewaren 26

Page 27: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

.xlsx (MS Office Excelbestand)

RDMO Data opslaan & bewaren 27

Page 28: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

.csv (comma separated values)

RDMO Data opslaan & bewaren 28

Page 29: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

RDMO Data opslaan & bewaren 29

Overwegingen bij het kiezen van een formaat

Welk bestandsformaat werkt met de software die ik

ga gebruiken voor analyse van de data?

Welk bestandsformaat werkt voor soortgelijke data?

Is er een standaard?

Wat wil mijn (beoogd) data-archief?

Page 30: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

Data-archieven

beoordelen bestands-

formaten op

1) duurzaamheid

2) geschiktheid voor

hergebruik

RDMO Data opslaan & bewaren 30

Page 31: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

RDMO Data opslaan & bewaren 31

Omzetten in ander formaat: risico’s

verlies van data of interne metadata

verlies van opmaak (bijv. bij tekstbestanden)

kwaliteitsverlies (bijv. bij grafische bestanden)

>>> bewaar originele bestand

>>> raadpleeg deskundige

Page 32: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

RDMO Data opslaan & bewaren 32

Inventarisatie

Welke bestandsformaten worden in jouw vakgebied het

meest gebruikt?

Welke software wordt in jouw vakgebied het meest

gebruikt?

Kun je onderzoekers adviseren over de voors en tegens?

Page 33: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

RDMO Data opslaan & bewaren 33

Selectie &vernietiging

Page 34: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

RDMO Data opslaan & bewaren 34

Bewaren voor de lange termijn: redenen

1) Verplichting in verband met verificatie van

onderzoek, opgelegd door wet, financier, instituut of

journal

Page 35: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

RDMO Data opslaan & bewaren 35

Bewaren voor de lange termijn: redenen

1) Verplichting (wet, financier, instituut, journal)

2) Ten behoeve van het vakgebied i.v.m. waarde (productiekosten, hergebruik, innovatie),

uniciteit (niet-herhaalbare waarnemingen) en/of

belang voor (wetenschaps)historisch onderzoek

Page 36: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

RDMO Data opslaan & bewaren 36

Bewaren voor de lange termijn: redenen

1) Verplichting (wet, financier, instituut, journal)

2) Ten behoeve van het vakgebied

3) Voor niet-wetenschappelijke doelen (bijv. cultureel

erfgoed, musea, presentaties etc.)

Page 37: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

RDMO Data opslaan & bewaren 37

Vernietiging: redenen

De onderzoeksdata vallen niet onder één van de

bewaarredenen, en de kosten van bewaren voor de

lange termijn zijn (te) hoog

Vernietiging van de onderzoeksdata is verplicht (bijv.

persoonsgegevens medisch onderzoek)

Page 38: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

RDMO Data opslaan & bewaren 38

Veilige vernietiging: manieren

harde schijf: overschrijven m.b.v. software

usb-sticks, cd’s, dvd’s: fysiek vernietigen

Page 39: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

RDMO Data opslaan & bewaren 39

Bewaren voor de lange termijn: hoe lang?

Medische data met persoonsgegevens: ten hoogste

15 jaar, tenzij geanonimiseerd

Andere data: ten minste 5 jaar (Gedragscode VSNU)

Page 40: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

RDMO Data opslaan & bewaren 40

Bewaren voor de lange termijn: waar?

eigen harde schijf

repository: gespecialiseerd data-archief (wordt vervolgd in ‘Data delen & hergebruiken’)

Page 41: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

De praktijk…

RDMO Data opslaan & bewaren 41

http://news.ubc.ca/2013/12/19/scientific-data-lost-at-alarming-rate/

http://www.nature.com/news/scientists-losing-data-at-a-rapid-rate-1.14416

Page 42: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

De praktijk…

RDMO Data opslaan & bewaren 42

Edinburgh University Data Library [Data Library]. (2013, November 8). MANTRA – Jeff Haywood – RDM Legacy access and data reuse [. Retrieved from http://youtu.be/BRwcPhavElI

Page 43: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

RDMO Data opslaan & bewaren 43

Informatiebronnen

UK Data Archive (UK Data Service), Managing and sharing data. Best practice for researchers (2011)http://ukdataservice.ac.uk/manage-data/training.aspx

DANS, DANS Preferred Formats (2013)http://www.dans.knaw.nl/content/data-archief/data-deponeren#voorkeursbestandsformaten

Tjalsma, H. en J. Rombouts, Selection of Research Data. Guidelines for appraising and selecting research data. DANS Studies in Digital Archiving 6 (Den Haag en Delft 2011)http://www.dans.knaw.nl/content/categorieen/publicaties/dans-studies-digital-archiving-6

Vereniging van Nederlandse Universiteiten (VSNU), De Nederlandse gedragscode wetenschapsbeoefening (2012)http://www.vsnu.nl/wetenschappelijke_integriteit.html

Nederlandse Federatie van Universitair Medische Centra (NFU), Kwaliteitsborging mensgebonden onderzoek 2.0 (2012)http://www.nfu.nl/img/pdf/NFU-12.6053_Kwaliteitsborging_mensgebonden_onderzoek_2.0.pdf

Page 44: Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor informatiespecialisten.

RDMO Data opslaan & bewaren 44

Colofon

Presentatie:

Mariëtte van Selm | [email protected]

Beeld, tenzij anders vermeld bij afbeelding:

Jørgen Stamp | http://www.digitalbevaring.dk/

M. van Selm, RDM Ondersteuning - basistraining voor informatiespecialisten, lesmateriaal sessie 3. Februari 2014.Dit werk is gelicenseerd onder de licentie Creative Commons Naamsvermelding-GelijkDelen 4.0 Internationaal