Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor...
-
Upload
barbara-molenaar -
Category
Documents
-
view
217 -
download
0
Transcript of Data opslaan & bewaren Bibliotheek – Project RDM Ondersteuning Basistraining voor...
Data opslaan &bewaren
Bibliotheek – Project RDM Ondersteuning
Basistraining voor informatiespecialisten
RDMO Data opslaan & bewaren 2
Manieren om data te verliezen
Bestand of drager verdwijnt: bestand per ongeluk
verwijderd, computer gestolen
Bestand of drager raakt beschadigd: bit rot, brand
Documentatie gaat verloren: data verliest context
Benodigde soft- of hardware raakt buiten gebruik
RDMO Data opslaan & bewaren 3
Manieren om data te behouden
Goed opslagmedium
Back-ups
Regelmatige controle (opslagmedium, bestand)
Beveiliging
Duurzame bestandsformaten
RDMO Data opslaan & bewaren 4
Opslagmedia
RDMO Data opslaan & bewaren 5
Digitale opslagmogelijkheden
Schijf (netwerk, pc, extern)
Onderzoeksapparatuur of softwarepakket (CAQDAS)
Virtual Research Environment (VRE)
Cloud (Dropbox, Google Drive e.a.)
Repository
RDMO Data opslaan & bewaren 6
Overwegingen
Beschikbare ruimte
Prijs
Gebruiksgemak
Veiligheid
RDMO Data opslaan & bewaren 7
Aandachtspunten
Exportmogelijkheden kan ik wat ik erin stop, er ook weer uit halen? In welk formaat?
Veiligheid waar staan mijn data precies en welke wetgeving geldt daar?
Betrouwbaarheid kan ik erop vertrouwen dat mijn data niet wegraken, ik er altijd bij kan en ik vorige versies kan herstellen?
RDMO Data opslaan & bewaren 8
Back-ups
RDMO Data opslaan & bewaren 9
Back-ups maken
handmatig
met behulp van software
laten doen (opslag op UvA-netwerkschijf = back-up
door ICT Services)
RDMO Data opslaan & bewaren 10
Back-ups
Full:
integrale kopie van alle bestanden
Incremental:
kopie van wijzigingen sinds laatste back-up
Differential:
kopie van wijzigingen sinds laatste full back-up
RDMO Data opslaan & bewaren 11
Back-ups
Aantal: ten minste 1, liever 2 op div. locaties
Frequentie: hoe vaak wijzigen de bestanden?
Identificatie: datum, inhoud?
Controle: compleet en toegankelijk?
RDMO Data opslaan & bewaren 12
Beveiliging
RDMO Data opslaan & bewaren 13
Fysieke beveiliging
Vergrendel je desktop als je even weggaat ( + L)
Doe je kamerdeur op slot
Hou een oogje op je laptop
Vervoer je usb-stick verliesbestendig
RDMO Data opslaan & bewaren 14
Virtuele beveiliging
Firewall
Anti-virus software
Updates van software en besturingssysteem
Wachtwoorden (netwerk, pc, bestand)
Encryptie (bestand, schijf, usb-stick)
Kwaliteitscontrole
Zelf kijken: ziet het eruit
zoals het moet?
Laten rekenen: klopt de
checksum?
RDMO Data opslaan & bewaren 15
Jorge Stolfi, Checksum, Wikimedia Commons http://en.wikipedia.org/wiki/File:Checksum.svg
Oefening
RDMO Data opslaan & bewaren 16
De UK Data Service heeft 10 situaties waarin het
misging met de veiligheid en beveiliging van
onderzoeksdata op een rijtje gezet. Met welke
voorzorgsmaatregelen hadden deze scenario’s
voorkomen kunnen worden?UK Data Archive (UK Data Service), Managing and sharing data. Training resources (2011), 63-65
http://ukdataservice.ac.uk/manage-data/training.aspx
RDMO Data opslaan & bewaren 17
Bestandsformaten
RDMO Data opslaan & bewaren 18
Bestanden
Bestand wordt gemaakt m.b.v. software
Bestandsnaam heeft een extensie (.docx, .pdf etc.)
Bestandsextensie zegt iets over bestandsformaat
Bestandsformaat bepaalt of (andere) software er
iets (zinnigs) mee kan
RDMO Data opslaan & bewaren 19
RDMO Data opslaan & bewaren 20Foto: Monique Kooijmans
RDMO Data opslaan & bewaren 21
Uh-oh…
Bestand met de verkeerde software geopend…
maar weten we zeker dat de goede software blijft
bestaan? En het besturingssysteem waaronder die
software werkt?
RDMO Data opslaan & bewaren 22
Drie variabelen, één beïnvloedbare
Bestandsformaat
Software
Besturingssysteem
RDMO Data opslaan & bewaren 23
Duurzame bestandsformaten
zijn onafhankelijk van specifieke betaalde software,
ontwikkelaars of leveranciers (non-proprietary),
hebben open specificaties (open format), of
worden veel gebruikt (bijv. MS Office-formaten)
.docx (MS Office Worddocument)
RDMO Data opslaan & bewaren 24
.txt (text)
RDMO Data opslaan & bewaren 25
.pdf (portable document format, PDF/A)
RDMO Data opslaan & bewaren 26
.xlsx (MS Office Excelbestand)
RDMO Data opslaan & bewaren 27
.csv (comma separated values)
RDMO Data opslaan & bewaren 28
RDMO Data opslaan & bewaren 29
Overwegingen bij het kiezen van een formaat
Welk bestandsformaat werkt met de software die ik
ga gebruiken voor analyse van de data?
Welk bestandsformaat werkt voor soortgelijke data?
Is er een standaard?
Wat wil mijn (beoogd) data-archief?
Data-archieven
beoordelen bestands-
formaten op
1) duurzaamheid
2) geschiktheid voor
hergebruik
RDMO Data opslaan & bewaren 30
RDMO Data opslaan & bewaren 31
Omzetten in ander formaat: risico’s
verlies van data of interne metadata
verlies van opmaak (bijv. bij tekstbestanden)
kwaliteitsverlies (bijv. bij grafische bestanden)
>>> bewaar originele bestand
>>> raadpleeg deskundige
RDMO Data opslaan & bewaren 32
Inventarisatie
Welke bestandsformaten worden in jouw vakgebied het
meest gebruikt?
Welke software wordt in jouw vakgebied het meest
gebruikt?
Kun je onderzoekers adviseren over de voors en tegens?
RDMO Data opslaan & bewaren 33
Selectie &vernietiging
RDMO Data opslaan & bewaren 34
Bewaren voor de lange termijn: redenen
1) Verplichting in verband met verificatie van
onderzoek, opgelegd door wet, financier, instituut of
journal
RDMO Data opslaan & bewaren 35
Bewaren voor de lange termijn: redenen
1) Verplichting (wet, financier, instituut, journal)
2) Ten behoeve van het vakgebied i.v.m. waarde (productiekosten, hergebruik, innovatie),
uniciteit (niet-herhaalbare waarnemingen) en/of
belang voor (wetenschaps)historisch onderzoek
RDMO Data opslaan & bewaren 36
Bewaren voor de lange termijn: redenen
1) Verplichting (wet, financier, instituut, journal)
2) Ten behoeve van het vakgebied
3) Voor niet-wetenschappelijke doelen (bijv. cultureel
erfgoed, musea, presentaties etc.)
RDMO Data opslaan & bewaren 37
Vernietiging: redenen
De onderzoeksdata vallen niet onder één van de
bewaarredenen, en de kosten van bewaren voor de
lange termijn zijn (te) hoog
Vernietiging van de onderzoeksdata is verplicht (bijv.
persoonsgegevens medisch onderzoek)
RDMO Data opslaan & bewaren 38
Veilige vernietiging: manieren
harde schijf: overschrijven m.b.v. software
usb-sticks, cd’s, dvd’s: fysiek vernietigen
RDMO Data opslaan & bewaren 39
Bewaren voor de lange termijn: hoe lang?
Medische data met persoonsgegevens: ten hoogste
15 jaar, tenzij geanonimiseerd
Andere data: ten minste 5 jaar (Gedragscode VSNU)
RDMO Data opslaan & bewaren 40
Bewaren voor de lange termijn: waar?
eigen harde schijf
repository: gespecialiseerd data-archief (wordt vervolgd in ‘Data delen & hergebruiken’)
De praktijk…
RDMO Data opslaan & bewaren 41
http://news.ubc.ca/2013/12/19/scientific-data-lost-at-alarming-rate/
http://www.nature.com/news/scientists-losing-data-at-a-rapid-rate-1.14416
De praktijk…
RDMO Data opslaan & bewaren 42
Edinburgh University Data Library [Data Library]. (2013, November 8). MANTRA – Jeff Haywood – RDM Legacy access and data reuse [. Retrieved from http://youtu.be/BRwcPhavElI
RDMO Data opslaan & bewaren 43
Informatiebronnen
UK Data Archive (UK Data Service), Managing and sharing data. Best practice for researchers (2011)http://ukdataservice.ac.uk/manage-data/training.aspx
DANS, DANS Preferred Formats (2013)http://www.dans.knaw.nl/content/data-archief/data-deponeren#voorkeursbestandsformaten
Tjalsma, H. en J. Rombouts, Selection of Research Data. Guidelines for appraising and selecting research data. DANS Studies in Digital Archiving 6 (Den Haag en Delft 2011)http://www.dans.knaw.nl/content/categorieen/publicaties/dans-studies-digital-archiving-6
Vereniging van Nederlandse Universiteiten (VSNU), De Nederlandse gedragscode wetenschapsbeoefening (2012)http://www.vsnu.nl/wetenschappelijke_integriteit.html
Nederlandse Federatie van Universitair Medische Centra (NFU), Kwaliteitsborging mensgebonden onderzoek 2.0 (2012)http://www.nfu.nl/img/pdf/NFU-12.6053_Kwaliteitsborging_mensgebonden_onderzoek_2.0.pdf
RDMO Data opslaan & bewaren 44
Colofon
Presentatie:
Mariëtte van Selm | [email protected]
Beeld, tenzij anders vermeld bij afbeelding:
Jørgen Stamp | http://www.digitalbevaring.dk/
M. van Selm, RDM Ondersteuning - basistraining voor informatiespecialisten, lesmateriaal sessie 3. Februari 2014.Dit werk is gelicenseerd onder de licentie Creative Commons Naamsvermelding-GelijkDelen 4.0 Internationaal