Cursus 5: digitaal archiveren en op internet publiceren Jeroen Poppe · Ontsluiting op het internet...
Transcript of Cursus 5: digitaal archiveren en op internet publiceren Jeroen Poppe · Ontsluiting op het internet...
Cursus 5: digitaal archiveren en op internet publicerenCursus 5: digitaal archiveren en op internet publiceren
Jeroen Poppe
Turnhout 21-03-2013
2
Digitaal archiveren• Archiveren:
• Bewaren
• Terugvinden
• Leesbaarheid garanderen
• Complexiteit digitale archivering cfr. papieren archivering > actieve archivering
• Probleem van de digitale duurzaamheid– Hardware
– Software
– Formaten
– Veroudering (door voortschrijden technologie)
– Verval (uit elkaar vallen)
3
Soorten digitale erfgoed objecten
Erfgoed
objectMetadata
4
Digitaal geboren
MS Office Camera
Gedigitaliseerd
8 mm film Brief
Eigenschappen digitaal document� Losse band tussen gegevens en drager
� Dossier kan op meerdere dragers opgeslagen zijn
� Dossier kan uit meerdere bestanden bestaan
� Bestand kan uit meerdere archiefdocumenten bestaan
Noodzaak van hard- en software� Noodzaak van hard- en software� Een digitaal document is niet dadelijk raadpleegbaar
� Je bent afhankelijk van computerapparatuur en computerprogramma’s
� De bits moeten geïnterpreteerd worden tot gegevens
� Dezelfde problematiek bij geluids- en filmopnames
� Geen onderscheid tussen kopie en origineel > laat back-ups toe
5
6
Bestandsnamen
� Hoe kennen jullie bestandsnamen toe?
Waarom werd gekozen voor deze manier van werken?� Waarom werd gekozen voor deze manier van werken?
7
Bestandsnamen
Betekenisvol Betekenisloos
� Tijdrovend
� Interpretatieverschillen, fouten
� Bladeren
� Automatisch� Snel
� Uniform (voorloopnullen)
� Content- en � Eindgebruikers?
� Kleinere projecten
� Digitaal geboren archief
� Geen databank
� Vb: Dorpstraat_winter.tif
� Content- en systeemonafhankelijker
� Massabewerking
� Migratie
� Databank (invloed op bestandsnamen)
� Vb: 000458.tif
8
Bestandsnamen� Maximum 30 karakters
� Wel: a-z, 0-9, underscore (_)
� Geen spaties!
� Niet: \*/,”>?<|
� JJJJMMDD
vb: 15 maart 1984 wordt 19840315.
9
Bestandsnamen� Naam.ext
� Extensie:
3 tekens
� Voorbeelden:
� 20050216_Kermis.tif
� SchoenerBootshow1980.jpg
� PetersInterview_19960730.mp3� 3 tekens
� Bestandsformaat
� Afkortingen mijden
� PetersInterview_19960730.mp3
10
Mappen
� Scans groeperen
� Vb: boek, dossier
� Bestandsnamen uniek per map
� Snellere werkwijze
� Verkeerde map? > Weg!
� Werkproces op orde
11
Kantoordocumenten
12
Kantoordocumenten
� Tekstbestand: ODF, PDF/A
� Rekenblad: ODF, PDF/A
� Presentaties: ODF, PDF/A� Presentaties: ODF, PDF/A
� E-mail: Msg (XML, PDF/A)
13
Kantoordocumenten
Onveranderlijk
PDF/AHergebruik mogelijk
ODF
14
Raadpleegformaat
1 formaat voor alles
Bewaart onderliggende informatie
Bewaart oorspronkelijke look and feel
15
Opslagmedia� Bekende opslagmedia zijn:
� (Draagbare) harde schijven (magnetisch)
� CD-ROMs & DVD’s(optisch)(optisch)
� USB sticks
� Voor archieven zijn zogenaamde solid state opslag media (USB sticks en andere FLASH-geheugen systemen) een relatief nieuw fenomeen.
� 3 tot 4 jaar garantie
16
OpslagmediaMagnetische dragers (harde schijven)
� Regelmatige kwaliteitscontroles waarschuwen voor dreigend informatieverlies
� Controle harde schijf > Crystal Disk Info
� http://crystalmark.info/software/CrystalDiskInfo/index-e.htmlex-e.html
� Vervangen wanneer hun kwaliteit daalt (preventie).
� Een ‘rampenplan’ beschrijft hoe men best bij calamiteiten optreedt, zodat zoveel mogelijk informatie wordt gerecupereerd
� Voor elke drager wordt een veiligheids- en werkkopie gemaakt
� Verschillende exemplaren > verschillende locaties
17
Crystal Disk
Info
18
OpslagmediaMagnetische dragers
� NAS: Network-attachedstorage
� “Opslagcomputer”
� Verschillende harde � Verschillende harde schijven
� Verschillende computers op aangesloten
� RAID1 > 2 harde schijven
� RAID5 > 3 harde schijven
� Goedkoop: 300 €
� Synology, Qnap19
Opslagmedia: optische dragers� Nuttig om bij aankoop pc te zorgen
voor een ingebouwde cd/dvd-brander
� Vroeger: verschillende formaten dvd-recordables
� Nu: dual-layer, multi-formaat lezers � Nu: dual-layer, multi-formaat lezers die elk type dvd kunnen lezen
� Bewaren in juwelcase
� Levensduur: 1 jaar?
� Meer info: Referaat Eric-Jan Keulemans
� http://www.faronet.be/files/bijlagen/e-documenten/referaat_keulemans.pdf
20
� Apparatuur verdwijnt
� Niet bestand tegen:
� Zon
� Warmte
OpslagmediaBewaartips
� Warmte
� Vocht
� Etiket met duidelijke informatie (zonder drager te beschadigen)
� Om de vier jaar een kopie maken
21
OpslagmediaBewaartips
� Controlecijfers (checksum) maken?
vb.: md5summerwww.md5summer.org
22
Online backup in “the cloud”� www.box.net
� www.dropbox.com
� www.mozy.com
www.backblaze.com� www.backblaze.com
23
OpslagmediaSamenvatting
� Gebruik verschillende types drager� Kies courante opslagmedia� Voer regelmatig controles uit op de dragers en de data
aanwezig op de dragers� Voer regelmatig controles uit op de dragers en de data
aanwezig op de dragers� Maak af en toe veiligheidskopieën van data� Bewaar opslagmedia en kopieën op verschillende
plaatsen in ideale omstandigheden
24
25
Langetermijnarchivering
� Zeer moeilijk!
Contacteer dichtstbijzijnde archiefdienst� Contacteer dichtstbijzijnde archiefdienst
26
Bewaarstrategieën
• De verschillende bewaarstrategieën zijn:
1. Afdrukken1. Afdrukken
2. Technologie bewaren
3. Emulatie
4. Migratie
5. Conversie
Geïnteresseerden vinden hierover meer informatie in de rapporten van e-David:
www.edavid.be
27
Afdrukken
� Alles overgezet op een annaloog formaat, bvb. papier en microfilm
� Veel nadelen:� Verlies van digitale voordelen: plaatsbesparend, � Verlies van digitale voordelen: plaatsbesparend,
zoekmogelijkheden…� Niet alle essentiële informatie wordt afgedrukt� Sommige digitale documenten moeilijk afdrukbaar
(geluid, video, databanken, …)� Het digitale document zal altijd beschouwd
worden als origineel� Niet goedkoop
28
Technologie bewaren
� De originele hard- en software bewaren, zodat de digitale documenten in hun originele vorm raadpleegbaar blijven.
� Veel nadelen:� Veel nadelen:� Kennis en onderdelen verdwijnen� Je moet veel bijhouden: veel configuraties en
programma’s voorhanden� Verval van de dragers
� In de praktijk is het onhaalbaar een dergelijk ‘computermuseum’ in stand te houden
29
Emulatie (virtualiseren)
� Nabootsing van hard- en/of software in een nieuwe omgeving
� Moderne computers doen zich voor als oude � Moderne computers doen zich voor als oude computers
� Lijkt een veelbelovende piste, maar toch nog veel nadelen� Probleem met patenten voor beschermde software
� Voldoende kennis nodig
� Uitwisselen gegevens moeilijk
� https://www.virtualbox.org/
30
Migratie
� Omzetting van document naar een standaardformaat dat geschikt is voor bewaring op lange termijn (TIFF, PDF/A,…)bewaring op lange termijn (TIFF, PDF/A,…)
� Vandaag de meest toegepaste en betrouwbaarste strategie voor bewaring van digitale documenten
31
Conversie
� Overzettingen van het digitaal document van een lagere naar een hogere versie van het bestandsformaat
� Bvb: MS Word 97 →MS Word 2003 →MS Word � Bvb: MS Word 97 →MS Word 2003 →MS Word 2007 …
� Nadelen:� Altijd verlies van gegevens
� Gebonden aan een fabrikant
� Heel snel nieuwe versie
32
Tweevoudige strategie?� Bestanden worden gemigreerd naar een
archiefformaat als TIFF of PDF/A, maar blijven ook in hun oorspronkelijke formaat bewaard
� Veilige methode: het blijft mogelijk om in de toekomst � Veilige methode: het blijft mogelijk om in de toekomst nieuwe strategieën toe te passen op het oorspronkelijke document, maar (als dat bijvoorbeeld geen goede resultaten oplevert) de informatie blijft nog te raadplegen in een gestandaardiseerd formaat
33
Samengevat
“There is no easy way to insure your digital files will last.”
(Library of Congress)
34
35
Digitaal archief structureren� Digitale documenten moeten snel opspoorbaar zijn
� Noodzaak van een logische en overzichtelijke structuur
� Heel vaak niet geval, bvb. alles onder ‘Mijn � Heel vaak niet geval, bvb. alles onder ‘Mijn documenten’ bewaard, onduidelijke bestands- en mapnamen,…
� In feite dezelfde problematiek als bij papieren documenten
36
Mappenstructuur� Gebruik een boomstructuur voor de mappen die de
werking van de archiefvormer weerspiegelt
� Zie het archiefschema van een papieren archief
� Maak een overzicht van de digitale mappenstructuur� Maak een overzicht van de digitale mappenstructuur
� Druk deze af, de gebruiker kan die gebruiken als inventaris
� Voeg dit overzicht van de mappenstructuur bij de digitale drager
37
MappenstructuurEen voorbeeld
OverlegRaad van BestuurAlgemene vergadering
BoekhoudingJaarrekeningInkomstenInkomstenUitgaven
ProjectenTentoonstellingenOpendeurdag
Opendeurdag 2010OntwerpAffiche_20100510.pdfNOBrochure_WV_20100511.doc
Voorbeeld: http://194.78.136.105/AMVB/docs/21_ordeningsplan.pdfAMVB & BBOT
38
Samenvatting archiveren� Bestanden migreren naar geschikte standaarden
� Op geschikte dragers opslaan
� Een duidelijke mappenstructuur voorzien
Eenvormige en heldere bestandsnamen gebruiken� Eenvormige en heldere bestandsnamen gebruiken
� Regelmatige controle
� Dragers na 4 jaar vervangen
39
Archiveren� Personal archiving
� http://www.digitalpreservation.gov/personalarchiving/
eDAVID� eDAVID
� http://www.edavid.be/
� FARO
� http://www.faronet.be/vrije-tags/digitaal-archiveren
40
Registratie
• Registreren: informatie vastleggen over document/boek/object
• Excel, Access
• Denk op voorhand na over wat en hoe je wil beschrijven, zeker • Denk op voorhand na over wat en hoe je wil beschrijven, zeker als dit door verschillende medewerkers wordt gedaan. Duidelijke afspraken vastleggen!
• Verzamel voldoende informatie over je collectie (inhoudelijk + technisch)
• Uniek identificatienummer voor elke digitale kopie• Bijv. hkvl210001.tif
42
Registratie
• Archivering van de context
• Context is heel belangrijk om de inhoud van een archiefstuk volledig te kunnen vatten
• Wat was de functie? Wie creëerde het document? In welk dossier • Wat was de functie? Wie creëerde het document? In welk dossier hoort het?
43
Dublin Core� Basisstandaard voor registraties
� Dublin Core Metadata Element Set
ISO 15836� ISO 15836
� Generiek (Resource): archiefstuk, boek, object
� Uitwisselbaar (XML, HTML)
� http://dublincore.org/
Dublin Core� 15 velden
� Herhaling zelfde veld toegelaten
� Uniek kenmerk > verbinden met digitaal object
� Bepalen welke velden verplicht zijn
� Uniek kenmerk
� Titel
Dublin Core vertaling (DEN)� Auteur/maker
� Onderwerp/trefwoord
� Omschrijving
Uitgever
� Bestandstype (vb: brief, boek,…)
� Bestandsformaat (vb: TIFF, A4)
� Bestandsidentificatie (Uniek)
Bron (vb: dossier)� Uitgever
� Andere medewerkers
� Datum
� Titel
� Bron (vb: dossier)
� Taal
� Relatie
� Dekking (periode, grondgebied)
� Rechten (vb: CC-licentie)
Dublin Core� Beschrijvingsregels:
� Eén-op-één-principe: beschrijft een object, niet wat het object voorstelt
� Meermaals zelfde veld
� Uitbreiding ≠ Specifiëring
Passende waarde invullen > doelgroep� Passende waarde invullen > doelgroep
� http://dublincore.org/documents/usageguide/
48
Ontsluiting op het internet
� Je hebt objecten gedigitaliseerd en/of digitaal beschreven. Maar vervolgens wil je ze ook op het web publiceren. En misschien wil je je data ook wel toegankelijk maken voor aggregatoren of ‘harvesters’, zodat je collectie in andere omgevingen vindbaar worden? vindbaar worden?
� Je kan zelf je collectie online brengen, met je eigen software en domeinnaam. Maar overweeg ook om aan te sluiten bij een bestaand netwerk.
Voorbeeld: Effectmeting ‘Nationaal Archief joins Wikipedia’ (NL):
“Uit dit onderzoek blijkt dat gedigitaliseerd cultureel erfgoed dat beschikbaar gesteld wordt aan Wikipedia aantoonbaar veel vaker bekeken wordt. De beschikbaar gestelde collectie is in 4 maanden meer dan 2 miljoen keer bekeken op Wikipedia, in tegenstelling tot enkele honderden bezoeken aan de selectie op de beeldbank van het Nationaal archief zelf.”
www.beeldenvoordetoekomst.nl
49
Ontsluiting op het internet� Publiceer je gegevens op het web
� http://www.projectcest.be/index.php/Website
Minimale eisen:Zorg ervoor dat je website met de gebruikelijke webstandaarden is ontwikkeld. Publiceer de inhoud van webpagina's in HTML of XML, in combinatie met CSS of XHTMLPubliceer de inhoud van webpagina's in HTML of XML, in combinatie met CSS of XHTMLZorg ervoor dat de website aan de toegankelijkheidseisen beantwoordt. Internationale standaard is WAI WCAG 1.0 A. Een alternatief is
het AnySurfer-label
AanbevelingVermijd een site volledig in Flash op te bouwen Hou rekening met de introductie van HTML 5
� Gebruik een open datastructuur: http://www.den.nl/pagina/334/den-lab/
� Verzeker de vindbaarheid
50
Ontsluiting op het internetVoorbeeld: een oud tijdschrift
� Online aanbieden als pdf-document
� Bijvoorbeeld via www.issuu.com
51
Ontsluiting op het internetVoorbeeld: een handschrift
� http://www.historischebronnenbrugge.be/
52
Ontsluiting op het internetVoorbeeld: Itinera Nova
53
Ontsluiting op het internetVoorbeeld: Itinera Nova
Binnen het kader van het project Itinera Nova zullen alle ca. 950.000 bladzijden van de registers van de Leuvense schepenbank ingescand worden, en dit op een termijn van tien jaar. De digitale beelden worden worden, en dit op een termijn van tien jaar. De digitale beelden worden ter beschikking gesteld op de projectwebsite itineranova.be. De akten, van verkoop tot erfenis, van burenruzie tot schuldbekentenis, worden voorzien van een index en een volledige transcriptie. Een netwerk van vrijwilligers zal wiki-gewijs helpen bij de ontsluiting van deze rijke bron door mee te transcriberen.
54
CrowdsourcingVoorbeeld: oldweather.org
55
Crowdsourcing� http://youtu.be/JHQyfev
-zaM
56
Een beeldbank opzetten?� Beeldbank vs. erfgoedbank?
� Beeldbanken = verzameling (gedigitaliseerde) afbeeldingen, opgeslagen in databank en ter beschikking gesteld op een websitebeschikking gesteld op een website
� Erfgoedbanken = combinatie van media (beeld, tekst, geluid…)
57
Een beeldbank opzetten?� Onderwerp
� www.hetvirtueleland.be
� www.rubensonline.be
� Geografisch� Geografisch� www.beeldbankbrugge.be
� www.ganshoren-ingezoomd.be
� Collecties� www.vlaamsekunstcollectie.be
� …
58
Erfgoedplus.be
Limburg & Vlaams-Brabant
Verschillende erfgoedorganisaties (musea, bewaarbibliotheken, verenigingen, kerkfabrieken, bewaarbibliotheken, verenigingen, kerkfabrieken, heemkundige kringen, ...) werken mee en leveren gegevens en beeldmateriaal over hun collectiestukken aan.
Erfgoedplus.be verzamelt al deze beschrijvingen in een databank, legt linken en verbanden tussen alle gegevens, en maakt deze gegevens doorzoekbaar op de website http://www.erfgoedplus.be/.
59
Zelf doen?
� Op middellange termijn komen er wellicht een aantal nieuwe mogelijkheden, die professioneel zijn maar toch betaalbaar
� Vb.: CollectiveAccess – www.collectiveaccess.org� Vb.: CollectiveAccess – www.collectiveaccess.org
60
Zelf doen?
� Op middellange termijn komen er wellicht een aantal nieuwe mogelijkheden, die professioneel zijn maar toch betaalbaarzijn maar toch betaalbaar
� Vb.: Omeka – www.omeka.org
61
Toch geen budget?Voorbeeld: www.erf-goed.be
62
Toch geen budget?Voorbeeld: Picasa
63
Toch geen budget?Voorbeeld: Flickr
64
65
Auteursrecht� http://www.youtube.co
m/watch?v=dUH8yD37YR4&feature=share&list=UUbro4WrCA6n6e1KNUUUbro4WrCA6n6e1KNUbE3EaQ
66
Auteursrecht� Ieder origineel werk is in principe beschermd door
het auteursrecht
� Van kracht tot 70 jaar na de dood van de auteur� Van kracht tot 70 jaar na de dood van de auteur
� Na 70 jaar: publiek domein
� Opsporen van rechthebbenden is echter vaak zeer arbeidsintensief
� Probleem: ‘orphan works’ / verweesde werken
67
Auteursrecht
� Auteur bekend?� Vraag toestemming aan auteur of rechthebbende (= meestal
erfgenamen)erfgenamen)
� Stel een contract of overeenkomst op
� Auteur onbekend?� Voorzie het materiaal van een disclaimer
� Pas op met recent materiaal
68
Auteursrecht� Verweesd werk
� Disclaimer (Archipelproject)
“ Wij hebben de nodige inspanningen gedaan om de “ Wij hebben de nodige inspanningen gedaan om de rechthebbenden van dit document te vinden, maar zijn hier helaas niet altijd in geslaagd. Bent u de rechthebbende of kent u deze persoon, neem dan zeker contact met ons op.”
69
AuteursrechtVoorbeeld: Beeldbank Lier
70
AuteursrechtVoorbeeld: Beeldbank Oostende
71
Auteursrecht: Creative commons
72
http://creativecommons.org/licenses/?lang=nl
AuteursrechtEen interessante publicatie
Auteursrecht en erfgoedAuteursrecht en erfgoed
Handleiding tot het vermijden van uitschuivers
(2004)http://www.faronet.be/e-documenten/auteursrecht-en-erfgoed
http://www.faronet.be/e-documenten/publicaties-archipel
https://projects.ibbt.be/bom-vl/ > Deliverables
73
Portretrecht
� Altijd toestemming nodig van de geportretteerde
� Die zijn toestemming altijd kan herroepen
� Tot 20 jaar na de dood
� Met een bepaald doel > geen toestemming voor een ander doel
74
Andere juridische problemen?In Nederland ontstond recent discussie over
het opnemen van dagbladen met een nationaal-socialistische signatuur in het online Historisch Krantenarchief van de Koninklijke Bibliotheek. Het ministerie van Justitie bracht een negatief advies uit over het op Internet ter beschikking stellen van de kranten, omdat het niet kan garanderen de kranten, omdat het niet kan garanderen dat het Openbaar Ministerie niet tot vervolging zou overgaan wegens het 'vermenigvuldigen van strafbare uitingen'. Met andere woorden: het digitaal ontsluiten van oorspronkelijk materiaal uit de oorlogsjaren zou kunnen leiden tot een aanklacht voor verspreiden van haatdragende teksten.
Sinds kort zijn de kranten toch online op http://kranten.kb.nl
75
Meer informatie vinden� www.heemkunde-vlaanderen.be Cursussen en advies
� www.projectcest.be Alles over digitaal erfgoed
� www.packed.be De organisatie achter CEST� www.packed.be De organisatie achter CEST
� www.edavid.be Digitaal archiveren/documentbeheer
� www.amvb.be Digitaal archiveren/documentbeheer op maat van kleine organisaties (project DIGIgids)
� www.den.nl Alles over digitaal erfgoed
77