Cursus 5: digitaal archiveren en op internet publiceren Jeroen Poppe · Ontsluiting op het internet...

Post on 05-Aug-2020

2 views 0 download

Transcript of Cursus 5: digitaal archiveren en op internet publiceren Jeroen Poppe · Ontsluiting op het internet...

Cursus 5: digitaal archiveren en op internet publicerenCursus 5: digitaal archiveren en op internet publiceren

Jeroen Poppe

Turnhout 21-03-2013

2

Digitaal archiveren• Archiveren:

• Bewaren

• Terugvinden

• Leesbaarheid garanderen

• Complexiteit digitale archivering cfr. papieren archivering > actieve archivering

• Probleem van de digitale duurzaamheid– Hardware

– Software

– Formaten

– Veroudering (door voortschrijden technologie)

– Verval (uit elkaar vallen)

3

Soorten digitale erfgoed objecten

Erfgoed

objectMetadata

4

Digitaal geboren

MS Office Camera

Gedigitaliseerd

8 mm film Brief

Eigenschappen digitaal document� Losse band tussen gegevens en drager

� Dossier kan op meerdere dragers opgeslagen zijn

� Dossier kan uit meerdere bestanden bestaan

� Bestand kan uit meerdere archiefdocumenten bestaan

Noodzaak van hard- en software� Noodzaak van hard- en software� Een digitaal document is niet dadelijk raadpleegbaar

� Je bent afhankelijk van computerapparatuur en computerprogramma’s

� De bits moeten geïnterpreteerd worden tot gegevens

� Dezelfde problematiek bij geluids- en filmopnames

� Geen onderscheid tussen kopie en origineel > laat back-ups toe

5

6

Bestandsnamen

� Hoe kennen jullie bestandsnamen toe?

Waarom werd gekozen voor deze manier van werken?� Waarom werd gekozen voor deze manier van werken?

7

Bestandsnamen

Betekenisvol Betekenisloos

� Tijdrovend

� Interpretatieverschillen, fouten

� Bladeren

� Automatisch� Snel

� Uniform (voorloopnullen)

� Content- en � Eindgebruikers?

� Kleinere projecten

� Digitaal geboren archief

� Geen databank

� Vb: Dorpstraat_winter.tif

� Content- en systeemonafhankelijker

� Massabewerking

� Migratie

� Databank (invloed op bestandsnamen)

� Vb: 000458.tif

8

Bestandsnamen� Maximum 30 karakters

� Wel: a-z, 0-9, underscore (_)

� Geen spaties!

� Niet: \*/,”>?<|

� JJJJMMDD

vb: 15 maart 1984 wordt 19840315.

9

Bestandsnamen� Naam.ext

� Extensie:

3 tekens

� Voorbeelden:

� 20050216_Kermis.tif

� SchoenerBootshow1980.jpg

� PetersInterview_19960730.mp3� 3 tekens

� Bestandsformaat

� Afkortingen mijden

� PetersInterview_19960730.mp3

10

Mappen

� Scans groeperen

� Vb: boek, dossier

� Bestandsnamen uniek per map

� Snellere werkwijze

� Verkeerde map? > Weg!

� Werkproces op orde

11

Kantoordocumenten

12

Kantoordocumenten

� Tekstbestand: ODF, PDF/A

� Rekenblad: ODF, PDF/A

� Presentaties: ODF, PDF/A� Presentaties: ODF, PDF/A

� E-mail: Msg (XML, PDF/A)

13

Kantoordocumenten

Onveranderlijk

PDF/AHergebruik mogelijk

ODF

14

Raadpleegformaat

1 formaat voor alles

Bewaart onderliggende informatie

Bewaart oorspronkelijke look and feel

15

Opslagmedia� Bekende opslagmedia zijn:

� (Draagbare) harde schijven (magnetisch)

� CD-ROMs & DVD’s(optisch)(optisch)

� USB sticks

� Voor archieven zijn zogenaamde solid state opslag media (USB sticks en andere FLASH-geheugen systemen) een relatief nieuw fenomeen.

� 3 tot 4 jaar garantie

16

OpslagmediaMagnetische dragers (harde schijven)

� Regelmatige kwaliteitscontroles waarschuwen voor dreigend informatieverlies

� Controle harde schijf > Crystal Disk Info

� http://crystalmark.info/software/CrystalDiskInfo/index-e.htmlex-e.html

� Vervangen wanneer hun kwaliteit daalt (preventie).

� Een ‘rampenplan’ beschrijft hoe men best bij calamiteiten optreedt, zodat zoveel mogelijk informatie wordt gerecupereerd

� Voor elke drager wordt een veiligheids- en werkkopie gemaakt

� Verschillende exemplaren > verschillende locaties

17

Crystal Disk

Info

18

OpslagmediaMagnetische dragers

� NAS: Network-attachedstorage

� “Opslagcomputer”

� Verschillende harde � Verschillende harde schijven

� Verschillende computers op aangesloten

� RAID1 > 2 harde schijven

� RAID5 > 3 harde schijven

� Goedkoop: 300 €

� Synology, Qnap19

Opslagmedia: optische dragers� Nuttig om bij aankoop pc te zorgen

voor een ingebouwde cd/dvd-brander

� Vroeger: verschillende formaten dvd-recordables

� Nu: dual-layer, multi-formaat lezers � Nu: dual-layer, multi-formaat lezers die elk type dvd kunnen lezen

� Bewaren in juwelcase

� Levensduur: 1 jaar?

� Meer info: Referaat Eric-Jan Keulemans

� http://www.faronet.be/files/bijlagen/e-documenten/referaat_keulemans.pdf

20

� Apparatuur verdwijnt

� Niet bestand tegen:

� Zon

� Warmte

OpslagmediaBewaartips

� Warmte

� Vocht

� Etiket met duidelijke informatie (zonder drager te beschadigen)

� Om de vier jaar een kopie maken

21

OpslagmediaBewaartips

� Controlecijfers (checksum) maken?

vb.: md5summerwww.md5summer.org

22

Online backup in “the cloud”� www.box.net

� www.dropbox.com

� www.mozy.com

www.backblaze.com� www.backblaze.com

23

OpslagmediaSamenvatting

� Gebruik verschillende types drager� Kies courante opslagmedia� Voer regelmatig controles uit op de dragers en de data

aanwezig op de dragers� Voer regelmatig controles uit op de dragers en de data

aanwezig op de dragers� Maak af en toe veiligheidskopieën van data� Bewaar opslagmedia en kopieën op verschillende

plaatsen in ideale omstandigheden

24

25

Langetermijnarchivering

� Zeer moeilijk!

Contacteer dichtstbijzijnde archiefdienst� Contacteer dichtstbijzijnde archiefdienst

26

Bewaarstrategieën

• De verschillende bewaarstrategieën zijn:

1. Afdrukken1. Afdrukken

2. Technologie bewaren

3. Emulatie

4. Migratie

5. Conversie

Geïnteresseerden vinden hierover meer informatie in de rapporten van e-David:

www.edavid.be

27

Afdrukken

� Alles overgezet op een annaloog formaat, bvb. papier en microfilm

� Veel nadelen:� Verlies van digitale voordelen: plaatsbesparend, � Verlies van digitale voordelen: plaatsbesparend,

zoekmogelijkheden…� Niet alle essentiële informatie wordt afgedrukt� Sommige digitale documenten moeilijk afdrukbaar

(geluid, video, databanken, …)� Het digitale document zal altijd beschouwd

worden als origineel� Niet goedkoop

28

Technologie bewaren

� De originele hard- en software bewaren, zodat de digitale documenten in hun originele vorm raadpleegbaar blijven.

� Veel nadelen:� Veel nadelen:� Kennis en onderdelen verdwijnen� Je moet veel bijhouden: veel configuraties en

programma’s voorhanden� Verval van de dragers

� In de praktijk is het onhaalbaar een dergelijk ‘computermuseum’ in stand te houden

29

Emulatie (virtualiseren)

� Nabootsing van hard- en/of software in een nieuwe omgeving

� Moderne computers doen zich voor als oude � Moderne computers doen zich voor als oude computers

� Lijkt een veelbelovende piste, maar toch nog veel nadelen� Probleem met patenten voor beschermde software

� Voldoende kennis nodig

� Uitwisselen gegevens moeilijk

� https://www.virtualbox.org/

30

Migratie

� Omzetting van document naar een standaardformaat dat geschikt is voor bewaring op lange termijn (TIFF, PDF/A,…)bewaring op lange termijn (TIFF, PDF/A,…)

� Vandaag de meest toegepaste en betrouwbaarste strategie voor bewaring van digitale documenten

31

Conversie

� Overzettingen van het digitaal document van een lagere naar een hogere versie van het bestandsformaat

� Bvb: MS Word 97 →MS Word 2003 →MS Word � Bvb: MS Word 97 →MS Word 2003 →MS Word 2007 …

� Nadelen:� Altijd verlies van gegevens

� Gebonden aan een fabrikant

� Heel snel nieuwe versie

32

Tweevoudige strategie?� Bestanden worden gemigreerd naar een

archiefformaat als TIFF of PDF/A, maar blijven ook in hun oorspronkelijke formaat bewaard

� Veilige methode: het blijft mogelijk om in de toekomst � Veilige methode: het blijft mogelijk om in de toekomst nieuwe strategieën toe te passen op het oorspronkelijke document, maar (als dat bijvoorbeeld geen goede resultaten oplevert) de informatie blijft nog te raadplegen in een gestandaardiseerd formaat

33

Samengevat

“There is no easy way to insure your digital files will last.”

(Library of Congress)

34

35

Digitaal archief structureren� Digitale documenten moeten snel opspoorbaar zijn

� Noodzaak van een logische en overzichtelijke structuur

� Heel vaak niet geval, bvb. alles onder ‘Mijn � Heel vaak niet geval, bvb. alles onder ‘Mijn documenten’ bewaard, onduidelijke bestands- en mapnamen,…

� In feite dezelfde problematiek als bij papieren documenten

36

Mappenstructuur� Gebruik een boomstructuur voor de mappen die de

werking van de archiefvormer weerspiegelt

� Zie het archiefschema van een papieren archief

� Maak een overzicht van de digitale mappenstructuur� Maak een overzicht van de digitale mappenstructuur

� Druk deze af, de gebruiker kan die gebruiken als inventaris

� Voeg dit overzicht van de mappenstructuur bij de digitale drager

37

MappenstructuurEen voorbeeld

OverlegRaad van BestuurAlgemene vergadering

BoekhoudingJaarrekeningInkomstenInkomstenUitgaven

ProjectenTentoonstellingenOpendeurdag

Opendeurdag 2010OntwerpAffiche_20100510.pdfNOBrochure_WV_20100511.doc

Voorbeeld: http://194.78.136.105/AMVB/docs/21_ordeningsplan.pdfAMVB & BBOT

38

Samenvatting archiveren� Bestanden migreren naar geschikte standaarden

� Op geschikte dragers opslaan

� Een duidelijke mappenstructuur voorzien

Eenvormige en heldere bestandsnamen gebruiken� Eenvormige en heldere bestandsnamen gebruiken

� Regelmatige controle

� Dragers na 4 jaar vervangen

39

Archiveren� Personal archiving

� http://www.digitalpreservation.gov/personalarchiving/

eDAVID� eDAVID

� http://www.edavid.be/

� FARO

� http://www.faronet.be/vrije-tags/digitaal-archiveren

40

Registratie

• Registreren: informatie vastleggen over document/boek/object

• Excel, Access

• Denk op voorhand na over wat en hoe je wil beschrijven, zeker • Denk op voorhand na over wat en hoe je wil beschrijven, zeker als dit door verschillende medewerkers wordt gedaan. Duidelijke afspraken vastleggen!

• Verzamel voldoende informatie over je collectie (inhoudelijk + technisch)

• Uniek identificatienummer voor elke digitale kopie• Bijv. hkvl210001.tif

42

Registratie

• Archivering van de context

• Context is heel belangrijk om de inhoud van een archiefstuk volledig te kunnen vatten

• Wat was de functie? Wie creëerde het document? In welk dossier • Wat was de functie? Wie creëerde het document? In welk dossier hoort het?

43

Dublin Core� Basisstandaard voor registraties

� Dublin Core Metadata Element Set

ISO 15836� ISO 15836

� Generiek (Resource): archiefstuk, boek, object

� Uitwisselbaar (XML, HTML)

� http://dublincore.org/

Dublin Core� 15 velden

� Herhaling zelfde veld toegelaten

� Uniek kenmerk > verbinden met digitaal object

� Bepalen welke velden verplicht zijn

� Uniek kenmerk

� Titel

Dublin Core vertaling (DEN)� Auteur/maker

� Onderwerp/trefwoord

� Omschrijving

Uitgever

� Bestandstype (vb: brief, boek,…)

� Bestandsformaat (vb: TIFF, A4)

� Bestandsidentificatie (Uniek)

Bron (vb: dossier)� Uitgever

� Andere medewerkers

� Datum

� Titel

� Bron (vb: dossier)

� Taal

� Relatie

� Dekking (periode, grondgebied)

� Rechten (vb: CC-licentie)

Dublin Core� Beschrijvingsregels:

� Eén-op-één-principe: beschrijft een object, niet wat het object voorstelt

� Meermaals zelfde veld

� Uitbreiding ≠ Specifiëring

Passende waarde invullen > doelgroep� Passende waarde invullen > doelgroep

� http://dublincore.org/documents/usageguide/

48

Ontsluiting op het internet

� Je hebt objecten gedigitaliseerd en/of digitaal beschreven. Maar vervolgens wil je ze ook op het web publiceren. En misschien wil je je data ook wel toegankelijk maken voor aggregatoren of ‘harvesters’, zodat je collectie in andere omgevingen vindbaar worden? vindbaar worden?

� Je kan zelf je collectie online brengen, met je eigen software en domeinnaam. Maar overweeg ook om aan te sluiten bij een bestaand netwerk.

Voorbeeld: Effectmeting ‘Nationaal Archief joins Wikipedia’ (NL):

“Uit dit onderzoek blijkt dat gedigitaliseerd cultureel erfgoed dat beschikbaar gesteld wordt aan Wikipedia aantoonbaar veel vaker bekeken wordt. De beschikbaar gestelde collectie is in 4 maanden meer dan 2 miljoen keer bekeken op Wikipedia, in tegenstelling tot enkele honderden bezoeken aan de selectie op de beeldbank van het Nationaal archief zelf.”

www.beeldenvoordetoekomst.nl

49

Ontsluiting op het internet� Publiceer je gegevens op het web

� http://www.projectcest.be/index.php/Website

Minimale eisen:Zorg ervoor dat je website met de gebruikelijke webstandaarden is ontwikkeld. Publiceer de inhoud van webpagina's in HTML of XML, in combinatie met CSS of XHTMLPubliceer de inhoud van webpagina's in HTML of XML, in combinatie met CSS of XHTMLZorg ervoor dat de website aan de toegankelijkheidseisen beantwoordt. Internationale standaard is WAI WCAG 1.0 A. Een alternatief is

het AnySurfer-label

AanbevelingVermijd een site volledig in Flash op te bouwen Hou rekening met de introductie van HTML 5

� Gebruik een open datastructuur: http://www.den.nl/pagina/334/den-lab/

� Verzeker de vindbaarheid

50

Ontsluiting op het internetVoorbeeld: een oud tijdschrift

� Online aanbieden als pdf-document

� Bijvoorbeeld via www.issuu.com

51

Ontsluiting op het internetVoorbeeld: een handschrift

� http://www.historischebronnenbrugge.be/

52

Ontsluiting op het internetVoorbeeld: Itinera Nova

53

Ontsluiting op het internetVoorbeeld: Itinera Nova

Binnen het kader van het project Itinera Nova zullen alle ca. 950.000 bladzijden van de registers van de Leuvense schepenbank ingescand worden, en dit op een termijn van tien jaar. De digitale beelden worden worden, en dit op een termijn van tien jaar. De digitale beelden worden ter beschikking gesteld op de projectwebsite itineranova.be. De akten, van verkoop tot erfenis, van burenruzie tot schuldbekentenis, worden voorzien van een index en een volledige transcriptie. Een netwerk van vrijwilligers zal wiki-gewijs helpen bij de ontsluiting van deze rijke bron door mee te transcriberen.

54

CrowdsourcingVoorbeeld: oldweather.org

55

Crowdsourcing� http://youtu.be/JHQyfev

-zaM

56

Een beeldbank opzetten?� Beeldbank vs. erfgoedbank?

� Beeldbanken = verzameling (gedigitaliseerde) afbeeldingen, opgeslagen in databank en ter beschikking gesteld op een websitebeschikking gesteld op een website

� Erfgoedbanken = combinatie van media (beeld, tekst, geluid…)

57

Een beeldbank opzetten?� Onderwerp

� www.hetvirtueleland.be

� www.rubensonline.be

� Geografisch� Geografisch� www.beeldbankbrugge.be

� www.ganshoren-ingezoomd.be

� Collecties� www.vlaamsekunstcollectie.be

� …

58

Erfgoedplus.be

Limburg & Vlaams-Brabant

Verschillende erfgoedorganisaties (musea, bewaarbibliotheken, verenigingen, kerkfabrieken, bewaarbibliotheken, verenigingen, kerkfabrieken, heemkundige kringen, ...) werken mee en leveren gegevens en beeldmateriaal over hun collectiestukken aan.

Erfgoedplus.be verzamelt al deze beschrijvingen in een databank, legt linken en verbanden tussen alle gegevens, en maakt deze gegevens doorzoekbaar op de website http://www.erfgoedplus.be/.

59

Zelf doen?

� Op middellange termijn komen er wellicht een aantal nieuwe mogelijkheden, die professioneel zijn maar toch betaalbaar

� Vb.: CollectiveAccess – www.collectiveaccess.org� Vb.: CollectiveAccess – www.collectiveaccess.org

60

Zelf doen?

� Op middellange termijn komen er wellicht een aantal nieuwe mogelijkheden, die professioneel zijn maar toch betaalbaarzijn maar toch betaalbaar

� Vb.: Omeka – www.omeka.org

61

Toch geen budget?Voorbeeld: www.erf-goed.be

62

Toch geen budget?Voorbeeld: Picasa

63

Toch geen budget?Voorbeeld: Flickr

64

65

Auteursrecht� http://www.youtube.co

m/watch?v=dUH8yD37YR4&feature=share&list=UUbro4WrCA6n6e1KNUUUbro4WrCA6n6e1KNUbE3EaQ

66

Auteursrecht� Ieder origineel werk is in principe beschermd door

het auteursrecht

� Van kracht tot 70 jaar na de dood van de auteur� Van kracht tot 70 jaar na de dood van de auteur

� Na 70 jaar: publiek domein

� Opsporen van rechthebbenden is echter vaak zeer arbeidsintensief

� Probleem: ‘orphan works’ / verweesde werken

67

Auteursrecht

� Auteur bekend?� Vraag toestemming aan auteur of rechthebbende (= meestal

erfgenamen)erfgenamen)

� Stel een contract of overeenkomst op

� Auteur onbekend?� Voorzie het materiaal van een disclaimer

� Pas op met recent materiaal

68

Auteursrecht� Verweesd werk

� Disclaimer (Archipelproject)

“ Wij hebben de nodige inspanningen gedaan om de “ Wij hebben de nodige inspanningen gedaan om de rechthebbenden van dit document te vinden, maar zijn hier helaas niet altijd in geslaagd. Bent u de rechthebbende of kent u deze persoon, neem dan zeker contact met ons op.”

69

AuteursrechtVoorbeeld: Beeldbank Lier

70

AuteursrechtVoorbeeld: Beeldbank Oostende

71

Auteursrecht: Creative commons

72

http://creativecommons.org/licenses/?lang=nl

AuteursrechtEen interessante publicatie

Auteursrecht en erfgoedAuteursrecht en erfgoed

Handleiding tot het vermijden van uitschuivers

(2004)http://www.faronet.be/e-documenten/auteursrecht-en-erfgoed

http://www.faronet.be/e-documenten/publicaties-archipel

https://projects.ibbt.be/bom-vl/ > Deliverables

73

Portretrecht

� Altijd toestemming nodig van de geportretteerde

� Die zijn toestemming altijd kan herroepen

� Tot 20 jaar na de dood

� Met een bepaald doel > geen toestemming voor een ander doel

74

Andere juridische problemen?In Nederland ontstond recent discussie over

het opnemen van dagbladen met een nationaal-socialistische signatuur in het online Historisch Krantenarchief van de Koninklijke Bibliotheek. Het ministerie van Justitie bracht een negatief advies uit over het op Internet ter beschikking stellen van de kranten, omdat het niet kan garanderen de kranten, omdat het niet kan garanderen dat het Openbaar Ministerie niet tot vervolging zou overgaan wegens het 'vermenigvuldigen van strafbare uitingen'. Met andere woorden: het digitaal ontsluiten van oorspronkelijk materiaal uit de oorlogsjaren zou kunnen leiden tot een aanklacht voor verspreiden van haatdragende teksten.

Sinds kort zijn de kranten toch online op http://kranten.kb.nl

75

Meer informatie vinden� www.heemkunde-vlaanderen.be Cursussen en advies

� www.projectcest.be Alles over digitaal erfgoed

� www.packed.be De organisatie achter CEST� www.packed.be De organisatie achter CEST

� www.edavid.be Digitaal archiveren/documentbeheer

� www.amvb.be Digitaal archiveren/documentbeheer op maat van kleine organisaties (project DIGIgids)

� www.den.nl Alles over digitaal erfgoed

77