Duurzaam digitaliseren: principes en strategieën

65

Transcript of Duurzaam digitaliseren: principes en strategieën

DUURZAAM

DIGITALISEREN:

PRINCIPES &

STRATEGIEEN

Rony Vissers & Bert Lemmens | PACKED vzw

6 mei 2015 | Heemkunde Vlaanderen

PACKED VZW

● 2006 – 2010: platform voor archivering en conservering

van kunst op elektronische en digitale dragers

● 2011 – heden: expertisecentrum digitaal erfgoed ● expertise m.b.t. digitaal erfgoed opbouwen, hertalen en ter beschikking

stellen

● ICT-processen: creatie, catalogisering, opslag, online toegankelijk maken,

uitwisseling

● ook beleid: in organisatie, en bij overheden

● brede cultureel-erfgoedveld

● sinds 2013 ook terug kunstensector

● projecten, maar ook loketfunctie

● 9 medewerkers, structurele subsidie: 274.396 euro

PACKED VZW

www.packed.be

www.projectcest.be

www.scart.be

www.projectracks.be

www.scoremodel.org

PACKED VZW

PACKED VZW

AGENDA

● digitale duurzaamheid

● bedreigingen

● principes

● strategieen

● knelpunten

I. DIGITALE DUURZAAMHEID

Digitale duurzaamheid refereert aan de langdurige toegankelijkheid van

digitale data. Dit vereist zowel beleidsmatige beslissingen in de vorm

van een duurzaamheidsstrategie, als praktische oplossingen voor

behoud en beheer van digitale data.

01000100 01101001 01100111 01101001 01110100 01100001 01101100 01100101 00100000 01100100 01110101 01110101 01110010 01111010 01100001

01100001 01101101 01101000 01100101 01101001 01100100 00100000 01110010 01100101 01100110 01100101 01110010 01100101 01100101 01110010

01110100 00100000 01100001 01100001 01101110 00100000 01100100 01100101 00100000 01101100 01100001 01101110 01100111 01100100 01110101

01110010 01101001 01100111 01100101 00100000 01110100 01101111 01100101 01100111 01100001 01101110 01101011 01100101 01101100 01101001

01101010 01101011 01101000 01100101 01101001 01100100 00100000 01110110 01100001 01101110 00100000 01100100 01101001 01100111 01101001

01110100 01100001 01101100 01100101 00100000 01100100 01100001 01110100 01100001 00101110 00100000 01000100 01101001 01110100 00100000

01110110 01100101 01110010 01100101 01101001 01110011 01110100 00100000 01111010 01101111 01110111 01100101 01101100 00100000 01100010

01100101 01101100 01100101 01101001 01100100 01110011 01101101 01100001 01110100 01101001 01100111 01100101 00100000 01100010 01100101

01110011 01101100 01101001 01110011 01110011 01101001 01101110 01100111 01100101 01101110 00100000 01101001 01101110 00100000 01100100

01100101 00100000 01110110 01101111 01110010 01101101 00100000 01110110 01100001 01101110 00100000 01100101 01100101 01101110 00100000

01100100 01110101 01110101 01110010 01111010 01100001 01100001 01101101 01101000 01100101 01101001 01100100 01110011 01110011 01110100

01110010 01100001 01110100 01100101 01100111 01101001 01100101 00101100 00100000 01100001 01101100 01110011 00100000 01110000 01110010

01100001 01101011 01110100 01101001 01110011 01100011 01101000 01100101 00100000 01101111 01110000 01101100 01101111 01110011 01110011

01101001 01101110 01100111 01100101 01101110 00100000 01110110 01101111 01101111 01110010 00100000 01100010 01100101 01101000 01101111

01110101 01100100 00100000 01100101 01101110 00100000 01100010 01100101 01101000 01100101 01100101 01110010 00100000 01110110 01100001

01101110 00100000 01100100 01101001 01100111 01101001 01110100 01100001 01101100 01100101 00100000 01100100 01100001 01110100 01100001

00101110 11000010 10100000 00001101 00001010

digitaliseren (overg.;

digitaliseerde, h. gedigita-

liseerd) in een digitale

code overbrengen

TEKST

w:1px

w:2px w:5px w:10px w:20px w:50px w:100px

w:40px

w:1085px

beeldgrootte: l (px) x w (px) resolutie: r (px/inch) BEELD

24-bit RGB

(256x256x256= 16,7 milj. kleuren) RED GREEN BLUE

000000000000000000000000

000000000000000000000001

000000000000000000000010

111111111111111111111111

1-bit (2 kleuren)

BLACK

0

3-bit RGB (2x2x2=8 kleuren)

RED GREEN BLUE

0 0 0

6-bit RGB (4x4x4=64 kleuren)

RED GREEN BLUE

00 00 00

9-bit RGB (8x8x8=64 kleuren)

RED GREEN BLUE

000 000 000

kleurruimte:CMYK; sRGB, aRGB, etc. bitdiepte: b (bit)

KLEUR

GELUID

samplefrequentie: f (kHz)

bitdiepte: b (bit)

run length encoding discrete cosine transform

lossless = omkeerbaar

= geen informatieverlies

> LZW (GIF, TIFF)

> DEFLATE (ZIP, gZIP, PNG)

> FLAC

lossy = niet omkeerbaar

= artefacten, kleurverlies

> JPEG

> MPEG-4 /h.264

COMPRESSIE

FORMAAT

FORMAAT

CODERING FORMAAT

TEKST utf-8 XML

BEELD

TIFF v6.0 uncompressed baseline

lossless JPEG2000 pt.1 jp2

BEWEGEND

BEELD

JPEG2000 MXF

FFV1 MKV

GELUID LPCM

WAV

AIFF

FLAC

01001001 01001001 00101010 00000000 00011010 00000000 00000000 00000000 1111111111111101 1111111111111101 00111111 01111100

1111111111111101 01001011 00110011 00110110 00100100 01110000 01111000 01000110 00011001 00011010 00010010 01010010 01011011

00101001 00010001 00000000 1111111111111101 00000000 00000100 00000000 00000001 00000000 00000000 00000000 00000000 00000000

00000000 00000000 00000000 00000001 00000011 00000000 00000001 00000000 00000000 00000000 00000010 00000000 00000000 00000000

00000001 00000001 00000011 00000000 00000001 00000000 00000000 00000000 00000011 00000000 00000000 00000000 00000010 00000001

00000011 00000000 00000011 00000000 00000000 00000000 1111111111111101 00000000 00000000 00000000 00000011 00000001 00000011

00000000 00000001 00000000 00000000 00000000 00000001 00000000 00000000 00000000 00000110 00000001 00000011 00000000 00000001

00000000 00000000 00000000 00000010 00000000 00000000 00000000 00001010 00000001 00000010 00000000 00110010 00000000 00000000

00000000 00000010 00000001 00000000 00000000 00010001 00000001 00000100 00000000 00000001 00000000 00000000 00000000 00001000

00000000 00000000 00000000 00010010 00000001 00000011 00000000 00000001 00000000 00000000 00000000 00000001 00000000 00000000

00000000 00010101 00000001 00000011 00000000 00000001 00000000 00000000 00000000 00000011 00000000 00000000 00000000 00010110

00000001 00000011 00000000 00000001 00000000 00000000 00000000 01000000 00000000 00000000 00000000 00010111 00000001 00000100

00000000 00000001 00000000 00000000 00000000 00010010 00000000 00000000 00000000 00011010 00000001 00000101 00000000 00000001

00000000 00000000 00000000 1111111111111101 00000000 00000000 00000000 00011011 00000001 00000101 00000000 00000001 00000000

00000000 00000000 1111111111111101 00000000 00000000 00000000 00011100 00000001 00000011 00000000 00000001 00000000 00000000

00000000 00000001 00000000 00000000 00000000 00101000 00000001 00000011 00000000 00000001 00000000 00000000 00000000 00000010

00000000 00000000 00000000 01110011 1111111111111101 00000111 00000000 01001000 00100000 00000000 00000000 00110100 00000001

00000000 00000000 00000000 00000000 00000000 00000000 01001000 00000000 00000000 00000000 00000001 00000000 00000000 00000000

01001000 00000000 00000000 00000000 00000001 00000000 00000000 00000000 00001000 00000000 00001000 00000000 00001000 00000000

01000011 00111010 01011100 01010101 01110011 01100101 01110010 01110011 01011100 01000010 01100101 01110010 01110100 01011100

01000100 01101111 01110111 01101110 01101100 01101111 01100001 01100100 01110011 01011100 01000100 01100101 01110011 01101011

01110100 01101111 01110000 01011100 01001101 01100001 01100011 01100001 01100011 01100001 01011111 00110110 01110000 01101001

II. BEDREIGINGEN

● Verouderde technologie

● Onbetrouwbare dragers

● Rechten

● Omvang & beheer

● Toegang via web

DIGITALE DUURZAAMHEID

●Digitale duurzaamheid is de houdbaarheid en bruikbaarheid van

digitale gegevens op de langere termijn. (Wikipedia)

●Langdurige toegankelijkheid van digitale data. Dit is een grote

technologische uitdaging voor databeherende instellingen omdat

er nog geen passende oplossingen voorhanden zijn. Het

duurzaam beschikbaar houden van data vergt zowel

beleidsmatige beslissingen in de vorm van een

duurzaamheidsstrategie als praktische oplossingen voor beheer

en behoud. (Digitaal Erfgoed Nederland)

● Grote technologische uitdaging? Wat kan er dan allemaal fout

lopen?

DIGITALE LEVENSCYCLUS

DIGITALE LEVENSCYCLUS

#1 VEROUDERDE TECHNOLOGIE

#1 VEROUDERDE TECHNOLOGIE

#1 VEROUDERDE TECHNOLOGIE

#1 VEROUDERDE TECHNOLOGIE

● Leesbaarheid is afhankelijk van technologie

● Probleem:

● Sleutel tot de code is verdwenen

● Software die de sleutel toepast is verdwenen

● Apparaat om de software uit tet voeren is

verdwenen

#2 ONBETROUWBARE DRAGERS

● Probleem

● onderhevig aan inherent fysiek verval (bitrot)

● fysieke schade aan drager (of apparaat) door gebruik

● fouten bij codering (bv. bij kopiëren)

#2 ONBETROUWBARE DRAGERS

#2 ONBETROUWBARE DRAGERS

#3 RECHTEN

● auteursrechten, patenten, …

● bestandscodering & -formaat zijn beschermd

● software is beschermd

● hardware is beschermd

#3 RECHTEN

#4. OMVANG & BEHEER

#4. OMVANG & BEHEER

#4. OMVANG & BEHEER

● Probleem

● onvoldoende metadata

● eindeloos kopiëren

● onzorgvuldig beheer

#. TOEGANG VIA HET WEB

● geen missie toegankelijk maken bestanden

● slechte webinterface

● onderschatting kost

● veiligheidsrisico’s

● beschermd door

paswoorden

● onwetendheid over

gebruiksgaranties

II. BEDREIGINGEN

● Verouderde technologie

● Onbetrouwbare dragers

● Rechten

● Omvang & beheer

● Toegang via web

III. PRINCIPES

● Documentatie

● Acceptatie

● Rechtenvrij

● Veilige opslag

● Webtoegang

#1 DOCUMENTATIE

Begrijp hoe je digitale documenten

digitaal gecodeerd zijn.

● Zijn codering en formaat goed beschreven in een document?

● Heb je die documenten in je bezit?

● Kan je de code van het bestand eenvoudig openen?

● Bevat het document voldoende informatie over zichzelf?

#2 ACCEPTATIEGRAAD

Vergewis je of de rest van de wereld je

digitale documenten begrijpt.

● Heb jij de nodige software en hardware om het document te

openen?

● Bestaat er meer dan een programma beschikbaar om het

document te openen?

#3 RECHTENVRIJ

Zorg ervoor dat je het document kan

openen zonder een inbreuk te plegen

op iemands rechten.

● Is het gebruik van het bestand vrij van licenties?

● Is het bestand vrij van technische mechanismen die de

toegang beperken?

#4 VEILIGE OPSLAG

Zorg dat de digitale documenten

veilig zijn opgeslagen.

● Worden er nog documenten bewaard op draagbare dragers?

● Worden documenten op verschillende plaatsen bewaard?

● Worden documenten dubbel bewaard?

#5 WEBTOEGANG

Publiceer documenten op het web

onder een erkende open data licentie.

● Kan je alle documenten openen met een URI?

● Zijn de voorwaarden waaronder je documenten publiceert

goed vastgelegd?

● Bevatten de documenten een verwijzing naar de

eigendomsrechten en de licentievoorwaarden?

PERMANENT BEHEER !

Digital Curation Centre: http://www.dcc.ac.uk/resources/curation-lifecycle-model

#1

documentatie

#2

acceptatie

#3

rechtenvrij

#4

veilige opslag

#5

webtoegang

verouderde

techniek

schade

rechten

claims

overvloed

onvindbaar

IV. STRATEGIEËN

● niets…

● conservatie

● documentatie

● kopieren & verspreiden

● regelmatige controles

● migratie & transcodering

● emulatie

DIGITALE DUURZAAMHEID

●Digitale duurzaamheid is de houdbaarheid en bruikbaarheid van

digitale gegevens op de langere termijn. (Wikipedia)

●Langdurige toegankelijkheid van digitale data. Dit is een grote

technologische uitdaging voor databeherende instellingen omdat

er nog geen passende oplossingen voorhanden zijn. Het

duurzaam beschikbaar houden van data vergt zowel

beleidsmatige beslissingen in de vorm van een

duurzaamheidsstrategie als praktische oplossingen voor beheer

en behoud. (Digitaal Erfgoed Nederland)

● Grote technologische uitdaging? Wat kan er dan allemaal fout

lopen?

#1 NIETS

#2 CONSERVATIE

#2 CONSERVATIE

● nauwgezet en in aangepaste omstandigheden

bewaren van hardware, software en bestanden

● slechts in zeer specifieke gevallen gewenst

● vereist ook onderhoud (bv. interne batterij)

#3 DOCUMENTATIE

● documenteren van hardware, software en bestanden

● bv. met software bepaalde bestanden zijn

aangemaakt, en onder welke besturingsprogramma

en op welke hardware die software draait

● handleidingen voor hardware en software (gedrukt?

op cd? online?)

#3 DOCUMENTATIE

#4 KOPIEREN & VERSPREIDEN

● aanmaken van archiveringsbestanden,

reproductiebestanden, raadplegingsbestanden, …

● aanmaken van back-up kopieën

● bewaring van back-ups op verschillende

geografische locaties

● kopiëren op zich kan nieuwe bedreigingen m.b.t.

omvang en beheer introduceren

#4 KOPIEREN & VERSPREIDEN

#5 REGELMATIGE CONTROLES

● controle van functioneren hardware en software

● controles op virussen

● controles op volledigheid

● controles op integriteit

#5 REGELMATIGE CONTROLES

#6 MIGRATIE & TRANSCODERING

● migreren naar een ander formaat

● transcoderen naar een andere codec

● opletten voor informatieverlies

● opletten voor functionaliteitsverlies

● zoveel mogelijk beperken, vereist kennis

● migreren / transcoderen naar duurzaam

archiveringsformaat

#7 EMULEREN

● nabootsen van oorspronkelijke omgeving waarin het

bestand werd gebruikt

● hardware en software

● ontwikkelen emulatieplatformen is specialistenwerk

● niet voor alles zijn er emulatieplatformen

● emulatieplatformen zijn vaak resultaat van reverse

engineering (wettelijk?)

#7 EMULEREN

GOEDE STRATEGIE = COMBINATIE

● verschillende strategie combineren

● alle aspecten moeten beschreven worden tot

echte, volledige strategie

● meestal geen kant-en-klare oplossingen

● in bepaalde gevallen nog geen oplossingen

IV. STRATEGIEËN

● niets…

● conservatie

● documentatie

● kopieren & verspreiden

● regelmatige controles

● migratie & transcodering

● emulatie

V. HUISWERK - KNELPUNTEN

● Bewaarstrategie:

Ik weet niet waar ik moet

beginnen om mijn bestanden

langdurig toegankelijk te maken.

● Kwaliteitscontrole:

Ik weet niet hoe ik moet

controleren of een bestand

duurzaam is of niet.

● Opslagbeheer:

Mijn bestanden zijn niet veilig

opgeslagen.

● Opnameprocedure:

Ik krijg geen overzicht over de

massa bestanden in mijn

collectie.

● Toegang:

Ik weet niet hoe ik al die

bestanden toegankelijk moet

maken via het web

VI. HUISWERK - OPDRACHT

● Welke drie knelpunten zijn het

meest herkenbaar voor jouw

organisatie?

● Beschrijf die knelpunten specifiek

voor jouw organisatie.

● Beschrijf de oplossing voor jouw

organisatie: ● Welke bedreigingen zijn van

toepassing op jouw situatie?

● Welke principes moet je navolgen

om die bedreigingen te beheersen?

● Welke strategie(en) ga je volgen om

die bedreigingen te minimaliseren.