Afstudeeronderzoek linked open data duurzaam voor de toekomst

63
Linked Open Data Duurzaam voor de toekomst? Annette Allaart – Afstudeeronderzoek Reinwardt Academie – Cultureel Erfgoed Oktober 2011

Transcript of Afstudeeronderzoek linked open data duurzaam voor de toekomst

Linked Open Data Duurzaam voor de toekomst?

Annette Allaart – Afstudeeronderzoek

Reinwardt Academie – Cultureel Erfgoed

Oktober 2011

2

Colofon

Dit werk is gelicenseerd onder een Creative Commons Naamsvermelding-NietCommercieel-

GelijkDelen 3.0 Nederland. Bezoek http://creativecommons.org/licenses/by-nc-sa/3.0/nl/ om een

kopie te zien van de licentie of stuur een brief naar Creative Commons, 444 Castro Street, Suite 900,

Mountain View, California, 94041, USA.

Opleiding: Amsterdamse Hogeschool voor de Kunsten

Faculteit: Reinwardt Academie

Begeleider: Gerdie Borghuis

Titel: Linked Data – Duurzaam voor de toekomst?

Auteur: Annette Allaart

Studiejaar: 2011

Datum: 5 oktober 2011

3

Voorwoord

Voor u ligt een scriptie welke het resultaat is van een onderzoek naar de mogelijkheden van Linked

(Open) Data, om duurzame toegang tot digitale erfgoedinformatie te bevorderen. Deze scriptie

vormt het einde van mijn studie Cultureel Erfgoed aan de Reinwardt Academie.

Het schrijven van een scriptie zag en zie ik nog steeds als een hele uitdaging. Ik ben dan ook trots op

het eindresultaat. Trots vanwege de discipline die ik mijzelf heb moeten opleggen. Zelfstandig

onderzoek doen betekent dat je geen stok achter de deur hebt in de vorm van een organisatie waar

je het onderzoek uitvoert.

Ik ben ook trots op het aantal pagina’s waaruit deze scriptie bestaat. Hieruit blijkt dat ik wel degelijk

‘verhaaltjes’ kan schrijven. Iets wat ik tijdens het schrijven niet voor mogelijk hield. Ik schreef mijn

eerste hoofdstuk in steno..

Bij deze wil ik daarom mijn begeleider vanuit de Reinwardt Academie, Gerdie Borghuis, bedanken. Zij

heeft me geleerd hoe ik de lezer aan de hand moet nemen in mijn verhaal.

Graag wil ik ook Enno Meijers en Inge Angevaare bedanken. Zij hebben mij met hun brede kennis van

digitale duurzaamheid, geholpen meer vorm aan mijn onderzoek te geven. Victor de Boer bedank ik

voor het overdragen van zijn kennis van het Semantisch Web en Linked (Open) Data aan mij. Judith

van Gent van het Amsterdam Museum bedank ik voor een kijkje in de praktijk. Zonder jullie was ik

ongetwijfeld nog steeds verdwaald in de enorme hoeveelheid ingewikkelde informatie die er te

vinden is over digitale duurzaamheid en Linked (Open) Data.

Een scriptie schrijven is een proces. Dit proces had ik niet kunnen volbrengen zonder de hulp en

steun van familie, vrienden en huisgenoten. Dank jullie wel!

4

Samenvatting

Digitale informatie is niet meer weg te denken uit onze kennissamenleving. In het hedendaagse leven

kan men niet meer zonder. Digitale duurzaamheid staat echter nog steeds in de kinderschoenen.

Duurzaamheid wordt voornamelijk gezien als veilige opslag van digitale objecten. Het duurzaam

toegankelijk houden van de digitale erfgoedinformatie wordt daarbij vergeten.

Het streven naar duurzame toegang tot digitale erfgoedinformatie is een grote uitdaging omdat er

drie soorten bedreigingen zijn die de risico’s op verlies van digitale informatie vergroten.

Deze afstudeerscriptie onderzoekt of het een mogelijkheid is de data in de collectiedatabase om te

zetten naar een Linked Open dataset, om zodoende duurzame toegang tot digitale erfgoedinformatie

te bevorderen.

Daarnaast is het doel een beeld te creëren wat Linked (Open) Data voor culturele erfgoedinstellingen

kan betekenen, hoe het werkt en wat het oplevert. Hierbij word het Amsterdam Museum als case-

study gebruikt. Zij zijn het eerste museum dat haar data in de collectiedatabase heeft omgezet naar

een Linked Open dataset.

Om duurzame toegang tot digitale erfgoedinformatie te bieden gaat dit onderzoek uit van het

strategische stappenmodel van Enno Meijers. Het stappenmodel bestaat uit drie delen. Het laatste

deel wordt gebruikt om de koppeling naar Linked (Open) Data te maken.

Linked (Open) Data wordt als de praktijk van het Semantisch Web gezien. Het Semantisch Web draait

om interoperabiliteit van de Web-resources. Door digitale objecten inhoudelijk aan elkaar te

koppelen ontstaat een betekenisvolle relatie.

Uit een analyse moet men tot de conclusie komen of Linked (Open) Data een mogelijkheid is om

duurzame toegang tot digitale informatie te bevorderen, of niet. De analyse vergelijkt de

beheersmaatregelen die worden geadviseerd in het derde deel van het stappenplan van Enno

Meijers met het Linked Data principe van Tim Berners-Lee.

Uit de analyse is gebleken dat er wel degelijk overeenkomsten zijn tussen deze twee thema’s. De

overeenkomsten hebben vooral betrekking op het toepassen van open standaarden ten behoeve van

metadata beheer en het signaleren van technologische veranderingen in de omgeving.

De volgende aanbevelingen zijn gedaan:

� Maak gebruik van de open standaard XML.

� Gebruik RDF/XML als schrijfwijze van het RDF-datamodel.

� Nader onderzoek naar de praktijk van deze conclusie.

5

Summary

Digital information has become part of our knowledge society. In daily life, we cannot live without

digital information anymore. Despite of this all, digital preservation is still a new market. It’s only

twenty years old.

Digital preservation is primarily seen as safe storage of digital objects. Sustainable access to the

digital information is something the heritage institutions don’t think of. To achieve sustainable access

to the digital information is a real challenge. There are three kinds of threats which will increase the

risk to lose digital information.

This thesis examines whether it’s a possibility to convert the collection data to Linked Open Data,

thereby promote sustainable access to digital heritage information. Moreover it’s a purpose to

create a picture of Linked (Open) Data. What do cultural heritage institutions have to do with? How

does Linked (Open) Data work? What does Linked (Open) Data bring the cultural heritage

institutions?

The Amsterdam Museum is the first museum in the Netherlands who converted their collection data

to Linked Open Data. I will refer to The Amsterdam Museum as they are used as a case study.

To offer sustainable access to the digital heritage information this examination studied the strategic

model for digital preservation by Enno Meijers. This model consists of three parts. The last part will

be used to make the connection to Linked (Open) Data.

Linked (Open) Data is called the more operative way of the Semantic Web. The Semantic Web is all

about interoperability of Web resources. By linking the digital objects with their inside the Semantic

Web creates meaningful relationships.

An analysis should be to conclude Linked (Open) Data is an opportunity to promote

sustainable access to digital information or not. The analysis compares the preservation tools

recommended in the third part of the strategic preservation model by Enno Meijers to the principles

of Linked Data by Tim Berners-Lee.

The analysis showed that there are indeed similarities between these two themes. The similarities in

particular related to the use of open standards for metadata management and the identification

of technological changes in the environment.

The following recommendations were made:

� Use the Open Standard XML,

� Use RDF / XML as the serialisation of the RDF-data model,

� Make sure you evaluate.

6

Inhoudsopgave

1 Inleiding en afbakening……………………………………………………………………………………………………….............9

Aanleiding………………………………………………………………………………………..........................................9

Hypothese………………………………………………………………………………………………...............................10

Onderzoeksvraag…………………………………………………………………………………………………..................11

Doelstelling...............................................................................................................................11

Afbakening................................................................................................................................11

Methode....................................................................................................................................12

2 Digitale toegankelijkheid...................................................................................................................14

2.1 Wat is digitale toegankelijkheid..............................................................................................14

Digitale duurzaamheid............................................................................................................................14

2.2 Wat is het doel van digitale toegankelijkheid?.......................................................................15

2.3 Waarom is digitale toegankelijkheid belangrijk?....................................................................15

2.4 Obstakels en digitale toegankelijkheid...................................................................................16

2.4.1 Veranderingen in de technologie en technische oplossingen.....................................16

Migratie.....................................................................................................................................17

Emulatie....................................................................................................................................17

Normalisatie..............................................................................................................................18

2.4.2 Veranderingen in de omgeving, hoe verder?...............................................................18

Expertisecentrum DAVID...........................................................................................................18

2.4.3 Veranderingen in de organisatie dankzij nieuw beleid................................................19

De BASIS....................................................................................................................................20

PLATTER.....................................................................................................................................21

Business Model Innovation........................................................................................................22

OAIS-model...............................................................................................................................22

2.5 Strategisch stappenmodel.......................................................................................................24

Volwassenheidsmodel...............................................................................................................25

2.5.1 Opbouw van het stappenmodel..................................................................................25

2.5.2 Deel C: Duurzaam toegang bieden...............................................................................26

Stap 1: duurzame toegang.........................................................................................................26

Stap 2: beheer van metadata.....................................................................................................27

Stap 3: de veranderende omgeving...........................................................................................29

3 Veranderingen van het Web...........................................................................................................30

3.1 Wat is het Web?.....................................................................................................................30

Internet......................................................................................................................................30

Hoe is het World Wide Web ontstaan?.....................................................................................30

Standaarden World Wide Web..................................................................................................31

3.2 Het DNA van het Web............................................................................................................31

3.3 Het ‘Social Web’.....................................................................................................................32

Interactief..................................................................................................................................32

3.4 Het Semantisch Web..............................................................................................................33

Hoe werkt het?..........................................................................................................................34

Ontologie...................................................................................................................................35

7

4 Linked Open Data...............................................................................................................................37

4.1 Wat is Linked (Open) Data?.....................................................................................................37

4.2 Wat is de meerwaarde voor de erfgoedsector?......................................................................38

4.3 Hoe verhouden Linked (Open) Data en het Semantisch Web zich tot elkaar?......................39

4.4 Linked Data – Open Data – Linked Open Data........................................................................40

Linked Data...............................................................................................................................40

Open Data..................................................................................................................................40

Linked Open Data......................................................................................................................41

4.5 De technische aspecten van Linked (Open) Data....................................................................41

4.5.1 Syntactische transformatie..........................................................................................41

XML............................................................................................................................................41

Uniform Resource Identifier......................................................................................................42

HyperText Transfer Protocol......................................................................................................42

4.5.2 Semantische transformatie..........................................................................................42

Triple..........................................................................................................................................43

Resource Description Framework..............................................................................................43

4.6 Linked (Open) Data – wat nu?.................................................................................................45

Linked (Open) Data browser......................................................................................................45

Linked (Open) Data zoekmachines............................................................................................45

Linked (Open) Data applicaties..................................................................................................46

5 Linked Open Data in de praktijk........................................................................................................47

5.1 Aandacht voor Linked (Open) Data.........................................................................................47

5.2 Aan de slag...............................................................................................................................47

5.2.1 ‘The Linking Open Data Project’...................................................................................48

5.2.2 Amsterdam Museum als Linked Open Data.................................................................48

Wat levert het op?.....................................................................................................................49

Nadelen.....................................................................................................................................49

Europeana.................................................................................................................................50

Apps for Amsterdam..................................................................................................................50

Tot slot………………………………………………………………………………………………………………………………….50

5.2.3 MultimediaN N9C Eculture Project..............................................................................51

5.2.4 Europeana....................................................................................................................52

5.2.5 Apps for Amsterdam....................................................................................................52

6 Conclusie en aanbevelingen..............................................................................................................53

Hypothese.................................................................................................................................53

Aanalyse stappenmodel Enno Meijers en Linked Data principe Tim Berners-Lee....................53

Referentie metadata.................................................................................................................54

‘Fixity’ en ‘provenance’.............................................................................................................54

Het leesbaar houden van de informatie....................................................................................54

De behoefte van de gebruiker...................................................................................................55

Aanbevelingen...........................................................................................................................55

7 Geraadpleegde bronnen....................................................................................................................57

8 Afbeeldingenlijst................................................................................................................................59

A Strategisch Stappenmodel Enno Meijers..........................................................................................60

B Linked Open Data Cloud Diagram.....................................................................................................61

8

1 Inleiding en afbakening

Deze scriptie behandelt de duurzame toegankelijkheid van digitale erfgoedinformatie en welke rol

Linked Data hierin kan spelen. Dit zijn twee grote thema’s die met elkaar in verbinding zullen worden

gebracht.

Aanleiding

Digitale informatie is niet meer weg te denken uit onze kennissamenleving. In het hedendaagse leven

kan men niet meer zonder. Het is een essentieel bestanddeel van onze kenniseconomie. In vrijwel

elke sector, publiek en privaat, speelt digitale informatie een grote rol van betekenis.

De instellingen binnen de culturele erfgoed sector zijn driftig aan de slag gegaan met digitaliseren

van hun collectie. Om mee te blijven doen in de kennissamenleving bieden zij laagdrempelig toegang

tot hun digitale informatie. Hiervoor zijn een aantal redenen te noemen1:

� Internet vereenvoudigt deelname van andere partijen aan informatieverspreiding.

� De instellingen proberen op deze manier hun meerwaarde in de kennissamenleving te

behouden.

� De verschuiving van informatieschaarste naar informatieovervloed maakt deze instellingen

niet meer de autoriteit op het gebied van kennis, bovendien zijn zij niet langer de

toegangspoort tot de informatie.

Het digitaliseren staat dus wel degelijk hoog op de agenda. Digitale duurzaamheid staat echter nog

steeds in de kinderschoenen. Duurzaamheid wordt voornamelijk gezien als veilige opslag van digitale

objecten.2

Het streven naar duurzame toegang tot digitale erfgoedinformatie is dus een grote uitdaging, maar

het is ook een probleem dat nog geen twintig jaar oud is.

Informatie op traditionele dragers van papier is zonder schadelijke invloeden van buitenaf jaren

bruikbaar. Je moet alleen kunnen lezen en de taal begrijpen. Dit is niet het geval bij digitale

informatie. Digitale informatie kent drie soorten bedreigingen die de risico’s op verlies van digitale

informatie vergroten:

� Technologie

� Metadata

� Organisatie

In zijn master thesis Stapsgewijs naar duurzame toegang heeft Enno Meijers een strategisch

stappenmodel ontwikkeld om stapsgewijs de risico’s op verlies van digitale informatie te verkleinen.

1 Enno Meijers, Stapsgewijs naar duurzame toegang. Onderzoek naar een strategisch stappenmodel voor

duurzame toegang tot digitale informatie in kleine en middelgrote erfgoedinstellingen. Thesis Master of

Business Informatics – Avans+ (Middelburg, april 2010), 11-12. 2 Meijers, Stapsgewijs naar duurzame toegang, 38.

9

Dit stappenplan is op te delen in drie delen waarin vijftien factoren worden beschreven om tot een

duurzame borging van digitale informatie te komen:

� Het bepalen van de ambitie van de organisatie.

� De digitale objecten veilig stellen.

� Het duurzaam toegang bieden.

In mijn onderzoek ga ik in op het derde deel van het stappenplan: het duurzaam toegang bieden.

Hierin komen de volgende factoren aan bod:

� Beschrijven van de doelen voor duurzame toegang.

� Metadata beheer.

� De veranderende omgeving.

Enno Meijers beschrijft in dit derde deel, over duurzame toegang bieden, de behoefte aan open

standaarden en open source software. Het toepassen van open standaarden en open source

software zouden de beste overlevingskansen bieden voor het duurzaam toegankelijk houden van

digitale informatie.

Hier haakt het tweede thema van deze scriptie op in. Linked (Open) Data is een nieuwe technologie

die een intelligenter Web ondersteunt, dat gebaseerd is op open standaarden. Het is een

ontwikkeling die in 2011 meer bekendheid kreeg door de Europeana database en de aandacht die de

grote instellingen als de Koninklijke Bibliotheek, Nationaal Archief, Digitaal Erfgoed Nederland en

Nationale Coalitie Digitale Duurzaamheid eraan gaven.

Op 13 mei vond het Dutch Culture Linked Open Data Event plaats in Haarlem. Hier verzamelde het

erfgoedveld van Nederland en België zich om meer over deze nieuwe technologie te weten te komen

en het gebruik ervan te bevorderen. Ook ik was van de partij, dit vormde het startschot voor mijn

scriptie.

Hypothese

Linked (Open) Data is een nieuwe praktijk van het Semantisch Web. Linked (Open) Data wordt ook

wel gezien als een pragmatische manier om een praktische bijdrage te leveren aan het Semantisch

Web.3 Praktisch vanwege de toepasbaarheid van Linked (Open) Data. In deze scriptie zie ik Linked

(Open) Data als een technologische verandering in de omgeving. Ik wil ik deze toepasbaarheid

koppelen aan het duurzaam toegang bieden tot digitale erfgoedinformatie. Is dit mogelijk en wat is

hiervoor nodig? Zijn er overeenkomsten tussen de Linked (Open) Data technologie en de

beheersmaatregelen voor duurzame toegang tot digitale informatie? Mijn veronderstelling is dat er

overeenkomsten zijn die het mogelijk maken de Linked (Open) Data technologie te gebruiken als

beheersmaatregel voor duurzame toegang tot digitale informatie.

3 http://www.den.nl/thema/129/ (Linked Open Data) (geraadpleegd: 09-06-2011)

10

Onderzoeksvraag

Het voorgaande resulteert in de volgende hoofdvraag:

Is Linked (Open) Data, als toepassing van het semantisch web, een mogelijkheid om digitale

erfgoedinformatie duurzaam toegankelijk te maken?

De bijbehorende deelvragen zullen het onderzoek meer diepte geven:

� Wat is digitale duurzaamheid?

� Wat is het maatschappelijk belang van het duurzaam toegankelijk maken van digitale

(erfgoed) informatie?

� Welke mogelijkheden voor het duurzaam toegankelijk maken van digitale (erfgoed)

informatie zijn er al?

� Wat is semantisch web?

� Welke ontwikkelingen zijn er vooraf gegaan aan het semantisch web?

� Wat is Linked Open Data (LOD)?

� Hoe verhouden LOD en het semantisch web zich tot elkaar?

� Door wie wordt deze toepassing van semantisch web al gebruikt?

� Wat zijn de voors/tegens van LOD als toepassing van semantisch web?

� Hoe werkt LOD?

� Welke stappen moeten doorlopen worden om van data LOD te maken?

� Is er een verschil tussen erfgoedinstellingen en niet-erfgoedinstellingen, in duurzaam

toegankelijk maken van informatie?

Doelstelling

Mijn doelstelling is de erfgoedprofessional een duidelijk beeld te geven wat Linked (Open) Data is en

hoe het kan bijdragen aan duurzame toegankelijkheid van digitale erfgoedinformatie.

Afbakening

Aangezien duurzame toegankelijkheid even als Linked (Open) Data grote begrippen zijn, is het nodig

een afbakening te maken.

Dit onderzoek heeft plaatsgevonden binnen de publieke sector. Hierin worden drie terreinen

onderscheiden:4

� Wetenschap

� Overheid

� Cultuur en media

Binnen het cultuur en media terrein onderscheidt het ministerie van Onderwijs, Cultuur en

Wetenschap drie andere verdelingen:

� Media

� Letteren en bibliotheken

� Cultureel erfgoed

4 Inge Angevaare ed., Toekomst voor ons digitaal geheugen. Duurzame toegang tot informatie in Nederland

(Den Haag: Nationale Coalitie voor Digitale Duurzaamheid, juli 2009), 15.

11

Cultureel erfgoed is het gemeengoed van de Reinwardt Academie. Het omvat de musea,

monumenten, archeologie en archieven. Dit is ook het terrein waarin ik de duurzame

toegankelijkheid van digitale informatie bestudeer.

Na aangegeven te hebben welk terrein binnen de sector cultuur en media ik bestudeer, zal ik nu

duidelijk maken wat ik onder digitale (erfgoed) informatie versta.

Binnen de culturele erfgoedsector onderscheiden we drie verschillende soorten digitaal cultureel

erfgoed:

� Born-digital erfgoed materiaal, dit zijn objecten die van origine digitaal zijn. Het zijn

erfgoedobjecten die niet van analoge objecten zijn afgeleid. Hierbij kun je denken aan

bouwtekeningen die gemaakt zijn met behulp van CAD/CAM-programmatuur, e-

maildossiers, games, verrijkte publicaties, tweets en websites.5

� Gedigitaliseerd erfgoed, hiervan kennen we twee soorten. 1. Gedigitaliseerd erfgoed dat het

origineel heeft vervangen en nu als een digitaal substituut geldt. 2. Gedigitaliseerd erfgoed

waarbij het fysieke origineel bewaard blijft.6

� Digitale informatie over erfgoed, hieronder vallen bijvoorbeeld beschrijvingen die zijn

vastgelegd in collectie-informatiesystemen.7

In dit onderzoek laat ik born digital materiaal buiten beschouwing. Dit vanwege de complexiteit en

de ‘nieuwheid’ van het materiaal.

Wanneer ik het over digitale (erfgoed) informatie heb, bedoel ik hiermee gedigitaliseerd erfgoed

en/of digitale informatie over erfgoed.

Methode

Ik heb geprobeerd meer grip te krijgen op de twee begrippen: duurzame toegankelijkheid en Linked

(Open) Data, door eerst theoretisch onderzoek te doen, hierbij heb ik zowel literatuur als het

internet geraadpleegd. De belangrijkste bronnen die ik gebruikt heb zijn:

� Meijers, E., Stapsgewijs naar duurzame toegang. Onderzoek naar een strategisch

stappenmodel voor duurzame toegang tot digitale informatie in kleine en middelgrote

erfgoedinstellingen. Thesis Master of Business Informatics – Avans+ (Middelburg, april 2010).

� Angevaare, I. ed., Toekomst voor ons digitaal geheugen. Duurzame toegang tot informatie in

Nederland (Den Haag: Nationale Coalitie voor Digitale Duurzaamheid, juli 2009).

� www.den.nl

Daarnaast heb ik met diverse mensen uit het werkveld gesproken. Ik heb ze gevraagd naar hun

mening en ervaring met digitale toegankelijkheid en Linked (Open) Data. Zoals ik al aangaf wordt

Linked (Open) Data als de ‘praktijk’ van het Semantisch Web gezien. Het Amsterdam Museum is de

eerste Nederlandse culturele erfgoedinstelling die deze ‘praktijk’ ook daadwerkelijk in praktijk heeft

gebracht. Zij hebben hun collectiedatabase als een Linked Open Dataset ontsloten. Ik ben bij het

Amsterdam Museum langs geweest om te weten te komen wat hun ervaringen zijn.

5 M. Van der Graaf en G.J. Nauta, ‘Noodklok voor behoud van born-digital erfgoed’, Informatie Professional (04

/ 2010), 12-15. 6 http://www.den.nl/bericht/2283 (Digitaal duurzame bewaartermijnen?) (geraadpleegd: 22-09-2011)

7 Ibidem.

12

In veel van de gesprekken met experts op dit gebied kwam naar voren hoe ambitieus mijn

onderwerp is. Het zijn twee grote thema’s die beide nog veel bestudeerd dienen te worden. Het was

dan ook erg moeilijk om me niet te verliezen in de complexiteit van voornamelijk het thema digitale

toegankelijkheid. Ik kom nog maar net kijken, terwijl sommige experts al tien jaar bezig zijn op dit

terrein en nog steeds niet alles weten. Toch verwacht ik met deze scriptie de brug tussen de technici

en de erfgoedprofessionals te slaan door op een begrijpelijke manier uit te leggen hoe digitale

toegankelijkheid en Linked (Open) Data met elkaar verweven zijn en wat zij voor elkaar kunnen

betekenen.

13

2 Digitale Toegankelijkheid

Digitale toegankelijkheid gaat vanzelfsprekend samen met de komst van het digitale tijdperk.

2.1 Wat is digitale toegankelijkheid?

Met het ontstaan van het Internet in de jaren ’70, de komst van de eerste ‘personal computer’ in

1981 van IBM en de komst van het Web van Tim Berners Lee in 1991 veranderde er niet alleen veel

in positieve zin, maar ook in negatieve zin.

Het Web bijvoorbeeld, is een handig middel om informatie sneller op te vragen en te verspreiden.

Informatie sneller opvragen gebeurd door slimme ‘browsers’ op het Internet. Informatie verspreiden

gaat door webtoepassingen als virtuele tentoonstellingen. Deze voorbeelden kunnen allemaal

digitale technieken genoemd worden.

In de jaren tachtig van de vorige eeuw realiseerde men zich dat de opkomende digitale technieken

ook risico’s met zich mee brachten. Jeff Rothenberg benoemde de onderstaande technische

problemen8:

� De dragers (cd, dvd, floppy disk) hebben een beperkte levensduur, vaak niet meer dan vijf

jaar.

� De informatie bestaat uit een op zichzelf betekenisloze ‘bitstream’, alleen met behulp van de

juiste hardware-/softwarecombinatie kan die informatie tot leven gewekt worden.

� De betekenis kan alleen achterhaald worden als aan de ‘bitstream’ zelf contextinformatie is

toegevoegd.

Deze risico’s vragen om oplossingen. Dit is echter niet eenvoudig. In tegenstelling tot papier dat

eeuwenlang in een constante (geklimatiseerde) omgeving bruikbaar kan worden gehouden, gelden

voor digitale informatie heel andere regels. Digitale informatie en haar dragers zijn niet

vanzelfsprekend geschikt voor bewaring op de lange termijn.

Met iedere nieuwe ontwikkeling van hard- en software zullen we de digitale informatie en hun

dragers moeten controleren of zij nog wel bruikbaar zijn. Dit gebeurd door de ‘bitstream’ te

controleren. Blijkt de ‘bitstream’ niet meer toegankelijk te zijn, dan moet er een passende oplossing

gevonden worden om de toegankelijkheid op de lange termijn te waarborgen. Deze controle van de

digitale informatie en haar dragers, vereist een continu proces van aandacht en zorg. We noemen dit

een streven naar digitale duurzaamheid.9

Digitale Duurzaamheid?

Een streven naar digitale duurzaamheid dus. Wat is dan digitale toegankelijkheid?

De Nationale Coalitie Digitale Duurzaamheid heeft in het rapportToekomst voor ons digitaal

geheugen aangegeven liever over duurzame toegang of duurzame toegankelijkheid te spreken dan

8 Rothenburg, Jeff, ‘Ensuring the Longevity of Digital Information’, Scientific American, vol. 272, nr. 1 (1999) 24-

29. 9 Angevaare, Toekomst voor ons digitaal geheugen, 23.

14

van digitale duurzaamheid. De reden die zij hiervoor geven is dat duurzame bewaring zonder

toegankelijkheid geen zin heeft.10

In mijn gesprek met Inge Angevaare (coördinator NCDD) gaf zij ook aan dat duurzame

toegankelijkheid bestaat uit twee delen:

� Het bewaren van het object voor de toekomst,

� Het op de lange termijn beschikbaar houden voor de gebruiker.

Ik sluit me aan bij de NCDD en zal in deze scriptie de term duurzame toegankelijkheid gebruiken.

2.2 Wat is het doel van digitale toegankelijkheid?

“Duurzaamheid opzich is nooit het doel” [Inge Angevaare, NCDD, 21-06-2011]11

Het doel van digitale toegankelijkheid is het langdurig bewaren van digitale informatie en

beschikbaar houden voor de gebruikers, zodat de digitale informatie (her)gebruikt kan worden in de

toekomst en men erop kan vertrouwen dat de informatie authentiek en betrouwbaar is.12

2.3 Waarom is digitale toegankelijkheid belangrijk?

In het hedendaagse leven kan men niet meer zonder digitale informatie. Digitale informatie is een

essentieel bestandsdeel van onze kenniseconomie. In vrijwel elke sector publiek en/of privaat speelt

informatie een rol van betekenis. Tegenwoordig spreken we zelfs van een informatieovervloed in

plaats van informatieschaarste. De publieke sector investeert in de productie en verwerving van

digitale informatie en wil deze langdurig toegankelijk houden.

Binnen de culturele sector wordt het belang van deze taak benadrukt door de Raad van Cultuur. Zij

wijzen op het belang van cultuurhistorie wat indirect het belang van digitale toegankelijkheid tot

digitale erfgoedinformatie onderstreept. In het beleidsstuk Innoveren, Participeren!, zeggen zij:

‘Een samenleving die vooruit wil, doet er verstandig aan óók achterom te kijken. Het verleden

moet niet worden vergeten, maar opgepoetst en gebruikt. Zonder continuïteit raken we op

drift en koersen we van het ene incident naar het volgende. Ons collectieve geheugen,

waarvan belangrijke delen zijn opgeslagen in archieven, musea en bibliotheken, schept een

onmisbare basis voor die continuïteit.’ [Innoveren, Participeren!, 2007, p.12]

De NCDD sluit zich hierbij aan door het volgende te zeggen:

‘Geschiedschrijving wordt in de toekomst onmogelijk als wij er anno 2008 niet voor zorgen

dat digitale informatie over onze samenleving wordt bewaard.’13

10

Ibidem, 13. 11

Gesprek met Inge Angevaare, coördinator Nationale Coalitie Digitale Duurzaamheid, 21-06-2011. 12

Ibidem, 12. 13

http://www.ncdd.nl/digitaleduurzaamheid-inleiding.php (Inleiding in Digitale Duurzaamheid)(geraadpleegd:

4-07-2011)

15

Digitaal Erfgoed Nederland, Kennisland en het Ministerie van OCW benadrukken in het rapport

Business Model Innovatie Cultureel Erfgoed juist de waardecreatie die toegang tot digitale collecties

brengt:

‘De digitale collecties vertegenwoordigen een grote potentiële economische en

maatschappelijke waarde, mits ze optimaal toegankelijke worden gemaakt.’14

Naast deze redenen voor cultuurbesef en waardecreatie gelden er nog een aantal redenen die

voornamelijk van technologische en organisatorische aard zijn15

:

� Erfgoedinstellingen investeren de laatste jaren fors in digitalisering van hun collecties.

Duurzame toegankelijkheid van de digitale informatie waarborgt in zekere zin deze

investering in digitalisering.

� Digitalisering van de collecties levert digitale reproducties van o.a. kwetsbare originelen.

Deze hoeven dankzij de digitale reproductie niet vaak uit het depot gehaald te worden.

Indirect zorgt duurzame toegankelijkheid van digitale informatie op deze manier ook voor

duurzaamheid van het fysieke object.

2.4 Obstakels en digitale toegankelijkheid?

In paragraaf 1.1 zijn al kort de grootste risico’s die de toegankelijkheid tot digitale informatie

bedreigen, uiteengezet. Er zijn echter drie soorten bedreigingen te noemen met elk hun eigen

kenmerkende risico’s die de duurzame toegang tot digitale informatie in gevaar brengen. Hieronder

de drie soorten bedreigingen16

:

� Veranderingen in de technologie;

� Veranderingen in de omgeving;

� Veranderingen in de organisatie.

Hoe vangen we deze risico’s en bedreigingen op en zorgen we ervoor dat de digitale informatie goed

bewaard en beheerd wordt?

Om de verschillende soorten bedreigingen van toegang tot digitale informatie te beperken kunnen

verschillende beheersmaatregelen worden gehanteerd. Deze kunnen betrekking hebben op de

technologie en/of beleid en organisatie. We noemen dit ook wel bewaarstrategieën.

Op de komende pagina’s worden de verschillende bedreigingen met hun bijbehorende (mogelijke)

bewaarstrategieën beschreven.

Deze beheersmaatregelen kunnen echter nog niet als DE oplossing worden gezien. De problematiek

van digitale toegankelijkheid tot digitale informatie is daarvoor nog te jong, nog geen twintig jaar

oud. Deze beheersmaatregelen proberen de risico’s en bedreigingen tot een minimum te beperken.

14

M. De Niet, L. Heijmans en H. Verwayen e.a., Business Model Innovatie Cultureel Erfgoed, (Ministerie OCW:

z.pl. 2009), 6-7. 15

http://www.den.nl/thema/16/digitale-duurzaamheid (Digitale Duurzaamheid) (geraadpleegd: 4-07-2011) 16

Meijers, Stapsgewijs naar duurzame toegang, 13.

16

2.4.1 Veranderingen in de technologie en technische oplossingen

Veranderingen in de technologie omvatte de risico’s die Jeff Rothenberg aangaf. Deze risico’s hebben

voornamelijk betrekking op het bewaren van de digitale informatie.

Digitale informatie bestaat uit enen en nullen (bitstream) die alleen betekenis krijgen wanneer deze

wordt afgespeeld op dezelfde combinatie van hard- en software. Dit zou niet een heel groot

probleem moeten zijn mits de voortdurende ontwikkeling van nieuwe hard- en softwareproducten

niet zo groot en snel was dat digitale informatie al na tien jaar onbruikbaar is. Wanneer een van de

twee of beide verouderen en de informatie niet meer leesbaar is, moet een oplossing worden

gevonden. Daarnaast speelt ook de beperkte houdbaarheid van digitale informatie dragers een rol.17

Omdat dit een technische zaak betreft, vraagt dit om een technische beheersomgeving.

Er zijn drie bekende technische bewaarstrategieën:

� Migratie,

� Emulatie,

� Normalisatie

Migratie

Bestanden worden overgezet van de ene hardwareconfiguratie of softwareapplicatie naar de andere.

Het bestand wordt dan niet meer als een bitstream opgeslagen maar in een formaat dat gangbaar en

geschikt is voor de toekomst.

Een goed voorbeeld is wanneer we een tekst hebben getypt op een computer met Windows 95

software en deze willen openen op onze nieuwe computer met de software Windows 2007. We

zullen dan eerst het Windows 95 bestand moeten converteren naar een Windows 2007 bestand,

voordat we het kunnen lezen. Anders kan de computer de bitstream niet meer ‘lezen’.

Migratie is gericht op het behoud van data, er zijn echter toch een aantal nadelen. Migratie moet

elke ± twee jaar herhaald worden om te voorkomen dat dit bestandsformaat ook niet verouderd en

niet meer toegankelijk is. Het leidt vaak tot verlies van informatie. De nieuwe software kan het

bestand niet meer ‘lezen’ zoals het was. Er kunnen kenmerken als inhoud, structuur, uiterlijk of

gedrag verloren gaan. Het verlies van informatie leidt uiteindelijk tot aantasting van de authenticiteit

van het bestand.18

Emulatie

Een andere manier om je digitale informatie te behouden voor de toekomst is emulatie. Volgens

sommige mensen is dit de enige mogelijkheid om de authenticiteit en integriteit van een digitaal

bestand op de lange termijn te behouden.19

17

Angevaare, Toekomst voor ons digitaal geheugen, 11. 18

http://www.nationaalarchief.nl/informatiebeheer-archiefvorming/-digitaal-

archiefmateriaal/bewaarstrategie%C3%ABn/migratie (Migratie) (geraadpleegd: 22-09-2011) 19

http://www.nationaalarchief.nl/informatiebeheer-archiefvorming/-digitaal-

archiefmateriaal/bewaarstrategie%C3%ABn/emulatie (Emulatie) (geraadpleegd: 22-09-2011)

17

Bij emulatie blijft het oorspronkelijke bestand, bestaande uit het besturingssysteem en de software

behouden. De bitstream wordt, in tegenstelling tot bij migratie, niet veranderd. Er wordt als het ware

een software ontwikkeld die een nieuwe computer kan laten functioneren als een ouder model. De

oorspronkelijke omgeving wordt dus nagebootst op een nieuwe computer.20

20

Ibidem.

18

Normalisatie

Dit is een techniek met als doel alle digitale informatie te converteren naar een zelfde

bestandsformaat. Deze methode wordt voornamelijk gebruikt wanneer er is besloten niet alle

bestandsformaten op te nemen in de digitale collectie.21

2.4.2 Veranderingen in de omgeving, hoe verder?

Niet alleen het bewaren van digitale informatie is belangrijk. We moeten de digitale informatie als

we ze teruglezen ook in een context kunnen plaatsen, zodat we de betekenis van de inhoud kunnen

begrijpen.

De ‘bitstream’ wordt pas informatie wanneer extra informatie over deze data beschikbaar is. Deze

extra informatie geeft betekenis aan de data. We noemen deze extra informatie: metadata. Op deze

manier wordt er context gecreëerd.

Het beheren van de relevante metadata van digitale informatie is weer een extra uitdaging.22

Hier

komt ook de problematiek rondom het beheren van de relevante metadata voor duurzaamheid aan

het licht:

� De digitale objecten en de metadata worden beheerd in omgevingen waar in beperkte mate

sprake is van professioneel IT-beheer.

� Het beheer van metadata richt zich vrijwel uitsluitend op de inhoud; het vastleggen van

metadata noodzakelijk voor duurzaam beheer zoals het registeren van gebruikte formaten,

herkomst- of referentie informatie of het vastleggen van een digitale ‘handtekening’ bij de

objecten krijgt weinig aandacht.

Dit deel van de problematiek van digitale toegankelijkheid is nog nauwelijks verkend. Enno Meijers

geeft aan dat de markt, om deze problematiek te verkleinen, nog niet ver genoeg ontwikkeld is. Hij

suggereert dat Digitaal Erfgoed Nederland deze markt kan ontwikkelen door hierin een sturende en

stimulerende rol te spelen. Daarnaast geeft hij aan dat het beheren van de relevante metadata voor

duurzaamheid ook op het terrein van inspelen op technologische veranderingen slaat.

In België hebben ze in 2009 een product op de markt gebracht om de problematiek van metadata

beheer voor duurzaamheid te verkleinen. Dit stappenplan ontwikkeld door Expertisecentrum DAVID

uit Antwerpen, bevat een tiental praktische richtlijnen om de risico’s die duurzame toegankelijkheid

van digitale informatie met zich meebrengt te verkleinen. Het focust zich voornamelijk op juist

software gebruik en metadata beheer.

Expertisecentrum DAVID

Het stappenplan van het expertisecentrum DAVID in Antwerpen is gebaseerd op de functionele

vereisten van digitale archivering en de bijbehorende maatregelen voor risicobeheer.

21

Angevaare, Toekomst voor ons digitaal geheugen, 25. 22

Meijers, Stapsgewijs naar duurzame toegang, 14.

19

Digitaal archiveren wordt als een risicovol en kwetsbaar reconstructieproces gezien. Bij het bouwen

en beheren van een digitaal archief gelden daarom vijf terugkerende basisprincipes23

:

1. Vermijd (externe) afhankelijkheden.

2. Vermijdt overbodige reconstructiestappen.

3. Pas risicospreiding en –beheer toe.

4. Pas normen en standaarden toe.

5. Documenteer de implementatie en het beheer.

Deze vijf basisprincipes vormen de basis voor de acties die voor elke stap worden uitgevoerd.

Deze tien stappen zijn verdeeld in drie groepen: Groep 1 houdt zich bezig met de keuze en inrichting

van de hard- en softwarearchitectuur. Groep 2 organiseert de functionaliteiten rondom leesbaarheid,

authenticiteit en integriteit. De laatste groep documenteert het digitaal archiveringssysteem24

.

Dit stappenplan stelt iedere organisatie in staat een betrouwbaar digitaal archief op te stellen.

2.4.3 Veranderingen in de organisatie dankzij nieuw beleid

De langetermijnzorg van digitale informatie vraagt om continue aandacht en zorg. De laatste jaren

groeide het besef dat technische oplossingen niet voldoende zijn om de digitale risico’s die de

duurzame toegang tot digitale informatie in gevaar brengen te beheersen. Om technische

oplossingen te kunnen ontwikkelen en te implementeren zijn beleidsmatige en organisatorische

randvoorwaarden nodig.25

Er moeten strategische keuzes binnen de organisatie worden gemaakt die

een duurzaamheidstrategie implementeren. Deze strategische keuzes kunnen invloed hebben op de

hele organisatiestructuur.26

23

Filip Boudrez, Een digitaal archief in 10 stappen, (Antwerpen: Expertise Centrum DAVID vzw, 2009), 1. 24

Boudrez, Een digitaal archief in 10 stappen, 2. 25

Angevaare, Toekomst voor ons digitaal geheugen, 25. 26

Meijers, Stapsgewijs naar duurzame toegang, 15.

1. Gebruik een betrouwbaar en beveiligd opslagsysteem en pas een adequaat beheer toe.

2. Bewaar de metadata op een digitaal duurzame wijze.

3. Voorzie een duurzame band tussen het document en zijn metadata.

4. Registreer voor elk digitaal object metadata.

5. Definieer en documenteer de essentiële eigenschappen van het originele document.

6. Bewaar de leesbaarheid van de digitale documenten.

7. Archiveer alle componenten die nodig zijn voor een getrouwe reconstructie van de

documenten.

8. Documenteer het beheer van de digitale documenten.

9. Beschrijf de digitale documenten.

10. Documenteer het digitale archief.

20

Er zijn diverse soorten beleidsmatige en organisatorische randvoorwaarden gedefinieerd. De

volgende pagina’s beschrijven bestaande beheersmaatregelen die gebruikt zijn als instrument voor

beleidsontwikkeling.

Tot instrumenten voor beleidsontwikkeling behoren De BASIS van Digitaal Erfgoed Nederland,

“Planning Tool for Trusted Electronic Repositories – PLATTER” door het project Digital Preservation

Europe (DPE) en Business Model Innovatie ontwikkeld vanuit het Ministerie van OCW.

De BASIS

De culturele erfgoed sector vind deze randvoorwaarden voornamelijk in ‘de BASIS voor

Duurzaamheid’ van DEN.27

Digitale toegankelijkheid op de lange termijn is een continu proces en begint al bij de creatie van het

digitale bestand. De BASIS is een strategie waarin de technische- en ICT-infrastructuur

beheersmaatregelen elkaar ontmoeten, die is gebaseerd op de kwaliteitscyclus van DEN en bestaat

uit minimale eisen die elkaar in verschillende fasen opvolgen28

.

27

http://www.den.nl/pagina/217/standaarden_en_richtlijnen/ (DE BASIS voor digitale duurzaamheid)

(geraadpleegd: 26-07-2011) 28

Ibidem.

Fase 1: beleid ontwikkelen

Iedere erfgoedinstelling die digitale informatie produceert moet denken aan een

duurzaamheidstrategie. Bij het opstellen van een duurzaamheidbeleid moet rekening worden

gehouden met vier aspecten:

- Documentatie, het formuleren van een informatieplan.

- Organisatie, de gehele organisatie is zich bewust van de betekenis van

duurzaamheid

- Middelen, er wordt budget gereserveerd.

- Technische oplossing, welke systemen worden gebruikt? Eigen beheer ja/nee?

Fase 2: plannen maken

Er worden concrete plannen geformuleerd die gebaseerd zijn op het beleid om collecties te

digitaliseren en digitale informatie te beheren. Hieraan worden een aantal eisen gesteld:

- Wat wordt bewaard? Er dienen selectiecriteria opgezet te worden.

- Criteria voor bestandsformaten, welke bestandformaten worden opgenomen?

- Uitvoerbare plannen, check-check-dubbel check.

- Kennis van externe voorzieningen, kijk eens bij de buren, hoe doen zij het?

21

De BASIS voor Duurzaamheid bestaat nu twee jaar en zal in 2011 geëvalueerd worden en indien nog

aangepast.

PLATTER

Een ander goed werkende beleidsstrategie die duurzame toegang tot digitale informatie nastreeft is

de “Planning Tool for Trusted Electronic Repositories - PLATTER” [DPE, 2008].

Dit is een instrument ontwikkeld door het project Digital Preservation Europe. Het heeft als doel te

komen tot het formuleren van concrete, meetbare doelstellingen voor het digitaal archief.29

PLATTER richt zich op negen strategische plannen die samen een duurzaam beleid vormen ten

opzichte van toegang tot digitale informatie die in verband worden gebracht met de tien Core

Principles of Trust Repository Design30

.

29

Meijers, Stapsgewijs naar duurzame toegang, 32. 30

Statsbiblioteket, HATII ed., Repository Planning Checklist and Guidance, (Glasgow: HATII, 2008), 9.

Fase 3: uitvoering

Concrete oplossingen voor duurzame toegankelijkheid tot digitale informatie moet aan een

aantal eisen voldoen:

- Kennisuitwisseling, er dient een aanspreekpunt binnen de organisatie te zijn.

- Referentiemodel, wanneer een eigen ‘repository’ wordt gemaakt dient die volgens het

OAIS-model te zijn opgezet.

Fase 4: evaluatie

Wanneer een erfgoedinstelling duurzame toegang tot digitale informatie nastreeft dient een

evaluatie plaats te vinden die aan een basiseis voldoet:

- Toetsing van een eigen ‘repository’ dient plaats te vinden met TRAC.

1. Business Plan – Financiële planning, monitoring en planning.

2. Acquistion Plan – Evaluatie beleid. Beheren van de relaties met aanbieders en andere

leveranciers.

3. Staffing Plan – Aquisitie en onderhoud van relevante vaardigheden voor depotbeheer.

4. Acces Plan – Toegangsbeleid. Beheren van gebruikersrelaties.

5. Technical Plan – Doelen vaststellen voor hardware, software en netwerken.

6. Data Plan – Specificatie van data en metadata van objecten, formaten en structuren voor

opname, opslag en verspreiding samen met de relevante transformaties en

mappings.

7. Succession Plan – Beheren van contracten na verloop van het archief om digitale objecten te

behouden voor de toekomst.

8. Disaster Plan – Reageren op veranderingen in het archiefsysteem.

9. Preservation Plan – Erop toezien dat de toegang en bruikbaarheid van de digitale objecten in

22

Business Model Innovatie

Als het om beleidsontwikkeling gaat, mag een Business Model niet vergeten worden. Ook niet bij

ontwikkeling van beleid voor duurzame toegankelijkheid tot digitale informatie. Het bieden van

duurzame toegang tot digitale informatie vraagt om financiële middelen. Voordat men investeert in

duurzame toegang moet duidelijk zijn wat de baten zijn van deze toekomstige investering.31

Het Business Model dat besproken wordt in Business Model Innovatie, Cultureel Erfgoed van DEN,

Kennisland en het Ministerie van OCW gaat uit van negen bouwstenen die in directe relatie tot elkaar

staan.32

In de vorige pagina’s hebben we stil gestaan bij beheersmaatregelen die betrekking hebben op het te

vormen beleid en de technologie die nodig is om de risico’s die de duurzame toegang tot digitale

informatie in gevaar brengen te verkleinen. Beleidsmatige- en technologische beheersmaatregelen

ontmoeten elkaar bij het inrichten van een stabiele interne infrastructuur. Het inrichten van een

stabiele interne infrastructuur is het derde aspect van duurzaam beheren. Dit derde aspect is nog

niet eerder genoemd als duurzaam beheersaspect, maar het kan als het ware als een sausje over de

technologische- en beleidsmatige beheersmaatregelen worden gegoten.

Duurzame toegang tot digitale informatie heeft o.a. te maken met interne infrastructuren. Wanneer

deze stabiel zijn, kan dit tot zo min mogelijk verlies van informatie leiden.33

Het voor vrijwel iedereen

bekende OAIS-model biedt een manier om een dergelijke stabiele interne infrastructuur binnen een

collectiedatabase op te zetten.

OAIS-model

Het “Open Archival Information System (OAIS) Reference Model” [CCSDS, 2009] is een model dat een

conceptueel begrippenkader introduceerde voor een architectuur voor duurzame toegang. Het is

algemeen geaccepteerd en wordt over de hele wereld gebruikt. Het werd in 2000 ontwikkeld door

31

Meijers, Stapsgewijs naar duurzame toegang, 33. 32

De Niet, Heijmans en Verwayen e.a., Business Model Innovatie Cultureel Erfgoed, 16-18. 33

Meijers, Stapsgewijs naar duurzame toegang, 24.

1. Propositie – Onderscheidend vermogen organisatie.

2. Klant – Klant is koning.

3. Distributie – Bepaald communicatie en ervaring klant.

4. Relatie

5. Opbrengsten – Bereidheid betaling klant. Volgt uit 4 voorgaande bouwstenen.

6. Activiteiten – Om propositie te kunnen realiseren.

7. Resources – Door organisatie zelf uit te voeren activiteiten.

8. Partners – Uitbesteding activiteiten.

9. Kosten – Kostenstructuur organisatie. Volgt uit bouwstenen 6 t/m 8.

23

het Consultative Committee for Space Data Systems (CCSDS) van NASA. Tegenwoordig is het zelfs

een ISO-standaard (ISO 14721 [Lavoie, 2004]).34

Het OAIS-model draait

om het zogenaamde

‘Archive Information

Package’ (AIP).

Een digitaal object wordt

opgenomen in het

archief.

Alle digitale objecten

samen vormen het

Archive Information

Package.

Het doel van het archief

is dit AIP duurzaam

toegankelijk te houden.

Dit gebeurd aan de hand

van de zes functies die in

figuur 1 zijn gekaderd. Hieronder worden ze verder toegelicht35

.

34

Angevaare, Toekomst voor ons digitaal geheugen, 25. 35

Meijers, Stapsgewijs naar duurzame toegang, 26.

Figuur 1: OAIS Functioneel Model

‘ingest’

Dit is het startpunt van het archiveringsproces. Het materiaal dat wordt aangeboden wordt

beoordeeld op verschillende aspecten als kwaliteit, formaat en volledigheid die bepalen of

het materiaal geschikt is voor opname in het archief.

‘storage’

Bij deze stap wordt gekeken naar de opslag van het digitale object en de bijbehorende

metadata. Het is een continueproces waarbij veel aandacht is voor de conditie van de

opslagomgeving en de opgeslagen gegevens.

‘data management’

De databeheer-functie zorgt voor de instrumenten voor het toekennen en onderhouden van

alle metadata die nodig zijn voor het duurzaam beheer van het informatieobject. Dit gaat

verder dan het alleen maar toekennen van metadata voor het ontsluiten; er is ook behoefte

aan het vastleggen van formaattype, controlewaarden (‘fixity’), wijzigingshistorie

(‘provenance’) en gebruiksvoorwaarden (‘access rights’).

‘access’

Dit wordt ook wel de raadpleeg functie genoemd. Hier wordt gezorgd voor de vindbaarheid

en het toegang geven tot het digitale object. Hierbij worden wel de voorwaarden die bij de

opname functie zijn vastgesteld aangehouden. ‘Access’ en ‘data management’ staan in nauw

contact met elkaar.

24

De introductie van het OAIS-model heeft veel invloed gehad op de manier waarop men omgaat met

de problematiek rondom duurzame toegankelijkheid tot digitale informatie. Elke organisatie die

nadenkt over duurzame toegankelijkheid tot de digitale informatie van haar instelling, wordt geacht

de zes functies van het OAIS-model in haar beleid op te nemen.36

Naast deze beheersmaatregelen- die gebaseerd zijn op de drie aspecten van duurzaam beheren:

beleid, inrichting en technologie- zijn er natuurlijk nog tal van andere beheersmaatregelen. Dit zijn

echter de meest gehanteerde. Bovendien vormen deze beheersmaatregelen de basis voor het

stappenmodel dat Enno Meijers in zijn master thesis heeft ontwikkeld. Dit wil ik graag gebruiken in

deze scriptie om de koppeling naar het gebruik van Linked (Open) Data te leggen.

2.5 Strategisch Stappenmodel

Enno Meijers heeft een stappenmodel ontwikkeld dat kleine- en middelgrote culturele

erfgoedinstellingen in staat stelt aan de slag te gaan met de problematiek van duurzame

toegankelijkheid tot digitale informatie. Het stappenmodel kan gebruikt worden als een

ondersteunend middel bij het opstellen van maatregelen om de risico’s van verlies van digitale

informatie te beperken.37

De maatregelen raken aan veel gebieden binnen de organisatie van de culturele erfgoedinstellingen:

� Ontwikkeling beleid,

� Inrichting ICT-infrastructuur,

� Beheersprocessen.

36

Angevaare, Toekomst voor ons digitaal geheugen, 25. 37

Meijers, Stapsgewijs naar duurzame toegang, 30.

‘administration’

De zogenaamde coördinatie van het beheer is een veelomvattende taak. Het bevat o.a.:

- bewaking van het opname proces,

- configuratie management voor hard- en software,

- proces monitoring,

- documenteren en rapporteren over de opgeslagen objecten,

- ontwikkelen en onderhouden archiveringsbeleid,

- ondersteunen gebruikers.

‘preservation planning’

Deze functie verzorgt de evaluatie van het archief. Het speelt in op de veranderingen in

technologie, of veranderingen van gebruikers en/of producenten. Op deze manier spoort men

vroegtijdig eventuele risico’s op die kunnen optreden of kunnen de nodige aanpassingen aan

het archief worden gemaakt.

25

Om die reden zijn veel van de in paragraaf 2.4 besproken beheersmaatregelen verwerkt in het

stappenmodel. We zien PLATTER, het OAIS-model en het stappenplan van Expertisecentrum DAVID

terug in het stappenplan van Enno Meijers.

“De toegevoegde waarde van het stappenmodel is het rangschikken van de stappen naar volgorde

van urgentie met als leidraad de vijftien elementen uit het volwassenheidsmodel van Dollar.”38

Volwassenheidsmodel

Het stappenmodel is gebaseerd op het volwassenheidsmodel van Charles M. Dollar.

Het volwassenheidsmodel van Dollar: “Digital Preservation Capability Maturity Model” is gebaseerd

op het bekende Capability Maturity Model Integration uit de IT, waarvan de basis in 1990 is

ontwikkeld. Charles M. Dollar is een pionier op het gebied van duurzame toegankelijkheid.39

Dit volwassenheidsmodel voor digitale duurzaamheid bestaat uit vijftien kernfactoren. Deze zijn

verdeeld in twee groepen.

De ene groep omvat de factoren die gaan over de infrastructuur van digitale duurzaamheid.

De andere groep bevat de processen die

nodig zijn om duurzame

opslag van en toegang tot digitale

informatie te realiseren.40

De essentie van een

volwassenheidsmodel is het inrichten

van een cyclisch proces van verbetering

om op deze manier een steeds hoger

kwaliteitsniveau te bereiken.

In het volwassenheidsmodel worden vijf

niveaus gedefinieerd voor het vermogen

voor duurzame toegang. De vijftien

kernfactoren zijn vervolgens geordend

naar urgentie en afname van risico op

verlies van digitale informatie die

verwerkt zijn in het strategisch

stappenmodel.41

2.5.1 Opbouw van het stappenmodel

Het stappenmodel bestaat uit drie delen.

38

Meijers, Stapsgewijs naar duurzame toegang, 49. 39

http://www.digitaalallemaal.nl/?p=2061, (Blog van DEN)(geraadpleegd: 24-09-2011). 40

Meijers, Stapsgewijs naar duurzame toegang, 42. 41

Ibidem, 90.

Figuur 2: Digital Preservation Infrastructure and Processes

(Dollar, 2010)

Deel A: Het bepalen van de ambitie van de organisatie.

Deel B: Het veiligstellen van de digitale objecten.

Deel C: Het duurzaam toegang bieden tot digitale informatie.

26

Aangezien ik in mijn scriptieonderzoek juist dieper in ga op het duurzaam toegang bieden tot digitale

informatie zal ik hier alleen stil staan bij Deel C van het stappenmodel. Het gehele stappenmodel is te

zien in Bijlage 1.

2.5.2 Deel C: Duurzaam toegang bieden

In deel A en deel B van het stappenmodel was het doel langdurig toegang te bieden tot digitale

informatie. Om dit te bereiken moeten de gebruikers eenvoudig over de informatie kunnen

beschikken die voor hen relevant is. Bovendien moeten zij erop kunnen vertrouwen dat de

informatie die zij vinden, betrouwbaar is. Hierin spelen twee processen een belangrijke rol.

Metadata van een digitaal object zijn nodig om het object te kunnen vinden, er toegang tot te

krijgen, het object betekenis te geven en de authenticiteit te kunnen bepalen.

Veranderingen in de omgeving kunnen het digitale object in gevaar brengen als deze niet constant in

de gaten worden gehouden, zodat men ziet of de digitale objecten of de collectiebeheerssystemen

aangepast moeten worden.

Bovenstaande is schematisch weergeven in figuur 3. Hierin zijn ook een aantal kernfactoren van het

volwassenheidsmodel van Charles M. Dollar terug te zien.

Stap 1 – duurzame toegang

De eerste stap in dit deel is bedoeld om planmatig vast te stellen op welke manier de gebruikers

informatie moeten kunnen vinden en gebruiken. Welke vorm van ‘ontsluiting’ is het meest geschikt

voor de beoogde doelgroep? Welke maatregelen zijn er nodig om de duurzaamheid te

waarborgen?42

Strategy

Het antwoord op deze vragen kan worden verkregen door een plan voor duurzame toegang op te

stellen dat als leidraad dient bij het verder concretiseren van de stappen om duurzame toegang tot

digitale informatie te vergroten. Het ‘Acces Plan’, ‘Data Plan’ en ‘Preservation Plan’ van PLATTER kan

hierbij gebruikt worden als voorbeeld van een dergelijk plan. Ook het stappenplan van

42

Ibidem, 60.

Figuur3: Deel C van het stappenmodel Enno Meijers.

27

Expertisecentrum DAVID haakt hier op in.43

43

Ibidem, 61.

28

Designated Community

Vanuit het perspectief van de gebruiker is het aan te raden om de informatie aan te bieden op basis

van open standaarden, eenvoudig doorzoekbaar en met zo weinig mogelijk drempels.

Gebruikers verwachten steeds sneller informatie te kunnen vinden. Zij gaan niet meer naar de

informatie op zoek, maar er wordt verwacht dat de informatie naar hen komt. Informatie moet

beschikbaar zijn op de plaatsen waar de gebruiker vaak komt. Google en allerlei verschillende ‘Social

Media’ zijn hier een goed voorbeeld van.

Access

De aard van het object en het gebruikersdoel bepaald welke beschrijvende metadata aan het digitale

object toegevoegd moeten worden. Naast de beschrijvende metadata zijn er nog een aantal andere

soorten metadata die belangrijk zijn voor duurzame toegang tot digitale informatie. Hierover meer in

stap 2: beheer van metadata.

Open Standards

Om veranderingen in de technologie, in productieprocessen van producenten of veranderingen in de

context van de gebruikers op te vangen is het een goede keuze om open standaarden en open source

software toe te passen. Hierop wordt ingegaan in stap 3: de veranderende omgeving.44

Stap 2 – Beheer van metadata

Het beheer van metadata komt duidelijk terug in het OAIS-model. De data-beheer functie van het

model definieert vijf verschillende soorten metadata die een rol spelen bij duurzame opslag en

toegang tot digitale informatie.45

� Referentie metadata

� Context metadata

� Onveranderbaarheid (‘fixity’)

� Herkomst (‘provenance’)

� Toegang (‘access’)

Wat is nu precies kenmerkend aan deze verschillende soorten metadata?

Referentiemetadata

Het OAIS-model beschouwt ‘beschrijvende’ metadata als referentie metadata. Dit zijn metadata die

een beschrijving geven van een bibliografie, object en/of archief.

Onder dezelfde noemer schaart het OAIS-model ook de zogenaamde ‘persistent identifier’. Dit soort

referentie metadata zorgt voor duurzame adressering van het Archief Informatie Pakket (AIP).

Verwijzingen kunnen op deze manier een lange tijd geldig blijven. Welke ‘persistent identifier’

gebruikt dient te worden in de culturele erfgoedsector is nog een punt van discussie.

De realisatie van een duurzame verbinding tussen het digitale object en haar beschrijvende metadata

is niet eenvoudig. Het OAIS-model ziet deze twee elementen als onderdelen van het Archief

44

Ibidem, 61. 45

Ibidem.

29

Informatie Pakket (AIP). De huidige collectiebeheerssystemen voorzien echter nog niet in deze

denkwijze dat er een ondeelbare koppeling is tussen het digitale object en haar beschrijvende

metadata. In afwachting van verdere ontwikkelingen in de komende jaren is het raadzaam om met

periodieke controles de vindbaarheid te bewaken van zowel de metadata als de objecten en van de

relaties onderling daartussen.46

Metadata ten behoeve van authenticiteit

Zoals men door de jaren heen wijs is geworden, zo weet men ook dat digitale informatie kwetsbaar

en eenvoudig te manipuleren is. Men hecht daarom tegenwoordig veel waarde aan de authenticiteit

van het digitale object. Het aanbieden van openbare betrouwbare informatie sluit aan bij die

behoefte aan authenticiteit.47

Voor het bewaren van de authenticiteit van het digitale object zijn twee aspecten belangrijk. De

onveranderbaarheid of te wel ‘fixity’ van het digitale object en herkomst (‘provenance’) van het

digitale object.

De ‘fixity’ van het digitale object geldt als een controle voor de authenticiteit. Om de authenticiteit te

waarborgen kan bijvoorbeeld een digitale ‘handtekening’ worden aangebracht. Deze wordt dan

regelmatig gecontroleerd op vervalsing.

De ‘provenance’ van het digitale object vertelt meer over de wijzigingen aan het AIP in het verleden,

die in het verleden hebben plaatsgevonden.

Overige metadata

Er zijn nog twee soorten metadata te benoemen. Een daarvan is in 2009 opgenomen in het OAIS-

model.

‘Context’ metadata worden door het Expertisecentrum DAVID als volgt omschreven: het beschrijven

van de archiefvormer, het beschrijven van het werkproces waarbinnen het document een rol/functie

vervulde, en het documenteren van de relatie met archiefbestanddelen en andere documenten.48

Een nieuwe soort metadata die in het OAIS-model benoemd wordt, is de ‘access rights’ metadata.

Deze soort metadata beschrijft de voorwaarden waaronder het materiaal bewerkt mag worden voor

duurzame opslag en opgevraagd mag worden door de gebruiker. Deze toegangsrechten worden

bepaald bij de opname van het digitale object in het AIP.49

Zoals bij de ‘persistent identifier’ al duidelijk werd is er in veel collectiebeheerssystemen nog geen

ruimte om ook de bijbehorende metadata van het digitale object op te nemen. Het koppelen en

beheren van de metadata aan het digitale object is nog een lastige opgave, net als het bewaken van

de authenticiteit. Dit vormt voor culturele erfgoedinstellingen een grote uitdaging. De juiste software

die in staat is de metadata en het digitale object te koppelen bestaat nog niet. De bestaande

softwaresystemen zijn geënt op opslag en archivering. Het accent ligt niet op het bieden van toegang

tot digitale informatie.

46

Ibidem, 62. 47

Ibidem, 63. 48

Ibidem, 64. 49

Ibidem.

30

Toch dient de relatie tussen metadata en object behouden te worden. Desnoods in een aparte

administratie. De volgende ‘tips’ zouden kunnen bijdragen aan het beheren van de metadata.

� Eén mogelijkheid is het noteren van de metadata in XML-documenten. Dit gebeurt ook al

met het digitale object. Dit zou het eenvoudiger maken de duurzame relaties tussen het

digitale object en de bijbehorende metadata te beheren.

� Zorg ervoor dat de metadata van het digitale object onder dezelfde omstandigheden wordt

opgeslagen en beheerd als het digitale object. Bij voorkeur worden deze twee ook in

dezelfde opslagplaats beheerd.

� Tenslotte is het verstandig een collectiebeheersysteem te gebruiken dat in staat is om alle

data in een open formaat te exporteren zonder tussenkomst van de leverancier. Zorg er in

ieder geval voor dat de broncode van de software altijd beschikbaar blijft in de toekomst.

Stap 3: de veranderende omgeving

De IT-technologie is voortdurend aan verandering onderhevig.

Het belangrijkste doel van duurzame toegankelijkheid is het leesbaar houden van de informatie. Het

leesbaar kunnen houden van de digitale informatie is gekoppeld aan het bekend zijn met de

definities van de gebruikte formaten.

Om het risico te verkleinen dat binnen een organisatie niemand

meer bekend is met de gebruikte formaten en software, kan

besloten worden de digitale objecten tijdig te migreren naar een

ander formaat. Hierbij gaat de voorkeur uit naar formaten die

gebaseerd zijn op open standaarden. Zij hebben een duurzaam

karakter omdat de formaatdefinities algemeen beschikbaar zijn. Ze

worden breder ondersteund en kunnen vaak door meerdere

softwareprogramma’s gelezen worden.50

Een ander risico dat ingedekt kan worden is de kans dat een

softwareleverancier failliet gaat en het collectiebeheerssysteem

met hem ten onder gaat. Wanneer men gebruik maakt van open source software zal de broncode

van de software altijd beschikbaar blijven en is de instelling niet afhankelijk van de

softwareleverancier. Een handig bijkomend element is dat open source software de

formaatdefinities ook documenteert dankzij de broncode.

Daarom is het voor de duurzame toegang tot digitale informatie wenselijk zo veel mogelijk gebruik te

maken van open standaarden en open source software.

Naast deze technische ontwikkelingen dient er ook rekening gehouden te worden met veranderingen

binnen de organisatie. Denk hierbij aan de doelgroep, maar ook aan de producenten van digitale

informatie.51

50

Ibidem, 65. 51

Ibidem, 66.

Figuur 4: Open Standaarden,

Open Source

31

Tot zover Deel C: duurzaam toegang bieden. Dit deel van het stappenmodel van Enno Meijers vormt

een aanleiding om Linked (Open) Data te introduceren als technologische verandering van de

omgeving in hoofdstuk 4. Maar eerst zal ik de context waarin Linked (Open) Data thuis hoort

scheppen in hoofdstuk 3.

3 Ontwikkelingen van het Web

In de afgelopen twintig jaar heeft het Web een aantal grote ontwikkelingen doorgemaakt. We

kennen allemaal de termen: Internet, social media, web 1.0 en web 2.0. Deze woorden duiden

allemaal op deze ontwikkelingen van het Web. De laatste ontwikkeling binnen het Web is het

Semantisch Web.

3.1 Wat is het Web?

Met het Web wordt het World Wide Web bedoeld. Dit is een applicatie of dienst die gebruik maakt

van het Internet. In tegenstelling tot wat veel mensen denken is het Web iets anders dan het

Internet.

Internet

Het internet is het mondiale netwerk van aan elkaar gekoppelde computers. Het wordt gebruikt voor

het versturen van informatie in pakketvorm (applicatie). Ieder netwerk bestaat uit computers die

verbonden zijn via kabel of radioverbindingen. 52

Op dit systeem draaien vele applicaties of diensten.

Het World Wide Web is hier een van. Andere bekende applicaties zijn: 53

� E-mail,

� VoIP,

� FTP,

� UseNet

Het Internet bestond en werkte al in de jaren zeventig. Het Internet werkt volgens twee zogenaamde

Internetprotocollen. Internet Protocol (IP) en Transmission Control Protocol (TCP).Verschillende

computers in diverse computernetwerken kunnen via de afspraken in deze Internetprotocollen met

elkaar communiceren, waardoor een wereldwijd netwerk ontstaat.54

Het Web is een dus een applicatie of dienst die via het Internet functioneert. Het is een collectie van

geschreven documenten en andere bronnen, die worden verbonden door hyperlinks en URL’s die

verzonden zijn door Web-browsers en Web-servers.

Hoe is het World Wide Web ontstaan?

Het World Wide Web zoals wij dat nu kennen vindt zijn oorsprong in 1990. Het werd ontwikkeld door

52

Tim Berners-Lee, De wereld van het World Wide Web. Het oorspronkelijke ontwerp en de uiteindelijke

bestemming van het World Wide Web, beschreven door zijn uitvinder, (Amsterdam: 2000), 18-19 + 222. 53

http://nl.wikipedia.org/wiki/Internet (Internet) (geraadpleegd: 25-08-2011). 54

Berners-Lee, De wereld van het World Wide Web, 18-19 + 222.

32

Tim Berners-Lee. Het Web werd uitgevonden met de bedoeling om kennis en gegevens in

zogenaamde datasets uit te wisselen tussen wetenschappers verspreid over de wereld.

Tim Berners-Lee had de intentie om een Web te creëren dat vroeg om de participatie van haar

gebruikers. Hij verwachtte in drie maanden een Web te ontwikkelen waarin de gebruikers alleen

content konden afnemen en binnen acht maanden konden deze zelfde gebruikers ook zelf content

toevoegen aan het Web.

Dit gebeurde echter niet. Men kon alleen maar gelinkte documenten lezen. Het Web werd vrij

eenzijdig gebruikt. Er werd informatie gepubliceerd die door gebruikers werd geconsumeerd. Men

kon dus alleen lezen wat op dat moment beschikbaar was.

Het Web waarin content werd aangeboden die enkel geconsumeerd kon worden ontwikkelde zich

tien jaar voordat gebruikers hun content ook in het Web konden plaatsen. We hebben het hier dan

over gebruikers zonder technologische kennis.

Standaarden World Wide Web

Tim Berners-Lee voegde twee al bestaande technologieën bij elkaar, namelijk:

� Internet,

� Hypertext.

Internet is het overkoepelende netwerk van verschillende applicaties. En hypertext word gezien als

een document met verwijzingen naar andere documenten die in een klik van de muis ‘gevolgd’

kunnen worden. Hieruit ontwikkelde hij drie essentiële technologieën. Hij bedacht het communicatie

protocol HTTP, de opmaaktaal HTML en het idee van een Web-adres URL. Alle drie deze standaarden

worden tegenwoordig nog steeds gebruikt en vormen samen de ruggengraat van het Web. 55

3.2 Het DNA van het Web

Tegenwoordig heeft vrijwel iedereen toegang tot het Web. Doordat er zoveel gebruikers zijn is het

Web zich gaan ontwikkelen. De ontwikkeling van het Web kent een aantal kenmerken.

De ontwikkeling van het Web is grof in te delen in drie periodes van ± tien jaar, ook wel generaties

genoemd:

� 1990-2000 World Wide Web

� 2000-2010 Social Web

� 2010-... Semantisch Web

Wat zijn nu de belangrijkste kenmerken van deze zogenaamde generaties van het Web? Door welke

vaak innovatieve ontwikkelingen zijn zij ontstaan?

55

Gesprek met Victor de Boer, postdoctoraal onderzoeker binnen de Web & Media Group aan de Vrije

Universiteit Amsterdam, 22-07-2011.

33

Volgens Nova Spivack - een prominente denker in het toekomstige Internet (met name Semantisch

Web)- kennen deze generaties twee drijfveren, namelijk:56

� Technologische drijfveer,

� Sociaal-economische drijfveer.

Met technologie wordt bedoeld dat voornamelijk professionals zoals programmeurs en ingenieurs

een rol spelen in deze innovatieve ontwikkelingen van het Web. De gebruikers spelen hier geen rol.

In de jaren negentig werd het ‘Web’ uitgevonden door Tim Berners-Lee. Dit is een van de bekendste

voorbeelden van een technologische drijfveer.

Het sociaal-economische aspect als drijfveer draait veel meer om de participatie van de gebruiker bij

het aanleveren van content. Social media toepassingen als Facebook en Twitter zijn een perfect

voorbeeld van het sociale aspect, dat wordt ondersteund vanuit economisch opzicht. De gunstige

economie zorgt ervoor dat rond 2000 bijna heel Nederland thuis een computer heeft en zich op het

internet begeeft. De professionals hebben op dat moment niet meer het alleenrecht op het

publiceren van content op het Web.

Technologie en het sociale-economie kunnen dus worden gezien als de twee basisstrengen van het

DNA van de innovatie van het Web. Deze twee zijn nooit los van elkaar te zien, maar zijn elkaars

tegenhanger. Er is altijd sprake

van een directe wisselwerking

tussen beide DNA strengen. 57

Deze heeft ervoor gezorgd dat

er een ware evolutie op het

internet gaande is, die als een

soort golfbeweging is

ontwikkeld.

De ontwikkeling van het Web

was dus een puur

technologische ontwikkeling

van professionals op het gebied

van ICT. Er kwamen

voornamelijk ingenieurs en

programmeurs bij kijken. De

gebruikers consumeerde de

informatie die zij toegespeeld kregen. Zij konden helemaal niet mee beslissen welke informatie tot

hun kwam. Achteraf gezien benoemen we deze ontwikkeling ook wel met het buzzwoord: ‘web 1.0’.

3.3 Het ‘Social Web’

Rond het jaar 2007 is het wat men noemt: het ‘Social Web’ ontstaan. Het Web werd inmiddels door

56

http://www.frankwatching.com/archive/2009/01/05/web-webber-webst-van-10-naar-30%E2%80%A6-en-

verder/ (Onafhankelijk crossmedia platform)(geraadpleegd: 26-08-2011) 57

http://www.frankwatching.com/archive/2009/01/05/web-webber-webst-van-10-naar-30%E2%80%A6-en-

verder/ (Onafhankelijk crossmedia platform)(geraadpleegd: 26-08-2011)

Figuur 5: Het DNA van web innovatie.

34

miljoenen mensen gebruikt. Al deze gebruikers van het Web creëerden een nieuw inzicht. Men

ontdekte dat de huidige infrastructuur van het internet ook gebruikt kon worden om iets van de

consument terug te krijgen.58

Interactief

Actief is het woord van het ‘Social Web’. De infrastuctuur van het Web verandert van

eenrichtingsverkeer naar tweerichtingsverkeer. De gebruiker kan interactief zijn met het Web.

58

Ivo Zandhuis, ‘Fundamenten in verandering: archieven op het semantisch web’, Archievenblad, (mei 2010), 1.

35

In de vorm van ‘Social Media’, wordt er interactief deelgenomen aan het Web:

� Social tagging,

� Weblogs,

� Delen van foto’s,

� Reageren op elkaars berichten/foto’s,

� Publiceren van content.

De gebruiker consumeert nu niet alleen meer, maar produceert nu ook. Er ontstaat een zogenaamde

‘prosumer’.

In navolging van de technologische golfbeweging die de ontwikkeling van het Web was, speelt juist

het sociaal/economische aspect een rol bij de ontstaan van ‘het sociale Web’. Het ‘Social Web’ is

gericht op de gebruiker, je ziet dat de technologie dan ook de functionaliteit volgt. Niet langer gaat

het om de techniek van het Web, maar gaat het over een concept dat betrekking heeft op het

gebruik van webapplicaties door mensen. Het ‘Social Web’ is voor de zelfstandige activiteit van het

publiek.59

Toen het tweerichtingsverkeer eenmaal op gang was, verspreidde het ‘Social Web’ zich als een

lopend vuurtje. Verschillende zogenaamde ‘Social Media’ als Twitter, Facebook, Hyves etc. kwamen

op en men nam hieraan deel. Het succes van het ‘Social Web’ is volgens Haustein en Pleumann te

danken aan twee factoren:60

� Participeren op het Web was eenvoudig,

� De resultaten van de participatie op het Web werd direct zichtbaar voor de gebruiker.

De drempel om te participeren binnen het ‘Social Web’ is erg laag. Participeren kan al door een klein

beetje content te delen. Je kunt rustig de kat uit de boom kijken en later meer content toevoegen.

Het gaat erom dat je participeert, dat je het tweerichtingsverkeer op gang houdt. Bovendien groeit

de waarde van de content wanneer mensen content publiceren over datzelfe onderwerp.61

Hier

geldt het principe: the wisdom of the crowd. Al deze inspanningen op het Web zijn direct terug te

zien en kunnen we als resultaat van onze inspanningen beschouwen. Dat zorgt voor een voldaan

gevoel. Jij draagt bij aan het Web.

3.4 Het Semantisch Web

De term Semantisch Web is niet nieuw. Deze is al in de jaren ‘90 geïntroduceerd. In tegenstelling tot -

wat men inmiddels aanduidt met de buzzwoorden web 1.0 en web 2.0, is het geen menselijke

interface, waarbij het gaat om de presentatie van de informatie die gericht is op mensen en waarbij

tekst, grafische vormgeving en usability van belang zijn.

59

Zandhuis, ‘Fundamenten in verandering: archieven op het semantisch web’, 2. 60

Seamus Ross, ‘Position Paper’, DigiCULT Thematic Issue 3 – Towards a Semantic Web for Heritage Resources,

(Oostenrijk: 2003), 9. 61

Ross, ‘Position Paper’, 10.

36

Het Semantisch Web is een computerinterface. In 2007 beschreef Christine Karman het Semantisch

Web als volgt:

Web 3.0, het semantisch web, onderscheidt zich van het huidige www doordat er structuur in

is aangebracht en doordat aan alle stukjes informatie meta-informatie is gekoppeld die

automatische interpretatie mogelijk maakt. Het woordt semantiek wordt gebruikt omdat als

het ware de betekenis van een woord, of van een stukje informatie, is mee-opgeslagen met

het woord zelf. Dat maakt het navigeren op het web eenvoudiger, niet alleen voor ons

mensen maar met name voor systemen. Informatiesystemen ‘begrijpen’ immers niet wat ze

lezen, maar in het semantisch web wordt een deel van dat begrip als het ware meegeleverd,

waardoor een systeem de informatie een beetje kan ‘begrijpen’.62

Tim Berners-Lee had met de ontwikkeling van het World Wide Web eigenlijk een Semantisch Web

voor ogen. Hij wilde een datamodel ontwikkelen dat een informatiestructuur herbergt dat over de

grenzen van de individuele instellingen heen gaat. Na ongeveer twintig jaar lijkt het er dan nu toch

van te komen. Ik zeg expliciet lijkt, want er zijn nog steeds een hoop ontwikkelingen gaande en nog

niet iedereen is blij met het Semantisch Web zoals het nu is.

Hoe werkt het?

De sleutel tot het realiseren van de visie van het Semantisch Web is semantische interoperabiliteit

van de Web-resources.63

Om deze werkelijkheid te laten worden dient er een grote omslag plaats te

vinden in de manier waarop data, informatie en kennis nu zijn gerepresenteerd op het Web.

Begrippenkader

Om de visie van het Semantische Web te verduidelijken zal ik hier eerst de twee belangrijkste

begrippen beschrijven die deze visie ondersteunen.

� Semantiek se - man` tiek («Frans«Grieks) de -woord (vrouwelijk) taalkunde leer van de

betekenis en betekenisveranderingen64

� Interoperabiliteit is de eigenschap van systemen en software om data uit te wisselen met

externe systemen via een gemeenschappelijke set procedures.65

De huidige situatie op het Web laat te veel content zien die niet tot nauwelijks beschreven is om met

elkaar in verband gebracht te kunnen worden. Hierdoor wordt deze content informatie niet

gevonden en hergebruikt. Wanneer deze volgens de principes van het Semantisch Web zouden zijn

ontsloten, zouden geautomatiseerde gegevensverwerkingsprogramma’s de informatie kunnen

vinden, interpreteren en hergebruiken.66

62

www.sync.nl/web-30/, (Definitie Semantisch Web van Christine Karman)(geraadpleegd: 14-06-2011) 63

Geser Guntram, ‘A Cultural Heritage Semantic Web Example & Primer’, DigiCULT Thematic Issue 3 – Towards

a Semantic Web for Heritage Resources, (Oostenrijk: 2003), 3. 64

http://www.encyclo.nl/begrip/semantiek (Semantiek)(geraadpleegd: 27-09-2011) 65

http://www.den.nl/thema/10/interoperabiliteit (Interoperabiliteit)(geraadpleegd: 27-09-2011) 66

Ross, ‘Position Paper’, 7.

37

Dit kan worden gerealiseerd door beschrijvende metadata aan de informatie en de resources toe te

voegen. Vervolgens dient de content en de metadata op een gestructureerde en consistente manier

aangeboden te worden op het Web om een intelligenter Web te ondersteunen.67

Het Semantisch Web wordt wel gepresenteerd

als een zeer complexe en uitgebreide visie van

een intelligent web. Dit is terug te zien in figuur 2.

In de layer-cake is te zien hoe de meer semantische

lagen van het Semantisch Web bouwen op minder

semantische.

Het is zo complex vanwege de stappen die nodig

zijn om een Semantisch Web mogelijk te maken.

Elke stap kent haar eigen standaarden.

Het transformeren van contentinformatie

en metadata naar semantische

interoperabiliteit gebeurd in

twee fases.

We onderscheiden de

syntactische fase en

de semantische fase.

Het syntactische deel bestaat uit het onderste deel van de layer-cake. Het gaat hier om XML-

documenten die een unieke naam en plaats hebben (URI).

In de laag hierboven speelt het RDF-datamodel een rol. Het bouwt voort op XML en URI’s en bestaat

uit subject-predicaat-objectrelaties (triples). Op deze manier wordt de layer-cake steeds meer

semantisch. Standaarden die hier gebruikt worden zijn bijvoorbeeld Dublin Core, SKOS en FOAF.

Het semantische deel begint bij het gebruiken van ontologieën. Ik sta hier wat langer stil bij het

begrip ontologie vanwege het feit dat ontologieën zijn bedoeld om de betekenis, oftewel de

semantiek, vast te leggen van de concepten van de triples. De ontologieën maken het Web

semantisch.

Ontologie

Een ontologie is een triple die is bedoeld om uit te leggen hoe de computer de informatie kan

gebruiken.68

Het is te vergelijken met het RDF-datamodel of een metadataschema.

Er zijn een aantal standaardontologieën:

� RDFS,

� OWL,

67

Ibidem, 7. 68

Zandhuis, ‘Fundamenten in verandering: archieven op het semantisch web’, 2.

Figuur 6: Enabling technologies - layer cake.

38

� OWL2

De ontologieën leggen steeds preciezer vast wat met de onderdelen van de triple wordt bedoeld. Er

wordt bijvoorbeeld vastgelegd wat de relaties binnen een familie betekenen:

De computer moet nu weten dat in een bepaalde stamboom de moeder niet

altijd dezelfde persoon is. De moeder kan meerdere namen hebben. Dit is iets

dat wij mensen weten, maar dat een computer ‘vertelt’ moet worden.

Hier zijn de ontologieën o.a. voor, maar het wordt steeds complexer.

Naarmate we ons meer in het bovenste deel van de layer-cake bevinden wordt de complexiteit

groter. Dit deel van de layer-cake omvat de visie van het Semantische Web. Omdat de

computerinterface steeds meer als een mens moet denken worden de betekenis systemen ook

steeds complexer. 69

Door de complexiteit zijn er nog geen concrete goed functionerende praktijkvoorbeelden te noemen

die de volledige Semantische Web visie dragen. Wat we wel zien in de praktijk is het Linked Data

principe van Tim Berners-Lee. Deze technologie is gebaseerd op de lagen van de layer-cake in figuur

2, tot en met de ontologieën. Over Linked (Open) Data zal ik in hoofdstuk 4 meer vertellen.

Er zijn dus drie web-generaties te onderscheiden. De drie generaties lopen als het ware parallel aan

elkaar. Het ‘Social Web’ houdt niet op te bestaan na 2010. Het blijft parallel lopen met het

Semantisch Web. Ditzelfde geldt voor het World Wide Web, het is er nog steeds en kan niet als

‘dood’ worden beschouwd nu het ‘Social Web’ en het Semantisch Web bestaan.70

69

Gesprek met Victor de Boer, 08-09-2011. 70

E-mailwisseling met Victor de Boer, 30-09-2011.

39

4 Linked Open Data

Linked (Open) Data wordt ook wel de praktijk van het Semantisch Web genoemd. Linked (Open) Data

is een pragmatische manier om een praktische bijdrage te leveren aan het Semantisch Web.71

Praktisch vanwege de toepasbaarheid van Linked (Open) Data.

In dit hoofdstuk meer over de toepasbaarheid van Linked (Open) Data en de overeenkomsten tussen

deze technologie en de beheersmaatregelen voor duurzame toegang tot informatie, zoals

beschreven in Deel C van het strategische stappenplan van Enno Meijers.

De termen waaruit Linked Open Data bestaat sluiten perfect aan op de erfgoedsector.

Om te beginnen Data. Data is onze digitale informatie. Informatie die al jaren door

erfgoedinstellingen wordt verzameld en die de erfgoedsector een autoriteit van kennis in de

samenleving maken.

Open wijst naar de huidige tendens in de samenleving dat informatie van publieke instellingen

openbaar moet zijn: de open access beweging. Nu alleen gegoten in een ander jasje. Niet fysiek,

maar digitaal. Deze openheid stimuleert het hergebruik van data. De informatie die we al jaren

verzamelen.

Linked wijst op waardecreatie met als gevolg meer betekenis. Dankzij het hergebruik worden er

nieuwe koppelingen gemaakt en ontstaat er meer context. Wat uiteindelijk zorgt voor meer

betekenis.72

4.1 Wat is Linked (Open) Data?

Linked (Open) Data is een nieuwe technologie die een intelligenter web ondersteunt. Tot nu toe

werden bij het koppelen van informatie standaarden gebruikt voor de verpakking van de informatie.

Linked (Open) Data koppelt informatie door middel van standaarden die gebruikt worden voor de

inhoud van de informatie.73

In plaats van de buitenkant, de binnenkant dus.

Op het Web worden documenten gekoppeld door links. Deze links hebben geen betekenis. Ze laten

niet zien wat de relatie is tussen de twee documenten die gekoppeld zijn. Alleen dat er een relatie is.

Je moet dus zelf uitzoeken wat de relatie tussen die twee documenten is.

Bij Linked (Open) Data geldt het principe dat de relatie tussen twee documenten betekenisvol moet

zijn. Die betekenis ontstaat door elk woord uit het Webdocument als concept uniek te maken en te

beschrijven in subject-predicaat-objectrelaties (triples). Een woord als bijvoorbeeld de stad

Amsterdam is dan een concept dat meerdere relaties kan krijgen met andere concepten. Het subject,

predicaat en object zijn dan dus ook concepten. Elk concept wint aan betekenis naarmate er meer

beschrijvingen aan gekoppeld worden. Op deze manier worden webdocumenten betekenisvol en

worden zoekresultaten nauwkeuriger.74

Dat is de kracht van Linked (Open) Data.

71

http://www.den.nl/thema/129/ (Linked Open Data) (geraadpleegd: 09-06-2011) 72

http://www.den.nl/blog/bericht/3027 (DCL11: Autoriteit, hergebruik en betekenis van linked data)

(geraadpleegd: 22-06-2011) 73

http://digitaalduurzaam.blogspot.com/ (‘Linked Data’ – wat is dat nu eigenlijk precies?’)(geraadpleegd: 28-

07-2011) 74

http://www.den.nl/thema/129/ (Linked Open Data) (geraadpleegd: 09-06-2011)

40

Schematisch is dat als volgt weer te geven.75

X is de schilder van Y

X is getrouwd met Z

X is afkomstig uit W

X, Y, Z en W zijn hierin de concepten. De relaties die tussen de concepten zijn beschreven zijn

betekenisvol, want ze vertellen hoe de concepten met elkaar verband houden.

Om nauwkeurig te kunnen zoeken in de enorme hoeveelheid informatie op het Web is zoeken op

basis van betekenis onontkoombaar. Er is echter een probleem. De betekenis van mensen, dingen en

gebeurtenissen kan variëren. Mensen kunnen bedenken welke betekenis iets heeft, dankzij de

context. Computers kunnen dit echter niet. Linked (Open) Data is een techniek om machine-leesbare

context te genereren.76

4.2 Wat is de meerwaarde voor de erfgoedsector?

Wat is nu de meerwaarde van Linked (Open) Data en wat levert het op voor de erfgoedsector?

Zoals hierboven al genoemd werd, koppelt Linked (Open) Data niet de verpakking, maar de inhoud

aan elkaar.

De belangrijkste meerwaarde van Linked (Open) Data

voor de erfgoedsector is voornamelijk

interoperabiliteit. Hiermee bedoelen we het kunnen

koppelen van objecten uit verschillende collecties en

het koppelen aan data die van buiten de culturele

sector afkomstig zijn door middel van een

gemeenschappelijke set procedures.77

De Europeana

database is hier een uitstekend voorbeeld van.

Een andere meerwaarde is dat de zichtbaarheid van de

collecties wordt vergroot. Voor zoekmachines geldt dat

zij beter in staat zijn de data te indexeren wanneer

data de Linked Data ‘standaard’ draagt. Er ontstaat de

mogelijkheid om met één zoekopdracht relevante

resultaten te vinden uit meerdere collecties, ook al is

de informatie niet overal hetzelfde geschreven. Op

deze manier komt de informatie dus min of meer naar

de gebruiker toe. De gebruiker hoeft niet meer zelf

opzoek te gaan.78

75

http://digitaalduurzaam.blogspot.com/ (‘Linked Data’ – wat is dat nu eigenlijk precies?’)(geraadpleegd: 28-

07-2011) 76

Ibidem. 77

http://www.den.nl/thema/129/ (Linked Open Data) (geraadpleegd: 09-06-2011) 78

http://digitaalduurzaam.blogspot.com/ (‘Linked Data’ – wat is dat nu eigenlijk precies?’)(geraadpleegd: 28-

07-2011)

Figuur 7: Logo Europeana.

41

Linked (Open) Data stimuleert het hergebruik van data doordat er zoveel mogelijk verwijzingen naar

andere kennisbronnen worden gelegd. Maar dit geldt ook andersom, andere kennisbronnen

verwijzen ook naar jouw data. Tweerichtingsverkeer dus.79

Daarnaast haakt Linked (Open) Data aan bij een maatschappelijke tendens die nu speelt, namelijk dat

informatie openbaar gemaakt moet worden.80

Het afgelopen jaar hebben er diverse initiatieven

plaats gevonden die gebaseerd zijn op de ‘open access’ beweging. Een voorbeelden hiervan is de

Apps for Amsterdam wedstrijd waarbij de data van de Gemeente Amsterdam vrijgegeven was en

deze (her)gebruikt kon worden om mash-ups te creëren die op het Web of als applicatie op de

smartphone kon worden geraadpleegd.81

4.3 Hoe verhouden Linked (Open) Data en het Semantisch Web zich tot elkaar?

Het Semantisch Web en Linked (Open) Data wordt vaak voor hetzelfde aangezien. Deze verwarring

heeft veel te maken met het gebruik van verschillende termen door elkaar:

� Semantisch Web,

� Web of Data,

� Linked Data

Veel mensen spreken van Linked (Open) Data als een nieuwe poging om het Semantisch Web onder

de aandacht te brengen. Ik deel echter de mening van o.a. Tom Heath82

en James Hendler83

:

Het Semantisch Web is een Web of Data. Linked Data creëert als het ware het Web of Data. Daarmee

is Linked Data dus een onderdeel van het Semantisch Web. Je zou kunnen zeggen dat Linked (Open)

Data mede mogelijk word gemaakt door het Semantisch Web.

Zoals de eerste regel van dit hoofdstuk vertelt. Kan Linked (Open) Data

als de praktijk van de Semantische Web visie worden gezien.

Dit kan nog eens verduidelijkt worden door terug te gaan naar

hoofdstuk 3, waarin de ontwikkeling van het Web besproken wordt.

De semantische layer-cake laat de complexe visie van

het Semantisch Web zien. Het meerlaagse model waarin

onderin het Linked (Open) Data principe huist, met daarboven

steeds meer semantiek. Met als top, de logica die

ondersteund wordt door ontologieën. Het volledige

model is moeilijk in praktijk te brengen.

79

http://www.den.nl/thema/129/ (Linked Open Data) (geraadpleegd: 09-06-2011) 80

http://digitaalduurzaam.blogspot.com/ (‘Linked Data’ – wat is dat nu eigenlijk precies?’)(geraadpleegd: 28-

07-2011) 81

http://www.appsforamsterdam.nl/ (Apps for Amsterdam)(geraadpleegd: 29-09-2011) 82

http://tomheath.com/blog/2009/03/linked-data-web-of-data-semantic-web-wtf/ (‘Linked Data? Web of

Data? Semantic Web? WTF?’)(geraadpleegd: 28-07-2011) 83

http://blogs.nature.com/jhendler/2009/06/16/what-is-the-semantic-web-really-all-about (‘What is the

Semantic Web really all about?’)(geraadpleegd: 28-07-2011)

42

Jaren na de term Semantisch Web

gelanceerd werd, is men tot het inzicht

gekomen dat we eerst maar eens onze

data moeten koppelen aan elkaar. Daarna kunnen we daar nog eens logica aan verbinden. Op die

manier is Linked (Open) Data de praktijk van het Semantisch Web.

4.4 Linked Data – Open Data – Linked Open Data

Data kan ‘linked’ zijn, maar niet ‘open’. Net als data ook ‘open’ kan zijn, maar niet ‘linked’.

Wat is ‘linked data’, ‘open’ data? En wanneer spreken we van Linked Open Data?

Linked Data

Data moet aan de vier principes van Tim Berners-Lee voldoen:84

Dit Linked Data principe is de set procedures die de interoperabiliteit mogelijk maakt tussen

verschillende systemen en software.

Open Data

Open Data komt ook in Nederland steeds vaker voor. Het ontsluiten van data die beschikbaar is bij

(semi)overheidsinstellingen en in de privaatsector, zoals het bedrijfsleven, noemt men Open Data. De

data die hier vrijgegeven zijn, zijn vaak: milieu- en demografische data, data over incidenten,

mobiliteit, educatie, connectiviteit, infrastructuur en de planning en het gebruik van (publieke)

ruimte. Het ontsluiten, combineren en visualiseren van Open Data stimuleert innovatie. Het komt

echter nog steeds voor dat toegang tot, of hergebruik van deze data gecontroleerd wordt door

publieke of private partijen. Daarom zijn er een aantal principes opgesteld die kenmerkend zijn voor

Open Data.85

84

http://tomheath.com/papers/bizer-heath-berners-lee-ijswis-linked-data.pdf (‘Linked Data – The story so

far’)(geraadpleegd:21-07-2011) 85

http://www.appsforamsterdam.nl/wat-is-open-data (Wat is Open Data?) (geraadpleegd: 13-09-2011)

Figuur 8: Enabling technologies – layer cake.

1. URI’s om dingen te identificeren.

2. Gebruik HTTP URI’s zodat er naar deze dingen kan worden verwezen en dat ze kunnen

worden opgezocht door zowel mensen als machines.

3. Leg de informatie over het concept vast in een ‘triple’ (subject-predicaat-objectrelatie) en

leg die triple vast in RDF.

4. Neem links naar andere, gerelateerde, open data concepten op in de beschrijving om het

1. Alle data waar geen restricties i.v.m. privacy, veiligheid of anderszins op rusten wordt

ter beschikking gesteld;

2. Data wordt verzameld bij de bron, dus met de grootst mogelijke detaillering;

3. Data wordt zo snel mogelijk beschikbaar gesteld om de gebruikswaarde te behouden;

4. Data wordt beschikbaar gesteld voor een zo breed mogelijke groep mensen, en voor

een zo breed mogelijk aantal toepassingen;

5. Data wordt beschikbaar gesteld in een formaat dat voldoende gestructureerd is om

automatische verwering mogelijk te maken;

6. Data wordt ter beschikking gesteld aan iedereen;

43

Linked Open Data

Linked Open Data zijn rechtenvrije Linked Data. 86

De Linked Data principes worden aangevuld met de

principes voor Open Data. Het gebruik van ‘open’ datasets bevorderd op deze manier het hergebruik

van je data.

4.5 De technische aspecten van Linked (Open) Data

Tom Heath zegt op zijn blog Linked Data? Semantic Web? WTF? [2 maart, 2009]87

:

“Linked Data is no more complex than this – connecting related data across the Web using

URI’s, HTTP and RDF.”

Met deze uitspraak zijn de belangrijkste technische aspecten van Linked Data genoemd.

� Uniform Resource Identifier,

� Hyper Text Transfer Protocol,

� Resource Description Framework.

Om uit te leggen hoe Linked (Open) Data technisch in elkaar zit zal ik dit uitleggen aan de hand van

het Linked Data principe van Tim Berners-Lee, waarin deze drie standaarden centraal staan.

Met de data die betekenisvol aan elkaar wordt gekoppeld, worden de digitale objecten en de

bijbehorende metadata zoals beschreven in hoofdstuk 2 bedoeld.

Het transformeren van metadata naar semantische interoperabiliteit gebeurt in twee fases88

:

� fase 1 - syntactische transformatie;

� fase 2 - semantische transformatie.

4.5.1 Syntactische transformatie

Zoals in hoofdstuk 2 is geadviseerd dienen allereerst zowel de digitale objecten zelf als de

bijbehorende metadata die afkomstig zijn uit de collectiedatabase omgezet te worden naar XML

documenten (veel databases en museumsystemen als Adlib laten het toe om hun inhoud als XML te

exporteren89

). Daarna kan men doorgaan met stap 1 van het Linked Data principe van Tim Berners-

Lee.

XML

XML is een mark-up taal om data te beschrijven. Het is in staat de structuur van een document te

beschrijven en daarmee beschrijft het dus het digitale object (of metadata). XML beschrijft dus alleen

maar. Het geeft bijvoorbeeld aan dat een bepaald onderdeel van een tekst de naam van de maker

betreft, of de datum dat de tekst geschreven is. De notatie van XML is als volgt:

86

http://digitaalduurzaam.blogspot.com/ (‘Linked Data’ – wat is dat nu eigenlijk precies?’)(geraadpleegd: 28-

07-2011) 87

http://tomheath.com/blog/2009/03/linked-data-web-of-data-semantic-web-wtf/ (‘Linked Data? Web of

Data? Semantic Web? WTF?’)(geraadpleegd: 28-07-2011) 88

Guntram, ‘A Cultural Heritage Semantic Web Example & Primer’, 27-32. 89

http://www.den.nl/art/uploads/files/Tutorial%20Linked%20Data%20Part%203b.pdf (Linked Data: stap voor

stap, deel 3B)(geraadpleegd: 15-08-2011)

44

<creator>Kazimir Malevich</creator>

De XML-documenten zijn de concepten zoals al eerder beschreven.

De reden dat we XML gebruiken is omdat het een universele standaard is. Het is een open standaard

die door elke software en elk systeem kan worden gebruikt. Daarnaast is het ook niet applicatie

afhankelijk. Het kan dus ook gebruikt worden voor data uitwisseling en data harvesting of om een

website te maken.90

Een XML document bestaat ook weer uit een bepaalde structuur, een

zogenaamde XML Schema.

Elk concept krijgt een unieke naam: een Uniform Resource Identifier (URI). Naast de unieke naam

krijgt het concept ook nog een uniek adres. Dit bestaat uit informatie over de herkomst van de data

(uit welke dataset is het concept afkomstig.)

Uniform Resource Identifier

Een URI bestaat uit twee onderdelen; geeft een unieke plaats en naam aan een concept:

� URL;

� URN.

De URL (Uniform Resource Locator) identificeert digitale objecten aan de hand van de plaatsing van

het bestand op een netwerkserver. De locatie blijft op deze manier uniek, maar is tijdelijk

opgeslagen.91

De URN (Uniform Resource Name) verwijst niet naar de fysieke plaats van een bestand op de server,

maar verwijst naar een tabel (‘name space’) waarin de instelling op een generieke wijze bijhoudt

welke bestanden zij beheert. Op deze manier krijgen we meer duidelijkheid over de afkomst van de

informatie. Uit welke dataset is deze afkomstig? Voor URN is het een vereiste dat elke naamruimte-

aanduiding wereldwijd uniek is, waarmee ook iedere URN uniek is.

Het gebruiken van URI’s om entiteiten(dingen) te identificeren zoals hierboven is uiteengezet is stap

1 van het Linked Data principe van Tim Berners-Lee.

Stap 2 is de URI’s vindbaar te maken door mensen en machines. Dit doen we door de URI’s in een

HTTP schema op te nemen.

Hyper Text Transfer Protocol

HTTP is een belangrijk protocol voor de communicatie tussen de web cliënt en de webbrowser. Het

haalt de informatie als het ware op. Het is een protocol dat bestaat uit verschillende HTTP-requests

die een web cliënt aan een server stelt. De server geeft vervolgens antwoordt terug aan de Web

cliënt.92

4.5.2 Semantische transformatie

Er is nog een proces nodig om de elementen van het XML document te interpreteren. Hier begint

90

Guntram, ‘A Cultural Heritage Semantic Web Example & Primer’, 30. 91

http://www.den.nl/standaard/266/ (Uniform Resource Identifier (URI))(geraadpleegd: 29-08-2011) 92

http://nl.wikipedia.org/wiki/HTTP (Hypertext Transfer Protocol) (geraadpleegd: 28-08-2011)

45

stap 3 van het Linked Data principe en gaat de syntactische transformatie over naar een semantische

transformatie.

Leg de informatie over het concept vast in een ‘triple’ (subject-predicaat-objectrelatie) en leg die

triple vast in RDF.

Triple

De XML-documenten bevatten nu gestructureerde data die door computers wordt begrepen. Deze

gestructureerde data bestaat uit zogenaamde ‘triples’.

Een triple bestaat uit drie concepten93

:

� Subject – Waar het over gaat.

� Predicaat – Een eigenschap van het subject (de aard van de relatie).

� Object – De waarde van die eigenschap.

Digitale informatie kan met behulp van triples worden gecodeerd en op deze manier kan je een

gerichte vraag stellen op het Web.

Resource Description Framework

De triples worden gecodeerd volgens het RDF-

datamodel. RDF wordt ook wel de ruggengraat van

het Semantisch Web genoemd. Het is een

standaardmodel voor het coderen van metadata

op het Web.94

RDF maakt het mogelijk om twee bronnen aan

elkaar te linken terwijl deze afkomstig zijn uit twee

verschillende datasets. Daarin kan het subject van

de RDF triple van de ene data set zijn, en het object van dezelfde RDF triple afkomstig uit een andere

data set.95

Het RDF-model stimuleert dus het hergebruik van data.

Er zijn verschillende serialisaties voor de triples in het RDF-datamodel. De drie bekendste zijn:

� RDF/XML,

� Turtle,

� Ntriples.

Deze zogenaamde standaardtaal beschrijft hoe een computerbestand eruitziet, waarin triples zijn

vastgelegd. 96

93

http://www.den.nl/art/uploads/files/Tutorial%20Linked%20Data%20Part%203.pdf (Linked Data: stap voor

stap, deel 3) (geraadpleegd: 15-08-2011) 94

Guntram, ‘A Cultural Heritage Semantic Web Example & Primer’, 32. 95

http://tomheath.com/papers/bizer-heath-berners-lee-ijswis-linked-data.pdf (‘Linked Data – The story so

far’)(geraadpleegd:21-07-2011) 96

Zandhuis, ‘Fundamenten in verandering: archieven op het semantisch web’, 8.

Triple:

SUBJECT EIGENSCHAP WAARDE

X is de schilder van Y

| | |

[http://URI]

herkomst:

persoonsnamen-

thesaurus

[http://URI] [http://URI]

herkomst:

Wikipedia

Figuur 9: Schematische weergave van een triple.

46

Mijn voorkeur gaat uit naar RDF/XML.

Dit is de oudste manier om RDF-triples te schrijven. Daarom werd het in eerste instantie ook gezien

als DE standaard.

Een andere reden waarom ik RDF/XML boven Turtle of Ntriples kies is dat XML ook buiten het

Semantisch Web een standaard is. Dit blijkt uit twee opmerkingen die al eerder genoemd zijn in dit

scriptieonderzoek. Ten eerste hebben we de digitale informatie uit de collectiedatabase al overgezet

naar XML-documenten. Ten tweede, deze grijpt terug op de problematiek van duurzame toegang tot

digitale informatie, is het eenvoudiger om de duurzame relaties tussen het digitale object en de

metadata te beheren wanneer de metadata in een XML-document worden overgezet.

Een derde reden is dat XML een universele standaard is. Als een open standaard wordt XML door

elke software en elk systeem gebruikt en blijft daardoor langer bruikbaar.

Er zijn ook een paar kleine nadelen te noemen voor het gebruik van RDF/XML. In tegenstelling tot

Turtle en Ntriples leest deze standaard niet zo makkelijk. Een ander nadeel is dat RDF/XML

bestanden vaak nogal groot worden.97

Stap 4 van het Linked Data principe van Tim Berners-Lee gaat over het koppelen naar andere,

gerelateerde (open) data concepten.

Je kunt verwijzen naar allerlei

entiteiten doordat ieder

concept in relatie gebracht kan

worden met een ander

concept. Een concept kan in

verschillende contexten een

andere betekenis hebben. De

verbindingsmogelijkheden van

concepten zijn eindeloos. Er

wordt als het ware een web

van triples gemaakt. Figuur 5 is

een voorbeeld dat bestaat uit

allemaal triples van een

entiteit, in dit geval een persoon, die allerlei relaties en

eigenschappen beschrijven van deze entiteit, maar in

verschillende contexten.

Om alle entiteiten te beschrijven, zijn er verschillende vocabularies in omgang. Veel verschillende

culturele erfgoedinstellingen hebben immers een andere manier van benoemen van hun entiteiten.

In vocabularies zijn standaardpredicaten opgenomen. Je hoeft dus niet meer je eigen predicaat te

maken, als er voor deze entiteit al een predicaat is. De bekendste vocabularies zijn98

:

� FOAF, vooral predicaten die betrekking hebben op personen.

97

http://www.den.nl/art/uploads/files/Tutorial%20Linked%20Data%20Part%203.pdf (Linked Data: stap voor

stap, deel 3) (geraadpleegd: 15-08-2011) 98

http://tomheath.com/papers/bizer-heath-berners-lee-ijswis-linked-data.pdf (‘Linked Data – The story so

far’)(geraadpleegd:21-07-2011)

Figuur 10: Web van RDF-triples.

47

� SKOS, (Simple Knowledge Organization System). SKOS wordt gebruikt voor het vastleggen

van thesauri en andere woordsystemen als bijvoorbeeld de AAT.

� Dublin Core, is een van de belangrijkste standaardpredicaten. Het is wereldwijd bekend, en

wordt door bijna elk systeem begrepen. Het bevat standaardpredicaten van beschrijvende

metadata.

� OAI-ORE, bevat objecten voor hergebruik en wisselen van tekst, afbeeldingen, data en video.

Nu we het Linked Data principe besproken hebben kunnen we eigenlijk wel zeggen dat het RDF-

datamodel de gemeenschappelijke set procedures is die er voor zorgt dat er interoperabiliteit

ontstaat tussen de verschillende collecties van culturele erfgoedinstellingen.

4.6 Linked (Open) Data - wat nu?

Met de groei van het Linked (Open) Data netwerk op het Web ontstaan steeds meer Linked (Open)

Data initiatieven. Deze zijn in drie categorieën te delen:

� De Linked (Open) Data browsers.

� De Linked (Open) Data zoekmachines.

� De Linked (Open) Data applicaties.

Linked (Open) Data browser

De Linked (Open) Data browser stelt gebruikers in staat om met behulp van links, weergeven in RDF-

triples, tussen verschillende databronnen te navigeren op het Web. Dankzij de Linked Data principes

van Tim Berners-Lee kan men veel eenvoudiger informatie in verband brengen met de informatie uit

andere contexten.99

Het Web of Data doet als het ware een suggestie een volgende databron te

bestuderen.

Linked (Open) Data zoekmachines

Het Linked Data principe maakt het mogelijkheid om met één zoekopdracht relevante resultaten te

vinden uit meerdere collecties. Door de data en namen van velden onafhankelijk van het

collectiebeheersysteem bij de archiefdienst vast te leggen en relaties te leggen met data en

99

Ibidem.

Figuur 11: Growth of LOD Cloud.

48

veldnamen op andere plaatsen op het Web is een heel nauwkeurig en volledig antwoordt op de

‘query’ te krijgen. Het doet er dan ook niet toe welke standaardpredicaten zijn gebruikt in de RDF-

triples. De betekenis van de subject-predicaat-objectrelaties zorgt voor de filtering van relevante

resultaten. Het levert een preciezer zoekresultaat op.

Deze Linked (Open) Data zoekmachine haalt alle soorten triples (subject-predicaat-objectrelaties) op

die hij tegenkomt als antwoordt op zijn zoekvraag, mits ze aan de selectiecriteria van de zoekvraag

voldoen. Een ander woord voor zoekvraag is ‘query’. De standaard, de zogenaamde ‘querytaal’, van

deze zoekmachine, om een antwoordt te vinden dat aan de selectiecriteria voldoet, is SPARQL.100

Linked (Open) Data applicaties

Linked (Open) Datasets lenen zich uitstekend voor het maken van ‘mash-ups’ Er dienen nieuwe

koppelingen gelegd te worden tussen bestaande informatie. Deze bestaande data kan heel variërend

zijn, zoals bijvoorbeeld foto’s van Flickr, video’s van YouTube, kaarten van Google, boeken of

muziekbestanden. Deze mix van bestaande informatie werkt vervolgens als een nieuwe online

service.101

In hoofdstuk 5: Linked Open Data in de praktijk, zal ik verder ingaan op browsers, zoekmachines en

applicaties die gebaseerd zijn op Linked (Open) Data.

100

Zandhuis, ‘Fundamenten in verandering: archieven op het semantisch web’, 8. 101

J. Grooten, M. De Niet, E.L. Rademaker ed., ABC-DE Woordenboek voor het Digitaal Erfgoed, (Rotterdam:

Veenman Drukkers 2008), 133.

49

5 Linked Open Data in de praktijk

De groei van het Linked (Open) Data netwerk heeft invloed op de hoeveelheid en soort initiatieven

die worden opgezet binnen de culturele erfgoedsector. Hoe staat het inmiddels met Linked (Open)

Data in de praktijk? Welke culturele instellingen wagen de sprong en maken hun digitale informatie

beschikbaar met behulp van Linked (Open) Data? Welke categorieën die in hoofdstuk 4 zijn

onderscheiden zien we terug? De volgende voorbeelden laten een beeld van de praktijk zien.

5.1 Aandacht voor Linked (Open) Data

Sinds een aantal jaar heeft Linked (Open) Data zijn entree gemaakt in de culturele erfgoedsector. Er

is steeds meer aandacht voor de manier waarop je Linked (Open) Data kunt maken en wat de

meerwaarde van Linked (Open) Data voor de culturele erfgoedsector is. Digitaal Erfgoed Nederland is

het kenniscentrum voor digitaal erfgoed en maakt deze rol ook waar.

Digitaal Erfgoed Nederland heeft hun online kennisdossier aangevuld met een pagina gewijd aan

zowel Linked Open Data als het Semantisch Web. In het kennisdossier over Linked Open Data is een

‘recept’ van Jacco van Ossenbruggen. Dit ‘recept’ is speciaal voor de culturele erfgoedinstellingen die

wel eens gehoord hebben van Linked (Open) Data maar niet weten wat ze er precies mee moeten.

Het is een praktische handleiding voor het creëren van Linked (Open) Data. Jacco van Ossenbruggen

staat stil bij het wat en waarom van Linked (Open) Data en geeft tips hoe Linked (Open) Data toe te

passen.102

Voor degenen die daadwerkelijk een deel van hun collectie willen omzetten naar een Linked Open

dataset hebben Paul Hermans en Henk Vanstappen een instructie gemaakt waarmee men aan de

slag kan gaan.103

Er wordt stap voor stap besproken welke handelingen moeten worden uitgevoerd

om een Linked Open dataset te maken van de collectie-informatie.

In juni publiceert Digitaal Erfgoed Nederland binnen het DEN Lab online tutorials over Linked Open

Data. Een keer in de twee weken wordt er een nieuwe tutorial gepubliceerd.

Dit initiatief is voortbordurend op het Dutch Culture Linked Open Data Event dat in mei werd mede

georganiseerd in Haarlem.

Naast Digitaal Erfgoed Nederland zijn er nog een hoop enthousiaste personen die over Linked (Open)

Data schrijven en bloggen. Voorbeelden hiervan zijn:

� http://digitaalduurzaam.blogspot.com/ door Inge Angevaare, coördinator Nationale Coalitie

Digitale Duurzaamheid.

� http://www.linkedin.com/groups/Open-Data-Nederland-3112848?trk=myg_ugrp_ovr Open

Data Nederland, groep binnen LinkedIn.

5. 2 Aan de slag

Alle aandacht die aan Linked (Open) Data wordt besteed is heel goed, maar zijn er nu ook

daadwerkelijk Linked (Open) Data initiatieven?

102

http://www.den.nl/bericht/2278 (Linked Data voor de erfgoedsector – een recept van Jacco van

Ossenbruggen)(geraadpleegd: 23-06-2011) 103

http://www.den.nl/art/uploads/files/LDpubliceren.pdf (Linked Data publiceren)(geraadpleegd: 20-09-2011)

50

5.2.1 ‘The Linking Open Data Project’

Het meest bekende voorbeeld van Linked (Open) Data is ‘The Linking Open Data Project’.

In januari 2007 heeft een groep gelijkgestemden dit project gestart. Het doel was het Web of Data

een impuls te geven door data sets onder een open licentie vrij te geven en deze te converteren naar

RDF volgens de Linked Data principes en deze vervolgens te publiceren op het web.

Het project is in de jaren snel gegroeid, iedereen kan namelijk participeren door data te publiceren

volgens de Linked Data principes en te linken naar al bestaande Linked Data sets. Hieronder is een

Linking Open Data cloud diagram te zien dat een overzicht geeft van alle gepubliceerde data sets en

hun relaties met andere data sets.104

‘The Linking Open Data Project’ is de algemene initiatief waarbij iedereen, welke sector dan ook zich

kan aansluiten. Het gaat hier tenslotte om het creëren van een web. Het is dus ook niet bij uitstek

een initiatief vanuit de culturele erfgoedsector. De meest recente versie van het Linked Open Data

Cloud laat echter wel een culturele erfgoedinstelling uit Nederland zien, namelijk: het Amsterdam

Museum.105

Het Amsterdam Museum heeft als eerste museum in

Nederland haar collectie beschikbaar gemaakt als Linked

Open Data.106

Om meer te weten te komen over hun

ervaringen en daarvan te leren had ik met Judith van Gent,

teamleider Documentatie & Fotografie in het Amsterdam

Museum, een gesprek. Zij was als databeheerder actief

betrokken bij dit project.

5.2.2 Amsterdam Museum als Linked Open Data

De collectie van het Amsterdam Museum bevat 70.000 objecten. Sinds 2010 is de hele collectie

digitaal toegankelijk via ‘De Collectie Online’.107

In het informatiebeleidsplan van het Amsterdam Museum staat dat zij de data beschikbaar stellen en

kennis delen met mogelijke partners.108

Data beschikbaar stellen betekent ook dat de digitale

informatie hergebruikt mag worden. Data en afbeeldingen worden aangeboden voor (her)gebruik

met een Creative Commons Attribution-Share licentie.

De digitale collectie beschikbaar maken als een Linked Open dataset lag dan ook voor de hand. Het

pionieren met het ontsluiten van de digitale collectie zit in de genen van het museum.109

Dit was de

Vrije Universiteit van Amsterdam ook opgevallen. Zij hebben het Amsterdam Museum benaderd en

hen gevraagd deel te nemen aan een experimenteel project dat Open Data en semantisch zoeken

104

http://www.w3.org/wiki/SweoIG/TaskForces/CommunityProjects/LinkingOpenData (‘The Linking Open Data

Project’) (geraadpleegd: 23-06-2011) 105

Zie bijlagen: B. 106

http://semanticweb.cs.vu.nl/lod/am/ (Amsterdam Museum in Europeana Data Model RDF)(geraadpleegd:

23-06-2011) 107

http://collectie.ahm.nl/ (AM Collectie Online)(geraadpleegd: 23-06-2011) 108

http://digitalecollectie.nl/casestudies/amsterdam-museum-gesprek-met-judith-van-gent/ (Case

study)(geraadpleegd: 19-09-2011) 109

http://digitalecollectie.nl/casestudies/amsterdam-museum-gesprek-met-judith-van-gent/ (Case

study)(geraadpleegd: 19-09-2011)

Figuur 12: Logo Amsterdam Museum.

51

onderzocht. Zij gebruiken de data die afkomstig is uit de collectiedatabase van Adlib, om te

experimenteren met open data en semantisch zoeken.

De VU benaderde juist het Amsterdam Museum vanwege de grote hoeveelheid contextinformatie

die de collectiedatabase beheert. De collectiedatabase bevat niet alleen de digitale objecten, maar

ook zaalteksten, tentoonstellingsteksten en catalogusteksten. Al deze digitale informatie schept

context en dat is juist waar semantisch zoeken om draait.

Wat levert het op?

Ik vroeg Judith van Gent, wat deze Linked Open dataset het Amsterdam Museum nu heeft

opgeleverd?

Het is nu anderhalf jaar geleden dat er een Linked Open dataset van de collectiedatabase is gemaakt.

Direct levert deze Linked Open dataset niet veel op. De Linked Open Data zijn bedoeld voor het

onderzoek naar Open Data en semantisch zoeken van de VU.

In maart heeft de VU de Linked Open dataset van het Amsterdam Museum geconverteerd naar het

Europeana Data Model. De data van het Amsterdam Museum zijn dan klaar voor de Europeana

portal. De data worden nu beheerd door ‘De Digitale Collectie Nederland’ en wachten daar tot ze

geharvest kunnen worden door Europeana. Dan pas levert het Amsterdam Museum ook iets op.

Tot die tijd is de Linked Open dataset van het museum voornamelijk een bevestiging van het

innovatieve karakter van het Amsterdam Museum. Meewerken aan een onderzoek als dit van de

Vrije Universiteit, ten behoeve van kennis delen ligt bovendien ook in het straatje van het

Amsterdam Museum.

Vanwege het onderzoek van de Vrije Universiteit zijn de problemen waar tegenaan gelopen werd

voornamelijk van technische aard. Het Amsterdam Museum had hier weinig mee te maken.

Nadelen

Wanneer ik Judith van Gent vraag naar de nadelen van de Linked Open dataset van het Amsterdam

Museum kom ik bij haar stokpaardje. Ze vindt het een groot nadeel dat de Linked Open dataset niet

actueel is. Deze is anderhalf jaar oud. Maar de collectiedatabase die door Adlib gehost wordt, wordt

elke twee weken geupdate. Er worden dan wijzigingen en aanpassingen doorgevoerd, trefwoorden

toegevoegd of zelfs een nieuw object in de collectiedatabase toegevoegd. Dit is nu allemaal niet te

zien in de Linked Open dataset. Deze is niet up-to-date.

Dit is ook de reden dat tijdens de ‘Apps for Amsterdam’ wedstrijd gebruik gemaakt werd van de

Application Programming Interface (API) van de collectiedatabase in Adlib en niet van de Linked

Open dataset. Deze API wordt net als de collectiedatabase in Adlib iedere twee weken geüpdate.

Dat is volgens Judith van Gent een groot nadeel. De Linked Open dataset van het Amsterdam

Museum is niet live. Het harvesten van de data uit de collectiedatabase zou periodiek moeten

gebeuren, net zoals er iedere week een up-date van de collectiedatabase wordt gemaakt in Adlib.

Er wordt nog maar even de nadruk gelegd op het experimentele karakter van de tot stand koming

van de Linked Open dataset van het Amsterdam Museum. De Linked Open dataset bevat dus hier en

daar onvolledigheden. Dankzij het experimentele karakter is dit echter niet erg. Het is puur bedoeld

voor museaal onderzoek.

52

Europeana

Vanwege het onderzoek van de VU naar semantisch zoeken en de relatie van de VU met Europeana

is er in maart 2011 voor gekozen de Linked Open dataset van het Amsterdam Museum om te zetten

naar het Europeana Data Model. Dit is een RDF-datamodel speciaal voor Europeana.

Je zou kunnen zeggen dat het voor een stadsmuseum niet relevant is bij Europeana te willen

aansluiten, maar de collectie van het Amsterdam Museum bevat veel deelcollecties die van

internationaal belang zijn.110

Bovendien profiteer je door je aan te sluiten bij Europeana ook van de

technologische en inhoudelijke tools die Europeana ontwikkeld voor de digitale ontsluiting van

collecties.

Wanneer in de loop van de tijd meer projecten worden geharvest door Europeana zal pas echt

duidelijk worden wat Europeana zal betekenen voor culturele erfgoedinstellingen en hun digitale

informatie.

Judith van Gent verwacht door opgenomen te zijn in de Europeana, dat de collectie van het

Amsterdam Museum meer internationale bekendheid krijgt. Dit is nu al te merken aan de Luijken

collectie, er worden veel meer fotoverzoeken van deze schilder aangevraagd dan voor de toetreding

tot de Europeana database. Daarnaast hoopt ze ook dat de zichtbaarheid van de gehele collectie

vergroot wordt.

Apps for Amsterdam

Tijdens de ‘Apps for Amsterdam’ wedstrijd is dus geen gebruik gemaakt van de Linked Open dataset,

maar van de API van de collectiedatabase in Adlib. De applicaties die ontwikkeld zijn gebruiken de

recente data van het API van Adlib. Een API van Adlib is echter dubbelop als je een Linked Open

dataset hebt. Maar een API beheert wel de actuele data, in tegenstelling tot de Linked Open dataset.

Judith van Gent ziet dan ook graag dat de Linked Open Data technologie nog iets vind op het

streamen van de live data. Maar deze ontwikkeling ligt nog in de toekomst.

Er is dus ook geen applicatie gemaakt die bestaat uit data van de Linked Open dataset. Maar wel een

hele mooie die gebruikt maakt van de API van de collectiedatabase in Adlib. Zie de website van ‘Apps

for Amsterdam’ voor de ‘Amsterdam Time Machine’.

Tot slot

De gebruiker is vanwege het experimentele karakter van het initiatief ook helemaal niet op de

hoogte van het bestaan van de Linked Open dataset van het Amsterdam Museum. Waarom is het

dan belangrijk om de collectie te ontsluiten als Linked Open dataset? Wat is het belang van Linked

Open Data voor de toekomst?

Volgens Judith van Gent is het linken van de inhoud erg belangrijk. Door de inhoud van verschillende

data aan elkaar te koppelen geldt voor zoekmachines dat zij beter in staat zijn de data te indexeren

wanneer data de Linked Data ‘standaard’ draagt. Op deze manier krijg je een completer en meer

nauwkeurig zoekresultaat.

Het Amsterdam Museum is dus het eerste museum dat haar collectie beschikbaar stelt als Linked

Open dataset. Als laatste vroeg ik Judith van Gent of zij nog tips hebben voor andere culturele

110

http://digitalecollectie.nl/casestudies/amsterdam-museum-gesprek-met-judith-van-gent/ (Case

study)(geraadpleegd: 19-09-2011)

53

erfgoedinstellingen die overwegen dit ook te doen? Een echte tip heeft ze niet. Het Amsterdam

Museum moet eerst dit project evalueren, voordat het goed kan beoordelen wat dit initiatief nu

precies voor hen heeft betekent en opgeleverd. Helaas ligt iets dergelijks nog niet in het verschiet,

vanwege het onderzoek van de VU dat nog steeds bezig is.

Ze heeft echter wel nog een opmerking. Ze meent dat het Europeana Data Model te ingewikkeld is

en pleit voor een lightversie van dit datamodel, zodat het toegankelijker in gebruik wordt en dit voor

musea de drempel doet verlagen hun data beschikbaar te stellen als Linked Open Data.

Naast deze casestudy van het Amsterdam Museum heb ik een aantal gesprekken gehad met

personen die werkzaam zijn in de culturele erfgoedsector en zich bezig houden met de problematiek

rond duurzame toegang tot digitale informatie en Linked (Open) Data. In de gesprekken die ik had

met verschillende personen uit de culturele erfgoedsector noemde zij ook een aantal projecten en

initiatieven die met Linked (Open) Data of het Semantisch Web te maken hadden.

5.2.3 MultimediaN N9C Eculture Project

Het MultimediaN N9C Eculture Project is een voorbeeld van een semantische zoekmachine. Dit

project heeft een zoekmachine ontwikkeld die gebaseerd is op de Semantische Web technologie. Het

demonstreert hoe de technologie van het Semantisch Web de zoekfunctie, het navigeren door de

collectie en annoteren van informatie interactief kan maken met de collectiedata.111

Aan dit project werkten meerdere culturele erfgoedinstellingen mee, o.a. het Rijksmuseum

Amsterdam, Digitaal Erfgoed Nederland, Rijksmuseum voor Volkenkunde Leiden, Instituut Collectie

Nederland en het Getty Research Institute.

111

http://e-culture.multimedian.nl/demo/www/faq.html#howitworks (MultimediaN N9C Eculture

Project)(geraadpleegd: 22-07-2011)

Figuur 13: MultimediaN N9C Eculture Project.

54

5.2.4 Europeana

Sinds de start van Europeana in 2008, geeft het mensen toegang tot miljoenen gedigitaliseerde

objecten uit Europa’s musea, bibliotheken, archieven en audiovisuele collecties. Europeana brengt je

niet in direct contact met de gedigitaliseerde objecten. Het is een database met de metadata van de

gedigitaliseerde objecten. Er wordt gelinked naar de website van de instelling waar het betreffende

object is gedigitaliseerd. Europeana geeft alleen de beschrijving van het object en waar het object

zich bevindt.112

Doordat Europeana de metadata van de digitale informatie beheerd, zijn zij een voorbeeld van de

Linked (Open) Data praktijk. Helaas is de zoekfunctie van de Europeana database nog niet

semantisch.

Meer dan 1500 culturele erfgoedinstellingen door heel Europa doen mee. De metadata wordt

geharvest bij de aggregatoren die de Linked (Open) datasets van culturele erfgoedinstellingen uit een

bepaald land verzamelen. In Nederland is ‘De Digitale Collectie’ een aggregator. Het Amsterdam

Museum heeft haar Linked Open dataset ook in beheer van ‘De Digitale Collectie’ gegeven in

afwachting tot het geharvest wordt door Europeana.

5.2.5 Apps for Amsterdam

Apps for Amsterdam is een initiatief om zoveel mogelijk data van de Gemeente Amsterdam

toegankelijk te maken voor iedereen. Ze hebben dit gedaan door Linked Open Data applicaties te

ontwikkelen met behulp van de Open Data van de instellingen die mee werkte.

‘PLAY! Amsterdam’ is helaas niet met behulp van Linked (Open) Data van een culturele

erfgoedinstelling tot stand gekomen, maar is wel een erg mooi voorbeeld van een Linked Open Data

applicatie.

112

ttp://group.europeana.eu/web/guest/provide_content;jsessionid=8F0F9C690C75E95C7CE3C22102FD4CFE

(Europeana)(geraadpleegd: 28-07-2011)

Figuur 14: Android App Play! Amsterdam.

55

6 Conclusie en aanbevelingen

Het streven naar duurzame toegang tot digitale erfgoedinformatie is dus een grote uitdaging voor de

culturele erfgoedinstellingen. Digitale informatie kent drie soorten bedreigingen die de risico’s op het

verlies van digitale informatie vergroten:

� Technologie,

� Metadata,

� Organisatie.

Het strategisch stappenmodel van Enno Meijers is een model dat stapsgewijs de risico’s op verlies

van digitale informatie verkleind. Hij onderscheidt daarin drie delen om tot duurzame borging van

digitale informatie te komen.

A: Het bepalen van de ambitie van de organisatie.

B: De digitale objecten veilig stellen.

C: Het duurzaam toegang bieden.

Het derde deel van dit stappenmodel, het duurzaam toegang bieden, gaat in op drie factoren:

� Beschrijven van de doelen van duurzame toegang,

� Metadata beheer,

� De veranderende omgeving.

Hypothese

Ik onderzocht de maatregelen die de veranderende omgeving vroeg en stelde hierbij dat Linked

(Open) Data een verandering in de omgeving is te noemen. Linked (Open) Data kan als een

technologische verandering van de omgeving worden gezien.

Aan de hand van het Semantisch Web werd duidelijk dat Linked (Open) Data als de eenvoudig

toepasbare praktijk van dit Semantisch Web wordt gezien. Linked (Open) Data is naar mijn mening

daarom een manier om de maatregelen voor duurzame toegankelijkheid tot digitale informatie

tegemoet te komen. In het bijzonder veranderingen in de omgeving.

Analyse stappenmodel Enno Meijers en Linked Data principe Tim Berners-Lee

De literatuur vermeld dat om duurzame toegang tot digitale informatie te bereiken, gebruikers

eenvoudiger over de informatie moeten kunnen beschikken op de lange termijn en dat deze

informatie betrouwbaar dient te zijn. Om aan deze vraag te voldoen wordt de aandacht gevestigd op

het beheer van metadata en de veranderende omgeving.

Er zijn vijf verschillende soorten metadata beheer te benoemen:

� Referentie metadata,

� Context metadata

56

� Onveranderbaarheid (‘fixity’)

� Herkomst (‘provenance’)

� Toegang (‘access’)

Een aantal van deze metadata vertonen overeenkomsten met sommige stappen van het Linked Data

principe van Tim Berners-Lee.

Referentie metadata

Vanuit het stappenmodel van Enno Meijers wordt de noodzaak van een duurzame relatie tussen het

digitale object en de bijbehorende metadata benadrukt. Een oplossing die wordt aangedragen is de

bijbehorende metadata van het digitale object in een XML-document op te slaan. Dit is eenvoudig

want de digitale objecten worden al in XML-documenten opgeslagen dus de kennis om dit te doen is

al aanwezig in een culturele erfgoedinstelling.

De overeenkomst met het Linked Data principe van Tim Berners-Lee is die van het gekozen formaat,

het XML-document. Voordat er een triple (subject-predicaat-objectrelatie) gemaakt kan worden

dienen zowel de digitale objecten als de bijbehorende metadata te worden beschreven in een XML-

document. Deze XML-documenten vormen later de concepten van een triple (subject-predicaat-

objectrelatie).

‘Fixity’ en ‘provenance’

De manier waarop de authenticiteit van de digitale objecten en de bijbehorende metadata wordt

gewaarborgd vertoond een overeenkomst met stap 1 van het Linked Data principe van Tim Berners-

Lee.

Zoals aangegeven in het stappenmodel van Enno Meijers worden de metadata ten behoeve van de

authenticiteit gewaarborgd door een digitale ‘handtekening’ aan te brengen die de

onveranderbaarheid vast legt. Daarnaast wordt een wijzigingshistorie toegevoegd die de afkomst

vastlegt.

In stap 1 van het Linked Data principe gebeurt iets vergelijkbaars. Elk concept dat deel uitmaakt van

een triple krijgt een URI toegewezen. Een URI geeft de triple een unieke naam en plaats. De unieke

naam wijst op de authenticiteit van het digitale object of de bijbehorende metadata. De unieke

plaats verwijst naar de afkomst van het digitale object of de bijbehorende metadata.

Dat zijn dus twee overeenkomsten tussen beheersmaatregelen voor metadata beheer in het

stappenmodel van Enno Meijers en het Linked Data principe van Tim Berners-Lee.

De veranderingen in de omgeving zouden volgens mijn hypothese ook overeenkomsten moeten

vertonen met het Linked Data principe van Tim Berners-Lee.

Het leesbaar houden van de informatie

Het belangrijkste doel van duurzame toegankelijkheid is het leesbaar houden van de informatie. Het

leesbaar kunnen houden van de digitale informatie is gekoppeld aan het bekend zijn met de

definities van de gebruikte formaten.

In het stappenmodel van Enno Meijers wordt als oplossing voor dit probleem het gebruik van

formaten die gebaseerd zijn op open standaarden, aangedragen.

Ook hier kan men verwijzen naar Linked (Open) Data. Net als bij de referentie metadata kan XML als

oplossing worden toegepast. XML is immers een open standaard die door elke software en elk

57

systeem kan worden gebruikt. Ideaal dus om te gebruiken wanneer je bang bent de digitale

informatie niet meer te kunnen lezen vanwege het feit dat er geen kennis meer binnen de

organisatie beschikbaar is over het bestandsformaat dat gebruikt is om dit digitale object op te slaan.

Niet alleen technologische veranderingen zijn belangrijk om in de gaten te houden om de kans op

verlies van digitale informatie te verkleinen. Ook de doelgroep moet in de gaten worden gehouden.

De behoefte van de gebruiker

De gebruikers van dit moment verwachten dat informatie naar hen toekomt. Ze vinden hun

informatie op de plaatsen waar zij zich het meest bevinden, online op ‘social media’ pagina’s of

wanneer zij gebruik maken van hun smartphone. Het stappenmodel van Enno Meijers raad daarom

vanuit het perspectief van de gebruiker aan om open standaarden te gebruiken voor het duurzaam

toegankelijk houden van digitale informatie.

Een ontwikkeling die gebaseerd is op het Linked Data principe van Tim Berners Lee, is de Linked

(Open) Data applicatie. Het steeds grotere Linked (Open) Data netwerk dat ontstaat door steeds

meer Linked (Open) datasets, maakt het eenvoudig om een ‘mash-up’ te maken. Een ‘mash-up’

speelt juist in op de behoefte van deze gebruiker door verschillende bestaande data te combineren

tot een nieuwe online service. De online service komt wel naar de gebruiker toe via de ‘social media’

of de smartphone.

Aan de hand van deze analyse van de twee thema’s blijkt dat er genoeg overeenkomsten bestaan

tussen beheersmaatregelen voor duurzame toegankelijkheid tot digitale informatie en het Linked

Data principe van Tim Berners-Lee om deze twee thema’s aan elkaar te koppelen. Dit ondersteunt

mijn hypothese dus.

We kunnen uit deze analyse opmaken dat Linked (Open) Data een technologische verandering van de

omgeving is die beter metadata beheer stimuleert. Het raakt daarmee dus niet aan één maar aan

twee aspecten van het bieden van duurzame toegang tot digitale informatie.

De hoofdvraag:

Is Linked (Open) Data, als toepassing van het semantisch web, een mogelijkheid om digitale

erfgoedinformatie duurzaam toegankelijk te maken?

is door dit onderzoek dus positief beantwoordt.

Met dit onderzoek had ik niet alleen voor ogen te onderzoeken of Linked (Open) Data de duurzame

toegang tot digitale erfgoedinformatie bevorderd? Ik wilde ook een duidelijk beeld schetsen van

Linked (Open) Data. Wat is het? Wat levert het ons op? Wie maakt er al gebruik van Linked (Open)

Data? Hoofdstuk 4 gaf veel technische informatie die ook gebruikt is in de analyse om

overeenkomsten tussen beheersmaatregelen genoemd in het stappenmodel van Enno Meijers en

het Linked Data principe van Tim Berners-Lee te vinden.

Hoofdstuk 5 gaf door de praktijkvoorbeelden meer een beeld hoe Linked (Open) Data nu precies

door de culturele erfgoedsector gebruikt kan worden.

Aanbevelingen

Wat is er nu precies nodig om deze conclusie te ondersteunen?

58

Uit de analyse is gebleken dat XML gebruikt kan worden als open standaard.

Om vervolgens een Linked (Open) dataset te kunnen maken van de data in de collectiedatabase van

een erfgoedinstelling, dienen de data en bijbehorende metadata naar XML-documenten omgezet te

worden.

Vervolgens kunnen de RDF-triples gemaakt worden. De serialisatie die in het RDF-datamodel gebruikt

wordt is dan vanzelfsprekend RDF/XML.

Concreet kunnen we spreken van de volgende aanbevelingen:

� Voor het duurzaam opslaan van een digitaal object en de bijbehorende metadata dient een

XML-document gebruikt te worden. Dit vanwege de open standaard die XML is.

� De RDF-triples dienen in RDF/XML geschreven te worden.

� Nader onderzoek naar de praktijk van deze conclusie.

59

7 Geraadpleegde bronnen

Gedrukte bronnen

Angevaare, I. ed., Toekomst voor ons digitaal geheugen. Duurzame toegang tot informatie in

Nederland (Den Haag: Nationale Coalitie voor Digitale Duurzaamheid, juli 2009).

Boudrez, F., Een digitaal archief in 10 stappen, (Antwerpen: Expertise Centrum DAVID vzw, 2009).

Graaf, M. Van der en G.J. Nauta, ‘Noodklok voor behoud van born-digital erfgoed’, Informatie

Professional (04 / 2010).

Grooten, J., Niet, M. de, Rademaker, E.L. ed., ABC-DE Woordenboek voor het Digitaal Erfgoed,

(Rotterdam: Veenman Drukkers 2008).

Guntram, G., ‘A Cultural Heritage Semantic Web Example & Primer’, DigiCULT Thematic Issue 3 –

Towards a Semantic Web for Heritage Resources, (Oostenrijk: 2003).

Meijers, E., Stapsgewijs naar duurzame toegang. Onderzoek naar een strategisch stappenmodel voor

duurzame toegang tot digitale informatie in kleine en middelgrote erfgoedinstellingen. Thesis

Master of Business Informatics – Avans+ (Middelburg, april 2010).

Niet, M. de, Heijmans, L. en Verwayen, H. e.a., Business Model Innovatie Cultureel Erfgoed,

(Ministerie OCW: z.pl. 2009.

Rothenburg, J., ‘Ensuring the Longevity of Digital Information’, Scientific American, vol. 272, nr. 1

(1999).

Ross, S., ‘Position Paper’, DigiCULT Thematic Issue 3 – Towards a Semantic Web for Heritage

Resources, (Oostenrijk: 2003).

Statsbiblioteket, HATII ed., Repository Planning Checklist and Guidance, (Glasgow: HATII, 2008), 9.

Tim Berners-Lee, De wereld van het World Wide Web. Het oorspronkelijke ontwerp en de uiteindelijke

bestemming van het World Wide Web, beschreven door zijn uitvinder, (Amsterdam: 2000).

Zandhuis, I., ‘Fundamenten in verandering: archieven op het semantisch web’, Archievenblad, (mei

2010).

Internetbronnen

http://blogs.nature.com/jhendler/2009/06/16/what-is-the-semantic-web-really-all-about (‘What is

the Semantic Web really all about?’)(geraadpleegd: 28-07-2011)

http://digitaalduurzaam.blogspot.com/ (‘Linked Data’ – wat is dat nu eigenlijk

precies?’)(geraadpleegd: 28-07-2011)

http://nl.wikipedia.org/wiki/HTTP (Hypertext Transfer Protocol) (geraadpleegd: 28-08-2011)

http://nl.wikipedia.org/wiki/Internet (Internet) (geraadpleegd: 25-08-2011).

www.sync.nl/web-30/, (Definitie Semantisch Web van Christine Karman)(geraadpleegd: 14-06-2011)

http://tomheath.com/blog/2009/03/linked-data-web-of-data-semantic-web-wtf/ (‘Linked Data?

Web of Data? Semantic Web? WTF?’)(geraadpleegd: 28-07-2011)

http://tomheath.com/papers/bizer-heath-berners-lee-ijswis-linked-data.pdf (‘Linked Data – The

story so far’)(geraadpleegd:21-07-2011)

http://www.appsforamsterdam.nl/ (Apps for Amsterdam)(geraadpleegd: 29-09-2011)

http://www.appsforamsterdam.nl/wat-is-open-data (Wat is Open Data?) (geraadpleegd: 13-09-2011)

http://collectie.ahm.nl/ (AM Collectie Online)(geraadpleegd: 23-06-2011)

http://www.den.nl/art/uploads/files/LDpubliceren.pdf (Linked Data publiceren)(geraadpleegd: 20-

09-2011)

60

http://www.den.nl/art/uploads/files/Tutorial%20Linked%20Data%20Part%203b.pdf (Linked Data:

stap voor stap, deel 3B)(geraadpleegd: 15-08-2011)

http://www.den.nl/art/uploads/files/Tutorial%20Linked%20Data%20Part%203.pdf (Linked Data:

stap voor stap, deel 3) (geraadpleegd: 15-08-2011)

http://www.den.nl/bericht/2283 (Digitaal duurzame bewaartermijnen?) (geraadpleegd: 22-09-2011)

http://www.den.nl/blog/bericht/3027 (DCL11: Autoriteit, hergebruik en betekenis van linked data)

(geraadpleegd: 22-06-2011)

http://www.den.nl/bericht/2278 (Linked Data voor de erfgoedsector – een recept van Jacco van

Ossenbruggen)(geraadpleegd: 23-06-2011)

http://www.den.nl/pagina/217/standaarden_en_richtlijnen/ (DE BASIS voor digitale duurzaamheid)

(geraadpleegd: 26-07-2011)

http://www.den.nl/standaard/266/ (Uniform Resource Identifier (URI))(geraadpleegd: 29-08-2011)

http://www.den.nl/thema/10/interoperabiliteit (Interoperabiliteit)(geraadpleegd: 27-09-2011)

http://www.den.nl/thema/129/ (Linked Open Data) (geraadpleegd: 09-06-2011)

http://www.den.nl/thema/16/digitale-duurzaamheid (Digitale Duurzaamheid) (geraadpleegd: 4-07-

2011)

http://www.digitaalallemaal.nl/?p=2061, (Blog van DEN)(geraadpleegd: 24-09-2011).

http://digitalecollectie.nl/casestudies/amsterdam-museum-gesprek-met-judith-van-gent/ (Case

study)(geraadpleegd: 19-09-2011)

http://e-culture.multimedian.nl/demo/www/faq.html#howitworks (MultimediaN N9C Eculture

Project)(geraadpleegd: 22-07-2011)

http://www.encyclo.nl/begrip/semantiek (Semantiek)(geraadpleegd: 27-09-2011)

http://www.frankwatching.com/archive/2009/01/05/web-webber-webst-van-10-naar-

30%E2%80%A6-en-verder/ (Onafhankelijk crossmedia platform)(geraadpleegd: 26-08-2011)

http://www.nationaalarchief.nl/informatiebeheer-archiefvorming/-digitaal-

archiefmateriaal/bewaarstrategie%C3%ABn/emulatie (Emulatie) (geraadpleegd: 22-09-2011)

http://www.nationaalarchief.nl/informatiebeheer-archiefvorming/-digitaal-

archiefmateriaal/bewaarstrategie%C3%ABn/migratie (Migratie) (geraadpleegd: 22-09-2011)

http://www.ncdd.nl/digitaleduurzaamheid-inleiding.php (Inleiding in Digitale

Duurzaamheid)(geraadpleegd: 4-07-2011)

http://semanticweb.cs.vu.nl/lod/am/ (Amsterdam Museum in Europeana Data Model

RDF)(geraadpleegd: 23-06-2011)

http://www.w3.org/wiki/SweoIG/TaskForces/CommunityProjects/LinkingOpenData (‘The Linking

Open Data Project’) (geraadpleegd: 23-06-2011)

ttp://group.europeana.eu/web/guest/provide_content;jsessionid=8F0F9C690C75E95C7CE3C22102F

D4CFE (Europeana)(geraadpleegd: 28-07-2011)

Geïnterviewde personen

Inge Angevaare, coordinator Nationale Coalitie Digitale Duurzaamheid.

Victor de Boer, postdoctoraal onderzoeker binnen de Web & Media Group aan de Vrije Universiteit

Amsterdam.

Judith van Gent, teamleider afdeling Documentatie & Fotografie in het Amsterdam Museum.

61

8 Afbeeldingenlijst

Figuur 1: OAIS Functioneel model.

http://public.ccsds.org/publications/archive/650x0b1.PDF

Figuur 2: Digital Preservation Infrastructure and Processes.

Meijers, Enno, Stapsgewijs naar duurzame toegang. Onderzoek naar een strategisch stappenmodel

voor duurzame toegang tot digitale informatie in kleine en middelgrote erfgoedinstellingen. Thesis

Master of Business Informatics – Avans+ (Middelburg, april 2010)

Figuur 3: Deel C van het stappenmodel Enno Meijers.

Meijers, Enno, Stapsgewijs naar duurzame toegang. Onderzoek naar een strategisch stappenmodel

voor duurzame toegang tot digitale informatie in kleine en middelgrote erfgoedinstellingen. Thesis

Master of Business Informatics – Avans+ (Middelburg, april 2010)

Figuur 4: Open Standaarden, Open Source.

http://goo.gl/yqm0D

Figuur 5: Het DNA van web innovatie.

http://www.frankwatching.com/archive/2009/01/05/web-webber-webst-van-10-naar-

30%E2%80%A6-en-verder/

Figuur 6: Enabling technologies – layer cake.

http://www.w3.org/2002/Talks/www2002-w3ct-swintro-em/slide9-0.html

Figuur 7: Logo Europeana.

http://www.europeana.eu/portal/aboutus_press.html

Figuur 8: Enabling technologies – layer cake.

http://www.w3.org/2002/Talks/www2002-w3ct-swintro-em/slide9-0.html

Figuur 9: Schematische weergave van een triple.

http://digitaalduurzaam.blogspot.com/ (‘Linked Data- wat is dat nu eigenlijk precies?’)

Figuur 10: Web van RDF-triples.

http://goo.gl/Svu0N

Figuur 11: Growth of LOD Cloud.

http://goo.gl/7ppK1

Figuur 12: Logo Amsterdam Museum.

http://www.ahm.nl/nl/Amsterdam-Museum/algemeen/pers/ahm-huisstijl

Figuur 13: MultimediaN N9C Eculture Project.

http://e-culture.multimedian.nl/demo/session/search

Figuur 14: Android App PLAY! Amsterdam.

http://www.playamsterdam.nl/android.html

62

Bijlage A Strategisch Stappenmodel Enno Meijers

63

Bijlage B Linked Open Data Cloud Diagram