Afstudeeronderzoek linked open data duurzaam voor de toekomst
-
Author
erfgoed-20 -
Category
Documents
-
view
1.916 -
download
3
Embed Size (px)
Transcript of Afstudeeronderzoek linked open data duurzaam voor de toekomst

Linked Open Data Duurzaam voor de toekomst?
Annette Allaart – Afstudeeronderzoek
Reinwardt Academie – Cultureel Erfgoed
Oktober 2011

2
Colofon
Dit werk is gelicenseerd onder een Creative Commons Naamsvermelding-NietCommercieel-
GelijkDelen 3.0 Nederland. Bezoek http://creativecommons.org/licenses/by-nc-sa/3.0/nl/ om een
kopie te zien van de licentie of stuur een brief naar Creative Commons, 444 Castro Street, Suite 900,
Mountain View, California, 94041, USA.
Opleiding: Amsterdamse Hogeschool voor de Kunsten
Faculteit: Reinwardt Academie
Begeleider: Gerdie Borghuis
Titel: Linked Data – Duurzaam voor de toekomst?
Auteur: Annette Allaart
Studiejaar: 2011
Datum: 5 oktober 2011

3
Voorwoord
Voor u ligt een scriptie welke het resultaat is van een onderzoek naar de mogelijkheden van Linked
(Open) Data, om duurzame toegang tot digitale erfgoedinformatie te bevorderen. Deze scriptie
vormt het einde van mijn studie Cultureel Erfgoed aan de Reinwardt Academie.
Het schrijven van een scriptie zag en zie ik nog steeds als een hele uitdaging. Ik ben dan ook trots op
het eindresultaat. Trots vanwege de discipline die ik mijzelf heb moeten opleggen. Zelfstandig
onderzoek doen betekent dat je geen stok achter de deur hebt in de vorm van een organisatie waar
je het onderzoek uitvoert.
Ik ben ook trots op het aantal pagina’s waaruit deze scriptie bestaat. Hieruit blijkt dat ik wel degelijk
‘verhaaltjes’ kan schrijven. Iets wat ik tijdens het schrijven niet voor mogelijk hield. Ik schreef mijn
eerste hoofdstuk in steno..
Bij deze wil ik daarom mijn begeleider vanuit de Reinwardt Academie, Gerdie Borghuis, bedanken. Zij
heeft me geleerd hoe ik de lezer aan de hand moet nemen in mijn verhaal.
Graag wil ik ook Enno Meijers en Inge Angevaare bedanken. Zij hebben mij met hun brede kennis van
digitale duurzaamheid, geholpen meer vorm aan mijn onderzoek te geven. Victor de Boer bedank ik
voor het overdragen van zijn kennis van het Semantisch Web en Linked (Open) Data aan mij. Judith
van Gent van het Amsterdam Museum bedank ik voor een kijkje in de praktijk. Zonder jullie was ik
ongetwijfeld nog steeds verdwaald in de enorme hoeveelheid ingewikkelde informatie die er te
vinden is over digitale duurzaamheid en Linked (Open) Data.
Een scriptie schrijven is een proces. Dit proces had ik niet kunnen volbrengen zonder de hulp en
steun van familie, vrienden en huisgenoten. Dank jullie wel!

4
Samenvatting
Digitale informatie is niet meer weg te denken uit onze kennissamenleving. In het hedendaagse leven
kan men niet meer zonder. Digitale duurzaamheid staat echter nog steeds in de kinderschoenen.
Duurzaamheid wordt voornamelijk gezien als veilige opslag van digitale objecten. Het duurzaam
toegankelijk houden van de digitale erfgoedinformatie wordt daarbij vergeten.
Het streven naar duurzame toegang tot digitale erfgoedinformatie is een grote uitdaging omdat er
drie soorten bedreigingen zijn die de risico’s op verlies van digitale informatie vergroten.
Deze afstudeerscriptie onderzoekt of het een mogelijkheid is de data in de collectiedatabase om te
zetten naar een Linked Open dataset, om zodoende duurzame toegang tot digitale erfgoedinformatie
te bevorderen.
Daarnaast is het doel een beeld te creëren wat Linked (Open) Data voor culturele erfgoedinstellingen
kan betekenen, hoe het werkt en wat het oplevert. Hierbij word het Amsterdam Museum als case-
study gebruikt. Zij zijn het eerste museum dat haar data in de collectiedatabase heeft omgezet naar
een Linked Open dataset.
Om duurzame toegang tot digitale erfgoedinformatie te bieden gaat dit onderzoek uit van het
strategische stappenmodel van Enno Meijers. Het stappenmodel bestaat uit drie delen. Het laatste
deel wordt gebruikt om de koppeling naar Linked (Open) Data te maken.
Linked (Open) Data wordt als de praktijk van het Semantisch Web gezien. Het Semantisch Web draait
om interoperabiliteit van de Web-resources. Door digitale objecten inhoudelijk aan elkaar te
koppelen ontstaat een betekenisvolle relatie.
Uit een analyse moet men tot de conclusie komen of Linked (Open) Data een mogelijkheid is om
duurzame toegang tot digitale informatie te bevorderen, of niet. De analyse vergelijkt de
beheersmaatregelen die worden geadviseerd in het derde deel van het stappenplan van Enno
Meijers met het Linked Data principe van Tim Berners-Lee.
Uit de analyse is gebleken dat er wel degelijk overeenkomsten zijn tussen deze twee thema’s. De
overeenkomsten hebben vooral betrekking op het toepassen van open standaarden ten behoeve van
metadata beheer en het signaleren van technologische veranderingen in de omgeving.
De volgende aanbevelingen zijn gedaan:
� Maak gebruik van de open standaard XML.
� Gebruik RDF/XML als schrijfwijze van het RDF-datamodel.
� Nader onderzoek naar de praktijk van deze conclusie.

5
Summary
Digital information has become part of our knowledge society. In daily life, we cannot live without
digital information anymore. Despite of this all, digital preservation is still a new market. It’s only
twenty years old.
Digital preservation is primarily seen as safe storage of digital objects. Sustainable access to the
digital information is something the heritage institutions don’t think of. To achieve sustainable access
to the digital information is a real challenge. There are three kinds of threats which will increase the
risk to lose digital information.
This thesis examines whether it’s a possibility to convert the collection data to Linked Open Data,
thereby promote sustainable access to digital heritage information. Moreover it’s a purpose to
create a picture of Linked (Open) Data. What do cultural heritage institutions have to do with? How
does Linked (Open) Data work? What does Linked (Open) Data bring the cultural heritage
institutions?
The Amsterdam Museum is the first museum in the Netherlands who converted their collection data
to Linked Open Data. I will refer to The Amsterdam Museum as they are used as a case study.
To offer sustainable access to the digital heritage information this examination studied the strategic
model for digital preservation by Enno Meijers. This model consists of three parts. The last part will
be used to make the connection to Linked (Open) Data.
Linked (Open) Data is called the more operative way of the Semantic Web. The Semantic Web is all
about interoperability of Web resources. By linking the digital objects with their inside the Semantic
Web creates meaningful relationships.
An analysis should be to conclude Linked (Open) Data is an opportunity to promote
sustainable access to digital information or not. The analysis compares the preservation tools
recommended in the third part of the strategic preservation model by Enno Meijers to the principles
of Linked Data by Tim Berners-Lee.
The analysis showed that there are indeed similarities between these two themes. The similarities in
particular related to the use of open standards for metadata management and the identification
of technological changes in the environment.
The following recommendations were made:
� Use the Open Standard XML,
� Use RDF / XML as the serialisation of the RDF-data model,
� Make sure you evaluate.

6
Inhoudsopgave
1 Inleiding en afbakening……………………………………………………………………………………………………….............9
Aanleiding………………………………………………………………………………………..........................................9
Hypothese………………………………………………………………………………………………...............................10
Onderzoeksvraag…………………………………………………………………………………………………..................11
Doelstelling...............................................................................................................................11
Afbakening................................................................................................................................11
Methode....................................................................................................................................12
2 Digitale toegankelijkheid...................................................................................................................14
2.1 Wat is digitale toegankelijkheid..............................................................................................14
Digitale duurzaamheid............................................................................................................................14
2.2 Wat is het doel van digitale toegankelijkheid?.......................................................................15
2.3 Waarom is digitale toegankelijkheid belangrijk?....................................................................15
2.4 Obstakels en digitale toegankelijkheid...................................................................................16
2.4.1 Veranderingen in de technologie en technische oplossingen.....................................16
Migratie.....................................................................................................................................17
Emulatie....................................................................................................................................17
Normalisatie..............................................................................................................................18
2.4.2 Veranderingen in de omgeving, hoe verder?...............................................................18
Expertisecentrum DAVID...........................................................................................................18
2.4.3 Veranderingen in de organisatie dankzij nieuw beleid................................................19
De BASIS....................................................................................................................................20
PLATTER.....................................................................................................................................21
Business Model Innovation........................................................................................................22
OAIS-model...............................................................................................................................22
2.5 Strategisch stappenmodel.......................................................................................................24
Volwassenheidsmodel...............................................................................................................25
2.5.1 Opbouw van het stappenmodel..................................................................................25
2.5.2 Deel C: Duurzaam toegang bieden...............................................................................26
Stap 1: duurzame toegang.........................................................................................................26
Stap 2: beheer van metadata.....................................................................................................27
Stap 3: de veranderende omgeving...........................................................................................29
3 Veranderingen van het Web...........................................................................................................30
3.1 Wat is het Web?.....................................................................................................................30
Internet......................................................................................................................................30
Hoe is het World Wide Web ontstaan?.....................................................................................30
Standaarden World Wide Web..................................................................................................31
3.2 Het DNA van het Web............................................................................................................31
3.3 Het ‘Social Web’.....................................................................................................................32
Interactief..................................................................................................................................32
3.4 Het Semantisch Web..............................................................................................................33
Hoe werkt het?..........................................................................................................................34
Ontologie...................................................................................................................................35

7
4 Linked Open Data...............................................................................................................................37
4.1 Wat is Linked (Open) Data?.....................................................................................................37
4.2 Wat is de meerwaarde voor de erfgoedsector?......................................................................38
4.3 Hoe verhouden Linked (Open) Data en het Semantisch Web zich tot elkaar?......................39
4.4 Linked Data – Open Data – Linked Open Data........................................................................40
Linked Data...............................................................................................................................40
Open Data..................................................................................................................................40
Linked Open Data......................................................................................................................41
4.5 De technische aspecten van Linked (Open) Data....................................................................41
4.5.1 Syntactische transformatie..........................................................................................41
XML............................................................................................................................................41
Uniform Resource Identifier......................................................................................................42
HyperText Transfer Protocol......................................................................................................42
4.5.2 Semantische transformatie..........................................................................................42
Triple..........................................................................................................................................43
Resource Description Framework..............................................................................................43
4.6 Linked (Open) Data – wat nu?.................................................................................................45
Linked (Open) Data browser......................................................................................................45
Linked (Open) Data zoekmachines............................................................................................45
Linked (Open) Data applicaties..................................................................................................46
5 Linked Open Data in de praktijk........................................................................................................47
5.1 Aandacht voor Linked (Open) Data.........................................................................................47
5.2 Aan de slag...............................................................................................................................47
5.2.1 ‘The Linking Open Data Project’...................................................................................48
5.2.2 Amsterdam Museum als Linked Open Data.................................................................48
Wat levert het op?.....................................................................................................................49
Nadelen.....................................................................................................................................49
Europeana.................................................................................................................................50
Apps for Amsterdam..................................................................................................................50
Tot slot………………………………………………………………………………………………………………………………….50
5.2.3 MultimediaN N9C Eculture Project..............................................................................51
5.2.4 Europeana....................................................................................................................52
5.2.5 Apps for Amsterdam....................................................................................................52
6 Conclusie en aanbevelingen..............................................................................................................53
Hypothese.................................................................................................................................53
Aanalyse stappenmodel Enno Meijers en Linked Data principe Tim Berners-Lee....................53
Referentie metadata.................................................................................................................54
‘Fixity’ en ‘provenance’.............................................................................................................54
Het leesbaar houden van de informatie....................................................................................54
De behoefte van de gebruiker...................................................................................................55
Aanbevelingen...........................................................................................................................55
7 Geraadpleegde bronnen....................................................................................................................57
8 Afbeeldingenlijst................................................................................................................................59
A Strategisch Stappenmodel Enno Meijers..........................................................................................60
B Linked Open Data Cloud Diagram.....................................................................................................61

8
1 Inleiding en afbakening
Deze scriptie behandelt de duurzame toegankelijkheid van digitale erfgoedinformatie en welke rol
Linked Data hierin kan spelen. Dit zijn twee grote thema’s die met elkaar in verbinding zullen worden
gebracht.
Aanleiding
Digitale informatie is niet meer weg te denken uit onze kennissamenleving. In het hedendaagse leven
kan men niet meer zonder. Het is een essentieel bestanddeel van onze kenniseconomie. In vrijwel
elke sector, publiek en privaat, speelt digitale informatie een grote rol van betekenis.
De instellingen binnen de culturele erfgoed sector zijn driftig aan de slag gegaan met digitaliseren
van hun collectie. Om mee te blijven doen in de kennissamenleving bieden zij laagdrempelig toegang
tot hun digitale informatie. Hiervoor zijn een aantal redenen te noemen1:
� Internet vereenvoudigt deelname van andere partijen aan informatieverspreiding.
� De instellingen proberen op deze manier hun meerwaarde in de kennissamenleving te
behouden.
� De verschuiving van informatieschaarste naar informatieovervloed maakt deze instellingen
niet meer de autoriteit op het gebied van kennis, bovendien zijn zij niet langer de
toegangspoort tot de informatie.
Het digitaliseren staat dus wel degelijk hoog op de agenda. Digitale duurzaamheid staat echter nog
steeds in de kinderschoenen. Duurzaamheid wordt voornamelijk gezien als veilige opslag van digitale
objecten.2
Het streven naar duurzame toegang tot digitale erfgoedinformatie is dus een grote uitdaging, maar
het is ook een probleem dat nog geen twintig jaar oud is.
Informatie op traditionele dragers van papier is zonder schadelijke invloeden van buitenaf jaren
bruikbaar. Je moet alleen kunnen lezen en de taal begrijpen. Dit is niet het geval bij digitale
informatie. Digitale informatie kent drie soorten bedreigingen die de risico’s op verlies van digitale
informatie vergroten:
� Technologie
� Metadata
� Organisatie
In zijn master thesis Stapsgewijs naar duurzame toegang heeft Enno Meijers een strategisch
stappenmodel ontwikkeld om stapsgewijs de risico’s op verlies van digitale informatie te verkleinen.
1 Enno Meijers, Stapsgewijs naar duurzame toegang. Onderzoek naar een strategisch stappenmodel voor
duurzame toegang tot digitale informatie in kleine en middelgrote erfgoedinstellingen. Thesis Master of
Business Informatics – Avans+ (Middelburg, april 2010), 11-12. 2 Meijers, Stapsgewijs naar duurzame toegang, 38.

9
Dit stappenplan is op te delen in drie delen waarin vijftien factoren worden beschreven om tot een
duurzame borging van digitale informatie te komen:
� Het bepalen van de ambitie van de organisatie.
� De digitale objecten veilig stellen.
� Het duurzaam toegang bieden.
In mijn onderzoek ga ik in op het derde deel van het stappenplan: het duurzaam toegang bieden.
Hierin komen de volgende factoren aan bod:
� Beschrijven van de doelen voor duurzame toegang.
� Metadata beheer.
� De veranderende omgeving.
Enno Meijers beschrijft in dit derde deel, over duurzame toegang bieden, de behoefte aan open
standaarden en open source software. Het toepassen van open standaarden en open source
software zouden de beste overlevingskansen bieden voor het duurzaam toegankelijk houden van
digitale informatie.
Hier haakt het tweede thema van deze scriptie op in. Linked (Open) Data is een nieuwe technologie
die een intelligenter Web ondersteunt, dat gebaseerd is op open standaarden. Het is een
ontwikkeling die in 2011 meer bekendheid kreeg door de Europeana database en de aandacht die de
grote instellingen als de Koninklijke Bibliotheek, Nationaal Archief, Digitaal Erfgoed Nederland en
Nationale Coalitie Digitale Duurzaamheid eraan gaven.
Op 13 mei vond het Dutch Culture Linked Open Data Event plaats in Haarlem. Hier verzamelde het
erfgoedveld van Nederland en België zich om meer over deze nieuwe technologie te weten te komen
en het gebruik ervan te bevorderen. Ook ik was van de partij, dit vormde het startschot voor mijn
scriptie.
Hypothese
Linked (Open) Data is een nieuwe praktijk van het Semantisch Web. Linked (Open) Data wordt ook
wel gezien als een pragmatische manier om een praktische bijdrage te leveren aan het Semantisch
Web.3 Praktisch vanwege de toepasbaarheid van Linked (Open) Data. In deze scriptie zie ik Linked
(Open) Data als een technologische verandering in de omgeving. Ik wil ik deze toepasbaarheid
koppelen aan het duurzaam toegang bieden tot digitale erfgoedinformatie. Is dit mogelijk en wat is
hiervoor nodig? Zijn er overeenkomsten tussen de Linked (Open) Data technologie en de
beheersmaatregelen voor duurzame toegang tot digitale informatie? Mijn veronderstelling is dat er
overeenkomsten zijn die het mogelijk maken de Linked (Open) Data technologie te gebruiken als
beheersmaatregel voor duurzame toegang tot digitale informatie.
3 http://www.den.nl/thema/129/ (Linked Open Data) (geraadpleegd: 09-06-2011)

10
Onderzoeksvraag
Het voorgaande resulteert in de volgende hoofdvraag:
Is Linked (Open) Data, als toepassing van het semantisch web, een mogelijkheid om digitale
erfgoedinformatie duurzaam toegankelijk te maken?
De bijbehorende deelvragen zullen het onderzoek meer diepte geven:
� Wat is digitale duurzaamheid?
� Wat is het maatschappelijk belang van het duurzaam toegankelijk maken van digitale
(erfgoed) informatie?
� Welke mogelijkheden voor het duurzaam toegankelijk maken van digitale (erfgoed)
informatie zijn er al?
� Wat is semantisch web?
� Welke ontwikkelingen zijn er vooraf gegaan aan het semantisch web?
� Wat is Linked Open Data (LOD)?
� Hoe verhouden LOD en het semantisch web zich tot elkaar?
� Door wie wordt deze toepassing van semantisch web al gebruikt?
� Wat zijn de voors/tegens van LOD als toepassing van semantisch web?
� Hoe werkt LOD?
� Welke stappen moeten doorlopen worden om van data LOD te maken?
� Is er een verschil tussen erfgoedinstellingen en niet-erfgoedinstellingen, in duurzaam
toegankelijk maken van informatie?
Doelstelling
Mijn doelstelling is de erfgoedprofessional een duidelijk beeld te geven wat Linked (Open) Data is en
hoe het kan bijdragen aan duurzame toegankelijkheid van digitale erfgoedinformatie.
Afbakening
Aangezien duurzame toegankelijkheid even als Linked (Open) Data grote begrippen zijn, is het nodig
een afbakening te maken.
Dit onderzoek heeft plaatsgevonden binnen de publieke sector. Hierin worden drie terreinen
onderscheiden:4
� Wetenschap
� Overheid
� Cultuur en media
Binnen het cultuur en media terrein onderscheidt het ministerie van Onderwijs, Cultuur en
Wetenschap drie andere verdelingen:
� Media
� Letteren en bibliotheken
� Cultureel erfgoed
4 Inge Angevaare ed., Toekomst voor ons digitaal geheugen. Duurzame toegang tot informatie in Nederland
(Den Haag: Nationale Coalitie voor Digitale Duurzaamheid, juli 2009), 15.

11
Cultureel erfgoed is het gemeengoed van de Reinwardt Academie. Het omvat de musea,
monumenten, archeologie en archieven. Dit is ook het terrein waarin ik de duurzame
toegankelijkheid van digitale informatie bestudeer.
Na aangegeven te hebben welk terrein binnen de sector cultuur en media ik bestudeer, zal ik nu
duidelijk maken wat ik onder digitale (erfgoed) informatie versta.
Binnen de culturele erfgoedsector onderscheiden we drie verschillende soorten digitaal cultureel
erfgoed:
� Born-digital erfgoed materiaal, dit zijn objecten die van origine digitaal zijn. Het zijn
erfgoedobjecten die niet van analoge objecten zijn afgeleid. Hierbij kun je denken aan
bouwtekeningen die gemaakt zijn met behulp van CAD/CAM-programmatuur, e-
maildossiers, games, verrijkte publicaties, tweets en websites.5
� Gedigitaliseerd erfgoed, hiervan kennen we twee soorten. 1. Gedigitaliseerd erfgoed dat het
origineel heeft vervangen en nu als een digitaal substituut geldt. 2. Gedigitaliseerd erfgoed
waarbij het fysieke origineel bewaard blijft.6
� Digitale informatie over erfgoed, hieronder vallen bijvoorbeeld beschrijvingen die zijn
vastgelegd in collectie-informatiesystemen.7
In dit onderzoek laat ik born digital materiaal buiten beschouwing. Dit vanwege de complexiteit en
de ‘nieuwheid’ van het materiaal.
Wanneer ik het over digitale (erfgoed) informatie heb, bedoel ik hiermee gedigitaliseerd erfgoed
en/of digitale informatie over erfgoed.
Methode
Ik heb geprobeerd meer grip te krijgen op de twee begrippen: duurzame toegankelijkheid en Linked
(Open) Data, door eerst theoretisch onderzoek te doen, hierbij heb ik zowel literatuur als het
internet geraadpleegd. De belangrijkste bronnen die ik gebruikt heb zijn:
� Meijers, E., Stapsgewijs naar duurzame toegang. Onderzoek naar een strategisch
stappenmodel voor duurzame toegang tot digitale informatie in kleine en middelgrote
erfgoedinstellingen. Thesis Master of Business Informatics – Avans+ (Middelburg, april 2010).
� Angevaare, I. ed., Toekomst voor ons digitaal geheugen. Duurzame toegang tot informatie in
Nederland (Den Haag: Nationale Coalitie voor Digitale Duurzaamheid, juli 2009).
� www.den.nl
Daarnaast heb ik met diverse mensen uit het werkveld gesproken. Ik heb ze gevraagd naar hun
mening en ervaring met digitale toegankelijkheid en Linked (Open) Data. Zoals ik al aangaf wordt
Linked (Open) Data als de ‘praktijk’ van het Semantisch Web gezien. Het Amsterdam Museum is de
eerste Nederlandse culturele erfgoedinstelling die deze ‘praktijk’ ook daadwerkelijk in praktijk heeft
gebracht. Zij hebben hun collectiedatabase als een Linked Open Dataset ontsloten. Ik ben bij het
Amsterdam Museum langs geweest om te weten te komen wat hun ervaringen zijn.
5 M. Van der Graaf en G.J. Nauta, ‘Noodklok voor behoud van born-digital erfgoed’, Informatie Professional (04
/ 2010), 12-15. 6 http://www.den.nl/bericht/2283 (Digitaal duurzame bewaartermijnen?) (geraadpleegd: 22-09-2011)
7 Ibidem.

12
In veel van de gesprekken met experts op dit gebied kwam naar voren hoe ambitieus mijn
onderwerp is. Het zijn twee grote thema’s die beide nog veel bestudeerd dienen te worden. Het was
dan ook erg moeilijk om me niet te verliezen in de complexiteit van voornamelijk het thema digitale
toegankelijkheid. Ik kom nog maar net kijken, terwijl sommige experts al tien jaar bezig zijn op dit
terrein en nog steeds niet alles weten. Toch verwacht ik met deze scriptie de brug tussen de technici
en de erfgoedprofessionals te slaan door op een begrijpelijke manier uit te leggen hoe digitale
toegankelijkheid en Linked (Open) Data met elkaar verweven zijn en wat zij voor elkaar kunnen
betekenen.

13
2 Digitale Toegankelijkheid
Digitale toegankelijkheid gaat vanzelfsprekend samen met de komst van het digitale tijdperk.
2.1 Wat is digitale toegankelijkheid?
Met het ontstaan van het Internet in de jaren ’70, de komst van de eerste ‘personal computer’ in
1981 van IBM en de komst van het Web van Tim Berners Lee in 1991 veranderde er niet alleen veel
in positieve zin, maar ook in negatieve zin.
Het Web bijvoorbeeld, is een handig middel om informatie sneller op te vragen en te verspreiden.
Informatie sneller opvragen gebeurd door slimme ‘browsers’ op het Internet. Informatie verspreiden
gaat door webtoepassingen als virtuele tentoonstellingen. Deze voorbeelden kunnen allemaal
digitale technieken genoemd worden.
In de jaren tachtig van de vorige eeuw realiseerde men zich dat de opkomende digitale technieken
ook risico’s met zich mee brachten. Jeff Rothenberg benoemde de onderstaande technische
problemen8:
� De dragers (cd, dvd, floppy disk) hebben een beperkte levensduur, vaak niet meer dan vijf
jaar.
� De informatie bestaat uit een op zichzelf betekenisloze ‘bitstream’, alleen met behulp van de
juiste hardware-/softwarecombinatie kan die informatie tot leven gewekt worden.
� De betekenis kan alleen achterhaald worden als aan de ‘bitstream’ zelf contextinformatie is
toegevoegd.
Deze risico’s vragen om oplossingen. Dit is echter niet eenvoudig. In tegenstelling tot papier dat
eeuwenlang in een constante (geklimatiseerde) omgeving bruikbaar kan worden gehouden, gelden
voor digitale informatie heel andere regels. Digitale informatie en haar dragers zijn niet
vanzelfsprekend geschikt voor bewaring op de lange termijn.
Met iedere nieuwe ontwikkeling van hard- en software zullen we de digitale informatie en hun
dragers moeten controleren of zij nog wel bruikbaar zijn. Dit gebeurd door de ‘bitstream’ te
controleren. Blijkt de ‘bitstream’ niet meer toegankelijk te zijn, dan moet er een passende oplossing
gevonden worden om de toegankelijkheid op de lange termijn te waarborgen. Deze controle van de
digitale informatie en haar dragers, vereist een continu proces van aandacht en zorg. We noemen dit
een streven naar digitale duurzaamheid.9
Digitale Duurzaamheid?
Een streven naar digitale duurzaamheid dus. Wat is dan digitale toegankelijkheid?
De Nationale Coalitie Digitale Duurzaamheid heeft in het rapportToekomst voor ons digitaal
geheugen aangegeven liever over duurzame toegang of duurzame toegankelijkheid te spreken dan
8 Rothenburg, Jeff, ‘Ensuring the Longevity of Digital Information’, Scientific American, vol. 272, nr. 1 (1999) 24-
29. 9 Angevaare, Toekomst voor ons digitaal geheugen, 23.

14
van digitale duurzaamheid. De reden die zij hiervoor geven is dat duurzame bewaring zonder
toegankelijkheid geen zin heeft.10
In mijn gesprek met Inge Angevaare (coördinator NCDD) gaf zij ook aan dat duurzame
toegankelijkheid bestaat uit twee delen:
� Het bewaren van het object voor de toekomst,
� Het op de lange termijn beschikbaar houden voor de gebruiker.
Ik sluit me aan bij de NCDD en zal in deze scriptie de term duurzame toegankelijkheid gebruiken.
2.2 Wat is het doel van digitale toegankelijkheid?
“Duurzaamheid opzich is nooit het doel” [Inge Angevaare, NCDD, 21-06-2011]11
Het doel van digitale toegankelijkheid is het langdurig bewaren van digitale informatie en
beschikbaar houden voor de gebruikers, zodat de digitale informatie (her)gebruikt kan worden in de
toekomst en men erop kan vertrouwen dat de informatie authentiek en betrouwbaar is.12
2.3 Waarom is digitale toegankelijkheid belangrijk?
In het hedendaagse leven kan men niet meer zonder digitale informatie. Digitale informatie is een
essentieel bestandsdeel van onze kenniseconomie. In vrijwel elke sector publiek en/of privaat speelt
informatie een rol van betekenis. Tegenwoordig spreken we zelfs van een informatieovervloed in
plaats van informatieschaarste. De publieke sector investeert in de productie en verwerving van
digitale informatie en wil deze langdurig toegankelijk houden.
Binnen de culturele sector wordt het belang van deze taak benadrukt door de Raad van Cultuur. Zij
wijzen op het belang van cultuurhistorie wat indirect het belang van digitale toegankelijkheid tot
digitale erfgoedinformatie onderstreept. In het beleidsstuk Innoveren, Participeren!, zeggen zij:
‘Een samenleving die vooruit wil, doet er verstandig aan óók achterom te kijken. Het verleden
moet niet worden vergeten, maar opgepoetst en gebruikt. Zonder continuïteit raken we op
drift en koersen we van het ene incident naar het volgende. Ons collectieve geheugen,
waarvan belangrijke delen zijn opgeslagen in archieven, musea en bibliotheken, schept een
onmisbare basis voor die continuïteit.’ [Innoveren, Participeren!, 2007, p.12]
De NCDD sluit zich hierbij aan door het volgende te zeggen:
‘Geschiedschrijving wordt in de toekomst onmogelijk als wij er anno 2008 niet voor zorgen
dat digitale informatie over onze samenleving wordt bewaard.’13
10
Ibidem, 13. 11
Gesprek met Inge Angevaare, coördinator Nationale Coalitie Digitale Duurzaamheid, 21-06-2011. 12
Ibidem, 12. 13
http://www.ncdd.nl/digitaleduurzaamheid-inleiding.php (Inleiding in Digitale Duurzaamheid)(geraadpleegd:
4-07-2011)

15
Digitaal Erfgoed Nederland, Kennisland en het Ministerie van OCW benadrukken in het rapport
Business Model Innovatie Cultureel Erfgoed juist de waardecreatie die toegang tot digitale collecties
brengt:
‘De digitale collecties vertegenwoordigen een grote potentiële economische en
maatschappelijke waarde, mits ze optimaal toegankelijke worden gemaakt.’14
Naast deze redenen voor cultuurbesef en waardecreatie gelden er nog een aantal redenen die
voornamelijk van technologische en organisatorische aard zijn15
:
� Erfgoedinstellingen investeren de laatste jaren fors in digitalisering van hun collecties.
Duurzame toegankelijkheid van de digitale informatie waarborgt in zekere zin deze
investering in digitalisering.
� Digitalisering van de collecties levert digitale reproducties van o.a. kwetsbare originelen.
Deze hoeven dankzij de digitale reproductie niet vaak uit het depot gehaald te worden.
Indirect zorgt duurzame toegankelijkheid van digitale informatie op deze manier ook voor
duurzaamheid van het fysieke object.
2.4 Obstakels en digitale toegankelijkheid?
In paragraaf 1.1 zijn al kort de grootste risico’s die de toegankelijkheid tot digitale informatie
bedreigen, uiteengezet. Er zijn echter drie soorten bedreigingen te noemen met elk hun eigen
kenmerkende risico’s die de duurzame toegang tot digitale informatie in gevaar brengen. Hieronder
de drie soorten bedreigingen16
:
� Veranderingen in de technologie;
� Veranderingen in de omgeving;
� Veranderingen in de organisatie.
Hoe vangen we deze risico’s en bedreigingen op en zorgen we ervoor dat de digitale informatie goed
bewaard en beheerd wordt?
Om de verschillende soorten bedreigingen van toegang tot digitale informatie te beperken kunnen
verschillende beheersmaatregelen worden gehanteerd. Deze kunnen betrekking hebben op de
technologie en/of beleid en organisatie. We noemen dit ook wel bewaarstrategieën.
Op de komende pagina’s worden de verschillende bedreigingen met hun bijbehorende (mogelijke)
bewaarstrategieën beschreven.
Deze beheersmaatregelen kunnen echter nog niet als DE oplossing worden gezien. De problematiek
van digitale toegankelijkheid tot digitale informatie is daarvoor nog te jong, nog geen twintig jaar
oud. Deze beheersmaatregelen proberen de risico’s en bedreigingen tot een minimum te beperken.
14
M. De Niet, L. Heijmans en H. Verwayen e.a., Business Model Innovatie Cultureel Erfgoed, (Ministerie OCW:
z.pl. 2009), 6-7. 15
http://www.den.nl/thema/16/digitale-duurzaamheid (Digitale Duurzaamheid) (geraadpleegd: 4-07-2011) 16
Meijers, Stapsgewijs naar duurzame toegang, 13.

16
2.4.1 Veranderingen in de technologie en technische oplossingen
Veranderingen in de technologie omvatte de risico’s die Jeff Rothenberg aangaf. Deze risico’s hebben
voornamelijk betrekking op het bewaren van de digitale informatie.
Digitale informatie bestaat uit enen en nullen (bitstream) die alleen betekenis krijgen wanneer deze
wordt afgespeeld op dezelfde combinatie van hard- en software. Dit zou niet een heel groot
probleem moeten zijn mits de voortdurende ontwikkeling van nieuwe hard- en softwareproducten
niet zo groot en snel was dat digitale informatie al na tien jaar onbruikbaar is. Wanneer een van de
twee of beide verouderen en de informatie niet meer leesbaar is, moet een oplossing worden
gevonden. Daarnaast speelt ook de beperkte houdbaarheid van digitale informatie dragers een rol.17
Omdat dit een technische zaak betreft, vraagt dit om een technische beheersomgeving.
Er zijn drie bekende technische bewaarstrategieën:
� Migratie,
� Emulatie,
� Normalisatie
Migratie
Bestanden worden overgezet van de ene hardwareconfiguratie of softwareapplicatie naar de andere.
Het bestand wordt dan niet meer als een bitstream opgeslagen maar in een formaat dat gangbaar en
geschikt is voor de toekomst.
Een goed voorbeeld is wanneer we een tekst hebben getypt op een computer met Windows 95
software en deze willen openen op onze nieuwe computer met de software Windows 2007. We
zullen dan eerst het Windows 95 bestand moeten converteren naar een Windows 2007 bestand,
voordat we het kunnen lezen. Anders kan de computer de bitstream niet meer ‘lezen’.
Migratie is gericht op het behoud van data, er zijn echter toch een aantal nadelen. Migratie moet
elke ± twee jaar herhaald worden om te voorkomen dat dit bestandsformaat ook niet verouderd en
niet meer toegankelijk is. Het leidt vaak tot verlies van informatie. De nieuwe software kan het
bestand niet meer ‘lezen’ zoals het was. Er kunnen kenmerken als inhoud, structuur, uiterlijk of
gedrag verloren gaan. Het verlies van informatie leidt uiteindelijk tot aantasting van de authenticiteit
van het bestand.18
Emulatie
Een andere manier om je digitale informatie te behouden voor de toekomst is emulatie. Volgens
sommige mensen is dit de enige mogelijkheid om de authenticiteit en integriteit van een digitaal
bestand op de lange termijn te behouden.19
17
Angevaare, Toekomst voor ons digitaal geheugen, 11. 18
http://www.nationaalarchief.nl/informatiebeheer-archiefvorming/-digitaal-
archiefmateriaal/bewaarstrategie%C3%ABn/migratie (Migratie) (geraadpleegd: 22-09-2011) 19
http://www.nationaalarchief.nl/informatiebeheer-archiefvorming/-digitaal-
archiefmateriaal/bewaarstrategie%C3%ABn/emulatie (Emulatie) (geraadpleegd: 22-09-2011)

17
Bij emulatie blijft het oorspronkelijke bestand, bestaande uit het besturingssysteem en de software
behouden. De bitstream wordt, in tegenstelling tot bij migratie, niet veranderd. Er wordt als het ware
een software ontwikkeld die een nieuwe computer kan laten functioneren als een ouder model. De
oorspronkelijke omgeving wordt dus nagebootst op een nieuwe computer.20
20
Ibidem.

18
Normalisatie
Dit is een techniek met als doel alle digitale informatie te converteren naar een zelfde
bestandsformaat. Deze methode wordt voornamelijk gebruikt wanneer er is besloten niet alle
bestandsformaten op te nemen in de digitale collectie.21
2.4.2 Veranderingen in de omgeving, hoe verder?
Niet alleen het bewaren van digitale informatie is belangrijk. We moeten de digitale informatie als
we ze teruglezen ook in een context kunnen plaatsen, zodat we de betekenis van de inhoud kunnen
begrijpen.
De ‘bitstream’ wordt pas informatie wanneer extra informatie over deze data beschikbaar is. Deze
extra informatie geeft betekenis aan de data. We noemen deze extra informatie: metadata. Op deze
manier wordt er context gecreëerd.
Het beheren van de relevante metadata van digitale informatie is weer een extra uitdaging.22
Hier
komt ook de problematiek rondom het beheren van de relevante metadata voor duurzaamheid aan
het licht:
� De digitale objecten en de metadata worden beheerd in omgevingen waar in beperkte mate
sprake is van professioneel IT-beheer.
� Het beheer van metadata richt zich vrijwel uitsluitend op de inhoud; het vastleggen van
metadata noodzakelijk voor duurzaam beheer zoals het registeren van gebruikte formaten,
herkomst- of referentie informatie of het vastleggen van een digitale ‘handtekening’ bij de
objecten krijgt weinig aandacht.
Dit deel van de problematiek van digitale toegankelijkheid is nog nauwelijks verkend. Enno Meijers
geeft aan dat de markt, om deze problematiek te verkleinen, nog niet ver genoeg ontwikkeld is. Hij
suggereert dat Digitaal Erfgoed Nederland deze markt kan ontwikkelen door hierin een sturende en
stimulerende rol te spelen. Daarnaast geeft hij aan dat het beheren van de relevante metadata voor
duurzaamheid ook op het terrein van inspelen op technologische veranderingen slaat.
In België hebben ze in 2009 een product op de markt gebracht om de problematiek van metadata
beheer voor duurzaamheid te verkleinen. Dit stappenplan ontwikkeld door Expertisecentrum DAVID
uit Antwerpen, bevat een tiental praktische richtlijnen om de risico’s die duurzame toegankelijkheid
van digitale informatie met zich meebrengt te verkleinen. Het focust zich voornamelijk op juist
software gebruik en metadata beheer.
Expertisecentrum DAVID
Het stappenplan van het expertisecentrum DAVID in Antwerpen is gebaseerd op de functionele
vereisten van digitale archivering en de bijbehorende maatregelen voor risicobeheer.
21
Angevaare, Toekomst voor ons digitaal geheugen, 25. 22
Meijers, Stapsgewijs naar duurzame toegang, 14.

19
Digitaal archiveren wordt als een risicovol en kwetsbaar reconstructieproces gezien. Bij het bouwen
en beheren van een digitaal archief gelden daarom vijf terugkerende basisprincipes23
:
1. Vermijd (externe) afhankelijkheden.
2. Vermijdt overbodige reconstructiestappen.
3. Pas risicospreiding en –beheer toe.
4. Pas normen en standaarden toe.
5. Documenteer de implementatie en het beheer.
Deze vijf basisprincipes vormen de basis voor de acties die voor elke stap worden uitgevoerd.
Deze tien stappen zijn verdeeld in drie groepen: Groep 1 houdt zich bezig met de keuze en inrichting
van de hard- en softwarearchitectuur. Groep 2 organiseert de functionaliteiten rondom leesbaarheid,
authenticiteit en integriteit. De laatste groep documenteert het digitaal archiveringssysteem24
.
Dit stappenplan stelt iedere organisatie in staat een betrouwbaar digitaal archief op te stellen.
2.4.3 Veranderingen in de organisatie dankzij nieuw beleid
De langetermijnzorg van digitale informatie vraagt om continue aandacht en zorg. De laatste jaren
groeide het besef dat technische oplossingen niet voldoende zijn om de digitale risico’s die de
duurzame toegang tot digitale informatie in gevaar brengen te beheersen. Om technische
oplossingen te kunnen ontwikkelen en te implementeren zijn beleidsmatige en organisatorische
randvoorwaarden nodig.25
Er moeten strategische keuzes binnen de organisatie worden gemaakt die
een duurzaamheidstrategie implementeren. Deze strategische keuzes kunnen invloed hebben op de
hele organisatiestructuur.26
23
Filip Boudrez, Een digitaal archief in 10 stappen, (Antwerpen: Expertise Centrum DAVID vzw, 2009), 1. 24
Boudrez, Een digitaal archief in 10 stappen, 2. 25
Angevaare, Toekomst voor ons digitaal geheugen, 25. 26
Meijers, Stapsgewijs naar duurzame toegang, 15.
1. Gebruik een betrouwbaar en beveiligd opslagsysteem en pas een adequaat beheer toe.
2. Bewaar de metadata op een digitaal duurzame wijze.
3. Voorzie een duurzame band tussen het document en zijn metadata.
4. Registreer voor elk digitaal object metadata.
5. Definieer en documenteer de essentiële eigenschappen van het originele document.
6. Bewaar de leesbaarheid van de digitale documenten.
7. Archiveer alle componenten die nodig zijn voor een getrouwe reconstructie van de
documenten.
8. Documenteer het beheer van de digitale documenten.
9. Beschrijf de digitale documenten.
10. Documenteer het digitale archief.

20
Er zijn diverse soorten beleidsmatige en organisatorische randvoorwaarden gedefinieerd. De
volgende pagina’s beschrijven bestaande beheersmaatregelen die gebruikt zijn als instrument voor
beleidsontwikkeling.
Tot instrumenten voor beleidsontwikkeling behoren De BASIS van Digitaal Erfgoed Nederland,
“Planning Tool for Trusted Electronic Repositories – PLATTER” door het project Digital Preservation
Europe (DPE) en Business Model Innovatie ontwikkeld vanuit het Ministerie van OCW.
De BASIS
De culturele erfgoed sector vind deze randvoorwaarden voornamelijk in ‘de BASIS voor
Duurzaamheid’ van DEN.27
Digitale toegankelijkheid op de lange termijn is een continu proces en begint al bij de creatie van het
digitale bestand. De BASIS is een strategie waarin de technische- en ICT-infrastructuur
beheersmaatregelen elkaar ontmoeten, die is gebaseerd op de kwaliteitscyclus van DEN en bestaat
uit minimale eisen die elkaar in verschillende fasen opvolgen28
.
27
http://www.den.nl/pagina/217/standaarden_en_richtlijnen/ (DE BASIS voor digitale duurzaamheid)
(geraadpleegd: 26-07-2011) 28
Ibidem.
Fase 1: beleid ontwikkelen
Iedere erfgoedinstelling die digitale informatie produceert moet denken aan een
duurzaamheidstrategie. Bij het opstellen van een duurzaamheidbeleid moet rekening worden
gehouden met vier aspecten:
- Documentatie, het formuleren van een informatieplan.
- Organisatie, de gehele organisatie is zich bewust van de betekenis van
duurzaamheid
- Middelen, er wordt budget gereserveerd.
- Technische oplossing, welke systemen worden gebruikt? Eigen beheer ja/nee?
Fase 2: plannen maken
Er worden concrete plannen geformuleerd die gebaseerd zijn op het beleid om collecties te
digitaliseren en digitale informatie te beheren. Hieraan worden een aantal eisen gesteld:
- Wat wordt bewaard? Er dienen selectiecriteria opgezet te worden.
- Criteria voor bestandsformaten, welke bestandformaten worden opgenomen?
- Uitvoerbare plannen, check-check-dubbel check.
- Kennis van externe voorzieningen, kijk eens bij de buren, hoe doen zij het?

21
De BASIS voor Duurzaamheid bestaat nu twee jaar en zal in 2011 geëvalueerd worden en indien nog
aangepast.
PLATTER
Een ander goed werkende beleidsstrategie die duurzame toegang tot digitale informatie nastreeft is
de “Planning Tool for Trusted Electronic Repositories - PLATTER” [DPE, 2008].
Dit is een instrument ontwikkeld door het project Digital Preservation Europe. Het heeft als doel te
komen tot het formuleren van concrete, meetbare doelstellingen voor het digitaal archief.29
PLATTER richt zich op negen strategische plannen die samen een duurzaam beleid vormen ten
opzichte van toegang tot digitale informatie die in verband worden gebracht met de tien Core
Principles of Trust Repository Design30
.
29
Meijers, Stapsgewijs naar duurzame toegang, 32. 30
Statsbiblioteket, HATII ed., Repository Planning Checklist and Guidance, (Glasgow: HATII, 2008), 9.
Fase 3: uitvoering
Concrete oplossingen voor duurzame toegankelijkheid tot digitale informatie moet aan een
aantal eisen voldoen:
- Kennisuitwisseling, er dient een aanspreekpunt binnen de organisatie te zijn.
- Referentiemodel, wanneer een eigen ‘repository’ wordt gemaakt dient die volgens het
OAIS-model te zijn opgezet.
Fase 4: evaluatie
Wanneer een erfgoedinstelling duurzame toegang tot digitale informatie nastreeft dient een
evaluatie plaats te vinden die aan een basiseis voldoet:
- Toetsing van een eigen ‘repository’ dient plaats te vinden met TRAC.
1. Business Plan – Financiële planning, monitoring en planning.
2. Acquistion Plan – Evaluatie beleid. Beheren van de relaties met aanbieders en andere
leveranciers.
3. Staffing Plan – Aquisitie en onderhoud van relevante vaardigheden voor depotbeheer.
4. Acces Plan – Toegangsbeleid. Beheren van gebruikersrelaties.
5. Technical Plan – Doelen vaststellen voor hardware, software en netwerken.
6. Data Plan – Specificatie van data en metadata van objecten, formaten en structuren voor
opname, opslag en verspreiding samen met de relevante transformaties en
mappings.
7. Succession Plan – Beheren van contracten na verloop van het archief om digitale objecten te
behouden voor de toekomst.
8. Disaster Plan – Reageren op veranderingen in het archiefsysteem.
9. Preservation Plan – Erop toezien dat de toegang en bruikbaarheid van de digitale objecten in

22
Business Model Innovatie
Als het om beleidsontwikkeling gaat, mag een Business Model niet vergeten worden. Ook niet bij
ontwikkeling van beleid voor duurzame toegankelijkheid tot digitale informatie. Het bieden van
duurzame toegang tot digitale informatie vraagt om financiële middelen. Voordat men investeert in
duurzame toegang moet duidelijk zijn wat de baten zijn van deze toekomstige investering.31
Het Business Model dat besproken wordt in Business Model Innovatie, Cultureel Erfgoed van DEN,
Kennisland en het Ministerie van OCW gaat uit van negen bouwstenen die in directe relatie tot elkaar
staan.32
In de vorige pagina’s hebben we stil gestaan bij beheersmaatregelen die betrekking hebben op het te
vormen beleid en de technologie die nodig is om de risico’s die de duurzame toegang tot digitale
informatie in gevaar brengen te verkleinen. Beleidsmatige- en technologische beheersmaatregelen
ontmoeten elkaar bij het inrichten van een stabiele interne infrastructuur. Het inrichten van een
stabiele interne infrastructuur is het derde aspect van duurzaam beheren. Dit derde aspect is nog
niet eerder genoemd als duurzaam beheersaspect, maar het kan als het ware als een sausje over de
technologische- en beleidsmatige beheersmaatregelen worden gegoten.
Duurzame toegang tot digitale informatie heeft o.a. te maken met interne infrastructuren. Wanneer
deze stabiel zijn, kan dit tot zo min mogelijk verlies van informatie leiden.33
Het voor vrijwel iedereen
bekende OAIS-model biedt een manier om een dergelijke stabiele interne infrastructuur binnen een
collectiedatabase op te zetten.
OAIS-model
Het “Open Archival Information System (OAIS) Reference Model” [CCSDS, 2009] is een model dat een
conceptueel begrippenkader introduceerde voor een architectuur voor duurzame toegang. Het is
algemeen geaccepteerd en wordt over de hele wereld gebruikt. Het werd in 2000 ontwikkeld door
31
Meijers, Stapsgewijs naar duurzame toegang, 33. 32
De Niet, Heijmans en Verwayen e.a., Business Model Innovatie Cultureel Erfgoed, 16-18. 33
Meijers, Stapsgewijs naar duurzame toegang, 24.
1. Propositie – Onderscheidend vermogen organisatie.
2. Klant – Klant is koning.
3. Distributie – Bepaald communicatie en ervaring klant.
4. Relatie
5. Opbrengsten – Bereidheid betaling klant. Volgt uit 4 voorgaande bouwstenen.
6. Activiteiten – Om propositie te kunnen realiseren.
7. Resources – Door organisatie zelf uit te voeren activiteiten.
8. Partners – Uitbesteding activiteiten.
9. Kosten – Kostenstructuur organisatie. Volgt uit bouwstenen 6 t/m 8.

23
het Consultative Committee for Space Data Systems (CCSDS) van NASA. Tegenwoordig is het zelfs
een ISO-standaard (ISO 14721 [Lavoie, 2004]).34
Het OAIS-model draait
om het zogenaamde
‘Archive Information
Package’ (AIP).
Een digitaal object wordt
opgenomen in het
archief.
Alle digitale objecten
samen vormen het
Archive Information
Package.
Het doel van het archief
is dit AIP duurzaam
toegankelijk te houden.
Dit gebeurd aan de hand
van de zes functies die in
figuur 1 zijn gekaderd. Hieronder worden ze verder toegelicht35
.
34
Angevaare, Toekomst voor ons digitaal geheugen, 25. 35
Meijers, Stapsgewijs naar duurzame toegang, 26.
Figuur 1: OAIS Functioneel Model
‘ingest’
Dit is het startpunt van het archiveringsproces. Het materiaal dat wordt aangeboden wordt
beoordeeld op verschillende aspecten als kwaliteit, formaat en volledigheid die bepalen of
het materiaal geschikt is voor opname in het archief.
‘storage’
Bij deze stap wordt gekeken naar de opslag van het digitale object en de bijbehorende
metadata. Het is een continueproces waarbij veel aandacht is voor de conditie van de
opslagomgeving en de opgeslagen gegevens.
‘data management’
De databeheer-functie zorgt voor de instrumenten voor het toekennen en onderhouden van
alle metadata die nodig zijn voor het duurzaam beheer van het informatieobject. Dit gaat
verder dan het alleen maar toekennen van metadata voor het ontsluiten; er is ook behoefte
aan het vastleggen van formaattype, controlewaarden (‘fixity’), wijzigingshistorie
(‘provenance’) en gebruiksvoorwaarden (‘access rights’).
‘access’
Dit wordt ook wel de raadpleeg functie genoemd. Hier wordt gezorgd voor de vindbaarheid
en het toegang geven tot het digitale object. Hierbij worden wel de voorwaarden die bij de
opname functie zijn vastgesteld aangehouden. ‘Access’ en ‘data management’ staan in nauw
contact met elkaar.

24
De introductie van het OAIS-model heeft veel invloed gehad op de manier waarop men omgaat met
de problematiek rondom duurzame toegankelijkheid tot digitale informatie. Elke organisatie die
nadenkt over duurzame toegankelijkheid tot de digitale informatie van haar instelling, wordt geacht
de zes functies van het OAIS-model in haar beleid op te nemen.36
Naast deze beheersmaatregelen- die gebaseerd zijn op de drie aspecten van duurzaam beheren:
beleid, inrichting en technologie- zijn er natuurlijk nog tal van andere beheersmaatregelen. Dit zijn
echter de meest gehanteerde. Bovendien vormen deze beheersmaatregelen de basis voor het
stappenmodel dat Enno Meijers in zijn master thesis heeft ontwikkeld. Dit wil ik graag gebruiken in
deze scriptie om de koppeling naar het gebruik van Linked (Open) Data te leggen.
2.5 Strategisch Stappenmodel
Enno Meijers heeft een stappenmodel ontwikkeld dat kleine- en middelgrote culturele
erfgoedinstellingen in staat stelt aan de slag te gaan met de problematiek van duurzame
toegankelijkheid tot digitale informatie. Het stappenmodel kan gebruikt worden als een
ondersteunend middel bij het opstellen van maatregelen om de risico’s van verlies van digitale
informatie te beperken.37
De maatregelen raken aan veel gebieden binnen de organisatie van de culturele erfgoedinstellingen:
� Ontwikkeling beleid,
� Inrichting ICT-infrastructuur,
� Beheersprocessen.
36
Angevaare, Toekomst voor ons digitaal geheugen, 25. 37
Meijers, Stapsgewijs naar duurzame toegang, 30.
‘administration’
De zogenaamde coördinatie van het beheer is een veelomvattende taak. Het bevat o.a.:
- bewaking van het opname proces,
- configuratie management voor hard- en software,
- proces monitoring,
- documenteren en rapporteren over de opgeslagen objecten,
- ontwikkelen en onderhouden archiveringsbeleid,
- ondersteunen gebruikers.
‘preservation planning’
Deze functie verzorgt de evaluatie van het archief. Het speelt in op de veranderingen in
technologie, of veranderingen van gebruikers en/of producenten. Op deze manier spoort men
vroegtijdig eventuele risico’s op die kunnen optreden of kunnen de nodige aanpassingen aan
het archief worden gemaakt.

25
Om die reden zijn veel van de in paragraaf 2.4 besproken beheersmaatregelen verwerkt in het
stappenmodel. We zien PLATTER, het OAIS-model en het stappenplan van Expertisecentrum DAVID
terug in het stappenplan van Enno Meijers.
“De toegevoegde waarde van het stappenmodel is het rangschikken van de stappen naar volgorde
van urgentie met als leidraad de vijftien elementen uit het volwassenheidsmodel van Dollar.”38
Volwassenheidsmodel
Het stappenmodel is gebaseerd op het volwassenheidsmodel van Charles M. Dollar.
Het volwassenheidsmodel van Dollar: “Digital Preservation Capability Maturity Model” is gebaseerd
op het bekende Capability Maturity Model Integration uit de IT, waarvan de basis in 1990 is
ontwikkeld. Charles M. Dollar is een pionier op het gebied van duurzame toegankelijkheid.39
Dit volwassenheidsmodel voor digitale duurzaamheid bestaat uit vijftien kernfactoren. Deze zijn
verdeeld in twee groepen.
De ene groep omvat de factoren die gaan over de infrastructuur van digitale duurzaamheid.
De andere groep bevat de processen die
nodig zijn om duurzame
opslag van en toegang tot digitale
informatie te realiseren.40
De essentie van een
volwassenheidsmodel is het inrichten
van een cyclisch proces van verbetering
om op deze manier een steeds hoger
kwaliteitsniveau te bereiken.
In het volwassenheidsmodel worden vijf
niveaus gedefinieerd voor het vermogen
voor duurzame toegang. De vijftien
kernfactoren zijn vervolgens geordend
naar urgentie en afname van risico op
verlies van digitale informatie die
verwerkt zijn in het strategisch
stappenmodel.41
2.5.1 Opbouw van het stappenmodel
Het stappenmodel bestaat uit drie delen.
38
Meijers, Stapsgewijs naar duurzame toegang, 49. 39
http://www.digitaalallemaal.nl/?p=2061, (Blog van DEN)(geraadpleegd: 24-09-2011). 40
Meijers, Stapsgewijs naar duurzame toegang, 42. 41
Ibidem, 90.
Figuur 2: Digital Preservation Infrastructure and Processes
(Dollar, 2010)
Deel A: Het bepalen van de ambitie van de organisatie.
Deel B: Het veiligstellen van de digitale objecten.
Deel C: Het duurzaam toegang bieden tot digitale informatie.

26
Aangezien ik in mijn scriptieonderzoek juist dieper in ga op het duurzaam toegang bieden tot digitale
informatie zal ik hier alleen stil staan bij Deel C van het stappenmodel. Het gehele stappenmodel is te
zien in Bijlage 1.
2.5.2 Deel C: Duurzaam toegang bieden
In deel A en deel B van het stappenmodel was het doel langdurig toegang te bieden tot digitale
informatie. Om dit te bereiken moeten de gebruikers eenvoudig over de informatie kunnen
beschikken die voor hen relevant is. Bovendien moeten zij erop kunnen vertrouwen dat de
informatie die zij vinden, betrouwbaar is. Hierin spelen twee processen een belangrijke rol.
Metadata van een digitaal object zijn nodig om het object te kunnen vinden, er toegang tot te
krijgen, het object betekenis te geven en de authenticiteit te kunnen bepalen.
Veranderingen in de omgeving kunnen het digitale object in gevaar brengen als deze niet constant in
de gaten worden gehouden, zodat men ziet of de digitale objecten of de collectiebeheerssystemen
aangepast moeten worden.
Bovenstaande is schematisch weergeven in figuur 3. Hierin zijn ook een aantal kernfactoren van het
volwassenheidsmodel van Charles M. Dollar terug te zien.
Stap 1 – duurzame toegang
De eerste stap in dit deel is bedoeld om planmatig vast te stellen op welke manier de gebruikers
informatie moeten kunnen vinden en gebruiken. Welke vorm van ‘ontsluiting’ is het meest geschikt
voor de beoogde doelgroep? Welke maatregelen zijn er nodig om de duurzaamheid te
waarborgen?42
Strategy
Het antwoord op deze vragen kan worden verkregen door een plan voor duurzame toegang op te
stellen dat als leidraad dient bij het verder concretiseren van de stappen om duurzame toegang tot
digitale informatie te vergroten. Het ‘Acces Plan’, ‘Data Plan’ en ‘Preservation Plan’ van PLATTER kan
hierbij gebruikt worden als voorbeeld van een dergelijk plan. Ook het stappenplan van
42
Ibidem, 60.
Figuur3: Deel C van het stappenmodel Enno Meijers.

27
Expertisecentrum DAVID haakt hier op in.43
43
Ibidem, 61.

28
Designated Community
Vanuit het perspectief van de gebruiker is het aan te raden om de informatie aan te bieden op basis
van open standaarden, eenvoudig doorzoekbaar en met zo weinig mogelijk drempels.
Gebruikers verwachten steeds sneller informatie te kunnen vinden. Zij gaan niet meer naar de
informatie op zoek, maar er wordt verwacht dat de informatie naar hen komt. Informatie moet
beschikbaar zijn op de plaatsen waar de gebruiker vaak komt. Google en allerlei verschillende ‘Social
Media’ zijn hier een goed voorbeeld van.
Access
De aard van het object en het gebruikersdoel bepaald welke beschrijvende metadata aan het digitale
object toegevoegd moeten worden. Naast de beschrijvende metadata zijn er nog een aantal andere
soorten metadata die belangrijk zijn voor duurzame toegang tot digitale informatie. Hierover meer in
stap 2: beheer van metadata.
Open Standards
Om veranderingen in de technologie, in productieprocessen van producenten of veranderingen in de
context van de gebruikers op te vangen is het een goede keuze om open standaarden en open source
software toe te passen. Hierop wordt ingegaan in stap 3: de veranderende omgeving.44
Stap 2 – Beheer van metadata
Het beheer van metadata komt duidelijk terug in het OAIS-model. De data-beheer functie van het
model definieert vijf verschillende soorten metadata die een rol spelen bij duurzame opslag en
toegang tot digitale informatie.45
� Referentie metadata
� Context metadata
� Onveranderbaarheid (‘fixity’)
� Herkomst (‘provenance’)
� Toegang (‘access’)
Wat is nu precies kenmerkend aan deze verschillende soorten metadata?
Referentiemetadata
Het OAIS-model beschouwt ‘beschrijvende’ metadata als referentie metadata. Dit zijn metadata die
een beschrijving geven van een bibliografie, object en/of archief.
Onder dezelfde noemer schaart het OAIS-model ook de zogenaamde ‘persistent identifier’. Dit soort
referentie metadata zorgt voor duurzame adressering van het Archief Informatie Pakket (AIP).
Verwijzingen kunnen op deze manier een lange tijd geldig blijven. Welke ‘persistent identifier’
gebruikt dient te worden in de culturele erfgoedsector is nog een punt van discussie.
De realisatie van een duurzame verbinding tussen het digitale object en haar beschrijvende metadata
is niet eenvoudig. Het OAIS-model ziet deze twee elementen als onderdelen van het Archief
44
Ibidem, 61. 45
Ibidem.

29
Informatie Pakket (AIP). De huidige collectiebeheerssystemen voorzien echter nog niet in deze
denkwijze dat er een ondeelbare koppeling is tussen het digitale object en haar beschrijvende
metadata. In afwachting van verdere ontwikkelingen in de komende jaren is het raadzaam om met
periodieke controles de vindbaarheid te bewaken van zowel de metadata als de objecten en van de
relaties onderling daartussen.46
Metadata ten behoeve van authenticiteit
Zoals men door de jaren heen wijs is geworden, zo weet men ook dat digitale informatie kwetsbaar
en eenvoudig te manipuleren is. Men hecht daarom tegenwoordig veel waarde aan de authenticiteit
van het digitale object. Het aanbieden van openbare betrouwbare informatie sluit aan bij die
behoefte aan authenticiteit.47
Voor het bewaren van de authenticiteit van het digitale object zijn twee aspecten belangrijk. De
onveranderbaarheid of te wel ‘fixity’ van het digitale object en herkomst (‘provenance’) van het
digitale object.
De ‘fixity’ van het digitale object geldt als een controle voor de authenticiteit. Om de authenticiteit te
waarborgen kan bijvoorbeeld een digitale ‘handtekening’ worden aangebracht. Deze wordt dan
regelmatig gecontroleerd op vervalsing.
De ‘provenance’ van het digitale object vertelt meer over de wijzigingen aan het AIP in het verleden,
die in het verleden hebben plaatsgevonden.
Overige metadata
Er zijn nog twee soorten metadata te benoemen. Een daarvan is in 2009 opgenomen in het OAIS-
model.
‘Context’ metadata worden door het Expertisecentrum DAVID als volgt omschreven: het beschrijven
van de archiefvormer, het beschrijven van het werkproces waarbinnen het document een rol/functie
vervulde, en het documenteren van de relatie met archiefbestanddelen en andere documenten.48
Een nieuwe soort metadata die in het OAIS-model benoemd wordt, is de ‘access rights’ metadata.
Deze soort metadata beschrijft de voorwaarden waaronder het materiaal bewerkt mag worden voor
duurzame opslag en opgevraagd mag worden door de gebruiker. Deze toegangsrechten worden
bepaald bij de opname van het digitale object in het AIP.49
Zoals bij de ‘persistent identifier’ al duidelijk werd is er in veel collectiebeheerssystemen nog geen
ruimte om ook de bijbehorende metadata van het digitale object op te nemen. Het koppelen en
beheren van de metadata aan het digitale object is nog een lastige opgave, net als het bewaken van
de authenticiteit. Dit vormt voor culturele erfgoedinstellingen een grote uitdaging. De juiste software
die in staat is de metadata en het digitale object te koppelen bestaat nog niet. De bestaande
softwaresystemen zijn geënt op opslag en archivering. Het accent ligt niet op het bieden van toegang
tot digitale informatie.
46
Ibidem, 62. 47
Ibidem, 63. 48
Ibidem, 64. 49
Ibidem.

30
Toch dient de relatie tussen metadata en object behouden te worden. Desnoods in een aparte
administratie. De volgende ‘tips’ zouden kunnen bijdragen aan het beheren van de metadata.
� Eén mogelijkheid is het noteren van de metadata in XML-documenten. Dit gebeurt ook al
met het digitale object. Dit zou het eenvoudiger maken de duurzame relaties tussen het
digitale object en de bijbehorende metadata te beheren.
� Zorg ervoor dat de metadata van het digitale object onder dezelfde omstandigheden wordt
opgeslagen en beheerd als het digitale object. Bij voorkeur worden deze twee ook in
dezelfde opslagplaats beheerd.
� Tenslotte is het verstandig een collectiebeheersysteem te gebruiken dat in staat is om alle
data in een open formaat te exporteren zonder tussenkomst van de leverancier. Zorg er in
ieder geval voor dat de broncode van de software altijd beschikbaar blijft in de toekomst.
Stap 3: de veranderende omgeving
De IT-technologie is voortdurend aan verandering onderhevig.
Het belangrijkste doel van duurzame toegankelijkheid is het leesbaar houden van de informatie. Het
leesbaar kunnen houden van de digitale informatie is gekoppeld aan het bekend zijn met de
definities van de gebruikte formaten.
Om het risico te verkleinen dat binnen een organisatie niemand
meer bekend is met de gebruikte formaten en software, kan
besloten worden de digitale objecten tijdig te migreren naar een
ander formaat. Hierbij gaat de voorkeur uit naar formaten die
gebaseerd zijn op open standaarden. Zij hebben een duurzaam
karakter omdat de formaatdefinities algemeen beschikbaar zijn. Ze
worden breder ondersteund en kunnen vaak door meerdere
softwareprogramma’s gelezen worden.50
Een ander risico dat ingedekt kan worden is de kans dat een
softwareleverancier failliet gaat en het collectiebeheerssysteem
met hem ten onder gaat. Wanneer men gebruik maakt van open source software zal de broncode
van de software altijd beschikbaar blijven en is de instelling niet afhankelijk van de
softwareleverancier. Een handig bijkomend element is dat open source software de
formaatdefinities ook documenteert dankzij de broncode.
Daarom is het voor de duurzame toegang tot digitale informatie wenselijk zo veel mogelijk gebruik te
maken van open standaarden en open source software.
Naast deze technische ontwikkelingen dient er ook rekening gehouden te worden met veranderingen
binnen de organisatie. Denk hierbij aan de doelgroep, maar ook aan de producenten van digitale
informatie.51
50
Ibidem, 65. 51
Ibidem, 66.
Figuur 4: Open Standaarden,
Open Source

31
Tot zover Deel C: duurzaam toegang bieden. Dit deel van het stappenmodel van Enno Meijers vormt
een aanleiding om Linked (Open) Data te introduceren als technologische verandering van de
omgeving in hoofdstuk 4. Maar eerst zal ik de context waarin Linked (Open) Data thuis hoort
scheppen in hoofdstuk 3.
3 Ontwikkelingen van het Web
In de afgelopen twintig jaar heeft het Web een aantal grote ontwikkelingen doorgemaakt. We
kennen allemaal de termen: Internet, social media, web 1.0 en web 2.0. Deze woorden duiden
allemaal op deze ontwikkelingen van het Web. De laatste ontwikkeling binnen het Web is het
Semantisch Web.
3.1 Wat is het Web?
Met het Web wordt het World Wide Web bedoeld. Dit is een applicatie of dienst die gebruik maakt
van het Internet. In tegenstelling tot wat veel mensen denken is het Web iets anders dan het
Internet.
Internet
Het internet is het mondiale netwerk van aan elkaar gekoppelde computers. Het wordt gebruikt voor
het versturen van informatie in pakketvorm (applicatie). Ieder netwerk bestaat uit computers die
verbonden zijn via kabel of radioverbindingen. 52
Op dit systeem draaien vele applicaties of diensten.
Het World Wide Web is hier een van. Andere bekende applicaties zijn: 53
� E-mail,
� VoIP,
� FTP,
� UseNet
Het Internet bestond en werkte al in de jaren zeventig. Het Internet werkt volgens twee zogenaamde
Internetprotocollen. Internet Protocol (IP) en Transmission Control Protocol (TCP).Verschillende
computers in diverse computernetwerken kunnen via de afspraken in deze Internetprotocollen met
elkaar communiceren, waardoor een wereldwijd netwerk ontstaat.54
Het Web is een dus een applicatie of dienst die via het Internet functioneert. Het is een collectie van
geschreven documenten en andere bronnen, die worden verbonden door hyperlinks en URL’s die
verzonden zijn door Web-browsers en Web-servers.
Hoe is het World Wide Web ontstaan?
Het World Wide Web zoals wij dat nu kennen vindt zijn oorsprong in 1990. Het werd ontwikkeld door
52
Tim Berners-Lee, De wereld van het World Wide Web. Het oorspronkelijke ontwerp en de uiteindelijke
bestemming van het World Wide Web, beschreven door zijn uitvinder, (Amsterdam: 2000), 18-19 + 222. 53
http://nl.wikipedia.org/wiki/Internet (Internet) (geraadpleegd: 25-08-2011). 54
Berners-Lee, De wereld van het World Wide Web, 18-19 + 222.

32
Tim Berners-Lee. Het Web werd uitgevonden met de bedoeling om kennis en gegevens in
zogenaamde datasets uit te wisselen tussen wetenschappers verspreid over de wereld.
Tim Berners-Lee had de intentie om een Web te creëren dat vroeg om de participatie van haar
gebruikers. Hij verwachtte in drie maanden een Web te ontwikkelen waarin de gebruikers alleen
content konden afnemen en binnen acht maanden konden deze zelfde gebruikers ook zelf content
toevoegen aan het Web.
Dit gebeurde echter niet. Men kon alleen maar gelinkte documenten lezen. Het Web werd vrij
eenzijdig gebruikt. Er werd informatie gepubliceerd die door gebruikers werd geconsumeerd. Men
kon dus alleen lezen wat op dat moment beschikbaar was.
Het Web waarin content werd aangeboden die enkel geconsumeerd kon worden ontwikkelde zich
tien jaar voordat gebruikers hun content ook in het Web konden plaatsen. We hebben het hier dan
over gebruikers zonder technologische kennis.
Standaarden World Wide Web
Tim Berners-Lee voegde twee al bestaande technologieën bij elkaar, namelijk:
� Internet,
� Hypertext.
Internet is het overkoepelende netwerk van verschillende applicaties. En hypertext word gezien als
een document met verwijzingen naar andere documenten die in een klik van de muis ‘gevolgd’
kunnen worden. Hieruit ontwikkelde hij drie essentiële technologieën. Hij bedacht het communicatie
protocol HTTP, de opmaaktaal HTML en het idee van een Web-adres URL. Alle drie deze standaarden
worden tegenwoordig nog steeds gebruikt en vormen samen de ruggengraat van het Web. 55
3.2 Het DNA van het Web
Tegenwoordig heeft vrijwel iedereen toegang tot het Web. Doordat er zoveel gebruikers zijn is het
Web zich gaan ontwikkelen. De ontwikkeling van het Web kent een aantal kenmerken.
De ontwikkeling van het Web is grof in te delen in drie periodes van ± tien jaar, ook wel generaties
genoemd:
� 1990-2000 World Wide Web
� 2000-2010 Social Web
� 2010-... Semantisch Web
Wat zijn nu de belangrijkste kenmerken van deze zogenaamde generaties van het Web? Door welke
vaak innovatieve ontwikkelingen zijn zij ontstaan?
55
Gesprek met Victor de Boer, postdoctoraal onderzoeker binnen de Web & Media Group aan de Vrije
Universiteit Amsterdam, 22-07-2011.

33
Volgens Nova Spivack - een prominente denker in het toekomstige Internet (met name Semantisch
Web)- kennen deze generaties twee drijfveren, namelijk:56
� Technologische drijfveer,
� Sociaal-economische drijfveer.
Met technologie wordt bedoeld dat voornamelijk professionals zoals programmeurs en ingenieurs
een rol spelen in deze innovatieve ontwikkelingen van het Web. De gebruikers spelen hier geen rol.
In de jaren negentig werd het ‘Web’ uitgevonden door Tim Berners-Lee. Dit is een van de bekendste
voorbeelden van een technologische drijfveer.
Het sociaal-economische aspect als drijfveer draait veel meer om de participatie van de gebruiker bij
het aanleveren van content. Social media toepassingen als Facebook en Twitter zijn een perfect
voorbeeld van het sociale aspect, dat wordt ondersteund vanuit economisch opzicht. De gunstige
economie zorgt ervoor dat rond 2000 bijna heel Nederland thuis een computer heeft en zich op het
internet begeeft. De professionals hebben op dat moment niet meer het alleenrecht op het
publiceren van content op het Web.
Technologie en het sociale-economie kunnen dus worden gezien als de twee basisstrengen van het
DNA van de innovatie van het Web. Deze twee zijn nooit los van elkaar te zien, maar zijn elkaars
tegenhanger. Er is altijd sprake
van een directe wisselwerking
tussen beide DNA strengen. 57
Deze heeft ervoor gezorgd dat
er een ware evolutie op het
internet gaande is, die als een
soort golfbeweging is
ontwikkeld.
De ontwikkeling van het Web
was dus een puur
technologische ontwikkeling
van professionals op het gebied
van ICT. Er kwamen
voornamelijk ingenieurs en
programmeurs bij kijken. De
gebruikers consumeerde de
informatie die zij toegespeeld kregen. Zij konden helemaal niet mee beslissen welke informatie tot
hun kwam. Achteraf gezien benoemen we deze ontwikkeling ook wel met het buzzwoord: ‘web 1.0’.
3.3 Het ‘Social Web’
Rond het jaar 2007 is het wat men noemt: het ‘Social Web’ ontstaan. Het Web werd inmiddels door
56
http://www.frankwatching.com/archive/2009/01/05/web-webber-webst-van-10-naar-30%E2%80%A6-en-
verder/ (Onafhankelijk crossmedia platform)(geraadpleegd: 26-08-2011) 57
http://www.frankwatching.com/archive/2009/01/05/web-webber-webst-van-10-naar-30%E2%80%A6-en-
verder/ (Onafhankelijk crossmedia platform)(geraadpleegd: 26-08-2011)
Figuur 5: Het DNA van web innovatie.

34
miljoenen mensen gebruikt. Al deze gebruikers van het Web creëerden een nieuw inzicht. Men
ontdekte dat de huidige infrastructuur van het internet ook gebruikt kon worden om iets van de
consument terug te krijgen.58
Interactief
Actief is het woord van het ‘Social Web’. De infrastuctuur van het Web verandert van
eenrichtingsverkeer naar tweerichtingsverkeer. De gebruiker kan interactief zijn met het Web.
58
Ivo Zandhuis, ‘Fundamenten in verandering: archieven op het semantisch web’, Archievenblad, (mei 2010), 1.

35
In de vorm van ‘Social Media’, wordt er interactief deelgenomen aan het Web:
� Social tagging,
� Weblogs,
� Delen van foto’s,
� Reageren op elkaars berichten/foto’s,
� Publiceren van content.
De gebruiker consumeert nu niet alleen meer, maar produceert nu ook. Er ontstaat een zogenaamde
‘prosumer’.
In navolging van de technologische golfbeweging die de ontwikkeling van het Web was, speelt juist
het sociaal/economische aspect een rol bij de ontstaan van ‘het sociale Web’. Het ‘Social Web’ is
gericht op de gebruiker, je ziet dat de technologie dan ook de functionaliteit volgt. Niet langer gaat
het om de techniek van het Web, maar gaat het over een concept dat betrekking heeft op het
gebruik van webapplicaties door mensen. Het ‘Social Web’ is voor de zelfstandige activiteit van het
publiek.59
Toen het tweerichtingsverkeer eenmaal op gang was, verspreidde het ‘Social Web’ zich als een
lopend vuurtje. Verschillende zogenaamde ‘Social Media’ als Twitter, Facebook, Hyves etc. kwamen
op en men nam hieraan deel. Het succes van het ‘Social Web’ is volgens Haustein en Pleumann te
danken aan twee factoren:60
� Participeren op het Web was eenvoudig,
� De resultaten van de participatie op het Web werd direct zichtbaar voor de gebruiker.
De drempel om te participeren binnen het ‘Social Web’ is erg laag. Participeren kan al door een klein
beetje content te delen. Je kunt rustig de kat uit de boom kijken en later meer content toevoegen.
Het gaat erom dat je participeert, dat je het tweerichtingsverkeer op gang houdt. Bovendien groeit
de waarde van de content wanneer mensen content publiceren over datzelfe onderwerp.61
Hier
geldt het principe: the wisdom of the crowd. Al deze inspanningen op het Web zijn direct terug te
zien en kunnen we als resultaat van onze inspanningen beschouwen. Dat zorgt voor een voldaan
gevoel. Jij draagt bij aan het Web.
3.4 Het Semantisch Web
De term Semantisch Web is niet nieuw. Deze is al in de jaren ‘90 geïntroduceerd. In tegenstelling tot -
wat men inmiddels aanduidt met de buzzwoorden web 1.0 en web 2.0, is het geen menselijke
interface, waarbij het gaat om de presentatie van de informatie die gericht is op mensen en waarbij
tekst, grafische vormgeving en usability van belang zijn.
59
Zandhuis, ‘Fundamenten in verandering: archieven op het semantisch web’, 2. 60
Seamus Ross, ‘Position Paper’, DigiCULT Thematic Issue 3 – Towards a Semantic Web for Heritage Resources,
(Oostenrijk: 2003), 9. 61
Ross, ‘Position Paper’, 10.

36
Het Semantisch Web is een computerinterface. In 2007 beschreef Christine Karman het Semantisch
Web als volgt:
Web 3.0, het semantisch web, onderscheidt zich van het huidige www doordat er structuur in
is aangebracht en doordat aan alle stukjes informatie meta-informatie is gekoppeld die
automatische interpretatie mogelijk maakt. Het woordt semantiek wordt gebruikt omdat als
het ware de betekenis van een woord, of van een stukje informatie, is mee-opgeslagen met
het woord zelf. Dat maakt het navigeren op het web eenvoudiger, niet alleen voor ons
mensen maar met name voor systemen. Informatiesystemen ‘begrijpen’ immers niet wat ze
lezen, maar in het semantisch web wordt een deel van dat begrip als het ware meegeleverd,
waardoor een systeem de informatie een beetje kan ‘begrijpen’.62
Tim Berners-Lee had met de ontwikkeling van het World Wide Web eigenlijk een Semantisch Web
voor ogen. Hij wilde een datamodel ontwikkelen dat een informatiestructuur herbergt dat over de
grenzen van de individuele instellingen heen gaat. Na ongeveer twintig jaar lijkt het er dan nu toch
van te komen. Ik zeg expliciet lijkt, want er zijn nog steeds een hoop ontwikkelingen gaande en nog
niet iedereen is blij met het Semantisch Web zoals het nu is.
Hoe werkt het?
De sleutel tot het realiseren van de visie van het Semantisch Web is semantische interoperabiliteit
van de Web-resources.63
Om deze werkelijkheid te laten worden dient er een grote omslag plaats te
vinden in de manier waarop data, informatie en kennis nu zijn gerepresenteerd op het Web.
Begrippenkader
Om de visie van het Semantische Web te verduidelijken zal ik hier eerst de twee belangrijkste
begrippen beschrijven die deze visie ondersteunen.
� Semantiek se - man` tiek («Frans«Grieks) de -woord (vrouwelijk) taalkunde leer van de
betekenis en betekenisveranderingen64
� Interoperabiliteit is de eigenschap van systemen en software om data uit te wisselen met
externe systemen via een gemeenschappelijke set procedures.65
De huidige situatie op het Web laat te veel content zien die niet tot nauwelijks beschreven is om met
elkaar in verband gebracht te kunnen worden. Hierdoor wordt deze content informatie niet
gevonden en hergebruikt. Wanneer deze volgens de principes van het Semantisch Web zouden zijn
ontsloten, zouden geautomatiseerde gegevensverwerkingsprogramma’s de informatie kunnen
vinden, interpreteren en hergebruiken.66
62
www.sync.nl/web-30/, (Definitie Semantisch Web van Christine Karman)(geraadpleegd: 14-06-2011) 63
Geser Guntram, ‘A Cultural Heritage Semantic Web Example & Primer’, DigiCULT Thematic Issue 3 – Towards
a Semantic Web for Heritage Resources, (Oostenrijk: 2003), 3. 64
http://www.encyclo.nl/begrip/semantiek (Semantiek)(geraadpleegd: 27-09-2011) 65
http://www.den.nl/thema/10/interoperabiliteit (Interoperabiliteit)(geraadpleegd: 27-09-2011) 66
Ross, ‘Position Paper’, 7.

37
Dit kan worden gerealiseerd door beschrijvende metadata aan de informatie en de resources toe te
voegen. Vervolgens dient de content en de metadata op een gestructureerde en consistente manier
aangeboden te worden op het Web om een intelligenter Web te ondersteunen.67
Het Semantisch Web wordt wel gepresenteerd
als een zeer complexe en uitgebreide visie van
een intelligent web. Dit is terug te zien in figuur 2.
In de layer-cake is te zien hoe de meer semantische
lagen van het Semantisch Web bouwen op minder
semantische.
Het is zo complex vanwege de stappen die nodig
zijn om een Semantisch Web mogelijk te maken.
Elke stap kent haar eigen standaarden.
Het transformeren van contentinformatie
en metadata naar semantische
interoperabiliteit gebeurd in
twee fases.
We onderscheiden de
syntactische fase en
de semantische fase.
Het syntactische deel bestaat uit het onderste deel van de layer-cake. Het gaat hier om XML-
documenten die een unieke naam en plaats hebben (URI).
In de laag hierboven speelt het RDF-datamodel een rol. Het bouwt voort op XML en URI’s en bestaat
uit subject-predicaat-objectrelaties (triples). Op deze manier wordt de layer-cake steeds meer
semantisch. Standaarden die hier gebruikt worden zijn bijvoorbeeld Dublin Core, SKOS en FOAF.
Het semantische deel begint bij het gebruiken van ontologieën. Ik sta hier wat langer stil bij het
begrip ontologie vanwege het feit dat ontologieën zijn bedoeld om de betekenis, oftewel de
semantiek, vast te leggen van de concepten van de triples. De ontologieën maken het Web
semantisch.
Ontologie
Een ontologie is een triple die is bedoeld om uit te leggen hoe de computer de informatie kan
gebruiken.68
Het is te vergelijken met het RDF-datamodel of een metadataschema.
Er zijn een aantal standaardontologieën:
� RDFS,
� OWL,
67
Ibidem, 7. 68
Zandhuis, ‘Fundamenten in verandering: archieven op het semantisch web’, 2.
Figuur 6: Enabling technologies - layer cake.

38
� OWL2
De ontologieën leggen steeds preciezer vast wat met de onderdelen van de triple wordt bedoeld. Er
wordt bijvoorbeeld vastgelegd wat de relaties binnen een familie betekenen:
De computer moet nu weten dat in een bepaalde stamboom de moeder niet
altijd dezelfde persoon is. De moeder kan meerdere namen hebben. Dit is iets
dat wij mensen weten, maar dat een computer ‘vertelt’ moet worden.
Hier zijn de ontologieën o.a. voor, maar het wordt steeds complexer.
Naarmate we ons meer in het bovenste deel van de layer-cake bevinden wordt de complexiteit
groter. Dit deel van de layer-cake omvat de visie van het Semantische Web. Omdat de
computerinterface steeds meer als een mens moet denken worden de betekenis systemen ook
steeds complexer. 69
Door de complexiteit zijn er nog geen concrete goed functionerende praktijkvoorbeelden te noemen
die de volledige Semantische Web visie dragen. Wat we wel zien in de praktijk is het Linked Data
principe van Tim Berners-Lee. Deze technologie is gebaseerd op de lagen van de layer-cake in figuur
2, tot en met de ontologieën. Over Linked (Open) Data zal ik in hoofdstuk 4 meer vertellen.
Er zijn dus drie web-generaties te onderscheiden. De drie generaties lopen als het ware parallel aan
elkaar. Het ‘Social Web’ houdt niet op te bestaan na 2010. Het blijft parallel lopen met het
Semantisch Web. Ditzelfde geldt voor het World Wide Web, het is er nog steeds en kan niet als
‘dood’ worden beschouwd nu het ‘Social Web’ en het Semantisch Web bestaan.70
69
Gesprek met Victor de Boer, 08-09-2011. 70
E-mailwisseling met Victor de Boer, 30-09-2011.

39
4 Linked Open Data
Linked (Open) Data wordt ook wel de praktijk van het Semantisch Web genoemd. Linked (Open) Data
is een pragmatische manier om een praktische bijdrage te leveren aan het Semantisch Web.71
Praktisch vanwege de toepasbaarheid van Linked (Open) Data.
In dit hoofdstuk meer over de toepasbaarheid van Linked (Open) Data en de overeenkomsten tussen
deze technologie en de beheersmaatregelen voor duurzame toegang tot informatie, zoals
beschreven in Deel C van het strategische stappenplan van Enno Meijers.
De termen waaruit Linked Open Data bestaat sluiten perfect aan op de erfgoedsector.
Om te beginnen Data. Data is onze digitale informatie. Informatie die al jaren door
erfgoedinstellingen wordt verzameld en die de erfgoedsector een autoriteit van kennis in de
samenleving maken.
Open wijst naar de huidige tendens in de samenleving dat informatie van publieke instellingen
openbaar moet zijn: de open access beweging. Nu alleen gegoten in een ander jasje. Niet fysiek,
maar digitaal. Deze openheid stimuleert het hergebruik van data. De informatie die we al jaren
verzamelen.
Linked wijst op waardecreatie met als gevolg meer betekenis. Dankzij het hergebruik worden er
nieuwe koppelingen gemaakt en ontstaat er meer context. Wat uiteindelijk zorgt voor meer
betekenis.72
4.1 Wat is Linked (Open) Data?
Linked (Open) Data is een nieuwe technologie die een intelligenter web ondersteunt. Tot nu toe
werden bij het koppelen van informatie standaarden gebruikt voor de verpakking van de informatie.
Linked (Open) Data koppelt informatie door middel van standaarden die gebruikt worden voor de
inhoud van de informatie.73
In plaats van de buitenkant, de binnenkant dus.
Op het Web worden documenten gekoppeld door links. Deze links hebben geen betekenis. Ze laten
niet zien wat de relatie is tussen de twee documenten die gekoppeld zijn. Alleen dat er een relatie is.
Je moet dus zelf uitzoeken wat de relatie tussen die twee documenten is.
Bij Linked (Open) Data geldt het principe dat de relatie tussen twee documenten betekenisvol moet
zijn. Die betekenis ontstaat door elk woord uit het Webdocument als concept uniek te maken en te
beschrijven in subject-predicaat-objectrelaties (triples). Een woord als bijvoorbeeld de stad
Amsterdam is dan een concept dat meerdere relaties kan krijgen met andere concepten. Het subject,
predicaat en object zijn dan dus ook concepten. Elk concept wint aan betekenis naarmate er meer
beschrijvingen aan gekoppeld worden. Op deze manier worden webdocumenten betekenisvol en
worden zoekresultaten nauwkeuriger.74
Dat is de kracht van Linked (Open) Data.
71
http://www.den.nl/thema/129/ (Linked Open Data) (geraadpleegd: 09-06-2011) 72
http://www.den.nl/blog/bericht/3027 (DCL11: Autoriteit, hergebruik en betekenis van linked data)
(geraadpleegd: 22-06-2011) 73
http://digitaalduurzaam.blogspot.com/ (‘Linked Data’ – wat is dat nu eigenlijk precies?’)(geraadpleegd: 28-
07-2011) 74
http://www.den.nl/thema/129/ (Linked Open Data) (geraadpleegd: 09-06-2011)

40
Schematisch is dat als volgt weer te geven.75
X is de schilder van Y
X is getrouwd met Z
X is afkomstig uit W
X, Y, Z en W zijn hierin de concepten. De relaties die tussen de concepten zijn beschreven zijn
betekenisvol, want ze vertellen hoe de concepten met elkaar verband houden.
Om nauwkeurig te kunnen zoeken in de enorme hoeveelheid informatie op het Web is zoeken op
basis van betekenis onontkoombaar. Er is echter een probleem. De betekenis van mensen, dingen en
gebeurtenissen kan variëren. Mensen kunnen bedenken welke betekenis iets heeft, dankzij de
context. Computers kunnen dit echter niet. Linked (Open) Data is een techniek om machine-leesbare
context te genereren.76
4.2 Wat is de meerwaarde voor de erfgoedsector?
Wat is nu de meerwaarde van Linked (Open) Data en wat levert het op voor de erfgoedsector?
Zoals hierboven al genoemd werd, koppelt Linked (Open) Data niet de verpakking, maar de inhoud
aan elkaar.
De belangrijkste meerwaarde van Linked (Open) Data
voor de erfgoedsector is voornamelijk
interoperabiliteit. Hiermee bedoelen we het kunnen
koppelen van objecten uit verschillende collecties en
het koppelen aan data die van buiten de culturele
sector afkomstig zijn door middel van een
gemeenschappelijke set procedures.77
De Europeana
database is hier een uitstekend voorbeeld van.
Een andere meerwaarde is dat de zichtbaarheid van de
collecties wordt vergroot. Voor zoekmachines geldt dat
zij beter in staat zijn de data te indexeren wanneer
data de Linked Data ‘standaard’ draagt. Er ontstaat de
mogelijkheid om met één zoekopdracht relevante
resultaten te vinden uit meerdere collecties, ook al is
de informatie niet overal hetzelfde geschreven. Op
deze manier komt de informatie dus min of meer naar
de gebruiker toe. De gebruiker hoeft niet meer zelf
opzoek te gaan.78
75
http://digitaalduurzaam.blogspot.com/ (‘Linked Data’ – wat is dat nu eigenlijk precies?’)(geraadpleegd: 28-
07-2011) 76
Ibidem. 77
http://www.den.nl/thema/129/ (Linked Open Data) (geraadpleegd: 09-06-2011) 78
http://digitaalduurzaam.blogspot.com/ (‘Linked Data’ – wat is dat nu eigenlijk precies?’)(geraadpleegd: 28-
07-2011)
Figuur 7: Logo Europeana.

41
Linked (Open) Data stimuleert het hergebruik van data doordat er zoveel mogelijk verwijzingen naar
andere kennisbronnen worden gelegd. Maar dit geldt ook andersom, andere kennisbronnen
verwijzen ook naar jouw data. Tweerichtingsverkeer dus.79
Daarnaast haakt Linked (Open) Data aan bij een maatschappelijke tendens die nu speelt, namelijk dat
informatie openbaar gemaakt moet worden.80
Het afgelopen jaar hebben er diverse initiatieven
plaats gevonden die gebaseerd zijn op de ‘open access’ beweging. Een voorbeelden hiervan is de
Apps for Amsterdam wedstrijd waarbij de data van de Gemeente Amsterdam vrijgegeven was en
deze (her)gebruikt kon worden om mash-ups te creëren die op het Web of als applicatie op de
smartphone kon worden geraadpleegd.81
4.3 Hoe verhouden Linked (Open) Data en het Semantisch Web zich tot elkaar?
Het Semantisch Web en Linked (Open) Data wordt vaak voor hetzelfde aangezien. Deze verwarring
heeft veel te maken met het gebruik van verschillende termen door elkaar:
� Semantisch Web,
� Web of Data,
� Linked Data
Veel mensen spreken van Linked (Open) Data als een nieuwe poging om het Semantisch Web onder
de aandacht te brengen. Ik deel echter de mening van o.a. Tom Heath82
en James Hendler83
:
Het Semantisch Web is een Web of Data. Linked Data creëert als het ware het Web of Data. Daarmee
is Linked Data dus een onderdeel van het Semantisch Web. Je zou kunnen zeggen dat Linked (Open)
Data mede mogelijk word gemaakt door het Semantisch Web.
Zoals de eerste regel van dit hoofdstuk vertelt. Kan Linked (Open) Data
als de praktijk van de Semantische Web visie worden gezien.
Dit kan nog eens verduidelijkt worden door terug te gaan naar
hoofdstuk 3, waarin de ontwikkeling van het Web besproken wordt.
De semantische layer-cake laat de complexe visie van
het Semantisch Web zien. Het meerlaagse model waarin
onderin het Linked (Open) Data principe huist, met daarboven
steeds meer semantiek. Met als top, de logica die
ondersteund wordt door ontologieën. Het volledige
model is moeilijk in praktijk te brengen.
79
http://www.den.nl/thema/129/ (Linked Open Data) (geraadpleegd: 09-06-2011) 80
http://digitaalduurzaam.blogspot.com/ (‘Linked Data’ – wat is dat nu eigenlijk precies?’)(geraadpleegd: 28-
07-2011) 81
http://www.appsforamsterdam.nl/ (Apps for Amsterdam)(geraadpleegd: 29-09-2011) 82
http://tomheath.com/blog/2009/03/linked-data-web-of-data-semantic-web-wtf/ (‘Linked Data? Web of
Data? Semantic Web? WTF?’)(geraadpleegd: 28-07-2011) 83
http://blogs.nature.com/jhendler/2009/06/16/what-is-the-semantic-web-really-all-about (‘What is the
Semantic Web really all about?’)(geraadpleegd: 28-07-2011)

42
Jaren na de term Semantisch Web
gelanceerd werd, is men tot het inzicht
gekomen dat we eerst maar eens onze
data moeten koppelen aan elkaar. Daarna kunnen we daar nog eens logica aan verbinden. Op die
manier is Linked (Open) Data de praktijk van het Semantisch Web.
4.4 Linked Data – Open Data – Linked Open Data
Data kan ‘linked’ zijn, maar niet ‘open’. Net als data ook ‘open’ kan zijn, maar niet ‘linked’.
Wat is ‘linked data’, ‘open’ data? En wanneer spreken we van Linked Open Data?
Linked Data
Data moet aan de vier principes van Tim Berners-Lee voldoen:84
Dit Linked Data principe is de set procedures die de interoperabiliteit mogelijk maakt tussen
verschillende systemen en software.
Open Data
Open Data komt ook in Nederland steeds vaker voor. Het ontsluiten van data die beschikbaar is bij
(semi)overheidsinstellingen en in de privaatsector, zoals het bedrijfsleven, noemt men Open Data. De
data die hier vrijgegeven zijn, zijn vaak: milieu- en demografische data, data over incidenten,
mobiliteit, educatie, connectiviteit, infrastructuur en de planning en het gebruik van (publieke)
ruimte. Het ontsluiten, combineren en visualiseren van Open Data stimuleert innovatie. Het komt
echter nog steeds voor dat toegang tot, of hergebruik van deze data gecontroleerd wordt door
publieke of private partijen. Daarom zijn er een aantal principes opgesteld die kenmerkend zijn voor
Open Data.85
84
http://tomheath.com/papers/bizer-heath-berners-lee-ijswis-linked-data.pdf (‘Linked Data – The story so
far’)(geraadpleegd:21-07-2011) 85
http://www.appsforamsterdam.nl/wat-is-open-data (Wat is Open Data?) (geraadpleegd: 13-09-2011)
Figuur 8: Enabling technologies – layer cake.
1. URI’s om dingen te identificeren.
2. Gebruik HTTP URI’s zodat er naar deze dingen kan worden verwezen en dat ze kunnen
worden opgezocht door zowel mensen als machines.
3. Leg de informatie over het concept vast in een ‘triple’ (subject-predicaat-objectrelatie) en
leg die triple vast in RDF.
4. Neem links naar andere, gerelateerde, open data concepten op in de beschrijving om het
1. Alle data waar geen restricties i.v.m. privacy, veiligheid of anderszins op rusten wordt
ter beschikking gesteld;
2. Data wordt verzameld bij de bron, dus met de grootst mogelijke detaillering;
3. Data wordt zo snel mogelijk beschikbaar gesteld om de gebruikswaarde te behouden;
4. Data wordt beschikbaar gesteld voor een zo breed mogelijke groep mensen, en voor
een zo breed mogelijk aantal toepassingen;
5. Data wordt beschikbaar gesteld in een formaat dat voldoende gestructureerd is om
automatische verwering mogelijk te maken;
6. Data wordt ter beschikking gesteld aan iedereen;

43
Linked Open Data
Linked Open Data zijn rechtenvrije Linked Data. 86
De Linked Data principes worden aangevuld met de
principes voor Open Data. Het gebruik van ‘open’ datasets bevorderd op deze manier het hergebruik
van je data.
4.5 De technische aspecten van Linked (Open) Data
Tom Heath zegt op zijn blog Linked Data? Semantic Web? WTF? [2 maart, 2009]87
:
“Linked Data is no more complex than this – connecting related data across the Web using
URI’s, HTTP and RDF.”
Met deze uitspraak zijn de belangrijkste technische aspecten van Linked Data genoemd.
� Uniform Resource Identifier,
� Hyper Text Transfer Protocol,
� Resource Description Framework.
Om uit te leggen hoe Linked (Open) Data technisch in elkaar zit zal ik dit uitleggen aan de hand van
het Linked Data principe van Tim Berners-Lee, waarin deze drie standaarden centraal staan.
Met de data die betekenisvol aan elkaar wordt gekoppeld, worden de digitale objecten en de
bijbehorende metadata zoals beschreven in hoofdstuk 2 bedoeld.
Het transformeren van metadata naar semantische interoperabiliteit gebeurt in twee fases88
:
� fase 1 - syntactische transformatie;
� fase 2 - semantische transformatie.
4.5.1 Syntactische transformatie
Zoals in hoofdstuk 2 is geadviseerd dienen allereerst zowel de digitale objecten zelf als de
bijbehorende metadata die afkomstig zijn uit de collectiedatabase omgezet te worden naar XML
documenten (veel databases en museumsystemen als Adlib laten het toe om hun inhoud als XML te
exporteren89
). Daarna kan men doorgaan met stap 1 van het Linked Data principe van Tim Berners-
Lee.
XML
XML is een mark-up taal om data te beschrijven. Het is in staat de structuur van een document te
beschrijven en daarmee beschrijft het dus het digitale object (of metadata). XML beschrijft dus alleen
maar. Het geeft bijvoorbeeld aan dat een bepaald onderdeel van een tekst de naam van de maker
betreft, of de datum dat de tekst geschreven is. De notatie van XML is als volgt:
86
http://digitaalduurzaam.blogspot.com/ (‘Linked Data’ – wat is dat nu eigenlijk precies?’)(geraadpleegd: 28-
07-2011) 87
http://tomheath.com/blog/2009/03/linked-data-web-of-data-semantic-web-wtf/ (‘Linked Data? Web of
Data? Semantic Web? WTF?’)(geraadpleegd: 28-07-2011) 88
Guntram, ‘A Cultural Heritage Semantic Web Example & Primer’, 27-32. 89
http://www.den.nl/art/uploads/files/Tutorial%20Linked%20Data%20Part%203b.pdf (Linked Data: stap voor
stap, deel 3B)(geraadpleegd: 15-08-2011)

44
<creator>Kazimir Malevich</creator>
De XML-documenten zijn de concepten zoals al eerder beschreven.
De reden dat we XML gebruiken is omdat het een universele standaard is. Het is een open standaard
die door elke software en elk systeem kan worden gebruikt. Daarnaast is het ook niet applicatie
afhankelijk. Het kan dus ook gebruikt worden voor data uitwisseling en data harvesting of om een
website te maken.90
Een XML document bestaat ook weer uit een bepaalde structuur, een
zogenaamde XML Schema.
Elk concept krijgt een unieke naam: een Uniform Resource Identifier (URI). Naast de unieke naam
krijgt het concept ook nog een uniek adres. Dit bestaat uit informatie over de herkomst van de data
(uit welke dataset is het concept afkomstig.)
Uniform Resource Identifier
Een URI bestaat uit twee onderdelen; geeft een unieke plaats en naam aan een concept:
� URL;
� URN.
De URL (Uniform Resource Locator) identificeert digitale objecten aan de hand van de plaatsing van
het bestand op een netwerkserver. De locatie blijft op deze manier uniek, maar is tijdelijk
opgeslagen.91
De URN (Uniform Resource Name) verwijst niet naar de fysieke plaats van een bestand op de server,
maar verwijst naar een tabel (‘name space’) waarin de instelling op een generieke wijze bijhoudt
welke bestanden zij beheert. Op deze manier krijgen we meer duidelijkheid over de afkomst van de
informatie. Uit welke dataset is deze afkomstig? Voor URN is het een vereiste dat elke naamruimte-
aanduiding wereldwijd uniek is, waarmee ook iedere URN uniek is.
Het gebruiken van URI’s om entiteiten(dingen) te identificeren zoals hierboven is uiteengezet is stap
1 van het Linked Data principe van Tim Berners-Lee.
Stap 2 is de URI’s vindbaar te maken door mensen en machines. Dit doen we door de URI’s in een
HTTP schema op te nemen.
Hyper Text Transfer Protocol
HTTP is een belangrijk protocol voor de communicatie tussen de web cliënt en de webbrowser. Het
haalt de informatie als het ware op. Het is een protocol dat bestaat uit verschillende HTTP-requests
die een web cliënt aan een server stelt. De server geeft vervolgens antwoordt terug aan de Web
cliënt.92
4.5.2 Semantische transformatie
Er is nog een proces nodig om de elementen van het XML document te interpreteren. Hier begint
90
Guntram, ‘A Cultural Heritage Semantic Web Example & Primer’, 30. 91
http://www.den.nl/standaard/266/ (Uniform Resource Identifier (URI))(geraadpleegd: 29-08-2011) 92
http://nl.wikipedia.org/wiki/HTTP (Hypertext Transfer Protocol) (geraadpleegd: 28-08-2011)

45
stap 3 van het Linked Data principe en gaat de syntactische transformatie over naar een semantische
transformatie.
Leg de informatie over het concept vast in een ‘triple’ (subject-predicaat-objectrelatie) en leg die
triple vast in RDF.
Triple
De XML-documenten bevatten nu gestructureerde data die door computers wordt begrepen. Deze
gestructureerde data bestaat uit zogenaamde ‘triples’.
Een triple bestaat uit drie concepten93
:
� Subject – Waar het over gaat.
� Predicaat – Een eigenschap van het subject (de aard van de relatie).
� Object – De waarde van die eigenschap.
Digitale informatie kan met behulp van triples worden gecodeerd en op deze manier kan je een
gerichte vraag stellen op het Web.
Resource Description Framework
De triples worden gecodeerd volgens het RDF-
datamodel. RDF wordt ook wel de ruggengraat van
het Semantisch Web genoemd. Het is een
standaardmodel voor het coderen van metadata
op het Web.94
RDF maakt het mogelijk om twee bronnen aan
elkaar te linken terwijl deze afkomstig zijn uit twee
verschillende datasets. Daarin kan het subject van
de RDF triple van de ene data set zijn, en het object van dezelfde RDF triple afkomstig uit een andere
data set.95
Het RDF-model stimuleert dus het hergebruik van data.
Er zijn verschillende serialisaties voor de triples in het RDF-datamodel. De drie bekendste zijn:
� RDF/XML,
� Turtle,
� Ntriples.
Deze zogenaamde standaardtaal beschrijft hoe een computerbestand eruitziet, waarin triples zijn
vastgelegd. 96
93
http://www.den.nl/art/uploads/files/Tutorial%20Linked%20Data%20Part%203.pdf (Linked Data: stap voor
stap, deel 3) (geraadpleegd: 15-08-2011) 94
Guntram, ‘A Cultural Heritage Semantic Web Example & Primer’, 32. 95
http://tomheath.com/papers/bizer-heath-berners-lee-ijswis-linked-data.pdf (‘Linked Data – The story so
far’)(geraadpleegd:21-07-2011) 96
Zandhuis, ‘Fundamenten in verandering: archieven op het semantisch web’, 8.
Triple:
SUBJECT EIGENSCHAP WAARDE
X is de schilder van Y
| | |
[http://URI]
herkomst:
persoonsnamen-
thesaurus
[http://URI] [http://URI]
herkomst:
Wikipedia
Figuur 9: Schematische weergave van een triple.

46
Mijn voorkeur gaat uit naar RDF/XML.
Dit is de oudste manier om RDF-triples te schrijven. Daarom werd het in eerste instantie ook gezien
als DE standaard.
Een andere reden waarom ik RDF/XML boven Turtle of Ntriples kies is dat XML ook buiten het
Semantisch Web een standaard is. Dit blijkt uit twee opmerkingen die al eerder genoemd zijn in dit
scriptieonderzoek. Ten eerste hebben we de digitale informatie uit de collectiedatabase al overgezet
naar XML-documenten. Ten tweede, deze grijpt terug op de problematiek van duurzame toegang tot
digitale informatie, is het eenvoudiger om de duurzame relaties tussen het digitale object en de
metadata te beheren wanneer de metadata in een XML-document worden overgezet.
Een derde reden is dat XML een universele standaard is. Als een open standaard wordt XML door
elke software en elk systeem gebruikt en blijft daardoor langer bruikbaar.
Er zijn ook een paar kleine nadelen te noemen voor het gebruik van RDF/XML. In tegenstelling tot
Turtle en Ntriples leest deze standaard niet zo makkelijk. Een ander nadeel is dat RDF/XML
bestanden vaak nogal groot worden.97
Stap 4 van het Linked Data principe van Tim Berners-Lee gaat over het koppelen naar andere,
gerelateerde (open) data concepten.
Je kunt verwijzen naar allerlei
entiteiten doordat ieder
concept in relatie gebracht kan
worden met een ander
concept. Een concept kan in
verschillende contexten een
andere betekenis hebben. De
verbindingsmogelijkheden van
concepten zijn eindeloos. Er
wordt als het ware een web
van triples gemaakt. Figuur 5 is
een voorbeeld dat bestaat uit
allemaal triples van een
entiteit, in dit geval een persoon, die allerlei relaties en
eigenschappen beschrijven van deze entiteit, maar in
verschillende contexten.
Om alle entiteiten te beschrijven, zijn er verschillende vocabularies in omgang. Veel verschillende
culturele erfgoedinstellingen hebben immers een andere manier van benoemen van hun entiteiten.
In vocabularies zijn standaardpredicaten opgenomen. Je hoeft dus niet meer je eigen predicaat te
maken, als er voor deze entiteit al een predicaat is. De bekendste vocabularies zijn98
:
� FOAF, vooral predicaten die betrekking hebben op personen.
97
http://www.den.nl/art/uploads/files/Tutorial%20Linked%20Data%20Part%203.pdf (Linked Data: stap voor
stap, deel 3) (geraadpleegd: 15-08-2011) 98
http://tomheath.com/papers/bizer-heath-berners-lee-ijswis-linked-data.pdf (‘Linked Data – The story so
far’)(geraadpleegd:21-07-2011)
Figuur 10: Web van RDF-triples.

47
� SKOS, (Simple Knowledge Organization System). SKOS wordt gebruikt voor het vastleggen
van thesauri en andere woordsystemen als bijvoorbeeld de AAT.
� Dublin Core, is een van de belangrijkste standaardpredicaten. Het is wereldwijd bekend, en
wordt door bijna elk systeem begrepen. Het bevat standaardpredicaten van beschrijvende
metadata.
� OAI-ORE, bevat objecten voor hergebruik en wisselen van tekst, afbeeldingen, data en video.
Nu we het Linked Data principe besproken hebben kunnen we eigenlijk wel zeggen dat het RDF-
datamodel de gemeenschappelijke set procedures is die er voor zorgt dat er interoperabiliteit
ontstaat tussen de verschillende collecties van culturele erfgoedinstellingen.
4.6 Linked (Open) Data - wat nu?
Met de groei van het Linked (Open) Data netwerk op het Web ontstaan steeds meer Linked (Open)
Data initiatieven. Deze zijn in drie categorieën te delen:
� De Linked (Open) Data browsers.
� De Linked (Open) Data zoekmachines.
� De Linked (Open) Data applicaties.
Linked (Open) Data browser
De Linked (Open) Data browser stelt gebruikers in staat om met behulp van links, weergeven in RDF-
triples, tussen verschillende databronnen te navigeren op het Web. Dankzij de Linked Data principes
van Tim Berners-Lee kan men veel eenvoudiger informatie in verband brengen met de informatie uit
andere contexten.99
Het Web of Data doet als het ware een suggestie een volgende databron te
bestuderen.
Linked (Open) Data zoekmachines
Het Linked Data principe maakt het mogelijkheid om met één zoekopdracht relevante resultaten te
vinden uit meerdere collecties. Door de data en namen van velden onafhankelijk van het
collectiebeheersysteem bij de archiefdienst vast te leggen en relaties te leggen met data en
99
Ibidem.
Figuur 11: Growth of LOD Cloud.

48
veldnamen op andere plaatsen op het Web is een heel nauwkeurig en volledig antwoordt op de
‘query’ te krijgen. Het doet er dan ook niet toe welke standaardpredicaten zijn gebruikt in de RDF-
triples. De betekenis van de subject-predicaat-objectrelaties zorgt voor de filtering van relevante
resultaten. Het levert een preciezer zoekresultaat op.
Deze Linked (Open) Data zoekmachine haalt alle soorten triples (subject-predicaat-objectrelaties) op
die hij tegenkomt als antwoordt op zijn zoekvraag, mits ze aan de selectiecriteria van de zoekvraag
voldoen. Een ander woord voor zoekvraag is ‘query’. De standaard, de zogenaamde ‘querytaal’, van
deze zoekmachine, om een antwoordt te vinden dat aan de selectiecriteria voldoet, is SPARQL.100
Linked (Open) Data applicaties
Linked (Open) Datasets lenen zich uitstekend voor het maken van ‘mash-ups’ Er dienen nieuwe
koppelingen gelegd te worden tussen bestaande informatie. Deze bestaande data kan heel variërend
zijn, zoals bijvoorbeeld foto’s van Flickr, video’s van YouTube, kaarten van Google, boeken of
muziekbestanden. Deze mix van bestaande informatie werkt vervolgens als een nieuwe online
service.101
In hoofdstuk 5: Linked Open Data in de praktijk, zal ik verder ingaan op browsers, zoekmachines en
applicaties die gebaseerd zijn op Linked (Open) Data.
100
Zandhuis, ‘Fundamenten in verandering: archieven op het semantisch web’, 8. 101
J. Grooten, M. De Niet, E.L. Rademaker ed., ABC-DE Woordenboek voor het Digitaal Erfgoed, (Rotterdam:
Veenman Drukkers 2008), 133.

49
5 Linked Open Data in de praktijk
De groei van het Linked (Open) Data netwerk heeft invloed op de hoeveelheid en soort initiatieven
die worden opgezet binnen de culturele erfgoedsector. Hoe staat het inmiddels met Linked (Open)
Data in de praktijk? Welke culturele instellingen wagen de sprong en maken hun digitale informatie
beschikbaar met behulp van Linked (Open) Data? Welke categorieën die in hoofdstuk 4 zijn
onderscheiden zien we terug? De volgende voorbeelden laten een beeld van de praktijk zien.
5.1 Aandacht voor Linked (Open) Data
Sinds een aantal jaar heeft Linked (Open) Data zijn entree gemaakt in de culturele erfgoedsector. Er
is steeds meer aandacht voor de manier waarop je Linked (Open) Data kunt maken en wat de
meerwaarde van Linked (Open) Data voor de culturele erfgoedsector is. Digitaal Erfgoed Nederland is
het kenniscentrum voor digitaal erfgoed en maakt deze rol ook waar.
Digitaal Erfgoed Nederland heeft hun online kennisdossier aangevuld met een pagina gewijd aan
zowel Linked Open Data als het Semantisch Web. In het kennisdossier over Linked Open Data is een
‘recept’ van Jacco van Ossenbruggen. Dit ‘recept’ is speciaal voor de culturele erfgoedinstellingen die
wel eens gehoord hebben van Linked (Open) Data maar niet weten wat ze er precies mee moeten.
Het is een praktische handleiding voor het creëren van Linked (Open) Data. Jacco van Ossenbruggen
staat stil bij het wat en waarom van Linked (Open) Data en geeft tips hoe Linked (Open) Data toe te
passen.102
Voor degenen die daadwerkelijk een deel van hun collectie willen omzetten naar een Linked Open
dataset hebben Paul Hermans en Henk Vanstappen een instructie gemaakt waarmee men aan de
slag kan gaan.103
Er wordt stap voor stap besproken welke handelingen moeten worden uitgevoerd
om een Linked Open dataset te maken van de collectie-informatie.
In juni publiceert Digitaal Erfgoed Nederland binnen het DEN Lab online tutorials over Linked Open
Data. Een keer in de twee weken wordt er een nieuwe tutorial gepubliceerd.
Dit initiatief is voortbordurend op het Dutch Culture Linked Open Data Event dat in mei werd mede
georganiseerd in Haarlem.
Naast Digitaal Erfgoed Nederland zijn er nog een hoop enthousiaste personen die over Linked (Open)
Data schrijven en bloggen. Voorbeelden hiervan zijn:
� http://digitaalduurzaam.blogspot.com/ door Inge Angevaare, coördinator Nationale Coalitie
Digitale Duurzaamheid.
� http://www.linkedin.com/groups/Open-Data-Nederland-3112848?trk=myg_ugrp_ovr Open
Data Nederland, groep binnen LinkedIn.
5. 2 Aan de slag
Alle aandacht die aan Linked (Open) Data wordt besteed is heel goed, maar zijn er nu ook
daadwerkelijk Linked (Open) Data initiatieven?
102
http://www.den.nl/bericht/2278 (Linked Data voor de erfgoedsector – een recept van Jacco van
Ossenbruggen)(geraadpleegd: 23-06-2011) 103
http://www.den.nl/art/uploads/files/LDpubliceren.pdf (Linked Data publiceren)(geraadpleegd: 20-09-2011)

50
5.2.1 ‘The Linking Open Data Project’
Het meest bekende voorbeeld van Linked (Open) Data is ‘The Linking Open Data Project’.
In januari 2007 heeft een groep gelijkgestemden dit project gestart. Het doel was het Web of Data
een impuls te geven door data sets onder een open licentie vrij te geven en deze te converteren naar
RDF volgens de Linked Data principes en deze vervolgens te publiceren op het web.
Het project is in de jaren snel gegroeid, iedereen kan namelijk participeren door data te publiceren
volgens de Linked Data principes en te linken naar al bestaande Linked Data sets. Hieronder is een
Linking Open Data cloud diagram te zien dat een overzicht geeft van alle gepubliceerde data sets en
hun relaties met andere data sets.104
‘The Linking Open Data Project’ is de algemene initiatief waarbij iedereen, welke sector dan ook zich
kan aansluiten. Het gaat hier tenslotte om het creëren van een web. Het is dus ook niet bij uitstek
een initiatief vanuit de culturele erfgoedsector. De meest recente versie van het Linked Open Data
Cloud laat echter wel een culturele erfgoedinstelling uit Nederland zien, namelijk: het Amsterdam
Museum.105
Het Amsterdam Museum heeft als eerste museum in
Nederland haar collectie beschikbaar gemaakt als Linked
Open Data.106
Om meer te weten te komen over hun
ervaringen en daarvan te leren had ik met Judith van Gent,
teamleider Documentatie & Fotografie in het Amsterdam
Museum, een gesprek. Zij was als databeheerder actief
betrokken bij dit project.
5.2.2 Amsterdam Museum als Linked Open Data
De collectie van het Amsterdam Museum bevat 70.000 objecten. Sinds 2010 is de hele collectie
digitaal toegankelijk via ‘De Collectie Online’.107
In het informatiebeleidsplan van het Amsterdam Museum staat dat zij de data beschikbaar stellen en
kennis delen met mogelijke partners.108
Data beschikbaar stellen betekent ook dat de digitale
informatie hergebruikt mag worden. Data en afbeeldingen worden aangeboden voor (her)gebruik
met een Creative Commons Attribution-Share licentie.
De digitale collectie beschikbaar maken als een Linked Open dataset lag dan ook voor de hand. Het
pionieren met het ontsluiten van de digitale collectie zit in de genen van het museum.109
Dit was de
Vrije Universiteit van Amsterdam ook opgevallen. Zij hebben het Amsterdam Museum benaderd en
hen gevraagd deel te nemen aan een experimenteel project dat Open Data en semantisch zoeken
104
http://www.w3.org/wiki/SweoIG/TaskForces/CommunityProjects/LinkingOpenData (‘The Linking Open Data
Project’) (geraadpleegd: 23-06-2011) 105
Zie bijlagen: B. 106
http://semanticweb.cs.vu.nl/lod/am/ (Amsterdam Museum in Europeana Data Model RDF)(geraadpleegd:
23-06-2011) 107
http://collectie.ahm.nl/ (AM Collectie Online)(geraadpleegd: 23-06-2011) 108
http://digitalecollectie.nl/casestudies/amsterdam-museum-gesprek-met-judith-van-gent/ (Case
study)(geraadpleegd: 19-09-2011) 109
http://digitalecollectie.nl/casestudies/amsterdam-museum-gesprek-met-judith-van-gent/ (Case
study)(geraadpleegd: 19-09-2011)
Figuur 12: Logo Amsterdam Museum.

51
onderzocht. Zij gebruiken de data die afkomstig is uit de collectiedatabase van Adlib, om te
experimenteren met open data en semantisch zoeken.
De VU benaderde juist het Amsterdam Museum vanwege de grote hoeveelheid contextinformatie
die de collectiedatabase beheert. De collectiedatabase bevat niet alleen de digitale objecten, maar
ook zaalteksten, tentoonstellingsteksten en catalogusteksten. Al deze digitale informatie schept
context en dat is juist waar semantisch zoeken om draait.
Wat levert het op?
Ik vroeg Judith van Gent, wat deze Linked Open dataset het Amsterdam Museum nu heeft
opgeleverd?
Het is nu anderhalf jaar geleden dat er een Linked Open dataset van de collectiedatabase is gemaakt.
Direct levert deze Linked Open dataset niet veel op. De Linked Open Data zijn bedoeld voor het
onderzoek naar Open Data en semantisch zoeken van de VU.
In maart heeft de VU de Linked Open dataset van het Amsterdam Museum geconverteerd naar het
Europeana Data Model. De data van het Amsterdam Museum zijn dan klaar voor de Europeana
portal. De data worden nu beheerd door ‘De Digitale Collectie Nederland’ en wachten daar tot ze
geharvest kunnen worden door Europeana. Dan pas levert het Amsterdam Museum ook iets op.
Tot die tijd is de Linked Open dataset van het museum voornamelijk een bevestiging van het
innovatieve karakter van het Amsterdam Museum. Meewerken aan een onderzoek als dit van de
Vrije Universiteit, ten behoeve van kennis delen ligt bovendien ook in het straatje van het
Amsterdam Museum.
Vanwege het onderzoek van de Vrije Universiteit zijn de problemen waar tegenaan gelopen werd
voornamelijk van technische aard. Het Amsterdam Museum had hier weinig mee te maken.
Nadelen
Wanneer ik Judith van Gent vraag naar de nadelen van de Linked Open dataset van het Amsterdam
Museum kom ik bij haar stokpaardje. Ze vindt het een groot nadeel dat de Linked Open dataset niet
actueel is. Deze is anderhalf jaar oud. Maar de collectiedatabase die door Adlib gehost wordt, wordt
elke twee weken geupdate. Er worden dan wijzigingen en aanpassingen doorgevoerd, trefwoorden
toegevoegd of zelfs een nieuw object in de collectiedatabase toegevoegd. Dit is nu allemaal niet te
zien in de Linked Open dataset. Deze is niet up-to-date.
Dit is ook de reden dat tijdens de ‘Apps for Amsterdam’ wedstrijd gebruik gemaakt werd van de
Application Programming Interface (API) van de collectiedatabase in Adlib en niet van de Linked
Open dataset. Deze API wordt net als de collectiedatabase in Adlib iedere twee weken geüpdate.
Dat is volgens Judith van Gent een groot nadeel. De Linked Open dataset van het Amsterdam
Museum is niet live. Het harvesten van de data uit de collectiedatabase zou periodiek moeten
gebeuren, net zoals er iedere week een up-date van de collectiedatabase wordt gemaakt in Adlib.
Er wordt nog maar even de nadruk gelegd op het experimentele karakter van de tot stand koming
van de Linked Open dataset van het Amsterdam Museum. De Linked Open dataset bevat dus hier en
daar onvolledigheden. Dankzij het experimentele karakter is dit echter niet erg. Het is puur bedoeld
voor museaal onderzoek.

52
Europeana
Vanwege het onderzoek van de VU naar semantisch zoeken en de relatie van de VU met Europeana
is er in maart 2011 voor gekozen de Linked Open dataset van het Amsterdam Museum om te zetten
naar het Europeana Data Model. Dit is een RDF-datamodel speciaal voor Europeana.
Je zou kunnen zeggen dat het voor een stadsmuseum niet relevant is bij Europeana te willen
aansluiten, maar de collectie van het Amsterdam Museum bevat veel deelcollecties die van
internationaal belang zijn.110
Bovendien profiteer je door je aan te sluiten bij Europeana ook van de
technologische en inhoudelijke tools die Europeana ontwikkeld voor de digitale ontsluiting van
collecties.
Wanneer in de loop van de tijd meer projecten worden geharvest door Europeana zal pas echt
duidelijk worden wat Europeana zal betekenen voor culturele erfgoedinstellingen en hun digitale
informatie.
Judith van Gent verwacht door opgenomen te zijn in de Europeana, dat de collectie van het
Amsterdam Museum meer internationale bekendheid krijgt. Dit is nu al te merken aan de Luijken
collectie, er worden veel meer fotoverzoeken van deze schilder aangevraagd dan voor de toetreding
tot de Europeana database. Daarnaast hoopt ze ook dat de zichtbaarheid van de gehele collectie
vergroot wordt.
Apps for Amsterdam
Tijdens de ‘Apps for Amsterdam’ wedstrijd is dus geen gebruik gemaakt van de Linked Open dataset,
maar van de API van de collectiedatabase in Adlib. De applicaties die ontwikkeld zijn gebruiken de
recente data van het API van Adlib. Een API van Adlib is echter dubbelop als je een Linked Open
dataset hebt. Maar een API beheert wel de actuele data, in tegenstelling tot de Linked Open dataset.
Judith van Gent ziet dan ook graag dat de Linked Open Data technologie nog iets vind op het
streamen van de live data. Maar deze ontwikkeling ligt nog in de toekomst.
Er is dus ook geen applicatie gemaakt die bestaat uit data van de Linked Open dataset. Maar wel een
hele mooie die gebruikt maakt van de API van de collectiedatabase in Adlib. Zie de website van ‘Apps
for Amsterdam’ voor de ‘Amsterdam Time Machine’.
Tot slot
De gebruiker is vanwege het experimentele karakter van het initiatief ook helemaal niet op de
hoogte van het bestaan van de Linked Open dataset van het Amsterdam Museum. Waarom is het
dan belangrijk om de collectie te ontsluiten als Linked Open dataset? Wat is het belang van Linked
Open Data voor de toekomst?
Volgens Judith van Gent is het linken van de inhoud erg belangrijk. Door de inhoud van verschillende
data aan elkaar te koppelen geldt voor zoekmachines dat zij beter in staat zijn de data te indexeren
wanneer data de Linked Data ‘standaard’ draagt. Op deze manier krijg je een completer en meer
nauwkeurig zoekresultaat.
Het Amsterdam Museum is dus het eerste museum dat haar collectie beschikbaar stelt als Linked
Open dataset. Als laatste vroeg ik Judith van Gent of zij nog tips hebben voor andere culturele
110
http://digitalecollectie.nl/casestudies/amsterdam-museum-gesprek-met-judith-van-gent/ (Case
study)(geraadpleegd: 19-09-2011)

53
erfgoedinstellingen die overwegen dit ook te doen? Een echte tip heeft ze niet. Het Amsterdam
Museum moet eerst dit project evalueren, voordat het goed kan beoordelen wat dit initiatief nu
precies voor hen heeft betekent en opgeleverd. Helaas ligt iets dergelijks nog niet in het verschiet,
vanwege het onderzoek van de VU dat nog steeds bezig is.
Ze heeft echter wel nog een opmerking. Ze meent dat het Europeana Data Model te ingewikkeld is
en pleit voor een lightversie van dit datamodel, zodat het toegankelijker in gebruik wordt en dit voor
musea de drempel doet verlagen hun data beschikbaar te stellen als Linked Open Data.
Naast deze casestudy van het Amsterdam Museum heb ik een aantal gesprekken gehad met
personen die werkzaam zijn in de culturele erfgoedsector en zich bezig houden met de problematiek
rond duurzame toegang tot digitale informatie en Linked (Open) Data. In de gesprekken die ik had
met verschillende personen uit de culturele erfgoedsector noemde zij ook een aantal projecten en
initiatieven die met Linked (Open) Data of het Semantisch Web te maken hadden.
5.2.3 MultimediaN N9C Eculture Project
Het MultimediaN N9C Eculture Project is een voorbeeld van een semantische zoekmachine. Dit
project heeft een zoekmachine ontwikkeld die gebaseerd is op de Semantische Web technologie. Het
demonstreert hoe de technologie van het Semantisch Web de zoekfunctie, het navigeren door de
collectie en annoteren van informatie interactief kan maken met de collectiedata.111
Aan dit project werkten meerdere culturele erfgoedinstellingen mee, o.a. het Rijksmuseum
Amsterdam, Digitaal Erfgoed Nederland, Rijksmuseum voor Volkenkunde Leiden, Instituut Collectie
Nederland en het Getty Research Institute.
111
http://e-culture.multimedian.nl/demo/www/faq.html#howitworks (MultimediaN N9C Eculture
Project)(geraadpleegd: 22-07-2011)
Figuur 13: MultimediaN N9C Eculture Project.

54
5.2.4 Europeana
Sinds de start van Europeana in 2008, geeft het mensen toegang tot miljoenen gedigitaliseerde
objecten uit Europa’s musea, bibliotheken, archieven en audiovisuele collecties. Europeana brengt je
niet in direct contact met de gedigitaliseerde objecten. Het is een database met de metadata van de
gedigitaliseerde objecten. Er wordt gelinked naar de website van de instelling waar het betreffende
object is gedigitaliseerd. Europeana geeft alleen de beschrijving van het object en waar het object
zich bevindt.112
Doordat Europeana de metadata van de digitale informatie beheerd, zijn zij een voorbeeld van de
Linked (Open) Data praktijk. Helaas is de zoekfunctie van de Europeana database nog niet
semantisch.
Meer dan 1500 culturele erfgoedinstellingen door heel Europa doen mee. De metadata wordt
geharvest bij de aggregatoren die de Linked (Open) datasets van culturele erfgoedinstellingen uit een
bepaald land verzamelen. In Nederland is ‘De Digitale Collectie’ een aggregator. Het Amsterdam
Museum heeft haar Linked Open dataset ook in beheer van ‘De Digitale Collectie’ gegeven in
afwachting tot het geharvest wordt door Europeana.
5.2.5 Apps for Amsterdam
Apps for Amsterdam is een initiatief om zoveel mogelijk data van de Gemeente Amsterdam
toegankelijk te maken voor iedereen. Ze hebben dit gedaan door Linked Open Data applicaties te
ontwikkelen met behulp van de Open Data van de instellingen die mee werkte.
‘PLAY! Amsterdam’ is helaas niet met behulp van Linked (Open) Data van een culturele
erfgoedinstelling tot stand gekomen, maar is wel een erg mooi voorbeeld van een Linked Open Data
applicatie.
112
ttp://group.europeana.eu/web/guest/provide_content;jsessionid=8F0F9C690C75E95C7CE3C22102FD4CFE
(Europeana)(geraadpleegd: 28-07-2011)
Figuur 14: Android App Play! Amsterdam.

55
6 Conclusie en aanbevelingen
Het streven naar duurzame toegang tot digitale erfgoedinformatie is dus een grote uitdaging voor de
culturele erfgoedinstellingen. Digitale informatie kent drie soorten bedreigingen die de risico’s op het
verlies van digitale informatie vergroten:
� Technologie,
� Metadata,
� Organisatie.
Het strategisch stappenmodel van Enno Meijers is een model dat stapsgewijs de risico’s op verlies
van digitale informatie verkleind. Hij onderscheidt daarin drie delen om tot duurzame borging van
digitale informatie te komen.
A: Het bepalen van de ambitie van de organisatie.
B: De digitale objecten veilig stellen.
C: Het duurzaam toegang bieden.
Het derde deel van dit stappenmodel, het duurzaam toegang bieden, gaat in op drie factoren:
� Beschrijven van de doelen van duurzame toegang,
� Metadata beheer,
� De veranderende omgeving.
Hypothese
Ik onderzocht de maatregelen die de veranderende omgeving vroeg en stelde hierbij dat Linked
(Open) Data een verandering in de omgeving is te noemen. Linked (Open) Data kan als een
technologische verandering van de omgeving worden gezien.
Aan de hand van het Semantisch Web werd duidelijk dat Linked (Open) Data als de eenvoudig
toepasbare praktijk van dit Semantisch Web wordt gezien. Linked (Open) Data is naar mijn mening
daarom een manier om de maatregelen voor duurzame toegankelijkheid tot digitale informatie
tegemoet te komen. In het bijzonder veranderingen in de omgeving.
Analyse stappenmodel Enno Meijers en Linked Data principe Tim Berners-Lee
De literatuur vermeld dat om duurzame toegang tot digitale informatie te bereiken, gebruikers
eenvoudiger over de informatie moeten kunnen beschikken op de lange termijn en dat deze
informatie betrouwbaar dient te zijn. Om aan deze vraag te voldoen wordt de aandacht gevestigd op
het beheer van metadata en de veranderende omgeving.
Er zijn vijf verschillende soorten metadata beheer te benoemen:
� Referentie metadata,
� Context metadata

56
� Onveranderbaarheid (‘fixity’)
� Herkomst (‘provenance’)
� Toegang (‘access’)
Een aantal van deze metadata vertonen overeenkomsten met sommige stappen van het Linked Data
principe van Tim Berners-Lee.
Referentie metadata
Vanuit het stappenmodel van Enno Meijers wordt de noodzaak van een duurzame relatie tussen het
digitale object en de bijbehorende metadata benadrukt. Een oplossing die wordt aangedragen is de
bijbehorende metadata van het digitale object in een XML-document op te slaan. Dit is eenvoudig
want de digitale objecten worden al in XML-documenten opgeslagen dus de kennis om dit te doen is
al aanwezig in een culturele erfgoedinstelling.
De overeenkomst met het Linked Data principe van Tim Berners-Lee is die van het gekozen formaat,
het XML-document. Voordat er een triple (subject-predicaat-objectrelatie) gemaakt kan worden
dienen zowel de digitale objecten als de bijbehorende metadata te worden beschreven in een XML-
document. Deze XML-documenten vormen later de concepten van een triple (subject-predicaat-
objectrelatie).
‘Fixity’ en ‘provenance’
De manier waarop de authenticiteit van de digitale objecten en de bijbehorende metadata wordt
gewaarborgd vertoond een overeenkomst met stap 1 van het Linked Data principe van Tim Berners-
Lee.
Zoals aangegeven in het stappenmodel van Enno Meijers worden de metadata ten behoeve van de
authenticiteit gewaarborgd door een digitale ‘handtekening’ aan te brengen die de
onveranderbaarheid vast legt. Daarnaast wordt een wijzigingshistorie toegevoegd die de afkomst
vastlegt.
In stap 1 van het Linked Data principe gebeurt iets vergelijkbaars. Elk concept dat deel uitmaakt van
een triple krijgt een URI toegewezen. Een URI geeft de triple een unieke naam en plaats. De unieke
naam wijst op de authenticiteit van het digitale object of de bijbehorende metadata. De unieke
plaats verwijst naar de afkomst van het digitale object of de bijbehorende metadata.
Dat zijn dus twee overeenkomsten tussen beheersmaatregelen voor metadata beheer in het
stappenmodel van Enno Meijers en het Linked Data principe van Tim Berners-Lee.
De veranderingen in de omgeving zouden volgens mijn hypothese ook overeenkomsten moeten
vertonen met het Linked Data principe van Tim Berners-Lee.
Het leesbaar houden van de informatie
Het belangrijkste doel van duurzame toegankelijkheid is het leesbaar houden van de informatie. Het
leesbaar kunnen houden van de digitale informatie is gekoppeld aan het bekend zijn met de
definities van de gebruikte formaten.
In het stappenmodel van Enno Meijers wordt als oplossing voor dit probleem het gebruik van
formaten die gebaseerd zijn op open standaarden, aangedragen.
Ook hier kan men verwijzen naar Linked (Open) Data. Net als bij de referentie metadata kan XML als
oplossing worden toegepast. XML is immers een open standaard die door elke software en elk

57
systeem kan worden gebruikt. Ideaal dus om te gebruiken wanneer je bang bent de digitale
informatie niet meer te kunnen lezen vanwege het feit dat er geen kennis meer binnen de
organisatie beschikbaar is over het bestandsformaat dat gebruikt is om dit digitale object op te slaan.
Niet alleen technologische veranderingen zijn belangrijk om in de gaten te houden om de kans op
verlies van digitale informatie te verkleinen. Ook de doelgroep moet in de gaten worden gehouden.
De behoefte van de gebruiker
De gebruikers van dit moment verwachten dat informatie naar hen toekomt. Ze vinden hun
informatie op de plaatsen waar zij zich het meest bevinden, online op ‘social media’ pagina’s of
wanneer zij gebruik maken van hun smartphone. Het stappenmodel van Enno Meijers raad daarom
vanuit het perspectief van de gebruiker aan om open standaarden te gebruiken voor het duurzaam
toegankelijk houden van digitale informatie.
Een ontwikkeling die gebaseerd is op het Linked Data principe van Tim Berners Lee, is de Linked
(Open) Data applicatie. Het steeds grotere Linked (Open) Data netwerk dat ontstaat door steeds
meer Linked (Open) datasets, maakt het eenvoudig om een ‘mash-up’ te maken. Een ‘mash-up’
speelt juist in op de behoefte van deze gebruiker door verschillende bestaande data te combineren
tot een nieuwe online service. De online service komt wel naar de gebruiker toe via de ‘social media’
of de smartphone.
Aan de hand van deze analyse van de twee thema’s blijkt dat er genoeg overeenkomsten bestaan
tussen beheersmaatregelen voor duurzame toegankelijkheid tot digitale informatie en het Linked
Data principe van Tim Berners-Lee om deze twee thema’s aan elkaar te koppelen. Dit ondersteunt
mijn hypothese dus.
We kunnen uit deze analyse opmaken dat Linked (Open) Data een technologische verandering van de
omgeving is die beter metadata beheer stimuleert. Het raakt daarmee dus niet aan één maar aan
twee aspecten van het bieden van duurzame toegang tot digitale informatie.
De hoofdvraag:
Is Linked (Open) Data, als toepassing van het semantisch web, een mogelijkheid om digitale
erfgoedinformatie duurzaam toegankelijk te maken?
is door dit onderzoek dus positief beantwoordt.
Met dit onderzoek had ik niet alleen voor ogen te onderzoeken of Linked (Open) Data de duurzame
toegang tot digitale erfgoedinformatie bevorderd? Ik wilde ook een duidelijk beeld schetsen van
Linked (Open) Data. Wat is het? Wat levert het ons op? Wie maakt er al gebruik van Linked (Open)
Data? Hoofdstuk 4 gaf veel technische informatie die ook gebruikt is in de analyse om
overeenkomsten tussen beheersmaatregelen genoemd in het stappenmodel van Enno Meijers en
het Linked Data principe van Tim Berners-Lee te vinden.
Hoofdstuk 5 gaf door de praktijkvoorbeelden meer een beeld hoe Linked (Open) Data nu precies
door de culturele erfgoedsector gebruikt kan worden.
Aanbevelingen
Wat is er nu precies nodig om deze conclusie te ondersteunen?

58
Uit de analyse is gebleken dat XML gebruikt kan worden als open standaard.
Om vervolgens een Linked (Open) dataset te kunnen maken van de data in de collectiedatabase van
een erfgoedinstelling, dienen de data en bijbehorende metadata naar XML-documenten omgezet te
worden.
Vervolgens kunnen de RDF-triples gemaakt worden. De serialisatie die in het RDF-datamodel gebruikt
wordt is dan vanzelfsprekend RDF/XML.
Concreet kunnen we spreken van de volgende aanbevelingen:
� Voor het duurzaam opslaan van een digitaal object en de bijbehorende metadata dient een
XML-document gebruikt te worden. Dit vanwege de open standaard die XML is.
� De RDF-triples dienen in RDF/XML geschreven te worden.
� Nader onderzoek naar de praktijk van deze conclusie.

59
7 Geraadpleegde bronnen
Gedrukte bronnen
Angevaare, I. ed., Toekomst voor ons digitaal geheugen. Duurzame toegang tot informatie in
Nederland (Den Haag: Nationale Coalitie voor Digitale Duurzaamheid, juli 2009).
Boudrez, F., Een digitaal archief in 10 stappen, (Antwerpen: Expertise Centrum DAVID vzw, 2009).
Graaf, M. Van der en G.J. Nauta, ‘Noodklok voor behoud van born-digital erfgoed’, Informatie
Professional (04 / 2010).
Grooten, J., Niet, M. de, Rademaker, E.L. ed., ABC-DE Woordenboek voor het Digitaal Erfgoed,
(Rotterdam: Veenman Drukkers 2008).
Guntram, G., ‘A Cultural Heritage Semantic Web Example & Primer’, DigiCULT Thematic Issue 3 –
Towards a Semantic Web for Heritage Resources, (Oostenrijk: 2003).
Meijers, E., Stapsgewijs naar duurzame toegang. Onderzoek naar een strategisch stappenmodel voor
duurzame toegang tot digitale informatie in kleine en middelgrote erfgoedinstellingen. Thesis
Master of Business Informatics – Avans+ (Middelburg, april 2010).
Niet, M. de, Heijmans, L. en Verwayen, H. e.a., Business Model Innovatie Cultureel Erfgoed,
(Ministerie OCW: z.pl. 2009.
Rothenburg, J., ‘Ensuring the Longevity of Digital Information’, Scientific American, vol. 272, nr. 1
(1999).
Ross, S., ‘Position Paper’, DigiCULT Thematic Issue 3 – Towards a Semantic Web for Heritage
Resources, (Oostenrijk: 2003).
Statsbiblioteket, HATII ed., Repository Planning Checklist and Guidance, (Glasgow: HATII, 2008), 9.
Tim Berners-Lee, De wereld van het World Wide Web. Het oorspronkelijke ontwerp en de uiteindelijke
bestemming van het World Wide Web, beschreven door zijn uitvinder, (Amsterdam: 2000).
Zandhuis, I., ‘Fundamenten in verandering: archieven op het semantisch web’, Archievenblad, (mei
2010).
Internetbronnen
http://blogs.nature.com/jhendler/2009/06/16/what-is-the-semantic-web-really-all-about (‘What is
the Semantic Web really all about?’)(geraadpleegd: 28-07-2011)
http://digitaalduurzaam.blogspot.com/ (‘Linked Data’ – wat is dat nu eigenlijk
precies?’)(geraadpleegd: 28-07-2011)
http://nl.wikipedia.org/wiki/HTTP (Hypertext Transfer Protocol) (geraadpleegd: 28-08-2011)
http://nl.wikipedia.org/wiki/Internet (Internet) (geraadpleegd: 25-08-2011).
www.sync.nl/web-30/, (Definitie Semantisch Web van Christine Karman)(geraadpleegd: 14-06-2011)
http://tomheath.com/blog/2009/03/linked-data-web-of-data-semantic-web-wtf/ (‘Linked Data?
Web of Data? Semantic Web? WTF?’)(geraadpleegd: 28-07-2011)
http://tomheath.com/papers/bizer-heath-berners-lee-ijswis-linked-data.pdf (‘Linked Data – The
story so far’)(geraadpleegd:21-07-2011)
http://www.appsforamsterdam.nl/ (Apps for Amsterdam)(geraadpleegd: 29-09-2011)
http://www.appsforamsterdam.nl/wat-is-open-data (Wat is Open Data?) (geraadpleegd: 13-09-2011)
http://collectie.ahm.nl/ (AM Collectie Online)(geraadpleegd: 23-06-2011)
http://www.den.nl/art/uploads/files/LDpubliceren.pdf (Linked Data publiceren)(geraadpleegd: 20-
09-2011)

60
http://www.den.nl/art/uploads/files/Tutorial%20Linked%20Data%20Part%203b.pdf (Linked Data:
stap voor stap, deel 3B)(geraadpleegd: 15-08-2011)
http://www.den.nl/art/uploads/files/Tutorial%20Linked%20Data%20Part%203.pdf (Linked Data:
stap voor stap, deel 3) (geraadpleegd: 15-08-2011)
http://www.den.nl/bericht/2283 (Digitaal duurzame bewaartermijnen?) (geraadpleegd: 22-09-2011)
http://www.den.nl/blog/bericht/3027 (DCL11: Autoriteit, hergebruik en betekenis van linked data)
(geraadpleegd: 22-06-2011)
http://www.den.nl/bericht/2278 (Linked Data voor de erfgoedsector – een recept van Jacco van
Ossenbruggen)(geraadpleegd: 23-06-2011)
http://www.den.nl/pagina/217/standaarden_en_richtlijnen/ (DE BASIS voor digitale duurzaamheid)
(geraadpleegd: 26-07-2011)
http://www.den.nl/standaard/266/ (Uniform Resource Identifier (URI))(geraadpleegd: 29-08-2011)
http://www.den.nl/thema/10/interoperabiliteit (Interoperabiliteit)(geraadpleegd: 27-09-2011)
http://www.den.nl/thema/129/ (Linked Open Data) (geraadpleegd: 09-06-2011)
http://www.den.nl/thema/16/digitale-duurzaamheid (Digitale Duurzaamheid) (geraadpleegd: 4-07-
2011)
http://www.digitaalallemaal.nl/?p=2061, (Blog van DEN)(geraadpleegd: 24-09-2011).
http://digitalecollectie.nl/casestudies/amsterdam-museum-gesprek-met-judith-van-gent/ (Case
study)(geraadpleegd: 19-09-2011)
http://e-culture.multimedian.nl/demo/www/faq.html#howitworks (MultimediaN N9C Eculture
Project)(geraadpleegd: 22-07-2011)
http://www.encyclo.nl/begrip/semantiek (Semantiek)(geraadpleegd: 27-09-2011)
http://www.frankwatching.com/archive/2009/01/05/web-webber-webst-van-10-naar-
30%E2%80%A6-en-verder/ (Onafhankelijk crossmedia platform)(geraadpleegd: 26-08-2011)
http://www.nationaalarchief.nl/informatiebeheer-archiefvorming/-digitaal-
archiefmateriaal/bewaarstrategie%C3%ABn/emulatie (Emulatie) (geraadpleegd: 22-09-2011)
http://www.nationaalarchief.nl/informatiebeheer-archiefvorming/-digitaal-
archiefmateriaal/bewaarstrategie%C3%ABn/migratie (Migratie) (geraadpleegd: 22-09-2011)
http://www.ncdd.nl/digitaleduurzaamheid-inleiding.php (Inleiding in Digitale
Duurzaamheid)(geraadpleegd: 4-07-2011)
http://semanticweb.cs.vu.nl/lod/am/ (Amsterdam Museum in Europeana Data Model
RDF)(geraadpleegd: 23-06-2011)
http://www.w3.org/wiki/SweoIG/TaskForces/CommunityProjects/LinkingOpenData (‘The Linking
Open Data Project’) (geraadpleegd: 23-06-2011)
ttp://group.europeana.eu/web/guest/provide_content;jsessionid=8F0F9C690C75E95C7CE3C22102F
D4CFE (Europeana)(geraadpleegd: 28-07-2011)
Geïnterviewde personen
Inge Angevaare, coordinator Nationale Coalitie Digitale Duurzaamheid.
Victor de Boer, postdoctoraal onderzoeker binnen de Web & Media Group aan de Vrije Universiteit
Amsterdam.
Judith van Gent, teamleider afdeling Documentatie & Fotografie in het Amsterdam Museum.

61
8 Afbeeldingenlijst
Figuur 1: OAIS Functioneel model.
http://public.ccsds.org/publications/archive/650x0b1.PDF
Figuur 2: Digital Preservation Infrastructure and Processes.
Meijers, Enno, Stapsgewijs naar duurzame toegang. Onderzoek naar een strategisch stappenmodel
voor duurzame toegang tot digitale informatie in kleine en middelgrote erfgoedinstellingen. Thesis
Master of Business Informatics – Avans+ (Middelburg, april 2010)
Figuur 3: Deel C van het stappenmodel Enno Meijers.
Meijers, Enno, Stapsgewijs naar duurzame toegang. Onderzoek naar een strategisch stappenmodel
voor duurzame toegang tot digitale informatie in kleine en middelgrote erfgoedinstellingen. Thesis
Master of Business Informatics – Avans+ (Middelburg, april 2010)
Figuur 4: Open Standaarden, Open Source.
http://goo.gl/yqm0D
Figuur 5: Het DNA van web innovatie.
http://www.frankwatching.com/archive/2009/01/05/web-webber-webst-van-10-naar-
30%E2%80%A6-en-verder/
Figuur 6: Enabling technologies – layer cake.
http://www.w3.org/2002/Talks/www2002-w3ct-swintro-em/slide9-0.html
Figuur 7: Logo Europeana.
http://www.europeana.eu/portal/aboutus_press.html
Figuur 8: Enabling technologies – layer cake.
http://www.w3.org/2002/Talks/www2002-w3ct-swintro-em/slide9-0.html
Figuur 9: Schematische weergave van een triple.
http://digitaalduurzaam.blogspot.com/ (‘Linked Data- wat is dat nu eigenlijk precies?’)
Figuur 10: Web van RDF-triples.
http://goo.gl/Svu0N
Figuur 11: Growth of LOD Cloud.
http://goo.gl/7ppK1
Figuur 12: Logo Amsterdam Museum.
http://www.ahm.nl/nl/Amsterdam-Museum/algemeen/pers/ahm-huisstijl
Figuur 13: MultimediaN N9C Eculture Project.
http://e-culture.multimedian.nl/demo/session/search
Figuur 14: Android App PLAY! Amsterdam.
http://www.playamsterdam.nl/android.html

62
Bijlage A Strategisch Stappenmodel Enno Meijers

63
Bijlage B Linked Open Data Cloud Diagram