DIGITAAL ERFGOED HOUDBAAR
PROJECTPLAN
Project C.5
Organiseren van coördinatie van webarchivering in
Nederland
Datum: 11 januari 2016
Auteur: Arnoud Goos (Nederlands Instituut voor Beeld en Geluid)
Projectmanager: Arnoud Goos (Nederlands Instituut voor Beeld en Geluid)
Opdrachtgever: Marcel Ras (NDE WP3 Digitaal Erfgoed Houdbaar)
Projectplan
2/11
Introductie
Doel van dit document
Dit document beschrijft de grondslagen waarop de initiatie van het project ‘C.1.3:Organiseren
van coördinatie van webarchivering in Nederland’ rust.
Het document vormt het contract tussen het projectmanagementteam en de bedrijfs- of
programmamanagement. Iedere significante wijziging in de inhoud van het Projectvoorstel
moet dan ook worden afgestemd met het betreffende bedrijfs- of programmamanagement.
Op basis van dit document geeft de Stuurgroep Digitaal Erfgoed Houdbaar goedkeuring voor
het uitvoeren van het project.
Projectplan
3/11
Inhoudsopgave
Achtergrond van het project .............................................................................................................................. 4
Context van het project ................................................................................................................................... 4 Aanleiding ............................................................................................................................................................. 5
Projectdefinitie ........................................................................................................................................................ 6 Probleem................................................................................................................................................................ 5 Doelstelling(en) van het project ................................................................................................................... 6 Bereik(scope) en afbakening ......................................................................................................................... 6 Belangrijkste projectresultaten ..................................................................................................................... 7 Randvoorwaarden .............................................................................................................................................. 8 Relaties met andere projecten ...................................................................................................................... 8
Business Case in hoofdlijnen. ............................................................................................................................ 8 Projecttoleranties ................................................................................................................................................... 8 Acceptatiecriteria .................................................................................................................................................... 9 Onderkende risico’s ............................................................................................................................................... 9 Projectorganisatie .................................................................................................................................................. 9
Overlegstructuur ................................................................................................................................................. 9 Planning ................................................................................................................................................................... 10 Budget ...................................................................................................................................................................... 10
Projectplan
4/11
Achtergrond van het project
Context van het project
Het project ‘C.1.3: Organiseren van coördinatie van webarchivering in Nederland’ is onderdeel
van een werkprogramma van het Netwerk Digitaal Erfgoed. Dit in 2014 op initiatief van het
ministerie van Onderwijs, Cultuur en Wetenschap (OCW) gestarte samenwerkingsverband is
gericht op het verbeteren van de zichtbaarheid, bruikbaarheid en houdbaarheid van het
nationale digitale erfgoed. Op basis van deze drie pijlers uit de Nationale Strategie Digitaal
Erfgoed zijn drie werkprogramma’s in het leven geroepen die in de periode 2015-2016
uitgevoerd worden:1
Digitaal Erfgoed Zichtbaar: vergroot de zichtbaarheid van collecties, verkent de vraag
van gebruikers en bevordert (her)gebruik van digitale collecties.
Digitaal Erfgoed Bruikbaar: verbetert de mogelijkheden tot gebruik van collecties door
ze gezamenlijk online beschikbaar te stellen, data te verbinden en te verrijken met
behulp van termenlijsten en thematisch beheer en door gerichte diensten te
ontwikkelen.
Digitaal Erfgoed Houdbaar: werkt aan het sectoroverstijgend delen, benutten en
opschalen van voorzieningen voor duurzaam behoud en toegang, met aandacht voor
kostenbeheersing en onderlinge rolverdeling.
‘Organiseren van coördinatie van webarchivering in Nederland‘ valt binnen werkpakket 3
Digitaal Erfgoed Houdbaar, en in cluster C. Het werkpakket is namelijk weer onderverdeeld in
drie clusters, die nauw met elkaar verbonden zijn:2
A. Schaalbare en bruikbare voorzieningen
B. Een transparante kostenstructuur
C. Afspraken en procedures met betrekking tot rollen en verantwoordelijkheden bij
collectievorming
Dit project is één van de use cases binnen cluster C en zal zich op het gebied van
webarchivering in Nederland dan ook richten op de rollen en verantwoordelijkheden tussen de
verschillende instanties.
1 Nationale strategie digitaal erfgoed: Een initiatief van het Netwerk Digitaal Erfgoed (2015):
http://www.den.nl/art/uploads/files/Publicaties/Nationale_Strategie_Digitaal_Erfgoed_MinOCW.pdf 2 Netwerk Digitaal Erfgoed Programmaplan WP3: Digitaal Erfgoed Houdbaar (2015).
Projectplan
5/11
Schets van Werkpakket 3: Houdbaar
Aanleiding
In Nederland is, in tegenstelling tot veel andere landen, geen sprake van een zogenaamd
‘legal e-deposit’ (een wettelijke verplichting tot het bewaren van digitale documentatie als
websites, e-mails, en dergelijke).3 Er bestaat niet eens een wettelijk depot (voor fysieke
documentatie). Er is dus geen heldere (archief)taak voor instanties of instellingen in
Nederland om het web te archiveren. Wel hebben verschillende organisaties in Nederland
(vooral archieven) een wettelijke verplichting tot het bewaren van overheidsinformatie van de
verschillende overheidslagen. Hieronder wordt vaak ook via het web verspreide
overheidsinformatie geschaard. Ter verduidelijking: een legal deposit is typisch een taak van
(nationale) bibliotheken en de Archiefwet richt zich op de archiefsector. Beide hebben dus een
ander mandaat, ook waar het archiveren van websites betreft.
Het niet hebben van een ‘legal e-deposit’ levert daarnaast extra werk op voor de instanties
die wel websites archiveren. Zij zullen voor het opslaan van de webpagina’s (wat simpel
gezegd neerkomt op het kopiëren ervan) toestemming moeten verkrijgen van de eigenaren
(opt-in), of op z’n minst de eigenaren op de hoogte brengen van het voornemen tot
archivering (opt-out).
Doordat er geen centrale plaats is waar het Nederlandse webdomein gearchiveerd wordt,
hebben verschillende instanties de taak op zich genomen internetpagina’s te archiveren die
voor hen relevant zijn. Deze instanties hebben allemaal andere achterliggende doelen,
hanteren andere selectiecriteria en doen dat vanuit een verschillende taakstelling.4 Onderling
is er weinig tot geen kennis over de werkzaamheden en de collecties van de andere
organisaties. Landelijke coördinatie ontbreekt.
3 Zoals bijvoorbeeld sinds 2013 wel het geval is in het Verenigd Koninkrijk.
4 Zo archiveert de ene instelling internetpagina’s als vorm van cultureel erfgoed (Beeld en Geluid) en de andere voor
het bewaren van overheidsinformatie (Nationaal Archief). Beiden instellingen hebben een andere doel en een andere
taak.
Projectplan
6/11
Projectdefinitie
In deze versie van het document wordt niet langer gesproken over een ‘use-case’, maar over
een project. Dit na opwaardering door de stuurgroep in december 2015.
Probleem
In Nederland zijn er verschillende nationale en regionale instellingen bezig met het archiveren
van websites; bibliotheken, archieven, wetenschappelijke organisaties en zelfs musea.
Onderling is er enig en sporadisch overleg, maar van een heldere coördinatie is geenszins
sprake. Hierdoor worden wielen onnodig opnieuw uitgevonden, wordt er werk dubbel gedaan
en blijven eventuele kansen, die kunnen optreden bij betere samenwerking, onbenut.
De grootste speler op nationaal niveau in het veld van webarchivering is de Koninklijke
Bibliotheek. Zij heeft momenteel een selectie van circa 10.000 websites in haar webarchief.
Andere instanties zijn onder andere het Webarchief van de Groninger Archieven (met de
ambitie aan het eind van 2015 1000 websites te hebben gearchiveerd), het Nationaal Archief
(die in een pilotfase verkeren met betrekking tot het archiveren van overheidswebsites), het
Gemeentearchief Rotterdam en het Nederlands Instituut voor Beeld en Geluid (circa 75
websites). Naast deze instellingen zijn er ook grotere en kleinere gemeenten bezig met het
veiligstellen van hun websites. Onderling zijn er weinig tot geen afspraken over wie wat doet
en hoe dat wordt gedaan.
Daarnaast hanteren de verschillende webarchieven in Nederland verschillende principes. Zo
archiveren de KB en Beeld en Geluid met het doel een collectie op te bouwen, en zijn
overheden meer geïnteresseerd in webarchivering volgens de Archiefwet. Bij verschillende
uitgangspunten horen niet alleen verschillende selectiecriteria, maar ook verschillende
middelen om die doelen te bereiken.
Doelstelling(en) van het project
Doel van dit project is breed gezegd meer zicht krijgen op welke webarchief-initiatieven er
zijn in Nederland, welke selectiecriteria er op na worden gehouden en van welke
infrastructuren en software er gebruik wordt gemaakt. Doel hierbij is het opzetten van
coördinatie tussen de verschillende instanties die zich bezig houden met webarchivering. Dit
om duidelijke afspraken te maken tussen de collectiebeherende instellingen over de rollen en
verantwoordelijkheden binnen webarchivering in Nederland.
Concreter worden deze brede doelen vertaald naar het onderzoeken van de mogelijkheid voor
een Nationaal register van gearchiveerde websites. Welke websites worden gearchiveerd en
door wie? En waar zijn de gearchiveerde websites te bekijken en eventueel te doorzoeken?
Deel van het onderzoek naar een mogelijk nationaal register zal bestaan uit het onderzoeken
van de beste vorm waarin een dergelijk bestand kan worden aangeboden en doorzoekbaar
gemaakt kan worden.
Bovengenoemde punten zullen, eenmaal gerealiseerd, de webarchiverende instanties in
Nederland helpen. Zij weten bij wie bepaalde kennis is belegd, waar welke websites worden
gearchiveerd en wat de achterliggende collectie doelstellingen per instantie zijn. Wat niet uit
het oog mag worden verloren, is dat de eindgebruiker van het webarchief weinig boodschap
zal hebben aan de onderlinge verhoudingen tussen instanties. Het zal de eindgebruiker vooral
gaan om duidelijkheid over welke websites in Nederland gearchiveerd zijn in welke periode en
waar hij moet zijn om er toegang tot te krijgen. Aangezien webarchivering bij meerdere
instanties is belegd, is een totaaloverzicht wat waar wordt gearchiveerd uiterst wenselijk.
Projectplan
7/11
Ondanks dat de nadruk in het project meer op de houdbaarheid van de gearchiveerde
websites ligt en minder op het gebruik ervan, zal ook de toegankelijkheid van het webarchief
worden meegenomen in de inventarisatie. Toegang is voor veel webarchieven een lastig punt.
Vanwege ondoorzichtige rechtenkwesties is het opnieuw online beschikbaar stellen van
gearchiveerde websites voor veel archieven problematisch. Een van de doelstellingen van het
project is dan ook het in kaart brengen van de mate waarin verschillende webarchieven
toegankelijk zijn voor de gebruiker, en welke voorwaarden er voor die toegankelijkheid
gelden.
Bereik(scope) en afbakening
- De hierboven genoemde eindgebruiker van het webarchief staat niet centraal. Deze
moet te allen tijde in het achterhoofd gehouden worden, maar de nadruk in dit
project ligt op de digitale houdbaarheid en niet de digitale bruikbaarheid. Eerst
moet de houdbaarheid op orde zijn voor de bruikbaarheid daar van kan profiteren.
o Bij de inventarisatie van hoe een selectie tot stand komt, zal wel worden
bekeken of een eindgebruiker hier een rol in kan spelen. Kan een
eindgebruiker bijvoorbeeld een website aanmelden voor archivering? Of
wordt de selectie gemaakt door de organisatie zelf?
- Alhoewel er wel naar het buitenland gekeken en gerefereerd zal worden, zal de
primaire focus van het project liggen op nationale coördinatie van webarchivering.
o In het buitenland ligt veel kennis over webarchivering, dus er zal zeker
gekeken worden naar initiatieven als het Memento-project van de British
Library of hoe andere leden van de IIPC (International Internet Preservation
Consortium) omgaan met vergelijkbare uitdagingen.
o Er zijn ook buitenlandse webarchieven die Nederlandse websites archiveren.
Internet Archive heeft bijvoorbeeld een grote collectie Nederlandse
websites. Er zal een verkenning van dit deel van het Nederlandse domein
worden gedaan, maar het is niet realistisch om te ambiëren alle
buitenlandse webarchieven te vinden die een deel van het Nederlandse
domein archiveren.
- Het project zal zich in eerste instantie richten op de nationale en regionale
webarchiveringsinitiatieven, en niet op particuliere en bedrijfsarchieven.
- Het project focust primair op de archivering van websites, maar zal daarnaast ook
de archivering van social media niet buiten beschouwing laten, aangezien deze
vaak een integraal onderdeel vormen van een website.
- De scope van het project ligt niet op het oplossen van de technische en/of
juridische struikelblokken van webarchivering, maar richt zich op strategische en
organisatorische samenwerkingen. Deze struikelblokken hebben wellicht wel hun
invloed op hoe webarchivering in Nederland wordt aangepakt en zullen daarom wel
erkend worden. Het oplossen ervan valt echter buiten de scope van het project.
Belangrijkste projectresultaten
- Een inventarisatierapport over welke behoeften er zijn met betrekking tot
landelijke coördinatie van webarchivering onder de verschillende instanties die zich
bezig houden met webarchivering.
- Een eindrapport waarin de strategische vraag ‘waarom archiveren we websites (en
social media)?’ wordt beantwoord. Hierin worden tevens de rollen en
verantwoordelijkheden binnen de samenwerkende instanties uiteengezet.
- Een nationaal webarchief register: hierin is te vinden welke websites waar worden
gearchiveerd. Onderverdeeld in drie sub-resultaten:
o 1. het opzetten van een nationaal register als een instrument voor
registreren van gearchiveerde websites in Nederland (instrument).
Projectplan
8/11
o 2. het initieel vullen van dit register met de gearchiveerde websites van de
participerende instellingen en daar waar mogelijk van meer initiatieven
o 3. een voorstel voor waar dit register belegd moet worden. Wie moet dit
gaan bijhouden en wat is daarvoor nodig?
- Een beslisboom voor website-eigenaren en de webarchieven zelf. Bedoeld om aan
te geven waar een bepaalde website idealiter het beste thuishoort.
- Adviesrapport voor het eventueel inrichten van een Nationaal webarchief. Hierin
worden de resultaten opgesomd van het onderzoek naar de wenselijkheid voor een
nationaal webarchief: één portal van waaruit gezocht kan worden en binnen de
muren van één deelnemend instituut in de webarchieven van de andere
instituten/instellingen.
Randvoorwaarden
- Voldoende beschikbaarheid van de betrokken instanties.
- Voldoende draagvlak voor het beoogde eindresultaat bij de betrokken instanties.
Relaties met andere projecten
- Digitaal Erfgoed Bruikbaar - project B3-1: Annoteren Webarchief Groningen o.b.v.
GTAA en OpenSKOS: Enige overlap in projectmedewerkers.
- Digitaal Erfgoed Bruikbaar als werkpakket in het algemeen: ook voor de gebruiker van
een webarchief in Nederland is het gewenst een overzicht te hebben van welke
website waar wordt gearchiveerd.
Business Case in hoofdlijnen.
Zodra er meer zicht is op wat er in Nederland gebeurt op het gebied van webarchivering, kan
het voor zowel de webarchiverende instanties als de gebruikers van de webarchieven duidelijk
worden wie welke rol vertolkt en waar de verschillende verantwoordelijkheden liggen. Dit
project moet voor die duidelijkheid gaan zorgen.
Door betere samenwerking tussen webarchieven zal er tevens meer inzicht ontstaan in de
technische problemen waar veel webarchieven mee kampen. Door gedeelde ervaringen valt
er veel te leren over de mogelijke oplossingen voor die problemen. Hetzelfde geldt hierbij
voor het omgaan met de legale belemmeringen of juiste mogelijkheden van een webarchief.
Tevens zullen er schaalvoordelen gehaald kunnen worden bij leveranciers van middelen en
diensten die gebruikt worden bij het archiveren van het web. Doordat meerdere
webarchieven aansturen op dezelfde ontwikkelingen, ontstaat er een stevig blok dat
potentieel zowel inhoudelijke als financiële voordelen kan opleveren.
Projecttoleranties
Het project heeft een doorlooptijd van 6 maanden. Startdatum in 1 januari 2016 en de
einddatum is 30 juni 2016.
Projectplan
9/11
Acceptatiecriteria
De eindproducten moeten overzichtelijk zijn en simpel te benaderen zijn.
Onderkende risico’s
Het succes van het project wordt voor het grootste deel bepaald door de bereidwilligheid van
webarchieven binnen Nederland om mee te werken met het project. De neuzen zullen
enigszins dezelfde kant op moeten staan, met de betrekking tot de beoogde doelstellingen
van het project. Dit zal naar alle waarschijnlijkheid bij de NCDD partners voor een groot deel
het geval zijn. In hoeverre commerciële partijen wensen mee te werken aan een dergelijk
project is nog onduidelijk.
Projectorganisatie
Kla
nk
bo
rdg
roe
p
Marcel RasProgrammaleider
WP3
Arnoud GoosProjectleider
Peter de Bode(KB)
Barbara Sierman (KB)
Antal Posthumus(NA)
Marcel Privé (Crossmedia)
Lotte Baltussen(ZPP)
Stuurgroep
Overlegstructuur
De projectleider zal deel uitmaken van het reguliere projectleidersoverleg dat ongeveer één
keer per maand zal plaatsvinden onder voorzitterschap van de programmamanager Digitaal
Erfgoed Houdbaar. Naast deze overleggen geeft elke projectleider uit WP3 elk eind van de
week een emailupdate aan de programmamanager én daarbij aan elkaar. Hierdoor is
iedereen steeds op de hoogte van wat er in de andere (deel)projecten speelt.
Binnen de use-case zal de projectleider regelmatig spreken met een groepje van experts op
het gebied van webarchivering. Toegezegd hebben reeds Peter de Bode (KB), Antal
Posthumus (NA), Marcel Privé (GW Crossmedia), Barbara Sierman (KB) en Lotte Belice
Projectplan
10/11
Baltussen (ZZP’er en projectleider B3-1 Digitaal Erfgoed Bruikbaar).
Planning
Fase 0: november 2015 – december 2015.
Voorbereidende fase: verkennende/kennismakingsgesprek. Samenstellen
projectgroep. Schrijven projectplan.
Fase 1: januari 2015 – maart 2015.
Inventarisatie van webarchieven in Nederland. Inventarisatie van collectiebeleid,
workflows en behoeften.
Fase 2: april 2015 – juni 2015.
Uitwerken op te leveren stukken.
Budget
Exclusief uren-matching.
Aan
tal u
ur p
er w
eek
Aan
tal w
eken
Tota
al a
anta
l ur
enUurtar
ief
Kost
en
Projectleider 8 28 224 65 14560
Totaal € 14.560,00
Overzicht van wijzigingen Datum
wijziging
Samenvatting van wijzigingen Status
28-10-2015 Eerste uitgave V0.1
25-11-2015 Derde uitgave, na commentaar Marcel Ras, Lotte Baltussen. V0.3
26-11-2015 Vierde uitgave, na commentaar Peter de Bode. V1.0
07-01-2016 Vijfde uitgave, na opmerkingen Stuurgroep V1.1
Top Related