projectplan Webarchivering

10
DIGITAAL ERFGOED HOUDBAAR PROJECTPLAN Project C.5 Organiseren van coördinatie van webarchivering in Nederland Datum: 11 januari 2016 Auteur: Arnoud Goos (Nederlands Instituut voor Beeld en Geluid) Projectmanager: Arnoud Goos (Nederlands Instituut voor Beeld en Geluid) Opdrachtgever: Marcel Ras (NDE WP3 Digitaal Erfgoed Houdbaar)

Transcript of projectplan Webarchivering

Page 1: projectplan Webarchivering

DIGITAAL ERFGOED HOUDBAAR

PROJECTPLAN

Project C.5

Organiseren van coördinatie van webarchivering in

Nederland

Datum: 11 januari 2016

Auteur: Arnoud Goos (Nederlands Instituut voor Beeld en Geluid)

Projectmanager: Arnoud Goos (Nederlands Instituut voor Beeld en Geluid)

Opdrachtgever: Marcel Ras (NDE WP3 Digitaal Erfgoed Houdbaar)

Page 2: projectplan Webarchivering

Projectplan

2/11

Introductie

Doel van dit document

Dit document beschrijft de grondslagen waarop de initiatie van het project ‘C.1.3:Organiseren

van coördinatie van webarchivering in Nederland’ rust.

Het document vormt het contract tussen het projectmanagementteam en de bedrijfs- of

programmamanagement. Iedere significante wijziging in de inhoud van het Projectvoorstel

moet dan ook worden afgestemd met het betreffende bedrijfs- of programmamanagement.

Op basis van dit document geeft de Stuurgroep Digitaal Erfgoed Houdbaar goedkeuring voor

het uitvoeren van het project.

Page 3: projectplan Webarchivering

Projectplan

3/11

Inhoudsopgave

Achtergrond van het project .............................................................................................................................. 4

Context van het project ................................................................................................................................... 4 Aanleiding ............................................................................................................................................................. 5

Projectdefinitie ........................................................................................................................................................ 6 Probleem................................................................................................................................................................ 5 Doelstelling(en) van het project ................................................................................................................... 6 Bereik(scope) en afbakening ......................................................................................................................... 6 Belangrijkste projectresultaten ..................................................................................................................... 7 Randvoorwaarden .............................................................................................................................................. 8 Relaties met andere projecten ...................................................................................................................... 8

Business Case in hoofdlijnen. ............................................................................................................................ 8 Projecttoleranties ................................................................................................................................................... 8 Acceptatiecriteria .................................................................................................................................................... 9 Onderkende risico’s ............................................................................................................................................... 9 Projectorganisatie .................................................................................................................................................. 9

Overlegstructuur ................................................................................................................................................. 9 Planning ................................................................................................................................................................... 10 Budget ...................................................................................................................................................................... 10

Page 4: projectplan Webarchivering

Projectplan

4/11

Achtergrond van het project

Context van het project

Het project ‘C.1.3: Organiseren van coördinatie van webarchivering in Nederland’ is onderdeel

van een werkprogramma van het Netwerk Digitaal Erfgoed. Dit in 2014 op initiatief van het

ministerie van Onderwijs, Cultuur en Wetenschap (OCW) gestarte samenwerkingsverband is

gericht op het verbeteren van de zichtbaarheid, bruikbaarheid en houdbaarheid van het

nationale digitale erfgoed. Op basis van deze drie pijlers uit de Nationale Strategie Digitaal

Erfgoed zijn drie werkprogramma’s in het leven geroepen die in de periode 2015-2016

uitgevoerd worden:1

Digitaal Erfgoed Zichtbaar: vergroot de zichtbaarheid van collecties, verkent de vraag

van gebruikers en bevordert (her)gebruik van digitale collecties.

Digitaal Erfgoed Bruikbaar: verbetert de mogelijkheden tot gebruik van collecties door

ze gezamenlijk online beschikbaar te stellen, data te verbinden en te verrijken met

behulp van termenlijsten en thematisch beheer en door gerichte diensten te

ontwikkelen.

Digitaal Erfgoed Houdbaar: werkt aan het sectoroverstijgend delen, benutten en

opschalen van voorzieningen voor duurzaam behoud en toegang, met aandacht voor

kostenbeheersing en onderlinge rolverdeling.

‘Organiseren van coördinatie van webarchivering in Nederland‘ valt binnen werkpakket 3

Digitaal Erfgoed Houdbaar, en in cluster C. Het werkpakket is namelijk weer onderverdeeld in

drie clusters, die nauw met elkaar verbonden zijn:2

A. Schaalbare en bruikbare voorzieningen

B. Een transparante kostenstructuur

C. Afspraken en procedures met betrekking tot rollen en verantwoordelijkheden bij

collectievorming

Dit project is één van de use cases binnen cluster C en zal zich op het gebied van

webarchivering in Nederland dan ook richten op de rollen en verantwoordelijkheden tussen de

verschillende instanties.

1 Nationale strategie digitaal erfgoed: Een initiatief van het Netwerk Digitaal Erfgoed (2015):

http://www.den.nl/art/uploads/files/Publicaties/Nationale_Strategie_Digitaal_Erfgoed_MinOCW.pdf 2 Netwerk Digitaal Erfgoed Programmaplan WP3: Digitaal Erfgoed Houdbaar (2015).

Page 5: projectplan Webarchivering

Projectplan

5/11

Schets van Werkpakket 3: Houdbaar

Aanleiding

In Nederland is, in tegenstelling tot veel andere landen, geen sprake van een zogenaamd

‘legal e-deposit’ (een wettelijke verplichting tot het bewaren van digitale documentatie als

websites, e-mails, en dergelijke).3 Er bestaat niet eens een wettelijk depot (voor fysieke

documentatie). Er is dus geen heldere (archief)taak voor instanties of instellingen in

Nederland om het web te archiveren. Wel hebben verschillende organisaties in Nederland

(vooral archieven) een wettelijke verplichting tot het bewaren van overheidsinformatie van de

verschillende overheidslagen. Hieronder wordt vaak ook via het web verspreide

overheidsinformatie geschaard. Ter verduidelijking: een legal deposit is typisch een taak van

(nationale) bibliotheken en de Archiefwet richt zich op de archiefsector. Beide hebben dus een

ander mandaat, ook waar het archiveren van websites betreft.

Het niet hebben van een ‘legal e-deposit’ levert daarnaast extra werk op voor de instanties

die wel websites archiveren. Zij zullen voor het opslaan van de webpagina’s (wat simpel

gezegd neerkomt op het kopiëren ervan) toestemming moeten verkrijgen van de eigenaren

(opt-in), of op z’n minst de eigenaren op de hoogte brengen van het voornemen tot

archivering (opt-out).

Doordat er geen centrale plaats is waar het Nederlandse webdomein gearchiveerd wordt,

hebben verschillende instanties de taak op zich genomen internetpagina’s te archiveren die

voor hen relevant zijn. Deze instanties hebben allemaal andere achterliggende doelen,

hanteren andere selectiecriteria en doen dat vanuit een verschillende taakstelling.4 Onderling

is er weinig tot geen kennis over de werkzaamheden en de collecties van de andere

organisaties. Landelijke coördinatie ontbreekt.

3 Zoals bijvoorbeeld sinds 2013 wel het geval is in het Verenigd Koninkrijk.

4 Zo archiveert de ene instelling internetpagina’s als vorm van cultureel erfgoed (Beeld en Geluid) en de andere voor

het bewaren van overheidsinformatie (Nationaal Archief). Beiden instellingen hebben een andere doel en een andere

taak.

Page 6: projectplan Webarchivering

Projectplan

6/11

Projectdefinitie

In deze versie van het document wordt niet langer gesproken over een ‘use-case’, maar over

een project. Dit na opwaardering door de stuurgroep in december 2015.

Probleem

In Nederland zijn er verschillende nationale en regionale instellingen bezig met het archiveren

van websites; bibliotheken, archieven, wetenschappelijke organisaties en zelfs musea.

Onderling is er enig en sporadisch overleg, maar van een heldere coördinatie is geenszins

sprake. Hierdoor worden wielen onnodig opnieuw uitgevonden, wordt er werk dubbel gedaan

en blijven eventuele kansen, die kunnen optreden bij betere samenwerking, onbenut.

De grootste speler op nationaal niveau in het veld van webarchivering is de Koninklijke

Bibliotheek. Zij heeft momenteel een selectie van circa 10.000 websites in haar webarchief.

Andere instanties zijn onder andere het Webarchief van de Groninger Archieven (met de

ambitie aan het eind van 2015 1000 websites te hebben gearchiveerd), het Nationaal Archief

(die in een pilotfase verkeren met betrekking tot het archiveren van overheidswebsites), het

Gemeentearchief Rotterdam en het Nederlands Instituut voor Beeld en Geluid (circa 75

websites). Naast deze instellingen zijn er ook grotere en kleinere gemeenten bezig met het

veiligstellen van hun websites. Onderling zijn er weinig tot geen afspraken over wie wat doet

en hoe dat wordt gedaan.

Daarnaast hanteren de verschillende webarchieven in Nederland verschillende principes. Zo

archiveren de KB en Beeld en Geluid met het doel een collectie op te bouwen, en zijn

overheden meer geïnteresseerd in webarchivering volgens de Archiefwet. Bij verschillende

uitgangspunten horen niet alleen verschillende selectiecriteria, maar ook verschillende

middelen om die doelen te bereiken.

Doelstelling(en) van het project

Doel van dit project is breed gezegd meer zicht krijgen op welke webarchief-initiatieven er

zijn in Nederland, welke selectiecriteria er op na worden gehouden en van welke

infrastructuren en software er gebruik wordt gemaakt. Doel hierbij is het opzetten van

coördinatie tussen de verschillende instanties die zich bezig houden met webarchivering. Dit

om duidelijke afspraken te maken tussen de collectiebeherende instellingen over de rollen en

verantwoordelijkheden binnen webarchivering in Nederland.

Concreter worden deze brede doelen vertaald naar het onderzoeken van de mogelijkheid voor

een Nationaal register van gearchiveerde websites. Welke websites worden gearchiveerd en

door wie? En waar zijn de gearchiveerde websites te bekijken en eventueel te doorzoeken?

Deel van het onderzoek naar een mogelijk nationaal register zal bestaan uit het onderzoeken

van de beste vorm waarin een dergelijk bestand kan worden aangeboden en doorzoekbaar

gemaakt kan worden.

Bovengenoemde punten zullen, eenmaal gerealiseerd, de webarchiverende instanties in

Nederland helpen. Zij weten bij wie bepaalde kennis is belegd, waar welke websites worden

gearchiveerd en wat de achterliggende collectie doelstellingen per instantie zijn. Wat niet uit

het oog mag worden verloren, is dat de eindgebruiker van het webarchief weinig boodschap

zal hebben aan de onderlinge verhoudingen tussen instanties. Het zal de eindgebruiker vooral

gaan om duidelijkheid over welke websites in Nederland gearchiveerd zijn in welke periode en

waar hij moet zijn om er toegang tot te krijgen. Aangezien webarchivering bij meerdere

instanties is belegd, is een totaaloverzicht wat waar wordt gearchiveerd uiterst wenselijk.

Page 7: projectplan Webarchivering

Projectplan

7/11

Ondanks dat de nadruk in het project meer op de houdbaarheid van de gearchiveerde

websites ligt en minder op het gebruik ervan, zal ook de toegankelijkheid van het webarchief

worden meegenomen in de inventarisatie. Toegang is voor veel webarchieven een lastig punt.

Vanwege ondoorzichtige rechtenkwesties is het opnieuw online beschikbaar stellen van

gearchiveerde websites voor veel archieven problematisch. Een van de doelstellingen van het

project is dan ook het in kaart brengen van de mate waarin verschillende webarchieven

toegankelijk zijn voor de gebruiker, en welke voorwaarden er voor die toegankelijkheid

gelden.

Bereik(scope) en afbakening

- De hierboven genoemde eindgebruiker van het webarchief staat niet centraal. Deze

moet te allen tijde in het achterhoofd gehouden worden, maar de nadruk in dit

project ligt op de digitale houdbaarheid en niet de digitale bruikbaarheid. Eerst

moet de houdbaarheid op orde zijn voor de bruikbaarheid daar van kan profiteren.

o Bij de inventarisatie van hoe een selectie tot stand komt, zal wel worden

bekeken of een eindgebruiker hier een rol in kan spelen. Kan een

eindgebruiker bijvoorbeeld een website aanmelden voor archivering? Of

wordt de selectie gemaakt door de organisatie zelf?

- Alhoewel er wel naar het buitenland gekeken en gerefereerd zal worden, zal de

primaire focus van het project liggen op nationale coördinatie van webarchivering.

o In het buitenland ligt veel kennis over webarchivering, dus er zal zeker

gekeken worden naar initiatieven als het Memento-project van de British

Library of hoe andere leden van de IIPC (International Internet Preservation

Consortium) omgaan met vergelijkbare uitdagingen.

o Er zijn ook buitenlandse webarchieven die Nederlandse websites archiveren.

Internet Archive heeft bijvoorbeeld een grote collectie Nederlandse

websites. Er zal een verkenning van dit deel van het Nederlandse domein

worden gedaan, maar het is niet realistisch om te ambiëren alle

buitenlandse webarchieven te vinden die een deel van het Nederlandse

domein archiveren.

- Het project zal zich in eerste instantie richten op de nationale en regionale

webarchiveringsinitiatieven, en niet op particuliere en bedrijfsarchieven.

- Het project focust primair op de archivering van websites, maar zal daarnaast ook

de archivering van social media niet buiten beschouwing laten, aangezien deze

vaak een integraal onderdeel vormen van een website.

- De scope van het project ligt niet op het oplossen van de technische en/of

juridische struikelblokken van webarchivering, maar richt zich op strategische en

organisatorische samenwerkingen. Deze struikelblokken hebben wellicht wel hun

invloed op hoe webarchivering in Nederland wordt aangepakt en zullen daarom wel

erkend worden. Het oplossen ervan valt echter buiten de scope van het project.

Belangrijkste projectresultaten

- Een inventarisatierapport over welke behoeften er zijn met betrekking tot

landelijke coördinatie van webarchivering onder de verschillende instanties die zich

bezig houden met webarchivering.

- Een eindrapport waarin de strategische vraag ‘waarom archiveren we websites (en

social media)?’ wordt beantwoord. Hierin worden tevens de rollen en

verantwoordelijkheden binnen de samenwerkende instanties uiteengezet.

- Een nationaal webarchief register: hierin is te vinden welke websites waar worden

gearchiveerd. Onderverdeeld in drie sub-resultaten:

o 1. het opzetten van een nationaal register als een instrument voor

registreren van gearchiveerde websites in Nederland (instrument).

Page 8: projectplan Webarchivering

Projectplan

8/11

o 2. het initieel vullen van dit register met de gearchiveerde websites van de

participerende instellingen en daar waar mogelijk van meer initiatieven

o 3. een voorstel voor waar dit register belegd moet worden. Wie moet dit

gaan bijhouden en wat is daarvoor nodig?

- Een beslisboom voor website-eigenaren en de webarchieven zelf. Bedoeld om aan

te geven waar een bepaalde website idealiter het beste thuishoort.

- Adviesrapport voor het eventueel inrichten van een Nationaal webarchief. Hierin

worden de resultaten opgesomd van het onderzoek naar de wenselijkheid voor een

nationaal webarchief: één portal van waaruit gezocht kan worden en binnen de

muren van één deelnemend instituut in de webarchieven van de andere

instituten/instellingen.

Randvoorwaarden

- Voldoende beschikbaarheid van de betrokken instanties.

- Voldoende draagvlak voor het beoogde eindresultaat bij de betrokken instanties.

Relaties met andere projecten

- Digitaal Erfgoed Bruikbaar - project B3-1: Annoteren Webarchief Groningen o.b.v.

GTAA en OpenSKOS: Enige overlap in projectmedewerkers.

- Digitaal Erfgoed Bruikbaar als werkpakket in het algemeen: ook voor de gebruiker van

een webarchief in Nederland is het gewenst een overzicht te hebben van welke

website waar wordt gearchiveerd.

Business Case in hoofdlijnen.

Zodra er meer zicht is op wat er in Nederland gebeurt op het gebied van webarchivering, kan

het voor zowel de webarchiverende instanties als de gebruikers van de webarchieven duidelijk

worden wie welke rol vertolkt en waar de verschillende verantwoordelijkheden liggen. Dit

project moet voor die duidelijkheid gaan zorgen.

Door betere samenwerking tussen webarchieven zal er tevens meer inzicht ontstaan in de

technische problemen waar veel webarchieven mee kampen. Door gedeelde ervaringen valt

er veel te leren over de mogelijke oplossingen voor die problemen. Hetzelfde geldt hierbij

voor het omgaan met de legale belemmeringen of juiste mogelijkheden van een webarchief.

Tevens zullen er schaalvoordelen gehaald kunnen worden bij leveranciers van middelen en

diensten die gebruikt worden bij het archiveren van het web. Doordat meerdere

webarchieven aansturen op dezelfde ontwikkelingen, ontstaat er een stevig blok dat

potentieel zowel inhoudelijke als financiële voordelen kan opleveren.

Projecttoleranties

Het project heeft een doorlooptijd van 6 maanden. Startdatum in 1 januari 2016 en de

einddatum is 30 juni 2016.

Page 9: projectplan Webarchivering

Projectplan

9/11

Acceptatiecriteria

De eindproducten moeten overzichtelijk zijn en simpel te benaderen zijn.

Onderkende risico’s

Het succes van het project wordt voor het grootste deel bepaald door de bereidwilligheid van

webarchieven binnen Nederland om mee te werken met het project. De neuzen zullen

enigszins dezelfde kant op moeten staan, met de betrekking tot de beoogde doelstellingen

van het project. Dit zal naar alle waarschijnlijkheid bij de NCDD partners voor een groot deel

het geval zijn. In hoeverre commerciële partijen wensen mee te werken aan een dergelijk

project is nog onduidelijk.

Projectorganisatie

Kla

nk

bo

rdg

roe

p

Marcel RasProgrammaleider

WP3

Arnoud GoosProjectleider

Peter de Bode(KB)

Barbara Sierman (KB)

Antal Posthumus(NA)

Marcel Privé (Crossmedia)

Lotte Baltussen(ZPP)

Stuurgroep

Overlegstructuur

De projectleider zal deel uitmaken van het reguliere projectleidersoverleg dat ongeveer één

keer per maand zal plaatsvinden onder voorzitterschap van de programmamanager Digitaal

Erfgoed Houdbaar. Naast deze overleggen geeft elke projectleider uit WP3 elk eind van de

week een emailupdate aan de programmamanager én daarbij aan elkaar. Hierdoor is

iedereen steeds op de hoogte van wat er in de andere (deel)projecten speelt.

Binnen de use-case zal de projectleider regelmatig spreken met een groepje van experts op

het gebied van webarchivering. Toegezegd hebben reeds Peter de Bode (KB), Antal

Posthumus (NA), Marcel Privé (GW Crossmedia), Barbara Sierman (KB) en Lotte Belice

Page 10: projectplan Webarchivering

Projectplan

10/11

Baltussen (ZZP’er en projectleider B3-1 Digitaal Erfgoed Bruikbaar).

Planning

Fase 0: november 2015 – december 2015.

Voorbereidende fase: verkennende/kennismakingsgesprek. Samenstellen

projectgroep. Schrijven projectplan.

Fase 1: januari 2015 – maart 2015.

Inventarisatie van webarchieven in Nederland. Inventarisatie van collectiebeleid,

workflows en behoeften.

Fase 2: april 2015 – juni 2015.

Uitwerken op te leveren stukken.

Budget

Exclusief uren-matching.

Aan

tal u

ur p

er w

eek

Aan

tal w

eken

Tota

al a

anta

l ur

enUurtar

ief

Kost

en

Projectleider 8 28 224 65 14560

Totaal € 14.560,00

Overzicht van wijzigingen Datum

wijziging

Samenvatting van wijzigingen Status

28-10-2015 Eerste uitgave V0.1

25-11-2015 Derde uitgave, na commentaar Marcel Ras, Lotte Baltussen. V0.3

26-11-2015 Vierde uitgave, na commentaar Peter de Bode. V1.0

07-01-2016 Vijfde uitgave, na opmerkingen Stuurgroep V1.1