Voorgoed vastgelegd? archiveren van websites

21
27-11-09 Voorgoed vastgelegd? Archiveren van websites Peter van Wijngaarden

Transcript of Voorgoed vastgelegd? archiveren van websites

27-11-09

Voorgoed vastgelegd?

Archiveren van websites

Peter van Wijngaarden

27-11-09 Voorgoed vastgelegd? : archiveren van websites

Indeling

Wat is een website ??

Waarom zouden we websites willen bewaren…?

Hoe archiveren we websites en hoe bewaren we

websites?

27-11-09 Voorgoed vastgelegd? : archiveren van websites

Wat is een website ?

Definitie in Van Dale groot woordenboek

hedendaags Nederlands:

“de plaats waar bepaalde informatie zich op het

world wide web bevindt, aangeduid met een URL”.

27-11-09 Voorgoed vastgelegd? : archiveren van websites

Wat is een website ?

Statisch: de website is aanbodgericht, de

pagina’s verschijnen altijd op dezelfde (door de

ontwerper bepaalde) manier op het beeldscherm

Dynamisch: de pagina’s worden afhankelijk van

de vraag van de bezoeker van de site

opgebouwd. (‘on the fly’)

27-11-09 Voorgoed vastgelegd? : archiveren van websites

Waarom zouden we websites willen bewaren ??

Overheidswebsites bieden online formulieren en e-

loketfuncties

Organisaties communiceren via websites met de

buitenwereld over hun beleid, bevoegdheden en

dienstverlening

Privé personen en ook kleine organisaties beschikken

over een eigen website en vooral deze websites

bevatten vaak informatie die elders niet beschikbaar is

en waarvan het nuttig is om te bewaren.

27-11-09 Voorgoed vastgelegd? : archiveren van websites

Waarom zouden we websites willen bewaren?

Het Unesco ‘Charter on the Preservation of the

Digital Heritage’ rekent websites expliciet tot ons

digitaal erfgoed.

Dit digitale erfgoed is van belang voor toekomstig

onderzoek naar de ontwikkeling van het web en

onze samenleving.

27-11-09 Voorgoed vastgelegd? : archiveren van websites

Webarchivering en Webharvesting

Webharvesting : het selecteren van relevante

informatie (websites in dit geval) en het

binnenhalen daarvan met behulp van speciale

applicaties.

Webarchivering: het duurzaam opslaan, beheren

en toegankelijk maken van de websites.

27-11-09 Voorgoed vastgelegd? : archiveren van websites

Selectie

Internet archive: Way Back Machine

http://www.archive.org/web/web.php

27-11-09 Voorgoed vastgelegd? : archiveren van websites

Selectie

Het collectieprofiel voor analoge documenten is

bijna gelijk aan het collectieprofiel voor digitale

documenten, incl. websites

Een website is slechts een verschijningsvorm van

een informatiedrager

Als we de via de website aangeboden informatie

ook zouden willen bewaren als deze wordt

aangeboden op papier of een andere drager kan

dat een reden zijn deze website te bewaren…

27-11-09 Voorgoed vastgelegd? : archiveren van websites 27 november 2009

Hoe archiveren we websites ?

27-11-09 Voorgoed vastgelegd? : archiveren van websites

Afbakenen

Bepalen wat een website maakt tot wat hij is, b.v.

de functie die de website heeft in werkprocessen.

Is het een presentatiemedium, een portaal naar

andere informatiebronnen of een

transactiemedium?

Of is het gewoon een interessante site van een

privé persoon

Daarna analyseren welke elementen van de website

behouden moeten blijven om er voor te zorgen dat

de authenticiteit overeind blijft.

27-11-09 Voorgoed vastgelegd? : archiveren van websites 27 november 2009

Voorgoed vastgelegd?

De authenticiteit van een website wordt bepaald door :

Integriteit: de website is intact en niet zodanig

veranderd of gecorrumpeerd dat de betekenis

ervan niet meer duidelijk is. Wijzigingen zijn

aanvaardbaar, zolang de oorspronkelijke

betekenis of functie van het document er niet

door wordt aangetast.

Verifieerbaarheid: Het is mogelijk vast te stellen

dat de website is wat het beweert te zijn. Om dit

mogelijk te maken is context informatie nodig.

Deze informatie wordt later vastgelegd in

metadata.

27-11-09 Voorgoed vastgelegd? : archiveren van websites 27 november 2009

Plan van aanpak

In kaart brengen en selecteren van de te

acquireren websites.

Contact leggen met de webmaster

Brief naar website eigenaar

Analyseren van de websites en opstellen van

authenticiteits- en integriteitseisen per website

Verzamelen gegevens ten behoeve van metadata.

27-11-09 Voorgoed vastgelegd? : archiveren van websites

Problemen in overvloed

27-11-09 Voorgoed vastgelegd? : archiveren van websites

Frequentie van de snapshots

In principe wordt jaarlijks één snapshot van een website

genomen.

Bij het nemen van meerdere snapshots per jaar

rekening houden met de relevantie van de betreffende

website.

Inmiddels zijn 268 verschillende websites gearchiveerd

27-11-09 Voorgoed vastgelegd? : archiveren van websites

Frequentie

De frequentie van de te nemen snapshots varieert:

Per jaar 234

Per half jaar 3

Per kwartaal 1

Maandelijks 1

Wekelijks 1

Eenmalig 6

Meerjaarlijks (politieke partijen) 22

27-11-09 Voorgoed vastgelegd? : archiveren van websites

Opslagkosten

De opslagkosten per Gb (gigabyte) bedragen € 1,50 per

jaar, inclusief backup en beheer.

Opslag van één Tb (terabyte) kost € 1500 per jaar

Voor duurzame opslag in een E-depot moet speciale

software worden aangeschaft en dan kunnen de kosten

aanzienlijk stijgen.

27-11-09 Voorgoed vastgelegd? : archiveren van websites 27 november 2009

Maar dan…..!

27-11-09 Voorgoed vastgelegd? : archiveren van websites

Digitale opslag

Een SIP is een pakketje digitaal materiaal met een

XML bestand aan metadata.

Deze SIP’s worden opgeslagen in het E-depot als

AIP (Archival Information Package).

27-11-09 Voorgoed vastgelegd? : archiveren van websites

Digitale opslag : AIP en DIP

Een AIP (Archive Information Package) is een

digitaal informatie-object met de noodzakelijke

toegevoegde metadata zoals die worden

opgeslagen voor lange termijn bewaring in het

depot.

Voor de beschikbaarstelling wordt een kopie

gemaakt van de AIP, minus een aantal voor de

gebruiker niet relevante metadata en dat noemen

we dan een DIP (Dissemination Information

Package)

27-11-09 Voorgoed vastgelegd? : archiveren van websites

Vragen …..

Voor wie behoeft heeft aan meer informatie:

[email protected]

010 - 2672560