Webarchivering op de Koninklijke Bibliotheek

26
Webarchivering op de KB René Voorburg [email protected]

Transcript of Webarchivering op de Koninklijke Bibliotheek

Page 1: Webarchivering op de Koninklijke Bibliotheek

Webarchivering op de KBRené [email protected]

Page 2: Webarchivering op de Koninklijke Bibliotheek

Koninklijke Bibliotheek – Nationale bibliotheek van Nederland

Presentatie Webarchivering op de KB

1. Waarom: achtergrond webarchivering op de KB

3. Hoe & wat: de praktijk van webarchivering op de KB

5. Vragen?

Page 3: Webarchivering op de Koninklijke Bibliotheek

Koninklijke Bibliotheek – Nationale bibliotheek van Nederland

Deel 1: Achtergrond webarchivering op de KB

Page 4: Webarchivering op de Koninklijke Bibliotheek

Koninklijke Bibliotheek – Nationale bibliotheek van Nederland

KB en de nationale biografie

KB opgericht in 1798 als nationale bibliotheek

Vorming depot van publicaties om nationale erfgoed in gedrukte vorm te verzamelen, te bewaren en te beschrijven

Sinds 1974 wordt van iedere publicatie die in Nederland verschijnt één exemplaar verzameld voor permanente bewaring en beschikbaarstelling.

Page 5: Webarchivering op de Koninklijke Bibliotheek

Koninklijke Bibliotheek – Nationale bibliotheek van Nederland

Publicaties Objecten in het internettijdperk

Publicaties steeds vaker digitaal, dikwijls zonder (equivalente) gedrukte variant

Traditionele onderscheid tussen drukwerk en audiovisuele uitingen steeds moeilijker vol te houden

Internet is hét publicatiemedium geworden van deze tijd.

Page 6: Webarchivering op de Koninklijke Bibliotheek

Koninklijke Bibliotheek – Nationale bibliotheek van Nederland

Webarchivering

Internet is hét publicatiemedium, de cultuurdrager geworden van deze tijd, een unieke bron van informatie over praktisch iedere aspect van de samenleving

Het web groeit hard, maar sites en pagina´s verdwijnen ook snel. Gemiddelde pagina ´leeft´ 100 dagen

Linkrot is een alledaags, herkenbaar fenomeen

Wie neemt verantwoordelijkheid?

Page 7: Webarchivering op de Koninklijke Bibliotheek

Koninklijke Bibliotheek – Nationale bibliotheek van Nederland

De digitale bibliotheek

Sinds 2003 is het e-depot operationeel, voor bewaren en duurzaam toegankelijk maken digitale objecten

Sinds 2006 is de KB actief met archiveren van een selectie Nederlandse websites

Websites zullen duurzaam opgeslagen worden in het e-depot.

Page 8: Webarchivering op de Koninklijke Bibliotheek

Koninklijke Bibliotheek – Nationale bibliotheek van Nederland

Het e-depot

Veilige en duurzame opslag

Registratie (metadata)

Hulpmiddelen voor duurzame toegang.

Page 9: Webarchivering op de Koninklijke Bibliotheek

Koninklijke Bibliotheek – Nationale bibliotheek van Nederland

Deel 2: De praktijk van webarchivering op de KB

Page 10: Webarchivering op de Koninklijke Bibliotheek

Koninklijke Bibliotheek – Nationale bibliotheek van Nederland

Proces webarchivering op de KB

i. Selectie

ii. Toestemming eigenaar via opt-out

iii. Harvesting

iv. Kwaliteitscontrole

v. Archivering (e-depot)

vi. Beschikbaarstellen (online webarchief).

Page 11: Webarchivering op de Koninklijke Bibliotheek

Koninklijke Bibliotheek – Nationale bibliotheek van Nederland

i. Selectie 1/2

Basis collectiebeleid KB, “alles van en over Nederland”• maatschappelijk belang evident• kwaliteitseisen• iha geen sites individuen (ivm ‘hobbysfeer’)• geen puur commerciële sites• geen radicale of abjecte sites• geen databases• geen kranten• geen dubbelingen met Archipol, R’dam, I. v. Beeld &

Geluid, Sinologie UBL.

Page 12: Webarchivering op de Koninklijke Bibliotheek

Koninklijke Bibliotheek – Nationale bibliotheek van Nederland

i. Selectie 2/2

Selectie per vakgebied

Momenteel vooral (cultuur-) geschiedenis, overheids-administratie, literaire auteurs en rechten

Kunst op het web nu nog niet behandeld

Selectie is arbeidsintensief!

Page 13: Webarchivering op de Koninklijke Bibliotheek

Koninklijke Bibliotheek – Nationale bibliotheek van Nederland

ii. Toestemming eigenaar

Per e-mail

Volgens opt-out principe

Deel reageert, voornamelijk (zeer) positief, een enkeling afwijzend.

Page 14: Webarchivering op de Koninklijke Bibliotheek

Koninklijke Bibliotheek – Nationale bibliotheek van Nederland

iii. Harvesting

Configuratie en beschrijving via ‘Web Curator Tool’• titel• contactadres• seed URLs• UNESCO-code• schedule• eventuele annotaties

Harvesting door ‘Heritrix’.

Page 15: Webarchivering op de Koninklijke Bibliotheek

Koninklijke Bibliotheek – Nationale bibliotheek van Nederland

Page 16: Webarchivering op de Koninklijke Bibliotheek

Koninklijke Bibliotheek – Nationale bibliotheek van Nederland

iv. Kwaliteitscontrole

Wat kan er mis gaan:• Interactieve content afhankelijk van techniek niet

altijd (goed) te archiveren (mn. serverinteracties zoals zoeken, AJAX, complexe javascripts, flash)

• ‘Oneindige’ websites door technische fouten of specifieke functionaliteit (bv.agenda)

• Ontbrekende vormgeving of content door robots.txt• URLs die niet uniek zijn (mn. bij taalswitch)• Onvolledige configuratie van het pagina-domein• Te ruime configuratie van het pagina-domein.

Page 17: Webarchivering op de Koninklijke Bibliotheek

Koninklijke Bibliotheek – Nationale bibliotheek van Nederland

Page 18: Webarchivering op de Koninklijke Bibliotheek

Koninklijke Bibliotheek – Nationale bibliotheek van Nederland

Page 19: Webarchivering op de Koninklijke Bibliotheek

Koninklijke Bibliotheek – Nationale bibliotheek van Nederland

Page 20: Webarchivering op de Koninklijke Bibliotheek

Koninklijke Bibliotheek – Nationale bibliotheek van Nederland

v. Archivering in e-depot

Opslag als (W)ARC-bestanden

Samen met beschrijvende metadata & technische metadata (via METS.xml).

Page 21: Webarchivering op de Koninklijke Bibliotheek

Koninklijke Bibliotheek – Nationale bibliotheek van Nederland

vi. Online webarchief

Beschikbaar begin 2010?

Page 22: Webarchivering op de Koninklijke Bibliotheek

Koninklijke Bibliotheek – Nationale bibliotheek van Nederland

Page 23: Webarchivering op de Koninklijke Bibliotheek

Koninklijke Bibliotheek – Nationale bibliotheek van Nederland

Page 24: Webarchivering op de Koninklijke Bibliotheek

Koninklijke Bibliotheek – Nationale bibliotheek van Nederland

Page 25: Webarchivering op de Koninklijke Bibliotheek

Koninklijke Bibliotheek – Nationale bibliotheek van Nederland

Page 26: Webarchivering op de Koninklijke Bibliotheek

Koninklijke Bibliotheek – Nationale bibliotheek van Nederland

Vragen?René Voorburg / [email protected]

[email protected]