DE Conferentie 2005 René Voorburg

17
Webarchivering hoe verduurzamen we het web? René Voorburg [email protected]

Transcript of DE Conferentie 2005 René Voorburg

Page 1: DE Conferentie 2005 René Voorburg

Webarchiveringhoe verduurzamen we het web?

René Voorburg

[email protected]

Page 2: DE Conferentie 2005 René Voorburg

Websites als vluchtige cultuurdragers

Websites vormen een steeds belangrijker medium voor onze cultuur

Cultuur wordt toegankelijker en laagdrempeliger dan ooit.

Page 3: DE Conferentie 2005 René Voorburg

Websites als vluchtige cultuurdragers

Websites vormen een steeds belangrijker medium voor onze cultuur

Cultuur wordt toegankelijker en laagdrempeliger dan ooit.

... maar …

Page 4: DE Conferentie 2005 René Voorburg

Websites als vluchtige cultuurdragers

Websites vormen een steeds belangrijker medium voor onze cultuur

Cultuur wordt toegankelijker en laagdrempeliger dan ooit.

... maar …

“The average lifespan of a Web page today is 100 days.

This is no way to run a culture.”

Brewster Kahle, the Internet Archive

Page 5: DE Conferentie 2005 René Voorburg

Websites als vluchtige cultuurdragers

Websites vormen een steeds belangrijker medium voor onze cultuur

Cultuur wordt toegankelijker en laagdrempeliger dan ooit.

... maar …

“The average lifespan of a Web page today is 100 days.

This is no way to run a culture.”

Brewster Kahle, the Internet Archive

“I think of it like the library burning in Alexandria.”

Dellavalle, Colorado Health Sciences Center

Page 6: DE Conferentie 2005 René Voorburg

Hoe verduurzamen we onze webcultuur?

Om te beginnen:

Page 7: DE Conferentie 2005 René Voorburg

Hoe verduurzamen we onze webcultuur?

Om te beginnen: Bewust ontwerp van een duurzame ‘URL-ruimte’

(denk aan gebruik ‘persistente URL’s / URI’s ; URL-beleid)

Page 8: DE Conferentie 2005 René Voorburg

Hoe verduurzamen we onze webcultuur?

Om te beginnen: Bewust ontwerp van een duurzame ‘URL-ruimte’

(denk aan gebruik ‘persistente URL’s / URI’s ; URL-beleid)

“Cool URIs don’t change”

Tim Berners-Lee

Page 9: DE Conferentie 2005 René Voorburg

Hoe verduurzamen we onze webcultuur?

Om te beginnen: Bewust ontwerp van een duurzame ‘URL-ruimte’

(denk aan gebruik ‘persistente URL’s / URI’s ; URL-beleid)

“Cool URIs don’t change”

Tim Berners-Lee

Hanteer duurzame standaarden(open, nonproprietary; denk aan XHTML, of HTML 4.0.1, PNG, e.d.)

Page 10: DE Conferentie 2005 René Voorburg

Hoe verduurzamen we onze webcultuur?

Om te beginnen: Bewust ontwerp van een duurzame ‘URL-ruimte’

(denk aan gebruik ‘persistente URL’s / URI’s ; URL-beleid)

“Cool URIs don’t change”

Tim Berners-Lee

Hanteer duurzame standaarden(open, nonproprietary; denk aan XHTML, of HTML 4.0.1, PNG, e.d.)

Vervolgens:

Page 11: DE Conferentie 2005 René Voorburg

Hoe verduurzamen we onze webcultuur?

Om te beginnen: Bewust ontwerp van een duurzame ‘URL-ruimte’

(denk aan gebruik ‘persistente URL’s / URI’s ; URL-beleid)

“Cool URIs don’t change”

Tim Berners-Lee

Hanteer duurzame standaarden(open, nonproprietary; denk aan XHTML, of HTML 4.0.1, PNG, e.d.)

Vervolgens: Webarchivering!

Page 12: DE Conferentie 2005 René Voorburg

Webarchivering?

Hoe conserveer je zoiets vluchtigs als webpagina’s?

Backups? Alleen van ‘eigen’ sites mogelijk Complex van technische afhankelijkheden maakt dat dit doorgaans geen

realistische oplossing is.

Snapshots! Ook van sites van derden Afhankelijkheid van techniek op de webserver wordt doorbroken

Page 13: DE Conferentie 2005 René Voorburg

Snapshots dé basis voor een webarchief

… inderdaad, zoals the Internet Archive doet….

The Internet Archive (www.archive.org) Pagina’s ontbreken Pagina’s zijn onvolledig of functioneren niet goed Traag Niet (/beperkt) onder eigen beheer

Neem webarchivering in eigen hand! Zelf bepalen hoe, wanneer & welke pagina’s in het eigen webarchief komen Zelf de toegankelijkheid van het gearchiveerde materiaal bepalen

Page 14: DE Conferentie 2005 René Voorburg

Webarchivering in eigen hand: Ministerie van Verkeer en Waterstaat & Capsis

Doelstellingen pilot webarchivering:

Ervaring opdoen met archivering van websites met de snapshotmethode;in context van de Archiefwet

Op basis van de ervaringen komen tot beproefde aanbevelingen voor duurzame websites

Een eerste webarchief van het ministerie opbouwen

Discussie over webarchivering stimuleren

Page 15: DE Conferentie 2005 René Voorburg

Aanpak pilot Ministerie van Verkeer en Waterstaat & Capsis

Gevolgde stappen: Inventarisatie “wat zijn de websites van het ministerie?” Snapshots gemaakt binnen applicatie Capsis Presurf Analyse van kwaliteit snapshots door Capsis én door inhoudelijk betrokkenen Analyse van duurzaamheid (mate waarin standaarden gevolgd werden) bij een

selectie snapshots

Page 16: DE Conferentie 2005 René Voorburg

Resultaten pilot Ministerie van Verkeer en Waterstaat & Capsis

Enige resultaten: Snapshots gemaakt van 114 websites, 13Gb aan data, ~ 7800 HTML-pagina’s. 75% van de snapshots vertoonde geen of kleinere onvolkomenheden;

overige 25% vertoonde met name grafische afwijkingen Onvolkomenheden vooral veroorzaakt door gebruik van javascripts in menu’s.

Andere “boosdoeners”: specifiek gebruik van Macromedia Flash, ‘user-agent’-checks en (onzorgvuldig) gebruik van zogenaamde URL-parameters.

Betrokken medewerkers waren in het algemeen tevreden over de kwaliteit van de snapshots.

De originele HTML-pagina’s bleken zeer zelden te voldoen aan standaarden (van W3C of webrichtlijnen Overheid.nl).

Soms diverse bestandsformaten in gebruik voor één mediumtype (met name bij video).

Page 17: DE Conferentie 2005 René Voorburg

Heden (verleden)& toekomst

Webarchivering met snapshots is nu al goed realiseerbaar!

De duurzaamheid van websites kan verder verbeterd worden door: Websites te ontwerpen voor duurzame standaarden én op geautomatiseerde

wijze de kwaliteit van de implementatie te controleren. Af te zien van specifieke webtechnieken die de inzet van de snapshotmethode

verhinderen / bemoeilijken.

Snapshots zullen in de toekomst alleen gemaakt worden van gewijzigde pagina’s.

Een webarchief wordt een krachtige & waardevolle webomgeving waarvan men in Alexandrië nooit had durven dromen.