GEBRUIKERSONDERZOEK - KB

48
GEBRUIKERSONDERZOEK WEBARCHIVERING SARA VAN BUSSEL JUNI 2007 KONINKLIJKE BIBLIOTHEEK

Transcript of GEBRUIKERSONDERZOEK - KB

Page 1: GEBRUIKERSONDERZOEK - KB

G E B RU I K E RS O ND E R Z OE K

WEBARCHIVERING

SARA VAN BUSSEL JUNI 2007

K O N I N K L I J K E B I B L I O T H E E K

Page 2: GEBRUIKERSONDERZOEK - KB

2

G E B RU I K E RS O ND E R Z OE K

WEBARCHIVERING

Koninklijke Bibliotheek, Juni 2007

Met dank aan: Thomas Beekman, Eric van den Berg, Bart Kiers, Shirley van Maren, Rosemarie Pomp-Blangé, Marcel Ras, Mirella van der Velde, Henk Voorbij, Repke de Vries, Hilde van Wijngaarden, Peter Wijnmaalen

K O N I N K L I J K E B I B L I O T H E E K

Page 3: GEBRUIKERSONDERZOEK - KB

3

Page 4: GEBRUIKERSONDERZOEK - KB

4

1 . SA ME N VA TTI NG

In 2006 is de KB gestart met het project webarchivering. Doel van dit project is het opdoen van kennis en ervaring met betrekking tot het duurzaam bewaren en toegankelijk houden van een selectie van Nederlandse websites. Daarbij is gekeken naar alle mogelijke aspecten van webarchivering: de benodigde techniek, organisatie, kosten, juridische kwesties en de potentiële gebruikers. Het gebruikersonderzoek, uitgevoerd in de periode januari tot en met mei 2007, is bedoeld om een beeld te krijgen van deze gebruikers.

Hoewel er al sinds 1996 websites gearchiveerd worden en er inmiddels veel landen zijn waar webarchivering op grote schaal uitgevoerd wordt, is er tot op heden nauwelijks onderzoek gedaan naar de gebruikers van deze archieven.

De KB heeft ervoor gekozen om een selectie van Nederlandse websites duurzaam te archiveren. Deze selectieve benadering vereist dat er kennis van de (potentiële) gebruikers is. Het gebruikersonderzoek is gericht op de inhoud en de zoekmogelijkheden van het webarchief, rekening houdend met deze (toekomstige) gebruikers. De daarbij opgestelde centrale vraag is opgedeeld in een vijftal deelvragen met betrekking tot gebruikers, gebruik en selectie. Deze vragen zijn beantwoord in een doelgroepanalyse en observaties van een testpanel. Dit kwalitatieve onderzoek is uitgevoerd onder een beperkt aantal deelnemers omdat het webarchief nog niet genoeg data bevatte en nog niet online beschikbaar was.

Ondanks het feit dat er nog slechts weinig informatie is over het gebruik van een webarchief hebben we wél een beeld van de potentiële gebruikers kunnen destilleren uit Use Cases for Access to Internet Archives opgesteld door het International Internet Preservation Consortium (IIPC), de door ons opgestelde aanvullingen daarop, de input van andere webarchieven en de stakeholders in Nederland en het klanttevredenheidsonderzoek van de KB. Daarmee hebben we ook gebruiksscenario’s kunnen opzetten, waarin mogelijkheden voor het gebruik van het webarchief duidelijk worden. (Wetenschappelijke) onderzoekers zullen naarmate het webarchief groeit steeds meer er aan hebben als bron voor onderzoek.

De doelgroepanalyse leverde ons informatie over gebruikersgroepen en wijze waarop selectie plaats kan vinden. De observaties gaven inzicht in het daadwerkelijke gebruik van het webarchief. Tijdens deze observaties hebben de deelnemers vragen beantwoord over onder andere selectie en toegang en gebruik gemaakt van het webarchief.

De deelnemers aan de observatie hebben een sterke voorkeur voor het zoeken op volledige tekst op een Google-achtige wijze, boven het zoeken op specifieke URL. Hieruit blijkt dat Google wat dat betreft de norm is. Zoektips op de zoekpagina en een goede helptekst zijn belangrijk. Verder staan de deelnemers positief tegenover de gedetailleerde wijze waarop de KB websites zal archiveren, ook wanneer dit betekent dat er slechts een beperkt aantal Nederlandse websites in het archief opgenomen kan worden. Startpunt voor selectie is het collectiebeleid van de KB. Dit betekent dat er websites op het gebied van Nederlandse taal, cultuur en samenleving gearchiveerd zullen worden. Om deze selectie uit te breiden kan worden samengewerkt met andere instellingen. Het verschil tussen het gearchiveerde websites en live websites, evenals metadata worden ook belangrijk gevonden. Beperkte toegang tot het webarchief (alleen binnen de KB) zal leiden tot weinig gebruik van het webarchief, online beschikbaar na registratie vinden de deelnemers acceptabel.

Zoals gezegd is er nog weinig onderzoek gedaan naar de gebruikers van webarchieven. Met dit onderzoek hopen we dat de kennis van gebruikers en het gebruik daarvan toeneemt. Ons

Page 5: GEBRUIKERSONDERZOEK - KB

5

onderzoek zal in ieder geval worden ingebracht in de Access Working Group van het IIPC, evenals het gebruikersonderzoek van de Bibliothèque nationale de France en een onderzoek naar gebruikerswensen van de British Library.

Wanneer het webarchief van de KB operationeel is en er een breder aanbod is van gearchiveerde websites is het aan te bevelen een omvangrijker kwantitatief gebruikersonderzoek uit te voeren om de huidige bevindingen te toetsen en gedetailleerder te kijken naar selectie en usability.

Page 6: GEBRUIKERSONDERZOEK - KB

6

2. INH O UD S OPG AV E

1. SAMENVATTING ..............................................................................................................................4 2. INHOUDSOPGAVE............................................................................................................................6 3. ACHTERGROND................................................................................................................................7 4. INLEIDING ..........................................................................................................................................9

Probleemstelling ..................................................................................................................................10 5. DOELGROEPANALYSE ................................................................................................................12

5.1 Wie zijn de potentiële gebruikers en stakeholders van het KB webarchief? ..........................12 5.2 Waarvoor zouden gebruikers het webarchief kunnen gebruiken? ..........................................14

6. ONDERZOEK....................................................................................................................................17 6.1 Inleiding .........................................................................................................................................17 6.2 Zoekmogelijkheden van het webarchief .....................................................................................18 6.3 Hoe wordt het zoeken op volledige tekst ervaren door de deelnemers? ..................................21 6.4 Hoe wordt het zoeken op URL ervaren door de deelnemers? ..................................................24 6.5 Hoe bruikbaar is de tijdbalk? ......................................................................................................25 6.6 Algemene opmerkingen ................................................................................................................25 6.7 Welke wensen of inzichten hebben de deelnemers ten aanzien van de te selecteren websites?...............................................................................................................................................................25 6.8 Hoe zou volgens de deelnemers aan het onderzoek de toegang tot het webarchief geregeld moeten zijn? .........................................................................................................................................26 6.9 Hoe kunnen gebruikswensen worden geprioteerd? ..................................................................27

7. CONCLUSIE ......................................................................................................................................29 8. LITERATUURLIJST .......................................................................................................................31 BIJLAGE 1 : LIJST GEARCHIVEERDE WEBSITES.......................................................................33 BIJLAGE 2 : DISCUSSIEBIJEENKOMSTEN STAKEHOLDERS .................................................34 BIJLAGE 3 : E-MAIL AAN ANDERE WEBARCHIEVEN...............................................................36 BIJLAGE 3 : GEBRUIKSSCENARIO’S ...............................................................................................37 BIJLAGE 4 : VRAGEN OBSERVATIE.................................................................................................44 BIJLAGE 5 : RESULTATEN GEBRUIKERSWENSEN ....................................................................48

Page 7: GEBRUIKERSONDERZOEK - KB

7

3. AC H TE RG RO N D

In het laatste decennium is het internet één van de belangrijkste communicatiemiddelen in onze samenleving geworden. Veel organisaties hebben een eigen website, en veel contacten verlopen nu per e-mail. Organisaties bieden steeds meer diensten exclusief op het internet aan, zoals nieuwssites, DigiD, of extra inhoud van kranten.

Het Nederlandse web1 bestaat uit bijna drie miljoen domeinnamen. Circa 2,5 miljoen daarvan zijn .nl domeinnamen; de overigen zijn onder andere .com .org en .net. Het aantal actieve Nederlandse websites is naar schatting twee miljoen. Volgens de SIDN groeide in 2006 het aantal domeinnamen gemiddeld met 36.000 per maand.2

Aangenomen wordt dat de gemiddelde levensduur van een webpagina slechts 44 dagen is.3 Dit getal is een van de drie getallen die rondzweven in webarchiveringskringen. De twee andere zijn 75 en 100 dagen. Deze laatste twee zijn gebaseerd op schattingen van Brewster Kahle, de oprichter van het Internet Archive. De schatting van 44 dagen, die in de literatuur vaak gebruikt wordt, blijkt gebaseerd te zijn op een artikel van censorware.org. Op deze website is het artikel echter niet meer te vinden. Gearchiveerde versies van de website bieden geen uitkomst, omdat blijkt dat twee jaar voor de eerste archivering de hele website, inclusief het artikel over de levensduur van webpagina’s, offline is gehaald. Alle verwijzingen lopen dus dood. Hoelang de levensduur van een webpagina nu echt is, is onbekend, maar dit bewijst wel het nut van webarchivering.

Het is dus duidelijk dat er dagelijks veel van het internet gewijzigd wordt of zelfs helemaal verdwijnt. Dit kan informatie zijn die niet op een andere wijze gepubliceerd is. De KB heeft als taak het verzamelen, bewaren en toegankelijk maken van Nederlandse publicaties. Daarbij gaat het niet alleen om analoge publicaties maar in toenemende mate ook om elektronische publicaties. Vanuit de invalshoek van een nationale bibliotheek kan een website beschouwd worden als een publicatie. Het archiveren van Nederlandse websites is daarmee een van de taken van de KB. In andere landen zijn vergelijkbare projecten ook door de nationale bibliotheek opgezet.

Op 1 januari 2006 is de KB gestart met de eerste fase van het project webarchivering. Deze eerste fase was bedoeld om kennis en ervaring op te doen. Zo is er onder andere een crawler gezocht die de websites opslaat, en een zoekmachine die ze toegankelijk maakt. Met deze tools, die overigens open source zijn, is proef gedraaid en ervaring opgedaan, door middel van de archivering van 83 websites.

Op 1 juni 2007 zal de tweede fase van het project van start gaan. Hierin wordt op basis van de kennis die opgedaan is in de eerste fase een operationeel proces webarchivering geïmplementeerd binnen de KB.

Tijdens dit kwalitatieve onderzoek is gebruik gemaakt van het webarchief zoals dit in de eerste fase van het project is opgezet. Dit bevat 83 websites op het gebied van cultuur, overheid en wetenschap. Voor een lijst van deze websites zie bijlage 1: lijst gearchiveerde websites. Binnen

1 In principe te definiëren als alle domeinen geregistreerd in Nederland.

2 Deze en volgende cijfers uit het jaarverslag van 2006 van de SIDN.

3 Peter Lyman, Archiving the world wide web < http://www.clir.org/pubs/reports/pub106/web.html> geraadpleegd op 27 feb 2007

Page 8: GEBRUIKERSONDERZOEK - KB

8

het archief kan er gezocht worden op URL (Wayback Machine) en op volledige tekst (NutchWax).

Page 9: GEBRUIKERSONDERZOEK - KB

9

4. INL EIDI NG

Er zijn twee basisstrategieën voor webarchivering. De eerste strategie is gericht op het automatisch harvesten van meestal een grote hoeveelheid websites (bulkarchivering van bijvoorbeeld een nationaal domein). De tweede strategie gaat uit van een selectie van websites, op basis van een specifiek selectiebeleid. Beide strategieën hebben voor- en nadelen. Een argument voor bulkarchivering is dat de toekomstige vraag van onderzoekers niet te bepalen is. Door niet te selecteren wordt in principe geen enkele toekomstige vraag uitgesloten. Daarnaast is bulkarchivering goedkoper omdat het grotendeels automatisch gebeurt. In een selectieve aanpak kan meer op maat gearchiveerd worden. De frequentie van archiveren kan aangepast worden per website, afhankelijk van de mate van verandering van de betreffende site. Ook is het in een selectieve aanpak mogelijk om gedetailleerder te harvesten. De KB heeft voor de selectieve aanpak gekozen . Hiervoor zijn een aantal redenen:

1. Nederland kent géén depotwetgeving, waardoor het juridisch erg lastig is om zonder enige vorm van toestemming websites te archiveren. Een selectieve aanpak geeft de mogelijkheid om voorzichtiger te opereren;

2. In geval van een volledige domeinharvest (het gehele .nl domein) wordt er een zogenaamd snapshot gemaakt. Dat wil zeggen dat er strikte limieten zijn gesteld voor het binnenhalen van websites. Niet meer dan 2-3 niveaus van een website, niet meer dan x GB aan data per website, niet meer dan y files per website, geen bestanden die groter zijn dan z MB, enz. Aangezien voor de KB het uitgangspunt voor webarchivering het duurzaam opslaan in het e-Depot is, lijkt het niet zo heel zinvol om slechts gedeeltes van websites te bewaren. We bewaren immers ook niet alleen de titelpagina van een elektronische publicatie. Omdat het Nederlandse webdomein bijzonder groot is (op drie na grootste ter wereld4), is het onmogelijk om het gehele Nederlandse domein gedetailleerd te archiveren. Het .nl domein bevat 2,5 miljoen domeinnamen5 en 1,5 miljoen websites. Het .nl-domein beslaat 71% van alle websites die in Nederland geregistreerd zijn; de overige 29% bestaat uit domeinen als .com, .org, .eu, etc.

De gearchiveerde websites zullen toegankelijk gemaakt worden (al dan niet online) voor gebruikers. Omdat we verwachten dat een webarchief op een andere manier gebruikt zal worden door de potentiële gebruikers dan de traditionele bibliotheek voeren we dit kwalitatieve gebruikersonderzoek uit. Maar wie is die gebruiker? En wat zijn de wensen van die gebruiker, bijvoorbeeld met betrekking tot de selectie? Zonder een antwoord op die vragen is het onmogelijk om een webarchief op te zetten voor die gebruiker.

Behalve met de potentiële eindgebruikers hebben we te maken met eigenaren van websites, eigenaren van content en andere kennisorganisaties die een rol kunnen spelen bij de selectie van te archiveren websites. Deze stakeholders (belanghebbenden) zijn betrokken bij dit gebruikersonderzoek.

Om in een zo vroeg mogelijk stadium rekening te kunnen houden met de wensen van potentiële gebruikers en stakeholders wordt dit gebruikersonderzoek al in de eerste fase van het project uitgevoerd. Dit kwalitatieve onderzoek zal gebruikt worden als ‘food for thought’ tijdens de opzet en uitvoering van de tweede fase van het project. Op het moment dat het webarchief operationeel is en meer content bevat zal er een groter kwantitatief onderzoek uitgevoerd worden.

4 Verisign The domain industry brief afl. 1 (2007) 4 <http://www.verisign.com/static/040767.pdf>

5 Jaarverslag SIDN (2006)

Page 10: GEBRUIKERSONDERZOEK - KB

10

Een vergelijkbaar kwalitatief onderzoek wordt door de Bibliothèque nationale de France (BnF) uitgevoerd. De resultaten van het onderzoek van de BnF en van dit onderzoek zullen worden gecombineerd met een usability onderzoek van het UK webarchive (UKWAC) uitgevoerd door de British Library (BL). Dit is in het kader van een project van de Access Working Group van het International Internet Preservation Consortium (IIPC). De bedoeling van dit project is het opstellen van een lijst van gebruikerswensen en het ontwikkelen van een methodologie voor gebruikersonderzoek ten behoeve van een webarchief.

PROBLEEMSTELLING

De centrale vraag van dit gebruikersonderzoek is:

Hoe zouden de inhoud en zoekmogelijkheden van het KB webarchief eruit moeten zien, rekening houdend met potentiële gebruikers en stakeholders?

Het gebruikersonderzoek is opgedeeld in een doelgroepanalyse en het onderzoek zelf. De centrale vraag kan worden onderverdeeld in een aantal deelvragen met betrekking tot het doelgroepanalyse en het gebruikersonderzoek.

1. Doelgroepanalyse

1.1 Wie zijn de potentiële gebruikers en stakeholders van het KB webarchief? Als de KB rekening wil houden met potentiële gebruikers en stakeholders dan moet er gekeken worden wie deze groepen kunnen zijn. Omdat het webarchief van de KB nog niet operationeel is zal deze vraag vooral beantwoord worden door middel van contacten met andere webarchieven en organisaties met betrekking op digitaal erfgoed in Nederland. Er zal gekeken worden naar wie het KB publiek is, zoals beschreven in eerdere onderzoeken.

1.2 Waarvoor zouden gebruikers het webarchief kunnen gebruiken? Om het webarchief tastbaarder te maken en inzicht te krijgen en geven in het toekomstige gebruik van het webarchief zullen gebruiksscenario’s worden opgesteld. Deze zijn gebaseerd op de Use Cases for Access to Internet Archives6 opgesteld door de IIPC.

2. Gebruikersonderzoek

2.1 Hoe willen deelnemers aan het onderzoek zoeken in het webarchief van de KB? Het archief wordt toegankelijk gemaakt voor het publiek, en dit kan op verschillende manieren. Er zal gekeken worden naar de manier waarop gebruikers te werk gaan bij het zoeken op volledige tekst en het zoeken op URL. Hierbij wordt zowel gelet op de algemene zoekmethoden en de door de KB gebruikte zoekmachines voor webarchivering.

2.2 Welke wensen of inzichten hebben de deelnemers aan het onderzoek ten aanzien van de te selecteren websites? Omdat de KB websites zal moeten selecteren voor archivering is het

6 Use Cases for Access to Internet Archives, <http://netpreserve.org/publications/reports.php?id=003>, geraadpleegd op 1 februari 2007

Page 11: GEBRUIKERSONDERZOEK - KB

11

belangrijk dat gekeken wordt naar de wensen van de potentiële gebruikers en de stakeholders.

2.3 Hoe zou volgens de deelnemers anhet onderzoek de toegang tot het webarchief geregeld moeten zijn? Er zijn verschillende mogelijkheden van beschikbaar stellen van het webarchief. De keuze hiervoor hangt natuurlijk af van de wettelijke mogelijkheden, maar er wordt ook gekeken naar de meningen van de potentiële gebruikers.

2.4 Hoe kunnen gebruikswensen worden geprioteerd? Deze vraag komt voort uit het samenwerkingsproject dat de KB samen met de BL en BnF uitvoert in het kader van de IIPC.

In dit rapport zullen de deelvragen per stuk worden besproken, met daarbij een bespreking van de gebruikte methode. De conclusie bevat de resultaten en aanbevelingen.

Page 12: GEBRUIKERSONDERZOEK - KB

12

5. DO EL G ROE PA NA LY S E

De analyse van de doelgroepen heeft op verschillende manieren plaatsgevonden. De stakeholders zijn uitgenodigd voor twee discussiemiddagen (bijlage 2). Tijdens deze middagen is gepraat over webarchivering door de KB. Om erachter te komen wie de klanten van de KB zijn, is gekeken naar het klanttevredenheidsonderzoek, in 2006 in opdracht van de KB uitgevoerd door TNS-NIPO. Verder is er contact opgenomen met webarchieven wereldwijd met het doel informatie over bestaand gebruikersonderzoek te verzamelen.

5.1 WIE ZIJN DE POTENTIËLE GEBRUIKERS EN STAKEHOLDERS VAN HET KB WEBARCHIEF?

5.1.1 Wie zijn de gebruikers van andere webarchieven? Er zijn webarchieven opgezet door (nationale) bibliotheken, (nationale) archieven en

universiteiten. Met vijftien bestaande webarchieven is via e-mail gericht contact opgenomen met vragen over hun gebruikers. De verstuurde e-mail is te vinden in bijlage 3. Het is van belang een onderscheid te maken tussen bulkarchivering en de selectieve aanpak. Deze laatste aanpak vereist een uitgebreidere kennis van (potentiële) gebruikers.

Er zijn vier respondenten die aan bulkarchivering doen.

De nationale bibliotheek van Finland wist nog niet wie hun gebruikers zijn, omdat dit archief (nog) niet publiekelijk toegankelijk is. Wel hebben zij een idee wie hun gebruikers kunnen zijn. Zij gaan uit van:

Eigenaren/ontwerpers van websites die graag een oude versie terug willen zien,

Openbare instellingen die niet zelf hun website archiveren en publiek doorverwijzen naar het webarchief,

Het grote publiek. Dit betreft het publiek dat de bibliotheek normaal ook al bezoekt of gebruikt.

Finland heeft verzoeken gekregen van de nationale tv maatschappij YLE en de gemeente Turku om websites van deze organisaties te archiveren.

Het Deense webarchief (netarchive.dk) is alleen toegankelijk na toestemming van het Danish Data Protection Agency en alleen voor onderzoekers, wat een strikte afbakening is van de doelgroep. Zij hebben geen lijst van (potentiële) gebruikers.

Het Portugese webarchief (Tomba) geeft op hun website aan dat ze geschikt zijn voor cultureel, sociologisch en taalkundig onderzoek. Ze hebben (nog) geen onderzoek gedaan naar de daadwerkelijke gebruikers, mede omdat Tomba op dit moment nog een proefversie is. Ze geven aan eventueel in het definitieve webarchief gebruikersonderzoek erbij te willen betrekken.

Het webarchief van de Zweedse nationale bibliotheek (Kulturarw3) is alleen in de bibliotheek toegankelijk. Hun grootste groep gebruikers zijn studenten computerwetenschappen. Enkele gebruikers hebben juridische vragen. Overheden gebruiken het webarchief om oudere versies van websites te vergelijken met huidige websites.

Er zijn vijf respondenten met een selectiebeleid die gereageerd hebben op de e-mail.

De Israëlische nationale- en universiteitsbibliotheek is recent begonnen met een onderzoek naar de wensen van hun potentiële gebruikers en stakeholders, vooral met betrekking tot de

Page 13: GEBRUIKERSONDERZOEK - KB

13

selectie. De doelgroepen die zij (onder andere) aanhouden als potentiële gebruikers zijn docenten, juristen, sociologen, journalisten en taalkundigen.

Het Britse webarchief van het nationale archief (UK Government Web Archive) wordt bezocht door overheidsinstellingen, informatieprofessionals uit de erfgoedsector, onderzoekers en het grote publiek. De bezoekers vanuit de overheidsinstellingen komen overwegend uit Groot-Brittannië, maar van de bezoekers uit de andere drie categorieën komt 61% uit Noord-Amerika, 24% uit Europa en 14% uit Azië.

De Library of Congress (VS) heeft geen concreet beeld van hun bezoekers, slechts een observatie op basis van contacten met gebruikers. Deze gebruikers waren studenten, docenten, website eigenaren en medewerkers van het US Congress.

Singapore en Tsjechië hadden (nog) geen zicht op hun bezoekers.

Bijna alle aangeschreven webarchieven zijn verenigd in de IIPC.7 Binnen de Access Working Group van de IIPC is nagedacht over de potentiële gebruikers van een webarchief in het algemeen. Hiervoor zijn gebruiksscenario’s opgesteld, Use Cases for Access to Internet Archives. Deze scenario’s bevatten concrete voorbeelden (cases) voor het gebruik (use) van een webarchief. De in dit document genoemde gebruikers zijn: journalist, ‘gewone’ burger, overheid, jurist, patent aanvrager, student, onderzoeker, genealogisch onderzoeker en interne medewerkers.

5.1.2 Wie zijn de klanten van de KB? In 2006 is er door TNS-NIPO een onderzoek uitgevoerd naar de tevredenheid van KB

klanten met de KB.8 Uit dit onderzoek komt naar voren wie de klanten van de KB zijn. Voor het onderzoek onder de jaarpashouders van de KB hebben 551 pashouders meegewerkt aan een telefonisch onderzoek. 502 bezoekers van de KB website hebben enkele vragen via de website beantwoord.

Pashouders De huidige pashouders van de KB zijn onder te verdelen in drie hoofdcategorieën, namelijk

de groep die voor studie van de diensten van de KB gebruik maakt (56% van alle klanten), de groep die dit beroepsmatig doet (23%) en de groep die dit doet voor zelfstudie (20%).

Naar het opleidingsniveau van de pashouders van de KB is tijdens dit onderzoek niet gekeken.

De twee gebieden waarin de pashouders het meest geïnteresseerd in zijn, zijn geschiedenis (36%) en recht (11%).

Bezoekers van de KB website De verdeling van de hoofdcategorieën onder bezoekers van de KB website (waarvan 64%

een pashouder is) is minder extreem dan bij de pashouders. 38% van de bezoekers gebruikt de KB website voor studie, 36% beroepsmatig en 25% voor zelfstudie.

De website bezoekers hebben een HBO of WO opleiding afgerond (70%), slechts 4% heeft als hoogste opleiding VMBO of MAVO, en 22% HAVO/VWO.

7 IIPC about members, < http://www.netpreserve.org/about/members.php>, geraadpleegd op 12 juni 2007

8 Nanet Beumer, Klantentevredenheidsonderzoek Koninklijke Bibliotheek, Onderzoek onder pashouders en webbezoekers (Amsterdam 2006)

Page 14: GEBRUIKERSONDERZOEK - KB

14

Hoewel geschiedenis ook hier een belangrijk interessegebied is (29%) zijn sociale wetenschappen (11%), boek-, bibliotheek- en archiefwetenschappen (10%), taalkunde (9%) en kunstwetenschappen (9%) belangrijker dan recht (5%).

De bezoekers van de website zijn van alle leeftijden, maar vooral tussen de 21 en 65 jaar oud (slechts 11% zit hier boven of onder). Tussen de 21 en 65 jaar oud is de verdeling gelijk.

5.1.3 Wie zijn de mogelijke stakeholders van het webarchief ? In Nederland zijn er verschillende webarchiveringsinitiatieven. Enkele thematische

webarchieven zijn al operationeel (onder andere Archipol en DACHS9), en enkele instellingen zijn bezig met webarchivering op verschillende niveaus. Zo heeft het Gemeentearchief Rotterdam in een pilot Rotterdamse websites gearchiveerd.

In de eerste fase van het KB project zijn een aantal Friese websites geselecteerd door Tresoar (Fries Historisch en Letterkundig Centrum) in de selectielijst opgenomen als voorbeeld van een mogelijke samenwerking op dit gebied. Instellingen kunnen op het gebied van selectie belang hebben bij het webarchief van de KB.

Andere personen die te maken hebben met het webarchief zijn de eigenaren van websites en de content op de websites.

Deze organisaties kunnen aangemerkt worden als stakeholders omdat zij belang hebben bij het webarchief van de KB op een ander niveau dat de ‘gewone’ gebruiker. Daarom is er voor gekozen om met deze stakeholders apart te spreken in het kader van dit onderzoek.

5.2 WAARVOOR ZOUDEN GEBRUIKERS HET WEBARCHIEF KUNNEN GEBRUIKEN?

Op basis van de vorige vraag is er een lijst gemaakt van doelgroepen voor het webarchief van de KB. Deze lijst is voorgelegd aan stakeholders tijdens de discussiebijeenkomsten en is daarna aangevuld met nog enkele doelgroepen.

De doelgroepen uit het onderstaande schema zijn gebaseerd op de e-mails van andere webarchieven en de use cases van de IIPC. Hieraan zijn de KB-doelgroepen uit het klantentevredenheidsonderzoek gekoppeld. De beroepen die gespecificeerd zijn, zijn de beroepen zoals deze in de use cases of tijdens de discussiebijeenkomsten zijn benoemd.

Doelgroep KB-doelgroep Beroepen Onderzoeker Beroepsmatig Historicus

Socioloog Taalkundige

Journalist Beroepsmatig Jurist Beroepsmatig Advocaat

Openbaar ministerie Octrooigemachtigde

Schrijver Beroepsmatig ITer Beroepsmatig Webdesigner

Beheerder webarchief Student Studie

9 Archipol is een archief, gestart in 2000, van websites van Nederlandse politieke partijen, opgezet door het Documentatiecentrum Nederlandse Politieke Partijen in samenwerking met de Universiteitsbibliotheek Groningen. DACHS is het Digital Archive for China Studies opgezet door de universiteiten Leiden en Heidelberg. Hierin worden websites, maar ook digitale documenten en films opgeslagen die te maken hebben met de politiek in China.

Page 15: GEBRUIKERSONDERZOEK - KB

15

Consument Zelfstudie Genealoog Zelfstudie Cultureel geïnteresseerde Zelfstudie

Voor iedere persoon uit deze doelgroepen is één of meerdere gebruiksscenario(s) opgesteld, naar voorbeeld van het eerder genoemde document Use Cases for Access to Internet Archives. In een scenario staat wat de persoon met het webarchief wil doen, wat hier voor nodig is met betrekking tot selectie, frequentie en toegang, of deze functionaliteiten al ergens anders worden aangeboden en eventueel een koppeling naar de actualiteit (een nieuwsbericht of artikel waarin de geschetste situatie voorkomt).

De KB heeft eigen gebruiksscenario’s opgezet omdat de situatie voor webarchivering in Nederland anders is dan in de meeste andere landen.

Nederland kent geen depotwetgeving die uitgevers verplicht om gepubliceerde informatie te deponeren bij de nationale bibliotheek; dit gebeurt op basis van vrijwilligheid. Online publicaties zijn inbegrepen in de depotwetgeving van onder meer Denemarken en Nieuw-Zeeland. Uit juridisch oogpunt heeft een regeling van wettelijk depot één belangrijk voordeel. Voor het harvesten van websites is onder een dergelijke wettelijke regeling géén toestemming vereist, mits die regeling ruim genoeg wordt geformuleerd zodat hij zowel voor offline als online elektronische publicaties geldt.

Een juridisch waterdichte aanpak behelst dat de voor archivering geselecteerde websites officieel om toestemming gevraagd wordt via een overeenkomst. Dit brengt echter een enorme administratieve last met zich mee. Daarom heeft de KB voor een meer pragmatische benadering gekozen. Deze benadering gaat uit van een ‘opt out’-systeem; een sitehouder geeft impliciet toestemming voor indexering en caching van zijn website wanneer hij niet expliciet (bijvoorbeeld via robots.txt) heeft aangegeven dat hij dit niet wenst.

Door de afwezigheid van depotwetgeving in Nederland is de juridische situatie anders dan in de meeste andere landen het geval is. Dit is van invloed op de wijze waarop het webarchief van de KB toegankelijk gemaakt wordt.

De KB heeft gekozen voor een selectieve benadering van webarchivering. Dit betekent dat een selectie van Nederlandse websites zal worden gearchiveerd. Dit heeft gevolgen voor de wijze waarop het webarchief gebruikt kan en zal worden.

Deze gegevens zijn verwerkt in de gebruiksscenario’s zoals de KB ze heeft opgesteld. De gebruiksscenario’s moeten dan ook niet gezien worden als een nieuwe of andere versie van de Use Cases van de IIPC, maar als een vertaling naar de specifieke situatie van de KB. De scenario’s zullen tijdens en na het onderzoek gebruikt worden om een betere voorstelling te krijgen van het toekomstige gebruik van het webarchief.

De scenario’s zijn allen volgens een zelfde schema opgezet:

Wie Voor welke doelgroep is het gebruiksscenario bedoeld?

Wat In welke situatie wordt het archief gebruikt?

Benodigdheden Wat moet het webarchief bieden om de situatie uit te kunnen voeren?

Page 16: GEBRUIKERSONDERZOEK - KB

16

Wordt deze functie al ergens anders aangeboden?

Voorbeeld uit de praktijk

Een voorbeeld van een scenario:.

Deze scenario’s zijn slechts voorbeelden (niet de enige mogelijkheden voor het gebruik van het webarchief) en zullen zeker niet als een keurslijf gebruikt worden. Het uiteindelijke document met de gebruiksscenario’s is te vinden in bijlage 4.

Wie: Cultureel geïnteresseerde Wat:

De kantoormedewerker Julia is erg geïnteresseerd in de muziek van eind jaren ’90. Ze weet dat verschillende bandjes begonnen zijn met zichzelf promoten via een eigen website, dus ze zoekt graag in het webarchief naar deze bijzondere verdwenen websites.

Benodigdheden

• Half jaarlijkse archivering • Zoeken via WERA/NutchWax/Wayback Machine • Selectie culturele websites

Wordt deze functie al ergens anders aangeboden:

Gedeeltelijk. Als men de URL weet kan men deze websites eventueel terugvinden in het Internet Archive.

Page 17: GEBRUIKERSONDERZOEK - KB

17

6. O ND ERZ O EK

6.1 INLEIDING

Centraal onderdeel van het gebruikersonderzoek zijn observaties van daadwerkelijke gebruikers. Alle deelnemers aan deze observatie hebben in een voorgesprek vragen beantwoord over de wijze waarop zij gebruik maken van het internet, zodat er inzicht verworven is in de voorkennis van de deelnemer. Na dit gesprek, uitleg over webarchieven en de uitleg over de test hebben de deelnemers het webarchief kunnen testen. Met behulp van het webarchief en twee beschikbare zoekmachines hebben de deelnemers getracht enkele vooraf opgestelde vragen te beantwoorden. Dit is geobserveerd en opgenomen, waarbij ook het commentaar van de gebruiker is opgenomen. De deelnemers hebben het webarchief gebruikt op een laptop met hieraan een extern scherm gekoppeld waarop de observator kon mee kijken. Voor de opname is het programma Camtasia Studio 4 van Techsmith gebruikt.10 In het gesprek na de observatie is hen gevraagd naar hun ervaringen met het KB webarchief. Er zijn ook vragen gesteld over selectie, toegankelijkheid en gebruikerswensen. Alle vragen en opdrachten zijn te vinden in bijlage 5, vragen observatie.

De deelnemers kwamen onder andere uit het KB klantenpanel. In dit panel zitten klanten van de KB die hebben aangegeven dat ze mee willen werken aan publieksonderzoek voor de KB. Aan de leden van dit panel (47 personen) is een uitnodiging voor de observatie verstuurd. Daar hebben we twaalf reacties op gehad. Uit deze twaalf zijn tien geschikte deelnemers geselecteerd. Andere deelnemers zijn buiten het klantenpanel om uitgenodigd, enkelen werken bij de KB op verschillende afdelingen.

De profielen van de deelnemers zijn:

1 Man, 26 jaar, beroepsmatig, onderzoeker (intern) 2 Vrouw, 33 jaar, beroepsmatig, onderzoeker (intern) 3 Vrouw, 43 jaar, beroepsmatig, juriste (extern) 4 Man, 37 jaar, beroepsmatig, archiefonderzoeker (extern) 5 Vrouw, 37 jaar, beroepsmatig, conservator (extern) 6 Man, 37 jaar, beroepsmatig, collectiebeheerder (intern) 7 Man, 28 jaar, beroepsmatig, onderzoeker (intern) 8 Man, 43 jaar, beroepsmatig, persdocumentalist (extern) 9 Vrouw, 53 jaar, beroepsmatig, onderzoeker (intern) 10 Man, 22 jaar, studie, student communicatie- en informatiewetenschappen (extern) 11 Vrouw, 25 jaar, beroepsmatig, projectleider (extern) 12 Man, 19 jaar, studie, student bedrijfseconomie (extern) 13 Vrouw, 55 jaar, beroepsmatig, mediëvist/neerlandica (extern) 14 Vrouw, 48 jaar, beroepsmatig, ondersteuning basisonderwijs (extern) 15 Vrouw, 41 jaar, beroepsmatig, communicatie (extern)

Helaas zijn er geen deelnemers gevonden uit de groep zelfstudie.

Voorkennis van de deelnemers Alle deelnemers gebruiken het internet voor werk of studie. Dertien van de vijftien

deelnemers gebruiken het internet voor privédoeleinden.

10 Er is gebruik gemaakt van de gratis demo welke 30 dagen werkt en te vinden is op http://www.techsmith.com/camtasia.asp.

Page 18: GEBRUIKERSONDERZOEK - KB

18

Alle deelnemers maken dagelijks gebruik van het internet. Dertien doen dit de hele dag met momenten. Hier wordt onder verstaan dat de deelnemer af en toe zijn/haar e-mail controleert of even iets opzoekt. De overige twee deelnemers zitten enkele uren achter elkaar per dag op het internet.

Het internet wordt voornamelijk gebruikt voor het opzoeken van informatie en e-mailen (alle deelnemers). Daarnaast wordt het internet gebruikt om te chatten (vier deelnemers), eigen weblog/website (vier deelnemers), entertainment zoals nieuws lezen of films kijken (zeven deelnemers) en administratief, zoals voor bankzaken (tien deelnemers).

Slechts één deelnemer wist niet van het bestaan van webarchieven af voordat ze de uitnodiging voor dit onderzoek ontving. Één persoon beschouwde de geschiedenisfunctie in Wikipedia als webarchief, dit was het enige wat ze kende en als webarchief beschouwde. Enkele deelnemers beschouwden de cachefunctie van Google en archieven op websites zelf (van de eigen website) als webarchief.

Van de veertien deelnemers die van webarchieven gehoord hadden hebben negen deelnemers ook daadwerkelijk een webarchief bezocht. Het meest bezochte en bekende webarchief is het Internet Archive (negen deelnemers), maar ook het webarchief van UKWAC (twee deelnemers), Archipol (één deelnemer), Library of Congress 11 september archief (één deelnemer) en Pandora (één deelnemer) zijn bezocht. Één deelnemer gebruikte gearchiveerde versies van de website van zijn werkgever.

Vijf van de negen deelnemers hebben een webarchief bezocht “voor de lol”. Ze hebben hierin websites opgezocht die ze zelf (ooit) vaak bezochten of hebben gemaakt. De overige vier deelnemers hebben onderzoek gedaan met behulp van een webarchief of een webarchief gebruikt als ondersteuning voor onderwijs. Zij waren hierbij op zoek naar informatie die van het huidige web was verdwenen.

Gevraagd naar ervaringen bij eerder gebruik van webarchieven merkten de deelnemers op dat zij het liefst willen zoeken op volledige tekst. Verder was er een sterke voorkeur de archivering van volledige websites in tegenstelling tot een snapshot en duidelijkheid over selectie en selectiebeleid (wat zit er wel in, en wat niet).

6.2 ZOEKMOGELIJKHEDEN VAN HET WEBARCHIEF

Om te testen hoe de gebruikers willen zoeken in het webarchief hebben we de deelnemers aan de observatie twee opties gegeven om te zoeken, namelijk een zoekmachine die zoekt op URL en een zoekmachine die zoekt op volledige tekst.

Afbeelding 1, Zoekmachine Wayback Machine

Page 19: GEBRUIKERSONDERZOEK - KB

19

De zoekmachine die zoekt op URL is de Wayback Machine (afbeelding 1). Deze zoekmachine heeft geen andere zoekfunctie.

Afbeelding 2, Zoekresultaten Wayback Machine

Als zoekresultaat worden de data van de verschillende gearchiveerde versies van de gezochte webpagina gepresenteerd (zie afbeelding 2). Datumweergave is een datestamp in jaar, maand, dag, uur, minuut, seconde. Alle documenten die zijn gearchiveerd kunnen worden gevonden. De gebruiker moet echter wel de exacte URL daarvan kennen.

Page 20: GEBRUIKERSONDERZOEK - KB

20

Afbeelding 3, Zoekresultaten van NutchWax in combinatie met de Wayback Machine

De zoekmachine die zoekt op volledige tekst is een combinatie van NutchWax (indexeren en opbouwen zoekfunctionaliteit) en de Wayback Machine (presentatie)(zie afbeelding 3). Met NutchWax kan de gebruiker gearchiveerde documenten vinden op basis van vrije tekst invoer, op een Google-achtige wijze.

De zoekresultaten (afbeelding 3) bestaan uit:

De titel van de pagina,

Een korte tekst,

De URL,

Het bestandsformaat,

De grootte (in data),

De datum en tijd van archivering,

“Other versions”, een lijst van alle data waarop de betreffende pagina is gearchiveerd

“More from this site” waarbij de zoekopdracht binnen de website wordt uitgevoerd.

Per domein is er maar één resultaat in de lijst. Voor meer hits per website moet de gebruiker op de link “More from this site” klikken.

Page 21: GEBRUIKERSONDERZOEK - KB

21

Afbeelding 4, Tijdbalk in weergave gearchiveerde website.

Voor de weergave van de gearchiveerde website maken beide zoekmachines gebruik van de Wayback Machine, waardoor de weergave bij beide zoekmachines hetzelfde is. Aan de bovenkant van de website staat een tijdbalk (bètaversie van de Wayback Machine) waarin de gebruiker kan zien hoeveel versies er van de betreffende pagina zijn en van welke datum deze versie is (afbeelding 4). Daarnaast staat een tijdlijn met pijlen om naar de eerste, de vorige, de volgende en de laatste versie van de pagina te gaan. De versies zijn uitgetekend op de tijdlijn, waarvan de schaal aangepast kan worden naar uren, dagen, weken, maanden en jaren. De gebruiker kan klikken op de blokjes die de versies voorstellen. Ook kan de gebruiker de metadata van de betreffende pagina inzien.

De deelnemers hebben zeven vragen beantwoord waarin zoveel mogelijk aspecten van de twee zoekmogelijkheden aan bod zijn gekomen. Deze vragen zijn te vinden in bijlage 5.

6.3 HOE WORDT HET ZOEKEN OP VOLLEDIGE TEKST ERVAREN DOOR DE DEELNEMERS?

Enkele deelnemers geven nog voor het gebruik van het KB webarchief aan dat het zoeken op volledige tekst hun voorkeur heeft. Één deelnemer geeft aan dat NutchWax, een voor hem nieuwe zoekmachine, hem niet veel vertrouwen geeft omdat zijn eerste zoekopdracht geen goed resultaat gaf. Twee deelnemers geven tijdens de observatie aan dat ze een geavanceerde zoekfunctie missen.

Als laatste opdracht is aan de deelnemers gevraagd om een site van hun eigen voorkeur op te zoeken in het Internet Archive. De omvang van archive.org was een eye-opener voor de deelnemers. De mogelijkheid om vele verschillende versies van een website, vaak jaren terug in de tijd, met elkaar te kunnen vergelijken maakte het nut van een webarchief duidelijk. Het enkel op URL kunnen zoeken wordt door de deelnemers echter wel als beperking gezien. Verder is er

Page 22: GEBRUIKERSONDERZOEK - KB

22

respect voor de keuze van de KB om een kleine selectie Nederlandse websites in detail te archiveren.

6.3.1 Algemene opmerkingen over de helptekst De mogelijkheden van de zoekmachine zijn beschreven in de helptekst. Tien deelnemers

geven aan dat ze de helptekst nooit gebruiken of slechts in het geval van nood. De observator heeft alle deelnemers de helptekst laten gebruiken om de duidelijkheid van de helptekst.

Enkele deelnemers vinden dat er duidelijker moet worden aangegeven welke zoeksyntax gebruikt kan worden. Zo kan er geen gebruik gemaakt worden van gangbare Boleaanse operatoren als AND, OR en NOT maar wel van aanhalingstekens, + en -. Dit blijkt niet duidelijk te zijn.

De conclusie die hieruit getrokken kan worden is dat er een uitgebreidere helptekst nodig is waarin voorbeelden van de syntax gegeven worden en zoektips op zoekpagina handige hulpmiddelen zijn.

Het feit dat het lezen van de helptekst of de FAQ op een website door bezoekers niet of nauwelijks wordt gedaan, werd ook door andere webarchieven opgemerkt.

6.3.2 Algemene indrukken zoektechnieken De deelnemers combineren meerdere zoektermen. Opvallend is dat, ondanks dat er

meerdere pagina’s met zoekresultaten zijn er vrijwel niemand doorgaat naar de tweede pagina terwijl in sommige gevallen het antwoord daar te vinden was. Enkele deelnemers scrollen zelfs niet helemaal naar beneden om te vinden wat ze zoeken.

6.3.3 Het gebruik van de zoekmogelijkheden De meeste deelnemers gebruiken standaard zoeksyntax in hun opdrachten, zoals

aanhalingstekens, + en -.

De deelnemers is gevraagd om een foto van Prinses Maxima te vinden in het webarchief. Één van de manieren om dit te doen is door de zoekopdracht uit te voeren met toevoeging van een beperking op bestandstype (type:jpg). Echter, een foto van Prinses Maxima was ook te vinden door een juiste combinatie van zoektermen.

Enkele deelnemers vragen zich onmiddellijk af of er niet een optie is zoals Google (Image Search/Afbeeldingen zoeken). Uiteindelijk voerden vier deelnemers de zoekopdracht uit met de toevoeging type:jpg. Twee daarvan halen deze optie uit de helptekst. Tien deelnemers vinden een foto door middel van een combinatie van zoektermen, zoals ‘prinses maxima foto’. Één deelnemer gebruikte ook een combinatie van termen, maar heeft uiteindelijk geen foto kunnen vinden (omdat ze haar opdracht teveel beperkte). Drie deelnemers geven aan dat ze voor deze opdracht liever via de Wayback Machine de website van het Koninklijk Huis opzoeken.

De deelnemers is ook gevraagd om een pdf document te vinden met in de bestandsnaam de woorden “nieuwe” en “woorden”. De pdf die we zochten heette nieuwewoorden2006.pdf, en was dus ook niet te vinden door nieuwewoorden.pdf in te tikken.

Uiteindelijk vinden acht deelnemers dit bestand door te zoeken met behulp van type:pdf. Zes deelnemers doen dit nadat ze dit in de helptekst hebben gelezen. Één deelnemer vraagt zich af, na het lezen van de helptekst, of bij de opdracht type:pdf meer zoektermen bij mogen. Opvallend is dat enkele deelnemers denken dat dit ook met de Wayback Machine kan, omdat een bestandsnaam onderdeel is van een URL. Dit kan alleen als de exacte URL bekend is; zoeken met wildcards is niet mogelijk. Vijf deelnemers vinden het bestand niet, de overige twee deelnemers vinden het bestand door een andere combinatie van zoektermen.

Page 23: GEBRUIKERSONDERZOEK - KB

23

6.3.4 “Other versions” en “More from this site’ Per zoekresultaat zijn vaak twee extra opties weergegeven. Er is gekeken of de deelnemers

deze opties zien, gebruiken en weten wat ze bieden. “Other versions” geeft een overzicht van data waarop deze pagina is gearchiveerd, met andere woorden alle versies van de betreffende pagina. “More from this site” geeft zoekresultaten waarbij de uitgevoerde zoekopdracht is gedaan binnen de gearchiveerde website waarvan de pagina komt.

Slechts vier deelnemers gaven aan dat ze de opties gezien hadden. Twee deelnemers gaven aan dat ze de opties wel zagen, maar dat ze er bij Google ook niets aan hebben, dus zullen ze er nu ook wel niets aan hebben.

Bij “other versions” verwachten acht deelnemers andere versies van de pagina. De overige deelnemers verwachten andere bestandsformaten, of ze verwachten andere versies bij “more from this site”. Bij “more from this site” zijn de verwachtingen meer verschillend. Drie deelnemers verwachten dat dit een link naar de live website is. Één deelnemer verwacht “leuke nieuwtjes over de website”. Andere deelnemers verwachten wel zoekresultaten van de betreffende website, maar dan niet met de gebruikte zoekopdracht. Twee deelnemers verwachten alles te zien waar die pagina in voorkomt, een andere deelnemer verwacht alles van die pagina.

Één deelnemer geeft na het uitproberen van “more from this site” aan dat hij het niet vertrouwenswekkend vind dat er bij de eerste tien zoekresultaten veel spacer.gif, css bestanden en javascripts staan. Deze moeten in de zoekresultaten lager eindigen dan pagina’s met tekst.

Een tip om deze twee opties meer te laten opvallen is door ze altijd op dezelfde plek te laten staan (dus altijd zoveel centimeter van de marge, in plaats van zoals nu aan het einde van een regel) en ze ook eventueel in een andere kleur en lettertype neer te zetten. Duidelijk is dat de termen “Other versions” en “More from this site” niet duidelijk zijn en veranderd moeten worden.

6.3.5 Zoeken naar een onbekende website De deelnemers is gevraagd om twee versies te vinden van de website van De Dubbelde

Palmboom. Vrijwel geen enkele deelnemer kende de URL van deze website, en zij gebruikten NutchWax om de website te vinden. Echter, het resultaat van een zoekopdracht naar De Dubbelde Palmboom leverde vaak als resultaat van de webpagina een subpagina op, vanwaar de deelnemers niet naar andere versies, of naar de voorpagina konden komen. Ze moesten dus of de URL inkorten (tot en met .nl) of via “Other versions” de voorpagina zien te vinden.

Twee deelnemers zoeken de URL op in Google en gebruiken deze in de Wayback Machine, de overige deelnemers gebruiken NutchWax.

Twee van de deelnemers die in NutchWax hebben gezocht hebben niet door dat ze naar een subpagina zitten te kijken. Één deelnemer kopieert de URL en plakt deze in de Wayback Machine. Drie deelnemers klikken op “Other versions” en zoeken verder in de Wayback Machine. Twee deelnemers knippen het deel na .nl uit de URL in de adresbalk. Vijf deelnemers gebruikten de optie “More from this site” om de hoofdpagina te vinden. Één deelnemer geeft hierbij aan dat ze normaal nooit zover door zou klikken om iets te vinden. Één deelnemer is er uiteindelijk niet uitgekomen. Deze gaf aan als eerste en belangrijkste zoekresultaat de hoofdpagina van de website te verwachten. Uiteindelijk vinden alle deelnemers de versies van de websites.

6.3.6 Zoeken binnen een website De deelnemers is gevraagd om in het webarchief informatie te zoeken over webarchivering

op de website van de KB, zodanig dat de resultaten alleen de hits van kb.nl geven. De twee manieren om dit te doen zijn door te zoeken op webarchivering in NutchWax en dan bij de hit

Page 24: GEBRUIKERSONDERZOEK - KB

24

van de KB website op “More from this site” te klikken, of door in de zoekopdracht site:www.kb.nl toe te voegen.

Vijf deelnemers beginnen met het opzoeken van www.kb.nl of www.kb.nl/webarchivering in de Wayback machine. Ze willen dan de website of de resultaten doorzoeken, maar ze komen er al snel achter dat dit niet kan. Twee deelnemers zoeken meteen met site: in NutchWax. Twee deelnemers kijken in de helptekst van de Wayback Machine of ze de zoekopdracht daarmee kunnen uitvoeren. Ze zien dat dit niet kan en gaan dan naar NutchWax. Zes deelnemers gaan naar de helptekst van NutchWax, nog voordat ze iets in NutchWax hebben opgezocht. Vijf van deze zes deelnemers kiezen allemaal site: uit als de optie die ze kunnen gebruiken. Één deelnemer probeert eerst nog exacturl: en daarna site:. Vier deelnemers proberen te zoeken in NutchWax met een combinatie van termen (zonder specificatie door middel van site:). Vier deelnemers lopen vast in NutchWax, en gaan dan pas naar de helptekst. Drie van deze deelnemers zien de optie voor site: niet.

6.4 HOE WORDT HET ZOEKEN OP URL ERVAREN DOOR DE DEELNEMERS?

Op URL zoeken gaat op dit moment alleen soepel in de Wayback Machine. Toch gebruikten enkele deelnemers NutchWax om op URL te zoeken. Dit is niet ideaal, zoals werd aangegeven door enkele deelnemers die NutchWax gebruikten in plaats van de Wayback Machine. Zo kregen ze geen overzicht van de data waarvoor een gearchiveerde versie beschikbaar was.

Negen deelnemers hebben het Internet Archive al eens bezocht, en dus de Wayback Machine al eens gebruikt. Als de deelnemers gevraagd wordt om naar een website van een bepaalde datum op zoek te gaan gebruiken veertien deelnemers de Wayback Machine. De deelnemer die NutchWax gebruikt om de website te vinden geeft aan niet zo goed te weten wat de Wayback Machine aan resultaten zal opleveren.

6.4.1 Algemene opmerkingen over de Wayback Machine Twee deelnemers willen de Wayback Machine gebruiken, maar typen vervolgens hun

zoekopdracht in de adresbalk van de browser in. Ze gaven aan het zoekvenster niet gezien te hebben. Één deelnemer gaf aan dat het zoekvenster te klein was, zeker voor lange URL’s. Twee deelnemers selecteren uit welk jaar ze een website willen vinden, de overige deelnemers laten deze optie op “ALL” staan. Één deelnemer zoekt een URL op zonder www ervoor te gebruiken, dit werkt ook.

Het standaard Wayback Machine logo wordt door twee deelnemers verwarrend gevonden, omdat ze denken dat ze nu in het Internet Archive zitten.

Één deelnemer geeft aan dat hij graag op “stukjes van URL’s” wil zoeken, bijvoorbeeld met wildcards, als hij de URL niet helemaal weet.

6.4.2 Weergave van de data De resultaten bestaan uit een timestamp van de data waarop de gezochte website is

opgeslagen. Deze data zijn voor veel deelnemers in eerste instantie onduidelijk. Na een beetje puzzelen zien de meesten dat het data zijn, en ontcijferen ze de timestamp. Één deelnemer controleert haar vermoedens over de datum met de helptekst.

Verschillende deelnemers verwachten dat de nieuwste versie bovenaan zal staan. Dit is niet het geval; de lijst is chronologisch van oud naar nieuw gepresenteerd.

De data die boven de resultaten staan (“between jan 1, 1996 and dec 31 2007”) wekt verwarring bij enkele deelnemers. Zij gaan er nu vanuit dat er dus een versie aanwezig is van 1 januari 1996 of 31 december 2007.

Page 25: GEBRUIKERSONDERZOEK - KB

25

Tijdens het gebruik van het Internet Archive hebben de deelnemers gekeken naar de presentatie van resultaten door IA. Deze is hier in leesbare data die per jaar in een tabel zijn gezet. De datum erboven klopt hier ook niet. Als een pagina veranderd is ten opzichte van de vorige gearchiveerde versie wordt dit aangegeven met een asterisk. Elf deelnemers geven aan dat ze deze presentatie duidelijker vinden.

6.5 HOE BRUIKBAAR IS DE TIJDBALK?

De tijdbalk is bij beide zoekmachines te zien, en is bij beiden hetzelfde en zal daarom apart besproken worden. Let op: de implementatie van de tijdbalk is op dit moment een bèta versie.

Één persoon had de tijdbalk tijdens de observatie niet gezien. Een mogelijke reden hiervoor is dat de tijdbalk dezelfde kleur grijs was als de adresbalk van de browser erboven.

Wat opvalt is dat veertien van de vijftien deelnemers met het pijltje in de tijdbalk proberen te schuiven om naar een eerdere of latere versie te gaan. Als ze merken dat dit niet werkt klikken ze op de pijlen voor en na de tijdbalk. De blauwe of rode blokjes worden nauwelijks gezien en gebruikt. Wel geven twee deelnemers aan dat ze de tooltip die ze krijgen als ze met de muis boven een blokje hangen handig vinden. Dit is een kleine tekst met daarin de datum van de versie die achter een blokje schuilt.

De datum van de weergegeven versie die op de tijdbalk staat wordt door vrijwel alle deelnemers (na vragen van welke datum de weergegeven versie is) gezien, evenals het aantal versies.

Om van de ene versie naar een andere te komen gebruiken tien deelnemers de tijdbalk, de overige deelnemers gaan een pagina terug en klikken dan een andere versie aan.

Na het gebruik van het Internet Archive (zonder tijdbalk) tijdens de observatie gaven tien deelnemers aan de tijdbalk handig te vinden.

6.6 ALGEMENE OPMERKINGEN

Één deelnemer gaf aan dat hij verschillende versies van gearchiveerde pagina’s naast elkaar wil vergelijken. Een andere deelnemer wilde de zoekmachine op de gearchiveerde webpagina gebruiken. Zes deelnemers willen een zoekopdracht binnen bepaalde archiveringsdata laten uitvoeren. Één deelnemer wil dat de zoektermen in de resultaten duidelijk naar voren komen, bijvoorbeeld door ze te highlighten.

6.7 WELKE WENSEN OF INZICHTEN HEBBEN DE DEELNEMERS TEN AANZIEN VAN DE TE SELECTEREN WEBSITES?

De deelnemers is gevraagd welke categorieën websites er in het webarchief van de KB moeten worden opgenomen. Hierbij is niet van te voren een lijst van categorieën opgesteld, de antwoorden liepen daardoor uiteen. De vijftien deelnemers aan de observatie hebben samen 27 categorieën opgegeven. De belangrijkste categorieën zijn nieuwswebsites, blogs, cultuur (alle zes maal genoemd). Websites van de overheid, en een selectiebeleid zoals nu gebruikt wordt voor de algemene of wetenschappelijke collectie van de KB worden beide vijf maal genoemd als selectiecategorie. Andere genoemde categorieën zijn: kunstwebsites, universitaire websites, actualiteiten, politiek, commercieel, forums, archieven, bibliotheken, webtechnologie, alles(!), wetenschap, cultuurhistorisch, een doorsnede van het Nederlandse web, privéwebsites, “nare dingen” (zoals racisme), gemeentelijke websites, rampen (bijvoorbeeld crisis.nl), letteren, musea (tentoonstellingen en collectiedatabases), recensies van boeken en voorstellingen en fotoarchieven.

Page 26: GEBRUIKERSONDERZOEK - KB

26

Opvallend veel deelnemers (33%) verwachten dat het selectiebeleid van het webarchief het selectiebeleid van de KB zal volgen. Dit betekent voor die deelnemers dat er websites op het gebied van Nederlandse taal, cultuur en wetenschap worden geselecteerd. Ook de stakeholders vinden dit een goede optie, zeker als startpunt.

Het tot stand komen van de selectie is gesproken tijdens de discussiebijeenkomsten met de stakeholders. De discussie richtte zich vooral op verschillende vormen van samenwerking. Het model zoals dat gehanteerd wordt door UKWAC werd gezien als een goede manier van samenwerking.11 Ideeën die tijdens de bijeenkomst genoemd waren gingen over samenwerking. De KB zou kunnen samenwerken met andere instellingen om de selectie van websites te maken. Een idee is bijvoorbeeld dat de KB een basisselectie maakt, waarop gespecialiseerde instellingen of een panel bestaande uit gebruikers uit de doelgroepen een aanvulling kunnen maken. Wanneer de KB websites selecteert voor archivering moet ze daarbij vooral gebruik maken van de kennis en expertise van andere kennisinstellingen (bijvoorbeeld niet zelf websites van politieke partijen selecteren in verband met Archipol).

De samenwerking tussen de KB en andere instellingen op het gebied van webarchivering kan ruwweg op drie niveaus plaatsvinden:

De andere instelling selecteert, de KB slaat op en biedt toegang;

De andere instelling selecteert, slaat op, en de KB biedt toegang;

De andere instelling selecteert, de KB slaat op, de andere instelling biedt toegang.

De andere instelling selecteert, slaat op en biedt toegang. Samenwerking is gelegen in het onderling linken van de archieven.

In alle gevallen wordt er van de KB een coördinerende rol verwacht.

Aan de deelnemers van de observatie is gevraagd of zij het wenselijk vinden om zelf als gebruiker websites te nomineren voor archivering. De reactie was overwegend positief. Een dergelijke functionaliteit is bij een aantal webarchieven al mogelijk. Een voorbeeld daarvan is Archive-It van het Internet Archive.12

6.8 HOE ZOU VOLGENS DE DEELNEMERS AAN HET ONDERZOEK DE TOEGANG TOT HET WEBARCHIEF GEREGELD MOETEN ZIJN?

Zoals eerder besproken ontbreekt een wettelijk depot kader voor het webarchief van de KB. Daarom is er gekozen voor de opt-out aanpak. Hierdoor moet er ook een keuze gemaakt worden met betrekking tot de toegang die gebruikers hebben tot het webarchief. Dit kan uiteenlopen van vrij toegankelijk op internet tot alleen beschikbaar binnen de KB. Om wat meer duidelijkheid te krijgen over wat de gebruiker daarvan vindt zijn enkele vragen hierover opgenomen in het nagesprek.

Aan de deelnemers zijn vier mogelijkheden voorgelegd voor het benaderen van het webarchief. Hen is gevraagd of ze het webarchief zouden gebruiken als:

11 In UKWAC (UK Web Archiving Consortium) werken zes Britse organisaties samen om het Britse web te archiveren. Zie: http://info.webarchive.org.uk/index.html (geraadpleegd op 8-6-2007)

12 http://www.archive-it.org/

Page 27: GEBRUIKERSONDERZOEK - KB

27

1. Het webarchief alleen toegankelijk is binnen de KB

Negen deelnemers geven aan dat ze het webarchief dan niet zouden gebruiken

Zes deelnemers geven aan dat ze het webarchief dan wel zullen gebruiken. Dit zijn drie onderzoekers, de conservator, de persdocumentalist, de mediëviste/neerlandica, en de directrice van communicatiebureau Dit zijn deelnemers die nu ook al vaak naar de KB komen of dichtbij wonen.

2. Het webarchief via het internet toegankelijk is voor KB jaarpashouders.

Alle deelnemers zouden het webarchief wel gebruiken, maar zeven deelnemers geven aan dit een barrière te vinden. Dit zijn twee onderzoekers, de archiefonderzoeker, de persdocumentalist, de collectiebeheerder, de projectleider en de ondersteuner van het basisonderwijs

3. Het webarchief via het internet toegankelijk is na registratie van naam en e-mail.

Geen van de deelnemers vindt dit een probleem. De directrice van het communicatiebureau geeft aan dit geen probleem te vinden omdat de KB een betrouwbare instelling is.

4. Het webarchief via het internet toegankelijk is zonder registratie of jaarpas

Dit vinden de deelnemers geen probleem. De deelnemers geven aan dat ze dan ook rond gaan kijken “voor de lol” en dat ze het net zo makkelijk gaan gebruiken als Google.

Zes deelnemers geven aan dat ze het erg vreemd vinden als het webarchief niet online toegankelijk zou zijn. De deelnemers geven aan dat ze websites via het internet verwachten te kunnen zien, ook al is het een webarchief. Enkele deelnemers gaven aan dat ze, als het alleen in de KB toegankelijk is, zelfs de KB er van verdachten er geld mee te willen verdienen.

Één persoon gaf aan dat hij het webarchief wel zou gebruiken als hier een jaarpas voor nodig is, op voorwaarde dat de KB-jaarpas geheel via internet aan te vragen is.

Samengevat betekent dit dat de optie “alleen beschikbaar binnen de KB” slechts 40% van deelnemers trekt die een optie via het internet zou trekken. Ook vind 47% het hebben van een jaarpas om het webarchief via internet in te zien een duidelijke barrière.

6.9 HOE KUNNEN GEBRUIKSWENSEN WORDEN GEPRIOTEERD?

De British Library (BL) heeft een lijst opgesteld met mogelijke gebruikerswensen ten aanzien van een webarchief. Deze lijst is door de KB vertaald en gebruikt tijdens dit onderzoek. De lijst is verstuurd naar zowel de stakeholders, als voorgelegd aan de deelnemers van de observatie. De lijst is te vinden in bijlage 5, en bestaat uit 32 mogelijke wensen.

Aan de deelnemers van de observatie en de stakeholders is gevraagd om per wens aan te geven of ze deze vereist (3 punten), wenselijk (2 punten), mogelijk (1 punt) of niet nodig (0 punten) vinden. In totaal hebben twintig deelnemers de lijst ingevuld. Het hoogste aantal te behalen punten was 60. De top tien is:

Page 28: GEBRUIKERSONDERZOEK - KB

28

Requirement Totaal Zoeken op url 58 Full text zoeken 58 Er moet in de presentatie een duidelijk onderscheid zijn tussen de live website en de

gearchiveerde versie 55 Zoeken binnen een specifieke website 50 Presentatie van gearchiveerde website moet in de browser exact zijn als de originele

website 48 Weergeven van de wijze van toegang bij de verschillende zoekresultaten (vrij

toegankelijk of alleen in de leeszaal van de bibliotheek) 48 Zoeken via bibliotheekcatalogus 46 Zoeken op trefwoorden 46 Aanwezigheid van een eenvoudige zoekfunctie en een geavanceerde zoekfunctie

(onafhankelijk van hoe deze uitgevoerd zijn) 46 Metadata met betrekking tot de betreffende website oproepbaar wanneer gewenst 43

De volledige lijst met resultaten is te vinden in bijlage 6, resultaten gebruikerswensen.

Page 29: GEBRUIKERSONDERZOEK - KB

29

7. CO N CLU SIE

Hieronder zijn een aantal duidelijke conclusies uit het onderzoek gegeven. Dit kwalitatieve onderzoek is slechts een begin, ‘food for thought’ en levert input voor de tweede fase van het project webarchivering.

De KB heeft ervoor gekozen om een selectie van Nederlandse websites duurzaam te archiveren. Deze selectieve benadering vereist dat er kennis van de (potentiële) gebruikers is. De centrale vraag van dit gebruikersonderzoek was dan ook: hoe moeten de inhoud en zoekmogelijkheden van het KB-webarchief eruit zien wanneer we rekening houden met potentiële gebruikers en stakeholders. De hieronder geformuleerde conclusies uit het gebruikersonderzoek geven antwoord op deze vraag.

1 Potentiële gebruikers en stakeholders Paragraaf 5.1

Ondanks het feit dat er nog slechts weinig informatie is over het gebruik van een webarchief hebben we wél een beeld van de potentiële gebruikers kunnen destilleren uit de IIPC use cases, de door ons opgestelde aanvullingen daarop, de input van andere webarchieven en de stakeholders in Nederland en het klanttevredenheidsonderzoek van de KB. De lijst met doelgroepen bestaat uit onderzoekers, journalisten, juristen, schrijvers, webdesigners, studenten, consumenten, genealogen, cultuur geïnteresseerden en de beheerder van het webarchief. Uit een breder, kwantitatief onderzoek, zal moeten blijken of dit juist is.

2 Redenen voor gebruik Paragraaf 5.2

Naar verwachting zal de voornaamste reden voor het gebruik van het webarchief onderzoek zijn. Naar mate het webarchief groeit en ouder wordt zal het steeds meer een bron worden voor (wetenschappelijk) onderzoek. Journalisten en juristen kunnen het webarchief gebruiken voor achtergrondinformatie. Natuurlijk zal het webarchief ook geïnteresseerde ‘leken’ trekken, zoals ook al in de gebruiksscenario’s naar voren kwam.

3 Zoeken in het webarchief Paragraaf 6.2, 6.3, 6.4, 6.5 en 6.6

Het zoeken in het webarchief kan op twee manieren, op URL en op volledige tekst. Het zoeken op volledige tekst heeft duidelijk de voorkeur van de deelnemers aan de observatie. Het zoeken op URL wordt echter ook als zeer bruikbaar ervaren en mag zeker niet ontbreken in het webarchief. Hoe de zoekmachine er ook uit zal zien, er moet zeker een goede helptekst beschikbaar zijn. Nog belangrijker is om op de hoofdpagina zoektips te geven aan de gebruiker. Duidelijk is dat voor de deelnemers Google de norm is. Ze verwachten dat een zoekmachine op volledige tekst werkt zoals Google.

4 Selectie van websites Paragraaf 6.7

De selectie van websites voor het webarchief moet beginnen met het KB-collectiebeleid. Dit betekent websites op het gebied van de Nederlandse taal, cultuur en wetenschap. Vanuit deze selectie kan met hulp van de gebruikers, stakeholders en specialisten een uitbreiding gemaakt worden. Samenwerking met andere instellingen op het gebied van webarchivering is wenselijk en kan op verschillende niveaus.

Page 30: GEBRUIKERSONDERZOEK - KB

30

5 Toegang tot het webarchief Paragraaf 6.8

De deelnemers aan de observatie vinden het geen probleem om te moeten registreren om via internet toegang te krijgen tot het webarchief. Bij beperking van de toegang door het archief alleen binnen de KB toegankelijk te maken zullen slechts enkele deelnemers gebruik maken van het archief, en dan nog alleen als laatste oplossing.

6 Gebruikerswensen Paragraaf 6.9

De deelnemers en stakeholders vinden het belangrijk dat er een duidelijk onderscheid gemaakt wordt tussen de live website en de gearchiveerde versie. Metadata en informatie over de pagina, de archivering en de website vindt men belangrijk om in te kunnen zien. De deelnemers willen op verschillende manieren kunnen zoeken in het webarchief. Dit is analoog aan het zoeken op het live-web. De keuze voor het archiveren van een selectie wordt gewaardeerd, zeker als dit betekent dat websites gedetailleerd worden gearchiveerd.

7 Kwantitatief vervolgonderzoek Als het webarchief operationeel is moet er een groter kwantitatief onderzoek worden opgezet

waarin de bevindingen van het huidige kwalitatieve onderzoek getoetst worden aan de werkelijke situatie. Dan kunnen ook meer en gedetailleerdere vragen gesteld worden over zaken zoals selectie, toegang en zoekfunctionaliteiten.

Page 31: GEBRUIKERSONDERZOEK - KB

31

8. LITER A TU URLI JS T

Beumer, Nanet, Klantentevredenheidsonderzoek Koninklijke Bibliotheek, Onderzoek onder pashouders en webbezoekers (Amsterdam 2006)

Beunen, Annemarie en Tjeerd Schiphof, Juridische aspecten van webarchivering (Leiden 2006)

Booij-Sleutel, Christien en Saskia van der Linden, Vier artikelen over Usability (z.p. 2006)

Booij-Sleutel, Christien en Saskia van der Linden, De kluwen ontward, hoe maak je een analyse en plan voor een ontwerp of herontwerp van een website? (z.p. 2006)

Booij-Sleutel, Christien en Saskia van der Linden, Lessons learned, de bijlage: Voorbeelden van usability-problematiek uit de archiefpraktijk (z.p. 2006)

Booij-Sleutel, Christien en Saskia van der Linden, Schatgraven zonder zweetdruppels, welke evaluatie technieken zijn er en in welke fase kunnen deze ingezet worden? (z.p. 2006)

Booij-Sleutel, Christien en Saskia van der Linden, Voor Antonius en Johanna tot Anouk en Jaimie, gebruiksvriendelijk ontwerpen, wat houdt dat in? (z.p. 2006)

Foot, Kristen e.a., The internet and elections, an international project for the comparative study of the role of the internet in the electoral process (2003)

Foot, Kristen en Steven M. Schneider, ‘The web as an object study’, New Media and society 6 (1) 114-122

Gomes, Daniel, Sérgio Freitas en Mário J. Silva, Design and selection criteria for a national web archive (Lissabon 2006)

Hokke, Erika, ‘Een toekomst voor het verleden van het web’, Informatie Professional 7/8 (2006) 26-31

IIPC about members, < http://www.netpreserve.org/about/members.php>, geraadpleegd op 12 juni 2007

IIPC, Use Cases for Access to Internet Archives, <http://netpreserve.org/publications/reports.php?id=003>, geraadpleegd op 1 februari 2007

Koninklijke Bibliotheek Collectieplan 2006-2009, Nederland in de wereld - de wereld in Nederland (Den Haag 2005)

Lyman, Peter, Archiving the world wide web <http://www.clir.org/pubs/reports/pub106/web.html>, geraadpleegd op 27 feb 2007

PADI webarchiving, secties 1 (purpose of page), 2 (web archiving models), 3 (case studies of archiving approaches) <http://www.nla.gov.au/padi/topics/92.html>, geraadpleegd op 18-12-2006

Pandora user survey, <http://pandora.nla.gov.au/usage_survey_form.html>, geraadpleegd op 18-12-2006

Ras, Marcel, Projectplan Eerste Fase Webarchivering (Den Haag 2006)

Page 32: GEBRUIKERSONDERZOEK - KB

32

Rauber, Andreas, e.a., ‘Uncovering information hidden in web archives’, D-Lib magazine dec 2002 vol 8 nr 12

SIDN, Jaarverslag 2006 (2006)

Sieverts, Eric e.a., ‘IP webtest VIII, Wetenschappelijke bibliotheken: meer’ Informatie professional 6/12 (2006) 16-33

Stack, Michael, Full text search of web archiving collections (San Fransisco z.j.)

UKWAC evaluation report, appendix 2: End user survey form for the UKWAC web site - Summary of responses (2006)

Verisign, The domain industry brief 1 (2007)

Voorburg, R.J.J. en J.L.E. Goutier, Web sphere analysis: an approach to studying online action (z.p. 2004)

Page 33: GEBRUIKERSONDERZOEK - KB

33

BIJL AG E 1 : LI JS T G EA RC HIV EE RD E W E BSI TES

Musea www.huygensinstituut.knaw.nl www.rmo.nl www.onderzoekinformatie.nl/nl/oi/nod www.nederlandsfotomuseum.nl www.tno.nl www.museumboerhaave.nl www.telin.nl www.rembrandthuis.nl www.nwo.nl www.letterkundigmuseum.nl www.tinbergen.nl www.dedubbeldepalmboom.nl www.dans.knaw.nl www.hmr.rotterdam.nl/sh www.niwi.knaw.nl www.centraalmuseum.nl www.centraalmuseum.nl Taal en Letterkunde www.geheugenvanoost.nl www.illc.uva.nl www.rkd.nl www.neder-l.nl listserv.surfnet.nl/archives/neder-l.html Archieven www.inl.nl gemeentearchief.amsterdam.nl www.louiscouperus.nl www.gemeentearchief.rotterdam.nl www.onzetaal.nl www.archiefschool.nl www.rhc-eindhoven.nl Geschiedenis www.rhcl.nl www.iisg.nl www.hetutrechtsarchief.nl www.inghist.nl www.tresoar.nl www.anno.nl www.divakoepel.nl www.annefrank.nl www.iiav.nl Bibliotheek www.sna.nl www.geheugenvannederland.nl www.digitaleatlasgeschiedenis.nl www.kb.nl www.datbewarenwe.nl www.bibliotheek.nl www.archeos.nl www.debibliotheken.nl www.cbg.nl www.gezondheidsplein.nl www.ikwilietsleren.nl Cultuur Algemeen www.deverdiepingvannederland.nl www.cultuurwijzer.nl sitegenerator.bibliotheek.nl/wsf/home www.cultuurwijs.nl www.den.nl Overheid www.erfgoedactueel.nl www.waterstaatsgeschiedenis.nl www.kennisnet.nl www.hetkenniscentrum.nl www.racm.nl www.tweedekamer.nl www.belvedere.nu www.minocw.nl www.kich.nl www.erfgoedinspectie.nl www.boekman.nl www.regering.nl www.overheid.nl Universiteit, Hogeschool www.eerstekamer.nl www.clingendael.nl www.koninklijkhuis.nl www.nyenrode.nl www.vng.nl www.ru.nl www.denhaag.nl www.cwi.nl www.postbus51.nl www.edusite.nl Onderzoeksinstituut Naderhand bijgekomen www.scp.nl Diverse Friese literaire websites www.cbs.nl www.inpoldering-noordwalcheren.com www.cpb.nl www.weekvandegeschiedenis.nl

Page 34: GEBRUIKERSONDERZOEK - KB

34

BIJL AG E 2 : DISC US SIE BIJ E EN K OM S TE N S TA K EH OL DE RS

Op 13 en 14 maart zijn er discussiebijeenkomsten georganiseerd met een groep van institutionele belanghebbenden. Doel van deze bijeenkomsten was gezamenlijk bepalen van de doelgroepen in het kader van de doelgroepenanalyse. Uitgangspunt voor de discussie waren de opgestelde gebruiksscenario’s. De deelnemers konden zich vinden in deze scenario’s, maar gaven wel aan deze niet te strikt te hanteren. Ze dienen enkel als leidraad voor doelgroepbepaling. Een aantal algemene conclusies uit beide sessies:

Hoewel de aanname dat onderzoekers de belangrijkste gebruikers zijn is methodologisch niet helemaal correct is, ligt het toch voor de hand deze groep als belangrijkste gebruikers van een webarchief te zien;

Het .nl-domein bevat ruim 1,5 miljoen websites. Wat is het nut van een selectie van 1000-3000 websites? Dat is 0.06% tot 0.18%. de vraag is of het vel nuttiger is om het volledige domein .nl te archiveren. Dit is echter onmogelijk op de wijze waarop de KB dit wil doen, websites zo diep en gedetailleerd mogelijk binnenhalen om ze vervolgens duurzaam te bewaren voor toekomstig onderzoek;

Het zou zeer nuttig zijn om een typologie te hebben van onderzoeksvragen. De vraag is echter hoe we deze opstellen en wie daar de verantwoordelijkheid voor op zich neemt;

We moeten ons realiseren dat de gebruiksscenario’s een handig hulpmiddel zijn, maar niet meer dan dat. Ze helpen ons bij het benoemen van concrete gebruikers en concreet gebruik. Dit is geen probleem zolang we de scenario’s niet als keurslijf zien en we ons realiseren dat een onderzoeker meerdere en verschillende zoekvragen en zoekmethoden hanteert. De ene keer zal hij in de breedte zoeken en de andere keer in de diepte, afhankelijk van zijn onderzoeksvraag;

Wanneer we uitgaan van een selectie aanpak, en dat gaan we, is men het erover eens dat het logisch is dat selectie start bij het collectiebeleid van de KB. Vervolgens zal deze aangevuld moeten worden door vakinhoudelijke specialisten/kennisinstellingen die ieder op hun gebied een bijdrage kunnen leveren;

Deze kennisinstellingen kunnen gezien worden als stakeholders/belanghebbenden en zullen hun eigen rol in het proces hebben gebaseerd op hun eigen kennisniveau en (technische) capaciteit;

Over de wijze waarop een dergelijke samenwerking vorm gegeven kan worden zijn verschillende suggesties gedaan; een gebruikersraad, een redactieraad, correspondenten of een publiekspanel;

Samenwerking kan kostenreductie opleveren op termijn; KB kan een doorverwijsfunctie hebben en daarmee doorverwijzen naar andere

webcollecties zoals de short title catalogus of de KB kan fungeren als Nationaal informatiecentrum voor webarchivering;

Onderzocht moet worden of het mogelijk is om een inventarisatie uit te voeren van webarchiveringsinitiatieven, en potentiële webarchiveringsinitiatieven in Nederland.

Deelnemers aan de discussiebijeenkomsten

Rol Naam Instelling Dinsdag 13 maart Jurist Annemarie Beunen UL Archief Peter van Wijngaarden GAR overkoepelend Marco de Niet DEN AV Irma van Kampen NIBG KB Klankbord Repke de Vries KB KB Klankbord Henk Voorbij KB

Page 35: GEBRUIKERSONDERZOEK - KB

35

Woensdag 14 maart Historicus Charles van den Heuvel VKS Historicus Gerrit Voerman Archipol Taalkundige Katrien Dupuyts INL KB Klankbord Peter Wijnmaalen KB KB Projectteam Peter de Bode KB

Page 36: GEBRUIKERSONDERZOEK - KB

36

BIJL AG E 3 : E- M AIL A A N A ND ER E W E BA RC HI E VE N

Dear …,

In 2006 the National Library of The Netherlands (KB) started a web archiving project in order to archive a selection of the Dutch web. In the past year we made a lot of progress and managed to set up a harvest process. As digital preservation is the main goal of the web archiving process within the KB, setting up an ingest process to store websites in our long-term preservation system, the e-Depot, is the main concern of the KB. Research on this topic is ongoing within the project.

We also started with some preliminary research into the future users our web archive will have. This is carried out by a trainee, Sara van Bussel.

As part of this research we are contacting other web archives who have been running for a while, to find out what they know about their users.

We were wondering if you have any information about the users of your web archive, and if you are willing to share that information with us to help us in our research.

Of course all data collected will be treated with confidentiality, and all results of the research will be shared with you.

Kind regards,

Page 37: GEBRUIKERSONDERZOEK - KB

37

BIJL A GE 3 : G EB RUI KS SC E NA RI O’S

De gebruiksscenario’s die hieronder beschreven zijn gaan uit van het webarchief van de Koninklijke Bibliotheek. Dit web archief zal een selectie van Nederlandse websites bevatten die toegankelijk zullen zijn via zoekmachines. Deze websites zullen volledig gearchiveerd zijn, met een frequentie die tussen iedere drie maanden en een maal per jaar zal liggen. Vergelijkbare webarchieven zijn Pandora (http://pandora.nla.gov.au/index.html) van de Australische nationale bibliotheek en het Internet Archive (http://www.archive.org/web/web.php). Per gebruiksscenario is aangegeven welke doelgroep het betreft en waar zij het webarchief voor kunnen gebruiken. Bij enkele gebruiksscenario’s is een voorbeeld uit een nieuwsbericht gegeven. Onderzoeker Wie: Onderzoeker/Student Wat:

De websites van vandaag de dag zijn flitsend en bieden de gebruiker veel verschillende persoonlijke mogelijkheden. Echter, zo waren de websites niet altijd. Door middel van een vergelijking van websites maakt een student een analyse van trends binnen webdesign, lettende op functionaliteiten en uiterlijk.

Benodigdheden:

• Jaarlijkse archivering • Zoeken via Wayback Machine • Selectie breed (persoonlijk/officieel/erfgoed/online verkopers)

Wordt deze functie al ergens anders aangeboden:

Gedeeltelijk, buitenlandse websites worden soms (per land verschillend) zeer compleet gearchiveerd (zie Pandora, Our digital island). Voor Nederlandse websites is dit echter nog niet zo.

Wie:

Onderzoeker Wat:

Een onderzoeker leest een onderzoeksverslag van een collega en zou graag de geciteerde bronnen terugvinden zodat hij ze kan controleren en eventueel gebruiken voor verdere studie. Echter, de gebruikte website blijkt niet meer te bestaan. In het webarchief is de website nog wel terug te vinden en het citaat is te controleren.

Benodigdheden:

• Jaarlijkse archivering • Zoeken via Wayback Machine • Selectie breed (persoonlijk/officieel/erfgoed/weblog)

Wordt deze functie al ergens anders aangeboden:

Page 38: GEBRUIKERSONDERZOEK - KB

38

Gedeeltelijk, via het Internet Archive. Echter, de archivering hier is niet geheel betrouwbaar en betreft niet de hele website, hierdoor is de kans groot dat de benodigde bron niet gearchiveerd wordt.

Voorbeeld uit de praktijk:

Diomidis Spinellis, The decay and failure of web reference (http://www.spinellis.gr/pubs/jrnl/2003-CACM-URLcite/html/urlcite.html)

Wie:

Onderzoeker (Socioloog) Wat:

Een socioloog wil onderzoek doen naar jeugdcultuur op internet. Naast bestaande huidige websites wil hij ook ‘oude’ websites onderzoeken om een vergelijking te kunnen maken tussen toen en nu.

Benodigdheden:

• Jaarlijkse archivering • Zoeken via Wayback Machine en volledige tekst • Selectie persoonlijk/weblog

Wordt deze functie al ergens anders aangeboden:

Gedeeltelijk, via het Internet Archive. Echter, de archivering gaat hierbij waarschijnlijk niet diep genoeg, en dit archief is niet op tekst doorzoekbaar.

Wie:

Onderzoeker (Historicus) Wat:

Een historicus doet onderzoek naar de effecten van de aanslagen van 11 september in de VS op erfgoed instellingen in Nederland. Hij gaat er van uit dat er niet alleen meer beveiliging is ingesteld maar ook dat bepaalde gevoelige tentoonstellingen die gepland stonden zijn afgelast. Met een vergelijking van de websites van voor en na de aanslagen heeft hij een idee van de geldigheid van zijn aanname.

Benodigdheden:

• Half jaarlijkse archiveirng • Zoeken via Wayback Machine • Selectie erfgoedwebsites

Wordt deze functie al ergens anders aangeboden:

Gedeeltelijk, via Internet Archive. Echter, de archivering is niet diep genoeg en de erfgoed websites zijn vaak erg afhankelijk van illustraties en Flash.

Wie:

Onderzoeker (Taalkundige (INL)) Wat:

De Taalkundigen van het INL doen onderzoek naar de Nederlandse taal. Hier gebruiken ze onder andere corpora voor, grote verzamelingen teksten. Uit het webarchief wordt

Page 39: GEBRUIKERSONDERZOEK - KB

39

een selectie gemaakt. Op deze web-corpus worden de research tools van het INL losgelaten.

Benodigdheden:

• Jaarlijkse archivering • Zoeken is niet nodig • Selectie Nederlandse websites • Subset moet geleverd worden

Wordt deze functie al ergens anders aangeboden: Nee Journalist Wie:

Journalist Wat:

Er gaan geruchten dat de politieke partij PBB steun heeft gegeven aan extremistische activisten via een open brief aan de eigenaar van een website van deze activisten. Deze persoon had, zo gaat het gerucht, deze brief gepubliceerd op haar pagina. Echter, deze steunbetuiging is niet te zien op het moment dat de journalist J. Jansen hiernaar op zoek gaat. Binnen het web archief zoekt de journalist via de Wayback Machine naar eerdere versies van de website. Hij vindt een gearchiveerde versie van de website, inclusief de brief, en kan nu een artikel schrijven.

Benodigdheden:

• Maandelijkse/wekelijkse archivering • Zoeken via Wayback Machine is voldoende • Selectie weblogs/persoonlijke websites/forums

Wordt deze functie al ergens anders aangeboden:

Ja, het Internet Archive archiveert ook Nederlandse websites die doorzoekbaar zijn op URL.

Wie:

Journalist Wat:

Voor een overzicht getiteld “21ste eeuw, de eerste vijf jaar” maakt een journalist een overzicht over 2005. Een onderdeel hiervan is het leven online, waarbij beschreven wordt wat er op het internet is gebeurd in 2005. Hiervoor bekijkt de journalist archieven van websites zelf, maar ook het internet archief.

Benodigdheden: • Maandelijkse archivering • Zoeken via Wayback Machine (met tijdlijn!) • Selectie weblog/persoonlijke websites/forums/nieuwssites/overheid/erfgoed

Wordt deze functie al ergens anders aangeboden:

Page 40: GEBRUIKERSONDERZOEK - KB

40

Gedeeltelijk. Het Internet Archive biedt de benodigde toegang en archiveert ook dit soort websites, echter de frequentie van archivering ligt daarvoor te laag.

Jurist Wie: Jurist Wat:

Jansen B.V. komt er achter dat een oud-werknemer foutieve en schadelijke informatie over Jansen B.V. op zijn website publiceert. Bij de voorbereiding van een klacht wegens laster blijkt dat de informatie van de website is verwijderd. Echter, Jansen B.V. wil de klacht toch indienen vanwege de geleden schade door de informatie. De advocaat van Jansen B.V. zoekt de website op in het web archief en vindt zo de exacte tekst waartegen een klacht wordt ingediend.

Benodigdheden: • Maandelijkse archivering • Zoeken via Wayback Machine is voldoende • Selectie weblogs/persoonlijke websites

Wordt deze functie al ergens anders aangeboden:

Ja, het Internet Archive archiveert ook Nederlandse websites die doorzoekbaar zijn op URL.

Wie: Jurist/Openbaar Ministerie Wat:

Erik J. wordt aangehouden wegens het aanbieden van medicijnen zonder recept op het internet. Omdat zijn handel alleen via zijn website verloopt wordt de website als bewijs gebruikt in het proces tegen Erik J. Via het webarchief is te achterhalen wanneer de website beschikbaar was op het internet. Ook vindt men berichten op andere websites waarin Erik J. reclame maakt voor de medicijnen.

Benodigdheden:

• Half jaarlijkse archivering • Zoeken via Wayback Machine is voldoende voor de website van Erik J. De berichten

worden gevonden na een volledige tekst zoekopdracht (WERA/NutchWax) • Selectie weblogs/persoonlijke websites/forums/online verkopers.

Wordt deze functie al ergens anders aangeboden:

Gedeeltelijk. Halfjaarlijkse archivering toegankelijk via de Wayback Machine is beschikbaar via Internet Archive, maar in de volledige tekst zoeken is hierbij niet mogelijk.

Voorbeeld uit de praktijk:

Webwereld: Duitser opgepakt na online verkoop zelfmoordpillen http://www.webwereld.nl/articles/44218/duitser-opgepakt-na-online-verkoop-zelfmoordpillen.html

Page 41: GEBRUIKERSONDERZOEK - KB

41

Wie: Jurist (Octrooigemachtigde) Wat:

De octrooigemachtigde wordt benaderd door J. Jansen die een uitvinding heeft gedaan. Hij zegt hier nog niet over gepubliceerd te hebben. Om de haalbaarheid van de octrooiaanvraag te toetsen bezoekt de octrooigemachtigde het webarchief waar hij niet alleen een mededeling over de uitvinding vindt op de website van J. Jansen, maar ook een vrijwel identieke uitvinding op de website van een opgeheven bedrijf.

Benodigdheden

• Half jaarlijkse archivering • Zoeken via Wayback Machine voor de website van J. Jansen. Eerde uitvindingen worden

gevonden via de volledige tekst zoekmogelijkheden van WERA/NutchWax • Selectie persoonlijke websites/bedrijven

Wordt deze functie al ergens anders aangeboden:

Gedeeltelijk. Halfjaarlijkse archivering toegankelijk via de Wayback Machine is beschikbaar via Internet Archive, maar in de volledige tekst zoeken is hierbij niet mogelijk.

Consument Wie: Consument/Jurist Wat:

Een consument besteld op het internet een artikel. Bij levering blijkt dit artikel niet het juiste artikel te zijn. De consument stuurt het artikel terug, in de veronderstelling dat deze zijn geld terug krijgt. Echter, met een verwijzing naar de algemene voorwaarden (AV) op de website weigert de webwinkel restitutie van het volledige bedrag. De consument meent echter voor de koop in de AV gelezen te hebben dat als hij zijn bestelling binnen zeven werkdagen terugstuurt hij teruggave van het volledige aankoopbedrag krijgt. De AV zijn dus blijkbaar in de tussentijd verandert. In het webarchief zoekt de consument de oude AV op, en wat blijkt, hij heeft gelijk.

Benodigdheden:

• Half-jaarlijkse archivering • Zoeken via Wayback Machine • Selectie online verkopers

Wordt deze functie al ergens anders aangeboden:

Gedeeltelijk, websites als Wehkamp en Otto zijn beperkt via Internet Archive toegankelijk, inclusief de Algemene Voorwaarden.

Voorbeeld uit de praktijk: Webwereld: “Algemene voorwaarden Otto niet van toepassing”

http://www.webwereld.nl/articles/43564/ictrecht

Page 42: GEBRUIKERSONDERZOEK - KB

42

Overige doelgroepen Wie: Schrijver Wat:

Een schrijver komt erachter dat zijn teksten integraal op het internet worden gepubliceerd op websites anders dan de zijne zonder zijn toestemming. Na onderzoek blijkt dat de website die hij nu gevonden heeft niet de enige website is die teksten had overgenomen. Graag wil hij weten welke websites vroeger teksten overnamen, en deze nu verwijderd hebben.

Benodigdheden:

• Half jaarlijkse archivering • Zoeken in de volledige tekst (WERA/NutchWax) • Selectie weblogs/persoonlijke websites

Wordt deze functie al ergens anders aangeboden: Nee, Nederlandse websites worden nog niet volledig gearchiveerd en toegankelijk gemaakt via een volledige tekst zoekmachine

Wie: Webdesigner Wat:

De webdesigner S. de Jong krijgt de opdracht een opzet te maken voor de website van een bedrijf. Om ervoor te zorgen dat de identiteit van het bedrijf in de website bewaard blijft kijkt hij in het webarchief naar eerdere versies van de websites. Hij baseert zijn ontwerp op de basis van de eerdere websites.

Benodigdheden

• Jaarlijkse archivering • Zoeken via Wayback Machine • Selectie bedrijven • Hoogwaardige archivering (inclusief illustraties)

Wordt deze functie al ergens anders aangeboden:

Nee, hoogwaardige archivering van Nederlandse websites wordt nog niet uitgevoerd (op enkele grote bedrijven na, deze zijn te vinden in het Internet Archive)

Wie: Genealoog Wat:

De genealoog W. Steen gebruikt regelmatig een website van een ver familielid van hem. Op deze website staat veel informatie over de historie van de familie Steen. Als de heer Steen op een dag de website op nieuw wil oproepen blijkt deze niet gevonden kunnen worden. Na een tijd blijkt de website verdwenen te zijn. In het web archief zoekt de heer Steen de betreffende website op en slaat de informatie van de website op.

Benodigdheden

• Half jaarlijkse archivering

Page 43: GEBRUIKERSONDERZOEK - KB

43

• Zoeken via de Wayback Machine • Selectie persoonlijke websites

Wordt deze functie al ergens anders aangeboden:

Gedeeltelijk. In het Internet Archive zijn persoonlijke websites terug te vinden via de Wayback Machine, alleen de archivering loopt erg achter, zeker bij persoonlijke websites.

Wie: Cultureel geïnteresseerde Wat:

De kantoormedewerker Julia is erg geïnteresseerd in de muziek van eind jaren ’90. Ze weet dat verschillende bandjes begonnen zijn met zichzelf promoten via een eigen website, dus ze zoekt graag in het webarchief naar deze bijzondere verdwenen websites.

Benodigdheden

• Half jaarlijkse archivering • Zoeken via WERA/NutchWax/Wayback Machine • Selectie culturele websites

Wordt deze functie al ergens anders aangeboden:

Gedeeltelijk. Als men de URL weet kan men deze websites eventueel terugvinden in het Internet Archive.

Wie: Beheerder webarchief Wat:

Om er voor te zorgen dat het webarchief een goede collectie blijft moeten de medewerkers die aan het archief werken het archief ook gebruiken. Er wordt bijvoorbeeld gekeken of de frequentie van archivering de juiste is, of de selectie dekkend is en of de archivering goed gaat (werken links, plaatjes etc.)

Benodigdheden

• Geen eisen aan frequentie, zoeken of selectie Wordt deze functie al ergens anders aangeboden: Nee, want het gaat hier om het beheer en behoud van het eigen archief.

Page 44: GEBRUIKERSONDERZOEK - KB

44

BIJL AG E 4 : V RA G EN OB SE R VA TIE

Ervaring met internet en webarchieven

1. Waar maakt u gebruik van het internet? a. Privé b. School c. Werk

2. Hoe vaak maakt u gebruik van het internet?

a. 1 – 2 maal per week b. 3 – 4 maal per week c. Iedere dag

3. Hoe lang maakt u per keer gebruik van het internet?

a. Één uur per keer b. Enkele uren per keer c. De hele dag met momenten

4. Waarvoor gebruikt u het internet?

a. Het opzoeken van informatie b. E-mailen c. Chatten d. Eigen weblog/website bijhouden e. Entertainment (filmpjes kijken, weblogs lezen, nieuws lezen) f. Administratief (bankzaken, bibliotheek enz.)

5. Wist u van het bestaan van web archieven?

a. Ja b. Nee

6. Hebt u wel eens een web archief bezocht?

a. Ja (welke dan) b. Nee

7. Wat hebt u opgezocht in het webarchief/wat voor informatie zocht u?

8. Hebt u nog op- of aanmerkingen op uw eerdere bezoek aan het webarchief (was er iets

wat u miste, iets wat u juist erg beviel?)

Opdrachten tijdens de test

1. Op de voorpagina van www.kb.nl staat nu het Gruuthuse handschrift als focus punt. Wat stond op 20 februari 2007 op de website?

2. De websites van de dubbelde palmboom en tno heeft een compleet nieuw uiterlijk gekregen sinds maart 2007. Beide versies van de websites zijn te vinden in ons web archief, kunt u deze opzoeken?

3. Zou u in het webarchief een foto van Maxima kunnen vinden?

4. Zou u in het webarchief een pdf document kunnen vinden met in de bestandsnaam “nieuwe woorden”?

Page 45: GEBRUIKERSONDERZOEK - KB

45

5. Zou u binnen het webarchief, binnen de website van de KB, informatie kunnen vinden over webarchivering en er hierbij voor zorgen dat u alleen resultaten van de KB website te zien krijgt?

6. Stel, het is 2017, en u wilt een stuk schrijven over de PvdA in aanloop naar de provinciale staten verkiezingen van maart 2007. Hoe zou u dan in het webarchief informatie zoeken?

7. Zou u naar de website willen gaan van het Internet Archive, en hier een voor u interessante website kunnen opzoeken? Wilt u hierbij uw ervaringen met het KB webarchief vergelijken met de ervaringen met het Internet Archive?

Nagesprek

Observatie

1. Wat vond u er van?

2. Zijn er problemen waar u tegen aan bent gelopen?

3. Zijn er mogelijkheden die u miste?

4. Waren er dingen onduidelijk?

5. Heeft u ideeën hoe het beter kan?

Webarchief

1. Denkt u dat u een webarchief in de toekomst gaat gebruiken.

2. Als dit webarchief er zou zijn, wat zou u er dan graag in vinden (wat voor soort websites?)

3. Als dit webarchief alleen in de Koninklijke bibliotheek toegankelijk zou zijn, zou u het dan gebruiken?

4. Als dit webarchief op het internet toegankelijk zou zijn met een KB jaarpas, zou u het dan gebruiken?

5. Als dit webarchief op het internet toegankelijk zou zijn na registratie van uw naam en e-mail adres, zou u het dan gebruiken?

6. Als dit webarchief vrij op internet toegankelijk zou zijn, zou u het dan gebruiken?

Gebruikerswensen

Gebruikerswens Vereist (V), Wenselijk (W), Mogelijk (M), Niet-nodig (N)

1 Presentatie van gearchiveerde website moet in de browser exact worden gepresenteerd als de originele website

2 Er moet in de presentatie een duidelijk onderscheid zijn tussen de live website en de gearchiveerde versie

Page 46: GEBRUIKERSONDERZOEK - KB

46

3 Metadata met betrekking tot de betreffende gearchiveerde website beschikbaar op iedere pagina gepresenteerd in het archief

4 Metadata met betrekking tot de betreffende website oproepbaar wanneer gewenst

5 Gegevens met betrekking tot wijzigingen in een betreffende website beschikbaar

6 De mogelijkheid om verschillende gearchiveerde versie van een betreffende website te kunnen vergelijken, waarbij wijzigingen gemarkeerd zijn

7 Informatie met betrekking tot de reden waarom de betreffende website gearchiveerd is beschikbaar

8 Informatie met betrekking tot de collectie waartoe de betreffende website behoort beschikbaar

9 Zoeken op url

10 Zoeken via bibliotheek catalogus

11 Volledige tekst zoekfunctionaliteit

12 Zoeken op trefwoorden

13 Browsen door de collectie op basis van vooraf vastgestelde categorieën

14 Zoeken via een alfabetische lijst van websites in het archief

15 Booleaans zoeken

16 Zoeken binnen een specifieke website

17 Zoeken op specifieke bestandstypen

18 Mogelijkheid om opnieuw te zoeken met behoud van vorige zoekresultaat

19 Aanwezigheid van een eenvoudige zoekfunctie en een geavanceerde zoekfunctie (onafhankelijk van hoe deze uitgevoerd zijn)

20 Gegevens met betrekking tot de frequentie van harvesten van de betreffende website

21 Mogelijkheid om annotaties toe te voegen aan de gearchiveerde website

22 Semantische zoekfunctionaliteit waarbij varianten en aanverwanten van een zoekvraag weergegeven worden

23 Weergeven van de wijze van toegang bij de verschillende zoekresultaten (vrij toegankelijk of alleen in de leeszaal van de bibliotheek)

24 De mogelijkheid om zelf collecties aan te leggen op basis van zoekresultaten

25 De mogelijkheid om zelf websites of een collectie van websites te nomineren ter archivering

26 Zoekresultaten worden weergegeven in een logische hiërarchie (bv. Homepage bovenaan de lijst, gevolgd door onderliggende pagina’s)

27 Hiërarchie van zoekresultaten wordt grafisch weergegeven (bv met behulp van iconen)

28 Mogelijk om zelf de hiërarchie van de zoekresultaten aan te passen

29 Integratie van een webarchief in geheel van bibliotheek collectie. Dit biedt de

Page 47: GEBRUIKERSONDERZOEK - KB

47

mogelijkheid om over alle collectie, inclusief het webarchief, te zoeken 30 De mogelijkheid om verschillende diensten aan te bieden op het webarchief

31 In het geval een zoekvraag geen of slechts weinig resultaten oplevert worden er andere opties gegeven (probeert u eens te zoeken op ..) en/of de reden waarom de betreffende zoekvraag geen resultaten opgeleverd heeft

32 Het geven van zoektips op de zoekpagina

Hebt u nog vragen of opmerkingen?

Page 48: GEBRUIKERSONDERZOEK - KB

48

BIJL AG E 5 : R ES U L TA TE N G E B RUIK ER SW E NS E N

Requirement Totaal Zoeken op url 55 Full text zoekfunctionaliteit 55 Er moet in de presentatie een duidelijk onderscheid zijn tussen de live website en de

gearchiveerde versie 52 Zoeken binnen een specifieke website 49 Presentatie van gearchiveerde website moet in de browser exact worden gepresenteerd

als de originele website 45 Weergeven van de wijze van toegang bij de verschillende zoekresultaten (vrij

toegankelijk of alleen in de leeszaal van de bibliotheek) 45 Zoeken via bibliotheek catalogus 43 Zoeken op trefwoorden 43 Aanwezigheid van een eenvoudige zoekfunctie en een geavanceerde zoekfunctie

(onafhankelijk van hoe deze uitgevoerd zijn) 43 Metadata met betrekking tot de betreffende website oproepbaar wanneer gewenst 41 Zoeken op specifieke bestandstypen 41 Integratie van een webarchief in geheel van bibliotheek collectie. Dit biedt de

mogelijkheid om over alle collectie, inclusief het webarchief, te zoeken 41 Gegevens met betrekking tot wijzigingen in een betreffende website beschikbaar 40 Boleaans zoeken 38 Zoekresultaten worden weergegeven in een logische hiërarchie (bv. Homepage

bovenaan de lijst, gevolgd door onderliggende pagina’s) 38 Het geven van zoektips op de zoekpagina 37 Metadata met betrekking tot de betreffende gearchiveerde website beschikbaar op

iedere pagina gepresenteerd in het archief 36 Mogelijkheid om opnieuw te zoeken met behoud van vorige zoekresultaat 36 Gegevens met betrekking tot de frequentie van harvesten van de betreffende website 35 De mogelijkheid om zelf websites of een collectie van websites te nomineren ter

archivering 35 In het geval een zoekvraag geen of slechts weinig resultaten oplevert worden er andere

opties gegeven (probeert u eens te zoeken op ..) en/of de reden waarom de betreffende zoekvraag geen resultaten opgeleverd heeft 35

De mogelijkheid om verschillende diensten aan te bieden op het webarchief 34 Informatie met betrekking tot de reden waarom de betreffende website gearchiveerd is

beschikbaar 32 Informatie met betrekking tot de collectie waartoe de betreffende website behoort

beschikbaar 30 De mogelijkheid om verschillende gearchiveerde versie van een betreffende website te

kunnen vergelijken, waarbij wijzigingen gemarkeerd zijn 28 Browsen door de collectie op basis van vooraf vastgestelde categorieën 28 Semantische zoekfunctionaliteit waarbij varianten en aanverwanten van een zoekvraag

weergegeven worden 27 Zoeken via een alfabetische lijst van websites in het archief 24 De mogelijkheid om zelf collecties aan te leggen op basis van zoekresultaten 23 Hiërarchie van zoekresultaten wordt grafisch weergegeven (bv met behulp van iconen) 21 Mogelijk om zelf de hiërarchie van de zoekresultaten aan te passen 21 Mogelijkheid om annotaties toe te voegen aan de gearchiveerde website 18