een systeem voor het - Amsterdam...In Amsterdam wordt de prijs van reproducties jaarlijks...
Transcript of een systeem voor het - Amsterdam...In Amsterdam wordt de prijs van reproducties jaarlijks...
De Archiefbank
een systeem voor het
Raadplegen en downloaden van archiefbronnen via het web
Projectvoorstel Gemeentearchief Amsterdam
Februari 2005
Inhoudsopgave Pagina
1. Inleiding 1
2. Doelstelling en opdracht 3
3. Standaardproducten 4
4. Maatwerkprocedure 7
5. Archiefbank 8
6. Projectorganisatie 11
7. Planning 12
8. Bijlagen 14
1. Inleiding
Doel van dit project is het bouwen van een Archiefbank, een systeem voor het raadplegen en downloaden van
archiefbronnen via het web. Het besluit dit systeem te gaan ontwikkelen past in het in 1999 in het
Gemeentearchief (GAA) ingezette traject Vernieuwing van de Ontsluitingssystemen van de Archieven en
Collecties. Een aantal belangrijke keuzes binnen het Archiefbankproject zijn gebaseerd op de in dit traject
opgedane ervaring. Daarom in deze inleiding een schets van het verloop van dit traject in de afgelopen jaren.
In 1999 heeft het Gemeentearchief Amsterdam besloten over te schakelen van analoge naar digitale
ontsluitingssystemen. Het eerste project in dit kader was de bouw van een website, destijds onze ‘digitale balie’
genoemd, met als belangrijke onderdelen daarvan de eerste, functioneel nog eenvoudige en volkomen
gescheiden, systemen om te zoeken door metadata: het Overzicht Archieven en Collecties en de
Bibliotheekcatalogus. Januari 2000 was de website online.
De volgende stap die het Gemeentearchief wilde zetten betrof de ontwikkeling van een zoeksysteem door de
archiefinventarissen. Ambitie was niet alleen de bestaande inventarissen ‘letterlijk’ over te zetten naar de
webomgeving, maar er ook nieuwe zoekingangen op persoon, onderwerp en topografie aan toe te voegen, de
zogenaamde ‘www-formule’: Wie-Wat-Waar. Omdat dit een omvangrijk en binnen de archiefwereld nieuw project
betrof is in 2001 eerst een vooronderzoek gestart in het project Domes. Tijdens dit project is het concept
uitgewerkt voor de totale opzet en integratie van de systemen voor zoeken, raadplegen en leveren van
documenten uit de Archieven en Collecties. Dit concept vormt nog steeds het uitgangspunt voor de verdere
stappen in het traject Vernieuwing ontsluitingssystemen.
Uitgangspunt voor het concept is een wat ontsluitingsniveau betreft uit drie niveau’s opgebouwd, samenhangend
geheel van systemen dat in modules wordt gerealiseerd. De drie ontsluitingsniveau’s die in de archiefwereld
algemeen onderscheiden worden zijn: macro, meso en micro. Het macroniveau is het hoogste niveau en bevat de
gegevens op niveau van archieven en collecties; het mesoniveau bevat de gegevens op het niveau van de
materiële eenheid en het microniveau, het laagste niveau, bevat gegevens op het niveau van de informatie
bínnen een materiële eenheid. Centraal binnen dit samenhangend geheel van systemen staat het zogenaamde
www-portal. Dat is een zoekportal op Wie (personen), Wat (onderwerpen) en Waar (topografie). Inmiddels is de
keuze voor het zoeken op WWW een vaker gebruikt uitgangspunt op het web.
Bouwen van het gewenste zoeksysteem op mesoniveau door de archiefinventarissen in aansluiting op het
vooronderzoek Domes bleek niet mogelijk omdat de ontwikkeling van een intern systeem voor beheer en
ontsluiting prioriteit verdiende; één intern systeem was een voorwaarde voor de integratie van de gegevens over
de archieven en collecties en een voorwaarde voor communicatie met de websystemen. Aanschaf en
implementatie dit systeem, genaamd Scope, is gestart in 2002 en de conversie van data uit de oude digitale en
analoge systemen is inmiddels voor ongeveer tweederde afgerond.
In dezelfde periode is voor het web daarom eerst één van de andere zoeksystemen op mesoniveau gerealiseerd:
de Beeldbank. De Beeldbank is een systeem voor het zoeken, raadplegen en leveren van niet bewegend
beeldmateriaal. Bij de lancering in 2003 omvatte de Beeldbank 30.000 foto’s en 15.000 bouwtekeningen. Binnen
de projectperiode groeide dit aantal uit tot 100.000 afbeeldingen. Begin 2004 is de implementatie van het project
in de lijntaken gestart en sindsdien is het de opzet de Beeldbank jaarlijks te laten groeien met minimaal 50.000
afbeeldingen, waarvan 10 tot 20% nieuwe acquisitie en 30 tot 40% retrospectieve invoer van metadata en
digitalisering van het analoge bronmateriaal. Bij een ongeveer gelijkblijvende acquisitie kan de retrospectieve
invoer en digitalisering over ongeveer 8 jaar afgerond zijn. Deze ambitieuze doelstelling is mede afhankelijk van
externe financiering. In 2004 kon hij worden gehaald en ook de vooruitzichten voor 2005 zijn veelbelovend. Door
webbezoekers wordt de Beeldbank intensief gebruikt. Dagelijks bezoeken nu gemiddeld 2500 personen de GAA-
website. Deze bezoekers bekijken met elkaar gemiddeld 16.000 pagina’s van de Beeldbank per dag. En intussen
maken ook andere beheerders van Amsterdams beeldmateriaal gebruik van de Beeldbank om hun afbeeldingen
te presenteren aan publiek.
Nadat in 2003 de conversie van de grotendeels analoge archiefinventarissen in Scope was afgerond kon worden
begonnen met de bouw van het zoeksysteem voor archieven op mesoniveau voor de website. Dat is in 2004
gereed gekomen en gepresenteerd in november. De vertraging van de bouw was in zoverre voordelig, dat we in
2004 konden profiteren van één van de nieuwste ontwikkelingen in zoektechnologie op het internet waardoor alle
gegevens uit de inventarissen toegankelijk zijn voor de grote internetzoekmachines, en dat betekent in
Nederland vooral toegankelijk voor de robots van Google. Dit heeft geleid tot een grote toename van het aantal
personen dat de inventarissen raadpleegt. Dagelijks worden ongeveer 700 inventarissen op het web geopend en
worden er ongeveer 100 in pdf-formaat gedownload.
Het succes van enerzijds de Beeldbank, een systeem voor zoeken, raadplegen en leveren, gecombineerd met
anderzijds het succes van dit systeem voor het zoeken door de Archiefinventarissen heeft ertoe geleid dat is
besloten binnen de ontwikkeling van het geheel van systemen nu voorrang te geven aan de ontwikkeling van een
systeem voor het raadplegen en leveren van de archiefbronnen. Veel nieuwe bezoekers, die nog onervaren zijn
met onderzoek in archieven, vragen ons ‘waar de knop zit om de stukken nu ook echt te zien’. Omdat het
Gemeentearchief – zoals de meeste instellingen die historisch erfgoed beheren - op zoek is naar nieuwe, jonge
archiefgebruikers willen we graag proberen aan deze wens tegemoet te komen. Daarbij sluit de ontwikkeling van
dit systeem aan op een tendens op internet om producten digitaal en downloadbaar aan te bieden, zoals
bijvoorbeeld het Tiger Online onderdeel op de website van het Rotterdam Filmfestival.
Een eerste voorwaarde voor zo’n systeem van raadpleging en levering van archiefbronnen is dat het uitermate
gebruikersvriendelijk is, zodat het met name ook de nieuwe en onervaren onderzoekers niet afschrikt van
bronnenonderzoek. Een tweede voorwaarde is dat in principe ook alles geleverd moet kunnen worden, ‘nee
verkopen’ werkt niet op het web. Deze tweede voorwaarde, kort samengevat als ‘we kunnen alles leveren wat u
vraagt’ zal een zware opgave zijn. Maar het Gemeentearchief dat het met goed georganiseerde inzet van mensen
en middelen mogelijk moet zijn.
2. Doelstelling en opdracht
Doel van dit project is het bouwen van een Archiefbank, een systeem voor het raadplegen en downloaden van
archiefbronnen via het web. Onder systeem wordt hier verstaan het geheel van functionaliteit, interface, inhoud
en procedures.
In deze paragraaf van dit voorstel wordt toelichting gegeven op deze doelstelling. Enerzijds betreft dat toelichting
op de archiefbronnen, anderzijds toelichting op het raadplegen en downloaden van de producten via het web.
Van archiefbronnen tot producten in de archiefbank
De archiefbronnen waar het om gaat maken deel uit van de archieven die worden beheerd in het
Gemeentearchief Amsterdam. Dat zijn enerzijds archieven die afkomstig zijn van de ‘gemeentelijke’ overheid
vanaf de middeleeuwen tot gisteren, en anderzijds archieven afkomstig van particulieren en instellingen die van
belang zijn voor de geschiedenis van Amsterdam. Het Gemeentearchief beheert in totaal ruim 4500 archieven,
die met elkaar ongeveer 35 kilometer planklengte beslaan. Van deze archieven is 55 % ontsloten voor het
publiek via archiefinventarissen. Een archiefinventaris is een genummerde lijst met beschrijvingen van de
onderdelen van het archief. Een beschrijving noemen we een inventarisnummer.
Deze inventarisnummers zijn zeer divers wat betreft omvang, materiaal en inhoud. Willen we al deze, op diverse
aspecten zeer uiteenlopende, inventarisnummers op een efficiënte wijze beschikbaar stellen via het internet dan
kan dat alleen door het ontwikkelen van (een beperkt aantal) standaardproducten. Deze standaardproducten
moeten tegen lage standaardtarieven geleverd kunnen worden in een procedure van zelfbediening. Vanuit de
inventarisnummers moet de gebruiker na betaling direct kunnen “doorklikken” naar de gedigitaliseerde
archiefbestanden.
Omdat het onmogelijk is de vele miljoen pagina’s die op die 35 kilometer boekenplank worden bewaard binnen
één project te digitaliseren zal er daarnaast een procedure ontwikkeld moeten worden voor het leveren van de
bestanden wanneer die (nog) niet als standaardproduct in de zelfbediening beschikbaar zijn. Deze procedure
hebben we de maatwerkprocedure genoemd ter onderscheiding van de directe levering in een
zelfbedieningsformule. Een klant die een nog niet gedigitaliseerd inventarisnummer wil raadplegen moet via deze
maatwerkprocedure de mogelijkheid geboden worden digitaal een offerte te vragen voor het raadplegen en
downloaden van dat inventarisnummer. Binnen een vastgestelde periode moet hij die offerte ontvangen en na
een eventueel akkoord moet ook, eveneens binnen een vastgestelde termijn, de productie en levering
plaatsvinden.
Archiefbank.amsterdam.nl: zoeken, betalen, raadplegen en downloaden
Om de standaardproducten via de website te kunnen downloaden of offerte te vragen voor een maatwerkproduct
moet een redelijk complexe website gebouwd worden, die voor de klant oogt als niet meer dan ‘een extra knop in
de zoeksystemen’, en waarmee raadplegen van de archiefbestanden via de website plaatsvindt in een logisch
traject. De overgang tussen de verschillende onderdelen van de Archiefbank moet vloeiend en vanzelfsprekend
verlopen. Als het die ogenschijnlijke eenvoud heeft is er namelijk sprake van een publieksvriendelijk systeem. In
de praktijk betekent dit echter het bouwen van een volgende module in ons netwerk van samenhangende
websystemen.
Raadplegen en downloaden van de archiefstukken wordt in deze notitie steeds in één adem genoemd omdat het
in de praktijk van een internetomgeving vrijwel niet te onderscheiden handelingen zijn. Voor de wet zijn het
echter wel onderscheiden handelingen. De archiefwet geeft iedere burger het recht archivalia in openbare
archiefbewaarplaatsen kosteloos te raadplegen, maar voor levering van reproducties stelt de wet dat de klant de
kostprijs in rekening gebracht moet worden. In Amsterdam wordt de prijs van reproducties jaarlijks vastgesteld
in de gemeentelijke legesverordening op basis van de gemeentelijke richtlijnen voor het vaststellen van
legestarieven.
Opdracht
Opdracht voor dit project is:
- de ontwikkeling van standaardproducten voor gebruik door publiek binnen een webomgeving
- onderzoek naar efficiënte opzet van een maatwerkprocedure voor levering van (standaard)producten
- de technische realisatie van een websysteem en daarmee samenhangende procedures
Nadere uitwerking van de problematiek rondom de standaardproducten wordt gegeven in paragraaf 3 van dit
voorstel; toelichting op de maatwerkprocedure in paragraaf 4. De technische aspecten van de bouw van de
Archiefbank ten slotte wordt nader uitgewerkt in paragraaf 5.
3. Standaardproducten
Een belangrijk onderdeel van het project is de realisatie van (een beperkt aantal) standaardproducten waarmee
reproducties van zoveel mogelijk verschillende soorten inventarisnummers via zelfbediening geleverd kunnen
worden.
Inventarisnummer
In principe is een inventarisnummer een materiële bergingseenheid die ter raadpleging aangevraagd kan worden
op de studiezaal. Inventarisnummers zijn zeer divers wat betreft omvang, materiaal en inhoud.
Wat de omvang betreft zijn er duidelijke verschillen tussen de bergingseenheden. Het kan een omslag zijn met
daarin één enkel document, bijvoorbeeld een oorkonde op perkament. Echter, een omslag kan ook een dossier
bevatten dat bestaat uit meerdere pagina’s. Een inventarisnummer kan zelfs een doos of pak zijn met daarin
enkele honderden vellen papier van verschillende formaten. Veel voorkomende materiële eenheden - en dus ook
inventarisnummers - zijn boekbanden en kaartsystemen. Ten slotte zijn er ook nog de, relatief minder vaak
voorkomende, uitzonderlijke materiële eenheden zoals kokers met plattegronden, albums met foto’s en andere
bijzondere vormen van bergingseenheden.
Inventarisnummers zijn ook zeer divers wat betreft het materiaal waar ze uit bestaan. De meerderheid van het
materiaal bestaat uit allerlei kwaliteiten en formaten papier dat is beschreven met verschillende soorten inkt of is
bedrukt in diverse druktechnieken. Daarnaast zijn er documenten van perkament, waarvan sommigen met
uithangende zegels. Dan zijn er nog films en recentelijk zijn ook de eerste digitale archiefbronnen overgedragen.
Ten slotte zijn de inventarisnummers ook wat betreft de inhoud zeer divers. Een inventarisnummer kan
inhoudelijk één onderwerp behandelen maar het kan ook een register zijn met een alfabetische chronologische of
financiële administratie. In het eerste geval wil een klant het gehele inventarisnummer raadplegen en in het
tweede geval wil hij liever niet meer dan één pagina, of een deel daarvan zien.
Een opsomming van de verschillen op het terrein van omvang, materiaal en inhoud geeft het volgende beeld van
verschillen in:
omvang: aantal onderdelen, variërend van 1 pagina tot enkele honderden pagina’s
omvang: formaat van de onderdelen, variërend van kleiner dan A4 tot A0
materiaal (eenheid): los stuk, omslag, rol, boekband, kaartsysteem
materiaal (vorm): charter, lompenpapier, krantenpapier, film, digitaal bestand
materiaal (staat): van zeer kwetsbaar tot goed
materiaal (wijze van productie): handgeschreven, machinaal geschreven, druktechniek
inhoud (wijze van ordening van de informatie): lopende tekst, alfabetische registratie
inhoud (mate van ontsluiting): inventaris, catalogus of depotlijst al dan niet aangevuld met
contemporaine of moderne index op één of meer gegevens
Reproducties
Niet alleen het begrip ‘inventarisnummers’ dekt vele verschillende soorten objecten, ook binnen het begrip
‘reproductie’ kunnen verschillende soorten worden onderscheiden.
De term reproducties wordt hier gebruikt als een koepelbegrip voor de in de Archiefwet (AW 1995, art.14)
omschreven producten: ‘afbeeldingen, afschriften, uittreksels en bewerkingen’. Bij dit project krijgen we in de
eerste plaats te maken met afbeeldingen, oftewel images van de documenten. Maar het systeem moet zodanig
gebouwd worden dat ook levering van transcripties en andere type bestanden mogelijk is. Hierbij zullen we ook
nagaan in hoeverre het haalbaar is om Optical Character Reading (OCR) technieken in te zetten om (vooral
gedrukte) tekstdocumenten doorzoekbaar te maken. En vanzelfsprekend moeten ook ‘reproducties’ van digitaal
gevormde archiefbescheiden geleverd kunnen worden. In dit project nemen we wel de levering van digitaal
gevormde tekstdocumenten mee, maar levering van gegevens uit archiefbescheiden in database bestanden
vermoedelijk nog niet, omdat aan het Gemeentearchief nog geen omvangrijke databases zijn overgedragen.
De verschillende soorten inventarisnummers moeten zodanig worden gereproduceerd dat ze kunnen worden
‘verpakt’ in een beperkt aantal standaardformaten. Daarbij wordt als uitgangspunt genomen een pdf-document
van een zodanige omvang dat het met een pc van gebruikelijke ‘ thuiskwaliteit’ gemakkelijk kan worden
gedownload. Bij omvangrijke dossiers kan de reproductie bestaan uit meer dan één pdf-document. Verwacht mag
worden dat compressietechniek en datatransportfaciliteiten in de toekomst verder zullen ontwikkelen, zodat van
de moederimages te zijner tijd weer nieuwe en kleinere standaardproducten kunnen worden samengesteld.
Standaardproduct
Onder een standaardproduct wordt in deze context dus verstaan een product
- waarvan de klant (ongeveer) weet wat het inhoudt,
- precies weet wat het kost
- en dat hij in zelfbediening kan verkrijgen direct na betaling
Belangrijk bij de ontwikkeling van standaardproducten is dat steeds raadpleging-levering-downloaden door de
gemiddelde klant als uitgangspunt wordt genomen. Het criterium waarop de standaardproducten worden
beoordeeld is de prijs-kwaliteit verhouding bij (grootschalige) productie. Er wordt dus niet gezocht naar de
hoogste kwaliteit van de reproductie, maar naar goede en tóch betaalbare kwaliteit. De compressie van
bestanden bijvoorbeeld zal zodanig hoog zijn dat tekstbestanden weliswaar leesbaar zijn, maar dat structuur van
het materiaal van de drager niet herkenbaar zal zijn. Hiervoor wordt gekozen omdat we daarmee naar schatting
meer dan 95% van onze klanten kunnen bedienen. Gespecialiseerde onderzoekers voor wie bijvoorbeeld de
verkleuring van het papier of de inkt van de handtekening van belang is, zullen op de studiezaal het origineel
moeten komen inzien. Een vergelijking met compressie van muziekbestanden ten behoeve van digitaal
downloaden is hier op zijn plaats.
Dit wil overigens niet zeggen dat we de digitale duurzaamheid uit het oog verliezen. Maar in een periode waarin
de ontwikkelingen in de techniek nog hoog zijn waardoor kwaliteit verbetert en productiekosten dalen, achten wij
het niet verstandig waar het reproducties van originelen betreft, om bij dit type originelen - archiefbronnen - te
kiezen voor de hoogst mogelijke kwaliteit.
Proefbestanden
Om deze standaardproducten te ontwikkelen wil het GAA proeven nemen met een aantal bestanden van enige
omvang met verschillende soorten inventarisnummers:
bestaand uit gelijkvormig, handgeschreven materiaal van kwalitatief goede aard in een middenformaat,
op microniveau ontsloten en gedigitaliseerd (gezinskaarten, marktkaarten, huiszittenhuizen)
bestaand uit vergelijkbaar materiaal waarvan reproductie op film of fiche aanwezig is (kwijtscheldingen,
doopregisters, bevolkingsregister)
bestaand uit vergelijkbaar materiaal maar niet openbaar toegankelijk (sociale dienst)
bestaand uit gelijkvormig, handgeschreven materiaal van kwetsbare aard op een groot formaat,
geconserveerd en op stuksniveau ontsloten (charters)
bestaand uit vergelijkbaar materiaal waarvan transcripties aanwezig zijn (vroedschapsresoluties)
bestaand uit ongelijksoortige documenten wat betreft materiële eenheid, vorm, formaat en wijze van
productie, ontsloten op mesoniveau (concertgebouw / bijenkorf / politiearchief)
bestaand uit vergelijkbaar materiaal waarvan reproductie op film aanwezig is (burgemeestersarchief /
notarieel / holland land company)
bestaand uit digitaal gevormd materiaal in een tekstformaat (collegebesluiten B&W)
bestaand uit een combinatie van analoog (al dan niet gedigitaliseerd) en digitaal gevormd materiaal
(begraafplaatsen)
Het is van belang te kiezen voor omvangrijke bestanden omdat met name de efficiëntie van de inrichting van het
werkproces de belangrijkste factor is voor kostprijsbeheersing. Tot op heden heeft in Nederland een dergelijk
onderzoek waarbij het, ten behoeve van gebruik door klanten, primair gaat om grote hoeveelheden en scherpe
kostenverhoudingen, niet plaatsgevonden. In Amerika en Schotland zijn projecten uitgevoerd waar meer
overeenkomst mee is. Inlezen in literatuur en persoonlijke contacten met de projectleiders daar maken deel uit
van dit project.
4. Maatwerkprocedure
Doelstelling van het project is het creëren van de mogelijkheid alle geïnventariseerde en openbare archivalia via
het web te kunnen aanbieden voor raadpleging en levering binnen afzienbare termijn. Dat betekent dat we een
efficiënte procedure moeten voorbereiden waarbij we kunnen garanderen dat scanning van alle soorten
inventarisnummers op verzoek kan worden uitgevoerd binnen een vastgestelde periode na opdrachtverstrekking
door de klant op basis van een offerte onzerzijds die op in principe per omgaande aan de klant moet kunnen
worden verzonden.
Ontwikkeling van deze procedure kan gedeeltelijk parallel lopen met de proeven voor de standaardproducten.
Dat betreft met name de beoordeling van de te digitaliseren stukken in het offertetraject. Voor het opstellen van
een offerte moeten de stukken beoordeeld worden op inhoudelijke en materiële criteria. Ordening en materiële
staat van de stukken moeten akkoord bevonden worden voordat gedigitaliseerd kan worden. Vervolgens moet
ingeschat worden hoeveel tijd het kost om eventuele gebreken te herstellen en of dat werk is waar uren van
specialisten voor nodig zijn. Als kwetsbare en bijzondere originelen speciale zorg behoeven kan het zijn dat
digitalisering alleen in het archief mag plaats vinden. We gaan er echter van uit dat het grootste deel van de
digitalisering extern zal plaatsvinden. Wanneer externe digitalisering op verzoek eenvoudig kan worden
ingevoegd in een traject van productie van standaardproducten, kan ook de kostprijs voor digitalisering op
verzoek laag blijven. Wanneer een producent een geregeld productieproces heeft lopen waar geen krappe
tijdslimiet aan verbonden is, vormt invoegen van ander, vergelijkbaar materiaal, geen wezenlijke onderbreking
van het proces. Bij een geregeld, bijvoorbeeld wekelijks, transport, levert productie op verzoek zelfs geen extra
transportkosten op. Bij de grootschalige digitalisering ten behoeve van de Beeldbank is eveneens gebleken dat
met name efficiënte werkprocessen van groot belang zijn om de kosten laag te houden.
Binnen het project worden betrokken medewerkers opgeleid en zal worden geoefend gedurende enkele maanden
met proefbestellingen. Daarna zullen ook bestellingen die inderdaad door klanten worden geplaatst in de nieuwe
maatwerkprocedure meegenomen kunnen worden in trajecten van reguliere digitalisering.
Voor het opzetten van een structureel digitaliseringstraject wordt onderzocht of we kunnen samenwerken met
digitalisering van andere (gemeentelijke) klanten om de kostprijs laag te houden. Met onze huidige
digitaliseringspartner voor de beeldbank heeft het Gemeentearchief een vergelijkbare procedure opgezet,
waardoor op digitaliseringsorders voor derden die via het Gemeentearchief worden aangebracht een korting van
10% op de kostprijs is bedongen. Verwerking van orders voor derden in de Beeldbank kan het Gemeentearchief,
na verstrekking van de opdracht en mits materiaal conform afspraak wordt aangeleverd, binnen een maand
realiseren.
5. Archiefbank
De Archiefbank zal een website zijn met drie hoofdfuncties:
Zoeken
Betalen of offerte vragen
Raadplegen en downloaden
De Archiefbank wordt de pendant van de Beeldbank, het systeem voor het zoeken, raadplegen en bestellen van
beeldmateriaal. Zoals de Beeldbank maakt de Archiefbank deel uit van de website van het Gemeentearchief
Amsterdam, maar zal hij ook onder een eigen url te vinden zijn. Centraal in de archiefbank staat het raadplegen
van gedigitaliseerde of digitaal geboren archiefbestanden. Belangrijk verschil met de Beeldbank, en reden
waarom samenvoegen van beide systemen niet mogelijk is, is dat de zoekfuncties in de Beeldbank primair zijn
afgestemd op beeldinhoudelijke elementen en oplossingen biedt voor de problematiek bij het zoeken op deze
elementen, terwijl het in de Archiefbank veel meer gaat om tekstinhoudelijke aspecten. Het traject van vraag
naar antwoord loopt voor de gebruiker anders en vraagt daarom om een geheel andere benadering in het
ontwerp van interface en functies. Zie voor een schematische weergave van de samenhang tussen de systemen
de bijlage, p. 14 en 15.
Functies: Zoeken = relatie met andere systemen op de GAA website
Toegang tot de bestanden in de Archiefbank wordt in eerste instantie gevormd door de inventarisnummers.
Om deze inventarisnummers of onderdelen daarvan te vinden zal gebruik worden gemaakt van – grotendeels al
gerealiseerde! – zoeksystemen, met in de eerste plaats het zoeksysteem voor de archiefinventarissen. In dit
zoeksysteem zijn alle beschikbare inventarisnummers te vinden. Vanaf de inventarisbeschrijving zijn er
verschillende mogelijke scenario’s.
Figuur: koppeling van inventarisnummers naar systemen op de GAA website
Allereerst kunnen er koppelingen zijn gelegd naar afbeeldingen in de Beeldbank. Vanuit een inventarisnummer
worden met een enkele klik de betreffende afbeeldingen in de Beeldbank getoond.
Daarnaast zullen onderdelen van inventarisnummers geraadpleegd kunnen worden via de zoeksystemen op
microniveau, zoals bijvoorbeeld de zoeksystemen op gezinskaarten, marktkaarten, kwijtscheldingen. Deze
microsystemen maken het mogelijk om een reproductie te bestellen van een onderdeel van een
inventarisnummers. Zo zijn er bijvoorbeeld 200 registers met kwijtscheldingen. Ieder register is één
inventarisnummer, maar iemand die onderzoek doet heeft meestal niet meer dan één pagina nodig uit zo’n
register, bijvoorbeeld de pagina met de kwijtschelding van het door de onderzoeker gezochte huis. Maar om die
pagina te kunnen vinden moet je dan wel eerst kunnen zoeken op het juiste adres. Dat kan in het speciaal
daarvoor ontwikkelde zoeksysteem op microniveau. Datzelfde geldt voor kaartsystemen.
Op mesoniveau kan een lade of een doos met kaarten onder één inventarisnummer vallen; op microniveau is dan
ontsluiting aanwezig op bijvoorbeeld naam van persoon of straatnaam.
Zoeksystemen op microniveau zijn er nog slechts een beperkt aantal beschikbaar. Dat aantal zal groeien, maar
omdat het ontsluiten op dit niveau enorm arbeidsintensief is, zal het nog vele jaren duren voordat alle
archiefbescheiden tot op microniveau ontsloten zijn. Tot die tijd zal het in principe mogelijk zijn offerte te vragen
voor reproducties van gehele inventarisnummers.
Figuur: koppeling van inventarisnummers naar de Archiefbank
De koppeling van inventarisnummer naar de archiefbank kent vier varianten. In het meest eenvoudige scenario
worden achter een inventarisnummer direct reproducties geraadpleegd van een omslag of map met 1 of
meerdere losse stukken over een bepaald onderwerp.
Er zijn ook inventarisnummers waar een beperkt aantal namen van personen of straatnamen in voorkomen.
Hiervoor worden geen aparte zoeksystemen op microniveau gebouwd, want in de meeste gevallen gaat het om
vrij eenvoudige, in omvang beperkte en eenduidige indexen. Specifieke zoekfunctionaliteiten zoals die
bijvoorbeeld worden aangeboden in het microsysteem voor de kwijtscheldingen zijn dan niet nodig.
Wanneer de reproducties van inventarisnummers zelf digitale tekstbestanden zijn (digitaal gevormd of via ACR
verkregen), is het in principe mogelijk die ook digitaal doorzoekbaar te maken. Voorlopig wordt binnen dit project
geen nader onderzoek gedaan naar specifieke functionaliteit op dit gebied omdat het project dan erg omvangrijk
en minder goed beheersbaar wordt. We gaan ervan uit dat dit in een vervolgtraject aan de orde komen zal.
Functies: betalen of offerte vragen
Voordat de onderzoeker over kan gaan tot het raadplegen of downloaden van de door hem gevonden
inventarisnummers of onderdelen van inventarisnummers zal hij, wanneer het standaardproducten zijn, direct
kunnen betalen en, wanneer het (nog) geen standaardproducten zijn zal hij offerte kunnen vragen voor levering
via de maatwerkprocedure.
Momenteel levert het Gemeentearchief reproducties (en andere producten) via de webwinkel alleen nadat
betaling via bank of giro is ontvangen. Deze keuze is bij de bouw van de website in 2000 gemaakt omdat de
hoeveelheid leverbare producten nog relatief klein was, de ontwikkeling van diverse internetbetaalsystemen nog
in de kinderschoenen stond, en de bereidheid van de Nederlander om creditcardbetalingen via internet te
verrichten nog niet erg groot was. Inmiddels zijn betaalsystemen verder ontwikkeld en is creditcardbetaling of
betaling via andere digitale mogelijkheden ook in Nederland gemeengoed geworden. Daarom zal bij de
Archiefbank digitale betaling geïntroduceerd worden op de GAA-website.
Functies: raadplegen en downloaden
Nadat de betaling is ontvangen kan de klant de reproducties van de inventarisnummers of onderdelen daarvan
raadplegen en downloaden gedurende een bepaalde periode. De reproducties mogen worden gebruikt voor privé
doeleinden. Voor publicatie zal toestemming van de Gemeentearchivaris moeten worden gevraagd, of
toestemming aan derden wanneer rechten op de archiefstukken bij derden berusten. Indien dit laatste het geval
is, moet het GAA voorafgaand aan plaatsing in de Archiefbank met de rechthebbende een contract hebben
afgesloten waarin is vastgelegd onder welke voorwaarden het GAA de reproducties mag aanbieden via de
Archiefbank.
Functies: schematische weergave
Zie voor een schematische weergave van de verschillende functies de bijlage, p. 16 en 17
Technische omgeving
Omdat het om zeer grote hoeveelheden data zal gaan en een vermoedelijk zeer intensief gebruikte website is het
noodzakelijk dat de technische omgeving daarop is ingesteld. Momenteel kent de website van het GAA een
absoluut minimale downtime en over de performance worden zelden klachten ontvangen. Wanneer door de
Archiefbank een zeer substantiële hoeveelheid data aan de website worden toegevoegd en het dataverkeer zal
verveelvoudigen moet onderzocht worden in hoeverre aanpassingen en uitbreidingen van hardware en
(besturings)software nodig zijn.
Speerpunt: beheersing van structurele kosten
Voor het slagen van dit project is kostenbeheersing van het allergrootste belang. Te gemakkelijk wordt
geaccepteerd dat digitalisering en internet structureel hoge kosten met zich meebrengen. Het GAA is er trots op
er in geslaagd te zijn met name de structurele kosten bij de gehele omschakeling van analoge naar digitale
dienstverlening laag te hebben kunnen houden. Bij de ontwikkeling van de Beeldbank is het mogelijk gebleken de
klanten gratis download- en printversies van lage resolutiebestanden ter beschikking te kunnen stellen voor
particulier gebruik van het materiaal. Gratis ter beschikking stellen van deze producten bleek tot nu goedkoper
dan de organisatie van de betaling van kleine hoeveelheden producten tegen lage tarieven.
Bij de ontwikkeling van het zoeksysteem voor archieven is de kostenbeheersing van het proces een belangrijk
aandachtspunt geweest. De download van omvangrijke archiefinventarissen, en dan spreken we over
gegevensbestanden van verschillende MB’s, is zodanig georganiseerd dat de kosten voor datatransport tot een
minimum beperkt blijven. Dat is bereikt door de applicatie zo in te richten dat het ‘zware werk’ bij de download
wordt uitgevoerd door de computer van de klant en niet door de server van het GAA. Daardoor is het mogelijk
gebleken de pdf’s met archiefinventarissen gratis op de website ter beschikking te stellen.
We veronderstellen nu dat het niet mogelijk zal blijken te zijn ook alle reproducties van inventarisnummers gratis
ter beschikking te stellen. Echter de hoofddoelstelling van het Gemeentearchief: een, op basis van de archieven
en collecties, zo breed mogelijke verspreiding van kennis over Amsterdam en zijn geschiedenis, impliceert dat
een gratis levering vanzelfsprekend onze absolute voorkeur zou hebben.
6. Projectorganisatie
Initiatief voor dit project is genomen door de afdeling Publieksdiensten. Het project maakt deel uit van het
jaarplan 2005 van deze afdeling en wordt uitgevoerd onder verantwoordelijkheid van het hoofd Publieksdiensten,
Ellen Fleurbaay.
Voor de uitvoering van het project is een projectgroep opgericht die bestaat uit:
projectleider (nog aan te trekken, verantwoordelijk voor voortgang project, rapportage en communicatie
binnen GAA en met externe partners)
coördinator digitaliseringsproeven (nog aan te trekken, verantwoordelijk voor uitvoering en
verslaglegging digitaliseringsproeven)
Marc Holtman (senior medewerker PD, verantwoordelijk voor bouw en plaatsing van de Archiefbank en
voor de implementatie van de maatwerkprocedure voor zover uitvoering plaatsvindt binnen afdeling PD)
Aranea Dijkmans (senior medewerker ACB, verantwoordelijk voor de uitvoering van de
digitaliseringsproeven, voor de implementatie van de maatwerkprocedure voor zover uitvoering
plaatsvindt binnen sectie Beheer en voor de opname en het exporteren van de reproducties in en uit het
digitaal depot)
Jan Huizing (medewerker ACB, verantwoordelijk voor standaardisatie van alle ontsluitings- en
koppelingsgegevens, voor import en export van gegevens in de systemen voor beheer en ontsluiting van
Archieven Scope en ABS/Archeion en voor de implementatie van de maatwerkprocedure voor zover
uitvoering plaatsvindt binnen sectie Ontsluiting).
7. Planning
1. Projectvoorbereiding januari – juni 2005
Productie projectplan
Financiering
2. Onderzoeksfase maart – oktober 2005
Onderzoek standaardproducten elders (nationaal/internationaal)
Onderzoek digitale betaalfaciliteiten
Onderzoek maatwerkprocedure
Contacten leggen met partners en leveranciers
Definitie Archiefbank
Selectie proefbestanden
3. Proefdigitalisering t.b.v. standaardproducten april 2005 – maart 2006
Voorbewerking proefbestanden
Productie reproducties
Nabewerking, testen, controle
Verslaglegging
4. Bouw Archiefbank oktober 2005 – oktober 2006
Bouw
Testfase intern en extern
5. Implementatie in lijntaken oktober 2005 – oktober 2006
Implementeren maatwerkprocedure
Rapport digitalisering gehele collectie
Werkwijze en financiering onderhoud Archiefbank
6. Presentatie project oktober 2006*
Feestelijke lancering voor pers en genodigden
Congres voor vakgenoten
Planning kan worden beïnvloed door verhuizing en opening De Bazel
8. Bijlagen
GAA Server
Gebruiker internetArchiefbank: procedures
Offerteaanvragen?
Inventaris-beschrijving
Zoeken doorinventarissen
Raadpleeg dossier
Inventarissen
Dossier is nog nietgedigitaliseerd
Dossier isgedigitaliseerd, geen
index
Dossier isgedigitaliseerd, index(= microontsluiting)
Dossier isgedigitaliseerd, apart
zoeksysteemaanwezig
Situatie 1. Situatie 2. Situatie 3. Situatie 4.
Nee Dossier bestaat uit xpagina's. Kostenbedragen € x,x.
Inzien?
Zoek / blader doorindex(en)
selectie (klik) item inindex
Dossier bestaat uit xpagina's. Kostenbedragen € x,x.
Inzien?
Volg proceduremaatwerk
Start zoeksysteem
Kies wijze vanbetaling
Ontvangst /akkodering betaling
Bericht aangebruiker
Viewerbladeren / printen /
zoomen images
Nee
Nee
Ja
Ja
Betaling
Images in archiefbank
Inzien?
GAA Server
Archiefbank: maatwerkprocedure (dossier is niet gedigitaliseerd)
Offerteaanvragen?
Dossier is nietgedigitaliseerd!
Inventaris-beschrijving
Zoeken doorinventarissen
Raadpleeg dossier
offerte makenen versturen
Ontvangstofferte
Opdrachtbevestigen?
Wacht opbetaling
Nee Ja
Ja
Nee Ja
Betaling
Ja
Dossierklaarmaken
voor scanning
Ontvangstbetaling
Ophalen envervoer doorscanbedrijf
Scanning
Moederimagesop cd-rom
Images
Beheer-systemen
Registratie
Reguliereexports
gegevens
Dossier retour:naar depot
Bericht aangebruiker
Berichtdossieronline
Viewer bladeren /printen / zoomen
images
Moederimagesnaar depot
Gebruiker internet
Export
Inventarissen
Archiefbank GAA intern
scanbedrijf extern