EDepots in het CVAa en het NAi

Post on 05-Jun-2015

1.083 views 1 download

description

EDepots in het CVAa en het NAi Annelies Nevejans, Vlaams Architectuurinstituut en Henk Vanstappen, Nederlands Architectuurinstituut Informatie aan Zee Donderdag 10 september 2009 Kursaal Oostende Zaal Permeke

Transcript of EDepots in het CVAa en het NAi

Een eDepot voor architectuurarchievenEen eDepot voor architectuurarchieven

Centrum Vlaamse Architectuurarchieven CVAaCentrum Vlaamse Architectuurarchieven CVAaVlaams Architectuurinstituut VAiVlaams Architectuurinstituut VAi

- - Nederlands Architectuurinstituut NAiNederlands Architectuurinstituut NAi

Sofie De Caigny/Annelies NevejansSofie De Caigny/Annelies NevejansHenk VanstappenHenk Vanstappen

2

Een eDepot voor architectuurarchieven

• NAio Context : CIS, ArchiVista en digitalisering in NAio Vooronderzoek: archiefpraktijk in bureauso Archiveringsbeleido eDepot testbed

• VAi/CVAao Context: kennis ontwikkeleno Testcase: Jaarboek Architectuur Vlaandereno Fedora Commons als eDepot o Toekomst: standaarden en samenwerking

3

Een eDepot voor het NAi

o Context : CIS, ArchiVista en digitalisering in NAio Vooronderzoek: archiefpraktijk in bureauso Archiveringsbeleido eDepot testbed

4

Nederlands Architectuurinstituut (NAi)

• Archief, Museum, Bibliotheek en Cultureel podium

• Archieven en collecties van Nederlandse architecten van na 1800 bewaren en toegankelijk maken

• Als sectorinstituut voorzien in mogelijkheden voor onderzoek en platform bieden voor discussie

• Zowel het professionele werkveld als het grote publiek informeren, inspireren en stimuleren door middel van tentoonstellingen en publicaties.

5

Collectie Informatie Systeem (CIS)

• Collectieso Bibliotheeko Objecteno Archief

• Authoritieso Personen & organisatieso Projecteno Events

• Procedureso Verwervingo Conservatie/restauratieo Bruikleeno Opslag en verplaatsing

6

Collectie Informatie Systeem (CIS)

7

ArchiVista (2009-2010)

• Toegang op collecties

• Toegang op authorities

• Harvesting externe databases (OAI-PMH)

• User generated content

• Google Maps

• Printing on Demand

• Toegang tot gedigitaliseerde / born digital content

8

CIS - Archivista

9

Digitale objecten in collecties

• Digitaliseringsprojecten (280 Gb/jaar)o Archief Jan Duikero Fotoarchief Tentoonstellingsraado Fotobestellingen

• Born digital (164 Gb/jaar)o Archief Carel Weebero Archief Abel Cahen

Project eDepoto Hoe beheren / Hoe preserveren ?o Hoe koppelen met CIS-metadata ?o Hoe content beschikbaar stellen in ArchiVista ?

10

CIS – ArchiVista - eDepot

11

Vooronderzoek: bureau enquête

• 4 architectenbureaus

• Onderzoek naaro Hard- en softwareomgevingo Intern archiveringsbeleido Problemen bij conversieo Gebruik van standaardeno Ontwikkelingstraject

• Opvragen van digitale projectdossiers

12

Vooronderzoek: resultaten

• Weinig diversiteit in software, hardware en operating systems

• Overgang naar nieuwe omgeving stelde geen problemen

• Overal backup beleid of -maatregelen

• Migratie gebeurt ad hoc, geen beleid (maar ook weinig problemen)

• Overgang naar nieuwe omgeving zelden gedocumenteerd

• Geen beleid voor verversen van dragers

• Authenticiteit is geen issue

• Geen standaarden voor metadata

13

Vooronderzoek: analyse dossiers

• Bevestiging resultaten enquête

• 90 % leesbaar

• Veel derivaten van zelfde bestand

• Bestandsstructuur, namen van folders en files zijn essentiële aanvulling op beperkte metadata

• Output documenten zijn mijlpaaldocumenten

14

Archiveringsbeleid: uitgangspunten

• Algemene doelstelling NAi: ontwerpproces documentereno Intellectuele inhoud prevaleert over functionaliteit

• Aanbod van architecten(bureaus):o Weinig impact op archiefvormingo Uiteenlopende bestandsformaten aangebodeno Problematisch archiveringsbeleid bij archiefvormer

• Beperkte middeleno Geen computer museumo Geen software museumo (Virtuele) emulatie (voorlopig) geen optieo Budget 100.000 – 300.000 euro

15

Archiveringsbeleid: methodes

• Originele bestand wordt steeds bewaard

• Voor elk proprietary format één de jure open formato Intellectuele inhoud bepaalt archiveringsformaato Meerdere archiveringsformaten mogelijk

• Migratiestrategie:o Migratie toepassen op mijlpaaldocumenteno Uitgestelde migratie voor secundaire documenten

• Technology watch

16

Testomgeving: functies

• Virus check

• Log bestandsnaam en –locatie

• Dedupliceren

• Identificeren en valideren o DROIDo Pronom-database

• Migrereno Tools

• Opslago Dspace ?

17

Conclusie: issues

• Proactief overleg met archiefvormer (architect)

• Impact op acquisitiebeleid (data, hardware, software)

• Workflow inpassen in bestaand praktijk

• Selectie noodzakelijk (mijlpaal documenten, formaten)

• Intellectuele inhoud primeert boven look&feel

• Technology watch noodzakelijk (CAD-formaten)

18

Een eDepot voor het VAi

• Context: kennis ontwikkelen

• Testcase: Jaarboek Architectuur Vlaanderen

• Fedora Commons als eDepot-applicatie

• Toekomst: standaarden en samenwerking

19

Centrum Vlaamse Architectuurarchieven (CVAa)

• Het CVAa werd in 2003 onder de koepel van het Vlaams Architectuurinstituut opgericht

• CVAa is een cultureel thema-archief voor architectuurarchieven• Missie van het CVAa: kennis, internationale expertise en best practises

verzamelen, ontwikkelen en verspreiden in Vlaanderen. Doelgroep: archiefinstellingen (cfr. versnipperde bewaring van architectuurarchieven in Vlaanderen)

• CVAa fungeert dus als een expertise- en coördinatiecentrum en bouwt geen eigen collectie architectuurarchieven op

20

vraagstelling m.b.t. eDepot

• De architectuurpraktijk genereert sinds de jaren 1990 zeer veel digitale objecten > een toekomstig archiefbeleid tov architectuur kan niet zonder een visie, kennis over en instrumenten voor een duurzaam digitaal beleid tov architectuurarchieven

• CVAa wil kennis ontwikkelen over archivering van digital born architectuurarchieveno Wat zijn de grootste moeilijkheden die een digitaal depot met zich brengt?o Welke aspecten zijn zeer eigen aan het ontwikkelen van een eDepot voor architectuurarchieven?o Welke technologie en expertise is generiek en komt terug in verschillende sectoren die met

eDepots bezig zijn?o Wat is de rol van CVAa in de archivering van digital born architectuurarchieven?

• Om antwoorden op bovenstaande vragen te kunnen formuleren, én om te vermijden te vervallen in een intensieve studie van andere voorbeelden en studies – ervaring is de beste leerschool – werd beslist een testcase op te starten

21

voorwaarden testcase

o Beperkt budget | beperkte timing (6 maanden)

o eDepot moet aan de OAIS-norm voldoen

o eDepot moet internationale standaarden en protocollen integreren met het oog op het uitwisselen van informatie met andere systemen, o.a. OAI-PMH

o eDepot moet worden gebouwd met bestaande ‘off-the-shelf’ instrumenten die bij voorkeur open source zijn

22

use case: Jaarboek Architectuur Vlaanderen

• Tweejaarlijks boek over hedendaagse architectuur in Vlaanderen, gepubliceerd door het VAi

• Kleine, beheersbare collectie: ca. 350 projecten worden ingezonden bij elke oproep. Daarvan wordt een kleine groep (ca. 10 %) effectief gepubliceerd. Van deze 10% bestaan bijkomende datastromen.

• Samenstelling van een object: elk object bestaat uit een bundel van meervoudige (digital born) datastromen (die in een beperkt aantal formaten wordt aangeleverd) die een logisch geheel vormen

• De collectie is klein maar heeft een hoge culturele waarden aangezien ze een doorsnede is van de hedendaagse architectuurproductie in Vlaanderen

23

use case: Jaarboek Architectuur Vlaanderen

• 750 objecten

• 11800 datastromen

• 50 GB

24

selectie van een systeem voor eDepot

VOORONDERZOEK• Verschillende ‘communities*’, organisaties en instituties ontwikkelen en

onderhouden eDepots om digitale objecten in te bewaren, en zij delen rijke collecties digitale objecten.

• Een al te enge kijk op de specificiteit van materialen en toepassingen heeft geleid tot een enorme variëteit aan parallelle technologieën en heterogene benaderingen bij de ontwikkeling van eDepots.

• In het algemeen blijkt dat de belofte en het potentieel van de bestaande ‘off-the-shelf’ standaarden en uniforme instrumenten die door een ‘community’ worden ontwikkeld, tot nog toe onvoldoende zijn geëxploreerd.

* community: een (open source) software-community brengt gebruikers van die software samen zodat ze verbeteringen, applicaties en ervaringen kunnen uitwisselen

25

DSpace

Fedora

Commons

EPrints

institutional repository system - 2002

MIT Libraries / Hewlett Packard

open source (BSD License) – 305 installaties

repository system - 2003

Cornell University / Univesity of Virginia

open source (Mozilla Public License)

institutional repository system - 2001

University of Southampton

open source (GNU License)

CCSDS OAISCCSDS OAISIngest

Access

Archival Storage

Archival Management

Administration

Reservation Planning

selectie van een systeem voor eDepot

26

• Fedora voordeleno open sourceo complex digitaal objectmodel dat grote aantallen en een verscheidenheid van

datastromen ondersteunto Interfaces (API’s) voor Zoeken, Opslaan en Ophalen van objecteno Rich Object Behavior: mogelijkheid om tools te ontwikkelen die met de objecten

in het eDepot aan de slag gaan (viewers, preservation services,…)o Schaal: > 1 miljoen objecteno Batch Support: kan op een eenvoudige manier grote hoeveelheden objecten

importeren of exportereno Modulair systeem: kan flexibel worden uitgebreid met andere diensten en

archiveringsoplossingen

• Fedora nadeleno Alleen ‘middleware’ en ‘storage’; vereist de ontwikkeling van

gebruiksvriendelijke front-endo Geen pasklare instrumenten om datamodellen te definiëren

selectie van een systeem voor eDepot: voor- en nadelen van Fedora

27

FEDORA REPOSITORY

ISLANDORA BRIDGE

DRUPAL WEB FRONTEND

(FEDORA) STORAGE LAYER

bouwstenen van de fedora-based repository van CVAa

CMS voor websites in PHP

Drupal Association

Open source (GNU General Public License)

Module om de Drupal-interface te koppelen aan Fedora

University of Prince Edward Island (UPEI)

Open source (No license)

Digital Object Repository system

Cornell University / Univesity of Virginia

open source (Mozilla Public License)

28

digitaal object

29

digitaal object

30

DATASTREAM N

fedora digitaal object

DATASTREAM 2

PERSISTENT ID

SYSTEM

PROPERTIES

DATASTREAM 1

digitaal object identifier

manage & track the object

aggregates content items

CCSDS OAIS AIPCCSDS OAIS AIPContent Information

Data Object

Preservation Infomation

Representation Information

Packaging Information

Fedora digital object Fedora digital object

model is model is

represented in XML represented in XML

(FOXML)(FOXML)

31

fedora digitaal object

PERSISTENT ID

SYSTEM

PROPERTIES

RESERVED

DATASTREAMS

DUBLIN CORE

(DC)

AUDIT TRAIL

(AUDIT)

RELATIONS

(RELS-EXT)

metadata over het object

automatische registratie van alle wijzigingen die aan een object worden aangebracht

beschrijft relaties met andere digitale objecten

willekeurig aantal datastromen door de gebruiker aan het object toe te voegen

32

fedora digitaal object

PERSISTENT ID

SYSTEM

PROPERTIES

AUDIT TRAIL

RELATIONS

DC

<oai_dc:dc>

<dc:title>Woning Frateur - Hallez</dc:title>

<dc:creator>Architettura</dc:creator>

<dc:subject>Houtskeletbouw</dc:subject>

<dc:publisher>VAI</dc:publisher>

<dc:identifier>info:fedora/vai:765</dc:identifier>

</oai_dc:dc>

image/tiffinfo:pronom/fmt/3

application/pdf

info:pronom/fmt/18

application/pdfinfo:pronom/fmt/18

application/xml

info:pronom/fmt/101

info:fedora/vai:765

managed content

internal XML

managed content

managed content

33

<rdf:description rdf:about="info:fedora/vai:765">

<fedora:isMemberOfCollection rdf:resource="info:fedora/vai:Yearbook2007"/>

<fedora-model:hasModel rdf:resource="info:fedora/islandora:VAI_Yearbook"/>

</rdf:description>

VAI YB 2007

QUERY

Collection Object

E.g. Yearbook 2007

PID 765

DS

DS

DS

RELS-EXT

isMem

berOfCollection

collecties ontwikkelen met relaties

34

belangrijkste kenmerken van Fedora eDepot

• Modulair systeem

• Web service interfaces (REST/SOAP)

• Ondersteunt OAI-PMH & OAI-ORE

• Versiebeheer

• Self-contained objects (alle essentiële eigenschappen staan in XML bestand)

• Indexing gebaseerd op RDF

35

preservatiemogelijkheden van Fedora

• Data-model voor samengestelde digitale objecteno bundelt meerdere datastromeno legt eigenschappen over het object en de datastromen vasto wijst een vaste en wereldwijde unieke ID aan

• XML-gebaseerde Digital Object Storage (FOXML files)o OAIS Archival Information Packages

• XML-gebaseerde Digital Object Ingest and Exporto FOXML, METS, MPEG-21 DIDL, ORE, etc.o OAIS Submission & Dissemination Information Packages

• Automatisch versiebeheer van de inhoud van de datastromen

• Logboek van alle aanpassingen aan digitale opjecten

• Uitbreidbaar met Preservation Support Serviceso bv. Migration services & file format identification

36

architectuur van CVAa eDepot

Isla

ndor

a br

idge

drup

al «

 web

site

 »File System

(Objects)

OA

IM

AN

AG

EA

CC

ES

S

RDBMS

(Registry)

RDF

Tripplestore

SE

AR

CH

RD

F Q

UE

RY

SE

RV

ICE

BIN

DP

OL

ICY

VA

LID

AT

E

AC

CE

SS

MA

NA

GE

ING

ES

T

ST

OR

ER

EG

IST

RY

RD

F I

ND

EX

end

user

37

eerste conclusies testcase

• Testcase laat toe kennis op te doen over datamodellen

• Met relatief beperkt budget en tijd, kan een duurzaam depot worden gebouwd d.m.v. open source software en gebruik van internationale standaarden

• Door praktijk van eDepot wordt kennis gegenereerd en kan naar concrete antwoorden worden gezocht op de vraag naar de specificiteit architectuurarchieven

• investering:• extern

• huur server: 1.800 € / jaar• ontwikkeling use case: 10.000 €

• intern• coördinator + projectleider: 20 % f.t.e.

38

toekomst

• De bestaande mogelijkheden van het Fedora eDepot van CVAa uitbreideno Ontwikkelen van specifieke metadataschema’s voor architectuurarchieveno Integratie van uitgebreidere collectie informatie – EAD/ISAD(G)o Integratie van disseminatie & preservatie diensten (bv. JPEG 2000 viewer,

instrumenten voor migratie van datastromen)

• Aftasten van de mogelijkheden tot interconnectiviteit en samenwerking tussen verschillende eDepots in een federatie van digitale architectuurarchieven

o Diverse architecturale eDepots toegankelijk maken via een centrale toegang (portal)

o Digitale objecten gebruiken, opslaan en uitwisselen tussen verschillende eDepots en voor verschillende doeleinden

39

toekomst

• Ontwikkelen van adviezen voor archiefvormers/architectenbureaus

• Richtlijnen voor het aanleveren van materiaal voor het Jaarboek Architectuur

40

toekomst:federatie van eDepots voor architectuur

VAi

Ghent

UniversityNAI

ARCH Y

CENTRAL PORTAL: CVAa

Asset

Registry ACCESSACCESS

ACCESS

ACCESSACCESS

ENS-USER | APPLICATIONENS-USER | APPLICATION

Potential technologiesPotential technologiesOAI-PMH

OAI-ORE

OpenURL

41

Conclusies: overeenkomsten CVAa en NAi

• Architectuurarchieveno Specifieke ontsluiting en beschrijving

• Private archieven versus publiekrechtelijke archieven:o geen regelgeving voor vorming archieveno vraagstuk authenticiteit op ander niveau (geen juridische bewijskracht)o selectieo auteursrechteno …

42

Belangrijkste conclusies: verschillen

CVAaE-depot voor use case

• Deelarchief van VAi

• Archief van architectuurorganisatie

• Gesloten collectie

• Integraal, autonoom systeem: Fedora

• Scope op preservering en expertise

NAi

E-depot voor volledige collectie

• Volledige archieven

• Architectenarchieven

• Ingebed in andere collecties

• Koppeling bestaand systeem (CIS)

• Scope op opname en preservering

43

Belangrijkste conclusies: Open standaarden

• Open Standaarden zorgen voor gelijkwaardige uitvoering van functies

• Open standaarden faciliteren gemeenschappelijke services (bijv. preservering)

• Open standaarden vereenvoudigen het uitwisselen van gegevens en gemeenschappelijke beschikbaarstelling

44

Belangrijkste conclusies: welk systeem

• Er is (nog) geen systeem ‘off the shelf’ beschikbaar.

• Ontwikkel eDepot vanuit eigen bestaande behoeften, eisen, wensen

• Ontwikkel eDepot vanuit eigen systeem

• Ieder eDepot moet voldoen aan minimale eisen (functionaliteit, ondersteuning werkprocessen)

• Met relatief beperkt budget en tijd, kan een duurzaam depot worden gebouwd d.m.v. Open Source

• eDepot ontwikkelen is experimenteren, leren en kennis delen

45

h.vanstappen@nai.nl

f.neggers@nai.nl

sofie.decaigny@vai.be

annelies.nevejans@vai.be