Vanstappen De Caigny

44
Een eDepot voor Een eDepot voor architectuurarchieven architectuurarchieven Centrum Vlaamse Architectuurarchieven Centrum Vlaamse Architectuurarchieven CVAa CVAa Vlaams Architectuurinstituut VAi Vlaams Architectuurinstituut VAi - - Nederlands Architectuurinstituut NAi Nederlands Architectuurinstituut NAi Sofie De Caigny/Annelies Nevejans Sofie De Caigny/Annelies Nevejans Henk Vanstappen Henk Vanstappen

description

 

Transcript of Vanstappen De Caigny

Page 1: Vanstappen De Caigny

Een eDepot voor architectuurarchievenEen eDepot voor architectuurarchieven

Centrum Vlaamse Architectuurarchieven CVAaCentrum Vlaamse Architectuurarchieven CVAaVlaams Architectuurinstituut VAiVlaams Architectuurinstituut VAi

- - Nederlands Architectuurinstituut NAiNederlands Architectuurinstituut NAi

Sofie De Caigny/Annelies NevejansSofie De Caigny/Annelies NevejansHenk VanstappenHenk Vanstappen

Page 2: Vanstappen De Caigny

2

Een eDepot voor architectuurarchieven

• NAio Context : CIS, ArchiVista en digitalisering in NAio Vooronderzoek: archiefpraktijk in bureauso Archiveringsbeleido eDepot testbed

• VAi/CVAao Context: kennis ontwikkeleno Testcase: Jaarboek Architectuur Vlaandereno Fedora Commons als eDepot o Toekomst: standaarden en samenwerking

Page 3: Vanstappen De Caigny

3

Een eDepot voor architectuurarchieven

• NAio Context : CIS, ArchiVista en digitalisering in NAio Vooronderzoek: archiefpraktijk in bureauso Archiveringsbeleido eDepot testbed

• VAi/CVAao Context: kennis ontwikkeleno Testcase: Jaarboek Architectuur Vlaandereno Fedora Commons als eDepot o Toekomst: standaarden en samenwerking

Page 4: Vanstappen De Caigny

4

Nederlands Architectuurinstituut (NAi)

• Archief, Museum, Bibliotheek en Cultureel podium

• Archieven en collecties van Nederlandse architecten van na 1800 bewaren en toegankelijk maken

• Als sectorinstituut voorzien in mogelijkheden voor onderzoek en platform bieden voor discussie

• Zowel het professionele werkveld als het grote publiek informeren, inspireren en stimuleren door middel van tentoonstellingen en publicaties.

Page 5: Vanstappen De Caigny

5

Collectie Informatie Systeem (CIS)

• Collectieso Bibliotheeko Objecteno Archief

• Authoritieso Personen & organisatieso Projecteno Events

• Procedureso Verwervingo Conservatie/restauratieo Bruikleeno Opslag en verplaatsing

Page 6: Vanstappen De Caigny

6

Collectie Informatie Systeem (CIS)

Page 7: Vanstappen De Caigny

7

ArchiVista (2009-2010)

• Toegang op collecties

• Toegang op authorities

• Harvesting externe databases (OAI-PMH)

• User generated content

• Google Maps

• Printing on Demand

• Toegang tot gedigitaliseerde born digital content

Page 8: Vanstappen De Caigny

8

CIS - Archivista

Page 9: Vanstappen De Caigny

9

Digitale objecten in collecties

• Digitaliseringsprojecteno Archief Jan Duikero Fotoarchief Tentoonstellingsraado Fotobestellingen

• Born digitalo Archief Carel Weeber

Project eDepoto Hoe beheren ?o Hoe preserveren ?o Hoe koppelen met CIS-metadata ?o Hoe content beschikbaar stellen in ArchiVista ?

Page 10: Vanstappen De Caigny

10

CIS – ArchiVista - eDepot

Page 11: Vanstappen De Caigny

11

Vooronderzoek: bureau enquête

• 4 architectenbureaus

• Onderzoek naaro Hard- en softwareomgevingo Intern archiveringsbeleido Problemen bij conversieo Gebruik van standaardeno Ontwikkelingstraject

• Opvragen van digitale projectdossiers

Page 12: Vanstappen De Caigny

12

Vooronderzoek: resultaten

• Weinig diversiteit in software, hardware en operating systems

• Overgang naar nieuwe omgeving stelde geen problemen

• Overal backup beleid of -maatregelen

• Migratie gebeurt ad hoc, geen beleid (maar ook weinig problemen)

• Overgang naar nieuwe omgeving zelden gedocumenteerd

• Geen beleid voor verversen van dragers

• Authenticiteit is geen issue

• Geen standaarden voor metadata

Page 13: Vanstappen De Caigny

13

Vooronderzoek: analyse dossiers

• Bevestiging resultaten enquête

• 90 % leesbaar

• Veel derivaten van zelfde bestand

• Bestandsstructuur, namen van folders en files zijn essentiële aanvulling op beperkte metadata

• Output documenten zijn mijlpaaldocumenten

Page 14: Vanstappen De Caigny

14

Archiveringsbeleid: uitgangspunten

• Algemene doelstelling NAi: ontwerpproces documentereno Intellectuele inhoud prevaleert over functionaliteit

• Aanbod van architecten(bureaus):o Weinig impact op archiefvormingo Uiteenlopende bestandsformaten aangebodeno Problematisch archiveringsbeleid bij archiefvormer

• Beperkte middelen o Geen computer museumo Geen software museumo (Virtuele) emulatie (voorlopig) geen optie

Page 15: Vanstappen De Caigny

15

Archiveringsbeleid: methodes

• Originele bestand wordt steeds bewaard

• Voor elk proprietary format één de jure open formato Intellectuele inhoud bepaalt archiveringsformaato Meerdere archiveringsformaten mogelijk

• Migratiestrategie:o Migratie toepassen op mijlpaaldocumenteno Uitgestelde migratie voor secundaire documenten

• Technology watch

Page 16: Vanstappen De Caigny

16

Testomgeving: functies

• Virus check

• Log bestandsnaam en –locatie

• Dedupliceren

• Identificeren en valideren o DROIDo Pronom-database

• Migrereno Tools

• Opslago Dspace ?

Page 17: Vanstappen De Caigny

17

Page 18: Vanstappen De Caigny

18

Een eDepot voor architectuurarchieven

• NAio Context : CIS, ArchiVista en digitalisering in NAio Vooronderzoek: archiefpraktijk in bureauso Archiveringsbeleido eDepot testbed

• VAi/CVAao Context: kennis ontwikkeleno Testcase: Jaarboek Architectuur Vlaandereno Fedora Commons als eDepot o Toekomst: standaarden en samenwerking

Page 19: Vanstappen De Caigny

19

Centrum Vlaamse Architectuurarchieven (CVAa)

• Het CVAa werd in 2003 onder de koepel van het Vlaams Architectuurinstituut opgericht

• CVAa is een cultureel thema-archief voor architectuurarchieven• Missie van het CVAa: kennis, internationale expertise en best practises

verzamelen, ontwikkelen en verspreiden in Vlaanderen. Doelgroep: archiefinstelling (cfr. versnipperde bewaring van architectuurarchieven in Vlaanderen)

• CVAa fungeert dus als een expertise- en coördinatiecentrum en bouwt geen eigen collectie architectuurarchieven op

Page 20: Vanstappen De Caigny

20

vraagstelling m.b.t. eDepot

• De architectuurpraktijk genereert sinds de jaren 1990 zeer veel digitale objecten > een toekomstig archiefbeleid tov architectuur kan niet zonder een visie, kennis over en instrumenten voor een duurzaam digitaal beleid tov architectuurarchieven

• CVAa wil kennis ontwikkelen over archivering van digital born architectuurarchieveno Wat zijn de grootste moeilijkheden die een digitaal depot met zich brengt?o Welke aspecten zijn zeer eigen aan het ontwikkelen van een eDepot voor architectuurarchieven?o Welke technologie en expertise is generiek en komt terug in verschillende sectoren die met

eDepots bezig zijn?o Wat is de rol van CVAa in de archivering van digital born architectuurarchieven?

• Om antwoorden op bovenstaande vragen te kunnen formuleren, én om te vermijden te vervallen in een intensieve studie van andere voorbeelden en studies – ervaring is de beste leerschool –, werd beslist een testcase van eDepot op te starten

Page 21: Vanstappen De Caigny

21

voorwaarden testcase

o Beperkt budget | beperkte timing (6 maanden)

o eDepot moet aan de OAIS-norm voldoen verzekering van duurzaamheid en de interoperabiliteit van het systeem te verzekeren

o eDepot moet internationale standaarden en protocollen integreren met het oog op het uitwisselen van informatie met andere systemen, o.a. OAI-PMH

o eDepot moet worden gebouwd met bestaande ‘off-the-shelf’ instrumenten die bij voorkeur open source zijn

Page 22: Vanstappen De Caigny

22

use case: Jaarboek Architectuur Vlaanderen

• Tweejaarlijks boek over hedendaagse architectuur in Vlaanderen, gepubliceerd door het VAi

• Kleine, beheersbare collectie: ca. 350 projecten worden ingezonden bij de oproep (350 objecten & 5600 datastromen). Daarvan wordt een kleine groep (ca. 10 % effectief gepubliceerd. Van deze 10% bestaan bijkomende digitale objecten.

• Samenstelling van een object: elk object bestaat uit een bundel van meervoudige (digital born) datastromen (die in een beperkt aantal formaten wordt aangeleverd) die een logisch geheel vormen

• De collectie is klein maar heeft een hoge culturele waarden aangezien ze een doorsnede is van de hedendaagse architectuurproductie in Vlaanderen

Page 23: Vanstappen De Caigny

23

use case: Jaarboek Architectuur Vlaanderen

Page 24: Vanstappen De Caigny

24

selectie van een systeem voor eDepot

VOORONDERZOEK• Verschillende ‘communities*’, organisaties en instituties ontwikkelen en

onderhouden eDepots om digitale objecten in te bewaren, en zij delen rijke collecties digitale objecten.

• Een al te enge kijk op de specificiteit van materialen en toepassingen heeft geleid tot een enorme variëteit aan parallelle technologieën en heterogene benaderingen bij de ontwikkeling van eDepots.

• In het algemeen blijkt dat de belofte en het potentieel van de bestaande ‘off-the-shelf’ standaarden en uniforme instrumenten die door een ‘community’ worden ontwikkeld, tot nog toe onvoldoende zijn geëxploreerd.

* community: een (open source) software-community brengt gebruikers van die software samen zodat ze verbeteringen, applicaties en ervaringen kunnen uitwisselen

Page 25: Vanstappen De Caigny

25

DSpace

Fedora

Commons

EPrints

institutional repository system - 2002

MIT Libraries / Hewlett Packard

open source (BSD License) – 305 installaties

repository system - 2003

Cornell University / Univesity of Virginia

open source (Mozilla Public License)

institutional repository system - 2001

University of Southampton

open source (GNU License)

CCSDS OAISCCSDS OAISIngest

Access

Archival Storage

Archival Management

Administration

Reservation Planning

selectie van een systeem voor eDepot

Page 26: Vanstappen De Caigny

26

• Fedora voordeleno open sourceo complex digitaal objectmodel dat grote aantallen en een verscheidenheid van

datastromen ondersteunto Interfaces (API’s) voor Zoeken, Opslaan en Ophalen van objecteno Rich Object Behavior: mogelijkheid om tools te ontwikkelen die met de objecten

in het eDepot aan de slag gaan (viewers, preservation services,…)o Schaal: > 1 miljoen objecteno Batch Support: kan op een eenvoudige manier grote hoeveelheden objecten

importeren of exportereno Modulair systeem: kan flexibel worden uitgebreid met andere diensten en

archiveringsoplossingen

• Fedora nadeleno Alleen ‘middleware’ en ‘storage’; vereist de ontwikkeling van

gebruiksvriendelijke front-endo Geen pasklare instrumenten om datamodellen te definiëren

selectie van een systeem voor eDepot: voor- en nadelen van Fedora

Page 27: Vanstappen De Caigny

27

FEDORA REPOSITORY

ISLANDORA BRIDGE

DRUPAL WEB FRONTEND

(FEDORA) STORAGE LAYER

bouwstenen van de fedora-based repository van CVAa

CMS voor websites in PHP

Drupal Association

Open source (GNU General Public License)

Module om de Drupal-interface te koppelen aan Fedora

University of Prince Edward Island (UPEI)

Open source (No license)

Digital Object Repository system

Cornell University / Univesity of Virginia

open source (Mozilla Public License)

Page 28: Vanstappen De Caigny

28

digitaal object

Page 29: Vanstappen De Caigny

29

digitaal object

Page 30: Vanstappen De Caigny

30

DATASTREAM N

fedora digitaal object

DATASTREAM 2

PERSISTENT ID

SYSTEM

PROPERTIES

DATASTREAM 1

digitaal object identifier

manage & track the object

aggregates content items

CCSDS OAIS AIPCCSDS OAIS AIPContent Information

Data Object

Preservation Infomation

Representation Information

Packaging Information

Fedora digital object Fedora digital object

model is model is

represented in XML represented in XML

(FOXML)(FOXML)

Page 31: Vanstappen De Caigny

31

fedora digitaal object

PERSISTENT ID

SYSTEM

PROPERTIES

RESERVED

DATASTREAMS

DUBLIN CORE

(DC)

AUDIT TRAIL

(AUDIT)

RELATIONS

(RELS-EXT)

metadata over het object

automatische registratie van alle wijzigingen die aan een object worden aangebracht

beschrijft relaties met andere digitale objecten

willekeurig aantal datastromen door de gebruiker aan het object toe te voegen

Page 32: Vanstappen De Caigny

32

fedora digitaal object

PERSISTENT ID

SYSTEM

PROPERTIES

sample object

AUDIT TRAIL

RELATIONS

DC

<oai_dc:dc>

<dc:title>Woning Frateur - Hallez</dc:title>

<dc:creator>Architettura</dc:creator>

<dc:subject>Houtskeletbouw</dc:subject>

<dc:publisher>VAI</dc:publisher>

<dc:identifier>info:fedora/vai:765</dc:identifier>

</oai_dc:dc>

image/tiffinfo:pronom/fmt/3

application/pdf

info:pronom/fmt/18

application/pdfinfo:pronom/fmt/18

application/xml

info:pronom/fmt/101

info:fedora/vai:765

managed content

internal XML

managed content

managed content

Page 33: Vanstappen De Caigny

33

<rdf:description rdf:about="info:fedora/vai:765">

<fedora:isMemberOfCollection rdf:resource="info:fedora/vai:Yearbook2007"/>

<fedora-model:hasModel rdf:resource="info:fedora/islandora:VAI_Yearbook"/>

</rdf:description>

VAI YB 2007

QUERY

Collection Object

E.g. Yearbook 2007

PID 765

DS

DS

DS

RELS-EXT

isMem

berOfCollection

collecties ontwikkelen met relaties

Page 34: Vanstappen De Caigny

34

belangrijkste kenmerken van Fedora eDepot

• Modulair systeem

• Web service interfaces (REST/SOAP)

• Ondersteunt OAI-PMH & OAI-ORE

• Versiebeheer

• Self-contained objects (alle essentiële eigenschappen staan in XML bestand)

• Indexing gebaseerd op RDF

Page 35: Vanstappen De Caigny

35

preservatiemogelijkheden van Fedora

• Data-model voor samengestelde digitale objecteno bundelt meerdere datastromeno legt eigenschappen over het object en de datastromen vasto wijst een vaste en wereldwijde unieke ID aan

• XML-gebaseerde Digital Object Storage (FOXML files)o OAIS Archival Information Packages

• XML-gebaseerde Digital Object Ingest and Exporto FOXML, METS, MPEG-21 DIDL, ORE, etc.o OAIS Submission & Dissemination Information Packages

• Automatisch versiebeheer van de inhoud van de datastromen

• Logboek van alle aanpassingen aan digitale opjecten

• Uitbreidbaar met Preservation Support Serviceso bv. Migration services & file format identification

Page 36: Vanstappen De Caigny

36

architectuur van CVAa eDepot

Isla

ndor

a br

idge

drup

al «

 web

site

 »File System

(Objects)

OA

IM

AN

AG

EA

CC

ES

S

RDBMS

(Registry)

RDF

Tripplestore

SE

AR

CH

RD

F Q

UE

RY

SE

RV

ICE

BIN

DP

OL

ICY

VA

LID

AT

E

AC

CE

SS

MA

NA

GE

ING

ES

T

ST

OR

ER

EG

IST

RY

RD

F I

ND

EX

end

user

Page 37: Vanstappen De Caigny

37

eerste conclusies testcase

• Testcase laat toe kennis op te doen over datamodellen

• Met relatief beperkt budget en tijd, kan een duurzaam depot worden gebouwd dmv. Open Source en gebruik van internationale standaarden

• Door praktijk van eDepot wordt kennis gegenereerd en kan naar concrete antwoorden worden gezocht op de vraag naar de specificiteit architectuurarchieven

Page 38: Vanstappen De Caigny

38

toekomst

• De bestaande mogelijkheden van het fedora eDepot van CVAa uitbreideno Ontwikkelen van specifieke metadataschema’s voor architectuurarchieveno Integratie van uitgebreidere collectie informatie – EAD/ISAD(G)o Integratie van disseminatie & preservatie diensten (bv. JPEG 2000 viewer,

instrumenten voor migratie van datastromen)

• Aftasten van de mogelijkheden tot interconnectiviteit en samenwerking tussen verschillende eDepots in een federatie van digitale architectuurarchieven

o Diverse architecturale eDepots toegankelijk maken via een centrale toegang (portal)

o Digitale objecten gebruiken, opslaan en uitwisselen tussen verschillende eDepots en voor verschillende doeleinden

Page 39: Vanstappen De Caigny

39

toekomst:federatie van eDepots voor architectuur

VAi

Ghent

UniversityNAI

ARCH Y

CENTRAL PORTAL: CVAa

Asset

Registry ACCESSACCESS

ACCESS

ACCESSACCESS

ENS-USER | APPLICATIONENS-USER | APPLICATION

Potential technologiesPotential technologiesOAI-PMH

OAI-ORE

OpenURL

Page 40: Vanstappen De Caigny

40

Conclusies: overeenkomsten CVAa en NAi

• Architectuurarchieveno Specifieke ontsluiting en beschrijving

• Private archieven versus publiekrechtelijke archieven:o geen regelgeving voor vorming archieveno vraagstuk authenticiteit op ander niveau (geen juridische bewijskracht)o selectieo auteursrechteno …

Page 41: Vanstappen De Caigny

41

Belangrijkste conclusies: verschillen

CVAaE-depot voor use case

• Deelarchief van VAi

• Archief van architectuurorganisatie

• Gesloten collectie

• Integraal, autonoom systeem: Fedora

• Scope op preservering en expertise

NAi

E-depot voor volledige collectie

• Volledige archieven

• Architectenarchieven

• Ingebed in andere collecties

• Koppeling bestaand systeem (CIS)

• Scope op opname en preservering

Page 42: Vanstappen De Caigny

42

Belangrijkste conclusies: Open standaarden

• Open Standaarden zorgen voor gelijkwaardige uitvoering van functies

• Open standaarden faciliteren gemeenschappelijke services (bijv. preservering)

• Open standaarden vereenvoudigen het uitwisselen van gegevens en gemeenschappelijke beschikbaarstelling

Page 43: Vanstappen De Caigny

43

Belangrijkste conclusies: keuze systeem

• Er is (nog) geen systeem ‘off the shelf’ beschikbaar.

• Ontwikkel eDepot vanuit eigen bestaande behoeften, eisen, wensen

• Ontwikkel eDepot vanuit eigen systeem

• Ieder eDepot moet voldoen aan minimale eisen (functionaliteit, ondersteuning werkprocessen)

• Met relatief beperkt budget en tijd, kan een duurzaam depot worden gebouwd dmv. Open Source

• eDepot ontwikkelen is experimenteren, leren en kennis delen