Verwerking van ontvangen digitale data. De opbouw van het LIAS-preintgestproces
-
Upload
vlaamse-vereniging-voor-bibliotheek-archief-documentatie-vzw -
Category
Documents
-
view
254 -
download
0
Transcript of Verwerking van ontvangen digitale data. De opbouw van het LIAS-preintgestproces
Ordening en beschrijving van ontvangen digitale data
Opbouw van het Lias pre-ingestproces
Katrien Weyns
Inhoud
• Uitgangspunten
• Eenvormig materiaal
• Kant-en-klare gehelen
• Te bewerken eenheden
• Knelpunten
• Metadata registratie
• Conclusie
2
Uitgangspunten
• Vertrekpunt: Open Archival InformationSystem Reference Model
• Opname digitaal object tot ter beschikking stellen
• Vooropgesteld:
– Flexibel, met oog op partners uit verschillende omgevingen
– Vanuit bestaande noden en werking
3
Uitgangspunten
4
Voorbereidingen voor opname in depot
pre-ingest fase
Uitgangspunten
• Nodig voor ingest:
– Digitaal object
– Metadata (preservatie en toegang)
5
Uitgangspunten
6
eenvoudige, uniforme en beschreven reeksen : bibliotheekcollecties, gedigitaliseerde stukken
gestructureerd, geselecteerd en gemetadateerd digital born archiefmateriaal : uit DMS en samenwerkingsplatformen
weinig gestructureerd, ongeselecteerd, niet-publiek, onbeschreven digital born archiefmateriaal : file servers
Ingesttool om ingest te automatiseren
7
Eenvormig materiaalbv. bibliotheekcollecties, gedigitaliseerde stukken
Kant-en-klare gehelenbv. DMS, samenwerkingsplatformen
Te bewerken eenhedenbv. file servers
Ingesttool om ingest te automatiseren
Eenvormig materiaal
+ Ingestovereenkomst : configuratie LIAS ingester
8
Eenvormig materiaal
• Vooraf gemaakte afspraken: • Keuze generiek ingestmodel: formaat voor preservatie
en raadpleging
• Keuze generiek access rights model: toegangsmogelijkheden
9
Ingestmodellen
archive view_main view thumbnail
jpg-watermark_jp2_tn original file jpg met watermerk 75 dpi jpeg2000 75dpi jpg 75x100
Access rights modellen
archive view_main view thumbnail
kdc_ar_jpg-watermark_jp2_tn_1 kadocadmin public kadocadmin en kadocguest public
Bv. voor affiches
Eenvormig materiaal
• Automatische ingest : 1 AIP = 1 beschreven eenheid (bv. gedigitaliseerde affiches): – Controles (virus, bitrot, checksum…)
– Creatie verschillende manifestaties per affiche : archiverings- en consulatieformaten
– Ophalen metadata (preservatie en beschrijving)
– Online beschikbaar gesteld
• Op basis van naming conventions gelinkt
bv. KCA014428
10
Eenvormig materiaal
11
• beschrijving (met uniek sigel)• reeks affiches bepaald formaat• gedigitaliseerd met sigel in bestandsnaam KCA014428
Eenvormig materiaal
12
Generieke configuratiefile
Object met bestandsnaam
KCA014428
BeschrijvingKCA014428
# manifestaties metadataSigel KCA014428
ArchivalInformationPackage
Eenvormig materiaal
13
– Online toegankelijk
(rechtstreeks zoeken in digitaal depot)
– Link naar object in OPAC
Eenvormig materiaal
• Gelijkaardige procedure voor het ingesten van gedigitaliseerde archiefstukken– Gedigitaliseerde stukken centraal aangeboden
– Generiek ingest- en access rights model
– Unieke referentiecode van bestanddeel in bestandsnaam
– Linken digitaal object en metadata via ref.code
• Metadata uit scopeArchiv: titel, source, identifier in digitaal depot
14
Eenvormig materiaal
15
Eenvormig materiaal
16
Na login
Complexe/samengestelde objecten in XML samengevoegd
Eenvormig materiaal
• Uniforme reeksen (formaten, bestandsnamen)
• Uniforme ingest- en toegangsprocedure per aangeboden lot (ingestovereenkomst)
• Beschrijvende metadata aanwezig in Aleph of scopeArchiv
17
Joseph Buyens
18
Eenvormig materiaalbv bibliotheekcollecties, gedigitaliseerde stukken
Kant-en-klare gehelen bv. DMS, samenwerkingsplatformen
Te bewerken eenhedenbv. file servers
Ingesttool om ingest te automatiseren
Kant-en-klare gehelen
• OAIS: – pre-ingest = Preliminary Phase met als eindpunt
draft Submission Agreement
– Onderhandeling met archiefvormer en validatie
• Afspraken: – Welke data vooronderzoek en tests
– Planning overdracht
– Welke toegangen
– …
19
Kant-en-klare gehelen
• Alle metadata, orde, link object-metadata
• Eén configuratiefile met ingestmodel en toegang voor set formaten
A B20
Object Metadata Manifestaties Metadata
Kant-en-klare gehelen
• Alles 1 op 1 overgebracht
1 object = 1 beschrijving
• Bepaalde structuur overgenomen
bv. reeksen per jaar
21
Kant-en-klare gehelen
22
Kant-en-klare gehelen
23
24
Eenvormig materiaalbv. bibliotheekcollecties, gedigitaliseerde stukken
Kant-en-klare gehelenbv. DMS, samenwerkingsplatformen
Te bewerken eenheden bv. file servers
Ingesttool om ingest te automatiseren
Te bewerken eenheden
• OAIS: onderhandeling met archiefvormer en validatie
• verwachtingen van archiefvormer en bestaande praktijk binnen UniversiteitsarchiefLeuven en KADOC-KU Leuven
25
Te bewerken eenheden
• In de praktijk
– objecten met (beschrijvende) metadata uit een CMS of DMS
– bestanden in mappenstructuur afkomstig van bv. file server/pc of meegegeven op cd-rom bij papier
26
Te bewerken eenheden
• Overeenkomst met archiefvormers:
– Welke data (en eventueel metadata)
– Minimale orde (geen losse bestanden zonder context)
– Overdrachtwijze en timing
– Te hanteren overdrachttools
27
Yves SmetsOmniaMaurice Brasseur
Te bewerken eenheden
28
- Ordening- Selectie- Herbestemming- Toevoegen metadata- Linken objecten aan metadata
Te bewerken eenheden
• Pre-ingestLias : bijwerken of opmaak van SIP die geautomatiseerd geïngestwordt
29
Institution Archivist
1ste verwerking met Windows Explorer
2de verwerking met SharePoint
• Ingest : automatische creatie AIP op basis van minimumset aan gegevens
Te bewerken eenheden
• Ingestdata
• Beschrijvende data
•(selectie, ordening, oplossen vreemde formaten)
Invoer SharePoint
• Controle
• Ingest : aanmaken XML, migratie objecten en toevoegen DC data
Ingest in depot• Aanmaak
beschrijvings-eenheden
• Invulling eenheden
• Linken van XML en objecten
Ingest in scopeArchiv
Wijziging in scopeArchiv
30
• Controle• Aanvulling
Knelpunten
Vragen en knelpunten:
– Hoe linkt men (gebruiksvriendelijk) objecten uit het digitaal depot aan de juiste beschrijving?
– Hoe worden de complexe objecten opgenomen?
Als platte lijst? Gaat dan niet de oude orde verloren?
– Hoe visualiseert men de oude orde voor lezers
31
Knelpunten: koppeling
Honderd brieven manueel linken aan1 beschrijving?
Automatisch!
32
Objectpreservatie metadata
# manifestaties
AIP
Knelpunten: koppeling
33
Eerste piste: mappen worden opgenomen als beschrijving (afdeling, onderafdeling, rubriek, subrubriek, bestanddeel) in scopeArchiv
Titel
Gebruiksvriendelijkheid
Knelpunten: koppeling
34
Knelpunten: koppeling
• Verschil tussen – mappen die leiden tot een
beschrijvingseenheid– mappen die onderdeel zijn
van een beschrijvingseenheid
• Tweede optie: Definieer vooraf welke map een beschrijvingseenheid wordt
35
Knelpunten: oude orde
• Bestanden AIP’s in e-depot
• Mappenbeschrijvingseenheid in beschrijvingssysteem
• Waar gaan mappen naartoe als ze niet tot beschrijvingseenheid leiden?
Opname van deze structuur als XML-document in het e-depot
36
Knelpunten: oude orde
37
Metadata
• Noodzakelijke informatie voor ingest
– Ingestmodel bepaling archiveringsformaat en representatie
– Access rights bepaling toegang
• (aanzet) beschrijving
– Keuze beschrijvingseenheid: i.f.v. koppeling object-beschrijving
38
Metadata
• Ingestdata
• Beschrijvende data
• (selectie, ordening, oplossen vreemde formaten)
Invoer SharePoint
• Controle
• Ingest : aanmaken XML, migratie objecten en toevoegen DC data
Ingest in depot• Aanmaak
beschrijvings-eenheden
• Invulling eenheden
• Linken van XML en objecten
Ingest in scopeArchiv
Wijziging in scopeArchiv
39
• Controle• Aanvulling
Metadata
40
Metadata
41
Ingestmodellenarchive view_main view thumbnail toepassing
jpg-watermark_jpg_tn original file jpg met watermerk 75
dpi
jpg zonder watermerk 75 dpi jpg 75x100 KADOC KF%
(foto's)
pdf-a original file pdf-a icon KADOC
Officedocumenten
Accessrights modellen
archive view_main view thumbnail
kdc_ar_jpg-
watermark_jpg_tn_1
kadocadmin public kadocadmin en kadocguest public
kdc_ar_jpg-
watermark_jpg_tn_2
kadocadmin kadocadmin en
kadocguest
kadocadmin en kadocguest kadocadmin en
kadocguest
kdc_ar_pdf-a_1 kadocadmin kadocadmin en
kadocguest
n/a n/a
Metadata
• Objecten digitaal depot
• Alle metadata uit SP scopeArchiv– Aanmaak beschrijvingseenheden
– Invulling
– Automatische telling en aanvulling omvang
– Automatische creatie inventarisnummers
– Automatisch linken naar de juiste objecten in het depot
– Opmaak controlelijsten voor gelinkte objecten aan bestaande beschrijvingen
42
Metadata
43
Conclusie
44
Joseph Buyens
Eenvoudige
procedure beperkte pre-ingest
Complexere procedure doornood aan tussenkomst en verschillende scenario’s
Pre-ingest heeft grote impact
Conclusie
45
LIAS ingester