Module 3 | CEST-richtlijnen voor beheerders van digitale collecties | Digitaliseren

Post on 27-Jun-2015

42 views 0 download

description

Digitaliseren van erfgoedcollecties wordt vaak nog gelijkgesteld met het scannen van documenten of digitale fotografie. In realiteit blijkt – kwaliteitsvolle – digitalisering echter een complex proces, waarbij technische en organisatorische expertise vereist is. De CEST-richtlijnen voor digitalisering bieden hiervoor een kader aan, in de vorm van aanbevolen en minimale standaarden. Tijdens deze introductie worden de richtlijnen voor het digitaliseren van tekst, beeld, geluid en video nader toegelicht.

Transcript of Module 3 | CEST-richtlijnen voor beheerders van digitale collecties | Digitaliseren

CESTRICHTLIJNEN

DIGITALISEREN

• kopieën

• binair coderen

• metadata

digitaliseren (overg.; digitaliseerde, h. gedigita-liseerd) in een digitale code overbrengen

DIGITALISEREN?

BINAIRE CODE

TEKST

BEELD: RASTERAFBEELDING

VIDEO

BEELD: RGB KLEURMODEL

KLEUR & KLEURDIEPTE

RED GREEN BLUE000000000000000000000000000000000000000000000001000000000000000000000010…111111111111111111111111

256 * 256 * 256

= 16,7 miljoen combinaties

BEELD: RGB KLEURMODEL

KLEURDIEPTE

• Aantal bits gebruikt om een kleur te bepalen

• Bepalend voor grootte bestand

BEELD: KLEURRUIMTE

GELUID

GELUID

GELUID: ANALOOG SIGNAAL

GELUID: DIGITAAL SIGNAAL

bestandsformaten

DIGITAAL BESTAND

Om welk type bestand gaat het?

Welk kleurruimte gebruikt het bestand?

Wat beeldt het bestand precies af?

Hoe is het beeld opgebouwd?

De gecodeerde afbeelding zelf.

RESOLUTIE

• sample rate (“bemonsteringsfrequentie”)• uitgedrukt in PPI (beeld) of Hz (geluid)• bepalend voor bestandsgrootte:

• Audio: sample rate x2 bestand x2• 2D: resolutie x2 bestand x4

RESOLUTIE

• Beeld• Pixels per Inch (PPI)• Let op met interpolatie!

• Video• lineaire pixels: 2K, 4K, 8K • originele frame rate

• Audio• Sample frequency: 48 tot 96 kHz

RESOLUTIE BEREKENEN

• 1 inch = 2,56 cm• voorbeeld dia op A4:

21 cm x 300 dpi / 3,6 cm = 1750 ppi• voorbeeld poster op A4:

21 cm x 300 dpi / 70 cm = 90 ppi

breedte gewenste afdruk x gewenste resolutie afdrukbreedte origineel

COMPRESSIE

• Afhankelijk van bestandsformaat• Lossless: geen informatieverlies (bv. LZW, ZIP)• Lossy: artefacten, kleurverlies (JPEG)

• Embedded/extern

• Descriptief: wat is de inhoud van het bestand?

• Administratief: hoe kan/mag ik het bestandgebruiken?

• Structureel: hoe is het bestand opgebouwd?

METADATA

• moederbestand

• archiveringsbestand

• reproductiebestand

• raadplegingsbestand

KOPIEËN

“Een moederbestand is een digitale kopie waarvan verder kopieën worden

afgeleid.”

KOPIEËN: MOEDERBESTAND

“Een archiveringsbestand is een digitale kopie van het oorspronkelijke (digitale of analoge) document in de

hoogst mogelijke kwaliteit - bij voorkeur voldoende hoog om het origineel in geval van vernietiging of

beschadiging te vervangen. Archiveringsbestanden worden gemaakt wanneer het oorspronkelijke document te kwetsbaar is om het te

kunnen raadplegen, of wanneer het verloren dreigt te gaan.

Ze worden bij voorkeur bewaard in een beveiligde opslagomgeving.”

UF: preservation master

KOPIEËN: ARCHIVERINGSBESTAND

“Een reproductiebestand is een digitale kopie waarvan de kwaliteit voldoende hoog is om de

inhoud van het oorspronkelijke (digitale of analoge) document op een betekenisvolle manier

toegankelijk te maken.

Reproductiebestanden worden bij voorkeur bewaard in een beveiligde opslagomgeving en zijn

doorgaans enkel ter beschikking via het intranet van een bewaarinstelling.”

UF: reproduction master, submaster, distributiekopie

KOPIEËN: REPRODUCTIEBESTAND

“Een raadplegingsbestand is een digitale kopie die gebruikt wordt om een document digitaal ter beschikking te stellen. De kwaliteit van een raadplegingsbestand wordt bepaald

door de aard van het gebruik. De kwaliteit is vaak veel lager om de opslagcapaciteit en de benodigde bandbreedte

beperkt te houden en het document makkelijker raadpleegbaar te maken.

Een raadplegingsbestand worden enkel bewaard en beheerd voor de termijn van het beoogde gebruik.

UF: distribution copy, access copy, raadplegingskopie

KOPIEËN: RAADPLEGINGSBESTAND

BEGRIPPEN:

• Concrete gevallen

• Do’s & don’ts

• Minimum standaarden

• Aanbevolen standaar-den

CEST RICHTLIJNEN

• Ik wil mijn fotocollectie digitaliseren

• Ik wil tekstdocumenten digitaliseren

• Ik wil geluidsopnames digitaliseren

• Ik wil video digitaliseren

4 DIGITALISERINGSSCENARIO’S

• Beschrijf steeds de collectie die je digitaliseert

• Maak een moederbestand van voldoende hoge kwaliteit

• Registreer metadata

• Maak archiverings-, reproductie en raadplegingsbestanden

DIGITALISEREN IN 4 STAPPEN

1STE GEBOD: BESCHRIJF DE COLLECTIE

Minimum:

• Beschrijft de (deel)collectie (COMETA)

• Beschrijf het niveau waarop je ontsluit (reeks, stuk)

Aanbevolen:• Beschrijf volgens het 1-op-1-principe (object, inhoud, representatie)

• Beschrijf het niveau van het digitale bestand (reeks, stuk, onderdeel)

• Beschrijf m.b.v. de standaarden voor:• het type collectie (musea, bibliotheek, archief)

• het soort object (tekst, foto, geluid, video)

2DE GEBOD: MAAK EEN MOEDERBESTAND

Algemeen:

• Bewaar een onbewerkte versie van het moederbestand

• Kwaliteitseisen doelstellingen digitalisering• Toegang tot de inhoud?

• Betrouwbare weergave?

• Substitutie origineel?

• Infrastructuur & kennis in huis?

2DE GEBOD: MAAK EEN MOEDERBESTAND (TEKST)

Minimum:

• Open en goed gedocumenteerd formaat

• Beeldformaat: TIFF of JPEG2000, soms JPG of PNG, geen PDF!

• Resolutie: ‘punten’&‘openingen’ ↔ 300ppi

• Bitdiepte: 8bit ↔ 24 bit; sRGB ↔ ECIRGB

• Tekstformaat: UTF-8

Aanbevolen:• TEI

• METS

2DE GEBOD: MAAK EEN MOEDERBESTAND (FOTO)

Minimum:

• TIFF v6.0 Part 1: Baseline Tiff Uncompressed

• Resolutie: 300ppi

• Bitdiepte: 8bit ↔ 24 bit; ECIRGB

Aanbevolen:• JPEG2000, soms JPG, PNG of GIF, geen PDF!

2DE GEBOD: MAAK EEN MOEDERBESTAND (GELUID)

Minimum:

• Magneetbanden reinigen en correct identificeren!

• Vermijd subjectieve correcties!

• Open en goed gedocumenteerd formaat

• Linear Pulse Code Modulatie: 48kHz-96kHz; 24 bit

• Geen compressie!

Aanbevolen:• WAV, AIFF, FLAC

2DE GEBOD: MAAK EEN MOEDERBESTAND (VIDEO)

Minimum:

• Magneetbanden reinigen en correct identificeren!

• Vermijd subjectieve correcties!

• Open en goed gedocumenteerd formaat

• Bewaar beeldeigenschappen (frame rate, aspect ration, etc.)

• Geen compressie!

Aanbevolen:• MXF, AVI, MOV

• MXF/JPEG2000 codering

2DE GEBOD: MAAK EEN MOEDERBESTAND (BESTANDSNAMEN)

Minimum:

• uniek!

• letters

• cijfers

• liggend streepje ( _ )

• koppelteken (-)

Aanbevolen:• Betekenisloze namen (UUID)

• Betekenisvolle namen (collectiecode / identificatienummer)

2DE GEBOD: MAAK EEN MOEDERBESTAND (STRUCTUUR)

Minimum:

• gestructureerd tekstbestand (CSV, XML)

• soms in de bestandsnaam (eenvoudige objecten)

• geen mappen!

Aanbevolen:• XML Schema’s:

• MPEG DIDL

• METS

• PREMIS

3DE GEBOD: REGISTREER ADMINISTRATIEVE METADATA

‘editievermelding’:

• Wie heeft het bestand gemaakt en hoe? (technische data)

• Welke beperkingen rusten op het gebruik ? (rechten data)

• Hoe moet het bestand bewaard worden? (preserveringsdata)

3DE GEBOD: REGISTREER ADMINISTRATIEVE METADATA

Minimum:

• Selecteer de elementen

• Gestructureerd tekstbestand (CSV, XML)

• Of in de header

Aanbevolen:• PREMIS

• Identificeer en valideer (DROID, JHOVE)

4DE GEBOD: MAAK BESTANDEN: ARCHIVERING/REPRODUCTIE

Minimum:

• Archivering: Open

• Reproductie: Open en goed ondersteund

Aanbevolen:• XML/UTF-8

• TIFF

• JPEG2000

• WAV/LPCM

• AIFF/LPCM

• FLAC

• MXF/MJPEG2000

4DE GEBOD: MAAK BESTANDEN: RAADPLEGING

Minimum:

• Breed ondersteund

• Gebruikt door je doelgroep

Aanbevolen:• JPEG2000

• JPG

• PNG

• PDF

• HTML

• MP3

• MPEG-2

• MPEG-4