Robert Gilesse; Digitaliseren van 2D materiaal

Post on 01-Nov-2014

1.548 views 0 download

description

 

Transcript of Robert Gilesse; Digitaliseren van 2D materiaal

Digitaliseren van 2D-materiaal

Studiedag VVBAD 28 april 2011Robèrt Gillesse

Digitaal Erfgoed Nederland

Digitaal Erfgoed Nederland (DEN)

Bevordering en bewaking van de kwaliteit van digitalisering en digitale dienstverlening door de erfgoedsector. Streeft naar

kennisontwikkeling op het gebied van open ICT-standaarden en andere landelijke kwaliteitsprincipes voor duurzame digitalisering.

DEN maakt onderdeel uit van de basisinfrastructuur in de culturele sector, en wordt gefinancierd door het ministerie van OCW.

ICT-Register en DE BASIS

Vlaanderen: CEST

Uw spreker

• Senior medewerker kwaliteitszorg• Verantwoordelijk voor kennisvergaring en verspreiding over o.a. digitalisering, digitale

duurzaamheid en kosten. Projectleider van DE BASIS.

• Meegeschreven aan een aantal digitaliseringsrichtlijnen in Nederland waaronder

die van het Geheugen van Nederland en Metamorfoze.

Deze lezing

•Uitgangspunt: doelstellingen project en de originelen

•Overzicht kwaliteitscriteria•Bestandsformaten, compressie

Pleidooi: niet beginnen bij technische kwaliteitseisen

Denk na over wat je wilt bereiken, de randvoorwaarden, en analyseer te

digitaliseren originelen

Doelstellingen

Vervangen, beschikbaar stellen, registreren, print service, OCR etc

Randvoorwaarden

Beleid, beschikbaar personeel, budget (incidenteel en structureel)

Te digitaliseren materiaal

Neem de tijd voor een grondige materiaalanalyse

Materiaalanalyse

Beredeneerde schattingen hoeveelheden, diversiteit, materiële staat. Maak

inschatting detaillering, heldersheidswaarden, kleurgebruik.

Materiële zaken die reproductieproces kunnen bemoeilijken

A0+ originelen, strak ingebonden boekwerken, nietjes, paperclips, onduidelijke volgorde, moeilijk te

hanteren originelen etc

Bron: Stadsarchief Amsterdam https://stadsarchief.amsterdam.nl/archieven/archiefbank/indexen/tewerkgestelden/voorbeeld/index.nl.html

\

Bron: Stadsarchief Amsterdam

In welke mate moet de digitale reproductie het origineel weerspiegelen?

Wat zijn de essentiële eigenschappen van het origineel die ik in de digitale reproductie wil

terugzien?

Detaillering, helderheidswaarden, kleur

Echter niet vergeten: volledigheid en volgorde

Detaillering

Wat is het kleinste betekenisvolle detail?

Helderheidswaarden

In hoeverre wil je alle stapjes tussen de donkere en lichte partijen in het origineel

waarheidsgetrouw in de digitale reproductie terugzien?

Bron: KB Historische kranten: http://kranten.kb.nl/view/article/id/ddd%3A010340569%3Ampeg21%3Ap002%3Aa0067/layout/fullscreen

Bron: KB Historische kranten: http://kranten.kb.nl/view/article/id/ddd%3A010018133%3Ampeg21%3Ap007%3Aa0136/layout/fullscreen

Kleur

In welke mate van betrouwbaarheid wil je de kleurinformatie in de digitale reproductie bewaren?

Bron: Geheugen van Nederland. Collectie Mauritshuis: http://www.geheugenvannederland.nl/?/nl/items/MAU01:0670

Bron: KB Historische kranten: http://kranten.kb.nl/view/article/id/ddd%3A010340569%3Ampeg21%3Ap002%3Aa0067/layout/fullscreen

Bron: KB Historische kranten: http://kranten.kb.nl/view/article/id/ddd%3A010018133%3Ampeg21%3Ap007%3Aa0136/layout/fullscreen

Waarschuwing!

Vanaf nu…

Wordt het technisch….

Jargon, getallen, testkaarten, meten

Vrees niet!

Techniek is niet leidend, maar dienend

Blijf uitgaan van de originelen en onthoud de doelstellingen van het

project

Edoch, enige kennisontwikkeling kan geen kwaad

…al is het maar om een gesprek te kunnen voeren met de leveranciers

en zelf te kunnen controleren

Vertaling te reproduceren eigenschappen origineel in technische kwaliteitseisen

Eigenschappen origineel Kwaliteitscriteria

Detaillering Resolutie Efficiëntie van de detailreproductie (SFR)

Helderheidswaarden Tonale weergave Bitdiepte

Kleur KleurbetrouwbaarheidKleurruimteBitdiepte

Resolutie

Resolutie = oplossend/scheidend vermogen van een optisch apparaat. Voor scanners en digitale camera’s dit uitgedrukt in pixels per

inch (ppi). In theorie: hoe hoger de resolutie, des te meer detail wordt er

waargenomen.

Resolutie scanner

De aantallen samples die de scanner per inch in de lengterichting produceert. 300

ppi zijn dus 300 samples per inch.

Resolutie camera

Een digitale camera produceert over algemeen een vaste hoeveelheid pixels: megapixels. Door

de camera op een bepaalde hoogte te fixeren wordt de resolutie ten opzichte van het

opnamevlak bepaald. Hoe hoger de camera hangt, des te lager de resolutie.

Koppelen detaillering aan resolutie

Lettergrootte Kleinste betekenisvolle detail

Aanbevolen resolutie

1 mm (“beursberichten”) 0,2 mm 300 ppi

1,5 mm (“normale drukletter”)

0,3 mm 200 ppi

2 mm (“grote letter”) 0,4 mm 150 ppi

Bron: Aanbevelingen voor digitalisering van tekstdocumenten ten behoeve van het concern Amsterdam http://stadsarchief.amsterdam.nl/stadsarchief/e-depot/downloads_en_links/digitalisering_tekstdocumenten.pdf

Koppelen resolutie aan afdrukgrootte

Waar kleinste betekenisvolle detail moeilijk vast te stellen en/of afdrukken een belangrijke rol

speelt wordt soms gekozen voor koppeling afdrukgrootte aan resolutie. Bijv 300 ppi A4 of

A3. DE BASIS: <A5 600 ppi, >A2 150 ppi.

Resolutie en bestandsgrootte

De resolutie bepaalt deels de bestandsgrootte. Naarmate resolutie oploopt, neemt de bestandsgrootte

exponentieel toe.

Grote originelen en resolutie

Grote originelen met veel detaillering als bouwtekeningen of kaarten hebben

hoge resolutie nodig, dus grote bestanden. Bestandsgrootte te

temperen door toepassing compressie.

Bron: Fries Scheepvaartmuseum, http://fsm.pictura-dp.nl/nl/zoeken-in-de-collectie/indeling/detail/start/725/trefwoord/Subcategorie/bouwtekeningen%20gebouwen

Resolutie geen sluitend kwaliteitscriterium betreft detail reproductie

Scherptemeting middels fotografische testkaarten en software geeft pas echt

indicatie waargenomen detail

Dit is 300 ppi

Dit is ook 300 ppi

Helderheidswaarden

Gekoppeld aan kwaliteitscriteria bitdiepte en de tonale weergave

Eerste keuze: bitdiepte.

Hoeveelheid helderheids- of kleurwaarden per pixel

Bitonaal, in grijswaarden of in kleur reproduceren

1 bit bitonaal: de pixel is exclusief zwart of wit

Bron: KB Historische kranten: http://kranten.kb.nl/view/article/id/ddd%3A010018133%3Ampeg21%3Ap007%3Aa0136/layout/fullscreen

8 bits grijswaarden: de pixel heeft de keus tussen 256 grijswaarden

Bron: KB Historische kranten: http://kranten.kb.nl/view/article/id/ddd%3A010340569%3Ampeg21%3Ap002%3Aa0067/layout/fullscreen

24 bits RGB (Red, Green, Blue): de pixel heeft de keus tussen 16.7 miljoen kleurwaarden

Bron: KB Historische kranten: http://kranten.kb.nl/view/article/id/ddd%3A010340569%3Ampeg21%3Ap002%3Aa0067/layout/fullscreen

Bitonale scanning

Alleen te overwegen voor niet vergeeld drukwerk met duidelijke drukletter. Voor gemiddeld archiefmateriaal dus minder geschikt. Ook minder geschikt voor OCR.

Bitdiepte en bestandsgrootte

Bitdiepte bepaalt mede bestandsgrootte:8 bits 8 maal zo groot als 1 bit, en 24 bits 3

maal zo groot als 8 bits.

Tweede: bepalen kwaliteit van de tonale weergave

Kwaliteit van de gereproduceerde helderheidswaarden. In hoeverre moet het hele

spectrum tussen de donkere en lichte partijen (=de tonale weergave) in het origineel in de digitale

reproductie terugkeren?

Eisen aan tonale weergave • Eis bij bitonale scanning: wordt de drempel

tussen zwart en wit op een juiste manier bepaald? •Eis grijswaarden en kleurenscanning: Minimale

aanbeveling: voorkomen overbelichting. • Verdergaand: vaststellen juiste belichting en contrastoverdracht (Metamorfoze richtlijnen).

Optische testkaart: grijstrap

Kleurweergave

In hoeverre moet de kleurinformatie van het origineel terugkeren in de

digitale reproductie?

Kleurbetrouwbaarheid

In drie stappen van toenemende betrouwbaarheid en complexiteit:

1. Visuele controle2. Vaststellen kleurzweem

3. Vaststellen delta E waardes (kleurmanagement)

Optische testkaart: Gretag Macbeth

Kleurruimte

•Mathematisch driedimensionaal model dat kleur op numerieke manier beschrijft.

• Elke scanner of camera werkt intern met een eigen unieke kleurruimte.

• Vertalen naar een gestandaardiseerde kleurruimte die los staat van de hardware.

•Keuze kleurruimte is belangrijk voor duurzame toegankelijkheid.

Aanbevolen kleurruimtes

•AdobeRGB •ECI-RGBv2•sRGB

Bestandsformaten

Algemeen uitgangspunt: open standaarden, veel gebruikt.

Bestandsformaten voor 2d afbeeldingen

•TIFF en JPEG meest voor de hand liggende formaten

•JPEG2000 in mindere mate•PDF/A kan worden gebruikt voor gedigitaliseerde tekstdocumenten

Compressie

Slim hergroeperen (encoderen) van computerdata waardoor het bestand in

omvang afneemt. Dit kan op een lossless of lossy manier.

Bestandsformaten en compressie

• TIFF veelal ongecomprimeerd• JPEG variabele lossy compressie

•JPEG2000 lossless en variabele lossy compressie• PDF/A ondersteunt verschillende

compressietechnieken

Compressie en bestandsgrootte

•JPEG2000 lossless compressie levert hoogstens 50% opslagwinst op

• JPEG lossy compressie kan tot 90% opslagwinst opleveren zonder verlies beeldkwaliteit• JPEG2000 lossy compressie 95%

•Wanneer enig verlies van kwaliteit aanvaardbaar is, kan nog veel meer opslagwinst worden behaald

Veel discussie over toepassen van compressie

Ter relativering: hele reproductieproces is een vorm van “compressie” ten opzichte van het

origineel

Nadelen compressie

•Kwetsbaarder voor omvallen bits •Complexiteit bestand zou duurzaamheid

kunnen schaden•Verlies van beeldkwaliteit (bij lossy

compressie)

Voordelen compressie

•Lagere kosten opslag •Eenvoudiger redundant op te slaan

•Geen verschil tussen offline (master) en online (access) bestand

Pragmatisch gebruik compressie

Bulkdigitalisering: voor gemiddeld archiefdocument gebruik lossy compressie geen enkel probleem. Zeker voor grotere

originelen – bouwtekeningen – stevige lossy compressie aanbevolen.

Aangaande discussie compressie

Lees: Marc Holtman, Digitalisering ontrafeld, Stadsarchief Amsterdam, 2006.

Samenvattend: bestandsgrootte

Bestandsgrootte wordt bepaald door 4 factoren, waarvan de laatste 3 variabel:

1. Afmeting origineel2. Resolutie3. Bitdiepte

4. Al dan niet gebruik compressie

Kwaliteitscontrole

•Technische kwaliteitscriteria (met behulp testkaarten)•Volledigheid•Volgorde•Metadata