Ambtenaar 2.0 vervanging en het nieuwe werken

42
Digitaliseren DE START VAN HET NIEUWE WERKEN DOOR: LEON VAN OOSTEROM ELVEO B.V.

description

Presentatie over scantechnieken, formaatkeuzes, kwaliteitsborging en technische scanfeiten en de relatie tot de handreiking vervanging van Archief 2020 uit 2014

Transcript of Ambtenaar 2.0 vervanging en het nieuwe werken

Page 1: Ambtenaar 2.0 vervanging en het nieuwe werken

DigitaliserenDE START VAN HET NIEUWE WERKEN

DOOR: LEON VAN OOSTEROMELVEO B.V.

Page 2: Ambtenaar 2.0 vervanging en het nieuwe werken

Workshop Ambtenaar 2.0 door Leon van Oosterom, Informatiearchitect

Politici en beleidsmakers moeten

04 feb 2014 Binnenlands Bestuur

Politici en beleidsmakers moeten ,,digitaler'' denken. Ze zouden digitalisering ruimer moeten opvatten. Dat zei prins Constantijn dinsdag in Brussel.

Kabinetschef KroesBij digitalisering gaat het om meer dan een industriële sector of een technologie. ,,Het is veel meer dan dat'', benadrukte Constantijn als kabinetschef van Europees Commissaris Neelie Kroes (Digitale Agenda). Omdat haar mandaat deze herfst na 5 jaar eindigt, maakte Constantijn een eerste balans op.

IndustrieEen van de problemen is dat digitalisering en ICT slechts als een van vele industrieën wordt beschouwd, aldus de kabinetschef: ,,Dat is het niet''. De digitalisering speelt inmiddels in praktisch heel de samenleving een niet meer weg te denken rol.

Page 3: Ambtenaar 2.0 vervanging en het nieuwe werken

Workshop Ambtenaar 2.0 door Leon van Oosterom, Informatiearchitect

Of deze, uit NU 4 februari 2014Boete Barclays voor slecht elektronisch archief

Barclays moet in de Verenigde Staten een boete van 3,75 miljoen dollar, circa 2 miljoen euro, betalen omdat de Britse bank zijn elektronisch archief slecht bijhield. De boete is uitgedeeld door toezichthouder Financial Industry Regulatory Authority (Finra) schrijft de BBC vrijdag.

Foto:  ANP

Barclays heeft volgens de Finra tussen 2002 en 2012 onvoldoende gegevens bewaard over orders, deals en rekeningen.Ook zijn mails en chatberichten niet opgeslagen of zijn er geen maatregelen genomen om te voorkomen dat informatie werd gewist of veranderd.

Page 4: Ambtenaar 2.0 vervanging en het nieuwe werken

Moraal

Als je dan toch digitaal gaat, kun je het maar beter goed doen!

Page 5: Ambtenaar 2.0 vervanging en het nieuwe werken

HANDREIKING VERVANGING ARCHIEFBESCHEIDEN• Archief 2020

•Positief - Alle noodzakelijke stappen voor het doen vervangen van analoge archiefbescheiden staan helder geformuleerd in één samenvattend document (92 pagina’s)

•Negatief - Eisen ten aanzien van beeldkwaliteit en kwaliteitsmetingen zijn geënt op Metamorfoze

(oftewel technische eisen ten aanzien van erfgoedmateriaal)

Page 6: Ambtenaar 2.0 vervanging en het nieuwe werken

Workshop Ambtenaar 2.0 door Leon van Oosterom, Informatiearchitect

Tijd- en plaatsonafhankelijk werken• Keuzes

• Vervangen of digitaliseren, wat is het verschil

• Uitbesteden of zelf doen

• Hoe begin je• Voorwerk• Decentraal of centraal scannen

• Hoe bepaal je de scannerkeuze

• Kwaliteit en borging

• Het DMS en vakapplicaties

Page 7: Ambtenaar 2.0 vervanging en het nieuwe werken

Workshop Ambtenaar 2.0 door Leon van Oosterom, Informatiearchitect

Keuzes bij het starten van digitaal werken

UITBESTEDEN

• Cultuur historische materialen

• Grote gestructureerde archiefcollecties

ZELF DOEN

• Routinematige vervanging

• On demand

Waar laat ik het papier?

Page 8: Ambtenaar 2.0 vervanging en het nieuwe werken

Workshop Ambtenaar 2.0 door Leon van Oosterom, Informatiearchitect

Het postproces vervangen of digitaliseren• Inventariseer de binnenkomende poststromen

• Communiceer met de ontvangende afdelingen over de impact

• Stel kaders vast voor wie doet wat• Post- en werkverdeling, DIV of vakafdeling

• Toevoegen metadata, DIV of vakafdeling?

• Koppelen aan werkprocessen, DIV of vakafdeling?

Page 9: Ambtenaar 2.0 vervanging en het nieuwe werken

Workshop Ambtenaar 2.0 door Leon van Oosterom, Informatiearchitect

Documentstromen en valkuilen• De keuze voor een scanner en scansofware is een

autonome keuze

• Hoe weet je zeker dat alles compleet gescand is

• Gaat een binnenkomend poststuk via het DMS of via de vakapplicatie

• Wat doe je met de uitgaande post• Printen / scannen versus digitaal houden en elektronisch archiveren

• Gekoppelde sjabloongeneratoren en het DM systeem.

• Hoe om te gaan met ‘digitale’ handtekeningen.

Page 10: Ambtenaar 2.0 vervanging en het nieuwe werken

Workshop Ambtenaar 2.0 door Leon van Oosterom, Informatiearchitect

Wat voor documenten komen we tegen

•Archieven zowel in overheidsomgeving als in het bedrijfsleving kenmerken zich door een grote verscheidenheid aan soorten materiaal, kwaliteiten en eigenschappen.

Bijvoorbeeld Bouw/milieu dossiers:

• Aanvragen

• Vergunningen

• Handhaving

• Overige bescheiden

• Berekeningen

• Tekeningen

Page 11: Ambtenaar 2.0 vervanging en het nieuwe werken

Okay: het scannen

Welke samenstelling

a) Single page

b) Multipage

c) Bookmarks

d) OCR

Page 12: Ambtenaar 2.0 vervanging en het nieuwe werken

Workshop Ambtenaar 2.0 door Leon van Oosterom, Informatiearchitect

Technische keuzes

IMAGING ASPECTEN

• Beeldkwaliteit• Resolutie (scherpte)

• Kleurbehoud

• Compressie

• Metadata

• Foutmarges

• Bestandsformaten

APPARATUUR

• Soorten scanners• Flatbed

• Multifunctionals

• Doorvoerscanners

• Groot formaat scanners

• Digitale achterwanden

• Boekscanners

Page 13: Ambtenaar 2.0 vervanging en het nieuwe werken

Workshop Ambtenaar 2.0 door Leon van Oosterom, Informatiearchitect

Scanners en aansturingNaast de aanschaf van de scanner hoort ook de aanschaf van de scansoftware.

Er is ruim keuze aan intelligente software om scanners aan te sturen. Laat je goed informeren

Scansoftware

• Kofax• EasySeparate• Abbyy Flexicapture• DPUscan• Papervision• IrisPowerscan• Kodak Capture Pro• …………..En veel meer

Page 14: Ambtenaar 2.0 vervanging en het nieuwe werken

Workshop Ambtenaar 2.0 door Leon van Oosterom, Informatiearchitect

De workflow scannen

• Opschonen• Ontnieten• Scheidingsbladen / barcodes toevoegen

Stap 1 werkvoorbereiding

Page 15: Ambtenaar 2.0 vervanging en het nieuwe werken

Workshop Ambtenaar 2.0 door Leon van Oosterom, Informatiearchitect

Archiefbesluit 1995 artikel 6

JUISTE EN VOLLEDIGE WEERGAVE

• welke aspecten van het origineel (bijvoorbeeld kleur en scherpte) zijn wezenlijk voor de juistheid en volledigheid van de daarin voorkomende gegevens.

• Heeft kleur een informatieve waarde of is deze essentieel voor correcte reproductie van het origineel!!!!

Page 16: Ambtenaar 2.0 vervanging en het nieuwe werken

Workshop Ambtenaar 2.0 door Leon van Oosterom, Informatiearchitect

Vaststellen van de resolutie, volgens handreiking vervanging Archief 2020 1/2• 1 mm zespunts letter ‘e’ als uitgangspunt

• Uitgangspunt voor meting van detailwaarneming is de 1 mm onderkast letter ‘e’ (zespunts letter). Dit is namelijk de kleinste letter die in kranten (beursberichten) wordt gebruikt. Voldoende reproductie van deze letter garandeert dat alle letters van zespunts en groter goed leesbaar zullen zijn.

Met voldoende reproductie wordt hier bedoeld

• • Letter loopt niet dicht

• • Alle lijnen en details van de letter zijn te onderscheiden

• • De lijnen van de letter zijn duidelijk van de achtergrond gescheiden

• • De letter is niet rafelig

• Het kleinste onderdeel van een zespunts letter is ongeveer 0.2 mm groot. De reproductie van een zespunts letter garandeert dus de reproductie van details die groter of gelijk zijn aan 0.2 mm.

Page 17: Ambtenaar 2.0 vervanging en het nieuwe werken

Workshop Ambtenaar 2.0 door Leon van Oosterom, Informatiearchitect

Vaststellen van de resolutie, volgens handreiking vervanging Archief 2020 2/2• Hoeveelheid benodigde lijnenparen/mm en

opnameresolutie om een 1 mm zespunts letter te kunnen reproduceren

• Om een detail van 0,2 mm (en daarmee een 1 mm zespunts letter) te kunnen reproduceren is een minimum van 5 lp/mm nodig. Deze berekening gaat uit van de premisse dat om een detail voldoende te kunnen oplossen minimaal één lijnenpaar nodig is. Voor een detail van 0.2 mm zijn dus vijf (1/0.2) lp/mm nodig.

• Voor verschillende resoluties is dit: • 400 ppi = 7,9 lp/mm

• 300 ppi = 5,9 lp/mm

• 200 ppi = 3,9 lp/mm

• 150 ppi = 2,9 lp/mm

Page 18: Ambtenaar 2.0 vervanging en het nieuwe werken

Workshop Ambtenaar 2.0 door Leon van Oosterom, Informatiearchitect

Vaststellen van de resolutie, veilige keuzes1. Zwart wit scannen documenten; 300DPI

2. Kleur scannen documenten; 200DPI

3. Scannen t.b.v. OCR; 300DPI óók bij kleur

4. Zwart wit scannen tekeningen; 200DPI

5. Scannen voor internet; 100DPI

6. Historische documenten; grijs of kleur 300 DPI

7. Zwakke documenten; grijs of kleur 300 DPI

Page 19: Ambtenaar 2.0 vervanging en het nieuwe werken

Workshop Ambtenaar 2.0 door Leon van Oosterom, Informatiearchitect

Zwart/wit of kleur

Kleur

Voordelen• Authenticiteit• Behoud van informatie

Nadelen•Grote bestanden•Mail-probleem•Servercapaciteit•Bandbreedte•De Metamorfoze richtlijnen

Page 20: Ambtenaar 2.0 vervanging en het nieuwe werken

Workshop Ambtenaar 2.0 door Leon van Oosterom, Informatiearchitect

Zwart/wit of kleur en de archiefregelingHandreiking Vervanging van Programma Archief 2020, Ministerie van OCW samen met gemeenten, waterschappen en provincies.

• De grote afweging:

Informatiefunctie en/of erfgoedbelang

• Risicoafwegingen

1. zijn er risico’s van toepassing?

2. hoe vaak komen deze voor?

3. wat is de impact bij verwaarlozing hiervan?

4. welke interne normen worden hierbij gehanteerd?

Page 21: Ambtenaar 2.0 vervanging en het nieuwe werken

Workshop Ambtenaar 2.0 door Leon van Oosterom, Informatiearchitect

Scanner-output toegelicht• één pagina A4 op 300 PPI 24 bits kleur levert

“lossless” een bestand op van 25 Mb.

• één echte productiescanner (vanaf 120 vel per minuut) genereert in raw scan-formaat (masterbestanden) per dag 1 tot 1½ Terabyte

• voor 100 meter archief in raw scanformaat is bijna 10 Terabyte geheugenruimte nodig (1 meter = 100 Gbyte)

Het gebruik van lossless kleurenbestanden zal dus niet veel gebruikt kunnen worden voor de “informatiebehoefte”

Page 22: Ambtenaar 2.0 vervanging en het nieuwe werken

Workshop Ambtenaar 2.0 door Leon van Oosterom, Informatiearchitect

Waarom is compressie zo beladen en oh zo belangrijk• Uitleg verschil lossless en lossy

• Uitleg Jpeg en Jpeg2000

• Zie ook: Digitalisering ontrafeld, technische aspecten van digitale reproductie van archiefstukken (Stadsarchief Amsterdam)

Page 23: Ambtenaar 2.0 vervanging en het nieuwe werken

De compressiemogelijkheden bij de meeste scannersJPEG (Joint Photographic Editor Group)

Quality (Kwaliteit) wanneer u JPEG-compressie kiest, selecteert u een van de kwaliteitsopties:• Concept: een maximale compressie waarbij het kleinste beeldformaat wordt

geproduceerd.• Goed: een redelijke hoeveelheid compressie, maar toch met een acceptabele

beeldkwaliteit.• Beter: enige compressie met een behoorlijke beeldkwaliteit.• Best: een minimale compressie met een zeer goede beeldkwaliteit.• Superieur: de minste hoeveelheid compressie waarbij het grootste beeldformaat

wordt geproduceerd.

Page 24: Ambtenaar 2.0 vervanging en het nieuwe werken

Workshop Ambtenaar 2.0 door Leon van Oosterom, Informatiearchitect

Tabel Jpeg versus Jpeg 2000

Bron: Digitalisering ontrafeld, stadsarchief Amsterdam

Page 25: Ambtenaar 2.0 vervanging en het nieuwe werken

Workshop Ambtenaar 2.0 door Leon van Oosterom, Informatiearchitect

Image Jpeg versus Jpeg 2000 1/2

Bron: Digitalisering ontrafeld, stadsarchief Amsterdam

PSD204,21Mb

Jpeg2000

PSD 104,62 Mb

Jpeg

Jpeg2000

PSD82,57 Mb

Jpeg

20,5 Mb

Raw scan

Page 26: Ambtenaar 2.0 vervanging en het nieuwe werken

Workshop Ambtenaar 2.0 door Leon van Oosterom, Informatiearchitect

Image Jpeg versus Jpeg 2000 2/2

Tiff 25,7 Mb

JPG2000 6,1 Mb

JPG 12 4,6 Mb

JPF 70 1,0 Mb

JPG 8 644 Kb

JPF 20 313 Kb

Page 27: Ambtenaar 2.0 vervanging en het nieuwe werken

Workshop Ambtenaar 2.0 door Leon van Oosterom, Informatiearchitect

Hoe bepaal ik dan de beste scankwaliteit• Keuze 1: volg de Metamorfoze methode uit de

handreiking vervanging Archief2020 door gebruik te maken van een technische testkaart (UTT) en controleer op:

• Kleurzweem en kleurafwijking (Delta E) • Scherpte (detail reproductie) • Uitlichting • Geometrische vervorming • Kleurmisregistratie • Witbalans • Belichting • Dynamisch bereik (OECF) • Ruis

Let op: scannen volgens

de Metamorfoze

richtlijnen kost meer geld

en lang niet iedere

scanner voldoet!

Page 28: Ambtenaar 2.0 vervanging en het nieuwe werken

Workshop Ambtenaar 2.0 door Leon van Oosterom, Informatiearchitect

Hoe bepaal ik dan de beste scankwaliteit visueel• Keuze2: Controleer visueel op:

• Kleinste detail nog leesbaar

• Is scherpte gelijk aan het origineel. Geen halo’s of witte omrandingen bij tekst

• Voldoende contrast (barcodes!!!!!!!!)

• Alle scanlijnen aanwezig, zowel horizontaal als verticaal

• Zijn er scansporen aanwezig, vervuiling, transportrollers e.d.

• Is er vervuiling zichtbaar, door b.v. lijmresten op de lenzen

• Zijn er spiegelingen, vervormingen of andere onbedoelde effecten zichtbaar

Page 29: Ambtenaar 2.0 vervanging en het nieuwe werken

Workshop Ambtenaar 2.0 door Leon van Oosterom, Informatiearchitect

Metadata toekennen• Gebruik van OCR

techniek om archiefstructuren en metadata vast te leggen• Bijvoorbeeld door barcodes,

zone herkenning of combinatie van factoren.

• Handmatige data-entry

• Een combinatie

• OCR – Optical Character Recognition

• ICR – Intelligent Character Recognition

• OMR – Optical Mark Recognition

• Barcode• Handschrift• Semantische

classificatieClassificatie-

tools

Page 31: Ambtenaar 2.0 vervanging en het nieuwe werken

Workshop Ambtenaar 2.0 door Leon van Oosterom, Informatiearchitect

Bestandsformaten 1/1• Tiff

• JPEG

• PNG

• JPG2000

• ODF

• PDF 1.7

• PDF/A 1a, 1b, 2a, 2b

• JPEG 2000 image compressie • Meer geavanceerde

ondersteuning• digitalw handtekening

OpenType fonts • 3D graphics • Audio/video content • Consistentie met andere op

PDF-gebaseerde standaarden

Waarom 2a/b?

Page 32: Ambtenaar 2.0 vervanging en het nieuwe werken

Tiff uncompressed volume

• één pagina A4 op 300 DPI 24 bits kleur levert een bestand op van 25 Mb.

• één productiescanner genereert per dag 1 tot 1½ Terabyte

• voor 100 meter archief is bijna 10 Terabyte geheugenruimte nodig (1 meter = 100 Gbyte)

32

Page 33: Ambtenaar 2.0 vervanging en het nieuwe werken

JPEGHet JPEG-algoritme verdeelt de afbeelding in blokken van 8 bij 8 pixels en neemt het gemiddelde van de kleuren van al deze pixels. Het bewaart dit gemiddelde als de waarde voor de pixel linksboven in het blok.

De kleuren van de andere pixels worden dan weergegeven als relatief tot de eerste pixel. Nu hoeven voor de resterende 63 pixels niet meer zoveel bits gebruikt te worden, omdat het kleurverschil tussen een pixel in het blok en het gemiddelde niet zo groot is.

Vervolgens wordt het proces herhaald: er worden blokken gemaakt van 8 bij 8 blokken, waarbij zoveel mogelijk pixels dezelfde kleur wordt gegeven

33

Page 34: Ambtenaar 2.0 vervanging en het nieuwe werken

Uitleg Jpeg 2000 compressie

34

Achtergrondkleuren / maximale compressie

Details en tekst / groep 4 compressie

Voorgrondkleuren / minimale compressie

Page 35: Ambtenaar 2.0 vervanging en het nieuwe werken

Pdf/a is géén garantie

• Tussen het scanmoment en de daadwerkelijke vorming van een PDF/A bestand kan veel misgaan!• PDF/A voorschriften.

• Metadatavelden (XMP tags)

• Resolutie en compresssie?

• Validatiecriteria vast?

35

Page 36: Ambtenaar 2.0 vervanging en het nieuwe werken

36

Page 37: Ambtenaar 2.0 vervanging en het nieuwe werken

Validatie pdf/a bestanden

• Een zorgvuldige validatie van de output op PDF/A is aan te bevelen.

• Verschillende leveranciers leveren daartoe tools:• Adobe

• Apagao

• Callas Software AG

• PDF Tools AG

• Intarsys

• Seal Systems AG

• Solid Documents

37

Page 38: Ambtenaar 2.0 vervanging en het nieuwe werken

Hoe zit dat nu precies met ODF• Is toch een open standaard en staat op de lijst “Pas toe

of leg uit”

ODF is een Open Office uitwisselingsformaat, bedoeld voor de actieve fase van een document.

Let op bij Spreadsheets bijvoorbeeld:

• Is weergave en precieze reproductie van het origineel van belang, kies PDF/A.

• Is gedrag (formules/berekening) van belang, kies ODF.

Page 39: Ambtenaar 2.0 vervanging en het nieuwe werken

Workshop Ambtenaar 2.0 door Leon van Oosterom, Informatiearchitect

De kosten van het digitaal gaan:Meten is weten• Hoe lang duurt het scannen

• Hoe lang duurt het verwerken van de scans

• Is de in-out controle automatisch

• Hoeveel scanfouten komen er voor • wat vinden we acceptabel

• Wat doen we er aan

Page 40: Ambtenaar 2.0 vervanging en het nieuwe werken

Workshop Ambtenaar 2.0 door Leon van Oosterom, Informatiearchitect

Hoe snel is de scanner in praktijk• Hoe lang duurt het scannen

De opgegeven scansnelheid en de 70% regel

Landscape of portret

Bereken op voorhand piekmomenten en stem daar de benodigde scancapaciteit op af.

Invloed•Resolutie•Geheugen PC•Netwerk bandbreedte•Aantal processoren•Videokaart•USB poort

Page 41: Ambtenaar 2.0 vervanging en het nieuwe werken

Workshop Ambtenaar 2.0 door Leon van Oosterom, Informatiearchitect

Werkvoorbereiding, onderschat het niet• Opschonen

• Ontnieten

• Uit hechters nemen

• Scheidingsbladen, barcodes, patchcodes, verwijzingsbladen, tokkelbladen

Page 42: Ambtenaar 2.0 vervanging en het nieuwe werken

Workshop Ambtenaar 2.0 door Leon van Oosterom, Informatiearchitect

Tijd voor vragen

Dank voor uw aandacht en graag tot ziens

Leon van [email protected]