Vervanging en kwaliteitseisen

Post on 24-Jan-2015

913 views 0 download

description

Over het toepassen van intelligent scannen in werkprocessen met aandacht voor kwaliteitszorg

Transcript of Vervanging en kwaliteitseisen

1

Kun je dan iedereen laten scannen?

2

Regeling 15 december 2009 Archiefregeling Artikel 16. Kwaliteitssysteem De zorgdrager

zorgt ervoor dat het beheer van zijn archiefbescheiden voldoet aan toetsbare eisen van een door hem toe te passen kwaliteitssysteem

Artikel 20. Toegankelijke staat De zorgdrager zorgt ervoor dat het archiveringssysteem de toegankelijke staat van archiefbescheiden waarborgt, zodanig dat elk van de archiefbescheiden binnen een redelijke termijn a.kan worden gevonden

1°.aan de hand van de daaraan gekoppelde metagegevens; of 2°.door middel van een andere ontsluitingsmethode; en

b.leesbaar of waarneembaar te maken is.

3

Artikel 26. Algemene eisen aan opslagformaten voor digitale archiefbescheiden

1. Digitale archiefbescheiden worden, uiterlijk op het tijdstip van overbrenging, opgeslagen in een valideerbaar en volledig gedocumenteerd bestandsformaat dat voldoet aan een open standaard, tenzij dit redelijkerwijs niet van de zorgdrager kan worden verlangd. Alsdan vindt met de beheerder van de voor overbrenging aangewezen archiefbewaarplaats overleg plaats over een alternatief bestandsformaat.

2. Voor zover op het tijdstip van overbrenging gebruik wordt gemaakt van encryptietechniek, wordt aan de beheerder van de archiefbewaarplaats de bijbehorende decryptiesleutel verstrekt.

3. Gebruikmaking van compressietechniek is slechts toegestaan, voor zover daarbij niet zodanig verlies van informatie optreedt, dat niet langer aan de bij deze regeling gestelde eisen ten aanzien van de toegankelijke en geordende staat van digitale archiefbescheiden kan worden voldaan.

4

Niet langer wordt voorgeschreven welke resolutie gescan moet worden.

Niet langer wordt compressie per definitie verboden.

5

7

Hoeveel bit?

a) Bilevel

b) Greyscale

c) Indexed color

d) Full color

Hoeveel DPI?

a) 100 DPI

b) 200 DPI

c) 300 DPI

d) Meer?

Welke samenstelling

a) Single page

b) Multipage

c) Bookmarks

d) OCR

Welke format

a) tiff

b) jpg

c) PDF

d) PDF/A-1b

e) ODF ????Indexering

a) Document

b) Zone OCR

c) Tagged Metadata

8

9

1. Document analyse

2. Stel output structuur en vorm vast

3. Bepaal scannersoort

4. Kies juiste aansturing scanner

5. Bepaal en richt het imaging proces in

6. Validatie

7. Logprocedures

10

1. Imaging post processing1. Logdata scanoutput2. Image enhancement3. QC image kwaliteit4. Herkennen barcodes/patchcodes5. Structureren output6. Vastleggen Metatags

1. Data extractie door OCR2. Data Entry

7. Full tekst OCR8. Volledigheidscontrole9. Definitieve Output

Gebruik van OCR techniek om archiefstructuren vast te leggen Bijvoorbeeld door barcodes, zone

herkenning of combinatie van factoren.

OCR (Optical Character Recognition) ICR (handprint recognition) OMR (checkmark recognition) Barcode herkenning Document conversie met accurate layout PDF conversion naar PDF/A of PDF 1.7 Vaste en semi-gestructureerde

formulieren en documentvastlegging Document classificatie

12

13

Vaste structuren:Vragenlijsten, enquetes, multiple choice testen, vaak handgeschreven Identieke layout

Semi-gestructureerd:Facturen, prijslijsten, paspoorten, vrachtbrieven, inkoop orders Gelijke data maar andere layouts

Ongestructureerd:Contracten, brieven, artikelenOngestrucureerde inhoud en verschillende layouts

14

15

Document Analyse (DA) maakt het verschilDA met behoud van de

Layout (FineReader) “Eigen factuur DA Logic” (FlexiLayout)

16

Combinerendocumenten met

voorbladen

AanleverenDIV

Geautomatiseerdscannen

Output:CSV bestandImagefiles

Importscript

DM Applicatie

Werkprocesapplicatie

export DBgegevens

Printenmachine-herkenbarevoor-tussenbladen

Invullenmetagegevens

Kwaliteits-controles

Processing CorsaExtractor

Validerenmetagegevens

Veel voorkomende misverstanden Kwaliteitszorg kost te veel Wij hebben VRS dus dat hoeft niet De scanoperator is verantwoordelijk

17

De kwaliteit wordt door de scanoperator bewaakt

………….. toch?18

19

20

Quality Index :3 = nauwelijks leesbaar3.6 = marginaal5 = goed8 = uitstekend

Stel een A4 document met als kleinste letter de letter “e” met een hoogte van 2 millimeter.

Doelstelling is een goede kwaliteit binaire scan te maken (Q1=5). Gewenste resolutie wordt dan:

3x5 / 0,039 x 2mm= 15 / 0,078 = 192dpi (200 dpi)

De Quality Index gebruiken bij binair scannen:• dpi = 3QI / (.039h)• QI = dpi x .039h)/3• h = 3QI / (.039dpi)

21

Stel een A4 document met als kleinste letter de letter “e” met een hoogte van 2 millimeter.

Doelstelling is een goede kwaliteit scan met 256 grijswaarden te maken. Gewenste resolutie wordt dan:

2x5 / 0,039 x 2mm= 10 / 0,078 = 128dpi (150 dpi)Quality Index :3 = nauwelijks leesbaar3.6 = marginaal5 = goed8 = uitstekend

De Quality Index gebruiken bij grijs of kleur scannen:• dpi = 2QI / (.039h)• QI = dpi x .039h)/2• h = 2QI / (.039dpi)

22

1. Zwart wit scannen documenten; 300DPI

2. Kleur scannen documenten; 200DPI

3. Scannen t.b.v. OCR; 300DPI

4. Zwart wit scannen tekeningen; 200DPI

5. Scannen voor internet; 100DPI

6. Historische documenten; grijs of kleur

7. Zwakke documenten; grijs of kleur

De meeste Dm systemen hebben een geïntegreerde scanmodule. Je keurt dan in één keer de batch goed. Leveranciers wordt wakker! Klant, neem geen genoegen met nee!

23

zorgt voor: Betrouwbaarheid Continuïteit Vertrouwelijkheid Integriteit Authenticiteit

24

25

Zorgt voor onafhankelijke toetsing Laat zien: wie wat wanneer Biedt differentiatie in het keuren

Onafhankelijke toetsing; Dus niet de scanoperator Kwaliteitszorg als benoemde functie

26

We willen ook achteraf kunnen zien wie de toetsing heeft gedaan, op welke bestanden en wanneer dat is uitgevoerd.

27

Zware fouten Compromitteert de informatie

Lichte fouten Cosmetisch maar niet kritiek

28

het formaat van de bestanden is fout er is incoherentie tussen beelden en namen van de

bestanden één of meerdere pagina's ontbreken in een dossier de afmetingen van het beeld zijn niet conform de

specificaties de resolutie is niet conform de specificaties het beeld staat meer dan 2° scheef ten opzichte van zijn

as er is een geometrische vervorming van het beeld het beeld werd verminkt tijdens het scannen sommige tekstzones zijn niet leesbaar

29

de ligging van het beeld is niet correct (bijvoorbeeld geroteerd)

er zit een halo rond het beeld het ruisniveau is overdreven er zijn overblijvende sporen van de scanning- en

behandelingsprocedure (strepen, banen, ruis...) het beeld is horizontaal niet gecentreerd en niet

gealigneerd aan het bovenste deel aan de kantlijn het contrast en de helderheid zijn onaangepast onvoldoende helderheid er zijn interferentiezones

30

Voer een relevante steekproef uit. Start met 20% van alle images Bij goed gevolg, bouw af tot 5%

31

Kies voor 3 tot 5 promille voor zware fouten

Kies voor 5 % lichte fouten

32

Na een eerste afkeur, verhoog de steekproef met 5 %

Wanneer dan nog een te hoog percentage fouten wordt gevonden; Onderzoek wat de oorzaak is. Herverwerk de betreffende batch

33

Iso 2859

34

Een zorgvuldige validatie van de output op PDF/A 1b is aan te bevelen.

Verschillende leveranciers leveren daartoe tools: Adobe Apagao Callas Software AG PDF Tools AG Intarsys Seal Systems AG Solid Documents

35

36