Missen is menselijk

19
Missen is menselijk, en de verspreiding van fouten in metadata Regine Dedecker

Transcript of Missen is menselijk

Page 1: Missen is menselijk

Missen is menselijk,

en de verspreiding van fouten in metadata

Regine Dedecker

Page 2: Missen is menselijk

A. Wat kan er mis lopen bij het beschrijven- Omschrijving specifieke fouten- Impact op de vindbaarheid voor de gebruiker- Mogelijke remedies- Nadelen/tijdsinvestering van de remedies

B. Kwaliteit verbeteren

C. De globalisering van metadata- Voordelen- Nadelen- Google books- Anderen

Page 3: Missen is menselijk

A. Wat kan er mis lopen bij het beschrijven

Page 4: Missen is menselijk

Brazil / Terry Gilliam

Page 5: Missen is menselijk

1. TIKFOUTEN- Zelfs de beste catalografen maken ze- Gotisch of civilité lettertypes- Elektronische catalogus : zoeken via woordenImpact - Ernstig indien in significante woorden (titel- of auteurvermelding) Remedies- Overlezen? Een net gemaakte fout wordt dikwijls niet opgemerkt- Je ziet fouten beter als je later opnieuw kijkt- Je ziet beter de fouten van een ander - Metadata spelling checkerNadelen - Grote tijdsinvestering

Page 6: Missen is menselijk

2. WAT OP HET TITELBLAD STAAT IS ONVOLLEDIGE, OF ZELFS MISLEIDENDE INFORMATIE- Oude drukken: politieke of religieuze redenen- De informatie die je hebt is verouderd- M. F. P. kan een afgekorte voornaam zijn, maar ook frère, père, monsieurImpact - Enkel groot als je op het ontbrekende element zoekt Remedies- Via het internet is correcte/volledige informatie beschikbaar - Nieuw onderzoek brengt nieuw dingen aan het lichtNadelen- Extern informatie zoeken kost tijd

Page 7: Missen is menselijk

3. VERTROUWEN OP 1 BRON- Niet alles wat je vind is correct of volledigImpact- Enkel groot als je op het ontbrekende/foute element zoektRemedies- Verschillende bronnen, kunnen verschillende info bevatten- Een bron met bronvermelding is betrouwbaarder- Recenter onderzoek kan nieuwe informatie bovenbrengenNadelen- Extern informatie zoeken kost tijd

Page 8: Missen is menselijk

4. ENKEL HET TITELBLAD BEKIJKEN- Een facsimile kan enkel het titelblad tonen van de oorspronkelijke druk- De taal van een publicaties kan anders zijn dan de titel- Meerdelige werken kunnen tezamen ingebonden zijn- De band kan meerdere werken bevatten (convoluut)Impact- variabel, gaande van ernstig (convoluut), tot minder (andere taal of druk), - Afhankelijk van de zoekopdracht en verfijning (specifieke druk, of taal)Remedies - Altijd de volledige band doorbladeren bij het primair beschrijvenNadelen- Geen (want het kost niet veel tijd)

Page 9: Missen is menselijk

5. HET TITELBLAD GEDEELTELIJK of ONOPLETEND LEZEN- Niet opmerken dat het een andere druk is- Niet opnemen van een hoofdauteur die in de titel staat- Niet opmerken dat er een 2e werk voorafgekondigd wordt- Niet opmerken dat een opgenomen auteur geboren is na het jaar van uitgave- enz.Impact- Afhankelijk van de zoekopdracht Remedies- Het titelblad altijd volledig en begrijpend lezen bij het primair beschrijvenNadelen- Geen (want het kost niet veel tijd)

Page 10: Missen is menselijk

6. VERSTROOIDHEID / DAGDROMEN- Bv. stukken titel zijn verdwenen, er staan andere woorden- Er zijn velden vergeten - De juiste info staat in een verkeerd veldImpact- Kan groot zijn als men het ontbrekende element zoektRemedie- Beschrijven vraagt concentratie- Foutmeldingen bij ontbrekende elementen bij primaire invoer- Browse mogelijkheid op afzonderlijke velden - Foutlijsten van ‘vreemde’ inhoud bij specifieke veldenNadelen- Concentratie is moeilijk urenlang vol te houden

Page 11: Missen is menselijk

7. COPYCATALOGINGVoordelen- Het gaat veel sneller, - De kwaliteit kan beter zijn dan bij het primaire beschrijvenNadelen- Niet alle mogelijke copy bronnen zijn goed- Niet alle beschrijvingen bij een goede copy bron zijn goed- Niet alle informatie is relevant voor elke catalogus- Te snel werken (verkeerde editie … komt meer voor)- Catalografie wordt minder aangeleerd- Correcties of aanvullingen worden niet doorgeven aan de bronImpact van fouten- Variabel, afhankelijk van de fout en zoekopdrachtRemedies- Grondig, kritisch en begrijpend het boek/titelblad en de mogelijke copy

bekijken- Catalografen goed opleidenNadelen- Kritisch overnemen gaat trager

Page 12: Missen is menselijk

8. DIACRIETEN

Geen menselijke foutInternationaal verschillende coderingen CopycatalogingConversies van bibliotheeksoftware

Impact- Groot indien in significante woorden

Remedies- Corrigeren kan soms geautomatiseerd, soms enkel manueel

Nadelen- Manueel verbeteren kost veel tijd

Page 13: Missen is menselijk

9. HET MOET SNEL GAAN

- Geen begrip meer dat nog niet alles beschreven is- Alles on-line is belangrijker dan kwaliteit

Voordelen

- Het merendeel is goed- Hoe meer er aangeboden wordt, hoe meer er gevonden kan

worden

Nadelen

- Nogal wat beschrijvingen met onvolledige, en/of foute informatie- Meer tijd nodig voor catalogusonderhoud

Page 14: Missen is menselijk

Wat te doen voor meer kwaliteit

- Feiten aanvaarden: Missen is menselijk Concentratie wordt geen uren volgehouden- Catalogusonderhoud bvb. – facets regelmatig nakijken - steekproeven- Elk werk de tijd geven die het nodig heeft- Kritische blik, gezond verstand- Goede opleiding- 2e of andere blik vb. bij het ontlenen of terugbrengen - Invoeren in een netwerk/datapool; met doorspelen van

correcties en aanvulling naar alle partners- Laat het publiek meehelpen - Later kan het ook nog

Page 15: Missen is menselijk
Page 16: Missen is menselijk

B. De globalisering van metadata

Page 17: Missen is menselijk

De digitalisering is een kantelmoment in de boekgeschiedenisMassa boeken worden toegankelijkMetadata worden uitgewisseld via copycatalogingCentrale catalogi en boekportalen spelen steeds grotere rol VoordelenHet merendeel van de metadata is goed genoeg Wat on-line wordt aangeboden, kan gevonden wordenNadelenFouten of onvolledige metadata worden verspreidDoor fouten wordt het gezochte boek niet altijd (gemakkelijk)

gevondenEen ruim verspreide fout krijgt autoriteitEen ruim verspreide fout is moeilijk overal recht te zetten RemediesZoveel mogelijk werken binnen netwerken en metadatapools Doorspelen naar alle partners van correcties en aanvullingen

Page 18: Missen is menselijk

GOOGLE BOOKS

Google books :a metadata train wreck / Geoffrey Nunberg 2009http://languagelog.ldc.upenn.edu/nll/?p=1701

2 reacties van Jon Orwant van Metadata Google books“we recently received a large number of Brazilian records from a metadata provider. This provider seemingly used 1899 as a placeholder for "no date", which is why we have 250,000 books incorrectly identified as being published in 1899. Our providers have millions of errors like these, and we do what we can to eliminate them.” Google exposes book metadata privates at ALA forum / Eric Hellmanhttp://go-to-hellman.blogspot.com/2010/01/google-exposes-book-metadata-privates.html

Most of these errors come from garbage records, and when one of these is found, almost always, the same problems can be found in other metadata sources

Page 19: Missen is menselijk

Oversien en ghebetert van vele honderde grove fouten

Regine