Sessie Metadata Informatie aan Zee 2015

30
Metadata & Identifiers Sigrid Vlaemynck – Meta4Books Informatie aan zee 2015

Transcript of Sessie Metadata Informatie aan Zee 2015

Page 1: Sessie Metadata Informatie aan Zee 2015

Metadata & IdentifiersSigrid Vlaemynck – Meta4Books

Informatie aan zee 2015

Page 2: Sessie Metadata Informatie aan Zee 2015

Wat is Meta4Books?Opgericht in 2000 als vzw Boekenbank

Dochtervzw van Boek.be

In 2011 omgevormd tot Meta4Books vzw: uitbreiding van de doelstellingen naar beheer en verzamelen metadata

Metadatacentrum voor Nederlandstalige boekenvak B2B o Titel-, auteurs- en uitgeversinformatie verzamelen en aanbieden aan professionals uit het

boekenvak o Via online platformen het boekenvak bijstaan

www.meta4books.be

Page 3: Sessie Metadata Informatie aan Zee 2015
Page 4: Sessie Metadata Informatie aan Zee 2015

Metadata

“Metadata liberates us, liberates knowledge.”David Weinberger

Page 5: Sessie Metadata Informatie aan Zee 2015

METADATA: een definitie

Metadata zijn gegevens die de karakteristieken van bepaalde gegevens beschrijven. Het zijn data over data.

De metadata bij een bepaald document (de gegevens) kunnen bijvoorbeeld zijn: de auteur, de datum van schrijven, de uitgever, het aantal pagina's en de taal waarin de gegevens zijn opgesteld.

Het expliciet opslaan van metadata bij de data waar het betrekking op heeft, heeft als voordeel dat de data makkelijker gevonden kan worden.

(bron: wikipedia)

Wat is Metadata?

Page 6: Sessie Metadata Informatie aan Zee 2015

In functie van logistiek en backoffice

In functie van on- en offline verkoop

Metadata is geëvolueerd.

Page 7: Sessie Metadata Informatie aan Zee 2015

Studie Nielsen Bookdatahttp://www.nielsenbookdata.co.uk/uploads/3971_Nielsen_Metadata_white_paper_A4(1).pdf

Goede metadata:

Meer en betere informatie over boeken voor (web)retailers en consument= belangrijke communicatie

Optimale vindbaarheid van boeken bij de (web)retailers en webbrowsers (SEO)= grotere verkoopkans

Page 8: Sessie Metadata Informatie aan Zee 2015

Metadata keten

Bron: Register R. & Mcllroy T.,The metadatahandbook, The metadata lifecycle.

Invoer data: mensenwerk, zoveel mogelijk bij de bron (uitgever). Vervolgens toevoegingen door gebruikers (verkoop of voorraadinformatie)

Distributie: digitaal, door distributeurs

Afnemers: retailer die metadata naar eigen goeddunken inzet (zoveel mogelijk geautomatiseerd)

Page 9: Sessie Metadata Informatie aan Zee 2015

Huidige problematiekDuidelijkere afspraken nodig over metadata

Te weinig kennis bij uitgeverijen en distributeurs: geen beleid voor metadata, arbeidsintensief, weinig automatisatie

Automatisering binnen de waardeketen ondersteunt vaak niet alle metadatavelden (beperkt aantal auteurs, geen weblinks, geen auteursinformatie)

Retailers weten niet hoe ze de standaarden moeten implementeren (foute aannames, handmatige correcties)

Page 10: Sessie Metadata Informatie aan Zee 2015

Toekomst van metadata

Page 11: Sessie Metadata Informatie aan Zee 2015
Page 12: Sessie Metadata Informatie aan Zee 2015

Semantisch web

Page 14: Sessie Metadata Informatie aan Zee 2015

Identifiers

& Standaarden

“Using identifiers in book metadata and on web pages about books will improve page rankings in organic search.”Amit Pande/Daniel Kaplan, Google

Page 15: Sessie Metadata Informatie aan Zee 2015

Voordelen van standaardisering

Invoer aan de bron (uitgever) en gebruik van standaarden betekent lagere algemene en verkoopkosten.

Geautomatiseerde verwerking binnen de keten betekend dat snelle verwerking van wijzigingen mogelijk is (inspelen op actualiteit).

Verhogen van de vindbaarheid van een publicatie.

Page 16: Sessie Metadata Informatie aan Zee 2015

ONline Information eXchange

Internationale metadata standaard (xml) voor de (commerciële) boekenketen

Wijdverspreid over Noord-Amerika, Europa, Japan, Rusland en start in China, Indië en de Arabische wereld

Ontwikkeld door AAP (Association of American Publishers), nu beheer door EDItEUR

Onix werkgroep: www.onixwerkgroep.org

Page 17: Sessie Metadata Informatie aan Zee 2015

ISBN = International Standard Book Number

Voor boeken en boekgerelateerde producten vb. 978-90-12356-01-8

Geen wettelijke verplichting. Belangrijk voor commerciële circuit.

Jaarlijkse verwerking van 12.000 ISBN’s in Vlaanderen

Kan aangevraagd worden via www.boekenbank.be

Page 18: Sessie Metadata Informatie aan Zee 2015

International Standard Text Code

Doel = verschillende verschijningsvormen van één titel bundelen

Internationaal verband o.l.v. EDItEUR

Vertraagde ontwikkeling => Nederlandstalig alternatief NSTC

Page 19: Sessie Metadata Informatie aan Zee 2015

NSTC: Nederlandstalige Standaard Tekst Code

E-book Luisterboek

Hardcover Paperback

NSTC

= bundeling van verschillende verschijningsvormen

Page 20: Sessie Metadata Informatie aan Zee 2015
Page 21: Sessie Metadata Informatie aan Zee 2015

NSTC: Nederlandstalige Standaard Tekst Code

Samenwerking tussen Centraal Boekhuis NL en Dante (Meta4Books)

Koppelen van:- Verschillende verschijningsvormen (incl. eboeken)- Luisterboek- Filmeditie- Braille, dyslectici- Grootletter- Vereenvoudigde versies- Oorspronkelijke uitgave- Dwarsliggers- Kamishibai- Reisboeken

Geen NSTC voor vertalingenen reeksen

Page 22: Sessie Metadata Informatie aan Zee 2015

Voor koppeling NSTC wordt er naar de volgende velden gekeken:- Hoofdtitel- Eerste contributor

Bij 100% match wordt het NSTC toegekend, <100% = manuele controleZoveel mogelijk baseren op bibliografisch gecontroleerde titels

Stand van zaken van het NSTC- Ongeveer 120.000 ISBN’s aangemeld voor het

algoritme (enkel A-boeken uit actueel bestand CB & Boekenbank) + alle nieuw aangemelde titels via bureau ISBN- Reeds 25.000 NSTC’s toegekend

Export van NSTC via de DANTE API webservice in Onix2 of 3

NSTC: Nederlandstalige Standaard Tekst Code

Page 23: Sessie Metadata Informatie aan Zee 2015

ISNI = International Standard Name Identifier

Standaard om publieke identiteiten (auteurs, illustrators, muzikanten, uitgevers, …) te identificerenVb. ISNI 0000 0003 9872 229X

Geleid door ISNI International Authority, belangrijke leden zijn Bibliothèque national de France en the British Library

8, 24 miljoen ISNI’s in de database

Verwante identifier is ORCID voor onderzoekers

Page 24: Sessie Metadata Informatie aan Zee 2015

Problemen rond dubbele auteursnamen oplossen

Slaat een brug tussen verschillende sectoren

Page 25: Sessie Metadata Informatie aan Zee 2015

Gebundelde informatie van één auteur (video’s, boeken, muziek, …

Page 26: Sessie Metadata Informatie aan Zee 2015

ThemaInternationaal classificatiesysteem (vergelijkbaar met nationale NUR-systeem) gebaseerd op onderwerp

Beheer door Editeur, in samenwerking met nationale comités

Digitale stroom vraagt om internationaal communicatiesysteem (zoals onix, isbn, isni, …)

Doel van thema: vindbaarheid en verkoop verhogen op internationale boekenmarkt

Thema bestaat uit 20 categorieën + ongeveer 2500 subcategorieën

Mogelijkheid om nationale specificatie toe te voegen

Page 27: Sessie Metadata Informatie aan Zee 2015

DOI = Digital Object Identifier

Unieke identifier voor een geselecteerde content (artikel, hoofdstuk, …)Permanent nummer dat doorverwijst naar de locatie van het object

Voornamelijk populair bij wetenschappelijke en educatieve uitgevers

Alfanumerieke string toegevoegd door een DOI-agentschap

Page 28: Sessie Metadata Informatie aan Zee 2015
Page 29: Sessie Metadata Informatie aan Zee 2015

Verwijzing naar artikel

Uitgevers website

Page 30: Sessie Metadata Informatie aan Zee 2015

ConclusieBelang van metadata en identifiers blijft toenemen. Nood aan duidelijke (internationale en nationale) afspraken.

Voordelen? Grotere vindbaarheid op het webUnieke identificatie van een productInternationale verbondenheid en communicatieSnellere en geautomatiseerde verwerking van metadata

Toekomstplannen voor Meta4Books: uitwerking ISNI, Thema en DOI

Meer [email protected] www.meta4books.be