Metadata en identifiers: NSTC, ISNI & DOI

30
Metadata & Identifiers Sigrid Vlaemynck – Meta4Books Informatie aan zee 2015

Transcript of Metadata en identifiers: NSTC, ISNI & DOI

Metadata & IdentifiersSigrid Vlaemynck – Meta4Books

Informatie aan zee 2015

Metadata

“Metadata liberates us, liberates knowledge.”David Weinberger

Wat is Meta4Books?

Opgericht in 2000 als vzw Boekenbank

Dochtervzw van Boek.be

In 2011 omgevormd tot Meta4Books vzw: uitbreiding van de doelstellingen naar beheer en verzamelen metadata

Metadatacentrum voor Nederlandstalige boekenvak B2B o Titel-, auteurs- en uitgeversinformatie verzamelen en aanbieden aan professionals uit

het boekenvak o Via online platformen het boekenvak bijstaan

www.meta4books.be

METADATA: een definitie

Metadata zijn gegevens die de karakteristieken van bepaalde gegevens beschrijven. Het zijn data over data.

De metadata bij een bepaald document (de gegevens) kunnen bijvoorbeeld zijn: de auteur, de datum van schrijven, de uitgever, het aantal pagina's en de taal waarin de gegevens zijn opgesteld.

Het expliciet opslaan van metadata bij de data waar het betrekking op heeft, heeft als voordeel dat de data makkelijker gevonden kan worden.

(bron: wikipedia)

Wat is Metadata?

In functie van logistiek en backoffice

In functie van on- en offline verkoop

Metadata is geëvolueerd.

Studie Nielsen Bookdatahttp://www.nielsenbookdata.co.uk/uploads/3971_Nielsen_Metadata_white_paper_A4(1).pdf

Goede metadata:

Meer en betere informatie over boeken voor (web)retailers en consument

= belangrijke communicatie

Optimale vindbaarheid van boeken bij de (web)retailers en webbrowsers (SEO)

= grotere verkoopkans

Metadata keten

Bron: The metadatahandbook, the metadata lifecycle

Invoer data: mensenwerk, zoveel mogelijk bij de bron (uitgever). Vervolgens toevoegingen door gebruikers (verkoop of voorraadinformatie)

Distributie: digitaal, door distributeurs

Afnemers: retailer die metadata naar eigen goeddunken inzet (zoveel mogelijk geautomatiseerd)

Huidige problematiek

Duidelijkere afspraken nodig over metadata

Te weinig kennis bij uitgeverijen en distributeurs: geen beleid voor metadata, arbeidsintensief, weinig automatisatie

Automatisering binnen de waardeketen ondersteunt vaak niet alle metadatavelden (beperkt aantal auteurs, geen weblinks, geen auteursinformatie

Retailers weten niet hoe ze de standaarden moeten implementeren (foute aannames, handmatige correcties)

Toekomst van metadata

Semantisch web

Identifiers

& Standaarden

“Using identifiers in book metadata and on web pages about books will improve page rankings in organic search.”Amit Pande/Daniel Kaplan, Google

Voordelen van standaardisering

Invoer aan de bron (uitgever) en gebruik van standaarden betekent lagere algemene en verkoopkosten.

Geautomatiseerde verwerking binnen de keten betekend dat snelle verwerking van wijzigingen mogelijk is (inspelen op actualiteit).

Verhogen van de vindbaarheid van een publicatie.

ONline Information eXchange

Internationale metadata standaard (xml) voor de (commerciële) boekenketen

Wijdverspreid over Noord-Amerika, Europa, Japan, Rusland en start in China, Indië en de Arabische wereld

Ontwikkeld door AAP (Association of American Publishers), nu beheer door EDItEUR

Onix werkgroep: www.onixwerkgroep.org

ISBN = International Standard Book Number

Voor boeken en boekgerelateerde producten vb. 978-90-12356-01-8

Geen wettelijke verplichting. Belangrijk voor commerciële circuit.

Jaarlijkse verwerking van 12.000 ISBN’s in Vlaanderen

Kan aangevraagd worden via www.boekenbank.be

International Standard Text Code

Doel = verschillende verschijningsvormen van één titel bundelen

Internationaal verband o.l.v. EDItEUR

Vertraagde ontwikkeling => Nederlandstalig alternatief NSTC

NSTC: Nederlandstalige Standaard Tekst Code

E-book Luisterboek

Hardcover Paperback

NSTC

= bundeling van verschillende verschijningsvormen

NSTC: Nederlandstalige Standaard Tekst Code

Samenwerking tussen Centraal Boekhuis NL en Dante (Meta4Books)

Koppelen van:- Verschillende verschijningsvormen (incl. eboeken)- Luisterboek- Filmeditie- Braille, dyslectici- Grootletter- Vereenvoudigde versies- Oorspronkelijke uitgave- Dwarsliggers- Kamishibai- Reisboeken

Geen NSTC voor vertalingenen reeksen

Voor koppeling NSTC wordt er naar de volgende velden gekeken:- Hoofdtitel- Eerste contributor

Bij 100% match wordt het NSTC toegekend, <100% = manuele controleZoveel mogelijk baseren op bibliografisch gecontroleerde titels

Stand van zaken van het NSTC- Ongeveer 120.000 ISBN’s aangemeld voor het

algoritme (enkel A-boeken uit actueel bestand CB & Boekenbank) + alle nieuw aangemelde titels via bureau ISBN- Reeds 25.000 NSTC’s toegekend

Export van NSTC via de DANTE API webservice in Onix2 of 3

NSTC: Nederlandstalige Standaard Tekst Code

ISNI = International Standard Name Identifier

Standaard om publieke identiteiten (auteurs, illustrators, muzikanten, uitgevers, …) te identificerenVb. ISNI 0000 0003 9872 229X

Geleid door ISNI International Authority, belangrijke leden zijn Bibliothèque national de France en the British Library

8, 24 miljoen ISNI’s in de database

Verwante identifier is ORCID voor onderzoekers

Problemen rond dubbele auteursnamen oplossen

Slaat een brug tussen verschillende sectoren

Gebundelde informatie van één auteur (video’s, boeken, muziek, …

Thema

Internationaal classificatiesysteem (vergelijkbaar met nationale NUR-systeem) gebaseerd op onderwerp

Beheer door Editeur, in samenwerking met nationale comités

Digitale stroom vraagt om internationaal communicatiesysteem (zoals onix, isbn, isni, …)

Doel van thema: vindbaarheid en verkoop verhogen op internationale boekenmarkt

Thema bestaat uit 20 categorieën + ongeveer 2500 subcategorieën

Mogelijkheid om nationale specificatie toe te voegen

DOI = Digital Object Identifier

Unieke identifier voor een geselecteerde content (artikel, hoofdstuk, …)Permanent nummer dat doorverwijst naar de locatie van het object

Voornamelijk populair bij wetenschappelijke en educatieve uitgevers

Alfanumerieke string toegevoegd door een DOI-agentschap

Verwijzing naar artikel

Uitgevers website

Conclusie

Belang van metadata en identifiers blijft toenemen. Nood aan duidelijke (internationale en nationale) afspraken.

Voordelen? Grotere vindbaarheid op het webUnieke identificatie van een productInternationale verbondenheid en communicatieSnellere en geautomatiseerde verwerking van metadata

Toekomstplannen voor Meta4Books: uitwerking ISNI, Thema en DOI

Meer [email protected] www.meta4books.be