Prepare your metadata - externe bronnen

Post on 27-Jun-2015

265 views 1 download

description

Externe bronnen gebruiken als persistent identifiers. Presentatie op de workshop 'Prepare your metadata' (Brussel, 17 juni 2014)

Transcript of Prepare your metadata - externe bronnen

EXTERNE DATABRONNEN

Alina Saenko

- WELKE EXTERNE DATABRONNEN ZIJN ER? WELKE ZIJN BRUIKBAAR?

- WELKE NOTATIESTANDAARDEN ZIJN ER EN HOE PAS JE ZE TOE?

WELKE EXTERNE DATABRONNEN ZIJN ER?

wat wil je identificeren? welke contextuele info biedt de externe databron? hoe hoog is de kwaliteit?

Persoon: VIAF, RKDartist, ULAN, Freebase, ODIS, ISNI, BALAT…

Instelling: Wikidata, ISIL…

Plaats: Geonames, TGN, CRAB…

Concepten: AAT-Ned, Van Dale, UDC, Iconclass, GTAA, Wordnet, LCSH

Kunstwerk: CONA

VIAF

VIAF Beheerorganisatie:

- OCLC Inhoudelijk:

- Personen en instellingen, bibliografie, naamsvarianten

- data nationale bibliotheken en bibliografische centra uit verschillende landen

- ook ISNI, ULAN, VLACC, Wiki Toegankelijkheid:

- rechtstreeks via een webbrowser

- export downloaden (RDF/XML, MARC-XML, JSON)

- API webservice (opensearch, autosuggest, SRU)

Persistentie: http://viaf.org/viaf/116687796

Licentie: Open Data Commons Attribution Licentie ODC BY 1.0.

Aanvullingen: als een volledige contributor

VIAF

Voordelen Nadelen

- internationaal bereik

- heeft een groot aantal andere autoriteiten al in zich opgenomen

- toegankelijk in verschillende formaten, en zowel via API als download

- open data

- is eigenlijk een bibliotheekindex (auteurs)

- niet gemakkelijk om een nieuwe

term toe te voegen, toevoegen kan enkel via grote organisatie

- in de praktijk: enkele beperkingen

tijdens het gebruik van API (beperkt aantal vragen, vooral voor grote opdrachten)

- lokaal bereik: vermoedelijk weinig

resultaat voor lokaal bekende kunstenaars

GEONAMES

GEONAMES Beheerorganisatie: Crowdsourcing project, Technische GeoNames Team en

vertegenwoordigers in landen Inhoudelijk:

- gebaseerd op bestaande open data uit nationale geografische agentschappen

- data over plaatsen, topografische data, officiële namen en informele benamingen, statistiek, postcodes, historische namen (work-in-progress)

- in verschillende talen Toegankelijkheid:

- rechtstreeks via een webbrowser

- export mogelijk (RDF/XML, KML, JSON, CSV, TXT)

- API webservice (fulltext, op postcodes, op plaatsnaam, complex) Persistentie: http://www.geonames.org/2802361 Licentie: Creative Commons Attribution 3.0 License Aanvullingen: registratie en zelf aanpassingen uitvoeren

AAT

AAT Beheerorganisatie:

- Getty Research Institute

- Bureau AAT binnen RKD Inhoudelijk:

- 30.000 unieke cultuurhistorische begrippen

- materialen, objecten, stijlen, fysieke kenmerken… Toegankelijkheid:

- rechtstreeks via een webbrowser

- export mogelijk (SKOS of XML)

- AAT-Ned API webservice, Getty AAT webservice (zoeken op term en in scope notes, SKOS of XML)

Persistentie: http://vocab.getty.edu/aat/300260338 Licentie: Open Data Commons Attribution Licentie ODC BY 1.0. Aanvullingen: procedure bestaat…

AAT

Voordelen Nadelen- standaard wordt actief en

internationaal beheerd

- grote hoeveelheid Nederlandstalige termen

- toegankelijk als een webservice

- het toevoegen van nieuwe termen is in de praktijk nog niet heel goed uitgewerkt, het proces verloopt heel moeizaam

WELKE NOTATIESTANDAARDEN ZIJN ER EN HOE PAS JE ZE TOE?

ISO 8601 – een standaard voor het noteren van een datum

Algemene principes: - van groot naar klein: jaar - maand - dag - uur - minuut - seconde

- vaste aantal mogelijke karakters (YYYY-MM-DDThh:mm:ss)

- gebruik een streepje (-) voor verdeling datum,

- gebruik een dubbelpunt (:) voor verdeling tijd

- elementen die niet relevant zijn voor een datum hoeven niet volledig uitgeschreven te worden (vb. ‘2004-05’ betekent mei 2004. Het zal nooit als de periode van 2004 tot 2005 worden begrepen)

- ook mogelijk om periodes aan te geven: tussen begin en eind datum dient er een schuine

streep (/) worden geplaatst.

ISO 8601

Voordelen Nadelen- duidelijk en machineleesbaar,

wat doorzoekbaarheid verhoogt

- wijdverspreide webstandaard voor dateringen

- nood aan interne afspraken i.v.m. de interpretatie van precisie

- de terminologie aanvaardt

enkel precisie tijdsperiodes. Open tijdsbepalingen zoals een terminus post/ante quem kunnen niet gecodeerd worden