PROJECT IDENTIFICATIE’… · van kunstwerken significant uitgebreid waardoor context en de...

23

Transcript of PROJECT IDENTIFICATIE’… · van kunstwerken significant uitgebreid waardoor context en de...

Page 1: PROJECT IDENTIFICATIE’… · van kunstwerken significant uitgebreid waardoor context en de vindbaarheid van de data gevoelig verbeterd. 5. De doorzoekbaarheid van de collectiecatalogus
Page 2: PROJECT IDENTIFICATIE’… · van kunstwerken significant uitgebreid waardoor context en de vindbaarheid van de data gevoelig verbeterd. 5. De doorzoekbaarheid van de collectiecatalogus

PROJECT ‘PERSISTENTE IDENTIFICATIE’ Alina Saenko, Bert Lemmens,

Joris Janssens

Page 3: PROJECT IDENTIFICATIE’… · van kunstwerken significant uitgebreid waardoor context en de vindbaarheid van de data gevoelig verbeterd. 5. De doorzoekbaarheid van de collectiecatalogus

INHOUD

I.  Persistente URI’s II.  Het project §  Doelstelling §  Onderzoeksvragen §  Methodologie

III. Conclusies IV. Aanbevelingen

Page 4: PROJECT IDENTIFICATIE’… · van kunstwerken significant uitgebreid waardoor context en de vindbaarheid van de data gevoelig verbeterd. 5. De doorzoekbaarheid van de collectiecatalogus

I. PERSISTENTE URI’S

Page 5: PROJECT IDENTIFICATIE’… · van kunstwerken significant uitgebreid waardoor context en de vindbaarheid van de data gevoelig verbeterd. 5. De doorzoekbaarheid van de collectiecatalogus

PERSISTENTE URI: ISA DEFINITIE • Samengesteld volgens bepaalde regels • Heeft een heldere en consistente structuur •  Is makkelijker te beheren en te gebruiken •  Is stabiel (onveranderlijk) en toegankelijk op lange termijn

ISA onderzoek-deliverable: D7.1.3 - Study on persistent URIs, with identification of best practices and recommendations on the topic for the MSs and the EC, 2012

Page 6: PROJECT IDENTIFICATIE’… · van kunstwerken significant uitgebreid waardoor context en de vindbaarheid van de data gevoelig verbeterd. 5. De doorzoekbaarheid van de collectiecatalogus

PERSISTENTE URI: STANDAARDVORM http://[domein]/[type object]/[type document]/[identificatienummer] waarbij: [domein] - de naam van de server [type object] – het soort object waar het document over gaat (work, concept, agent, event) [type document]– het soort informatie dat het document over het object bevat (id, data, representation) [identificatienummer] – het unieke registratienummer voor het object.

Page 7: PROJECT IDENTIFICATIE’… · van kunstwerken significant uitgebreid waardoor context en de vindbaarheid van de data gevoelig verbeterd. 5. De doorzoekbaarheid van de collectiecatalogus

PERSISTENTE URI: STRATEGIE

Om data te publiceren op het web met behulp van persistente URI’s zijn er in de praktijk twee strategieën mogelijk: •  Het beheer van de persistente URI’s bij een externe organisatie

onderbrengen, (handle.net, Digital Object Identifier (DOI))

•  Organisatie beheert zelf een webserver om data of publicaties te publiceren op het web. (Aanbeveling CIDOC in 2012)http://network.icom.museum/fileadmin/user_upload/minisites/cidoc/PDF/StatementOnLinkedDataIdentifiersForMuseumObjects.pdf

Page 8: PROJECT IDENTIFICATIE’… · van kunstwerken significant uitgebreid waardoor context en de vindbaarheid van de data gevoelig verbeterd. 5. De doorzoekbaarheid van de collectiecatalogus

PERSISTENTE URI: CIDOC RECOMMENDATION (2012) §  Museums are the sole authority with responsibility for establishing globally

unique and persistent identities (URIs) for each of the objects in their collections;

§  Each museum should establish and publish on the internet such a unique and persistent identity – preferably as http URI (=URL) – for each of its objects;

§  This URL should resolve to a human-readable description of the object, which is sufficiently detailed to identify it unambiguously;

§  Ideally, this URL should additionally resolve to a comparable description in a machine processible format, using best practice Linked Data principles;

§  When describing the relationship of the collection object to its cultural context (people, places, events, etc.), the museum should where possible use URLs from common frameworks, rather than minting its own URLs for these concepts;

http://network.icom.museum/fileadmin/user_upload/minisites/cidoc/PDF/StatementOnLinkedDataIdentifiersForMuseumObjects.pdf

Page 9: PROJECT IDENTIFICATIE’… · van kunstwerken significant uitgebreid waardoor context en de vindbaarheid van de data gevoelig verbeterd. 5. De doorzoekbaarheid van de collectiecatalogus

II. HET PROJECT

Page 10: PROJECT IDENTIFICATIE’… · van kunstwerken significant uitgebreid waardoor context en de vindbaarheid van de data gevoelig verbeterd. 5. De doorzoekbaarheid van de collectiecatalogus

DOELSTELLING Het doel van het project was om te onderzoeken of de normalisering en identificatie van gegevens over kunstwerken met behulp van persistente URI’s uit tien verschillende digitale collecties: §  het beheer van collectiedata stroomlijnt; §  de uitwisseling van collectiedata efficiënter maakt; §  de dynamische verwerking van collectiedata in andere websites of mobiele

toepassingen makkelijker maakt.

Page 11: PROJECT IDENTIFICATIE’… · van kunstwerken significant uitgebreid waardoor context en de vindbaarheid van de data gevoelig verbeterd. 5. De doorzoekbaarheid van de collectiecatalogus

ONDERZOEKSVRAGEN

1.  Hoe maak je de negotiatie naar de juiste webpagina of afbeelding van een kunstwerk eenvoudiger met persistente URI’s?

2.  Hoe verrijk je collectiedata met persistente URI’s?

3.  Hoe los je slechte doorzoekbaarheid veroorzaakt door spelling - en naamsvarianten op met persistente URI’s?

4.  Hoe maak je de registratie van objecten eenvoudiger met

persistente URI’s?

Page 12: PROJECT IDENTIFICATIE’… · van kunstwerken significant uitgebreid waardoor context en de vindbaarheid van de data gevoelig verbeterd. 5. De doorzoekbaarheid van de collectiecatalogus

ACTIE 1: DATA EXPORT

- Een projectmedewerker ging aan de slag met de data uit de 10 collecties. In het kade van het peoject werd de data geanalyseerd en werden gegevens over inventarisnummers, kunstenaarsnamen, objectnamen en bewaarinstellingen gekoppeld aan persistente URI’s.

Page 13: PROJECT IDENTIFICATIE’… · van kunstwerken significant uitgebreid waardoor context en de vindbaarheid van de data gevoelig verbeterd. 5. De doorzoekbaarheid van de collectiecatalogus

ACTIE 2: DEMONSTRATOR-TOOL •  Functionaliteit: - Afgeschermde omgeving - Maakt de collectiedata uit tien databanken voor en na normalisering

integraal doorzoekbaar - Toont hoe met behulp van links naar externe bronnen de

collectiedata inhoudelijk verrijkt kan worden

•  Technologie: - geschreven in php - data wordt opgeslagen in the datatank (http://thedatatank.com/) en zal

einde deze week verwijderd worden

• Ontwikkeld door Underlined bvba •  Broncode: https://github.com/weopendata/packed-input

Page 14: PROJECT IDENTIFICATIE’… · van kunstwerken significant uitgebreid waardoor context en de vindbaarheid van de data gevoelig verbeterd. 5. De doorzoekbaarheid van de collectiecatalogus

ACTIE 3: RESOLVER-TOOL •  Functionaliteit: - een tool voor beheerders van erfgoedcollecties waarmee je persistente

URI’s voor collectiestukken maakt en laat doorverwijzen naar afbeeldingen, webpagina’s of ruwe data in een beeldbank of collectiebeheersysteem.

•  Technologie: - geschreven in Python met Flask microframework (http://flask.pocoo.org/) - mogelijkheid te installeren op eigen servers, of in cloud (heroku)

• Ontwikkeld door Nils Van Geele (Jobstudent PACKED) •  Broncode: Open source (gpl3) https://github.com/PACKED-vzw/resolver

•  Testversie: http://resolver.be

Page 15: PROJECT IDENTIFICATIE’… · van kunstwerken significant uitgebreid waardoor context en de vindbaarheid van de data gevoelig verbeterd. 5. De doorzoekbaarheid van de collectiecatalogus

III. CONCLUSIES

Page 16: PROJECT IDENTIFICATIE’… · van kunstwerken significant uitgebreid waardoor context en de vindbaarheid van de data gevoelig verbeterd. 5. De doorzoekbaarheid van de collectiecatalogus

CONCLUSIES

1. Door een onderscheid te maken tussen URI’s voor kunstwerken en records wordt duidelijk voor hoeveel kunstwerken collectiedata verspreid zit over verschillende databanken. 2. Door het gebruik van een URI voor het kunstwerk, kan je alle beschikbare beschrijvingen voor een kunstwerk gegroepeerd opvragen. 3. Met het proactief toekennen van een persistente URI voor beelden is voor collectiebeheerders een helder kader ontwikkelt om stapsgewijs beelden online te publiceren.

Page 17: PROJECT IDENTIFICATIE’… · van kunstwerken significant uitgebreid waardoor context en de vindbaarheid van de data gevoelig verbeterd. 5. De doorzoekbaarheid van de collectiecatalogus

CONCLUSIES

4. Door gebruik van vier verschillende externe bronnen (VIAF, RKDartists&, ODIS, Wikidata) worden de identificatiegegevens van kunstwerken significant uitgebreid waardoor context en de vindbaarheid van de data gevoelig verbeterd. 5. De doorzoekbaarheid van de collectiecatalogus verbetert door een betere herkenning met naamsvarianten van kunstenaars (zoeken op een naamsvariant geeft alle werken van een bepaalde kunstenaar) 6. De doorzoekbaarheid van de collectiecatalogus verbetert door betere herkenning van spellingsvarianten van objectnamen (zoeken op een spellingsvariant geeft alle werken van dit type)

Page 18: PROJECT IDENTIFICATIE’… · van kunstwerken significant uitgebreid waardoor context en de vindbaarheid van de data gevoelig verbeterd. 5. De doorzoekbaarheid van de collectiecatalogus

CONCLUSIE

7. De doorzoekbaarheid van de collectiecatalogus verbetert door het gebruik van genormaliseerde machineleesbare waardes voor dateringen. 8. Persistente URI’s maken de registratie van kunstwerken eenvoudiger, op voorwaarde dat de koppeling met externe bronnen geautomatiseerd wordt. Hierdoor kan de documentatie van contextuele informatie over kunstwerken beperkt worden.

Page 19: PROJECT IDENTIFICATIE’… · van kunstwerken significant uitgebreid waardoor context en de vindbaarheid van de data gevoelig verbeterd. 5. De doorzoekbaarheid van de collectiecatalogus

VI. AANBEVELINGEN

Page 20: PROJECT IDENTIFICATIE’… · van kunstwerken significant uitgebreid waardoor context en de vindbaarheid van de data gevoelig verbeterd. 5. De doorzoekbaarheid van de collectiecatalogus

AANBEVELINGEN

§ De collectiebeheersystemen moeten aangepast worden om de genormaliseerde identificatiegegevens die het project ‘Persistente identificatie’ opleverde op een duurzame wijze vast te leggen.

§ De genormaliseerde identificatiegegevens uit het project ‘Persistente Identificatie’ moeten opgenomen worden in de collectiebeheersystemen van de partnerinstellingen en verder geactualiseerd worden.

§ De kwaliteit van de data in de tien deelnemende instelling moet verder verbeterd worden.

§ De Resolver-tool dient toegepast te worden om de in het kader van het project toegekende persistente URI’s te kunnen activeren, gebruiken en beheren.

Page 21: PROJECT IDENTIFICATIE’… · van kunstwerken significant uitgebreid waardoor context en de vindbaarheid van de data gevoelig verbeterd. 5. De doorzoekbaarheid van de collectiecatalogus

VII. VERVOLGTRAJECTEN

Page 22: PROJECT IDENTIFICATIE’… · van kunstwerken significant uitgebreid waardoor context en de vindbaarheid van de data gevoelig verbeterd. 5. De doorzoekbaarheid van de collectiecatalogus

ACTIES 2014-2015

Verder bouwen op de realisaties van het PID-project: •  operationeel maken van de persistente URI’s; •  verdere verrijking van contextuele data; •  de publicatie identificatie data als Linked Open Data.

Page 23: PROJECT IDENTIFICATIE’… · van kunstwerken significant uitgebreid waardoor context en de vindbaarheid van de data gevoelig verbeterd. 5. De doorzoekbaarheid van de collectiecatalogus

CONTACTGEGEVENS

[email protected] [email protected]