Post on 31-Jul-2015
TRAJECTPERSISTENTE IDENTIFICATIE
Alina Saenko | PACKED
12.06.2015
● 2005: opgericht door Museum Dhondt-Dhaenens, S.M.A.K., M HKA & argos.
● 2011: erkend door de Vlaamse Gemeenschap als Expertisecentrum Digitaal Erfgoed.
● Vlaamse projecten: CEST, Scoremodel Digitale Duurzaamheid, TRACKS - Archiefzorg in de Kunstensector, VIAA - digitalisering A/V dragers, opencultuurdata.be, persistente identificatie
● Europese projecten: ATHENAplus, PREFORMA, europeana.space
● Scoremodel | Erfgoedstats | SODA | SIP creator
● packed.be | scart.be | projectcest.be | scoremodel.org
5
Project ‘Persistente Identificatie’● okt 2013 – sep 2014
● opdracht en financiering: Vlaamse Overheid, Departement Cultuur, Jeugd, Sport en Media
● Partners: Vlaamse Kunst Collectie (KMSKA, MSK Gent, Groeningemuseum Brugge)
Contemporary Art Heritage Flanders (M HKA, Mu.Zee, SMAK, Middelheimmuseum)
● LUKAS
● Collectie Vlaamse Gemeenschap
Eindrapport: http://projectcest.be/index.php/Project_Persistente_identificatie
http://www.smak.be/collectie_kunstenaar.php?kunstwerk_id=1461&l=a&kunstenaar_id=41
http://www.smak.be/collectie_afbeeldingen/the%20journey%20%28true%20colours%29.jpg
http://smak.be/collection/work/data/3385
http://smak.be/collection/work/representation/3385
artwork
http://cvg.be/
collectie/work/id/1856
datahttp://
kmska.be/collectie/
work/data/1856
picturehttp://
kmska.be/collectie/
work/representati
on/1856
picturehttp://
lukasweb.be/collectie/work/representation/
1856
datahttp://cvg.be/
collectie/work/data/
1856
creatorhttp://
viaf.org/viaf/
312406452/
typehttp://
vocab.getty.edu/aat/
300033799
Wikidata, VIAF,
RKDartists, ODIS
AAT
DEMONSTRATOR
CLUSTERS
VERRIJKING
PERSISTENTE URI’S
- Alle kunstwerken en afbeeldingen binnen de collecties voorzien van uniek webadres
- Ook kunstenaars, objectnamen en dateringen genormaliseerd- Data verrijkt met informatie uit externe bronnen (131.266
naamvarianten van vervaardigers, objectnamen in 4 talen …)- Data over dezelfde kunstwerken in verschillende databanken
gelinkt met elkaar - Genormaliseerde data terug aan de collectieverantwoordelijke
bezorgt
kunstwerken kunstenaars objectnamen
Exports musea 43.264 10.183 697
Uniek 34.358 7.025 344
VERVAARDIGERS
>> 90% van de 10.183 naamsvermeldingen geidentificieerd
>> Aantal unieke personen in de 10 collecties – geschat tussen 7.025 en 7.750
Aantal naams-vermeldingen
Aantal unieke strings in de naams- vermeldingen
Aantal records geïdentificeerd met maar 1 pURI
Aantal records geïdentificeerd met maar 2 pURI
Aantal records geïdentificeerd met maar 3 pURI
Aantal records geïdentificeerd met maar 4 pURI
10.183 7.750 1.373 (14%) 3.424 (34%) 4.083 (40%) 204 (2%)
Externe bron Aantal geidentificieerde naamsvermeldingen
Aantal unieke kunstenaars
Aantal naamsvarianten gehaald uit de externe bron
RKDartists 8.708 7.025 21.413
VIAF 7.791 4.584 111.711
Wikidata 4.463 2.326 9.156
ODIS 347 165 -
VERVAARDIGERS De doorzoekbaarheid van de collectiecatalogus verbetert door een betere
herkenning met naamsvarianten van kunstenaars (zoeken op een naamsvariant geeft alle werken van een bepaalde kunstenaar)
1. Het gebruik van reconciliation service en API-services zorgt voor versnelling van het proces van identificatie. >> vb. 86% van de voorstellen van RKD-reconciliation service waren correct
2. Bereik van gekozen externe standaardterminologieen: Van de 7.750 unieke waardes aangeleverd door de instellingen werden er: 90% geïdentificeerd door unieke RKD-agents, 59% door unieke VIAF-agents, 30% door Wikidata-agents en 2% door ODIS-agents.
>> 1.100 naamsvermeldingen nog niet geïdentificeerd (10% van 10.183)
• 441 van anonieme vervaardigers
• 659 naamsvermeldingen nog te analyseren en aan een externe autoriteit voorstellen
3. Doorzoekbaarheid van de collecties is verbeterd>> Collectiedata is verrijkt met 131.266 unieke naamsvarianten
>> Demonstrator
16
VERVOLGTRAJECT (2014 – 2015)
1. ‘Hoe word ik data uitgever?’
PACKED ondersteunt de musea in het activeren, online zetten en beheren van de aangemaakte persistente URI’s via de Resolver
2. ‘Event-based objectbeschrijving’
Identificatie van de levensloop van kunstwerken (creatie, tentoonstelling, bruiklenen…)
3. ‘Linked Open Data (LOD) publicatie via Wikidata’
Basis identificatiegegevens vindbaar maken op het web voor grote publiek met behulp van duurzame bronvermelding en bestaande gratis applicaties (zoals Wikidata)
DATAUITGEVER: RESOLVER EN HANDBOEK
18
EVENTS: CONTEXTUAL DATA
19
LEVENSLOOP VAN EEN KUNSTWERK
Event 1
Event 2
Event 3
Event 4
Event 5
Wikidata, VIAF,
RKDartists,
ODIS?
20
MEER INFORMATIE…
● Persistent identification (2013-2014): http://www.projectcest.be/index.php/Project_Persistente_identificatie
● Vervolgtraject (2015):http://www.projectcest.be/index.php/Project_Persistente_Identificatie_II
● Demonstratorhttps://github.com/weopendata/packed-input
● Resolver softwarehttps://github.com/PACKED-vzw/resolver
● Open refinehttp://www.projectcest.be/index.php/Collectiedata_normaliseren_met_Open_Refine
BEDANKT VOOR DE AANDACHT
ALINA@PACKED.BE