Van adlib naar online collectie

27
WIE? PETER GROND @PGROND

description

Presentatie tijdens het seminar "Kunst ontsluiten geen kunst?" op 10 april in het Gemeentemuseum Den Haag. Voor het Gemeentemuseum heeft Triquanta een tool gebouwd die hun Adlib collectie doorzoekbaar maakt via een webservice. Hiervoor is onder andere Drupal en Apache solr gebruikt. Dit project is in het kader van het MuSeUM Plus project -onderdeel van Catch Plus- uitgevoerd. Voor meer informatie zie http://www.triquanta.nl/project/gemeentemuseum of neem contact op met [email protected]

Transcript of Van adlib naar online collectie

Page 1: Van adlib naar online collectie

WIE?

PETER GROND

@PGROND

Page 2: Van adlib naar online collectie

VAN ADLIB NAAR EENPUBLIEK DOORZOEKBARE

COLLECTIE

Page 3: Van adlib naar online collectie

WAT IS EEN GOEDE ZOEKMACHINE?

DE GEBRUIKER KAN EENVOUDIG DE MEESTRELEVANTE GEGEVENS UIT DE DATABASE

HALEN

Page 4: Van adlib naar online collectie

HOE TE ZOEKEN?

Page 5: Van adlib naar online collectie

HOE TE ZOEKEN?

Page 6: Van adlib naar online collectie

HOE TE ZOEKEN?Onderzoek van de UvA in het kader van Catchproject

Multiple Search Using Metadata (MuSeUM)

Zoekmethodiek moest geschikt zijn voorspecialistische en algemene gebruikers

Page 7: Van adlib naar online collectie

BESTE RESULTATEN MET...Combinatie van gestructureerd enongestructureerdBeperk het aantal velden om in te zoekenBepaal relevantie op basis van beidezoekmethodesScheiding van gegevens voor zoeken en weergave

Page 8: Van adlib naar online collectie

DEFINIEER DE ZOEKVELDEN

WIE, WAT, WAAR, HOE EN WANNEER

Page 9: Van adlib naar online collectie

DEFINIEER MAPPING ADLIB NAAR DIEVELDEN

Wie: creation_presentation, creator,inscription.maker

Wat: description, object_name,title.short_description, title

Waar: production.place_presentation,production.place

Hoe: material, material_technique_presentation,technique

Wanneer: inscription.date, production.date.start,production.date.end, production.date_presentation,production.period

Page 10: Van adlib naar online collectie

INDEXEER NIEUWE STRUCTUURWELKE TOOLS?

Page 11: Van adlib naar online collectie

WAAROM DRUPAL?Belangrijkste functionaliteiten al besckikbaar

Importeren van externe dataDefiniëren van objecten en veldenUitstekende koppeling met Apache Solr

FlexibelGedegen kennis van het systeem

Page 12: Van adlib naar online collectie

WAAROM APACHE SOLR?Open sourceEen van de snelste zoekmachinesBewezen staat van dienstGrote communityVolop in ontwikkelingUitstekende koppeling met Drupal

Page 13: Van adlib naar online collectie

API VOOR GEBRUIK ZOEKMACHINEZoekindex geschikt voor gestructureerd en

ongestructureer zoeken

De meest relevante resultaten moeten als eerst naarboven komen

Page 14: Van adlib naar online collectie
Page 15: Van adlib naar online collectie

VAN ADLIB NAAR DRUPALGenerieke PHP component niet afhankelijk vanDrupalBeschikbare module uitgebreid met een Fetcher enParser voor de import in DrupalTe downloaden op Drupal.org

Page 16: Van adlib naar online collectie

VAN DRUPAL NAAR SOLRBeschikbare module gebruiktVeldnamen in Solr niet dynamischVerder geen aanpassingen noodzakelijk

Page 17: Van adlib naar online collectie

MUS APISimpele laag voor SolrAfhandelen van fouten en API keysOmschrijven van request naar Solr queryRelevantiebepalingCode beschikbaar op Github

Page 18: Van adlib naar online collectie

RELEVANTIEBEPALINGViool gemaakt door Antonio Stradivarius uit Italië

Wie: Antonio Stradivarius

Wat: Viool

Waar: Italië

Full text: Antonio Stradivarius Viool Italië

Page 19: Van adlib naar online collectie
Page 20: Van adlib naar online collectie
Page 21: Van adlib naar online collectie

RELEVANTIEBEPALINGStandaard scoring van Solr bleek niet geschikt

Lengte van velden hadden teveel invloed

Page 22: Van adlib naar online collectie

RELEVANTIEBEPALINGStandaard Solr scoring

WieWatWaarFull text

0 2 4 6 8

Viool

Schilderij

Page 23: Van adlib naar online collectie

NIEUW MODEL RELEVANTIEBEPALINGEen match in een veld levert +1 op

Relatieve score van documenten onderling die eenmatch hebben in een veld levert maximaal +0.2 op

Page 24: Van adlib naar online collectie

NIEUW MODELNieuw scoring model

WieWie relatiefWatWat relatiefWaarWaar relatiefFull textFull text relatief

0 1 2 3 4

Viool

Schilderij

Page 25: Van adlib naar online collectie

RELEVANTIEBEPALINGObjecten met een match in 2 velden komen altijd

hoger in de resultaten

Onverwachte relevante of gerelateerde objectenkomen naar boven

Page 26: Van adlib naar online collectie

SAMENVATTINGZoek in 5 generieke velden + full textImporteer gegevens uit Adlib in DrupalIndexeer gegevens in zoekmachine Apache SolrInterface en relevantiebepaling met API

Page 27: Van adlib naar online collectie

VRAGEN?@pgrond

[email protected]