KOGK - Van adlib naar online collectie - Peter Grond

Post on 12-Nov-2014

269 views 1 download

description

Tijdens het seminarie Kunst ontsluiten geen kunst? op woensdag 10 april 2013 in Den Haag vertelde Peter Grond meer over de koppeling van een Adlib-database met Drupal.

Transcript of KOGK - Van adlib naar online collectie - Peter Grond

WIE?

PETER GROND

@PGROND

VAN ADLIB NAAR EENPUBLIEK DOORZOEKBARE

COLLECTIE

WAT IS EEN GOEDE ZOEKMACHINE?

DE GEBRUIKER KAN EENVOUDIG DE MEESTRELEVANTE GEGEVENS UIT DE DATABASE

HALEN

HOE TE ZOEKEN?

HOE TE ZOEKEN?

HOE TE ZOEKEN?Onderzoek van de UvA in het kader van Catchproject

Multiple Search Using Metadata (MuSeUM)

Zoekmethodiek moest geschikt zijn voorspecialistische en algemene gebruikers

BESTE RESULTATEN MET...Combinatie van gestructureerd enongestructureerdBeperk het aantal velden om in te zoekenBepaal relevantie op basis van beidezoekmethodesScheiding van gegevens voor zoeken en weergave

DEFINIEER DE ZOEKVELDEN

WIE, WAT, WAAR, HOE EN WANNEER

DEFINIEER MAPPING ADLIB NAAR DIEVELDEN

Wie: creation_presentation, creator,inscription.maker

Wat: description, object_name,title.short_description, title

Waar: production.place_presentation,production.place

Hoe: material, material_technique_presentation,technique

Wanneer: inscription.date, production.date.start,production.date.end, production.date_presentation,production.period

INDEXEER NIEUWE STRUCTUURWELKE TOOLS?

WAAROM DRUPAL?Belangrijkste functionaliteiten al besckikbaar

Importeren van externe dataDefiniëren van objecten en veldenUitstekende koppeling met Apache Solr

FlexibelGedegen kennis van het systeem

WAAROM APACHE SOLR?Open sourceEen van de snelste zoekmachinesBewezen staat van dienstGrote communityVolop in ontwikkelingUitstekende koppeling met Drupal

API VOOR GEBRUIK ZOEKMACHINEZoekindex geschikt voor gestructureerd en

ongestructureer zoeken

De meest relevante resultaten moeten als eerst naarboven komen

VAN ADLIB NAAR DRUPALGenerieke PHP component niet afhankelijk vanDrupalBeschikbare module uitgebreid met een Fetcher enParser voor de import in DrupalTe downloaden op Drupal.org

VAN DRUPAL NAAR SOLRBeschikbare module gebruiktVeldnamen in Solr niet dynamischVerder geen aanpassingen noodzakelijk

MUS APISimpele laag voor SolrAfhandelen van fouten en API keysOmschrijven van request naar Solr queryRelevantiebepalingCode beschikbaar op Github

RELEVANTIEBEPALINGViool gemaakt door Antonio Stradivarius uit Italië

Wie: Antonio Stradivarius

Wat: Viool

Waar: Italië

Full text: Antonio Stradivarius Viool Italië

RELEVANTIEBEPALINGStandaard scoring van Solr bleek niet geschikt

Lengte van velden hadden teveel invloed

RELEVANTIEBEPALINGStandaard Solr scoring

WieWatWaarFull text

0 2 4 6 8

Viool

Schilderij

NIEUW MODEL RELEVANTIEBEPALINGEen match in een veld levert +1 op

Relatieve score van documenten onderling die eenmatch hebben in een veld levert maximaal +0.2 op

NIEUW MODELNieuw scoring model

WieWie relatiefWatWat relatiefWaarWaar relatiefFull textFull text relatief

0 1 2 3 4

Viool

Schilderij

RELEVANTIEBEPALINGObjecten met een match in 2 velden komen altijd

hoger in de resultaten

Onverwachte relevante of gerelateerde objectenkomen naar boven

SAMENVATTINGZoek in 5 generieke velden + full textImporteer gegevens uit Adlib in DrupalIndexeer gegevens in zoekmachine Apache SolrInterface en relevantiebepaling met API

VRAGEN?@pgrond

peter@triquanta.nl