Download - Van adlib naar online collectie

Transcript
Page 1: Van adlib naar online collectie

WIE?

PETER GROND

@PGROND

Page 2: Van adlib naar online collectie

VAN ADLIB NAAR EENPUBLIEK DOORZOEKBARE

COLLECTIE

Page 3: Van adlib naar online collectie

WAT IS EEN GOEDE ZOEKMACHINE?

DE GEBRUIKER KAN EENVOUDIG DE MEESTRELEVANTE GEGEVENS UIT DE DATABASE

HALEN

Page 4: Van adlib naar online collectie

HOE TE ZOEKEN?

Page 5: Van adlib naar online collectie

HOE TE ZOEKEN?

Page 6: Van adlib naar online collectie

HOE TE ZOEKEN?Onderzoek van de UvA in het kader van Catchproject

Multiple Search Using Metadata (MuSeUM)

Zoekmethodiek moest geschikt zijn voorspecialistische en algemene gebruikers

Page 7: Van adlib naar online collectie

BESTE RESULTATEN MET...Combinatie van gestructureerd enongestructureerdBeperk het aantal velden om in te zoekenBepaal relevantie op basis van beidezoekmethodesScheiding van gegevens voor zoeken en weergave

Page 8: Van adlib naar online collectie

DEFINIEER DE ZOEKVELDEN

WIE, WAT, WAAR, HOE EN WANNEER

Page 9: Van adlib naar online collectie

DEFINIEER MAPPING ADLIB NAAR DIEVELDEN

Wie: creation_presentation, creator,inscription.maker

Wat: description, object_name,title.short_description, title

Waar: production.place_presentation,production.place

Hoe: material, material_technique_presentation,technique

Wanneer: inscription.date, production.date.start,production.date.end, production.date_presentation,production.period

Page 10: Van adlib naar online collectie

INDEXEER NIEUWE STRUCTUURWELKE TOOLS?

Page 11: Van adlib naar online collectie

WAAROM DRUPAL?Belangrijkste functionaliteiten al besckikbaar

Importeren van externe dataDefiniëren van objecten en veldenUitstekende koppeling met Apache Solr

FlexibelGedegen kennis van het systeem

Page 12: Van adlib naar online collectie

WAAROM APACHE SOLR?Open sourceEen van de snelste zoekmachinesBewezen staat van dienstGrote communityVolop in ontwikkelingUitstekende koppeling met Drupal

Page 13: Van adlib naar online collectie

API VOOR GEBRUIK ZOEKMACHINEZoekindex geschikt voor gestructureerd en

ongestructureer zoeken

De meest relevante resultaten moeten als eerst naarboven komen

Page 14: Van adlib naar online collectie
Page 15: Van adlib naar online collectie

VAN ADLIB NAAR DRUPALGenerieke PHP component niet afhankelijk vanDrupalBeschikbare module uitgebreid met een Fetcher enParser voor de import in DrupalTe downloaden op Drupal.org

Page 16: Van adlib naar online collectie

VAN DRUPAL NAAR SOLRBeschikbare module gebruiktVeldnamen in Solr niet dynamischVerder geen aanpassingen noodzakelijk

Page 17: Van adlib naar online collectie

MUS APISimpele laag voor SolrAfhandelen van fouten en API keysOmschrijven van request naar Solr queryRelevantiebepalingCode beschikbaar op Github

Page 18: Van adlib naar online collectie

RELEVANTIEBEPALINGViool gemaakt door Antonio Stradivarius uit Italië

Wie: Antonio Stradivarius

Wat: Viool

Waar: Italië

Full text: Antonio Stradivarius Viool Italië

Page 19: Van adlib naar online collectie
Page 20: Van adlib naar online collectie
Page 21: Van adlib naar online collectie

RELEVANTIEBEPALINGStandaard scoring van Solr bleek niet geschikt

Lengte van velden hadden teveel invloed

Page 22: Van adlib naar online collectie

RELEVANTIEBEPALINGStandaard Solr scoring

WieWatWaarFull text

0 2 4 6 8

Viool

Schilderij

Page 23: Van adlib naar online collectie

NIEUW MODEL RELEVANTIEBEPALINGEen match in een veld levert +1 op

Relatieve score van documenten onderling die eenmatch hebben in een veld levert maximaal +0.2 op

Page 24: Van adlib naar online collectie

NIEUW MODELNieuw scoring model

WieWie relatiefWatWat relatiefWaarWaar relatiefFull textFull text relatief

0 1 2 3 4

Viool

Schilderij

Page 25: Van adlib naar online collectie

RELEVANTIEBEPALINGObjecten met een match in 2 velden komen altijd

hoger in de resultaten

Onverwachte relevante of gerelateerde objectenkomen naar boven

Page 26: Van adlib naar online collectie

SAMENVATTINGZoek in 5 generieke velden + full textImporteer gegevens uit Adlib in DrupalIndexeer gegevens in zoekmachine Apache SolrInterface en relevantiebepaling met API

Page 27: Van adlib naar online collectie

VRAGEN?@pgrond

[email protected]