thema's weinig over puur “onderwerpsontsluiting” onderwerpsontsluiting full-text zoeken user /...

14

Transcript of thema's weinig over puur “onderwerpsontsluiting” onderwerpsontsluiting full-text zoeken user /...

Page 1: thema's weinig over puur “onderwerpsontsluiting” onderwerpsontsluiting full-text zoeken user / looser generated content catalogiseren / titelbeschrijven.
Page 2: thema's weinig over puur “onderwerpsontsluiting” onderwerpsontsluiting full-text zoeken user / looser generated content catalogiseren / titelbeschrijven.

thema's

weinig over puur “onderwerpsontsluiting”• onderwerpsontsluiting• full-text zoeken• user / looser generated content• catalogiseren / titelbeschrijven

en verder:• usability / user interfaces• economische aspecten • logistieke aspecten• juridische aspecten

Eric Sieverts | [email protected] | http://www.library.uu.nl/medew/it/eric | [email protected]

kikken op clicken ?

Page 3: thema's weinig over puur “onderwerpsontsluiting” onderwerpsontsluiting full-text zoeken user / looser generated content catalogiseren / titelbeschrijven.

onderwerpsontsluiting

Eric Sieverts | [email protected] | http://www.library.uu.nl/medew/it/eric | [email protected]

nut vangecontroleerdvocabulaire

free-textretrieval

problemen met recall:• als te weinig digitale tekst• (en door ontbreken van standaardisatie als retrieval software zelf te dom is)

problemen met precisie:• als te weinig digitale tekst

OK door standaardisatie /autorisatie, maar toch:

problemen met recall:• als te weinig trefwoorden (wat bijna altijd geval zal zijn)

problemen met precisie:• bij specialistisch onderwerp

Page 4: thema's weinig over puur “onderwerpsontsluiting” onderwerpsontsluiting full-text zoeken user / looser generated content catalogiseren / titelbeschrijven.

onderwerpsontsluiting

Eric Sieverts | [email protected] | http://www.library.uu.nl/medew/it/eric | [email protected]

nut vangecontroleerdvocabulaire

free-textretrieval

en wat is de bottomlinebij het (niet) vinden op titelwoorden?• 48 % WEL gevonden !of• 52% NIET gevonden !

bovendien:zijn we er eigenlijk al uit hoegebruikers er achter moetenkomen op welke woorden ze dan “moeten” zoeken? (werkt Pubmed-oplossingvoor ons ook ?)

Page 5: thema's weinig over puur “onderwerpsontsluiting” onderwerpsontsluiting full-text zoeken user / looser generated content catalogiseren / titelbeschrijven.

onderwerpsontsluiting

Eric Sieverts | [email protected] | http://www.library.uu.nl/medew/it/eric | [email protected]

weinigdigitaletekst

veeldigitaletekst

ook in gevallen waar titel wel "veelzeggend" is:• alleen hoofdonderwerp• globaal ontsloten

indien "table of contents"of goede "samenvatting":• alle invalshoeken /

onderdelen• "diepte-indexering" /

"granulariteit"

alleen hele boekfragmenten / hoofdstukken

“i-Tunisering”

Page 6: thema's weinig over puur “onderwerpsontsluiting” onderwerpsontsluiting full-text zoeken user / looser generated content catalogiseren / titelbeschrijven.

onderwerpsontsluiting

• alleen "gecontroleerd"?

• nut van "user generated" ontsluiting (tags, kennisrepresentatie-wiki, …)

– niet-gecontroleerd, maar toch beter?– up-to-date-ness– communities of practice– nut: specifiek ↔ algemeen– hoeveel materiaal krijgt die tags? – toch ook vorm van controle? >>

Eric Sieverts | [email protected] | http://www.library.uu.nl/medew/it/eric | [email protected]

Page 7: thema's weinig over puur “onderwerpsontsluiting” onderwerpsontsluiting full-text zoeken user / looser generated content catalogiseren / titelbeschrijven.

tags gebundeldop DDC-ranges

Page 8: thema's weinig over puur “onderwerpsontsluiting” onderwerpsontsluiting full-text zoeken user / looser generated content catalogiseren / titelbeschrijven.

retrieval of ontsluiting

• free-text retrieval alleen competitief met ontsluiting als er voldoende tekst is

• in dat geval retrieval veel beter voor recall• dan waarschijnlijk ook beter voor precisie,

zeker voor specialistische onderwerpen• automatische classificatie ook alleen mogelijk

als er voldoende tekst is (EN goede thesaurus!)• begrip "metadata" oprekken voor TOCs,

samenvattingen, flapteksten, user tags…• begrip metadata heel wat meer dan “door

mensen toegekende inhoudelijke ontsluiting”

Eric Sieverts | [email protected] | http://www.library.uu.nl/medew/it/eric | [email protected]

Page 9: thema's weinig over puur “onderwerpsontsluiting” onderwerpsontsluiting full-text zoeken user / looser generated content catalogiseren / titelbeschrijven.

alleen maar zoeken?

Eric Sieverts | [email protected] | http://www.library.uu.nl/medew/it/eric | [email protected]

zoeken ontdekken

beoordelen

webservicesmet suggestieszoals Amazon

webservices,user generated

content, …

ook verleiden?

hoeveel beoordeeld?“most popular”

“long tail”

Page 10: thema's weinig over puur “onderwerpsontsluiting” onderwerpsontsluiting full-text zoeken user / looser generated content catalogiseren / titelbeschrijven.

catalogiseren

• hoe belangrijk is "titelbeschrijving" nog?

• alleen nog als hulpmiddel voor vinden (en beoordelen) ?

– voor parametric search / faceted search ?

• kan het voor gewoon materiaal eenvoudiger ?

• gaat iemand iets met FRBR doen?

Eric Sieverts | [email protected] | http://www.library.uu.nl/medew/it/eric | [email protected]

Page 11: thema's weinig over puur “onderwerpsontsluiting” onderwerpsontsluiting full-text zoeken user / looser generated content catalogiseren / titelbeschrijven.

the experience

iedereen denkt dat Google "de maat der dingen" is voor onze gebruikers

Eric Sieverts | [email protected] | http://www.library.uu.nl/medew/it/eric | [email protected]

Page 12: thema's weinig over puur “onderwerpsontsluiting” onderwerpsontsluiting full-text zoeken user / looser generated content catalogiseren / titelbeschrijven.
Page 13: thema's weinig over puur “onderwerpsontsluiting” onderwerpsontsluiting full-text zoeken user / looser generated content catalogiseren / titelbeschrijven.

the experience

iedereen denkt dat Google "de maat der dingen" is voor onze gebruikers

maar let op:

de Google paradox– met Google "kun je alles vinden"

– maar: als echt "alles" in Google zit, is het eigenlijk niet meer te vinden

wat bedoelde Erik Oltmans dus met "zoiets als Google"?

Eric Sieverts | [email protected] | http://www.library.uu.nl/medew/it/eric | [email protected]

Page 14: thema's weinig over puur “onderwerpsontsluiting” onderwerpsontsluiting full-text zoeken user / looser generated content catalogiseren / titelbeschrijven.

Eric Sieverts | [email protected] | http://www.library.uu.nl/medew/it/eric | [email protected]