The Taxonomy Revolution
-
Upload
brenna-morris -
Category
Documents
-
view
22 -
download
0
description
Transcript of The Taxonomy Revolution
The Taxonomy Revolution
Taxonomies and Findability
Jan Voskuil
20 juni 2012,
BIUG
2Kennismodellen en Vindbaarheid
Taxonic
Taxonic is thought leader in de toepassing van semantische
technologieën in bedrijfsprocessen
Diensten op het gebied van Adaptive Case Management,
search en linked data
1 Nieuwe
Uitdagingen
4Kennismodellen en Vindbaarheid
De Nieuwe Wereld
• Understand your business• Cut the development process short• Predict the effect of changes• Empower knowledge workers
5Kennismodellen en Vindbaarheid
De slogans
Operations TCO Cost of Change
Pega
Be Informed
6Kennismodellen en Vindbaarheid
New skills required
7Kennismodellen en Vindbaarheid
Weten versus Begrijpen
• Karel hoort dat Marie een liedje zingt
• Welk liedje hoort Karel dat Marie zingt?
• Marie zingt een liedje terwijl Karel een boek leest.
• Welk boek zingt Marie een liedje terwijl Karel leest?
8Kennismodellen en Vindbaarheid
The challenge
Business Model
Understanding the processes
Process support systems
Insight in process support systems
2 Kennismodellen
10Kennismodellen en Vindbaarheid
The Aboutness Problem
11Kennismodellen en Vindbaarheid
Taxonomieën geven grip
Naming systems:•Standardized•Structured•Systematic
De gewone dotterbloem (Caltha palustris)
12Kennismodellen en Vindbaarheid
Wat maakt een goede taxonomie?
• Distinctiveness• Uniqueness• Homogeneity
13Kennismodellen en Vindbaarheid
Distinctiveness
• Causal mechanism• Positive criteria• Exhaustive classification
14Kennismodellen en Vindbaarheid
Uniqueness
“Als d een zoogdier is, dan is d een gewerveld dier”
15Kennismodellen en Vindbaarheid
Uniqueness observed
16Kennismodellen en Vindbaarheid
Homogeneity
• Autovakanties• Vliegvakanties• Skivakanties
3 Findability
18Kennismodellen en Vindbaarheid
Findability
Problemen met de term “retrieval”•Het gaat niet alleen om wat je doet tijdens retrieval•Gaat niet altijd op
– Bv het vinden van een toilet
•Je weet niet altijd wat je nodig hebt
Findability is about structuring the knowledge needed to find things, and making this knowledge available to others in the most effective way.
19Kennismodellen en Vindbaarheid
Semantic Search
• Free text search: wrong paradigm?• Semantic search:
– Search by word meaning, not word form– Language independent
• Technology:– Indexing and metatagging– Statistische analyse (bijv. Latent Semantic Indexing)
Semantic search is ultimately about understanding why you would issue a query, and retrieve matching items based on this understanding — preferably even before you type in any keywords.
3.1 Findability
Social tagging
21Kennismodellen en Vindbaarheid
Social tagging
• Everyone adds tags• Folksonomy• Tag counts indicate topicality
22Kennismodellen en Vindbaarheid
Social tagging on steroids
• Recommendations• Dishtip
– Generate dish reviews from what people say– Yelp: Web 2.0 > DishTip: Web 3.0
• First Retail– Conversations define markets– Frictionless commerce
3.2 Findability
Thesaurus
24Kennismodellen en Vindbaarheid
Thesaurus
A thesaurus describes the language used in a particular domain, including its concepts and their relations.
Thesauri add power to search and enhance findability.
In a business context, the thesaurus is a treasure trove of information about core concepts.
25Kennismodellen en Vindbaarheid
Thesaurus: structure and explanation
• Gestructureerd vocabulair voor metatags– Tag: (“Mark Twain”)– Tag: (Author: Mark Twain)
• Niet alleen taxonomische relaties• Uitleg bij termen en relaties• Voorbeeld IPC
http://www.wipo.int/classifications/ipc/en/
27Kennismodellen en Vindbaarheid
Hoe helpt een thesaurus bij vindbaarheid?
• Uitleg bij termen• In combinatie met een indexeersysteem:
– Trefwoorden met preciese betekenis • (Author: Mark Twain)
– Mapping van zoekterm naar indexterm– Query-expansie – Preciese zoekresultaten
28Kennismodellen en Vindbaarheid
MeSH
• Veelgebruikte zoek- en indexeerthesaurus• Medical Subject Headings• Dedicated team beheert de thesaurus• Uitgevers laten hun publicaties handmatig
indexeren
29Kennismodellen en Vindbaarheid
MeSH: Mapping, Query-expansie
• Mapping (expliciet)• Mapping (impliciet)
– “hay fever” -> “rhinitis, allergic, seasonal”
• Query-expansie
30Kennismodellen en Vindbaarheid
MeSH: Precise Queries
link
3.3 Findability
Navigational Taxonomies and Faceted search
32Kennismodellen en Vindbaarheid
Navigational taxonomies
33Kennismodellen en Vindbaarheid
Navigational taxonomies: Yahoo!
34Kennismodellen en Vindbaarheid
Faceted search
• Meerdere onafhankelijke taxonomieën
• Filter, “slice and dice”
• Breed toepasbaar
• Be Informed: case overview
35Kennismodellen en Vindbaarheid
Faceted search: rules for classification
• Elk facet is een taxonomie• Elke taxonomie voldoet aan
de regels• Vakantievoorbeeld
(homogeniteit):– Autovakantie– Vliegvakantie– Skivakantie
• Twee losse taxonomieen– Transport {auto, vliegtuig, trein}– Activiteit {skien duiken,
stadstour}– Homogeen!– Gebruiksvriendelijk!
4 Nieuwe Ontwikkelingen
37Kennismodellen en Vindbaarheid
Classificatie van context
Screenshot of http://newtoholland.nl.
38Kennismodellen en Vindbaarheid
Classifcatie van context (2)
Knowledge model mapping user context to information asset
39Kennismodellen en Vindbaarheid
Linked Data (1)
• Data op het Web:– Web 1.0: publiceer documenten– Web 2.0: publiceer conversaties– Web 3.0: publiceer gegevens
(databases)
• Nieuwe (oude) standaarden– RDF– SPARQL– OWL
• Pragmatische benadering– Veel kleine ontologieën– Mix-and-match
40Kennismodellen en Vindbaarheid
Linked data
5 Thank you!