The Taxonomy Revolution

41
The Taxonomy Revolution Taxonomies and Findability Jan Voskuil 20 juni 2012, BIUG

description

The Taxonomy Revolution. Taxonomies and Findability. Jan Voskuil 20 juni 2012, BIUG. Taxonic. Taxonic is thought leader in de toepassing van semantische technologieën in bedrijfsprocessen Diensten op het gebied van Adaptive Case Management, search en linked data. 1. Nieuwe Uitdagingen. - PowerPoint PPT Presentation

Transcript of The Taxonomy Revolution

Page 1: The Taxonomy Revolution

The Taxonomy Revolution

Taxonomies and Findability

Jan Voskuil

20 juni 2012,

BIUG

Page 2: The Taxonomy Revolution

2Kennismodellen en Vindbaarheid

Taxonic

Taxonic is thought leader in de toepassing van semantische

technologieën in bedrijfsprocessen

Diensten op het gebied van Adaptive Case Management,

search en linked data

Page 3: The Taxonomy Revolution

1 Nieuwe

Uitdagingen

Page 4: The Taxonomy Revolution

4Kennismodellen en Vindbaarheid

De Nieuwe Wereld

• Understand your business• Cut the development process short• Predict the effect of changes• Empower knowledge workers

Page 5: The Taxonomy Revolution

5Kennismodellen en Vindbaarheid

De slogans

Operations TCO Cost of Change

Pega

Be Informed

Page 6: The Taxonomy Revolution

6Kennismodellen en Vindbaarheid

New skills required

Page 7: The Taxonomy Revolution

7Kennismodellen en Vindbaarheid

Weten versus Begrijpen

• Karel hoort dat Marie een liedje zingt

• Welk liedje hoort Karel dat Marie zingt?

• Marie zingt een liedje terwijl Karel een boek leest.

• Welk boek zingt Marie een liedje terwijl Karel leest?

Page 8: The Taxonomy Revolution

8Kennismodellen en Vindbaarheid

The challenge

Business Model

Understanding the processes

Process support systems

Insight in process support systems

Page 9: The Taxonomy Revolution

2 Kennismodellen

Page 10: The Taxonomy Revolution

10Kennismodellen en Vindbaarheid

The Aboutness Problem

Page 11: The Taxonomy Revolution

11Kennismodellen en Vindbaarheid

Taxonomieën geven grip

Naming systems:•Standardized•Structured•Systematic

De gewone dotterbloem (Caltha palustris)

Page 12: The Taxonomy Revolution

12Kennismodellen en Vindbaarheid

Wat maakt een goede taxonomie?

• Distinctiveness• Uniqueness• Homogeneity

Page 13: The Taxonomy Revolution

13Kennismodellen en Vindbaarheid

Distinctiveness

• Causal mechanism• Positive criteria• Exhaustive classification

Page 14: The Taxonomy Revolution

14Kennismodellen en Vindbaarheid

Uniqueness

“Als d een zoogdier is, dan is d een gewerveld dier”

Page 15: The Taxonomy Revolution

15Kennismodellen en Vindbaarheid

Uniqueness observed

Page 16: The Taxonomy Revolution

16Kennismodellen en Vindbaarheid

Homogeneity

• Autovakanties• Vliegvakanties• Skivakanties

Page 17: The Taxonomy Revolution

3 Findability

Page 18: The Taxonomy Revolution

18Kennismodellen en Vindbaarheid

Findability

Problemen met de term “retrieval”•Het gaat niet alleen om wat je doet tijdens retrieval•Gaat niet altijd op

– Bv het vinden van een toilet

•Je weet niet altijd wat je nodig hebt

Findability is about structuring the knowledge needed to find things, and making this knowledge available to others in the most effective way.

Page 19: The Taxonomy Revolution

19Kennismodellen en Vindbaarheid

Semantic Search

• Free text search: wrong paradigm?• Semantic search:

– Search by word meaning, not word form– Language independent

• Technology:– Indexing and metatagging– Statistische analyse (bijv. Latent Semantic Indexing)

Semantic search is ultimately about understanding why you would issue a query, and retrieve matching items based on this understanding — preferably even before you type in any keywords.

Page 20: The Taxonomy Revolution

3.1 Findability

Social tagging

Page 21: The Taxonomy Revolution

21Kennismodellen en Vindbaarheid

Social tagging

• Everyone adds tags• Folksonomy• Tag counts indicate topicality

Page 22: The Taxonomy Revolution

22Kennismodellen en Vindbaarheid

Social tagging on steroids

• Recommendations• Dishtip

– Generate dish reviews from what people say– Yelp: Web 2.0 > DishTip: Web 3.0

• First Retail– Conversations define markets– Frictionless commerce

Page 23: The Taxonomy Revolution

3.2 Findability

Thesaurus

Page 24: The Taxonomy Revolution

24Kennismodellen en Vindbaarheid

Thesaurus

A thesaurus describes the language used in a particular domain, including its concepts and their relations.

Thesauri add power to search and enhance findability.

In a business context, the thesaurus is a treasure trove of information about core concepts.

Page 25: The Taxonomy Revolution

25Kennismodellen en Vindbaarheid

Thesaurus: structure and explanation

• Gestructureerd vocabulair voor metatags– Tag: (“Mark Twain”)– Tag: (Author: Mark Twain)

• Niet alleen taxonomische relaties• Uitleg bij termen en relaties• Voorbeeld IPC

Page 26: The Taxonomy Revolution

http://www.wipo.int/classifications/ipc/en/

Page 27: The Taxonomy Revolution

27Kennismodellen en Vindbaarheid

Hoe helpt een thesaurus bij vindbaarheid?

• Uitleg bij termen• In combinatie met een indexeersysteem:

– Trefwoorden met preciese betekenis • (Author: Mark Twain)

– Mapping van zoekterm naar indexterm– Query-expansie – Preciese zoekresultaten

Page 28: The Taxonomy Revolution

28Kennismodellen en Vindbaarheid

MeSH

• Veelgebruikte zoek- en indexeerthesaurus• Medical Subject Headings• Dedicated team beheert de thesaurus• Uitgevers laten hun publicaties handmatig

indexeren

Page 29: The Taxonomy Revolution

29Kennismodellen en Vindbaarheid

MeSH: Mapping, Query-expansie

• Mapping (expliciet)• Mapping (impliciet)

– “hay fever” -> “rhinitis, allergic, seasonal”

• Query-expansie

Page 31: The Taxonomy Revolution

3.3 Findability

Navigational Taxonomies and Faceted search

Page 32: The Taxonomy Revolution

32Kennismodellen en Vindbaarheid

Navigational taxonomies

Page 33: The Taxonomy Revolution

33Kennismodellen en Vindbaarheid

Navigational taxonomies: Yahoo!

Page 34: The Taxonomy Revolution

34Kennismodellen en Vindbaarheid

Faceted search

• Meerdere onafhankelijke taxonomieën

• Filter, “slice and dice”

• Breed toepasbaar

• Be Informed: case overview

Page 35: The Taxonomy Revolution

35Kennismodellen en Vindbaarheid

Faceted search: rules for classification

• Elk facet is een taxonomie• Elke taxonomie voldoet aan

de regels• Vakantievoorbeeld

(homogeniteit):– Autovakantie– Vliegvakantie– Skivakantie

• Twee losse taxonomieen– Transport {auto, vliegtuig, trein}– Activiteit {skien duiken,

stadstour}– Homogeen!– Gebruiksvriendelijk!

Page 36: The Taxonomy Revolution

4 Nieuwe Ontwikkelingen

Page 37: The Taxonomy Revolution

37Kennismodellen en Vindbaarheid

Classificatie van context

Screenshot of http://newtoholland.nl.

Page 38: The Taxonomy Revolution

38Kennismodellen en Vindbaarheid

Classifcatie van context (2)

Knowledge model mapping user context to information asset

Page 39: The Taxonomy Revolution

39Kennismodellen en Vindbaarheid

Linked Data (1)

• Data op het Web:– Web 1.0: publiceer documenten– Web 2.0: publiceer conversaties– Web 3.0: publiceer gegevens

(databases)

• Nieuwe (oude) standaarden– RDF– SPARQL– OWL

• Pragmatische benadering– Veel kleine ontologieën– Mix-and-match

Page 40: The Taxonomy Revolution

40Kennismodellen en Vindbaarheid

Linked data

Page 41: The Taxonomy Revolution

5 Thank you!