The Taxonomy Revolution Taxonomies and Findability Jan Voskuil 20 juni 2012, BIUG Taxonic Taxonic is thought leader in de toepassing van semantische technologieën in bedrijfsprocessen Diensten op het gebied van Adaptive Case Management, search en linked data Kennismodellen en Vindbaarheid 2 Nieuwe Uitdagingen De Nieuwe Wereld • • • • Understand your business Cut the development process short Predict the effect of changes Empower knowledge workers Kennismodellen en Vindbaarheid 4 De slogans 40 Pega 35 30 25 20 15 10 5 0 Customer retention Operations Kennismodellen en Vindbaarheid Be Informed Revenue Productivity TCO Cost of Change 5 New skills required Kennismodellen en Vindbaarheid 6 Weten versus Begrijpen • Karel hoort dat Marie een liedje zingt • Welk liedje hoort Karel dat Marie zingt? • Marie zingt een liedje terwijl Karel een boek leest. • Welk boek zingt Marie een liedje terwijl Karel leest? Kennismodellen en Vindbaarheid 7 The challenge Understanding the processes Business Model Process support systems Insight in process support systems Kennismodellen en Vindbaarheid 8 Kennismodellen The Aboutness Problem Kennismodellen en Vindbaarheid 10 Taxonomieën geven grip Naming systems: • Standardized • Structured • Systematic De gewone dotterbloem (Caltha palustris) Kennismodellen en Vindbaarheid 11 Wat maakt een goede taxonomie? • Distinctiveness • Uniqueness • Homogeneity Kennismodellen en Vindbaarheid 12 Distinctiveness • Causal mechanism • Positive criteria • Exhaustive classification Kennismodellen en Vindbaarheid 13 Uniqueness “Als d een zoogdier is, dan is d een gewerveld dier” Kennismodellen en Vindbaarheid 14 Uniqueness observed Kennismodellen en Vindbaarheid 15 Homogeneity • Autovakanties • Vliegvakanties • Skivakanties Kennismodellen en Vindbaarheid 16 Findability Findability Problemen met de term “retrieval” • Het gaat niet alleen om wat je doet tijdens retrieval • Gaat niet altijd op – Bv het vinden van een toilet • Je weet niet altijd wat je nodig hebt Kennismodellen en Vindbaarheid Findability is about structuring the knowledge needed to find things, and making this knowledge available to others in the most effective way. 18 Semantic Search • Free text search: wrong paradigm? • Semantic search: – Search by word meaning, not word form – Language independent • Technology: – Indexing and metatagging – Statistische analyse (bijv. Latent Semantic Indexing) Semantic search is ultimately about understanding why you would issue a query, and retrieve matching items based on this understanding — preferably even before you type in any keywords. Kennismodellen en Vindbaarheid 19 .1 Findability Social tagging Social tagging • Everyone adds tags • Folksonomy • Tag counts indicate topicality Kennismodellen en Vindbaarheid 21 Social tagging on steroids • Recommendations • Dishtip – Generate dish reviews from what people say – Yelp: Web 2.0 > DishTip: Web 3.0 • First Retail – Conversations define markets – Frictionless commerce Kennismodellen en Vindbaarheid 22 .2 Findability Thesaurus Thesaurus A thesaurus describes the language used in a particular domain, including its concepts and their relations. Thesauri add power to search and enhance findability. In a business context, the thesaurus is a treasure trove of information about core concepts. Kennismodellen en Vindbaarheid 24 Thesaurus: structure and explanation • Gestructureerd vocabulair voor metatags – Tag: (“Mark Twain”) – Tag: (Author: Mark Twain) • Niet alleen taxonomische relaties • Uitleg bij termen en relaties • Voorbeeld IPC Kennismodellen en Vindbaarheid 25 http://www.wipo.int/classifications/ipc/en/ Hoe helpt een thesaurus bij vindbaarheid? • Uitleg bij termen • In combinatie met een indexeersysteem: – Trefwoorden met preciese betekenis • (Author: Mark Twain) – Mapping van zoekterm naar indexterm – Query-expansie – Preciese zoekresultaten Kennismodellen en Vindbaarheid 27 MeSH • • • • Veelgebruikte zoek- en indexeerthesaurus Medical Subject Headings Dedicated team beheert de thesaurus Uitgevers laten hun publicaties handmatig indexeren Kennismodellen en Vindbaarheid 28 MeSH: Mapping, Query-expansie • Mapping (expliciet) • Mapping (impliciet) – “hay fever” -> “rhinitis, allergic, seasonal” • Query-expansie Kennismodellen en Vindbaarheid 29 MeSH: Precise Queries Kennismodellen en Vindbaarheid link 30 .3 Findability Navigational Taxonomies and Faceted search Navigational taxonomies Kennismodellen en Vindbaarheid 32 Navigational taxonomies: Yahoo! Kennismodellen en Vindbaarheid 33 Faceted search • Meerdere onafhankelijke taxonomieën • Filter, “slice and dice” • Breed toepasbaar • Be Informed: case overview Kennismodellen en Vindbaarheid 34 Faceted search: rules for classification • Elk facet is een taxonomie • Elke taxonomie voldoet aan de regels • Vakantievoorbeeld (homogeniteit): – Autovakantie – Vliegvakantie – Skivakantie • Twee losse taxonomieen – – – – Transport {auto, vliegtuig, trein} Activiteit {skien duiken, stadstour} Homogeen! Gebruiksvriendelijk! Kennismodellen en Vindbaarheid 35 Nieuwe Ontwikkelingen Classificatie van context Screenshot of http://newtoholland.nl. Kennismodellen en Vindbaarheid 37 Classifcatie van context (2) Knowledge model mapping user context to information asset Kennismodellen en Vindbaarheid 38 Linked Data (1) • Data op het Web: – Web 1.0: publiceer documenten – Web 2.0: publiceer conversaties – Web 3.0: publiceer gegevens (databases) • Nieuwe (oude) standaarden – RDF – SPARQL – OWL • Pragmatische benadering – Veel kleine ontologieën – Mix-and-match Kennismodellen en Vindbaarheid 39 Linked data Kennismodellen en Vindbaarheid 40 Thank you!