Taxonomy revolution - Taxonomies and Findability

advertisement
The Taxonomy Revolution
Taxonomies and Findability
Jan Voskuil
20 juni 2012,
BIUG
Taxonic
Taxonic is thought leader in de
toepassing van semantische
technologieën in bedrijfsprocessen
Diensten op het gebied van
Adaptive Case Management,
search en linked data
Kennismodellen en Vindbaarheid
2
Nieuwe Uitdagingen
De Nieuwe Wereld
•
•
•
•
Understand your business
Cut the development process short
Predict the effect of changes
Empower knowledge workers
Kennismodellen en Vindbaarheid
4
De slogans
40
Pega
35
30
25
20
15
10
5
0
Customer
retention
Operations
Kennismodellen en Vindbaarheid
Be Informed
Revenue Productivity
TCO
Cost of Change
5
New skills required
Kennismodellen en Vindbaarheid
6
Weten versus Begrijpen
• Karel hoort dat Marie een liedje zingt
• Welk liedje hoort Karel dat Marie zingt?
• Marie zingt een liedje terwijl Karel een boek leest.
• Welk boek zingt Marie een liedje terwijl Karel leest?
Kennismodellen en Vindbaarheid
7
The challenge
Understanding
the processes
Business
Model
Process support
systems
Insight in process
support systems
Kennismodellen en Vindbaarheid
8
Kennismodellen
The Aboutness Problem
Kennismodellen en Vindbaarheid
10
Taxonomieën geven grip
Naming systems:
• Standardized
• Structured
• Systematic
De gewone dotterbloem (Caltha palustris)
Kennismodellen en Vindbaarheid
11
Wat maakt een goede taxonomie?
• Distinctiveness
• Uniqueness
• Homogeneity
Kennismodellen en Vindbaarheid
12
Distinctiveness
• Causal mechanism
• Positive criteria
• Exhaustive classification
Kennismodellen en Vindbaarheid
13
Uniqueness
“Als d een zoogdier is, dan is d een gewerveld dier”
Kennismodellen en Vindbaarheid
14
Uniqueness observed
Kennismodellen en Vindbaarheid
15
Homogeneity
• Autovakanties
• Vliegvakanties
• Skivakanties
Kennismodellen en Vindbaarheid
16
Findability
Findability
Problemen met de term
“retrieval”
• Het gaat niet alleen
om wat je doet
tijdens retrieval
• Gaat niet altijd op
– Bv het vinden van een
toilet
• Je weet niet altijd
wat je nodig hebt
Kennismodellen en Vindbaarheid
Findability is about structuring the
knowledge needed to find things, and
making this knowledge available to others in
the most effective way.
18
Semantic Search
• Free text search: wrong paradigm?
• Semantic search:
– Search by word meaning, not word form
– Language independent
• Technology:
– Indexing and metatagging
– Statistische analyse (bijv. Latent Semantic Indexing)
Semantic search is ultimately about understanding why you would
issue a query, and retrieve matching items based on this understanding
— preferably even before you type in any keywords.
Kennismodellen en Vindbaarheid
19
.1
Findability
Social tagging
Social tagging
• Everyone adds tags
• Folksonomy
• Tag counts indicate topicality
Kennismodellen en Vindbaarheid
21
Social tagging on steroids
• Recommendations
• Dishtip
– Generate dish reviews from what people say
– Yelp: Web 2.0 > DishTip: Web 3.0
• First Retail
– Conversations define markets
– Frictionless commerce
Kennismodellen en Vindbaarheid
22
.2
Findability
Thesaurus
Thesaurus
A thesaurus describes the language used in a particular
domain, including its concepts and their relations.
Thesauri add power to search and enhance findability.
In a business context, the thesaurus is a treasure trove
of information about core concepts.
Kennismodellen en Vindbaarheid
24
Thesaurus: structure and explanation
• Gestructureerd vocabulair voor metatags
– Tag: (“Mark Twain”)
– Tag: (Author: Mark Twain)
• Niet alleen taxonomische relaties
• Uitleg bij termen en relaties
• Voorbeeld IPC
Kennismodellen en Vindbaarheid
25
http://www.wipo.int/classifications/ipc/en/
Hoe helpt een thesaurus bij vindbaarheid?
• Uitleg bij termen
• In combinatie met een indexeersysteem:
– Trefwoorden met preciese betekenis
• (Author: Mark Twain)
– Mapping van zoekterm naar indexterm
– Query-expansie
– Preciese zoekresultaten
Kennismodellen en Vindbaarheid
27
MeSH
•
•
•
•
Veelgebruikte zoek- en indexeerthesaurus
Medical Subject Headings
Dedicated team beheert de thesaurus
Uitgevers laten hun publicaties handmatig indexeren
Kennismodellen en Vindbaarheid
28
MeSH: Mapping, Query-expansie
• Mapping (expliciet)
• Mapping (impliciet)
– “hay fever” -> “rhinitis,
allergic, seasonal”
• Query-expansie
Kennismodellen en Vindbaarheid
29
MeSH: Precise Queries
Kennismodellen en Vindbaarheid
link
30
.3
Findability
Navigational Taxonomies
and Faceted search
Navigational taxonomies
Kennismodellen en Vindbaarheid
32
Navigational taxonomies: Yahoo!
Kennismodellen en Vindbaarheid
33
Faceted search
• Meerdere
onafhankelijke
taxonomieën
• Filter, “slice and
dice”
• Breed
toepasbaar
• Be Informed:
case overview
Kennismodellen en Vindbaarheid
34
Faceted search: rules for classification
• Elk facet is een taxonomie
• Elke taxonomie voldoet aan de
regels
• Vakantievoorbeeld
(homogeniteit):
– Autovakantie
– Vliegvakantie
– Skivakantie
• Twee losse taxonomieen
–
–
–
–
Transport {auto, vliegtuig, trein}
Activiteit {skien duiken, stadstour}
Homogeen!
Gebruiksvriendelijk!
Kennismodellen en Vindbaarheid
35
Nieuwe
Ontwikkelingen
Classificatie van context
Screenshot of http://newtoholland.nl.
Kennismodellen en Vindbaarheid
37
Classifcatie van context (2)
Knowledge model mapping user context to information asset
Kennismodellen en Vindbaarheid
38
Linked Data (1)
• Data op het Web:
– Web 1.0: publiceer documenten
– Web 2.0: publiceer conversaties
– Web 3.0: publiceer gegevens
(databases)
• Nieuwe (oude) standaarden
– RDF
– SPARQL
– OWL
• Pragmatische benadering
– Veel kleine ontologieën
– Mix-and-match
Kennismodellen en Vindbaarheid
39
Linked data
Kennismodellen en Vindbaarheid
40
Thank you!
Download