Hoofdstuk 5: Kennismanagement 1 Overzicht Introductie Types van kennis Kennismanagement Knowledge sharing Technieken voor kennisverwerving Kennisrepresentatie Conclusies 2 Kennis Data Informatie Data in context en met betekenis Kennis Ruwe geobserveerde feiten Informatie geïnterpreteerd samen met eigen inzicht en ervaring die tot concrete actie kan leiden Wijsheid 3 De Kennispiramide Wijsheid Waardevol Subjectief Kennis Volume Volledigheid Objectiviteit Codeerbaar Transfereerbaar Informatie Data 4 Types van kennis Explicit knowledge Kan gemakkelijk geïdentificeerd worden Formeel en gecodeerd in bijvoorbeeld documenten, rapporten, manuals, white papers, standaard procedures, … Bv. Een set van regels voor loonberekening Tacit knowledge Informeel en niet gecodeerd Vaak gebaseerd op persoonlijke ervaring, individueel leren, en speciale know how Vaak onbewust Heel moeilijk om te extraheren en te coderen Bv. Ervaring van een investeringsmanager bij het aan- en verkopen van aandelen 5 Kenniscreatie Distribution, combination Explicit knowledge Learning, codification Training, practice Tacit knowledge Socialization, experience 6 Kennisbronnen Mensen Bedrijfsprocessen Manuals Documenten en boeken Databases Intranetten … 7 Kennismanagement Definitie Het systematisch creëren, verzamelen, verfijnen, opslaan, onderhouden, beheren en verspreiden van kennis De explicit en tacit knowledge binnen een organisatie wordt ook het intellectueel kapitaal genoemd 8 De kennismanagement cyclus Knowledge Use Knowledge Sharing & Dissemination Knowledge Preservation & Storage Collect & Acquire knowledge Create & Discover new knowledge Knowledge Harmonisation & Quality 9 Belang van Knowledge Management Kenniseconomie Globalisatie Werknemers van geografisch verschillende locaties kunnen kennis delen Evoluties in ICT Toename van ‘white collar’ workers Web, portals, artificial intelligence, … Kennis wordt meer een meer aanzien als een belangrijke concurrentie-factor “Over 40 % of the Fortune 1000 now have a CKO (Chief knowledge officer), a senior-level executive responsible for creating an infrastructure and cultural environment for knowledge sharing” (B. Roberts, Web Week) 10 Belang van Knowledge Management Source: Orbital Software 11 Figure 12-8 12 Knowledge Management binnen de organisatie Knowledge Work Systems (KWS) Office Automation Systems (OAS) (Source: Laudon & Laudon, Management Information Systems 8, chapter 2) 13 Doelstellingen van knowledge management Het behouden van het intellectueel kapitaal en geheugen van een organisatie Minimaliseren van de impact van employee attrition Het creëren van nieuwe kennis op basis van bestaande kennis Harmonisatie van kennis Het exploiteren van de kennis ten behoeve van de besluitvorming Het creëren van toegevoegde waarde aan de hand van kennis Efficiënte verspreiding van kennis Inrichten van een kennis infrastructuur Hergebruik van kennis 14 The knowledge management landscape Figure 12-2 15 Employee attrition 16 Het verspreiden en delen van kennis E-mail Groupware Internet/Intranet/Extranet Portals 17 E-mail Voordelen: Nadelen Gemakkelijk, snel, goedkoop, onafhankelijk van tijd en plaats, ondersteunen van samenwerking, … Zeer ongestructureerd Time consuming (vaak 3 tot 4 uur per dag) Kennis gaat meestal verloren Veel te veel (SPAM) “The cost of time wasted by poor e-mail habits is estimated to be $20+ million per year in an organization of 10,000 employees” Oplossingen Gebruik van rules voor automatic filtering en foldering Duidelijke policies en guidelines! Attitude! 18 Groupware Software die ondersteuning biedt voor workflow activiteiten en information sharing Voorbeeld: Lotus Notes 19 Portals Samenbrengen van informatie voor een specifieke groep van gebruikers aan de hand van een gebruiksvriendelijke webinterface Visueel aantrekkelijk en gemakkelijk te navigeren Kan gepersonaliseerd worden op basis van individuele behoeften Uitgerust met search engine functionaliteit, discussiefora, … 20 Portals CRM Order Entry Support Web Content Sales Marketing Customer Service etc. Enterprise Portal Everything you need to do your job Customers Partners Suppliers ERP Product Literature Extranet Portal One-to-One relationships (P. Hinssen) 21 Voorbeeld SCK-CEN Knowledge Centre Portal Studie-centrum voor kernenergie R&D organisatie waarvoor kennis de belangrijkste resource is! On-line library catalogus E-journals On-line requests met workflow en status rapport Consultatie van eigen wetenschappelijke output Newsfeeds Search engine Ook portal voor nuclear waste disposal 22 Ruyssen, Moons, Borgermans, 2004 23 Intranet: cost aspecten 24 Technieken voor kennisverwerving Business intelligence en KDD Text mining Ontginnen van kennis uit goed gestructureerde data Cf. Hoofdstuk 4 Ontginnen van kennis uit tekst Kenniselicitatie van experten Vooral voor tacit knowledge 25 Text Mining Het ontdekken van patronen in tekstuele data Voorbeelden van tekstdocumenten: E-mails Nieuwsartikelen Verzekeringsclaims Webpagina’s Klachtenbrieven Transcripts van telefoongesprekken met klanten Manuals … Ongeveer 90% van de totale data beschikbaar is ongestructureerd (Oracle) 26 Text Mining Uitdagingen Heel veel dimensies Ongestructureerde documenten Complexe en subtiele verbanden “AOL merges with Time-Warner” “Time-warner is bought by AOL” Ambiguïteit en context-afhankelijkheid Alle mogelijke woorden Automobile=car=vehicle=Toyota Apple (the company) versus apple (fruit) Spelling mistakes and chat language “Hey whazzzzz up” 27 Preprocessing voor Text Mining Verwijderen van stopwoorden Stemming Bv. Lidwoorden (de, het, een, …) Herleiden van woorden naar hun stam Bv. Kopen, koop, koopt, gekocht, … Extraheren van sleutelwoorden 28 Text Mining taken Information Retrieval Information Extraction Categorisatie Clustering Summarisation 29 Taak: Information Retrieval Gegeven een bron van tekst documenten en een user query Bepaal de set (eventueel gerangschikt) van documenten die relevant zijn voor de query Voorbeeld: Google Recall en Precision heel belangrijk (cf. supra) 30 Intelligente Information Retrieval Houdt rekening met betekenis van woorden Volgorde van de woorden in de query Synoniemen: Buy versus purchase Homoniemen: bat (baseball versus mammal), predator (movie, animal, company, plane, …) Hot dog stand in the amusement park Hot amusement stand in the dog park Authority of the source E.g. Academic versus hobbyist 31 Taak: Information Extraction Gegeven een bron met tekstuele documenten en een goed gedefinieerde en gestructureerde tekstuele query Zoek alle zinnen met relevante informatie, extraheer de relevante informatie en negeer de niet relevante informatie, Presenteer de output in een vooraf gedefinieerd formaat (bijvoorbeeld voor het populeren van een database model) 32 Information Extraction: Voorbeeld Grobelnik 33 Taak: Text Classificatie Toewijzen van een document aan een voorafgedefinieerde categorie Supervised learning Eventueel een hiërarchie van categorieën Voorbeeld Catalogeren van e-mail als SPAM Catalogeren van nieuwsberichten (binnenland, buitenland, sport) 34 Taak: Text Clustering Het groeperen van documenten die analoge topics beschrijven in een aantal clusters Unsupervised learning Maximaliseren van de intra-cluster similariteit Maximaliseren van de inter-cluster dissimilariteit Via het definiëren van een similariteitsmaatstaf bv. Euclidische afstand 35 Text Clustering: voorbeeld Apple fruit? company? label? jeans? New York 36 Taak: Text Summarization Samenvatten van een tekst in een kleinere vorm Bijvoorbeeld door het identificeren en samenvoegen van enkele sleutelzinnen Voorbeeld: genereren van management summaries van rapporten MS Word 37 Text Mining: Toepassingen Clusteren van klachten van klanten Suggereren van producten (bv. Films) op basis van een productbeschrijving (tekstueel, bv. Film review) met profiel van de klant Het identificeren van web sites van concurrenten en het extraheren van informatie aangaande hun producten en prijzen 38 Kenniselicitatie van domein experten Extraheren en formaliseren van tacit knowlegde van één of meerdere domein experten door een knowledge engineer Technieken discussies interviews (gestructureerd of ongestructureerd) vragenlijsten aanbieden en laten oplossen van standaard problemen directe observatie van handelingen domein expert 39 Problemen bij kenniselicitatie van experten De domein expert weet vaak meer dan wat hij zegt Knowledge engineer moet vaak ook specialist zijn in de materie Bv. Kenniselicitatie van geneesheren Domein expert denkt volgens zijn eigen patronen, typische cases, objecten, gebeurtenissen Zeer moeilijk om een goede kennisrepresentatie-vorm te kiezen die begrijpbaar is voor de domein expert en werkbaar voor de knowledge engineer (cf. infra) Valideren van de geëliciteerde kennis niet gemakkelijk Hoe kennis van meerdere domein experten samenvoegen? Hoe conflicten oplossen? 40 Overzicht Introductie Types van kennis Kennismanagement Knowledge sharing Technieken voor kennisverwerving Kennisrepresentatie Conclusies 41 Nood aan kennisrepresentatie Beschouw het volgende voorbeeld The number of holidays depends on age and years of service. Every employee receives at least 22 days. Additional days are provided according to the following criteria: Only employees younger than 18 or at least 60 years, or employees with at least 30 years of service will get 5 extra days. Employees with at least 30 years of service and also employees of age 60 or more, receive 3 extra days, on top of possible additional days already supplied. If the employee has at least 15 but less than 30 years of service, 2 extra days are given. These 2 days are also provided for employees of age 45 or more. The 2 extra days can not be combined with the 5 extra days. Vraag: how many holidays is a 62-year old employee with 25 years of service entitled to? Nood aan kennisrepresentatie-vormen die expressief zijn, ondubbelzinnig, context onafhankelijk, en met precieze syntax en semantiek 42 Vormen van Kennisrepresentatie Als dan regels Beslissingstabellen Grafische methoden 43 Als dan regels Propositionele regels bestaande uit condities (antecedent) en acties (consequent) Als aan een aantal condities is voldaan, dan mogen bepaalde conclusies getrokken worden Voorbeeld: If age between 18 and 45 And Service less than 15 years Then Assign 22 days Typische geïmplementeerd als een regelbank met verschillende If then regels die een gegeven scenario of procedure beschrijven: R1: If… Then… R2: If … Then … … RN: If … Then… Wanneer data ter beschikking komt (bv. Age en Service) dan wordt de regelbank doorlopen voor het bepalen van het doelattribuut (bv. Number of holidays) Regelbanken zijn echter moeilijk te interpreteren, verifiëren en valideren 44 Voorbeeld regelbank 45 Kennisbank architectuur development operation 46 Beslissingstabellen The number of holidays depends on age and years of service. Every employee receives at least 22 days. Additional days are provided according to the following criteria: Only employees younger than 18 or at least 60 years, or employees with at least 30 years of service will get 5 extra days. Employees with at least 30 years of service and also employees of age 60 or more, receive 3 extra days, on top of possible additional days already supplied. If the employee has at least 15 but less than 30 years of service, 2 extra days are given. These 2 days are also provided for employees of age 45 or more. The 2 extra days can not be combined with the 5 extra days. Question: how many holidays is a 62-year old employee with 25 years of service entitled to? 47 48 Kim Clijsters' Tennis Ranking “Clijsters becomes the world's number one if she reaches the final, OR If Davenport doesn't reach the final, OR Mauresmo doesn't win the tournament. Lindsay Davenport stays number one if she wins the tournament AND Clijsters doesn't reach the final, OR she looses the final (against another player than Mauresmo) AND Clijsters looses in the semi-finals. Amélie Mauresmo becomes number one if she wins the tournament and Clijsters looses in the quarter-finals. ” (translated from a www.sporza.be, 2006 ...) 49 Holidays Example The number of holidays depends on age and years of service. Every employee receives at least 22 days. Additional days are provided according to the following criteria: Only employees younger than 18 or at least 60 years, or employees with at least 30 years of service will get 5 extra days. Employees with at least 30 years of service and also employees of age 60 or more, receive 3 extra days, on top of possible additional days already supplied. If the employee has at least 15 but less than 30 years of service, 2 extra days are given. These 2 days are also provided for employees of age 45 or more. The 2 extra days can not be combined with the 5 extra days. Question: how many holidays is a 62-year old employee with 25 years of service entitled to? 50 DT Quadrants A DT consists of four quadrants: condition subjects: relevant decision criteria action subjects: possible decision outcomes condition entries: (subranges of) values that the condition subjects may take ( ‘–’ : irrelevant in the context of that column) action entries: action values to be assigned under the corresponding condition combination ( ‘x’ : execute) condition entries condition subjects action subjects action entries 51 DT Properties Desirable properties of the condition part of a DT: It should represent a complete set of decision rules (“exhaustivity” criterion) where columns are mutually exclusive (“exclusivity” criterion) Criteria exclude so-called “multiple-hit” tables 52 DT Modelling Phases A typical DT modelling process includes the following phases: Obtain the conditions and actions of the decision situation Specify the problem in terms of decision rules Fill a DT enumerating every possible combination based on the former rules Check the DT for potential errors Simplify the DT 53 Holidays Example: Obtain Conditions The number of holidays depends on age and years of service. Every employee receives at least 22 days. Additional days are provided according to the following criteria: Only employees younger than 18 or at least 60 years, or employees with at least 30 years of service will get 5 extra days. Employees with at least 30 years of service and also employees of age 60 or more, receive 3 extra days, on top of possible additional days already supplied. If the employee has at least 15 but less than 30 years of service, 2 extra days are given. These 2 days are also provided for employees of age 45 or more. The 2 extra days can not be combined with the 5 extra days. Age: <18 18-<45 Service: <15 15-<30 45-<60 60 30 54 Holidays Example: Obtain Actions The number of holidays depends on age and years of service. Every employee receives at least 22 days. Additional days are provided according to the following criteria: Only employees younger than 18 or at least 60 years, or employees with at least 30 years of service will get 5 extra days. Employees with at least 30 years of service and also employees of age 60 or more, receive 3 extra days, on top of possible additional days already supplied. If the employee has at least 15 but less than 30 years of service, 2 extra days are given. These 2 days are also provided for employees of age 45 or more. The 2 extra days can not be combined with the 5 extra days. Assign 22 days 5 extra days 3 extra days 2 extra days 55 Holidays Example: Construct Empty DT Lexicographical ordering: entries at lower rows alternate before the entries above them Every combination is included (exhaustivity) There are no overlaps (exclusivity) DT can be consulted in a top-down manner 56 Specify Rules and Fill DT (1) “Every employee receives at least 22 days.” ‘x’ in all columns 57 Specify Rules and Fill DT (2) “Only employees younger than 18 or at least 60 years, or employees with at least 30 years of service will get 5 extra days.” if Age < 18 or Age ≥ 60 or Service ≥ 30 then 5 extra days {1, 2, 3} {10, 11, 12} {3, 6, 9, 12} (try completing remaining rows yourself ) 58 Check the DT for Potential Errors x x x x x “The 2 extra days can not be combined with the 5 extra days” Verify: look for any anomalies Check columns for conflicting action entries Check columns for missing action entries Validate: check correctness (semantic) Does every column have the right entries? 59 Simplify: Eliminate Impossibilities Simplify by removing impossible columns (e.g. employees younger than 18 cannot have 15 years of service or more) 60 Simplify: Contract Logically Adjacent Columns 61 Holidays Example: Decision Table (DT) Number of holidays: 62-year old employee with 25 years experience: 22+5+3 = 30 days Definition: A decision table (DT) is a tabular notation used to describe and analyse decision situations where the state of a number of conditions determines the execution of a set of actions 62 A DT Modelling Tool: Prologa URL: http://www.econ.kuleuven.be/prologa/ 63 Advantages of DTs Intuitive also to non-IT people Facilitate communication between business user, analyst and programmer Easy to validate Can be efficiently applied to a specific problem case Assumed faster and less prone to human mistakes than textual rules Provide range of implementation options Automatic export to other target representation procedural: program code (nested if-else statement) non-procedural: if-then rules & rule inference engine relational database table & SQL Direct consultation by special-purpose engine Easy to maintain (even by business user directly) Provide level of abstraction from implementation issues Implementing changes requires little effort Reflected instantly (direct consultation) or after re-generating target representation 64 Kim Clijsters’ Voorbeeld 1. Clijsters 2. Davenport 3. Mauresmo goes out before semi-final goes out before final runner-up does not win tourn. wins tourn. does not win tourn. wins tourn. 1. Cijsters number 1 2. Davenport number 1 3. Mauresmo number 1 1. Clijsters 2. Davenport 3. Mauresmo 1. Cijsters number 1 2. Davenport number 1 3. Mauresmo number 1 x . . 1 x . x 2 x . . 3 . . x 4 looses semi-final goes out before final runner-up or wins tourn. does not win tourn. wins tourn. x . . 6 x x . 7 wins tourn. - . . . 8 x x . 5 runner-up or wins x . . 9 65 Grafische kennisrepresentatie methoden Semantische netwerken Bayesiaanse netwerken 66 Semantische netwerken subclass haspart Animal head subclass Reptile Mammal subclass Africa livesin Elephant Dumbo size large instance Via het doorlopen van het netwerk vinden we dat Dumbo Large is, in Africa woont en een hoofd heeft! 67 Bayesiaanse netwerken Probabilistische white box modellen Kennis infereren aan de hand van Bayes’ theorema 68 Knowledge Management in de Praktijk General Electric McKinsey and Bain & Co. These two management consulting firms have developed "knowledge databases" that contain experiences from every assignment including names of team members and client reactions. Each team must appoint a "historian" to document the work. Boeing 777 GE has since 1982 collected all customer complaints in a database, that supports telephone operators in answering customer calls. GE has programmed 1,5 million potential problems and their solutions into its system. First "paperless" development of aircraft. Included customers in design teams. More than 200 teams with wide range of skills both designed and constructed sub parts, rather than usual organization design team, construction team. Suppliers world-wide used same digital databases as Boeing. Xerox Provides convenient places where people can get together routinely. Called the "distributed coffee pot" these environments encourage transfer of tacit knowledge 69 Knowledge Management: Slotbevindingen Bereidwilligheid van werknemers tot het delen van kennis Kennismanagement moet met een geschikte ICT technologie geïmplementeerd worden Kennismanagement moet gealigneerd zijn met de bedrijfsstrategie Ontwikkelen van een kennisinfrastructuur! 70