Developing a Knowledge management system based on the semantic web scheme

advertisement
南台科技大學
資訊管理研究所
碩士學位論文
以語意網為方法建構企業 IT 人員知識管理系統
Developing a Knowledge management
system based on the semantic web scheme
陳建輝
指導教授:陳志達
1
中文摘要
知識經濟時代的來臨,知識成為影響企業競爭的關鍵因素。基於知識變化與
更新的迅速,資訊科技工程師所需要的知識必須由不同的來源管道取得。因此,
整合相關領域知識用以提供使用者運用、分享與在利用,才能發揮知識之價值及
企業資源成本的節省。然而知識為一抽像的概念,定樣上較為困難,因此會造成
知識整合上所面臨的困難。當知識文件被建立之後只有人類可以理解與使用,電
腦無法了解這些資源的涵意而使得這些知識被侷限在特定條件搜尋下才能被利
用,語意網(Semantic Web)的的出現提供了一個解決方案,以電腦能夠了解的語言
來描述這些資源讓電腦能夠自動處理這些資源進而提供更多的可能性與應用。
本研究的目的將藉由本體論(Ontology)理論,提出一個適當的知識庫管理系
統。針對資訊業服務人員平日工作時所遇到的問題,或者公司內部教育訓練之文
件,運用本體論的類別與元素來實現知識整合系統與改變現在知識文件無法整合
利用,及進而透過語意網的概念讓這些知識可以隨時被使用者發掘,對於業界人
員及產業都能帶來正面的效益。
系統設計上以現有的知識管理系統為基礎,加入了語意網的技術,藉由此協
助讓這些資源能夠以電腦懂得的方式來描述,以提供更豐富的應用及精確的搜
尋,以提供企業對於知識管理的可靠度及品質。
關鍵字:本體論、Protégé、知識管理、語意網。
2
Developing a KM management system based on
semantic web scheme
ABSTRACT
Knowledge influences the competition of enterprise. Because of knowledge
changing and updating frequently, IT engineers need to get knowledge from different
sources. Therefore, it is important to integrate relative domain knowledge to support
users applying, sharing and reusing knowledge and resource cost down. However,
knowledge is an abstract concept which is difficult to define and integrate bottleneck.
After the knowledge document is established, only then the humanity may understand
and the use, The computer is unable to understand that these resources contain Italy to
cause these knowledge to limit can use under the special condition search. Semantic
web has provided a solution that use a OWL language describe these resource to enable
the computer automatic reduction these resource then provide more possibility.
An appropriate mode on the theory of Ontology is adopted in the knowledge
management system. Question ordinary day meets which in view of IT engineers, or
the company interior education news practices the curriculum, realize the knowledge
conformity system using the Ontology class and the element.
The system design take the existing knowledge management system as a
foundation has joined the Semantic Web technology, provides a precise search to
promotion enterprise knowledge management reliability and quality
Keywords: Ontology, Protégé, Knowledge Management System, Semantic
Web
3
目錄
中文摘要
2
ABSTRACT
3
第一章
6
緒論
1.1 研究背景 ................................................................................................... 6
1.2
1.3
1.4
第二章
研究動機 ................................................................................................... 7
研究目的 ................................................................................................... 8
論文架構 ................................................................................................... 8
文獻探討
10
2.1 知識管理 .................................................................................................. 10
2.1.1 知識的定義 .................................................................................. 10
2.1.2 知識的管理 .................................................................................. 11
2.2 知識管理系統 ......................................................................................... 13
2.2.1 知識管理系統的定義 ................................................................... 13
2.3
2.4
2.5
第三章
2.2.2 知識管理系統架構理論 ............................................................... 13
2.2.3 知識管理系統的導入流程 ........................................................... 15
2.2.4 知識管理系統的應用與挑戰 ....................................................... 16
語意網(Semantic Web)............................................................................ 17
2.3.1 語意網(Semantic Web)的意義 ..................................................... 17
2.3.2 語意網(Semantic Web)的架構 .................................................... 18
資源描述架構(Resource Description Framework,RDF) ....................... 19
本體論(Ontology) .................................................................................... 21
研究方法
24
3.1 研究方向 ................................................................................................. 24
3.1.1 領域研究階段 .............................................................................. 25
3.1.2 探討相關技術階段 ...................................................................... 26
3.1.3 應用本體論的優勢 ...................................................................... 31
3.2 個案公司研究 ......................................................................................... 32
3.3 個案公司知識面分類 ............................................................................. 33
3.4 系統說明及系統架構圖 ......................................................................... 34
3.4.1 KMS modules ................................................................................ 35
3.4.2 Transfer & Matching Module ........................................................ 36
4
第四章
3.4.3 Information Query Module ............................................................ 39
3.4.4 本體論模型建立 .......................................................................... 40
系統架構與實作
42
4.1 系統實做環境及流程 ............................................................................. 42
4.1 系統開發工具 ......................................................................................... 43
4.1.1 使用工具:Protégé 4.1_beta........................................................ 43
4.1.2 使用 Plugin ................................................................................... 44
4.1.3 Graphviz 安裝與設定................................................................... 46
4.2 知識本體論建置實例 ............................................................................. 48
4.2.1 知識本體的名稱空間 .................................................................. 48
4.2.1 知識類別的建立 .......................................................................... 49
4.2.1 知識屬性的建立 .......................................................................... 56
4.3 知識本體的推理 ..................................................................................... 60
第五章 結論與未來工作
63
5.1 結論 ......................................................................................................... 63
5.2 未來工作 ................................................................................................. 63
參考文獻
65
5
第一章 緒論
1.1 研究背景
由於知識經濟時代的來臨,知識成為影響企業競爭的關鍵因素。「知識經濟」
一詞是由經濟合作發展組織(OECD)首創,其定義為「以知識資源的擁有、配置、
產生和使用,為最重要生產因素的經濟型態。」時至今日,知識已經可以單獨作
為一個投資要素,而且其重要性已超過土地與資本。無論國際之間或是企業之間
的競爭,知識都扮演了舉足輕重的腳色。然而,在工業時代機器設備的發明、創
新、使用,同樣也需要知識,但為什麼不稱之為「知識經濟」呢?這是因為在知
識經濟時代,在知識的使用上與其他時代有所差異的緣故。這些差異包括(賴景昌,
林國仕,2004):
重複與非重複性地使用:在工業時代,員工從工作手冊、操作規範、經驗的
累積取得生產時所需要的知識,這些知識在生產時重複地使用,很少變革。而在
知識經濟時代,知識工作者所使用的知識則具原創性與創新性,而非單調地重複
使用同一種知識。
間接與直接地使用:在工業時代,員工所使用的工作手冊、操作規範等是工
程師或企業聘請專人所撰寫,員工只需依規則操作機器。在知識經濟時代,知識
工作者對知識的使用是直接、最主要的生產因素。
被動與主動地使用:在農業與工業時代,員工在正常狀況下是不會主動去使
用知識。而在知識經濟時代,企業起用大批的知識工作者,不是使用技術、資金
或勞力來創造財富,而是使用無形的知識來改造生產程式、組織結構及創新產品
6
來創造財富。
由此可知,現代社會所需的知識是複雜而多樣的,也因此,如何有效的獲得、
保存與管理這些龐大的知識群成為很大的挑戰。拜資訊科技快速發展及網際網路
的影響,企業已經開始運用新興科技的協助來加強企業內部對知識管理的實踐,
也就是所謂的知識管理系統。而相關本土應用軟體解決方案陸續推出,也使得國
內實際導入或建置知識管理系統並加以應用的比例年年增加,這也表示知識管理
已由觀念的推展進入實際應用階段,足見知識管理的浪潮已經席捲全台。研究發
現(吳炯龍,2002)知識管理系統的八項功能:工作流程、文件及內容管理、群體協
同運作、專案管理、決策支援系統、線上學習、網路社群、以及基礎建設,員工
皆非常重視,一方面顯示員工體認知識管理的重要性,需要系統來促進其知識的
創造、知識的儲存與整合、知識的分享與移轉等活動的進行,尤其是與工作相關
的應用上,另一方面,公司也必須持續加強在系統上的投資,導入系統時符合全
公司的需求才算完善。企業知識管理入口網站建置的考量上,以系統穩定與使用
簡單應被視為最優先考量的因素。而這樣的一個系統如何被有效的建構出來,也
成了企業間競爭決勝的關鍵因素。
1.2 研究動機
儘管許多公司開始利用知識管理取得競爭優勢,善用科技,建立知識分享的
文化,甚至運用許多吸引人的獎勵、激勵措施,或藉由體制上的改變,企圖建立
良好的知識管理系統,結果卻往往不如預期。探究其原因,在於企業的經營模式
越來越複雜,各部門的分工越來越細,經營的形態也呈現多樣化,讓企業在管理
上更加的困難。當公司人員專業的分工使得企業內部所要呈現的資訊越來越多並
且分散,就越難以將資訊集中管理。因為這些知識只是各部門自行整理彙整,並
沒有辦法將這些資訊有效、深入的分析提供給各部門使用。身為一個資訊業服務
人員所煩惱的不是資訊取得的問題,而是如何管理及過濾這些資訊,而資訊的最
7
大來源仍以文字方式呈現居大多數。傳統上要過濾這些資訊並找出其中有用的資
訊則須要仰賴個人對此領域的了解,並須花很多時間整理。另一方面,累積在員
工腦海中的知識,也無法有系統的紀錄下來,也造成知識擴散的障礙。
為確保具有正確性、價值性及重要性的知識能夠被保存與流動,企業運用了
知識管理系統以建立龐大的資料庫,但資料庫所提供的只有數據與記錄,電腦無
法理解其涵義而使得這些知識被侷限在特定條件搜尋下才能被利用,因此無法針
對企業內部特定人員的需求做出適切的回應。語意網(Semantic Web)技術的出
現,提供了解決此一問題的一道曙光。透過語意網的技術以電腦能理解的語言描
述資源的特性來處理所收集到的知識,進而提供更多的可能性與應用。
1.3 研究目的
本研究的目的將藉由本體論(Ontology)理論,提出一個適當的知識庫管理系
統。針對資訊業服務人員平日工作時所遇到的問題,或者公司內部教育訓練之文
件,運用本體論的類別與元素來實現知識整合系統與改變現在知識文件無法整合
利用,及進而透過語意網的概念讓這些知識可以隨時被使用者發掘,對於業界人
員及產業都能帶來正面的效益。
系統設計上以現有的知識管理系統為基礎,加入了語意網的技術,藉由此協
助讓這些資源能夠以電腦懂得的方式來描述,以提供更豐富的應用及精確的搜
尋,以提供企業對於知識管理的可靠度及品質。
1.4 論文架構
本論文架構共區分為五個章節。第一章為緒論包括研究背景、研究動機、研
究目的,介紹當前知識經濟趨勢下,知識管理系統的重要性及所遭遇的問題。透
過本體論的概念及語意網的技術,本研究嘗試提供一個更適當的知識庫管理系
統。第二章文獻探討包含知識管理、知識管理系統、本體論、語意網及 Protégé 等
8
的介紹。第三章則詳述本研究所採行的方法、研究對象的選擇、企業知識的分類、
系統說明及系統架構圖。第四章為本實驗對象之知識管理系統知識本體的建立實
作。
9
第二章 文獻探討
本章中,將針對知識管理、知識管理系統、本體論(ontology)、語意網(Semantic
Web)及資源描述架構(Resource Description Framework,RDF)等重要名詞,進行探
討與介紹。
2.1知識管理
2.1.1 知識的定義
知識是對某個主題確信的認識,並且這些認識擁有潛在的能力為特定目的而
使用。知識的層級可分為資料、資訊、知識及智慧四個階段,而知識的形成則是
先透過收集一些資料,再從資料中找出有用的資訊,利用這些資訊加上自己的想
法及做法,最後產生出知識,而智慧則是以知識為基礎加上個人的應用能力加以
運用於生活上。也因此在網際網路蓬勃發展的現今,琳瑯滿目的資料庫所儲存的
內容不足以稱為知識,充其量只能稱之為資料或資訊。唯有將這些資料或資訊交
至適當的人手中,並加以轉化與吸收,才能發揮知識的價值與力量。
人們所具有的知識可分為兩類,外顯知識(Explicit Knowledge)和內隱知識
(Tacit Knowledge),外顯知識是客觀的,可藉結構性的語法來表示;而內隱知識
卻是主觀不易以一般的方法來表達及溝通。如圖 2-1 說明知識的創新,皆是由這
兩種知識不停地循環轉換,才能源源不絕創造出新知識(廖河慶,2009)。
10
(取自:企業知識管理魔形之建置,頁 6)
圖 2-1 知識轉換模式
2.1.2 知識的管理
知識管理(Knowledge Management)是一項在 1990 年代中期開始在全球崛起
的學術與商業應用主題,針對個人及社群所擁有的顯性知識和隱性知識的確認、
創造、掌握、使用、分享及傳播進行積極及有效的管理。然而其明確的定義與內
涵,卻常因不同的人、不同的角度及不同的企業目的,而有不同。
Laurie(1997)對於知識管理的定義,是「經由一連串創造知識、獲取知識與使
用知識的過程以提升組織的積效」
。Lotus (1997)認為「知識管理是投入一群人員、
流程及工具以幫助知識的創造、吸收、傳撥與應用」。Davenport & Prusak(1998)認
為「知識管理乃一種循序漸近的過程,企圖透過人員、科技與智慧三者之間慎密
的結構,將知識的效益發揮到最高境界,以期完成組織設定的目標」
。而本國學者
吳思華(1998)認為知識管理應指在知識型企業中,建構一有效的知識系統,讓組織
中的知識能有效的創造、流通與加值,進而不斷產生創新性產品。Arthur Andersen
Business Consulting (2000)則提出了一個較完整的知識管理模式,認為四個主要影
11
響知識管理的促進要素為領導、組織文化、績效評估、資訊技術(如圖 2-2)。綜
合國內外學者的說法,知識管理是一個以知識為標的物的程序做法,目的是期望
能增加組織績效或是強化知識的能量。
(取自:以知識管理基礎設施探討影響顧客知識管理之因素,頁 7)
圖 2-2 知識管理模式
然而經過 90 年代企業組織大力導入知識管理後,也出現了不少的問題(廖河
慶,2009)。其中最重要的就是過度重視資訊科技,非由知識的本質為出發點、員
工在專業知識分享上採取不配合的態度、企業在導入知識管理系統時所保留的文
件及日常作業所被要求製作的知識管理、分享文件資料量過大造成 Information
Overloading,導致知識管理在現在的企業組織中淪為文件管理。結果不只浪費企
業資源,增加員工作業負擔,更讓知識管理成為口號,對於企業內部組織營運並
未帶來正面的助益。
12
2.2 知識管理系統
2.2.1 知識管理系統的定義
所謂「知識管理系統(Knowledge Management System﹐KMS)」主要係將組
織、團體、特定社群中的內隱知識外顯化,以促進組織內的資訊傳遞與業務傳承。
並透過系統使相關有用的訊息有效率的處理,儲存並有機會重覆的使用以避免時
間、人力等成本的浪費。杜長樹(2000)認為﹕「知識管理系統即為企業運用知
識取得、知識流、知識創造、知識擴散、知識蓄積等五大活動,所形成的市場利
基」。Maule 等人(2002)也提到:「知識管理系統是個資料與資訊儲存庫,亦可
稱為資訊與知識的處理系統」。
2.2.2 知識管理系統架構理論
Timothy G. Kotnour(1996)說明知識管理系統最主要的功能是整合個人和組織
學習的過程,使不同專業領域的個人和系統能快速的分享知識。Wayne Applehan
等人則在1999年提出知識管理系統所運用的技術架構得包含介面、存取、情報、
應用、傳輸與應用等六個層次架構如圖2-3。而Tiwana在2000年則依Wayne
Applehans的階層架構論為基礎,提出在傳輸層和儲存層中間加入中介軟體與整合
層,其目的乃在於提供相關的資訊科技讓使用者可以跨平台存取儲存層內的資源。
13
圖 2-3 知識管理系統技術架構
Laudon(2006)則在整體企業的運用上將知識管理系統依專業用途分為知
識管理系統、知識工作系統以及智能技術三類。而在知識管理系統的部份則用於
像是企業內知識論壇與文件檢索等普遍和整合性的收集、儲存、傳播知識之上,
此種狀態促使整體企業得以提供技術與能力的整體觀,它亦包含儲存結構化與非
結構化資料的能力,用以定位企業中具有專家知識的員工之最佳工具,同時擁有
由企業中的應用程式與網路獲得知識與資訊的能力如圖 2-4。
14
圖 2-4 整體企業的知識管理系統概觀
2.2.3 知識管理系統的導入流程
企業將知識管理的活動加以規範並訂出其主要的活動程序即稱為知識管理的
導入流程,通常企業藉由知識管理程序規範出有效的知識管理相關活動。而要如
何將組織所需要的知識引導出來,再逐步導入組織內部,則是企業最關心的議題。
Arthur Andersen等人於1996年提出知識管理包含創造、確認、蒐集、組織、分
享、轉化與應用等七種程序,Knapp Ellen(1998)認為獲取、組織、分享和創新是
知識管理程序的四個階段,Zack(1999)則以取得、提煉、儲存與取回、散播、呈現
等五個步驟來說明之,Bjorn(1999)發現軟體組織的開發流程中包含知識的獲取、
處理、保存、分送、利用與評估等活動是適用於知識的管理系統。
Beckman於1997年提出知識管理的導入步驟,包括定義(Identity)、擷取
(Capture)、選擇(Select)、儲存(Store)、分享(Share)、運用(Apply)、創造(Create)和
銷售(Sell)等階段(如圖2-5),旨在說明組織內如何發掘自我的特色,找出本身的核
15
心能力,由組織內部和外部的情部中,擷取知識,挑選適合者之後,分門別類的
儲存、分享與運用之,再重新依據本身的相關經驗和知識,提供利於組織的技術,
以提昇其競爭力。
圖 2-5 Beckman( 1997)知識管理導入步驟
綜合以上所言,得知知識管理系統並沒一定且明確的規範,其重要的精神源自
於知識的創造收集分享與應用的過程,而它所面臨的應用與挑戰則在下節與之說
明。
2.2.4 知識管理系統的應用與挑戰
傳統上,要施行「知識管理」
,並不一定需要建置電腦化的「知識管理系統」。
以往企業內部使用的 SOP手冊 (Standard Operation Procedure : 標準作業程序),就
觀念上而言,或許也可視為「知識管理系統」的一種形式。甚至是最傳統的師徒
制訓練法,也屬於廣義的「知識管理」模式之一。然而現今社會瞬息萬變,為處
理企業經營所需要的大量知識,有賴資訊科技的幫助。資訊科技以技術面來看,
包括了電腦軟硬體、通訊技術、工作站、自動化設備及電腦晶片等設備;以管理
的觀點來看,則有縮短時間、跨越空間、打破傳統線性的處理模式,而能同時多
工的處理方式,監督、控制以及分享資源,對組織確實有效能及影響力存在的協
助(簡瑞霖,2006)。
資訊科技雖帶給人們眾多的機會,尤其在網際網路(Internet)、企業內網路
16
(Intranet)及企業外網路(Extranet)蓬郣發展之際,但同時也帶來了一些挑戰。其中之
一是員工淹沒在一片資訊的汪洋中,如何以最有效率的方式來擷取所需的資訊,
並對資訊做有效的管理、保存及分析,變成了知識管理研究的課題之一(簡瑞霖,
2007)
。蔡敦浩與李慶芳(2002)研究指出,企業非常重視導入的科技、設計組織
資訊、知識的分類,並善用科技,建立知識分享的文化,甚至運用許多吸引人的
獎勵、激勵措施,或藉由體制上的改變,勾勒出良好的知識管理系統,結果卻不
如預期的美好,知識庫在員工眼中成為資訊廢棄物的堆積場。以國內某半導體公
司的知識管理系統UK(Useful Knowledge)為例,從訪談中發現大部份工程師不
喜歡使用這套系統,他們的感覺是:資深工程師不需要閱讀UK,便能解決問題;
而資淺工程師需要閱讀UK,但卻始終對UK沒有感覺。當資深工程師所掌握內隱知
識被迫編碼成為外顯知識時,難以將情境上的差異完整呈現,導致失去知識的價
值。知識管理系統未被接受、也未能有效的轉移知識,最根本的原因是內隱知識
摻雜太多情境,因而不易轉變為外顯知識。
因此,在利用資訊技術進行知識管理的過程中,存在著不少難以解決的挑戰,
不僅僅需要從技術層面找原因,更需要從人的角度出發,實現人和技術的相互協
同和相互促進,才能發揮系統的最大價值。
2.3 語意網(Semantic Web)
2.3.1 語意網(Semantic Web)的意義
根據W3C 對語意網所下的定義,
「語意網是現有網路架構的延伸, 也就是把
資料的意義定義的更明確, 能使人們更有效率地使用網路以及電腦所帶來的便
利」。語意網第一次發表是在2001年五月的Scientific American(科學美國人)上,
作者為Tim Berners-Lee,網際網路全球資訊網的發明人,他主張並認為語意網將成
為下一代的網際網路(黃居仁,2003)
。他認為全球資訊網和語意網的不同之處在
17
於,全球資訊網仍只是人們交換文件的載體(media),其中的資訊是電腦不能自
動運用,也不了解其內容。如果我們能針對電腦,將全球資訊網中的資料變成電
腦能理解的資料型態,電腦就能為我們提供更多的服務。例如,在做搜尋時,電
腦就能自己判斷該資源是不是符合使用者所需要,使人們得以更有效率的共享知
識。
2.3.2 語意網(Semantic Web)的架構
Berners-Lee & Fischetti (1999)提出語意網的架構如圖 2-6。此架構是藉由將高
層次的語言(技術)建構在低層次的語言(技術)上,來逐步達成的。由圖中可
知,語意網將本體論建構在 XML 和 RDF 等網路語言(Web language)上, 提供
智慧型代理人解讀,使得本體論不再只是表達詞彙之間的關係, 還包括詞彙和資
源之間的關係(亦即後設資料的目的- 描述資源的資訊)、以及資源和資源之間
的關係(許正欣,2004)。圖中所提重要概念說明如下:
1. 邏輯(Logic)層則:是一種推論的法則,語意網建構者可以將法則表達在本
體論上。例如建構者定義出一條規則:
「當一個人所提供的資訊被點閱超過 100 次,
那麼他就可被規類為『最佳資訊提供者』」
。所以當某甲所提供的資訊被點閱了 101
次,系統應可據此事實來推斷出「某甲是最佳資訊提供者」。
2. 證明(Proof)層則:表示一但我們所建構出來的系統, 能夠根據本體論來驗
證邏輯以及推論出結果的話, 我們便可以用此機制來驗證事情的對與否。只要是
能夠符合需求的邏輯規則便可以透過系統來產生出Semantic links,藉以來證明事
實。例如, 如果系統記錄了兩筆記名資訊,分別被點閱了60次及50次。當我們要
查詢誰是最佳資訊提供者時,系統便能推斷出該兩筆資訊都是某甲所提供,而且
60+50>100,再加上規則:「當一個人所提供的資訊被點閱超過100次,那麼他就
可被規類為『最佳資訊提供者』」,於是就可以証明出:某甲是最佳資訊提供者。
3. 信賴(Trust)層則:語意網的功能必須要在網路上存在許多處理或交換資訊
18
的智慧型代理人時才能真正地發揮,當代理人間的溝通越加頻繁時,就產生了所
謂信賴(Trust)的議題。例如:有一筆資訊某甲說是他提供的,但某乙也說是他提供
的,這時就產生了互相矛盾的問題。因此系統必須檢查所有代理人的推論機制是
一致的,以建立語意網上的信賴關係。
由此可知,語意網是一種建構在現有的網路環境之上,提供機器可讀的資訊
而不修改既存的網路內容的方式。他在既有資訊上加了一些後設資料,這些後設
資料用來描述文件、網頁和概念,使電腦能夠協助人們辨別這些資料的內容,增
加資料使用的效率。
取自:語意網上自動化建構本體論之研
究.pdf,頁 8
圖 2-6 語意網架構圖
2.4 資源描述架構(Resource Description Framework,
RDF)
資源描述架構(Resource Description Framework, RDF)
,是W3C 組織所提出
用來表示任何型態資源關係的一種標準,可以用來描述不同的存取節點以及存取
節點之間的關係,提供一個連接概念、與概念之間的關聯的資料結構。它以XML 作
19
為基礎語法,可帶給 RDF 以文字為基礎便於機器處理且適用於資料傳輸的特
性,其主要是由HTTP 協定加上URL 而成,因此使用者可以將每個網路文件視為
資訊或概念的存取節點(Nodes)
。也就是說,RDF 可看作是一種為了特殊目的而
使用XML 客製化定義後的標記語言,而客製化後的RDF 能夠提供網路環境上各
種資源的識別,以表達網路上不同資源之間的關係。如圖2-7
圖 2-7 一個描述 Eric Miller 的 RDF Graph
RDF 提供了一種 XML 的語法,我們稱它為 RDF/XML 。主要是用來保存
和交換 RDF GRAPH,圖2-6 的 RDF Graph 用 RDF./XML 來表示如圖 2-7:
<?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:contact="http://www.w3.org/2000/10/swap/pim/contact#">
<contact:Person rdf:about="http://www.w3.org/People/EM/contact#me">
20
<contact:fullName>Eric Miller</contact:fullName>
<contact:mailbox rdf:resource="mailto:em@w3.org"/>
<contact:personalTitle>Dr.</contact:personalTitle>
</contact:Person>
</rdf:RDF>
圖 2-7 描述 Eric Miller 的 RDF/XML
RDFS(RDF Schema)主要是用來定義RDF 三元式概念模型中各元件中所使
用到的語彙,此種方式可以協助達成語彙再利用的目標(神崎正英, 2005),也就
是說,如果將RDFS 中的定義視為一般化的關係,則三元式中的各元件便是由
RDFS 的定義所衍生出來的特殊化關係或實例。
2.5 本體論(Ontology)
本體論譯自英文 ontology,又譯存在論、存有論或是論,它是形上學的一個基
本分支,英語詞 ontology 是來源於希臘語單詞ον(存有)和λόγος(科學、
研究、理論)的組合。本體論主要探討存有本身,即一切現實事物的基本特徵,
也就是研究「到底哪些名詞代表真實的存在實體,哪些名詞只是代表一種概念」。
近年來,人工智慧及資訊技術相關領域的學者也開始將本體論的觀念用在知識表
達上,即藉由本體論中的基本元素:概念及概念間的關連,作為描述真實世界的
知識模型。Gruber 從資訊科技的觀點出發,將本體論定義為:
「本體論是一個明確
的、可將概念以特定規格呈現出來的概念化規範」(Gruber, 1995)。
當本體論被用以定義某一特定領域的知識或是主題時(曾新穆 & 李建興﹐
2001)
,其內容包含許多物件(Object)
、物件特徵(Properties)﹔物件一般也被稱
為概念(Concept)或是類別(Class),主要是用來描述領域中的概念;而物件特
徵則是用來描述概念的特性﹔關係則用以闡述概念間的關聯(如圖2-3)
。利用本體
論來建構知識管理系統有以下幾點優點
1. 人和電腦之間能夠以同樣的方式去理解資訊結構。
21
2. 使這門領域的知識可以再利用。
3. 讓抽象的概念能夠明確化。
圖 2-8 本體論組成架構圖
王亮超(2006)曾以政治新聞為例,來表達本體論的意涵。如圖2-4 表示一個
政治新聞的本體論架構,
「政治新聞」是這個本體論中最上層的概念(Concept),在
政治新聞中,考試院、行政院、司法院、監察院和立法院等訊息都是屬於政治新
聞的一種,所以與政治新聞存在著一種「is a」的關係(relation),都是屬於政治新
聞下所衍伸出的概念(Concept);而在總統府這個概念(Concept)中,範圍表示其屬
性(Attribute),在這裡我們利用屬性來描述其所屬之概念(Concept)下的某些特徵與
特性,因此,在其它概念(Concept)與實例(Instance)中,也都會有各自的屬性來表
達該Concept 的結構與性質;在屬於政治新聞下的中央政府概念(Concept)中,分別
由行政院、司法院、考試院、監察院和立法院等五個中央行政機構所組成,因此
這五院與中央政府存在著一種「part of 」的關係,而且各自有其屬性來表達各機
22
構內的職務。如上述所示,當我們利用本體論,便可以簡單的針對這些知識領域
的分類來定義與描述出該特殊領域的專業術語、項目與彼此間的關係,進而建立
一個系統,使用人與電腦皆可理解的本體論語言來描述上述的架構圖,進而分享、
再利用或擴張這些知識。
取自:領域本體論為基之網
頁知識擷取機制設計.pdf,頁 14
圖2-9 政治新聞本體論架構
23
第三章 研究方法
3.1 研究方向
知識管理常被看作一種廣泛的代表性名詞,本研究則是針對個案公司的內部
討論,會議,簡報等等各式各樣的資料收集與累積。根據實務上的經驗配合理論
的深入研究,認為知識管理應該是一種具有完整規劃的系統,能夠持續地、普遍
地收集人類經年累月的經驗;同時也是一種互動的過程。而知識在企業中的分享
與互動更影響了知識所發揮的最大價值。無論是留存知識、分享知識、創造知識
都和人在組織中的行為秘不可分。也因知識的特性與人性息息相關,因此有了建
立知識管理系統的念頭,但是如果只是單純將知識管理系統建立採用關鍵字做為
資料搜尋的依據,可能會找出不相關的資料,此時需要依賴使用者一筆一筆資料
進行過濾比對。因為電腦只會利用關鍵字去資料庫進行比對然後再將資料找出
來。但是電腦本身不瞭解使用者輸入的關鍵字所代表的「語意」
,因此若能將資料
庫的資料轉換成電腦可以讀取的格式,而這些格式又能讓電腦了解使用者所輸入
的關鍵字所代表的「語意」為何,使得資料搜尋更為精準符合使用者的需求,因
此將語意網與知識管理系統做結合,作為本研究的方向。
本研究之研究流程區分為四個階段,分別為領域研究階段、探討相關技術階
段、分析設計階段、系統實作階段,如圖 3-1 所示,研究流程與方法說明如下:
24
圖 3-1 本研究之研究流程
3.1.1 領域研究階段
確定研究方向之後,此階段分為兩部份,分別是「文獻探討」以及「個案公
司的選擇」
。針對本研究所要進行的方向去收集所有的相關文獻,主要大致往本體
論的概念與定義、語意網及知識管理方面相關文件。而個案公司中,對於知識管
理所面臨到的問題有:
 知識代表業界的優勢:
員工是否願意分享他所獲得的工作經驗,願意分享可以避免企業資
源的過度浪費,因此可以提供誘因讓員工願意分享。
 知識的流動是否被保存:
隨著員工的離職或者時間長久而遺忘,使得公司流失重要的資訊。
這時候建立適當的機制,幫助員工擷取隱性知識,則是非常重要。
 知識是分散的
例如公司有分散在全省各地的工作團隊,分公司等等,會使得團隊
25
之間難以分享共同的資源,因此建立一個有效的聯絡方法,集中管理知
識,讓不同的工作團隊可以從知識庫中掌握最新的資訊,並能有效率的
利用公司內部的知識。
 知識可以用語意來表達
目前大家所認同的知識管理系統,仍是使用關鍵字搜尋方式,也許
會因工作團隊,分公司所在的地理位置不同,對於一些公司產品名稱上
稱呼的差異性;既然是人類的知識,如果能用人類所熟知的方式來表達
知識,則可以減少彼此間的差異性,讓知識在企業內毫無阻礙的傳達。
 在相似而不相同的工作中,重覆遭遇相似的問題
同樣的產品,再不同的客戶要求下,為了滿足客戶的需求,因此可
能會產生不同的安裝方式,也許這個問題再不同地區會重複發生,如果
能將此知識分享,則可減少其他地區的工作團隊安裝公司產品時,所花
費的時間以及人力資源成本,進而節省企業資源的浪費。
因此企業整個工程部資訊人員知識管理中所面臨的瓶頸與可能的解決方案,
知識的分佈概況;了解該公司人員所擁有的個人知識是否可以導入知識庫。並針
對所提出的解決方案來確認是否繼續進行分析,確認在技術方面的可行性。
3.1.2 探討相關技術階段
此階段主要針對研究領域階段所收集的相關文獻區分為「知識管理」、「語意
網」以及「知識管理系統」三大類。
 知識管理
在前一章節領域研究了解知識的重要性之後,本階段將探討如何做
知識管理,即是將原本存在於企業內部所有成員長年累月累積下來的工
作經驗及隱藏於企業內各種類型資料庫、各類型文件,或者歷史資料中
的知識,完整的擷取,整理成為企業的資訊資產。從企業競爭成功關鍵
26
因素來看,根據文獻探討中幾位管理學者與實務大師的意見,企業最重
要的核心能力都不是有形的資產,而是無形的智慧成本。對企業來說,
回應客戶問題的時間長短反映出一個企業的競爭力。對工程人員來說,
回應使用者問題的時間長短與提升資訊系統效率的能力,反映出一個工
程人員對企業的貢獻度。而且現在的客戶也相當重視當問題反應給個案
公司的工程人員,到解決問題所花費的時間多寡,以做為來年續約的參
考依據。因此當一個工程人員所負責的客戶數量越多,系統規模越來越
大,要找出問題的癥結,所需的不只是個人的知識與經驗,更需要一種
高效率的工具。個案公司工程人員每天面對各式各樣的資訊設備與各種
軟體,其運行的紀錄散落在各處,猶如一座座彼此不相關聯的孤島,但
其脈絡卻潛藏其下。過去工程人員必須一處處前往檢視,在繁雜的紀錄
中尋找有用的資訊,試著找出問題解決方案或突破效率瓶頸找出蛛絲馬
跡;因此透過知識管理系統的導入,技術人員可以操作著簡易且具有親
和力的 Web 介面,把全省各處工程人員所累積下來的技術文件,有效率
的查詢,將知識管理上有價值的資訊蒐集起來。幫助工程管理人員將需
要的資訊找出來,如圖 3-2 所示,組織知識管理目的的層次架構圖。
27
圖 3.2

組織知識管理目的層次架構圖
語意網
Tim Berners-Lee 對網路有二個夢想。第一個夢想是所有的人都可以
透過全球資訊網(www)共享知識。第二個夢想是電腦可以瞭解人類的
語言,因此未來的網路是語意網(Semantic Web)
。不論是網站系統或者
是本研究之知識管理系統為了將基本的資訊檢索進步到能夠提供使用者
正確而有用的資訊,想要達成這點則必須把所有的文件變成電腦能夠閱
讀的文件,因此就需要語意網。那麼電腦如何閱讀語意呢﹖就是要在每
份文件都有一個自己定義的 Ontology,也就是知識本體。因為同一詞,
在不同領域,不同的時空背景,它的意義就會不一樣,所以使用者必須
定要要搜尋的關鍵字代表甚麼意義,屬於哪個領域,在任何一個文件裡,
每一個關鍵字的定義是甚麼,代表的領域是甚麼,就是知識本體所要告
訴使用者的。因此有語意網的存在就一定會有 Ontology Language。2004
年鐘正男提出知識本體區分為以下三類,可以根據需求選用不同的知識
28
本體:如圖 3-3
(1)上層知識本體(Top-Level Ontology):描述最一般化的概念,
例如空間、時間、事件、行動等,獨立於特定的問題與領域,作為大眾
溝通的工具,可以說是真實世界中的常識。
(2)領域知識本體與作業知識本體(Domain Ontology and Task O
ntology)
:定義或描述特殊領域的相關知識,領域知識本體如同專家的專
門知識,每一份專業知識都記載該領域中的事物。
(3)應用知識本體(Application Ontology):使用屬性、關係進行
定義與描述真實世界中特定領域的知識。
圖 3.3 知識本體分類
RDF( Resource Description Framework,資源描述架構)是一種通用目的描
述語言(general–purpose language ),描述全球資訊網的資源及其相關的描述性
資訊。透過簡單與一致性的描述介面,使用屬性描述任何一種具有
URI(Uniform Resource Identifier)的資源,以及它與其他資源之間的關係。RDF
29
模型中最基本的元素是三元結構(triple),主要是由資源(Resource)、屬性
(Property)
、屬性值(Property Value)三種元素所組成的。三元結構的構成三
要素是主體資源(Subject)、述語資源(Predicate)、與目的資源(Object)。
RDF 無法描述一個資源所應擁有的屬性有哪些,以及這些屬性與其他資源
之間的關係。RDFS(資源描述架構綱要,RDFSchema ) 是 RDF 的中介資料
(meta-data),其內容定義基礎的詞彙,RDF 可以依據這些辭彙來描述資源。
因此 RDF 是為目前最成熟也是最適合 ontology 的標籤語言,針對本研究個案
公司,以軟體知識分類之文件所設計的 RDF Graph 表示圖如圖 3-4:
圖 3-4 軟體知識面之 RDF Graph

知識管理系統
知識管理系統的建構,與一般資訊系統最大的不同點在於系統本身
主要是應用於知識與資訊上面的處理,而非資料之間的交易處理,知識
本身與資料最大的不同在於知識經常蘊藏在平常的工作過程中。
30
了解知識管理是一種透過合作以及整合的方法來創造、擷取、組織、和使用
企業的資訊資產。這些資產包括資料庫、文件紙本,但是其中最重要的內隱的專
門技術及個別的員工經驗。的定義及收集本體論與知識管理相關文件並針對
protégé 工具研究其使用方法與技術加以探討,以期可以建立出正確的推論模型。
3.1.3 應用本體論的優勢
一般知識管理系統著重於關鍵字的搜尋與比對,當使用者輸入關鍵字,
經由系統的搜尋比對,而找出相關的文件。但是如果使用者對於個案公司的
產品,名稱稱呼上的差異性,而輸入不同的關鍵字。這樣搜尋出來的文件,
還需要使用者自行過濾。因此本研究將現有的知識管理系統以本體論方法建
置,除了擁有原本知識管理系統的好處之外,又可以改善知識管理系統之不
足:因此運用本體論來建構一個系統會改變一個系統的基本建構方式,以及
系統設計者在設計時會有更多的選擇。使用本體論能夠反應真實世界的知識
與資料庫系統中字彙與字彙之間的關係。日後使用者在資料庫中搜尋知識,
可以藉由以本體論所建立的字彙關係,來搜尋所需要的知識。
茲將各項優點整理如下:
1. 讓電腦代替人們之間彼此分享資訊的知識。
2. 讓領域知識可重複被利用。
3. 讓領域知識可清楚的被描述。
4. 在現有的知識中,分割出新的領域知識。
31
3.2 個案公司研究

個案公司現況
選擇 S 公司為研究對象,選擇 S 公司考量如下﹕該公司為國內資訊
服務業龍頭地位,全省台北、新竹、台中、嘉義、台南、高雄及花連均
設有辦公室,員工約有 5 百人左右,其中工程服務人員約有 200 人,主
要服務客為科學園區科技廠、各級學校單位及一般傳統產業。例如:新
竹公司在賣出資訊設備給新竹科學園區客戶,新竹工程人員安裝完成之
後,須給客戶完整的安裝報告書,其內容為安裝步驟、安裝的軟體版本、
安裝過程中所遇到的問題及解決方式。也許在幾個月之後該客戶在台南
科學園區的科技廠也購買同一套設備,此時則交由台南地區的工程人員
負責安裝,而台南地區工程人員則需重覆新竹公司工程人員所做過的所
有步驟,或許也會遇到當初新竹工程人員安裝產品時所遇到的難題,而
台南的工程人員要再花許多的時間來查詢相關的資料,或者做一些安裝
上的嘗試,如無適當管理這些文件,則造成組織的資源浪費。雖屬同一
個企業體,因為地域性的不同工程人員的經驗考量傳承並不一致。因此
發展出各具特色的決策模式。

個案公司的知識流通
根據上述之情況,目前個案公司的知識流通有兩種方式,一是藉由
電話,詢問可能之相關工程人員;例如客戶同時擁有南北兩個工廠,當
南部工程人員安裝產品遇到問題時,只能試著詢問北部工程人員當時在
安裝時是否有遇到相類似的問題。另外一種方式則是藉由電子郵件的方
式來詢問相關的人員。以上兩種方法皆存在以下的問題
(1)問題描述的差異性
一個問題可能因為描述的不同,而讓不同的工程人員覺得
32
這是新產生的問題,而不是已經處理解決過的問題。
(2)知識分散
整個安裝產品的過程中所產生的知識可能只有少數人知
道,因為可能只有接觸過此產品的工程人員在安裝過程中,不管是詢問
他人或者是尋找資料之後來解決問題,會使得團隊之間難以分享,當這
些少數過接觸過此資訊的員工離職之後則造成知識斷層。
(3)知識容易消失
例如南北兩地的工程人員在討論中出現問題的解決方法,
但是如果沒有紀錄下來,往往可能這些想法在不經意之間就會消失。
3.3 個案公司知識面分類
資訊服務人員具有高度複雜性,有時所要達到的工作責任並不只有一個,所
背負的責任越多,相對的所需提供的知識亦會跟著增加。為了達到工作責任,則
必須將所有責任範圍之間的關係環環相扣,因此針對本研究個案公司推動知識管
理分成三個階段並說明如下:
第一階段:現有的知識收集分類
將公司內或外的顯示知識加以收集、過濾、分類。透過網際網路的技術
將這些顯性知識擴散給員工分享及使用。員工可利用公司所提供的入口網站內搜
尋到所需要的資訊或者是知識。
第二階段:隱性知識的發掘
將公司內部現有存在的隱性知識,透過獎勵機制,鼓勵員工將工作中所
獲得的經驗整理成文件,轉換成顯性知識。這些有價值的顯性知識可做為企業競
爭力最有利的條件。
第三階段:外來的知識引進融入
所謂的外來知識這邊定義為技術人員在原廠所受的教育訓練課程以及原
33
廠的技術文件等等。在公司指定人員在外受訓時,回來公司加以整理,並融入於
公司現有的內部知識內。
因此針對以上這三個階段,將個案公司目前的知識文件區分為五個類別,
將知識面分成為五大類,並將資訊人員所提供的知識文件區分為五個類別,
並將此五個類別的知識文件整理如下。五個知識類別區分內容如圖 3-5:
圖 3.5 企業知識面之分類
3.4 系統說明及系統架構圖
本實驗研究系統架構如圖 3.6 所示,主要將系統分為 KMS Module、Transfer and
Matching Module 及 KM Query Module 三個主要模組。各模組功能說明如下:
34
圖 3.6 系統架構圖
3.4.1 KMS modules
主要功能是將資訊服務人員將要存放到知識庫的文件經由知識管理者加以篩
選之後,分類編號及確定格式並無問題,經由 KMS Tools 存放到知識庫。知識管
理系統中不同的等級的人,其權限也不一樣。將之區分為三個等級,依權限大小
分 為 系統管理者 (Supervisor)、知識管理員 (Knowledge Manager) 、知識提供 者
(Knowledge provider)三個等級,等級不同權限也不同。以知識管理者之建立知識庫
流程為例步驟如下:
35
Document
Software
OS
Storage
Network
Knowledge Manager
Step 2
Step 1
Doc
Retrieval
Step 3
Knowledge
Classification
KM Tools
Knowledge
Base
Course
圖 3-7 KMS Module 示意圖
Step1 : 資訊服務人員將預存入知識庫(Knowledge Base)之文件確定文件格
式無誤後,將文件交由知識管理員。
Step2 : 文件管理員依照文件內容將其分類,並依照分類規則透過知識管理工
具(KM tools) 將文件存入知識庫。
Step3 : 系統管理員及知識管理員可以透過 KMS Tools 對知識新增文件上傳
(Upload)、刪除(Delete)或者是更動(Modify)內容及維護、備份知識庫。而
知識提供者僅能對文自己所制作的知識文件擁有修改之權限
3.4.2 Transfer & Matching Module
主要功能是將知識庫內的文件加以專有名詞處理,透過詞彙分析來產生詞彙
庫,併根據詞彙庫所得之資料來建立本體論模型。其運作方法如下:
36
Data Format
Transfer
Step 4
Step 5
Step 9
Domain term
Process
Step 6
CKIP
Matching Engine
Step 7
Step 8
Lexical
Database
Ontology
Base
Transfer & Matching Module
圖 3-8 Transfer & Matching Module
Step4 : 因為文件資料以自然語言的文件做為分析的對象,但也因其非結構化
的因素,導致在分件分析上有許多困難與限制。因此去除文件不必要的結構將圖、
表部份加以忽略取得其文字部份及文件標題,以利提供文字專有名詞處理(Text
Term Process)
。以資訊業為例:文件標題包含了產品的名稱,軟體的版本,或者是
問題的描述,因此專有名詞處理,主要的目的是要取出關鍵字。
Step5 : 而資訊業關鍵字最多的部分英文專有名詞占了大多數,因此可將英文
文字內容經由詞彙分析、 名詞與動詞及字元之間的空白或者標點符號來進行相關
的處理,得到具代表性的字彙(Lexical)。
Step6 : CKIP 中文斷詞系統是由中文詞知識庫小組( Chinese Knowledge
Information Processing Group,CKIP)所發展的線上斷詞服務。用戶端必須自行撰
寫程式,經由 TCP Scoket 傳送本文到斷詞系統,如果文件標題為中文則使用中研
院所開發的中文詞庫系(CKIP)來輔助 ,由於文件中的主題字與關鍵字通常由名
詞—動詞(Noun—Verb)、名詞—名詞(Noun—Noun)所組成,藉由詞性的標記
與篩選的詞性庫可以濾掉大部份無意義的詞彙。保留重要的名詞與動詞來了解文
37
件的語意。並依此建立建置本體論所需要的詞彙庫(Lexical DB)。
Step7 : 透過文字處理後所產生的詞彙庫(Lexical DB),做為本體論建立所需
要的詞詞彙庫。
Step8 : :採用關鍵字權重,指出一個詞彙在該文件中出現的次數,找出具有
代表性權重較高的文字,做為建置本體論之依據。
Step9 :Matchin Engine 主要是接受使用者所輸入的字串取得描述文件之詮釋
資料來進行推理的工作,使人與電腦之間將能達到帶有語意的交談溝通。並將搜
尋之後的結果透過 Query Interface 呈現給使用者。
38
3.4.3 Information Query Module
Query &
Result
Browser
Permission
Function
Query
Inetrface
User
Profile
Information Query Module
圖 3-9 Information Query module 圖示
主要是提供使用者一個登入畫面及使用者權限等級檢查,使用者等級權限可
以用來限制可供查詢的文件等級。確定使用者為系統認定的合法使用者之後,並
提供一查詢介面供使用者輸入關鍵字作查詢。
39
3.4.4 本體論模型建立
本體領域的規劃,主要是根據個案公司知識的分類,並且能夠提供使用者可
經由輸入軟體版本或者是硬體的版本,以及軟體名稱及硬體設備名稱來推論出相
關的知識。因此設計如圖 3-7 所示之五大知識面推論結構圖,而知識本體的設計
是採用史丹佛大學所開發的知識本體論建構軟體 Protégé 版本為.4.1 及 OWL
Plugin 編輯工具來建立資訊人員知識管理的本體論,W3C 為 OWL 定義了以下
三種不同層次 OWL,

OWL-Full:是給需要最強表現能力與自由的 RDF 語法,即使不能求
得計算結果也沒關係的使用者,完全與 RDF 相容。表達能理最強,
但是目前並沒有推理軟體可以完全支援 OWL-Full 推理特性。

OWL-DL:給需要表達能力強,同時可以確保所有的推理結論都能
夠被計算出來的使用者。OWL-DL 其實就是將 OWL-Full 對於類別
(Class)
、資料形態、物件形態做了一些限制。例如:一個類別(Class)
可以是其他類別的子類別(Sub Class)
,但是這個類別(Class)就不
能是其他類別(Class)的物件(Object)。而資料形態屬性和物件屬
性是不相容的,一個屬性不可同時包含兩者。而所有的類別和屬性
採用參考形態,一定要清楚的定義。這些限制的基礎運作原則來自
於敘述邏輯,而為了達到推理而設計。

OWL-Lite:將 OWL-DL 再做一些限制,成為一個表達能力最為精
簡的 OWL 語言。對於初學者來說容易使用。

OWL 比較
我們針對 OWL 的三個 Sub-Language 的相容關聯性、做一個整理。
這三種 Sub-Language 相關關聯性為:
40

每一個合法的 OWL-Lite 都是一個合法的 OWL-DL。

每一個合法的 OWL-DL 都是一個合法的 OWL-Full。

每一個有效的 OWL-Lite 堆論結果都是一個有效的
OWL-DL 推論結果。

每一個有效的 OWL-DL 推論結果都是一個有效的
OWL-Full 推論結果。
因此基於上述之三個 Sub-Language 的說明,本實驗則選用 OWL-DL 為
建立知識本體的 Language Profile。
圖 3.7 五大知識面推論結構
41
第四章 系統架構與實作
語意網是網站未來的展望,為了將網路上的資訊都被賦予明確的意義,讓電
腦能夠自動處理並加以整合,因此必須建立在 XML 可以自訂標籤與 RDF 可以靈
活描述資量的基礎上。而語意網要能夠使用 RDF,則必須要有一個正是用來描述
網站文件專門用語的本體語言。本章節將依據前一章節所說明的系統架構及系統
分析,對於本研究的知識管理系統的知識本體論建置詳加說明。
4.1 系統實做環境及流程
本研究擬發展本體論之知識管理系為主要目的是希望能夠改善知識管理
系統之不足,並根據第三章系統架構圖,系統部份使用現有的知識管理系統
工具,故將實驗環境及所使用的工具列舉如下:
電腦硬體
Interl® Core2 2.8GHz 4G RAM
作業系統
Windows Vista
資料庫
MySQL 4.x
網頁伺服器
Apache 2.1
知識本體推論
Joseki
知識本體
Protégé 4.1
知識本體概念圖
Graphviz 2.1.3
網頁設計
.Net 2008
網頁版面設計
Dreemwaver 4.1
執行環境
開發工具
知識庫工具
Kbpublish V 4.0 beta1
42
4.1 系統開發工具
本論文所建構的系統平台為 Microsoft Window Vista,知識本體論的設計
是採用史丹佛大學所開發的知識本體論建構軟體 Protégé 及 OWL Plugin 編輯工具
來建立資訊人員知識管理中,知識的分類以及相互之間的關係。
4.1.1 使用工具:Protégé 4.1_beta
Protégé 是一個免費,開放源碼(Source Code)的一套工具,用來建構領
域模型(Domain Model)以及知識為基礎(Knowledge-Based)的應用本體論。
由美國史丹佛大學以 JAVA 語言所開發的軟體。其中的 Protégé-Owl editor 讓
使用者可以建立語意網(Semantic Web)的本體論,使用 Protégé 有以下的優
點:
1. 圖形化介面:容易學習,短暫的訓練後即可直覺式的定義各種領域類
別,及各類別之間的關係。
2. 使用者眾多:它是目前較為成熟的 Ontology 開發工具之一,因此使
用人數相當多,可以從網路上查詢到許多相關資訊。
3. 支援多種儲存格式:如 XML、RFDS …等等。
4. 提供完整應用 API:可以讓使用者直接使用 API 直接存取 Protégé
Knowledge Base 以及不需要打開 Protégé-OWL 軟體就能使用 Protégé 格式。
不過 Protégé 仍與 OWL 兩者仍有些不同的地方,在 OWL 的構成要素分別
有:物件(Individuals)
、屬性(Properties)以及類別(Class)但是 Protégé 中
則稱之為:物件(Instance)、屬性(Slots)以及類別(Class)茲將兩者做成
比較如表 4-1:
表 4-1 Protégé 與 OWL 組成元件比較表
43
本體論
英文名稱
OWL
Individuals
中文名稱
物件
Protege
Instance
OWL
Properties
屬性
Protege
Slots
OWL
Class
類別
Protege
Class
4.1.2 使用 Plugin
在本研究中使用了一個 Plugin 名稱為 Graphviz 2.1.3 ,它是一個圖形抽象
化的軟體,由 AT&T 開發與維護,主要的功能是透過 Dot Language 表達節點的
特性與節點之間的關係,就可以設計出所需要的階層圖。其中有關它向量圖的
使用語法舉例如下:
digraph G {
subgraph cluster_0 {
style=filled;
color=lightgrey;
node [style=filled,color=white];
a0 -> a1 -> a2 -> a3;
label = "process #1";
}
44
subgraph cluster_1 {
node [style=filled];
b0 -> b1 -> b2 -> b3;
label = "process #2";
color=blue
}
start -> a0;
start -> b0;
a1 -> b3;
b2 -> a3;
a3 -> a0;
a3 -> end;
b3 -> end;
start [shape=Mdiamond];
end [shape=Msquare];
}
圖 4-1 Grpahviz 向量圖語法
(資料來源:http://www.graphviz.org)
圖 4-1 中 dot 語法中 digraph G 宣告此圖為一個向量圖,並且分成兩個
群組:Cluster_0 及 Cluster_1,然後對兩個群組的定義外框線以及節點的呈現方
式。並對兩個不同的群組設定不同的標籤(Label),然後指定各個節點之間的
關係,所呈現出來的向量圖形如圖 4-2 所示
45
圖 4-2 Graphviz 範例圖
(資料來源: http://www.graphviz.org)
4.1.3 Graphviz 安裝與設定
1. 先至 Graphviz 官方網站(http://www.graphviz.org)下載新版本的軟
體,進行安裝。安裝畫面如圖 4-3:
46
圖 4-3 Graphviz 安裝畫面
2. 然後開啟 Protégé Reaspner > Configure 設定 Graphviz 安裝路徑,本
研究安裝路徑為 C:\Vista_ap\Graphbiz2.26.3\bin 目錄下,執行檔為 dot.exe 。如圖
4-4 所示:
圖 4-4 Protégé 設定 Gaphviz Pulging 畫面
47
4.2 知識本體論建置實例
在 Protégé 預設的設計環境中,包含了 MetaData、OWL_Class、Properties、
Individuals 等等的標籤。而建立一個知識本體的方法,我們定義以下三個步驟:
本研究之知識本體論建立三個步驟為
1.先行建立知識本體的名稱空間(Name Space)。
2.建立各個知識類別(Class)及次類別(Sub Class)。
3. 再建立各類別之間的屬性(Properties)。
4.2.1 知識本體的名稱空間
在不同的知識領域中,相同的詞彙可能有不同的解釋與意義,因此為了
區分這些領域的不同,則不同的領域使用不相同名稱空間(Name Space)來
區別。因此對於本研究定義的名稱空間為:
http://www.semanticweb.org/ontologies/2010/11/myKM.owl 如圖 4-5:
圖 4-5 本研究之知識本體名稱空間定義
48
4.2.1 知識類別的建立
因為目前 Protégé 無法中文(Big-5)支援,所以在建立知識本體之前需先
需定義每個類別的英文名稱,因此根據第三章有關於個案公司的知識面我們先行
定義三個知識面的類別(Class)的英文名稱以及對每一個類別說明。整理如表 4-2
所示:
表 4-2 本研究定義的三個知識面類別說明
類別名稱
說
明
建立此類別的目的在於知識文件中有關軟體名稱以及機器型號相
關資訊。VersionModel 此類別底下還會有三個次類別(Sub Class),
VersionModel SoftwareName:用來定義各類軟體名稱的類別。
MachineType:用來定義各類產品名稱的類別。
Version:用來定義各文件版本,軟體版本的類別。
此類別的目的在於對個案公司的知識面做分類。分別有五個次類別
(Sub Class)。
OS:作業系統知識面類別。
Knowledge
Network:網路設備知識面類別。
Storage:儲存設備知識面類別。
Software:軟體知識面類別。
Course:教育訓練知識面類別。
此類別的目的在於對個案公司資訊人員做分類,以及知識文件的編
Author
號。分別有二個次類別(Sub Class)。
SEName:各地區工程人員名稱類別。
49
DociD:文件分類編號類別。
根據表 4-2 所定義的各類別名稱,使用 Protégé 將類別建立出來如圖 4-6 及
知識面示意圖如圖 4-7
圖 4-6 本研究知識類別建立
50
圖 4-7 本研究知識類別示意圖
根據表 4-2 所定義的次類別(Sub Class),我們分別建立每一個次類別
軟體文件編號類別
為了讓不同類型的知識文件可以做不同的編號管理,因此軟體文件類別建
立的目的是要用來做知識文件的編號分類,我們將此類別名稱定義為「DocID」。
而此類別又有四個次類別(Sub Class)。其知識類別示意圖如圖 4-8 所示:
CourseDocID:教育訓練文件編號類別。
StorageDocID:儲存設備文件編號類別。
OSDocID:作業系統文件編號類別。
51
NetworkDocID。網路設備文件編號類別。
圖 4-8 知識文件編號次類別示意圖
工程人員類別
為了區分各地區工程人員所提供的知識文件,我們將此類別名稱定義為
「SEName」。為了讓知識管理系統在文件查詢方面可以針對作者列出相關聯的知
識文件,因此將工程人員以他所服務的地區分成為不同的團隊類別,分別定義了
五個次類別(Sub Class),其知識類別示意圖如圖 4-9 所示:
Kaohsiung:高雄地區工程團隊類別。
Tainan:台南地區工程團隊類別。
Taipei:台北地區工程團隊類別。
Taichung:台中地區工程團隊類別。
Hsinchu:新竹地區工程團隊類別。
52
圖 4-9 各地區工程團隊知識類別示意圖
產品型號類別
針對個案公司現有的主力產品,區分為兩大類。建立此類別的目的是對
於這兩大類產品安裝時所需要的知識及相關注意事項等兩方面的知識文件。我們
將此類別名稱定義為「MachineType」。為了區分這兩大類的產品我們定義了二個
次類別(Sub Class),其知識類別示意圖如圖 4-10 所示:
NetworkModel:網路設備產品文件類別。
StorageModel。儲存設備產品文件類別。
圖 4-10 個案公司產品文件知識類別示意圖
軟體名稱類別
53
對於各類軟體的知識文件加以區分,我們針對個案公司目前主要的軟體
服務現況,採用軟體名稱的方式來區為三大類的方法,並將此類別名稱定義為
「SoftwareName」。其知識類別示意圖如圖 4-11 所示:
OSName:用來定義各式作業系統名稱的知識文件的類別。
DBName:用來定義各式資料庫軟體名稱的知識文件的類別。
SunSW: 用來定義 Sun 軟體名稱的知識文件的類別。
圖 4-11 軟體名稱文件知識類別示意圖
結合以上各個知識面的定義與分類,我們將整個知識管理系統有關知識面本
體論的階層樹狀概念圖整體呈現如圖 4-12 所示:整個知識本體以 RDF 方式表示
如圖 4-13 所示。
54
圖 4-12 本研究之知識面階層樹狀圖
55
圖 4-13 本研究之知識本體類別 RDF/XML
4.2.1 知識屬性的建立
前一章節已將知識本體的類別建立好之後,再來需要建立一些屬性來鏈
結各個類別之間的關係。在設計各類別之間的關係之前,我們仍需設計一份屬性
的中英文對照說明表。如表 4-3m
表 4-3 Knowledge 類別屬性表
屬性英文名稱
內容說明
屬性角色
hasKnowledge
知識文件是存在的
父屬性
HasAuthor
知識文件是有作者的
子屬性
HasVersionModel 知識文件是有版本號碼的
56
子屬性
表 4-4 KnowLedge 類別反轉屬性表
屬性英文名稱
內容說明
屬性角色
isKnowledgeof
知識文件是屬於
父屬性
isAuthorOf
作者是有提供知識文件的
子屬性
isVersionModelOf 這個版本號碼是有知識文件的 子屬性
設計好本研究知識本體所需要的屬性(Properties)之後,需要定義
每個一個屬性的 Domain 與 Domain Range 之間的關係。在此需特別說明
在 Protégé 中 Domain 與 Domain Range 的定義。如圖 4-14 所示
圖 4-14 類別與屬性示意圖
以圖 4-9 來做說明,Pizza 及 PizzaTopping 為兩個類別(Class),而
hasTopping 及 isToppingOf 則是兩個不同屬性(Properties)
。在 Protégé 中
兩個類別稱之為 Domain,而 PizzaTopping 類別 則是為 Pizza 類別的
Domain Range,反之 Pizza 則是為 PizzaTopping 的 Domain Range。將
57
三者的關係整理如表 4-4 所示:
表 4-4 Protégé 類別關係表
Domain
Property
Ranger
Pizza
hasTopping
PizzaTopping
PizzaTopping
isToppingOf
Pizza
因是對於本研究的知識本體我們設計了一些有關於類別之間屬性,
並整理如表 4-5 所示:
表 4-5 本研究之知識本體屬性列表
Properties
Domain
Domain Range
HasAuthor
Knowledge
Author
HasVersionModel
Knowledge
VersionModel
Author
Knowledge
isAuthorof
isVersionModelOF VersionModel
Knowledge
根據表 4-5 定義的類別與屬性之間的關係,我們在 Protégé 中建立
各個屬性,如圖 4-15 所示
58
圖 4-15 本研究之知識本體屬性建立畫面
圖 4-16 本研究之知識本體屬性 RDF/XML
59
4.3 知識本體的推理
Jena 之推論
Jena 是由惠普實驗室所研發的一套語意網架構的 API 軟體,它是一
個建構在 Java 上的語意網框架(Semantic Web Framework)
,是介於程式
與知識本體之間的橋樑。就如我們使用 Protégé 來操作知識本體,而電腦
則需要靠著程式透過 Jean 來做同樣的工作。其關係如圖 4-17 所示;Jena
框架主要包含以下幾個特點:
圖 4-17 Jena 運作示意圖
1. 它是一個 RDF API。
2. 擁有讀/寫 RDF 檔內容有關 RDF/XML,N3 跟 N-Triples 格式的
能力。
3. 它是一個 OWL 的 API。
4. 支援 SPARQL 查詢引擎。
Joseki 之推論
要使用 SPARQL 查詢語言做推論首先我們必須要有一個支援 Jena 的
伺服器程式;本研究所使用的 RDF 查詢器則是使用 Joseki。Joseki 是一
個 HTTP 引擎,它支援 SPARQL 協定及 SPARQL RDF 查詢語言。
60
安裝 Joseki
1. 首先先至 Joseki 網站(http://www.joseki.org/)下載新版的軟體,
本研究我使用的版本為 Joseki-3.4.2。
2. 然後將 Joseki-3.4.2.zip 解壓縮放到 c:\joseki-3.4.2 目錄中。
3. 執行以下指令設定 Joseki 運行的環境參數以及啟動 RDF
Server。如圖 4-18
圖 4-18 Joseki 環境設定畫面及 RDF Server 啟動畫面
4. 打開瀏覽器(Browser)輸入 http://127.0.0.1:2020/query.html 確定
RDF Server 是否啟動,啟動畫面如圖 4-19 所示。
61
圖 4-19 Joseki RDF Server 正常啟動畫面
5. 將本研究之知識本體以 N3 的格式匯出,匯出檔案名稱為
mykm.n3,並將檔案放置到 c:\joseki-3.4.2\data 目錄中。並將 RDF
Server 重新啟動。如圖 4-20 所示。
圖 4-20 從 Protégé 中匯出本研究之知識本體
6. 這樣即可對於本研究所設計之知識本體做推論查詢。
62
第五章 結論與未來工作
5.1 結論
目前大部分的知識管理系統著重於關聯式資料庫的查詢結果,因此本研
究提出以本體論為基礎之知識管理系統,將個案公司的知識面分類成不同的知識
領域,藉由本體論技術的幫助,可將使用者所查詢的知識文件,推論出可能相關
的文件,讓使用者可以在查詢的過程中,快速的找到所需要的知識,縮短解決客
戶問題的時間,並可以節省公司資源額外的浪費。而整個系統依照個案公司分散
在全省各地的工程團隊,使用 Web-Based 三層架構設計,建置一套可透過網際網
路上運行的知識管理系統,讓各地區工程人員可以隨時隨地只要有網路可以上網
即可使用此套系統。因此本研究所提出的知識管理系統架構模型可做為其他資訊
服務業者在建置知識管理系統平台上的參考。
5.2 未來工作
1. 建立更完整知識領域本體論
目前本研究所建立的知識領域本體論,只侷限在個案公司現有工程人員
技術文件方面的知識管理,未來如果能加入業務人員對於公司產品銷售方面的知
識文件方面管理,可以讓業務人員在替客戶規劃系統時,能夠達到更完整的功能
性。
2. 建立知識管理制度的績效
一個好的知識管理系統除了有良好的功能之外,還需要工程人員願意提
供更多的知識文件以充實知識管理系統的內容,建議企業推行知識管理石,可設
立績效制度,並建立於知識管理系統中,以鼓勵員工從事知識管理相關活動,方
能落實知識管理,以提高知識的價值。
63
3. 多樣化的知識本體
本研究只根據所挑選的個案公司做知識面的分類,但是資訊服務業類別
的多樣化,可能會因公司本身的組織文化,管理制度以及資訊科技採用程度的不
同而有所影響。
64
參考文獻
1. 賴景昌,林國仕(2004),知識經濟,科學發展月刊,377 期,58-63 頁。
2. 吳 炯 龍 (2002) , 知 識 管 理 系 統 功 能 之 需 求 與 其 影 響 因 素 之 研 究 , 國 立 中
央大學人力資源管理研究所碩士論文,桃園,2-6。
3. 廖河慶(2009),企業知識管理模型之建置-以信用卡授權作業為例,大同大學資訊
經營研究所,台北市,6-7。
4. 杜長樹(2002),服務業知識管理創新與經營,國立台北大學企業管理研究所碩
士論文。
5. Kenneth C. Laudon ,”Management Information System - Managing The Digital
Firm”,周宣光譯,(2006)。
6. 簡瑞霖(2006),知識管理基礎設施、顧客知識管理與顧客關係管理關聯性之探
討,理工研究學報,40:2,頁 25-48。
7. 簡瑞霖(2007),以知識管理基礎設施探討影響顧客知識管理之因素,明新學報,
33,頁 1-25。
8. 蔡敦浩,李慶芳(2002),知識轉變的限制:從情境知識觀點探討知識管理 ,
http://www.kyu.edu.tw/93/epaperv6/93-215.pdf。
9. 曾新穆,李建興(2001),文件自動分類技術研究,資策會。
10. 王亮超(2006),領域本體論為基之網頁知識擷取機制設計,南華大學資訊管
理研究所碩士論文。
11. 黃居仁(2003),語意網、詞網與知識本體:淺談未來網路上的知識運籌,佛
教圖書館館訊,33 期。
12. 許正欣(2004),語意網上自動化建構本體論之研究,輔仁大學資訊管理學系
65
碩士論文。
13. Bassi, Laurie J(1997) “ Hamessing The Power of Intellectual Capital” Training &
Developmrnt.
14. Arthur Andersen Business Consulting(2000). 圖解ナレッヅマネヅメント。劉京偉
譯:知識管理的第一本書---運用知識管理提升企業核心能力。台北:商周。
15. Gruber, T.R.(1995), "Towards Principles for the Design of Ontologies Used for
Knowledge Sharing," International Journal of Human-Computer Studies, vol. 43,no.
5-6, pp.907-928.
16. Berners-Lee, T. and Fischetti, M.(1999), Weaving the Web: The Original Design
and edition, Ultimate Destiny of the World Wide Web by Its Inventor, Harper
Business, 1st, San Francisco.
17. Tiwana, A., “The Knowledge Management Toolkit : practical techniques for
building a knowledge management system. Pren-tice Hall PTR”, 2000, pp.99-201.
18. Knapp, M. E., “Knowledge Management. Business & Economic Review”, July-Sept
1998, pp.3-6.
19. Zack, M. H., “Managing Codified Knowledge. Sloan Man-agement Review”, Summer
1999 , pp.45-48.
20. Zack, M. H., “Developing a Knowledge Strategy, California: Management Review”,
Vol.41, Spring 1999, pp.125-145.
21. Bjorn, S., “Knowledge Management and Organizational Learning. Diploma Thesis”,
September 1999.
22. Beckman, T., “A Methodology for Knowledge Management: Proceeding of the
IASTED”, International Conference on AI and Soft Computing, 1997.
66
Download