試析基于關鍵詞集合的知識關聯網絡構建
論文關鍵詞:知識關聯 知識地圖 關鍵詞集合 知識管理系統(KMS )
論文摘要:建立符合邏輯的知識關聯體系是知識地圖理論的重要內容之一本文對知識管理系統中知識關聯的有向性進行分析,敘述了單向知識關聯和雙向知識關聯的概念與特點;對關鍵詞集合進行定義,闡述了單關鍵詞集合、全關鍵詞集合和不定關鍵詞集合三種劃分策略,介紹了以關鍵詞集合為迭代單元構建關聯網絡和針對單個知識點構建關聯網絡的兩種算法,并指出了算法在實際應用中需注意的問題.
當前,知識地圖的理論研究有很大進展,但在知識管理系統(KMS )領域的實際應用成果卻比較有限.盡管有KMS產品應用了知識地圖理念,但多數產品僅在頁面上顯示了知識庫的分類體系與鏈接,缺乏對知識間邏輯關系的進一步刻畫與展示。.
建立符合邏輯的知識關聯體系是知識地圖的重要理論之一知識分類體系是實施知識管理的基礎性工作,現實世界中的事物間聯系并不是僅用樹型分類體系就可以表述的一個事物有可能同時從屬于多個分類,不同類別的事物也有可能發生聯系,僅僅依賴分類很難準確、全面地表達知識間的邏輯關系.知識關聯則提供了更靈活、更廣義的知識關系表示方法,采用跨分類、跨區域的知識關聯可以較好地表達信息之間的邏輯聯系本文根據集合論與圖論的基本原理,對知識關聯的有向性和關鍵詞集合進行了探討,并闡述了根據關鍵詞集合在KMS中建立知識關聯網絡的原理與算法.
1知識關聯的有向性
1. 1單向知識關聯
現實世界中的各類事物存在著紛繁復雜的關系,這種關聯關系是有方向的.如圖1所示,水和分子關聯的語義可以描述為“水由分子組成”.相應地,由分子到水關聯的語義可以描述為“分子構成了水”.這兩種關聯關系是不同的,是兩個單方向的知識關聯.
在知識關聯網絡中,我們可假設各知識點分別為k,、k2、k3、k4·…對于知識點k1,如果有知識點k2、k3、凡與其內容有較高相關度,此時可通過KMS的功能將k2、k3、k;與k,關聯,將關聯鏈接插人在k,的知識內容之后.這個關聯征進行自動關聯.采用單向知識關聯的KMS的特點是:如果知識點k,有到知識點k:的關聯鏈接,但知識點k:未必有到知識點k,的關聯鏈接,則系統須對每一個關聯關系的含義作出必要的表述.
1.2雙向知識關聯
根據常識,若知識點k,與k:有關系,則k2也與k,有關系.雙向知識關聯是在不考慮關聯語義的情況下發生的,例如知識點k,與知識點k2關聯,則知識點k:也必然與知識點k,關聯.設R,,RZ為定義在知識集合上的二元關系,則雙向知識關聯用符號可描述為:k, R, k2,kZRZk, .
在很多情況下,由于語義不同,R, RZ.當R:二R:時,則k:和k:的關聯關系是對稱的.采用雙向知識關聯的KMS的特點是:只要知識點k,有知識點k:的關聯鏈接,知識點k:也必然具有與知識點k,的關聯鏈接.系統在設置關聯鏈接時不考慮關聯的語義.
語義分析是計算機研究的難點,目前還沒有KMS能夠自動精確地識別知識的關聯語義.因此,在知識關聯系統中適宜采用忽略關聯語義的雙向關聯方式.
2基于關鍵詞集合的知識關聯網絡繪制算法
2.1算法原理
在目前的技術條件下,基于語義分析構建知識關聯網絡較為困難.利用知識點關鍵詞集合建立關聯網絡的精確度不如語義關聯網絡,但技術上現實可行,能夠較好地表達知識間的關系.
基于關鍵詞集合構建關聯網絡所遵循的原理是:設n個知識點具有共同的關鍵詞集合S,則這n個知識點均是互相關聯的;將各知識點作為點,關聯關系作為有向邊,可以繪制基于關鍵詞集合S的有向完全圖G;將KMS中的關鍵詞按特定策略劃分為集合,并綜合各關鍵詞集合,根據算法畫出有向完全圖,可以得到該關鍵詞集合劃分策略下的完整知識關聯網絡.
2.2健詞集合及其劃分策略
關鍵詞是用戶在編輯知識時為每個知識點設置的,一般用于知識檢索,本文則關注應用關鍵詞集合構建知識關聯網絡的思想與算法.關鍵詞集合指包含了1個或多個關鍵詞的集合.關鍵詞集合所包含的關鍵詞內容與數量如何設置,取決于知識關聯所遵循的關鍵詞集合劃分策略.本文涉及的三種劃分策略分別是單關鍵詞集合策略、全關健詞集合策略和不定關鍵詞集合策略.
在單關鍵詞集合策略下,每個關鍵詞集合S只擁有一個關鍵詞w;,該集合S‘對應知識點集合戊}k,,k2,-..,k,},這些知識點均含有關鍵詞,、.設知識點k,具有關鍵詞、,,,,,…,二r,基于此策略設置知識關聯時,k,會把與關鍵詞集合S,,SZ,...,5:匹配的知識點集合K,K‘中的全部知識點鏈接進來,并剔除其中的重復部分.如圖2所示,6個含有關鍵詞“學生”的知識點以單關鍵詞集合{學生}為制圖策略構成了有向完全圖,也就是這6個知識點基于“學生”關鍵詞的知識關聯網絡.
在全關鍵詞集合策略下,全關鍵詞集合s;包含了知識點k:所具有的所有關鍵詞,k:只把與全關鍵詞集合S;wl,叨2,…,,r匹配的知識點集合K;中的知識鏈接進來.使用該策略獲取的知識結果的相關度比使用單關鍵詞策略要高.
在不定關鍵詞集合策略下,需人工確定關鍵詞集合中所包含的關鍵詞,此方式無法實現全自動知識關聯,不適合在大型知識庫系統中采用.
由全關鍵詞策略或不定關鍵詞策略獲得的結果集是單關鍵詞集合策略結果集的子集,獲得的知識關聯網絡圖是基于單關鍵詞集合策略獲得的知識網絡圖的子圖.在實際應用中,宜采用全關鍵詞集合策略與單關鍵詞集合策略相結合的方式,在知識點關聯展示的時候分兩組按不同的優先級展示.首先展示優先級最高的按全關鍵詞集合策略得出的關聯知識點集合,該集合中的知識與當前知識點的相關度最高;其次才展示單關鍵詞集合策略得出的結果集.本文討論的算法均基于這兩種策略相結合的方式.
2. 3以關鍵詞集合為迭代單元的關聯網絡算法
計算知識關聯網絡可以用關鍵詞集合作為迭代單元循環進行或者僅針對單個知識點進行.這兩種方式在KMS中各有優勢,分別適合不同的場景在為數量較多的知識點構建關聯網絡時,首選以關鍵詞集合為迭代單元進行計算,算法描述如下.
1)設需要計算關聯網絡的知識范圍中有P個知識點k, , k2,…,kP,任意知識點氣均對應一個點v;,把所有的點繪制在圖‘<V, E>中,v;與k}一一對應.
2)分揀出KMS中所有種類的關鍵詞w‑w2.wn,記錄KMS中所有關鍵詞集合的信息獲得關鍵詞集合S, ,52,.. Sn ... S9(包含所有的單關鍵詞集合與全關鍵詞集合),同時獲得與任意關鍵詞集合S.相匹配的知識點集合K;.
3)逐個掃描關鍵詞集合S, ,52, ,59,優先掃描其中的全關鍵詞集合(這樣可以確保每條知識后的關聯信息優先展示關鍵字相關度最高的鏈接),記錄當前關鍵詞集合S,所對應的知識點集合Kl,記錄知識點集合K中所包含的每個知識點元素k;,在圖中與K對應的點集合的所有元素間作有向完全子圖,在畫邊e};、eji時,在系統內知識點k、后加人知識點匆的鏈接,在知識點k;后加人k‘的鏈接·如果邊已存在,則跳過,每畫一條邊,計數器c累加1.掃描完K9后,循環結束.
4)程序繪制的圖<V, E>就是P個知識點根據關鍵詞集合S‑S2,S。構建的知識關聯網絡圖,。是知識關聯網絡所具有的知識關聯數量.該算法的復雜度是。(n2).
如圖3所示,在一個具有7個知識點的示例系統中,算法先根據單關鍵字集合S,{經濟學}進行繪圖,其次根據單關鍵字集合管理學進行繪圖.“管理經濟學”知識點因為同時具有管理學、經濟學兩個關鍵詞,因此同時處于左、右兩個有向完全子圖中.圖3就是這7個知識點根據2個單關鍵字集合所繪制的知識關聯網絡.
2. 4針對單個知識點的關聯網絡算法
對于任意一個知識點k;設該矢識點擁有個關鍵詞,首先掃描全關鍵詞集合Sr十,{w},w2,…,、:},再逐個掃描關鍵詞二:所對應的關鍵詞集合S,在每一輪掃描中將當前集合所對應的知識點集合凡,內所有的知識點元素記錄在緩存中,掃描到任意知識點乓時,程序繪制兩條有向邊人知識點的關聯,在知識點氣后加入的關聯如果邊ei、ei;已存在或i=J,則跳過,每畫一條邊,計數器。累加,直到有向完全圖繪制完成.
程序繪制的圖就是知識點的相關知識點關聯圖。是與該知識點相關的所有知識關聯數量.該算法的復雜度是口(礦).該算法循環應用在所有知識點上同樣也可以得到算法2. 3繪制的整體知識地圖,但算法復雜度達到0(礦),因此在為多個知識點建立關聯或繪制地圖時宜采用2. 3節的算法.2. 4節的算法則適宜針對個別知識點繪制關聯網絡并建立知識鏈接時采用.
3實際應用中需注意的問題
企業級KMS中知識點數量可能達到1萬以上,在應用關鍵詞集合繪制知識關聯網絡時必須設置范圍與條件,一般只分層次、分區域按照相應使用人員群體的權限選擇部分知識點進行關聯網絡繪制.其次,必須嚴格準確地設定關鍵詞,管理維護關鍵詞,建立系統關鍵詞管理維護機制,同時應制定關鍵詞編輯規范并開發檢驗程序,限制每個知識點的關鍵詞字數、關鍵詞個數,并提供系統級視圖監控系統關鍵詞的使用與分布狀況.在 KMS中,應采用關聯網絡、分類體系、搜索引擎共同協作的方式構建完善的知識地圖,這樣有助于建立真正意義上的實用知識地圖,使知識查閱檢索更加方便、快捷、準確.
【試析基于關鍵詞的知識關聯網絡構建】相關文章:
試析基于IP網絡的新型通信應用技術12-07
試析油圖書館知識資源管理系統構建研究01-18
基于網絡多媒體的大學英語課堂生態構建12-05
試析企業知識轉移03-28
試析職業院校學生學習能力的構建12-06
試析高校法律英語師資培養模式的構建03-10
試析辯訴交易制度在我國的本土構建03-29
試析基于軟件歷史信息的軟件工程12-06
試析企業知識管理作用與影響03-28
- 相關推薦