- 相關推薦
網絡本體語言(OWL)的標準體系解析
萬維網之父蒂姆·伯納斯·李(Tim Berners-Lee)將萬維網的演變分為兩個階段[1]。第一個階段,萬維網應該是一個有利于人們合作的強大工具;第二個階段,則是蒂姆·伯納斯·李所定義的語義網階段。通俗地說,語義網就是一種能夠理解人類語言的智能網絡,它能夠使人與計算機的交流變得像人與人交流一樣輕松。我們目前正處于新一代萬維網發展的邊緣,即致力于第二代網絡——語義網的研究、開發階段。在語義網的開發進程中,網絡本體語言(Web Ontology Language,OWL)作為實現其功能的核心語言工具,其開發意義重大。為了給OWL系統的開發奠定基礎,萬維網聯盟(W3C)于2003年12月 15日發布了由其下屬的網絡本體工作組開發的OWL系列標準規范文件,緊接著又對各標準文檔進行了改進,于2004年2月10日公布了該系列體系的最新版本。本文將對最新版本的OWL系列標準規范體系進行探討和解析,并對中文網絡本體語言開發中的標準建設提出一些建議,以期為國內OWL系統的研究開發提供借鑒。
1 OWL系列標準規范體系的構成
為了更好地描述語義化本體模型和進行知識表述,W3C首先提出用來描述資源及其之間關系的語言規范:資源描述框架(Resources Description Frame,RDF),在此基礎上,歐洲開發了語義交互語言(Ontology Interchange Language,OIL),美國開發了DAML(DARPA Agent Markup Language)。這兩種網絡本體語言都是對RDF類似的擴展,因此后來合并為DAML+OIL,隨后W3C將其規范為理解力更強的網絡本體語言 (Web Ontology Language,OWL)。
OWL系列標準規范體系由6個推薦性標準文檔組成,分別從理論、實例及規范性定義的角度對OWL進行了全面、簡潔及規范化的闡述,它們是:
●《網絡本體語言概述》(OWL Web Ontology Language:Overview):通過列出OWL的語言特征并給出其簡要的描述,對OWL進行簡單介紹。它通過對OWL各子語言特征的非形式化描述,提供了OWL的入門知識[2]。
●《網絡本體語言指南》(OWL Web Ontology Language:Guide):通過一個擴展的例子說明如何使用OWL語言,同時也給出了這些文檔中用到的術語的解釋[2]。具體內容包括如何使用OWL本體語言定義類和類的屬性,以形成一個形式化的域;定義個體并確定它們的屬性,并且對這些類和個體進行推斷,以達到網絡本體語言的形式化語義的許可程度[3]。
●《網絡本體語言參考》(OWL Web Ontology Language:Reference):該文檔對OWL語言的整體構造進行了結構化的非形式化描述[2],使用RDF/XML語法對OWL的所有建模原語進行子系統及詳盡的描述,試圖為構建OWL的用戶提供參考[4]。
●《網絡本體語言語義與抽象語法》(OWL Web Ontology Language:Semantics and Abstract Syntax):對OWL進行了最終的、形式化的規范性定義[2]。
●《網絡本體語言測試用例》(OWL Web Ontology Language:Test Cases):該文檔包含了OWL的大量測試用例集合[2]。其中,許多測試用例說明了OWL語言的形式語義和正確使用方法,其它測試用例則說明了工作組所面臨的亟需解決的問題[5]。
●《網絡本體語言應用案例和需求》(OWL Web Ontology Language:Use Cases and Requirements):該文檔包含了一個Web本體語言的應用案例集合和關于OWL的需求集合[2],詳細闡述了本體語言的使用方式、目的和要求。其目的之一是確定網絡本體語言需要什么。網絡本體語言的要求將被潛在的使用案例和普通設計目標所激發,而這些潛在的使用案例和普通設計目標同時考慮到了將本體標準運用于網絡這一獨特環境時的困難[6]。
接下來將對OWL標準體系的內容框架進行介紹。
2 OWL系列標準規范體系的內容框架
2.1 概述
W3C制定OWL標準體系的目的是為了引起人們對規范的注意并且使其在更廣范圍的被采納與使用[5]。在推薦標準文件時,W3C將主要注意力放在制定規范和改進全面部署能力方面,這無疑增強了網絡的功能性和互操作性[4]。W3C網絡本體工作組采用一系列文檔對OWL語言進行描述,每一個文檔實現一個目的,以滿足不同讀者的需要[2],分別適合某些相關研究人員和技術人員使用。并且按照從易到難,由淺入深的順序對OWL系統進行了全面、透徹的闡述。
總體來說,OWL標準體系結構嚴謹、語言簡練、表達直觀,易于為用戶所接受。每個標準文件各有側重點,從不同的角度制定了OWL的規范,看似獨立,但在內容上又互相服務,理論和示例各有側重,互為補充,這表現為在具體內容的闡述上提供了到其它標準文件的相關鏈接。
具體來說,OWL概述文檔主要針對OWL的初步接觸者,以簡潔、直觀的語言闡述了OWL的基本概念、原理以及OWL三個子語言的語言特征,使用戶對OWL 的基礎知識架構有了一個清晰的了解,解決了用戶從對OWL一無所知到初步入門的問題。文檔對各部分內容作了更詳細的闡述,提供了到其它5個文檔的鏈接,用戶可交互參閱,達到全面學習掌握OWL的目的。
假設用戶首先閱讀完OWL概述文檔后,可閱讀OWL指南文檔獲知使用該語言的理論方法和例子。用戶在對純理論描述進行閱讀時,往往容易產生理解上的障礙。該文檔在對OWL構成元素進行描述時,貫穿了建立酒和食物的主體關系的例子,生動的示例對用戶理解和掌握OWL起到良好的作用。文檔除對OWL的構造元素做了進一步的闡述外,也對屬性特征及屬性限制等描述機制進行了詳細說明,進一步解決了OWL本體語言對信息內容進行更好的表達的問題同時,對數據合并與本體映射等相關技術問題作了一定的討論,為相關機構及人員日后的進一步研究提供了關注重點。
OWL參考文檔類似于一本使用手冊,OWL中所有建模原語的相關描述以及使用時的限制和注意事項都可在該文檔中進行查閱。用戶在閱讀其它5個標準文件的同時,可針對某個具體構造元素在該文檔中進行相關參閱。 文檔通篇圍繞類、個體及屬性對相關的建模元語進行非形式化描述,對每個元語的描述一般從理論闡述、舉例說明及使用時的注意事項三個方面展開,理論與示例相結合,內容詳盡、豐富。文檔的參考文獻提供了OWL每個語言構造元素的索引及快速參考。同時,附錄記錄了自DAML+OIL發展至OWL的變化,利于閱讀時的承前啟后。
OWL語義和抽象語法文檔為用戶提供了OWL語言的標準語法,此文件運用模式論式的語義學對語義進行了精確定義。一些概念如OWL的連貫性等在文件中都有所論述,該文檔適用于那些對OWL技術細節感興趣的用戶;OWL解析器及其它句法工具的開發者會對第二和第四部分特別感興趣;OWL推理器和其它語義工具的開發者會對第三和第五部分特別感興趣,但不適用于那些首先應該閱讀OWL概述文檔的普通讀者。
以上4個標準文件補充性兩個文檔OWL測試用例和OWL使用案例及要求。OWL測,試用例文檔提供了OWL語言的測試用例,OWL使用案例及要求文檔闡述了OWL語言的實際應用領域和OWL本體語言構建所需的必要條件。值得一提的是,OWL使用案例及要求中列舉了6個網絡本體的使用案例,其中一些是基于工業和學術界實際應用案例,另一些是帶前瞻性應用的案例。這些案例有助于用戶了解OWL應用的實際意義,便于有的放矢地開發OWL和研究語言,從而為語義網開發服務。
總的來說,W3C推薦的該標準體系綜合闡述了以下主要內容,下面綜合介紹這6個標準文件的內容。
2.2 OWL的概念及開發的必要性
OWL概述和OWL指南文檔的引言部分對本體和OWL的基本概念進行了闡述。我們討論的本體是表達術語及其詞間關系[2]。這里補充一個更標準的定義,即由Borst給出的:“Ontology是共享概念模型的形式化規范說明”。
OWL是定義和例示網絡本體的一種語言。一個OWL本體包括類、屬性和它們的實例的描述[3]。它可以明確表示詞匯表中術語的意義及其詞間關系[2]。
由于OWL概述文檔是為OWL入門者設計的,因此文檔對開發OWL的必要性進行了詳細說明。未來的語義網應是“構建于XML自定義標簽模式的能力以及 RDF靈活的描述數據的方式之上的”。而根據蒂姆·伯納斯·李提出的著名的語義網構成的標準體系結構,語義Web需要在RDF之上增加的第一個層次,是一種能夠對Web文檔中的術語含義進行形式化(指計算機可讀的)描述的本體語言。如果希望機器能夠對這些Web文檔進行有效的推理工作,這一本體語言必須超越RDF Schema的基本語義。因此,OWL被設計以滿足Web對本體語言的要求[2]。其優勢表現為,在表達意義和語義方面,OWL比XML、RDF和 RDF-S更方便,并且與這些語言相比,OWL表示的網絡內容更容易被機器所理解。OWL是DAML+OIL網絡本體語言的修改版,它結合了 DAML+OIL的設計和應用中得到的經驗教訓[2]。
2.3 OWL的三個子語言
OWL由三個子語言OWL Lite/OWL DL/OWL Full組成。OWL Lite用于執行簡單任務,并且提供給用戶一個功能性子集使他們在初次使用OWL時就能輕易上手。OWL DL(這里DL是指“描述邏輯”)提供令人滿意的語言子集用以支持推理系統實現其計算性能。OWL FULL適當放寬了對OWL DL的限制,目的是為了突出其某些特點使其對數據庫及知識表示系統發揮作用[4]。對OWL的描述實質上就是對這三個子語言的描述,6個標準文檔從不同的角度對這三個子語言作了詳細說明。
OWL概述文檔在分別闡述了三個子語言的總體特征、適用用戶及各個子語言之間的關系之后,著重列出了OWL Lite的語言構造元素,并對元素的特征進行了非正式描述。
由于OWL Lite對OWL語言使用的約束較多,因此OWL的某些構造元素不包含其中。文檔接著對OWL DL和OWL Full相對于OWL Lite增加的語言構造元素的特征做了進一步的非正式描述。
OWL指南文檔的描述與OWL概述類似。OWL參考文檔對三個子語言作了更詳細的描述,主要側重于具體使用時的注意事項,如詳細列出了OWL DL和OWL Lite中被限制使用的語言構造元素,為用戶在具體選擇使用這三個子語言時提供了參考。OWL語義與抽象語法文檔的第二部分從語法描述的角度對用于OWL Lite和OWL DL子語言的抽象語法進行了詳細說明,具體內容包括OWL Lite和OWL DL的類公理、限制或約束以及屬性公理。
這4個標準文檔分別從三個子語言的基本概念、使用時的注意事項及語法描述的角度對其進行了詳細說明,實質上是對OWL語言作了全面的補充性描述,用戶可在了解該部分內容時對4個標準文件進行交叉閱讀。
2.4 OWL本體構成
OWL本體包括類、屬性和它們的實例(即個體)的描述[3]。因此該部分是描述的重點。OWL概述文檔從對OWL Lite的語言特征進行描述出發,對類、個體及屬性進行了定義和簡單說明。“一個類定義了一組具有某些共同屬性的個體。例如類Person、類 Animal。個體是類的實例,例如一個名為Deborah的個體可以被描述為類Person的一個實例。而屬性能夠用來聲明個體間的關系或者從個體到數據值之間的關系。例如屬性hasEmployer可用來將個體Deborah關聯到個體斯坦福大學”。其后,對相關的類描述、屬性特征、屬性約束、數量約束中應用的語言構造元素進行了說明。
為了對OWL進行更生動的說明,OWL指南文檔是描述與示例相結合,恰如酒和食物的關系一樣。同時基于一個OWL本體的大多數語言構成元素都涉及了類、屬性、類的實例以及這些實例之間的關系。因此,在闡述如何建立酒和食物本體的過程中,文檔的第三、第五部分對建立簡單的類、個體、屬性及實例中應用的語言構造元素到建立復雜的類所用到的語言構造元素一一進行了闡述及例示,使用戶進一步掌握OWL的構成元素。
OWL參考文檔通篇圍繞類、個體及屬性對與它們相關的建模原語進行了非形式化描述,對每個原語的描述從理論闡述、舉例說明及使用時的注意事項三個方面展開,理論與例子相結合,內容詳盡、豐富。
OWL語義與抽象語法文檔在定義抽象語法時,對OWL Lite和OWL DL中的類公理、限制及屬性公理進行了規定。
這4個標準文件同樣按照從易到難的順序對類、個體及屬性的定義、構造元素及應用語法等進行了描述,尤其是OWL參考文檔對類、個體及屬性中所有的語言構造元素進行了詳細的描述。用戶在閱讀其它5個標準文件的同時,可針對某個具體構造元素在該文檔中進行相關參閱。
2.5 OWL本體附屬信息
本體標頭(Header)、引入(ioports)及版本信息(rersioninf)是構建一個本體必不可少的元素。OWL概述文檔首先對本體標頭、引入及版本信息進行了簡要說明,并建議用戶參閱OWL參考文檔獲取更多細節,參閱OWL指南文檔獲取更多示例。OWL參考文檔對本體標頭、引入及版本信息作了詳細說明。“一個本體就是一個資源,它可利用OWL的屬性和其它命名空間來對其進行描述,例如:<owl:Ontology rdf:about="">是一個本體標頭,指出這一塊描述的是當前本體。”
可利用一個owl:imports陳述來引用另一個已定義好的OWL本體來建立新的本體,這樣直接的引入可避免資源的重復建設,以利于整合語義網中分散的資源。關于該引入陳述的使用注意事項及示例分別在OWL參考文檔和OWL指南文檔中有詳細說明。
本體像軟件一樣,是可維護的,且隨著時間變化會發生變化。因此可利用owl:versionInfo、owl:priorVersion、 owl:backward Compatible With等介紹當前版本、前一版本及版本的兼容情況,利于本體的維護及擴充。OWL參考文檔和OWL指南文檔也對版本信息的概念、使用及示例作了全面描述。
2.6 OWL的正式語義
從事OWL推理器和其它語義工具的開發者需要對OWL的正式語義有所了解。W3C工作組在OWL語義和抽象語法文檔中提供了OWL的兩個正式語義。在文檔第三部分定義的語義是一個以抽象語法形式書寫的,用于OWL本體標準模型語義;另一個在文檔第五部分介紹的語義,是RDF語義[RDF Semantics]的一個詞表擴展,以RDF向圖形式為OWL本體提供語義。第二個語義有兩個版本,一個版本類似于直接語義(為OWL DL所用的語義);另一個版本適用于將類當作個體(individuals)的形式或抽象語法不能處理的形式(即為OWL Full所用的語義)。這兩個版本實際上非常接近,只是在如何分割論域(domain of discourse)時有一些不同。
2.7 OWL的相關技術問題
2.7.1 數據聚集與安全保護 語義網中的資源和數據是分散的,如何把這些分散的資源及數據有效地聚集及融合是一個值得考慮的問題,W3C工作組在制定該標準體系時已充分考慮這方面的重要性,分別在OWL指南文檔和OWL參考文檔中專門列出一節進行說明。雖然語義網具有可連接多種來源數據的優勢,可應用在多個領域。但這種合并多源數據的性能,再結合上OWL的語義推斷性能,卻有可能被濫用。因此,在使用OWL的某些可能與其它源數據或本體與單個數據合并時,應特別注意。工作組還提供了相關鏈接SAML和P3P等一系統優化解決方案。
2.7.2 本體映射 本體被廣泛地共用及再利用,利于提高其影響力,降低開發成本。但將一批本體融合起來將是一個挑戰,需要支持工具保持一致性。目前國際上對語義網及本體的研究熱點在于如何按照需要進行本體映射。
OWL語義與抽象語法文檔首先討論了OWL DL和OWL Lite抽象語法到OWL交換語法(即RDF/XML[RDF Syntax])的映射。此映射(及其反向映射)提供了抽象語法和交換語法之間的標準化的關系,并提供了轉換至RDF有向圖的轉換表,給出了將抽象語法轉換至OWL交換語法的轉換規則。
OWL指南文檔針對本體融合的問題的類和屬性之間的等值、個體之間的等同性及不同的個體的融合情況分別作了詳細說明。
2.8 OWL的使用案例、要求與測試用例
OWL使用案例及要求文檔和OWL測試用例文檔與前4個文檔不同。OWL使用案例及要求文檔列舉了本體在網絡、知識管理、智能數據庫及電子商務等領域應用的6個典型案例,并描述了8個設計目標,從而根據使用案例與設計目標對網絡本體語言提出了一些要求,這對網絡本體語言今后的發展方向提供了有益的參考[7]。
OWL測試用例文檔包含由Web本體工作組通過的Web本體語言測試用例。其中,許多測試用例說明了OWL語言的形式語義和正確使用方法,其它測試用例則說明了工作組亟需解決的問題。OWL文檔和OWL文檔檢查器(OWL document checkers)之間的一致性也得到了詳細說明。這些測試用例用于解釋和進一步說明OWL語義與抽象語法文檔中的標準化定義,該文檔是一個補充性的文檔。
總的來說,這兩個文檔重點在于具體應用,在對前4個文檔補充說明的同時,也使用戶認識到網絡本體語言在具體領域的應用價值及前景,同時提出了一些亟待解決的問題,為今后的研究方向提供參考。
3 OWL系列標準規范體系的未來發展趨向
很顯然,W3C目前推薦的網絡本體語言(OWL)標準并不是適用于語義網應用的本體語言標準的最終形式,OWL使用案例及要求文檔中已經提出了大量工作組,其中包括未在該標準文件中討論的、留待以后繼續研究的特性。工作組在這部分共提出14個有待進一步討論的語言特性,同時代表了OWL系列標準體系未來的發展趨向。對此感興趣的用戶可參閱OWL使用案例及要求文檔的相關部分。這里介紹兩個目前討論較多的問題。
3.1 OWL:多還是少
語義網在發展本體語言方面經過了大量的研究,確定OWL作為目前最合適的標準[8]。目前討論較多的一個關鍵問題是OWL是否需要很復雜?一種簡單本體語言的優勢在于更高效的推理支持并且更為簡單易用,這對于語義網的順利構建也能起到至關重要的作用。因此,對用戶來說,OWL三個子語言中較簡單易用的 OWL Lite語言可以說是通向語義網正確發展方向的第一步。在OWL標準體系的未來發展中也可對OWL Lite投入更多的關注,一旦其發展成熟,將更有利于語義網的建設。
3.2 模塊與引入本體
OWL標準體系制定的規范允許用戶在建立本體時引入一個事先定義好的本體。但OWL的這一引入機制價值并不大。因為它僅允許引入一個事先已指定好地址的完整本體。即使用戶僅希望使用該引入本體的一小部分,他也不得不同時引入該本體全部。編程語言中的模塊建設是以信息藏匿這一概念為基礎的,模塊給外部環境提供了一定的功能性(模塊的輸出子句),但引入模塊并不需要關心如何達到這一功能性。因此,這是一個開放性研究問題,即關于本體的信息藏匿概念的討論以及如何較好地利用信息藏匿為一個良好的引入機制建設服務。
4 結束語
OWL標準體系由W3C基于目前語義網的發展水平組織開發并發布,它對世界各國從事語義網及網絡本體語言開發的研究機構和人員起到了規范和指導作用。但我國目前在語義網方面的研究才剛剛起步,與世界上先進的發展水平還有差距。欲充分理解并有效利用該標準體系建立中文網絡本體語言,首先應基于語義網構成的標準體系的前三層,即Unicode+URI、XML+NS+xmlschema及RDF+rdfschema開發成熟的基礎上。其次,在應用OWL標準體系構建中文網絡本體語言時應充分考慮到中文語言的邏輯特點,因此對該標準體系需經我國的研究人員對其解析,并進行消化改進使其與中文語言相適應后再加以利用,而不是全盤照收。
【參考文獻】
1 朱禮軍,陶蘭,黃赤.語義萬維網的概念、開發及應用.[2004-07-10].http://bbs,w3china.org/list.asp?boardid=2
2 McGuinness D,van Harmelen F eds.OWL Web Ontology Language Overview.[2004-07-10].http://www.w3.org/TR/2004/REC-owl-features-20040210/
3 Smith M,Welty C,McGuinness D eds.OWL Web Ontology Language:Guide.[2004-07-10].http://www.w3.org/TR/2004/BEC-owl-guide-20040210/
4 Dean M,Schreiber G.OWL Web Ontology Language Reference.[2004-07-10].http://www.w3.org/TR/2004/REC-owl-ref-2O040210/
5 Patel-Schneider P F,Hayes P,Horrocks I eds.OWL Web Ontology Language:Semantics & Abstract Syntax.[2004-07-10].http://www.w3.org/TR/2004/REC-owl-semantics-20040210/
6 Heflin J ed.OWL Web Ontology Language:Use Cases and Requirements.[2004-07-10].http://www.w3.org/TR/2004/REC-webont-req-20040210/
7 Carroll J,De Roo J eds.OWL Web Ontology Language:Test Cases.[2004-07-10].http://www.w3.org/TR./2004/REC-owl-test-20040210/
8 Antoniou G,Harmelen F.A Semantic Web Premier,[2004-07-10].http://wiki.w3china.org/wiki/index.php/% E9% A6% 96% E9% A1% B5
【網絡本體語言(OWL)的標準體系解析】相關文章:
ERP標準成本體系與現代企業成本管理研究03-21
OWL-S綜述03-08
網絡工程的解析論文03-28
解析信息網絡傳播權03-22
試論內部控制評價標準體系框架的建立03-18
企業標準體系在企業進化管理中的作用分析03-14
上海移動人力資源管理體系解析03-18
數據中心網絡的體系結構分析12-01
淺析網絡信息中介商在網絡營銷體系中的作用03-22