- 相關推薦
互操作聯邦數字圖書館研究
【內容提要】未來的圖書館將是聯邦數字圖書館,其目標是向用戶提供一個將異構、分布信息源無縫集成的視圖,實現對數字圖書館資源的透明訪問。文中首先介紹了研究數字圖書館互操作的必要性,在此基礎上重點分析討論了聯邦數字圖書館的實現方法,并對當前具有代表性的互操作聯邦數字圖書館的研究進行了綜述討論,最后簡單討論了目前建立互操作聯邦數字圖書館所面臨的挑戰及進一步研究和解決的問題。【摘要題】專題探討……
1 研究數字圖書館互操作的必要性
隨著在線數字圖書館(DLs)的日益增多,人們發現必須訪問許多DLs才能找到所需要的資料。由于大多數DLs是基于數據庫驅動的,現有流行的搜索引擎不能對其內容建立索引。因此,對于那些需要跨越多個DLs查找資料的用戶來說,搜索引擎不能滿足這種需求。如何將廣泛分布的、異構的DLs聯合起來向用戶提供統一的服務,即實現DLs之間的互操作,成為DLs研究與開發所關注的中心問題。
所謂數字圖書館的互操作是指交換和共享DLs的文檔、查詢和服務的能力[1]。它要求來自技術(協議和格式等)、內容(元數據及其語義等)和組織(DLs的基本訪問原則、支付方式和認證等)三方面的合作。DLs的互操作可以出現在不同的抽象層次上,我們可以將其概括為兩類視圖[1]:縱向視圖(verticalview)和橫向視圖(horizontalview)。前者涉及法律、社會、文化和知識產權等方面的問題,后者涉及DLs的硬件和軟件即體系結構方面的問題。
為什么要研究DLs的互操作?道理很簡單:目前很少有DLs既提供豐富的館藏資源,又提供有效的服務。盡管目前一些DLs擁有大量的館藏資源,而另外一些DLs卻提供許多的服務,但在這兩種情況下,用戶都不太容易找到其所需要的信息資源。只有在這些DLs之間實現互操作,才能共享DLs的資源和服務。因此,研究DLs的互操作是十分必要的。
2 聯邦數字圖書館的實現方法
為了解決用戶使用DLs查找資料時同一查詢條件的重復提交問題,人們提出了聯邦數字圖書館的概念。所謂聯邦數字圖書館是指正式或非正式合作操縱DLs的一些組織,它們同意支持一組共同的服務和標準,以便在聯盟成員之間共享DLs的資源,實現互操作。聯邦數字圖書館允許跨越不同的DLs執行搜索,并將每個DLs的查詢結果合并后返回給用戶,使用戶感到如同使用單個數字圖書館一樣。從聯邦的耦合度考慮,實現聯邦數字圖書館的方法可分為以下三種:NCSTRL方法、Harvesting方法和搜集(Gathering)方法。
2.1 NCSTRL方法
網上計算機科學技術報告圖書館(NCSTRL)是一個擁有100多個機構加盟的聯邦數字圖書館[2],它利用Dienst作為DLs的協議和體系結構。凡是要求加入NCSTRL的機構需要在本地安裝Dienst服務器,并按照統一規定的數據格式建立其館藏資源。NCSTRL借助于分布式搜索技術在聯盟DLs之間實現資源共享,它將用戶的查詢送往參與聯邦的所有DLs上分別執行,收集返回的結果,綜合整理后返回給用戶(圖1)。
附圖
圖1 NCSTRL方法
NCSTRL方法要求所有參與聯邦的DLs使用相同的協議或軟件系統,因此能夠提供全面的互操作。但緊密的聯邦必將加重聯盟成員的負擔,它們不得不就技術標準和策略(如知識產權準則、安全和隱私等)達成一致。從網絡和搜索系統方面的限制考慮,NCSTRL是昂貴的運行模式,因為要求每個聯盟成員的DLs必須支持復雜的查詢語言和對查詢的快速實時響應。另外,從查詢的頻率、元數據的質量以及網絡資源的可用性等方面綜合考慮,這種實現聯邦的方法對聯盟成員加負較重。因此,只有那些需求強烈的DLs會采用這種代價較高的模式。
2.2 Harvesting方法
一臺計算機能夠自動地從其他計算機中收集并提取元數據的方法通常稱作Harvesting[3]。利用Harvesting方法建立聯邦數字圖書館的基本思想是:從每個DLs收集并提取元數據,經過處理、合并后集中保存在一個中心DL中,然后對保存在中心DL本地的元數據執行搜索(圖2)。顯然,這種方法需要在中心DL維護一個所有DLs館藏元數據索引信息的副本,以便提供基于館藏元數據內容的查詢路由服務。
附圖
圖2 Harvesting方法
Harvest系統[4]是這種方法的代表,它包括一組從各個DLs館藏中搜集信息并建立基于主題內容索引的集成工具。Harvest體系結構主要包括兩部分:搜集者(gatherers)和代理(brokers)。每個搜集者從DLs館藏中搜集并提取索引信息。代理程序從一個或多個搜集者或其他代理檢索索引信息,并按增量方式對其進行更新。代理程序能夠為多個館藏建立集成索引,并提供一個查詢界面。
由于Harvesting方法采用集中處理方式,所以能夠保證有較好的查詢響應時間,但各DLs館藏元數據內容的變化不能及時得到反映。另外,Harvesting方法不要求嚴格遵守一組完整的技術協定,只要求做少許支持基本共享服務(如數據訪問)的工作。同NCSTRL方法相比,Harvesting方法提供的互操作性相應的要差一些,但對聯盟成員的要求卻很少。因此,許多組織可能會加入這種松散的DLs聯邦。
2.3 搜集(Gathering)方法
對于那些不能正式加盟的DLs組織,仍有可能通過搜集(Gathering)DLs可公開訪問信息的途徑獲得一定程度的互操作。這種聯邦方法通常提供統一的用戶界面,用戶輸入查詢請求,系統執行分布式搜索,并將合并后的查詢結果返回給用戶。元數據蜘蛛(MetaCrawler)[5]是搜集方法的代表,它是由美國華盛頓大學實現的并行Web搜索服務。MetaCrawler提供一個智能接口界面,它能將用戶的查詢并行地送往多個搜索服務(如Lycos、Altavista和Yahoo等),并對返回的結果進行整理,篩除其中重復的內容,然后返回給用戶。MetaCrawler體系結構具有許多優點,它在傳統的搜索服務之上提供一個抽象層,使其在Web增長和變化時具有較好的適應性、可伸縮性和便攜性。
利用搜集方法建立聯邦數字圖書館無須任何DLs直接參與合作,但所提供服務的質量比參與合作情況下的要差。同前面介紹的兩種方法相比,搜集方法所提供的互操作性最差。目前許多關于Web的研究可視為在這個層次上添加功能,這將會提供更有效的互操作性。盡管期望整個Web表現出豐富的語義不太現實,但是人們還是期望著通過搜集方法提供服務的水平能夠逐步地得到改善。
上述三種聯邦方法中,NCSTRL方法通過使用相同的協議或軟件系統來消除DLs之間的異構問題,因此可以實現全面的互操作。而對現有的DLs來說,Harvesting方法是比較現實的建立聯邦數字圖書
【互操作聯邦數字圖書館研究】相關文章:
基于PDCA的數字圖書館質量管理研究03-18
服務品質與高校數字圖書館網站建設研究03-21
數字圖書館中個性化信息檢索研究03-27
TD—LTE與TD—SCDMA雙網互操作12-19
數字圖書館與傳統圖書館03-02
淺談數字圖書館03-02
中國高校數字圖書館二十年發展研究03-21
數字圖書館與地方文獻數字化03-18
英漢數字習語的對比研究03-11