- 相關推薦
數字檔案館建設面臨的難題
【內容提要】數字檔案館是數字信息時代檔案傳遞和利用的新途徑。數字檔案館與傳統檔案館相比有著極大的優越性,然而它也存在著不少缺陷。在數字檔案館的建設中面臨著諸多不容樂觀難以解決的問題,對此我們要有清醒的認識。本文提出了數字檔案館建設所面臨的10個方面的問題!娟P 鍵 詞】數字檔案館/問題
【 正 文】
隨著現代信息技術的迅速發展和大量電子文件的產生,數字檔案館的研究和建設成為我國檔案界關注的熱點。數字檔案館與傳統檔案館相比,有著豐富的數字化資源、海量的存儲、便捷的檢索、快速的傳輸、高度的開放、信息的共享等優點,使傳統的檔案館望塵莫及。然而,它也不可避免地存在一些缺陷和不足,有的甚至可能是致命的缺陷。因此,我們應該清醒地認識到數字檔案館存在的缺陷,數字檔案館的建設還存在著諸多的難點和問題亟待深入研究解決。如果對存在的問題視而不見,或掉以輕心,必將給未來的檔案事業留下巨大而無法彌補的遺憾。
1 數字檔案的憑證價值問題
檔案的基本價值有兩方面,憑證價值和參考價值,而尤以憑證價值最為重要,雖然,“目前人們對數字化檔案具有參考價值這一點已無疑義,然而,由于一系列技術和立法問題還未解決,數字化檔案目前還不具備法律憑證效力”[1]這無疑使數字檔案的作用大打折扣。因此,確認數字檔案的憑證價值就成為數字檔案館建設中無法回避的難題。目前,主要存在以下幾方面的問題:
1.1 認識上的問題。數字檔案不具備“白紙黑字”的直觀性,必須依賴特定的計算機設備加以解讀。數字檔案完全脫離了以往人人對檔案“原件”的認識,從而引起人們對其原始性、可靠性的懷疑。而且,有些數字檔案即使載體保存完好,內容亦可能在無形中丟失,它不像紙質檔案那樣載體與內容“一損俱損,一榮俱榮”。數字檔案與以往其他載體的檔案都不一樣,從甲骨檔案到簡牘檔案再到紙質檔案,只是載體的耐久性有差別,并沒有改變其直觀性,而數字檔案的非人工識讀性與其他載體的檔案有著質的區別。要確認數字檔案的憑證價值,恐怕不僅僅是改變觀念的問題,要真正認識數字檔案,確認其憑證價值,可能還需要走很長的路。
1.2 技術上的問題。數字檔案是高新技術的產物,它給人們帶來極大便利的同時,也給人們留下了困惑與難題。其一,數字檔案具有易復制、修改、刪除的特點,使得檔案“原件”的概念變得難以確認。其二,計算機硬、軟件技術不斷更新換代,迫使數字檔案必須不斷適應新的“生存環境”,不斷地變換載體、格式,因而無法通過載體、格式的鑒定來判定其原始性。其三,數字檔案不再具有特定的字跡,人們可以根據需要以不同的字體、字號將其輸出,傳統的字跡鑒定技術無法分辨數字檔案的原始性。其四,數字檔案對背景信息和元數據具有很強的依賴性!半娮游募谋尘靶畔⒊3Ec文件內容信息相分離保存,一旦失去背景信息,文件的內容即便仍有意義,但也不再具有憑證價值。元數據是電子文件、電子檔案所特有的,“元數據由于其隱含性而易被忽視,而元數據一旦丟失或破壞,電子文件的原始性就會改變!盵2]
1.3 管理制度上的問題。“傳統檔案之所以具有憑證價值,在一定程度上取決于嚴格的管理制度”,而目前“從電子文件的生成到歸檔都缺乏十分規范的程序化管理,缺乏嚴格而科學的標準體系和業務管理制度,一些標準、制度雖已制定,但全面推行尚需時日”[3]而且也有一定的難度。
2 數字檔案信息的長期存取問題
數字檔案信息的長期存取問題是數字檔案館建設的一個具體而又棘手的難題!皳䦂蟮,美國航空航天局在20年前發射的‘海盜’火星探測器上的計算機中,已經有20%的數據完全丟失,還有大約4000卷的統計數據因存儲的格式模糊無法讀出,程序員也無法保證將其恢復”。[4]數字檔案信息長期存取所面臨的主要問題有:
2.1 存儲的介質材料!艾F代介質的存儲設備還不可能解決計算機數據存儲問題”。[5]一般說來,磁盤的壽命是3~5年,光盤也不過30年左右,與能保存千年以上的紙質載體相比,其壽命相差甚遠,而且它還要受到溫度、磁場、記錄存儲格式、硬件配置等多方面的影響,10年前還經常使用的5.25英寸的軟盤,現在已經沒有一臺普通電腦可以讀出來。
2.2 機讀語言格式。“計算機語言平均每三個月就會問世一種,而語言之間的互換大部分存在問題。很難想象,若干年以后,我們用現行的機器語言描述的數據,還能百分之百的還原”。[6]
2.3 對設備的依賴。數字檔案必須依賴于計算機設備才能讀出,這個特征對其長期存取帶來很多問題:“如設備發生故障、系統癱瘓,電子文件就讀不出來;電子文件對其它設備環境的不兼容性,使其只能在某種設備上處理,而不能在其它設備上處理;不同軟件環境形成的電子文件存貯在載體上,有時難以互換;電子文件加密后,不解密就無法識別;技術設備更新時,不及時解決格式轉換問題,也無法讀取等等”。[7]
3 數字檔案的失真問題
“檔案數字化工作的生命線在于其能夠保持檔案原貌”。[8]然而,“就目前的研究水平而言,還難以保質保量地完成館藏檔案數字化的任務。如已研制出的OCR掃描輸入技術,其平均識別率是95%。這對于追求最大程度真實性的檔案來說無疑是致命弱點”。[9]數字化的主要方式是掃描加工,在這一過程中造成數字檔案失真的原因還有以下幾個方面:其一,技術參數選擇不當。針對不同色調、紙質和字跡,有時需調整不同的技術參數,如分辨率、明暗度、對比度等,選擇不當會直接影響掃描的質量,造成信息丟失、圖像模糊或產生額外信息,客觀上造成檔案原貌的改變。其二,工作失誤。檔案掃描是大量的重復勞動,難免有時失誤。如掃錯檔案或打錯順序,或存錯,或在建索引時鏈接錯誤等,如不及時發現,將直接導致數字化檔案失真。其三,轉換過程中的失真。在進行數字檔案的遷移或在提供利用時,往往需要將掃描后形成的圖像文件轉換成另一種格式的文件,如果格式選擇不當,同樣會導致數據發生變化。
4 數字檔案信息的安全問題
安全問題是計算機網絡世界最為頭痛的難題,也是數字檔案館中的重大難題之一。數字檔案館雖然被稱之為“館”,但它的存在更仿佛是一個巨大的沒有警察的自由市場,給不法分子帶來可乘之機,主要表現為:其一,計算機病毒。網絡信息安全的最主要的敵人就是計算機病毒!皣庥腥斯烙,現在計算機病毒的傳染每兩個月增加1倍。網絡病毒的泛濫已對計算機網絡系統構成嚴重的威脅”。[10]其二,計算機黑客。由于網絡的加密性和匿名性,使入侵者難以被發現。黑客對信息資源的攻擊,不僅僅是好奇和自我挑戰,程序設計高手可以篡改系統控制參數。其三,有竊取行為的間諜活動,窺視其機密信息進行復制或擴散。其四,有意破壞,摧毀系統的信息處理功能或破壞電子通訊裝置。其五,人為或偶然事故造成的威脅。如工作人員操作失誤而產生的不可預知的事件、網絡系統軟件硬件的故障、電子系統故障引發的系統問題等,所有這些,都使數字檔案信息的安全變得十分“脆弱”。
5 數字檔案館建設的諸多技術問題
數字檔案館完全是高新技術、電子設備和計算機網絡技術支撐起來的產物,離開了高新技術的支撐,就沒有了數字檔案館。但是高新技術也給數字檔案館帶來了致命的弱點,真是“成也蕭何,敗也蕭何”。諸多的技術問題成為制約數字檔案館建設的難點。
5.1 數字化設備技術條件。網絡系統中的硬件技術之一是必須有足夠的帶寬,以保證快捷地傳輸文本、語音、圖像、影像檔案,以便實現多網互連、高速互訪,實現跨平臺、跨系統、跨語種的互相轉換和鏈接。毫無疑問,足夠的帶寬條件和用戶對網絡信息傳輸的需求將一直是一對矛盾體。
5.2 技術難題。數字檔案館是以信息源、網絡、數據庫為基礎的,其相關技術是較復雜較先進并且不斷發展的,它幾乎囊括了計算機網絡技術所需要解決的所有問題,技術密集。如數字化圖像的存儲與壓縮、數據組織技術、信息檢索技術、多語言平臺互換互訪技術、海量信息存儲與調配技術等,既是計算機網絡技術的難關,也是制約數字檔案館建設發展的難題。此外,“數字檔案館的建設和運行需要解決一些特殊問題,為此必須開發應用一系列新技術,如:身份認定、智能檢索、信息隱蔽、數字水印、電子簽章、操作跟蹤、信息加密等,其中有很多技術有創新性”。[11]這些技術也都是不容易解決的問題。
5.3 技術過時問題。在飛速發展的IT業中,電腦硬件、操作系統、應用軟件及存儲載體等不斷地被新產品所替代,IT產品是真正的“短命鬼”。雖然絕大多數新產品承諾向下兼容,但其兼容的“代”數在跨越若干年后,舊的數字信息就很難被新的硬件設備和軟件系統讀出!凹夹g過時”的陰影一直會籠罩著數字信息。專家們提出的解決方案是數據遷移,但遷移卻存在著一個致命弱點,就是每次遷移總會丟失一定的相關信息,這些丟失的信息積累起來會造成數字檔案信息無法準確恢復原貌。
6 數字檔案館建設的標準化問題
數字檔案館建設的目的是要使地區檔案館、全國檔案館乃至全世界的檔案館連成一個整體,以實現檔案信息資源共享。這個整體性的數字檔案館事實上是一種基于網絡環境下的數字化檔案信息資源共享的社會檔案館系統,是一個面向對象的分布式的網狀結構模式,是由一個個相對獨立的數字檔案館實體組成的。要對這分散在各地的數字檔案信息資源進行組織控制,就必須要有彼此兼容的硬件環境,要有一致的文件格式、統一的著錄標引標準、數據描述標準、元數據標準、全文數據庫標準等等,這些標準也僅僅是幾個主要的標準!岸鴮嶋H上,在數字檔案館建設中,標準化是一個體系,是一個系統,因此對于我們來說,如何結合我國實際,迅速建立起一個適合我國數字檔案館建設的標準化體系是擺在我們面前的一個迫切需要解決的新問題”。[12]然而,要解決這個問題并不容易,我們面臨著很多問題:其一,一個嚴峻的事實是我國檔案信息系統沒有相應的具體標準可遵循;其二,有些標準規范要超出檔案工作的范圍,如綜合數據處理格式就需滿足跨行業、跨部門的要求。如何統一是一個很麻煩的問題;其三,與整個檔案工作的標準相銜接的問題;其四,與國際通用標準的接軌問題;其五,由于計算機技術更新速度非?,每次技術設備的更新,都會對原標準產生相應的影響,因而必須不斷適時修訂標準。
7 數字檔案館建設的投入與產出問題
數字檔案館建設存在著投入與產出不協調的問題。如果我們把數字檔案館與數字圖書館作比較,會對這個問題看得更清楚。數字檔案館建設投入的費用是巨大的,而且它的建設費用要遠遠高于數字圖書館的建設費用。由于圖書有復本,許多圖書館保存的圖書都一樣。因而國家圖書館和省市圖書館的部分圖書數字化后,其他圖書館特別是中小型圖書館完全可以坐享其成,不必再花費資金重復建設。而檔案館則不行,全國各個檔案館保存的檔案幾乎都是孤本,因而檔案館在用于檔案數字化的費用上要比圖書館多,如,僅檔案館進行數字化檔案目錄的“工作量約是圖書館的35倍”。[13]但是檔案館的利用人次與圖書館讀者的人數相比卻少得多,“以北京市檔案館和國家
【數字檔案館建設面臨的難題】相關文章:
對數字化檔案館的初步研究02-28
綜合性檔案館館藏檔案數字化鑒定探討03-20
網格技術的發展與數字圖書館建設12-07
淺析數字化圖書館的建設03-22
圖書館數字化建設實證分析03-21
數字化圖書館建設的深度剖析03-22
文學經典面臨挑戰03-20
服務品質與高校數字圖書館網站建設研究03-21
文學經典面臨挑戰的論文12-08