- 相關推薦
淺論當前軟件抗衰技術中存在的幾點問題
[摘要]計算系統軟件抗衰技術是隨著計算機技術的發展衍生出的一個新的研究方向,屬于計算機應用研究領域。它涉及系統性能檢測、故障診斷、軟件工程及可靠性分析等方面,主要針對當前計算機運行過程中普遍出現的性能衰退現象,研究其原因、檢測和評價方法、軟件抗衰策略及實現技術。本論文主要探討了當前軟件抗衰技術中存在的幾點問題。
[關鍵詞]軟件抗衰 軟件工程 計算機軟件
一、引言
軟件的體系結構為軟件系統的構造、行為和關鍵性質提供了一個高層的抽象,這種抽象包括對構成系統的元素的描述,對元素間交互的描述,對元素間組成模式的描述,以及對模式上的約束的描述。實現抗衰或自愈的軟件系統展示了能在運行時自適應以應對資源變動,系統故障等情況的能力,這種能力恰好是建立在這種對于軟件系統的高層抽象上的。
二、系統性能的監控和采集
系統性能的監控和性能數據的采集是實現系統抗衰的數據來源,是一個必不可少的環節,因此需要設計一個能適應于分布式計算環境,并且盡可能少的干擾所監控計算節點,可擴縮的性能監控工具。
目前軟件系統正變的越來越復雜,龐大,能夠反映出系統性能的參數有成千上百,為了能夠實時的獲悉軟件系統所處的狀態,需要高頻率的采集性能參數數據,這對監控工具的性能數據采集、編碼、傳輸、存儲提出了更高的要求。此外,隨著軟件抗衰粒度的細化,僅有系統級的監控已經不能滿足要求,因此需要監控工具能夠實現進程級,甚至于線程級的性能監控,從而為細粒度的抗衰策略的研究提供數據支持。
度量系統性能狀況的資源耗費參數有很多,各種資源耗費參數對于整體性能的影響是各不相同的,因此還需要對所確定的資源參數的權重進行分析。要確定可以衡量一個計算系統的性能的系統資源參數已不是很容易的問題,要分析其權重給出一個計算系統的合理的評價標準便更加困難,目前尚未檢索到有關這方面的研究報告,但是這方面的工作是非常必要的,它會影響到后期的策略制定。
三、系統性能衰退的檢測和量化
軟件系統運行時的狀態像人的狀態一樣可粗略的劃分為“健康”,“亞健康”和“不健康”等三大狀態,狀態劃分的標準以及如何來量化是需要解決的問題。因為它是抗衰策略的制定和實施的重要依據;同時“不健康”狀態有著一個比較龐大的范圍,也需要進一步細化,需要細粒度的刻畫衰退狀態,劃分衰退的范圍,為細粒度的抗衰提供支持。目前這方面的研究主要是通過檢測軟件系統資源的占用和釋放情況、服務的響應時間和響應率來驗證軟件衰退出現,但不能給出進一步更為細致的量化。
四、系統性能的預測
軟件系統的實時性能狀態能通過選擇性能參數來刻畫,通過性能衰退的檢測和量化確定,但光有系統狀態的歷史數據和實時數據對于軟件抗衰是不夠的,這是因為軟件系統未來的負載信息和性能狀態對于抗衰決策的制定同樣有著重要的影響,需要根據它們做出合理的抗衰決策,從而降低抗衰成本,同時提高可用性。目前這方面的研究工作主要集中是采用線性預測方式預測各種系統資源耗盡的時間估計,這種方式往往難于刻畫真正的衰退趨勢,誤差較大,因此有必要開展這方面的研究工作,提出符合精確性更高的預測方式。
五、軟件抗衰策略決策
軟件抗衰的目的是提高系統的可靠性,提供持續高質量的服務,同時降低服務的維護成本,因此軟件抗衰的時間決策和抗衰粒度決策是值得研究的重要內容?顾r間的選擇會極大地影響抗衰系統,如果在系統負載高峰期實施,可能帶來較低的服務率,如果過早的實施,可能增加抗衰成本,過晚的實施,可能需要采用更高粒度的抗衰,也增加抗衰成本。由于在抗衰期間實施抗衰的部分不能正常提供服務,抗衰粒度的選擇又影響了抗衰成本和可用性。抗衰粒度過小,可能抗衰帶來的性能改善不明顯,需要頻的實施抗衰;粒度過大,抗衰實施期間造成的服務不可用時間較長。目前抗衰策略的決策研究工作基本上基于預先假設的狀態轉移概率和單位時間下各種粒度的抗衰成本,通過公式推導出能獲得最大的可用性、最低的抗衰成本的抗衰時間間隔。這種通過分析模型來基于很多假設得出的抗衰決策,在理論上講得通,而很難應用于實際系統抗衰的決策過程中。鑒于上述分析,有必要開展抗衰決策方面的研究工作,使得能夠做出適時適度的抗衰決策。
六、抗衰實施技術
直觀上解決衰退問題最有效的途徑是重啟整個系統,恢復到初始狀態,不能輕易選擇這種方式的理由是高的抗衰成本和低的系統可用性。因此,目前抗衰實施技術的研究主要集中在微重啟技術和遞歸重啟技術等方面,研究的目的就是以最小的抗衰粒度來到達抗衰目的、提高系統可用性,無論是微重啟,還是遞歸重啟技術,研究的難點都在于獲取模塊之間的關聯關系,而關聯關系的獲取可能來自靜態的系統體系結構視圖,也可能來自系統運行時的反射。對于有完整的設計文檔的系統,問題變得很簡單,只需把文檔作為輸入就能解決問題,然而對于缺乏設計文檔的系統,需要在運行時建立模塊之間的關聯關系,這也是研究的難點。
七、結語
計算系統自身總體結構的復雜化傾向己使人難以直接進行系統性能的衰退檢測和防護,因此需要研究一種新的技術—軟件抗衰技術。它能夠擺脫人的干預,自動地檢測和分析計算系統性能,并在性能出現衰退時及時采取必要的措施。該技術實施的關鍵是性能檢測與分析和抗衰策略的制定。應用了軟件抗衰技術的計算系統在運行時能自主地維持其高性能,為系統的高可信賴、高性能和高可靠性提供有力的保證。
【淺論當前軟件抗衰技術中存在的幾點問題】相關文章:
當前我國部門預算改革中存在的問題及建議03-25
淺論經濟責任審計中存在的問題及對策03-02
探析當前英語口語教學中存在的問題及策略03-18
抽樣取證的意義及當前存在的問題11-22
當前企業成本管理存在的問題及對策01-06
當前企業資產重組過程中存在的問題與對策03-21
淺析當前課堂閱讀教學存在的問題03-21