計算機聯鎖系統安全可靠性設計研究
聯鎖機是信號控制系統的核心,怎樣對計算機聯鎖系統安全可靠性設計?
【摘要】從計算機聯鎖系統在鐵路交通應用中的基本組成和基本功能著手,根據影響計算機聯鎖系統安全可靠性的一些關鍵因素,分析了在研制開發計算機聯鎖系統設備過程中所采用的改善和提高安全可靠性的幾種方法。
【關鍵詞】計算機聯鎖系統 安全可靠性 硬件 軟件
1 概述
計算機聯鎖系統的安全可靠性是研究、開發、生產計算機聯鎖設備必須遵循的永恒的主題,也是驗證計算機聯鎖系統性能的主要依據。計算機聯鎖設備是一種連續工作的實時系統,它必須具有極高的安全性和可靠性才能適應鐵路運輸和城市軌道交通高效和安全的運營要求。
其實汁算機聯鎖系統的安全性是指聯鎖設備在運行過程中無論發生什么故障都不能產生有可能危及列車安全運行的危險因素,一般著重于在不正常的情況下使系統導向安全,防止產生危險后果;而可靠性是指聯鎖設備在規定的時間和規定的條件下完成規定功能的能力,一般側重于防止或減少系統發生故障。顯然,安全性的實現是以可靠性為基礎,并在提高可靠性的前提下完成的。為了系統地分析問題,我們將把計算機聯鎖系統的安全性和可靠性結合在一起考慮,并著重從系統的硬件設計、軟件設計和數據傳輸及處理等幾個方面采取各種綜合技術措施,使計算機聯鎖系統符合故障—一安全的原則。
2 硬件部分的安全可靠性分析
根據計算機聯鎖系統的結構組成和功能特點,硬件部分的安全可靠性技術從計算機聯鎖系統的上位機、聯鎖機和接口電路三個部分進行分析。
2.1上位機安全可靠性分析
上位機主要功能是向聯鎖機構輸入操作信息,接受聯鎖機構輸出的反映設備工作狀態和行車作業情況的表示信息。為此上位機可采用經國際安全機構認證的高可靠工業控制計算機,摒棄原商用機所采用的大母板結構,把原來的大底版(系統板)功能集中在一塊all--in--one插卡上,底板變成無源總線母板,增加了插槽數,便于系統的升級擴展。
采用的機箱結構具有良好的散熱、隔熱、防潮、防塵性能,驅動器架采取避震措施,使整個機箱具有可靠的機械強度和很好的抗電磁干擾的能力;采用不問斷供電及凈化的專用開關電源,抗共模干擾,具有浪涌保護、過載保護、漏電保護的功能,單機設備的平均無故障工作時間可達到100000h。
計算機聯鎖系統的維修機和上位機的配置是一致的,平?勺鳛樯衔粰C的熱備機,在系統故障時能夠進行自動無擾切換,切換過程不影響現場設備狀態,提高設備可靠性。
上位機的人機接口界面的設計使用先進的工業控制軟件,使得系統的監控不僅具有友好的人機交互界面,而且具有豐富的圖形畫面顯示及圖形操作功能,調圖方式靈活,修改參數方便。在設計中,根據鐵路交通和城市軌道交通信號計算機聯鎖的特點,可以靈活運用登錄口令、操作員權限、安全設定點、設定點口令、安全審計跟蹤記錄等安全特性,確保聯鎖系統執行操作的安全可靠。
2.2聯鎖機安全可靠性分析
聯鎖機是信號控制系統的核心。在設計中,可選用國際安全機構認證的硬件三重冗余計算機聯鎖系統,用于實現聯鎖數據處理過程的故障—安全。所謂三重化冗余系統是指系統共有a、b、c三個相同的主機,每個主機可以把它看成系統中的一個模塊。三個模塊同時執行一致的操作,其輸出送到“表決器”的輸入端,然后把表決器的輸出作為系統的輸出。結果經輸出設備三取二表決后進行輸出,可以保證輸出的安全性。當其中一個聯鎖處理單元聯鎖邏輯單元故障時,系統能夠轉換為二取二工作方式,在不降低安全陛的前提下,使整體系統的可靠性得到提高。
采用三取二表決系統原本是為了提高系統的可靠性而采取的一種冗余系統。然而從安全性角度來看,若有兩個主機發生了同樣的故障,即共模故障,系統將輸出錯誤信息,經接口驅動后,有可能危及行車的安全。因此,必須消除軟硬件的設計錯誤,當主機的設計完全正確無誤時,僅由硬件失效和干擾而產生的共模故障的發生概率就很小。為了進—步降低未檢出故障的組合而產生共模故障的可能性,可利用單機自檢技術、主機間互檢技術和雙套不同的軟件,擴大故障檢測范圍,消除因干擾而引起的影響。
為了保證三重化冗余系統能夠通過多數一致表決得到正確的結果和發現出錯的模塊,這就要求三臺微機必須同步工作。否則,整個系統便會出現紊亂狀態,多數一致表決無法進行,系統無法保證正?煽康墓ぷ鳌
計算機聯鎖系統為保證安全可靠而采取的主要措施是:全面的在線自診斷和專門的安全檢查程序。這就要求系統在規定的周期內對計算機的運算器、存儲器、接口等元器件用一系列自診斷程序進行全面自診,而安全檢查程序則對聯鎖程序任務模塊的運行狀態進行監視,對關鍵信息代碼的合法性進行檢查。在自診斷和專門的安全檢查中一旦發現故障,立即切斷計算機的輸出(同時報警)。在設計中必須采取有效的措施來確保:
(1)檢測過程本身應具有安全性,或采用相應硬件及軟件措施來實現安全性;
(2)檢測要要有足夠的頻率,使類似或等同故障在二次檢測之間不會發生;
(3)檢測要足夠靈敏,能夠測出每個安全單元之中的重要故障;
(4)檢測失敗時應及時產生安全保護動作;
(5)冗余裝置要足夠獨立,使之不受其他故障的影響。
例如在具體實施中,使輸出控制單元經過表決后輸出,所有輸出進行反饋檢查閉環控制;在輸出執行環節采用條件電源供電方法,當用實時檢測或實時比較技術發現聯鎖微機內部故障時,即使產生危險側的錯誤控制命令,通過強制切斷執行環節的條件電源,減少錯誤的控制命令輸出。
采用光電隔離技術,接點輸入電路要經過光電耦合后力節目接至接口電路輸入輸出模塊,有效的抑制接點輸入電路的電磁干擾;采用靜態輸入或動態輸入方式,以便有效的實現故障—安全原則。
在輸出接口的設計中,采用代碼—動靜態和動靜態—電平兩級變換電路;采用不間斷供電及凈化的專用電源,電源模塊內部設有雙重化電壓調整器及自診斷電路,可檢測電壓的輸出范圍與是否超溫并給出相應報警。
2.3 接口電路安全可靠性分析
由于一般繼電電路采用的重力式安全繼電器具有很高的安全性,在我國鐵路中運用了幾十年,為此計算機聯鎖系統的接口電路仍然以安全繼電器作為計算機聯鎖機構與室外設備控制電路的接口。我們知道安全繼電器通過以下技術實現故障—一安全:電氣接點采用特殊材料制作,使接點粘連的可能極小;采用吹弧技術,消除接點拉弧造成熔接;采用重力式設計原理,在繼電器故障時,利用其重力使銜鐵復位,從而保證實現系統的故障——安全的目的。
為此在計算機聯鎖系統中,信號、道岔、軌道電路等監控對象的狀態信息依然是用安全型繼電器的接點狀態來反映的,輸人接口的任務就是將這種電平形式的二值邏輯數據安全地采集到聯鎖機中來。
2.4 其他方面的安全可靠性分析
考慮計算機聯鎖系統硬件設備的其他方面的安全可靠性,對包括電源、計算機、數據通訊線路、輸人輸出接口、機架結構及地線設置等方面采取了電磁兼容設計和防雷設計,以保證在規定等級的運用環境中,設備必須正常工作,不產生任何指標下降和功能上非期望值的偏差。
3 軟件系統的安全可靠性分析
在計算機聯鎖控制系統里,各種復雜的功能主要依靠軟件來實現。嵌入在安全控制系統中的軟件,不僅要能完整地實現系統的控制功能,還要能保證實現系統在發生意外時的安全防護即故障—一安全功能。
一般在汁算機聯鎖控制系統中,普遍采用以下軟件技術來提高系統的安全可靠性:
(1)采用信息編碼技術,以便出錯時能被及時識別。例如,對于涉及行車安全的邏輯變量,用多元代碼來表示安全變量的兩個值—一安全側值和危險側值。這樣,當代碼在存儲或傳輸過程中,由于存儲器硬件故障或者外界干擾而發生畸變,一旦錯成非法碼時,就可由軟件自動檢出并導向安全側。
(2)采用軟件冗余技術,保證軟件運行的安全性。
(3)采用軟件檢測技術及時發現故障,以進一步采取措施防止危險側信息的發生和輸出。
(4)利用軟件對輸人數據的合理性進行檢查,劉輸出的控制信息進行反饋重復檢查等等。
圖1是一個從安全角度去考慮的計算機聯鎖系統的框圖,實際上也是計算機聯鎖系統的一個安全性模型,只是僅從保障安全的角度把計算機聯鎖系統描述成為一個典型的數據處理系統。對于計算機聯鎖系統來說,保障安全就是保障框圖中的數據流和控制流這兩種信息處理的安全;退一步講,即便信息處理發生錯誤也不會導致危險的后果。
聯鎖機和外部設備的輸入/輸出信息具有兩種特性,—是開關性;二是安全性。外部設備向聯鎖機提供的輸入信息具有開關性。同樣,聯鎖機的輸出信息也具有開關性,這種開關性可由表示兩個狀態的器件如繼電器來反映。輸入/輸出信息的安全性是根據信息與行車安全的關系來界定的。一類是與安全無關的信息,稱作非安全信息;另一類是與安全有關的信息,稱作安全信息。
聯鎖機和監控對象之間交換的信息屬于安全信息,因此必須考慮當輸凡輸出通道發生故障時,一定要確保傳送信息的安全。為此,在通道設計上必須采用安全輸凡輸出接口。在cpu與輸入和輸出模塊間采用專用總線以保證傳送的正確性,對輸入電路采用光電隔離電路讀取。輸入值,以檢測“粘連”狀態,對各個輸出信號在提供給繼電器前進行表決,不致因輸出模塊本身的故障而影響信息安全。一般在具體的系統設計中,可采取如下措施:
(1)安全信息的輸入:在計算機輸出每種信號設備狀態碼的第一位后,待輸出電平穩定(如20ms),再將每種信號設備狀態碼的第一位讀入儲存,并立即輸出第二位代碼;讀入全部代碼后,經計算機整理后再傳給每個對象的存儲模塊。
(2)安全信息的存儲與更新:計算機聯鎖中監視現場設備狀態的存儲單元,在宏觀上必須與被監視的對象建立不斷的聯系,當聯系中斷時,系統必須立即倒向安全。
(3)安全信息的運算:聯鎖條件滿足時,程序的走向和運算結果都是預知的。為了提高安全性和防止漏檢查聯鎖條件,在每次判斷條件成立后,將該條代碼進行按位累加,聯鎖關系全部檢查正確時,其累加值應與預期結果相符。
(4)安全信息的輸出:計算機的開關量的輸出是非故障安全的。為了保證安全,可對輸出環節進行連續的監視,如出現不應有的危險側輸出,應快速地在現場設備未動作前予以切斷。
(5)安全信息在計算機間的傳遞:為了符合信號系統的傳統做法,遵循故障安全的要求,在計算機聯鎖的設計時,應采用點對點的循環傳送方法,而不采用變化檢出、一次傳送的方法。
計算機聯鎖的串行數據在傳輸過程中,由于干擾而引起誤碼是難免的,在檢查數據位和冗余位之間的關系是否正確時,應著重防止在傳輸中錯誤地出現危險側代碼。為了確保信息傳輸的安全可靠,一方面可以采用冗余度小、檢錯能力高的循環碼(crc)作為檢錯碼;另一方面就是在軟件編程時對傳輸的信息進行特殊編碼,并以反饋重發方式糾錯。
根據編碼理論,利用n位二值碼元可生成一個具有2”種伏態的碼字或代碼的集合。在這2”種狀態的代碼組合當中,僅取一種狀態代表危險側碼字(例如用危險側碼字10101 010代表對應繼電器吸起),再取另一種狀態代表安全側碼字(例如用安全側碼字01 010101代表對應繼電器落下),其余的均認為是非法碼字,則這種代碼便具有典型的故障—一安全特性。由于非法碼字在正常的聯鎖運算時也被認做安全側碼字,故而該編碼組合僅有1種碼字對應危險側,其余2“—1種狀態均對應安全側。但在實際的運行中要真正能做到故障導向安全,還需對軟件編程的安全編碼進行科學的分析和認真的考慮。
我們認為編碼中各個碼元發生差錯的概率是相同的且不同碼元發生差錯的事件是獨立的。假定每一碼元發生差錯的概率是",則無差錯的概率即為1—p,此時整個代碼均無差錯的概率為(1—p)“。當選用編碼組合中碼距最大的一對代碼,即碼距等于n的—對代碼分別作為代表危險側和安全側的有效碼時,安全側代碼因故畸變成危險側代碼的條件是n個碼元同時出錯,其出錯概率為曠;而安全側代碼出錯變為另外一個代碼的概率則為1—(1—p),顯然這兩個概率有著明顯的數量的不同,這就造成了編碼在故障或受到干擾情況下邏輯出錯的不對稱性,假定2“種編碼中任一個發生畸變、出錯變為另外任一個代碼的概率相同,均為p(c);此時,因危險側代碼只有—個,某一代碼錯為該代碼的概率即為戶(c)以上數值與目前國內外廣泛使用的信號安全型繼電器的不對稱指數相比顯然是可以認可的;同時n取為16,恰好是計算機內存字節的整數,便于進行軟件編程。根據鐵道部《計算機聯鎖技術條件》標準,與行車安全有關的信息在計算機內必須以空間冗余的方式存儲,在自由狀態下其非法碼字和合法碼字出現的比率或非安全側碼字和安全側碼字出現的比率必須大于255:1,上述規定中所謂空間冗余即意味著必須用多余的信息位表示單一比特的信息,采用不對稱碼元的方法表示涉安信息即為空間冗余方法之一。此外,自由狀態即指任一代碼發生畸變而成另一代碼相同概率p(c)的假設。該條件給出的具體數值則意味著如采用不對稱碼元,則所選代碼位至少為n:8;谶@些原因,計算機聯鎖中選用16位代碼來表示聯鎖數據是可取的。經過正確的合理編碼,完全可以保證編碼的漢明距大于4。
4 結 論
計算機聯鎖系統的安全可靠性是計算機聯鎖系統的關鍵,我們必須從系統的硬件設計、軟件設計和數據傳輸及處理等幾個方面采取各種綜合技術措施,才可使計算機聯鎖系統符合故障—一安全的原則。
綜合以上分析和考慮,并通過可估算和推導的數學方法進行可靠性和安全性計算機聯鎖系統的安全可靠性指標:平均故障間隔時間mtbf為1x10h,平均危險側故障間隔時間mtbfas為1x10h,符合國家標準。
參考文獻
[1] 吳汶麟城市軌道交通信號與通信系統.北京:中國鐵道出版社,
[2] 吳芳美,鐵路安全軟件測試評估,北京:中國鐵道出版杜,2001
[3] 趙志熙.計算機聯鎖系統技術北京:中國鐵道出版社,1999
[4] tb/t3027--2002.計算機聯鎖技術條件
[5] tb/t2307--1992.電氣集中各種結合電路技術條件
[6]鐵路控制和防護系統軟件railwayapplication:softwareforrailwaycontrolandprotectionsystem,feburaryl994.en50128
[7]快路安全電子系統railwayappllcatlon:safetyrelatedelectronic,bn50129
【計算機聯鎖系統安全可靠性設計研究】相關文章:
計算機遠程控制系統的可靠性設計研究01-18
談談計算機網絡可靠性優化設計策略研究03-12
提高煤礦供電安全可靠性綜合措施研究11-24
硬齒面齒輪結構可靠性虛擬疲勞設計11-16
淺談計算機軟件可靠性設計的認識11-21
現代路橋設計研究03-28
- 相關推薦