- 相關推薦
發表:一類基于分級聚類的可解釋性模糊建模方法的研究(一)
摘 要 提出了一種基于兩級聚類算法的可解釋性模糊建模方法。首先指出模糊模型可解釋性的重要地位,分析影響可解釋性的主要因素;然后利用減法聚類和加權模糊C均值聚類算法辨識初始模糊模型,緊密/分離性函數確定最優劃分和模糊集合的相似性融合約簡初始模糊模型,從而提高其可解釋性;最后采用約束優化算法整體優化模型,提高其精度。通過對Box-Jenkins火爐數據的模糊建模,驗證了該方法的有效性。
關鍵詞 模糊建模,可解釋性,減法聚類,加權模糊C均值聚類
Key words fuzzy modeling, interpretability, subtraction clustering, weighted fuzzy c-means algorithm
引言
近些年來,基于規則的模糊建模以其眾多優點成為一個活躍研究的領域,并在仿真、分類、數據挖掘、模式識別、預測及控制等方面得到廣泛的應用。與神經網絡等模型不同,模糊模型的知識表達形式和推理機制符合人的思維習慣,可為人們所理解,成為模糊模型最顯著的特征。
在模糊建模中,一般要求所建立的模型既要有較好的擬合精度,又要有較簡單的模糊結構。目前,眾多聚類算法在模糊邏輯系統的結構辨識中得到了廣泛的應用,據此而得到的模糊結構往往以擬合精度作為指標,從而得到的模糊模型含有大量的冗余信息,泛化能力差,不具備可解釋性。
為了提高模糊模型的可解釋性,諸多學者進行了相關研究.文獻[7-11]給出了模糊模型可解釋性的一些必要條件。文獻[12-18]給出了提高模糊模型可解釋性的一些具體方法,包括模糊集合的相似性度量、正交變換和遺傳算法的規則約簡,全局與局部學習算法等。文獻[6]利用模糊聚類辨識含有冗余的模型,然后利用模糊集合相似性度量和相似性獎勵遺傳算法對模型進行迭代簡化,最后利用相似性懲罰遺傳算法整體優化模型。文獻[19]提出了一種新分級聚類算法,利用最近領域聚類算法和加權模糊C均值聚類算法辨識出較少的模糊規則,但沒有考慮模糊集合的相似性融合,同時最近領域聚類算法對于高維系統易產生維數災難。
本文提出了一種基于兩級聚類的可解釋性模糊建模方法。首先利用減法聚類算法對輸入輸出數據進行預處理;然后將一次聚類的聚類中心作為二次FCM聚類的樣本,并由緊密/分離性函數(XB)確定最優劃分,模糊集合的相似性融合約簡所得的初始模糊模型;提高其可解釋性;最后采用梯度下降算法整體優化模型。Box-Jenkins火爐數據的模糊建模,驗證了該方法的有效性。
預備知識
TS模型
Takagi和Sugeno[22]于1985 年提出了著名的TS模糊模型,是一種被廣泛使用的模糊模型,其典型規則形式如下:
(1)
其中Ri表示第i條模糊規則,xj為輸入變量,Aij為定義在輸入論域中的隸屬函數,可以取三角形、高斯型、梯形或者鐘型等.本文采用高斯型隸屬函數:
(2)
其中分別代表函數的中心和方差.
TS模型的輸出為所有規則輸出的加權平均:
(3)
其中pi是第i條規則的激勵強度:
(4)
對于數據{xk, yk | k=1, …, N},式(3)可以寫為線性回歸方程:
(5)
其中為規則后件參數矩陣,e為誤差矩陣.
TS模糊模型規則前件是模糊變量,而規則后件是輸入輸出線性函數,它以局部線性化為基礎,通過模糊建模實現了全局的非線性,能克服以往模糊模型的高維問題,已經成為一種被廣泛使用的模糊模型.
模糊模型的可解釋性
模糊模型的可解釋性問題在九十年代末期,開始得到部分研究學者的重視[7-21]。2000年4月,在ERUDIT“關于模糊系統與技術的未來”專題學術討論會上,Babuska R等人建議將模糊建模研究的焦點由精確性轉移到可解釋性上,標志著模糊模型可解釋性研究的重要里程碑[24]。
模糊模型的可解釋性是指模型的輸入輸出接口形式、模型結構形式、數據處理形式等符合人的思維,可以直接或者通過簡單分析來表達和洞察系統內部的運行機理,從而獲得對系統深入的認識。
一般認為,模糊模型的可解釋性,與模型結構、輸入變量和模糊規則數目、隸屬函數特性等密切相關,現將主要因素陳述如下[7-11]:
1) 輸入變量數目:人們很難通過高維模糊模型來分析系統行為,因此模糊模型應該采用盡可能少的輸入變量.
2) 模糊規則數目:模型的規則數目越多,其可解釋性越低.經驗認為,可解釋的模糊模型,其規則數目不超過10個,這是由人在理解、推理時的思維能力所決定的.
3) 模糊規則庫的完整性、一致性和精簡性:模糊規則要完整覆蓋輸入論域,對每一有效的輸入變量組合,至少有一條模糊規則被激勵,即完整性。模糊規則之間必須相容而不能有任何兩條規則相互矛盾,即一致性。在規則數目盡可能小的前提下,不能包含冗余規則,如某規則的前件是另一規則的子集等,即精簡性。
4) 隸屬函數的特性:隸屬函數必須是凸和正規的,常用的三角函數、高斯函數等都滿足這兩個要求。隸屬函數劃分必須是完備的,即對于任何的輸入變量,在其論域內的任何值,至少有一個隸屬函數相對應,在形式上表現為隸屬函數之間存在位置的交叉隸屬函數劃分必須是可區分的,即對于同一變量,隸屬函數之間存在明顯的位置區別,以便賦予一定的語義項。
可解釋性模糊建模
一次聚類
本文提出了一種基于兩級聚類的可解釋性模糊建模方法。首先利用減法聚類算法對輸入輸出數據進行預處理,起到精簡樣本,濾去樣本中重復信息的作用,減少了二次聚類算法中的迭代次數;然后將一次聚類的聚類中心作為二次加權FCM聚類的樣本,并由緊密/分離性函數(XB)確定最優劃分,模糊集合的相似性融合約簡所得的初始模糊模型;提高其可解釋性;最后采用梯度下降算法整體優化模型。
減法聚類算法思想為:考慮維空間的個數據點,不失一般性,假定數據點已歸一化到一個超立方體中。每個數據點都是聚類中心的候選者,則數據點處的密度指標定義為:
(6)
如果一個數據點有多個鄰近的數據點,則該數據點具有高密度值,半徑定義了該點的一個鄰域,半徑以外的數據點對該點的密度指標貢獻甚微。在計算每個數據點指標后,選擇具有最高密度指標的數據點為第一個聚類中心,令為選中的點,為其密度指標。的密度指標可用下式修正:
(7)
顯然,靠近第一個聚類中心的數據點的密度指標將明顯減少,從而使這些點不太可能選為下一個聚類中心。修正了每個數據點的密度指標后,選定下一個聚類中心,再次修正數據點的所有密度指標。當新聚類中心對應的密度指標與相比小于某個給定值時
(8)
則聚類過程結束,提取聚類中心聚相應的密度指標。
二次聚類
使用模糊C均值聚類算法進一步處理由一次聚類產生的聚類中心,因為這些聚類中心是由相應的密度指標所決定,所以在最后的模糊分區劃分時應考慮到相應樣本的密度指標的不同,為解決這個問題,使用加權模糊C均值聚類算法處理由一次聚類產生的聚類中心,相應的加權模糊C均值的目標函數為:
(9)
其中為最終的聚類數,為分區矩陣,是最后的聚類中心矢量,為模糊加權指數,是與初始聚類中心相關的加權量,由下式表示:
(10)
聚類的準則為取的極小值且約束條件為,最后所求的聚類中心和相應的隸屬度函數可用下式表示:
(11)
(12)
高斯型隸屬函數的方差可以通過計算模糊協方差矩陣來獲得:
(13)
(14)
一旦確定了模糊模型前件的參數,即可利用最小二乘法估計模糊模型的后件參數。
加權FCM算法:
Step1:選擇聚類數,加權指數,和聚類中心的初始值。
Step2:使用公式(12)計算隸屬度函數值。
Step3:利用公式(11)計算更新聚類中心的值。
Step4:如果,則停止,否則轉到Step2。
模糊規則數目的確定,即在模糊聚類中確定聚類的數目,是模糊建模的一個首要問題。聚類有效性分析就是尋找最優的聚類數目,文獻[30]提出的緊密/分離性函數(XB:Xie-Beni index)利用了隸屬函數信息和數據本身的信息,本文使用加權緊密/分離性函數,其最小值對應最優的聚類數目,對模糊指數m的魯棒性強,融合了數據的幾何結構信息:
(15)
模糊集合的相似性融合
經過兩級聚類算法和最小二乘估計得到的初始模糊模型,其隸屬函數(模糊集合)可能存在冗余,表現為模糊集合間存在過度的交叉或重疊,從而難以賦予相應的語義值,降低了模型的可解釋性,因此需要對每個變量的隸屬函數進行相似性分析和融合.
模糊模型的隸屬函數存在三種類型的冗余:第一種是兩個隸屬函數相似,這是最常見的模糊集合冗余形式;第二種是隸屬函數以較大值覆蓋整個論域;第三種是隸屬函數接近于單點集合。
第三種的隸屬函數冗余,由于其不存在可解釋的實際意義,一般在對應的規則前件中直接去除即可。對于第二種的隸屬函數冗余,在去除該規則后,建模誤差在允許范圍內,則為了提高可解釋性,可將該規則刪除,實現規則約簡,否則保留該規則。
第一種冗余,本文采用相似性測度來評判兩個隸屬函數的相似性。對模糊集合A和B,其相似性測度定義如下[34]:
(8)
其中表示集合的基數,和算子分別表示集合的交和并。
對于離散論域X={xk | k=1, …, N},式(22)表述如下:
(9)
其中和分別為最小最大算子。S為定義在[0,1]間的相似性測度,S=1表示兩個集合完全相等,而S=0意味著兩個集合沒有交叉或重疊.
如果兩個模糊集合A和B的相似性測度大于預先設定的閾值,那么集合A和B可以融合為新的集合C.對于不同形式的隸屬函數,確定集合C的具體方法不同,但其共同遵循的原則是集合C的支集是集合A與B的并集,集合C的核是集合A與B核的加減聚合.如對于梯形隸屬函數A(a1,a2,a3,a4)和B(b1,b2,b3,b4),融合生成的新的模糊集合為C(c1,c2,c3,c4):c1=min(a1,b1),c2=0.5(a2+b2),c3=0.5(a3+b3),c4=max(a4+b4) .
對于本文所采用的高斯型隸屬函數,由集合A和B融合生成的新集合C的參數如下:
(10)
閾值的大小直接影響模糊模型的性能,閾值越小,得到的模型的精度越低而可解釋性越高,一般閾值取[0.4 – 0.7],具體可根據實際系統的要求選擇。
模糊集合融合過程需要反復迭代進行.在每一次迭代過程中,對每一個變量的所有模糊集合進行兩兩相似性分析,相似性測度大于閾值的兩個模糊集合融合為新的集合.迭代反復進行,直到沒有任何兩個模糊集合的形似性測度大于閾值,然后再將第二類和第三類模糊集合刪除,從而完成整個模糊集合的相似性融合過程。
模糊模型的整體優化
初始模糊模型集合相似性融合,提高了模型的可解釋性,但同時降低了模型的精確性,因此采用梯度下降優化算法,提高模型的精度,為保持模型的可解釋性,對梯度下降優化算法施加搜索空間約束。前件參數的變化范圍為,以保證隸屬函數的可區分性,后件參數變化范圍為,以保證模型的局部可解釋性不變。在優化過程中,當模型的參數大于其最大值(或小于其最小值)時,則將該參數強迫限定為其最大值(或最小值).參數變化范圍的確定,根據經驗,一般取4-15%之間。
【發表:一類基于分級聚類的可解釋性模糊建模方法的研究(一)】相關文章:
基于解釋性和精確性的模糊建模方法研究研究的目的與意義(一)03-07
基于網格的聚類方法研究03-13
發表化學教學類論文的方法12-11
基于內容的模糊圖像檢索技術研究03-18
基于模糊綜合評價的企業危機評價及決策研究02-27
品牌權益綜合模糊測評研究方法探討03-07
基于GSM網絡的一機多號類業務研究03-07
2013年護理類職稱論文發表的方法11-28