證據(jù)理論和神經(jīng)網(wǎng)絡(luò)結(jié)合的診斷方法
證據(jù)理論是一種尚未成熟的方法,對(duì)它的研究方興未艾,雖然存在一些缺點(diǎn),但是其在不確定性推理方面的優(yōu)良性能,使其在模式識(shí)別、故障診斷等許多方面得到了越來(lái)越廣泛的應(yīng)用。
本文闡述Dempster.Shafer證據(jù)理論的基本原理、兩個(gè)證據(jù)和多個(gè)證據(jù)的合成方法、基于證據(jù)理論的三種決策方法。最后在分析神經(jīng)網(wǎng)絡(luò)和證據(jù)理論優(yōu)缺點(diǎn)的基礎(chǔ)上,提出了神經(jīng)網(wǎng)絡(luò)和證據(jù)理論集成的數(shù)據(jù)融合故障診斷方法。
一、信度函數(shù)
1.識(shí)別框架
證據(jù)理論討論一個(gè)辨識(shí)框架。(Frame of Discernment),它是關(guān)于命題的相互獨(dú)立和可窮舉的可能答案或假設(shè)的一個(gè)集合,一般為有限集合。
選取依賴于我們的知識(shí)和認(rèn)識(shí)水平。當(dāng)一個(gè)命題對(duì)應(yīng)于該框架的一個(gè)子集時(shí),稱框架能夠識(shí)別該命題。按傳統(tǒng)方法可以把0的冪集表示為2e,它是所有子集的集合(如果0有Ⅳ個(gè)元素,那么2e就有2個(gè)元素)。
2.基本信度分配與信度函數(shù)
二、證據(jù)理論的優(yōu)缺點(diǎn)
證據(jù)理論具有以下一些優(yōu)點(diǎn):
1)證據(jù)理論具有比較強(qiáng)的理論基礎(chǔ),既能處理隨機(jī)性所導(dǎo)致的不確定性,又能處理模糊性所導(dǎo)致的不確定性。
2)證據(jù)理論可以依靠證據(jù)的積累,不斷縮小假設(shè)集。
3)證據(jù)理論能將“不知道"和“不確定”區(qū)分開。
4)證據(jù)理論可以不需要先驗(yàn)概率和條件概率。而主觀貝葉斯方法卻需要假設(shè)的先驗(yàn)概率和條件概率。
5)證據(jù)理論能在不同層次上組合證據(jù),而貝葉斯方法要求有統(tǒng)一的識(shí)別框架。
證據(jù)理論的主要缺點(diǎn)是:
1)證據(jù)理論具有潛在的指數(shù)復(fù)雜度。
組合兩個(gè)證據(jù)主要要作m×m次相乘,所以計(jì)算復(fù)雜度為2“X2“,組合k個(gè)證據(jù)的計(jì)算復(fù)雜度為k×2“×2“。可見,利用D.S公式合成證據(jù)的計(jì)算復(fù)雜度與證據(jù)個(gè)數(shù)k呈線性關(guān)系,與假設(shè)集的模n成指數(shù)關(guān)系。
2)在推理鏈較長(zhǎng)時(shí),使用證據(jù)理論很不方便。這是因?yàn)樵趹?yīng)用證據(jù)理論時(shí),必須首先把相應(yīng)于每個(gè)步驟和證據(jù)的信度函數(shù)變換成一個(gè)一般的識(shí)別框架,然后再應(yīng)用Dempster組合規(guī)則。當(dāng)推理步驟增加時(shí),由于最后結(jié)果的信度函數(shù)的焦元結(jié)構(gòu)的復(fù)雜性也相應(yīng)增加,所以Dempster規(guī)則的遞歸應(yīng)用就會(huì)十分困難。
3)Dempster組合規(guī)則具有組合靈敏性。有時(shí),給基本信度分配一個(gè)很小的變化都可能導(dǎo)致結(jié)果很大的變化。此外,使用Dempster組合規(guī)則,要求證據(jù)是獨(dú)立的,這個(gè)要求有時(shí)使用起來(lái)很不方便。
三、證據(jù)理論和神經(jīng)網(wǎng)絡(luò)集成的數(shù)據(jù)融合診斷方法
人工神經(jīng)網(wǎng)絡(luò)是模仿大腦神經(jīng)元結(jié)構(gòu)特性而建立的一種非線性動(dòng)力學(xué)系統(tǒng),它由大量的簡(jiǎn)單的非線性處理單元高度并聯(lián)、互連而成,具有很強(qiáng)的數(shù)學(xué)模擬能力。它以分布存儲(chǔ)、并行處理性、容錯(cuò)性、自學(xué)習(xí)、自組織和自適應(yīng)性,避免了復(fù)雜的建模過程,在故障診斷領(lǐng)域也得到越來(lái)越廣泛的研究。它在診斷領(lǐng)域的應(yīng)用主要集中在三個(gè)方面:一是從模式識(shí)別的角度應(yīng)用神經(jīng)網(wǎng)絡(luò)作為分類器進(jìn)行故障診斷;二是從預(yù)測(cè)角度應(yīng)用神經(jīng)網(wǎng)絡(luò)作為動(dòng)態(tài)預(yù)測(cè)模型進(jìn)行故障預(yù)測(cè);三是從知識(shí)處理的角度建立基于神經(jīng)網(wǎng)絡(luò)的診斷專家系統(tǒng)。在所有應(yīng)用的神經(jīng)網(wǎng)絡(luò)中,BP網(wǎng)絡(luò)應(yīng)用最為廣泛,也取得了良好的效果。證據(jù)理論以其對(duì)不確定性推理的優(yōu)良特性,也已經(jīng)在各種故障診斷中被廣泛應(yīng)用,并且與模糊技術(shù)等得到了結(jié)合運(yùn)用。
但BP神經(jīng)網(wǎng)絡(luò)診斷存在著其固有的缺陷。首先,正確的診斷需要大量的樣本訓(xùn)練集,而實(shí)際中神經(jīng)網(wǎng)絡(luò)訓(xùn)練的大量樣本獲得是困難的,由此造成了神經(jīng)網(wǎng)絡(luò)記憶的診斷知識(shí)存在先天性缺陷;其次廣泛用于BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練的梯度下降訓(xùn)練算法,存在訓(xùn)練速度慢的缺陷,并且隨著網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜度的增加訓(xùn)練時(shí)間顯著增加;再次由于網(wǎng)絡(luò)結(jié)構(gòu)的各項(xiàng)參數(shù)都是根據(jù)經(jīng)驗(yàn)進(jìn)行選擇,所以很難保證選取的得當(dāng),網(wǎng)絡(luò)的學(xué)習(xí)和泛化能力難以保障;再者當(dāng)系統(tǒng)的診斷參數(shù)較多,征兆信息量很大時(shí),采用的樣本不可避免地存在矛盾性和隨機(jī)性,此時(shí)若將高維的征兆信息同時(shí)輸入到同一網(wǎng)絡(luò)處理,不但訓(xùn)練時(shí)間長(zhǎng),而且訓(xùn)練效果差,有時(shí)甚至導(dǎo)致網(wǎng)絡(luò)不收斂,這些都極大影響了神經(jīng)網(wǎng)絡(luò)的診斷效果。
為了克服神經(jīng)網(wǎng)絡(luò)的缺陷,可以如同人腦中不同區(qū)域處理不同的信息一樣,不同的信號(hào)也應(yīng)由各自的神經(jīng)網(wǎng)絡(luò)來(lái)診斷,這樣就能將高維的征兆空間分解為較低維的征兆空間。將復(fù)雜的網(wǎng)絡(luò)變成簡(jiǎn)單的網(wǎng)絡(luò),由不同的神經(jīng)網(wǎng)絡(luò)處理不同的低維征兆空間得到診斷結(jié)果,因此簡(jiǎn)化了網(wǎng)絡(luò)結(jié)構(gòu),提高了網(wǎng)絡(luò)訓(xùn)練的速度。因?yàn)楹?jiǎn)單的網(wǎng)絡(luò),只處理問題的某一方面,樣本容易獲得、結(jié)構(gòu)容易確定,訓(xùn)練的速度可以提高,網(wǎng)絡(luò)的泛化能力增強(qiáng),診斷效果有保證??墒沁@樣并沒有充分利用不同征兆空間(在證據(jù)理論中成為證據(jù)空間)的信息。因此為了充分利用這些信息,可以對(duì)各子網(wǎng)絡(luò)的診斷結(jié)果利用證據(jù)理論進(jìn)行故障信息的融合處理。
而且證據(jù)理論的基本信度分配,是專家在所獲證據(jù)的基礎(chǔ)上,根據(jù)個(gè)人的經(jīng)驗(yàn)對(duì)識(shí)別框架中不同命題的支持程度的數(shù)字化表示,主觀性很強(qiáng)。因此,對(duì)同一個(gè)證據(jù)對(duì)同一個(gè)命題不同的專家會(huì)給出不同的信度分配,有時(shí)差別很大。為了更客觀地得到一證據(jù)對(duì)不同的命題的支持度的大小,可以將各個(gè)獨(dú)立的低維的神經(jīng)網(wǎng)絡(luò)作為證據(jù)理論的一個(gè)證據(jù),并把低維神經(jīng)網(wǎng)絡(luò)的輸出值轉(zhuǎn)化作為辨識(shí)框架上命題的基本可信度。經(jīng)過證據(jù)理論的再次融合,類似于神經(jīng)網(wǎng)絡(luò)對(duì)信號(hào)層面數(shù)據(jù)的特征提取后的特征值再加以融合,充分利用證據(jù)源的信息,將大大提高識(shí)別的準(zhǔn)確率,消除單一傳感器包含信息的不全面和模糊性,因?yàn)樽C據(jù)理論可以對(duì)多個(gè)證據(jù)都支持的判斷進(jìn)行加強(qiáng)。
根據(jù)監(jiān)測(cè)系統(tǒng)的情況把傳感器分成獨(dú)立的組,對(duì)每個(gè)測(cè)點(diǎn)的傳感器或傳感器組,對(duì)應(yīng)一個(gè)局部神經(jīng)網(wǎng)絡(luò)進(jìn)行局部診斷。這樣可以簡(jiǎn)化各個(gè)網(wǎng)絡(luò),網(wǎng)絡(luò)更小更簡(jiǎn)單,避免了單一診斷神經(jīng)網(wǎng)絡(luò)復(fù)雜的結(jié)構(gòu)形式,以及某一傳感器故障或數(shù)據(jù)源的錯(cuò)誤對(duì)整個(gè)診斷系統(tǒng)帶來(lái)的不良影響,診斷系統(tǒng)的容錯(cuò)性能增強(qiáng),其原理如圖6所示。
若診斷系統(tǒng)的診斷故障域?yàn)間個(gè)故障狀態(tài),對(duì)應(yīng)證據(jù)理論的識(shí)別框架0就包括g個(gè)故障狀態(tài)及系統(tǒng)的正常狀態(tài)。同時(shí),若系統(tǒng)共有p個(gè)局部診斷神經(jīng)網(wǎng)絡(luò),每個(gè)網(wǎng)絡(luò)對(duì)應(yīng)的輸出同樣為g+1個(gè),分別對(duì)應(yīng)g個(gè)故障狀態(tài)及系統(tǒng)的正常狀態(tài)。每個(gè)神經(jīng)網(wǎng)絡(luò)作為證據(jù)理論的一個(gè)獨(dú)立證據(jù),將神經(jīng)網(wǎng)絡(luò)的輸出值經(jīng)過變換,成為此證據(jù)下各種狀態(tài)的可信度分配,為證據(jù)合成奠定基礎(chǔ)。每個(gè)診斷網(wǎng)絡(luò)診斷的能力是不同的,因此每個(gè)網(wǎng)絡(luò)存在一個(gè)可靠性系數(shù)理(即證據(jù)的折扣),表示了對(duì)判定結(jié)果的信任程度。
征兆空間 故障空間
圖6神經(jīng)網(wǎng)絡(luò)證據(jù)理論診斷模型
設(shè)第i個(gè)網(wǎng)絡(luò)的第歹個(gè)輸出值,那么它對(duì)應(yīng)的在本證據(jù)的基礎(chǔ)上的對(duì)狀態(tài),的信度分配;所以經(jīng)過證據(jù)合成后各狀態(tài)的置信區(qū)間[Bel,P1],并由此進(jìn)行診斷狀態(tài)判斷。這里采用以下判決原則:
證據(jù)理論可以使多個(gè)證據(jù)都支持的命題合成后的信度提高,減小未知信度,從而減小判斷的模糊性,達(dá)到提高診斷準(zhǔn)確率的目的。
將證據(jù)理論和神經(jīng)網(wǎng)絡(luò)相結(jié)合應(yīng)用于故障診斷系統(tǒng)中就可以實(shí)現(xiàn)優(yōu)勢(shì)互補(bǔ)、揚(yáng)長(zhǎng)避短。神經(jīng)網(wǎng)絡(luò)和證據(jù)理論集成方法除具有一般神經(jīng)網(wǎng)絡(luò)的性質(zhì)和特點(diǎn)外,還具有一些特殊性質(zhì)。比如,由于采用了證據(jù)理論中的不確定性推理方法,避免了貝葉斯推理無(wú)法區(qū)分“不知道”和“不確定”信息,也不需要明確先驗(yàn)概率和條件概率。同時(shí)克服了證據(jù)理論基本信度分配主觀性過強(qiáng)的缺陷,這使得系統(tǒng)的診斷能力得到明顯加強(qiáng)。