




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、武漢理工大學碩士學位論文非線性系統的模糊辨識方法與應用研究姓名:楊建林申請學位級別:碩士專業:機械制造及其自動化指導教師:黃之初20051001摘要模糊模型是當前系統辨識方法中經常用到的模型,它具有能夠有效地綜合利用專家知識和系統的輸入輸出數據的能力,并且得到的模型相對其它黑箱模型來說具有可解釋性。目前為止,已經有很多模糊建模方法被提出來,然而,仍然存在著許多待解決的問題。本文中,將研究的問題集中在下面三個方面:模糊模型的結構辨識,模型的精確性和可解釋性問的平衡,模型的參數辨識:一、模型的的結構辨識和參數辨識。在這里采用模糊均值聚類的方法從數據中獲取模糊規則前提部分的模糊集。模糊聚類依據輸入數
2、據空間上的相似度測試逐漸地將輸入輸出數據分成組,然后從每組中選擇一條零階或一階形式的模糊限唧規則,以組成一個初步的模糊規則庫,此規則庫可以直接用作模糊推理或用參數辨識的方法進行優化。與其它方法相比,這種獲取規則的方法具有能以更小的代價獲得更簡化的模型的優點。二、模型的精確性和可解釋性間的平衡。模糊建模相對于其他建模方法最大的優點就是其結果具有可解釋性。就目前的研究情況來看,不論何種方法,獲取的模型都較復雜,模糊集合重疊,具有很大的冗余。從得到的結果中我們很難解釋每個模糊集的物理意義。這里使用基于相似度合并方法提供了一個較為合理且快速的模糊集合并機制,藉此減少模型的復雜性,并可避免一般聚類方法容
3、易產生多余模糊集的問題。三、模型的參數辨識。得到初步的模糊規則庫后。將這個模糊模型融合到神經網絡結構中,利用神經網絡的學習能力調節模型參數。主要討論誤差反向傳播學習方法和一種混合學習方法。這三個方面側重點不一樣,同時這三個方面是相輔相成的,在研究具體的問題時它們之間是一個反復完善的過程,可以依據對模型要求的不同,具體安排。仿真及實驗結果表明模糊建模方法能有效地建立非線性系統模型,模型較好的精確性。相對于其它建模方法而言,得到的模型具有可解釋性,可能用專家知識等優點。關鍵詞:非線性系統辨識,模糊系統,混合式學習算法,模糊聚類,可解釋性,嘶腳:,。,武漢理工大學碩士學位論文:,第一章緒論研究的背景
4、及意義人類總是想把握自然。人們總是想預先知道在一定條件下事物會出現什么樣的結果,但是時間是人類無法改變的。發生了的是歷史,不再重演;沒有發生的是將來,不可預知。幸運的是事物的發生有其必然性,人們從已發生了的實踐中總結規律,對實體特征和它的變化規律進行抽象,構建它的簡化模型,試圖以這種簡化了的模型來預測事物在一定條件下會發生什么。這就是系統建模的主要任務。建立系統數學模型的方法可分為機理分析法和測試法兩大類,本文討論的是一種測試分析法。系統的輸入輸出信號一般總是可以測量的,系統的動態特性必然表現在這些輸入輸出數據中。因此,可以利用系統的輸入輸出數據提供的信息,經過加工處理來建立系統的數學模型。這
5、種建模方法又叫系統辨識。系統辨識的常用方法有:階躍響應法、脈沖響應法、相關函數法、最乘類參數辨識方法、極度大似然法等,這些方法都是建立對象的所謂精確的數學模型。然而,隨著社會、經濟的迅速發展,對科學管理、預測、監測和控制在深度和廣度方面的要求不斷提高,以及科學研究的不斷深入,所研究的對象越來越復雜,影響因素也越來越多,甚至存在一些難以精確描述的人為因素,且存在著大量延時、非線性、時變等非常復雜的現象,導致很難建立精確的數學模型。因此,在復雜的大系統中,復雜性與精確性形成了尖銳的矛盾。要想確切地描述復雜現象的任何現實的物理狀態,事實上是不可能的。為了對整個問題描述有意義,我們必須在模型的準確性與
6、簡明性之間取得平衡?;谀:侠碚摚孟到y的輸入、輸出數據來辨識系統的模糊模型,是對復雜系統建模系統建模與辨識的一種有效途徑。這種模糊模型在復雜系統的建模、預測、控制與決策中得到了廣泛應用,并且越來越顯示出其重要作用。另外,在實際的一些復雜過程控制中,也經常會出現這種情況,些控制器很難控制的問題,操作人員和工程師憑其經驗和知識卻能得到滿意的控制效果,但操作人員卻不能夠用語言確切地描述出在什么情況下采用什么動作的完整過程。因此,通過數據對人的控制行為進行模糊建模也是很有意義的問題。總之,無論是要模擬操作人員的控制行為,還是要建立基于模型的控制;無論是要對復雜系統的行為進行預測,還是要為達到某個
7、目標而進行決策,對系統進行模糊建模都是非常有意義和必要的。模糊辨識與傳統的辨識方法在辨識步驟和任務上大體相同,模糊系統相對于武漢理工大學碩士學位論文其他方法有其獨特的優點具體體現在以下幾個方面:)相對于經典辨識方法,它能有效地辨識復雜和病態結構()的系統,能夠有效地辨識具有大時延、時變的非線性系統【,】。現代工業過程中的系統越來越復雜,模糊辨識方法的這些優點顯得尤為突出。)相對于神經網絡等黑箱建模方法,它可以得到性能優越的人類控制器,】。一個好的系統模型應該具有明確的物理意義,無論是科學家還是工程操作人員都能夠理解它的結構和參數。黑箱模型所有的信息是隱含的,賦予它的權值是它工作性能的關鍵,然而
8、卻無法知道權值和神經網絡在做什么,如果要理解它幾乎是不可能的。模糊系統是基于規則庫的,用模糊系統來辨識對象,可以從觀測數據中提取系統的模糊規則,得到關于系統的規則形式的描述。另外,從這些規則的物理含義,很直觀的就可以判斷某組參數是否正確,模糊系統的參數是否合適。模糊控制和人類的控制策略,無論是專家還是線工作人員都很容易理解它的操作原理。)可得到被控對象的定性與定量相結合的模型。對絕大多數的工程系統來說,其重要的信息來源有兩種:提供測量數據的傳感器和提供系統性能描述的專家。我們稱來自傳感器的信息為數據信息,來自專家的信息為語言信息【。現代系統辨識理論指出:并非所有系統都可以從它的輸入、輸出完全確
9、定其結構和參數,專家知識在系統建模中也有相當重要的作用。從以上三個方面來講,模糊辨識方法相對于其它方法具有本質的優點,但模糊模型的建立也存在著實現上的困難,下面將討論國內外在這種方法研究上的現狀。國內外研究現狀調查非線性系統辨識與控制是模糊理論的個重要的應用領域。模糊系統理論隨著模糊數學和人工智能技術的發展而不斷完善,但其中最重要的問題之一就是模糊規則的獲取。模糊控制理論的發展從某種意義上說也是圍繞著這一問題而展開的。近來,這一研究領域取得了許多理論成果和實際應用,但還是存在許多難題,在理論研究與實際應用間還存在很大差距。模糊系統設計的核心問題就是如何從數據中獲取合適的模糊規則。模糊辨識是通過
10、輸入輸出測量數據,對模糊模型中的結構和參數進行的辨識。事實證明模糊模型在非線性動力系統建模,基于規則的學習控制,模式識別等領域起到了很大的作用。最近幾年,、基于模糊推理的建模方法大概分為以下幾類:武漢理工大學碩士學位論文基于模糊關系模型的建模方法【,:基于模糊神經網絡的模糊建模方法,¨】;基于()的模糊線性函數模型的建模方法。】。下面主要針對第三種建模方法,對目前的理論與實際應用加以簡單綜述。文獻【】提出的模糊模型,也稱為一階模型。國內外許多學者在此模型的基礎上進行了卓有成效的研究。模型具有很多優點:由于其規則前件是模糊變量,而結論部分是關于輸入輸出變量的線性函數,它以局部線性化為基
11、礎,通過模糊推理方法實現了全局的非線性。這種模型使用了局部線性化函數,能克服以往模糊模型的高維問題,所以已成為人們廣泛使用的模糊模型??偟膩碚f,這方面的研究主要集中于模型的結構辨識和參數辨識兩個方面:一、模型的結構辨識查表法:這種方法(卅的主要思想是按照某一確定的過程,例如等分,來劃分輸入模糊空間,即確定輸出語言項與模糊區域的映射關系。把模糊規則庫描述成一個兩位輸入情況下的可查詢表格,每個子格代表一條規則,它確定了模糊規則的結構。這種設計方法簡單易用,但對于較復雜的系統應用中存在問題。劃分準則是確定的,不具有學習功能。模糊空間劃分愈細,辨識結果愈好,但這樣會使模糊規則的數目快速增長。而且由查表
12、法得到的模糊規則庫可能是不完備的。模糊聚類法:等人,利用模糊聚類方法確定系統模糊規則。模糊聚類法把輸入輸出乘積空間劃分成不相交的子集或組,然后每組數據僅用一條規則來描述,聚類中心的數目就是模糊模型中模糊規則的數目,對每個區域可以用簡單的函數,如線性子模型來逼近系統曲面。將聚類數組投影到前提交量上,這樣就可以獲得規則前提部分的模糊子集,用這些模糊子集來構造合適的模糊系統。模糊聚類方法能夠有效地減少模糊規則的數日,但是這種方法產生的結果可能存在模糊集相互重疊的情況,在本文的后面將作解釋。本文用一種基于模糊集合相似度測量的方法對聚類的結果進行測量,合并相似的模糊規則,減少模型的冗余度。二、模型的參數
13、辨識梯度下降法根據先驗知識或一般模糊網格法初步確定模糊模型,然后利用梯度下降法優化模糊模型的參數。它是一種具有學習功能的算法。其缺點是系統結構的確定和初始參數的設置,這需要大量的啟發性知識。當輸入量增加時,學習復雜性成指數增長。遺傳算法遺傳算法是模擬達爾文的生物進化機制(選擇、交叉、變異)的一種自適應全局優化概率搜索算法。對規則前、后件參數進行編碼,借助于遺傳算法優化模糊系統【】,這種方法能得到系統的全局最優解。但二進制編碼或經典的武漢理工大學碩士學位論文遺傳算法在解決多維、高精度、連續問題時染色體的長度往往過長,使計算量隨之猛增,效率很低,而實值編碼方法可較好地解決這一問題。模糊系統與神經網
14、絡相結合將神經網絡優秀的學習能力和模糊推理整合在一起,形成模型】。然而,許多設計方法僅涉及到參數的辨識,回避了結構的辨識,一般假設結構已預先確定好了。總的來說,從模型的精度來看各種算法均能得到較滿意的結果,但是很少涉及到結構優化的參數辨識。即大多數研究者將結構辨識和參數辨識這兩個問題是分開考慮的。研究目的、所解決的關鍵問題、研究的目的將模糊系統應用到非線性系統辨識問題中的主要難點就在于模糊規則的獲取及如何保證模型的精確性和可解釋性。本文將圍繞這個問題展開討論,結合其他算法解決模糊規則的獲取及模糊系統初始值的確定方法,并將這些方法應用到非線性系統的辨識問題中。本文的目的就是:)選擇一種合適的自適
15、應模糊系統,討論此方法在工程系統中綜合地利用數據和語言兩種信息;)將自適應模糊系統應用于非線性系統的辨識問題,構造模糊辨識方法的一般步驟;)解決模糊模型的精度與模型的可解釋性問的平衡問題。、所解決的關鍵問題對于非線性系統的模糊辨識,本研究主要解決以下幾個方面的問題:)減少模糊聚類方法得到模型的冗余度,提高模型的可解釋性;)誤差反向傳播算法與全局最小二乘法,最小二乘法相結合,辨識模糊模型的參數;)模糊聚類算法和模糊神經網絡方法的應用及軟件實現;)模糊系統辨識方法在雙容水箱系統液位控制中的應用。論文結構本文將分為六個部分:第一章為緒論,主要介紹本文的目的和意義簡單介紹國內外在模糊系統辨識方面的研究
16、現狀。武漢理工大學碩士學位論文第二章介紹模型系統理論方面的知識。主要介紹模糊集、模糊規則和模糊推理的基礎理論,它們是構建本文內容的數學基礎。在這一章中還介紹了兩種常用的模糊模型,模型和()模型,重點討論了模型的結構,并給出了模型的數學表達式。本文中討論的辨識方法均在這種模型的基礎上展開討論的。第三章主要討論模糊系統辨識的結構辨識問題。通過對數據進行模糊聚類,將數據劃分為若干類,然后將每類數據投影到輸入空間的每個變量上,作為輸入變量的模糊集。在本章中還討論了另一種模糊聚類方法,模糊聚類。該方法中采用模糊最大似然估計作為數據點到聚類中心的距離。最后討論了模型的可解釋性問題。通過兩種方法來簡化模糊規
17、則庫:第一種方式為合并相似隸屬度函數的方法減少模型中的冗余模糊集和規則,另一種方式是在模型參數優化過程中添加約束參數,以這種方式約束模糊集問的重合度,提高模型的可解釋性。第四章中主要討論髑濮型的參數辨識問題。主要朗述了誤差反向傳播算法和幾種混臺學習算法。昆合學習方法中采用最小二乘法和誤差反向傳播學習相結合的方式,兩者分別訓練模型的結論參數和前提參數。最后提出將全局最小二乘法和局部最小二乘法相結合的方式,以達到在模型的精確性和局部模型的可解釋性問的平衡。第五章主要討論模糊模型辨識方法在雙容水箱系統中的應用。首先利用本文闡述韻方法根據系統的輸入輸出數據結合局部模型的約束參數,得到系統的模糊模型。然
18、后結合預測控制和內模控制對實際系統進行控制,結果表明了模糊模型的優越性。最后一部分為結論與展望??偨Y了本文中提出的各種方法的優點與不足,并對今后進一步研究方向作了初步探討。第二章模糊系統模型模糊系統早期最有成就的當屬于模糊控制在消費品和工業過程控制中的應用。同時因為大多實踐中只需要我們自己制定幾條模糊規則就可以實現,這就使得有這樣一種說法,稱模糊系統和模糊控制是經驗學科,缺少嚴格的理論支持和指導。我們應當注意到模糊系統經歷了近年的發展,它不僅僅是一種簡單的控制方法,已成為一種重要的計算方法。一個重要的原因就是模糊系統可以用一些簡單的線性函數逼近復雜的非線性曲面。模糊系統的精華在于它將一個問題劃
19、應的連接權值,使得這些線性函數能夠平滑地連接達到逼近平滑非線性函數的目的。模糊系統基礎理論模糊系統是一種基于知識或規則的系統。它的核心就是有所謂的規模糊集模糊集可以認為是經典數學理論中集合概念的擴展,它為模糊理論的發展應用奠定了基礎。經典集合論中集合是指具有某種性質或用途的元素的全體。集合可以定義為集合中元素的窮舉(列舉法),或描述為集合中元素所具有的性質(描述法),也可用隸屬度法定義。隸屬度法引入了集合的,隸屬度函數,用表示,它滿足:()。彰。()可以看出經典集合論中要求元素具有一個定義的很準確的性質,論域中的元素非此即彼。但是在現實生活中我們發現這種方式往往不能表達我們要陳述的意思。例如,
20、我們說“那個人的是個年青人。”具體多大年紀范圍內位年青人,我們并沒有一個非常嚴格的定義。為了克服經典集合理論中的這種局限性,需要一種新理論一一模糊集合理論,來彌補它的局限性。定義論域,上的模糊集合是用隸屬度函數,()來表征的,縱(。)的取值范圍是,】武漢理工大學碩士學位論文經典集合論中元素的隸屬度只允許取兩個值一一。或,而模糊集合中元素的隸屬度度則是在區間【,】上的一個連續函數。所以說模糊集合一點都不模糊,它只是一個帶有連續隸屬函數的集合。模糊集合的一些基本概念這里簡單介紹一下本文中將要用到的幾種基本概念。支撐集()年模糊單值()論域,上模糊集支撐集()是一個清晰集,它包括了,中所有在上具有非
21、零隸屬度值的元素,即()礦肛(刃)()如果模糊集合的支撐集僅包含中的個點,則稱該模糊集為模糊單值。投影()令是即上的一個模糊集,其隸屬度函數為()肛(,),令日為舒中的個超平面(),定義日為日扛¥吣。定義以在的投影為在艫。上的模糊集合,其隸屬度函數為肛(,)?。ǎ悖ǎ┠:阕樱ǎ┰O和日是上的兩個模糊集合。下表為兩種常用的模糊算子:例如,對于下面的這條規則:襲:常用模糊邏輯算子忍:,唧;凸茁()用上面兩種算子得到這條規則的隸屬度分別為:風(。)(。,(),婦(岔),一,“如(。哂)和覷(¥)肛;()、。()啦(昂)通常,并和交的運算分別用算子和來表示。()()武漢理工大學碩士學位論文語言變量
22、和模糊規則語言變量如果一個變量取自然語言中的詞語為值,則稱其為語言變量。這里,詞語由定義在論域上的模糊集合來描述的,變量也是在論域上定義的。語言變量在某種意義上實數值變量的一種擴展,即允許語言變量取模糊集為值。如圖,“年齡”是一個語言變量,它的術語集合(年紀)可以是甄年紀),餌,圖:模型對非線性函數的分段逼近能力出語言變量。例如,當使用流量計來測量水的流速時,流量計秈,語言變量是人類知識表達中最基本的元素,傳感器會給出數值,而專家會給等數字;而當讓某人告訴我們水的流速時,通常會說“水流的慢”、“水流的很快”等話語。在一些情況下語言變量比精確的數學描述更方便,易理解。例如,我們說“今天特別悶熱!
23、”,我們想表達的意思就是感覺到天氣悶熱,不舒服。如果說“今天是華氏。,氣壓百帕?!蔽覀兛赡芊炊恢?。引入語言變量的概念是人類知識系統有效地嵌入工程系統的第一步。模糊推理在模糊邏輯中,命題都是由模糊集表述的模糊命題。模糊邏輯的最終目的是將模糊集理論作為一種主要工具,為不精確命題的近似推理提供理論基礎。為實現這一目的,引入:廣義取式推理():前提:為前提:如果為,則為結論:為武漢理工大學碩士學位論文口,陽,(”),(),(,)】廣義拒式推理():前提:為前提:如果為,則目為結論:霉為即,腳,(。),(”),層(七,)】廣義拒式推理():前提:為,則可為前提:如果”為,則為結論:如果。為,則為即
24、,。,)。,),日,。(,)模糊模型在系統辨識中,經常使用到基于模糊規則庫的模糊模型。模糊模型由模糊產生器、模糊規則庫、模糊推理機和反模糊化器四部分組成,其基本結構如圖所示。設¥仉××墨××為模糊系統的輸入,封為模圖:模糊模型的結構圖糊系統的輸出,則模糊系統構成了由子空間到子空間,曠上的一個映射。模糊產生器將論域上的點一一映射為上的模糊集合,反模糊化器將論域上的模糊集合一映射為上確定的點,模糊推理機根據模糊規則庫中的模糊推理知識以及由模糊產生其產生的模糊集合,推理出模糊結論,即論域上的模糊集合,并將其輸入到反模糊化器。在模糊模型中,由于采用模糊產生器、模
25、糊規則庫、模糊推理機和反模糊化器的方法很多,每一種組合都會產生不同類型的模糊模型。一般常用的模糊模型為模型和【()模型:模型在此模型中,前提(規則的部分)和結論(規則的部分)均為模糊命武漢理工大學碩士學位論文題:碼。:。,們用模糊集表示。是模型中規則的數目。;,()這里鴿,)和甄分別是前提和結論語言變量(如,“小”,“大”,等),它模型模型經常用在專家系統中,而模型在數據辨識系統中應用的越來越多。沒有特別說明的情況下,本文中采用模型作為辨識的對象。在這種模型中模型的前提部分也是模糊命題,與模型不同的是它的結論部分是輸入變量的線性函數:():以砰,式中,向量和參數為結論參數。,()模型和模型的不
26、同之處在于他們的結論部分,前者的結論部分為模糊集,后者的結論為線性函數。模型將語言變量和標準回歸函數結合在一起:它描述了輸入空間各模糊劃分區域對應的線性函數。帶有中心平均解模糊器的模型輸出可由下式來計算:掣罨一絲礦一()()()(茁)()岫(¥)式中,()是第條規則的高度,若采用乘積推理:岫():()前提部分的模糊集描述輸入空間的不同區域,結論部分的參數,赴逼近前提部分描述的局部區域的線性模型。從這種意義上講,可以把模型看作多個局部線性模型的加權求和,如圖所示。由于模型具有函數逼近能力和參數學習能力,本文中主要以這種模型來進行系統辨識。模糊模型和系統辨識假設一個多輸入單輸出系統有仲維輸入變量和
27、一個輸出變量。經過測試得到系統的對輸入輸出數據樣本:、瀋,】,管協,剪)(一)武漢理工大學碩士學位論文圖:模型對非線性函數的分段逼近能力式中,忙,茁。為系統的輸入變量。在傳統辨識方法中,通過建立預測輸出與過去時刻輸入輸出間的數學關系得到系統的模型。通常表示為帶外生變量的非線性自回歸()模型:),(),口一),),。)()式中,為輸出、輸入變量的最大延遲,為系統延遲時間,代表模型的映射關系。本文的目的就是從數據樣本中獲取一個模糊模型,此模型由下面的一組規則表示:(:。:,()式中,表示輸入變量的語言變量,由隸屬數肛定義。上面這個結構稱為模糊模型。在這種意義上講,模糊辨識是一種特殊的系統辨識方法,
28、因為它得到的模型是一個模糊系統。因此,模糊模型設計的主要任務是:模型的結構辨識和參數估計。結構辨識主要是從輸入輸出樣本中選擇合適的模型前提變量、結論變量,及模糊規則的數目;參數估計主要是確定每條規則的前提變量的模糊集“和結論參數,。武漢理工大學碩士學位論文模糊模型的結構和參數辨識從模糊模型可以看出,這種模糊系統設計的主要問題就是確定規則的數目,及每條規則對應的隸屬函數州,鴿,啦,也就是模型的結構和參數確定的問題。模型結構的選擇非常重要,因為它決定了模型逼近未知系統的適應性。一個模型的結構越詳細對系統的逼近越精確,但模型的泛化能力越差。模型的泛化能力是指對于同一過程,根據有限樣本得到的模型,對其
29、他樣本集也有良好的預測能力。模糊模型的構造中可以使用專家知識和輸入輸出數據,專家知識可以是一種近似的表述(定性的,啟發式的)。有兩種方式可以綜合這兩種信息:、首先利用專家知識構造規則庫,這樣就可以構造初始模型。然后利用輸入輸出數據對調節模型的參數(前提參數,結論參數)。、利用輸入輸出數據對贏接構造模糊規則及相關的參數。這種情況下,與其它黑箱模型(如神經網絡模型)相比,這種網絡結構模型有一個突出優點,這種模型得到的結果具有可解釋性。我們可以理解得到規則的實際意義,可以修改規則,或者添加規則以增加模型的合理性。實際問題中,甚至可以將兩種方式結合起來使用。大致確定模型的結構后,可以用多種優化方法確定
30、模型的參數。本文將主要就這兩個問題展開討論,首先將討論利用模糊聚類法來構造合適的模糊規則庫,然后將討論模型參數辨識的幾種方法。第三章模糊聚類方法構造模糊系統規則引言對于模糊模型來說模型結構的確定主要包括兩個方面:、輸入變量的選擇。這包括物理輸入量和狀態變量的選擇。可以依據專家知識、對過程特性的理解和模型的用途來考慮如何選擇合適的輸入變量。然后可以參考某種準則,使用自動數據驅動選擇程序來比較不同結構的性能,選擇較好的模型結構。、隸屬函數的數量,形式及規則數量的選擇。這兩種結構參數是相互關聯的,因為有更多的隸屬函數相應地必須定義更多的規則。它們決定了模型的復雜程度,及對輸入空間劃分的間隔。在模糊系
31、統的設計過程中,規貝數目的確定很重要。規則太多會令模糊系統變的復雜,同時可能會存在不必需的規則;規則太少有會令模糊系統的作用削弱,也許難以完成該問題的目標。模型的用途,可獲取的信息(知識和數據)可以用來作為選擇的參考。還可以用其它的算法來選擇隸屬函數和規則的數目。模糊聚類方法由于無須監督控制,可以按著某一規則尋優,快速且有效,因此采用模糊聚類進行模糊辨識是一種有效的方法。本章采用模糊聚類的方法來確定模糊系統限刪規則?;舅枷胧遣捎媚:垲惙ò演斎胼敵鰯祿颖痉忠阅:巹t的數目等于聚類的數目。聚類劃分聚類分析是數理統計中研究“物以類聚”的一種多元分析方法。在數學上,類,再將每類數據祝為一個輸入輸
32、出數據對。即一類數據采用一條模糊規則。所把按一定要求對事物進行分類的方法叫做聚類分析,所要進行分類的對象叫做樣本。因此,聚類分析的任務在于通過數學分析定量地確定樣本的親疏關系,從而客觀地分型劃類。聯合系統的輸入輸出數據樣本()構成聚類數據集:陋;引()模糊聚類方法將樣本的笛卡爾空間一×豫劃分為一些特定的局部區域,利用這些局部區域的線性模型逼近系統特性。聚類可以看作是數據集的子集,依據得到的子集是清晰集還是模糊集可以將聚類方法分為硬聚類和模糊聚類。硬聚類法基于經典集合論,數據點只有屬于或武漢理工大學碩士學位論文不屬于某一聚類兩種情況。它將數據集中的數據劃分到個不相交的子集(聚類)中。模
33、糊聚類法中數據點以不同的隸屬度同時屬于幾個聚類,數據集被劃分到個模糊子集。由于事物本身在很多情況下都帶有模糊()性,因此把模糊數學方法引入聚類分析,就會使分類更切合實際。在模糊聚類法中,數據點不是被強制地劃分到某個聚類中,而是賦給它一個【問的隸屬度,表示它屬于某個聚類的程度。另外,硬聚類劃分的離散本質性導致它在分析和算法上難以實現,因為它的解析函數是不可微的。硬劃分聚類的目的是將數據集劃分到個聚類中。假設,由先前知識或試湊的方法得到。由經典集合論,一個硬劃分可以定義為一組子集滿足:(),它墨五,()【這些條件是指數據孑中的所有數據均被唯一地劃分到子集中,且子集不相交,不為空。寫成隸屬函數的形式
34、為:墨山,肌。以,【盧,式中,是子集的特征函數,它的值為或。)簡單起見,將記為,將雎(石)記為淞劃分可以寫成矩陣。的形式,且矩陣。;脅刈滿足下式:“玎,),若眥,、忙?。?,脅,、定義硬劃分空間令【,石】為有限集合,為正整武漢理工大學碩士學位論文數,的硬劃分空間為集合礦,;胍,;脅,()模糊劃分模糊劃分可以看作是硬劃分的推廣,請可以取,的值。這時表示模糊劃分的矩陣。扯州的約束條件為:以【,】,脅,()脅,定義模糊劃分空間令【;,】為有限集合,為正整數,的模糊劃分空問為集合:。礦。阻【,;脅,;誥,)()矩陣的每個元素噸表示樣本屬于聚類的程度,也稱之為隸屬度。的每列元素之和為,也就是說每個樣本到所
35、有聚類的隸屬度之和為。但每個隸屬度的取值沒有限制。在硬劃分中隸屬度的取值只能為或,中的每列元素中只能有一個為,其它為。這是模糊聚類和硬聚類本質區別在形式上的體現。另外,需要注意的是矩陣是一個二維矩陣,但因陋,茹,】及是維空間上的點,所以元素地表征的是多維空間中的關系,它的取值為正實數。模糊均值聚類均值算法硬聚類較直觀,下面先來討論它的實現方法。我們希望在眾多可能的分類中尋求合理的分類結果,為此,就要確立合理的聚類準則。在硬分類時,常使用的聚類準則是最小平方誤差和。一均值和一中心點聚類法中使數據點到個聚類中心優的距離平方和最小,即:(蜀副瓠一“。(刪武漢理工大學碩士學位論文式中,是第個聚類中的數
36、據集,仇是這個聚類中數據的均值。用。表示第璞中的樣本與第類的原型樣本之間的距離,即緣一隴。利用船(;礬)也可以表示為:(;礬)脅(砒)()聚類準則為尋求最佳組對眠),以使得在滿足約束條件話下(;,)為最小。均值聚類中稱仇為原型樣本,如聚類的中心點:驢毯,乎()式中,是中數據點的數目。模糊均值聚類按照定義的模糊劃分的概念,把硬聚類的目標函數推廣到模糊聚類的情況。為了避免產生平凡解,保證這一推廣有意義,對每個樣本與每類原型間的距離用其隸屬度平方加權,從而把類內誤差平方和目標函數擴展為類內加權誤差平方和目標函數:如礬礦:隨以曲姥()在上述目標函數中,樣本名與第類的聚類原型耽之間的距離度量一般定義為象
37、,(名血一,)(矗一)()式中,為)×(札)階的對稱正定矩陣,當取單位矩陣時對應于歐幾里德(歐氏)距離。圖孓說明了模糊聚類的直觀意義:武漢理工大學碩士學位論文,一陣:,肛圖:模糊聚類從統計學意義上講,式陸)可以看作求到仇總誤差的最小值。聚類準則洚)的求解是一個非線性優化問題,解決這類優化問題有很多方法,如群協同最小化、過擬退火、遺傳算法等。最常用的方法就是簡單的迭代法,即所謂的模糊。均值聚類()法。聚類推則)可以用拉格朗日乘予來求解:以吖:隨:蘭隨斟一()若,鞏且,七和,則(礬)似×艫。式取最小值的必要條件是,了對入的一階微分為,即:肌二一,()(功)一弄口仇生,嫘茹螺()
38、式爺)說明噸是聚類中數據的加權平均值,權值就是它們的隸屬度。因此這種算法叫做“一平均”。另外,算法就是式()和式()間的迭代。的詳細算法如下】:武漢理工大學碩士學位論文初始化參數:對于給定的數據集,選擇聚類數,權值數,中止閥值,內模積矩陣。隨機初始化劃分矩陣,滿足,()嶼。進行下面的迭代過程:步驟計算聚類中心:艫步驟計算距離:致魯吾一(囂一趣一叫()。一曝(名女一仇)?(),步驟更新劃分矩陣:以()趔露靳磊面莉)一(一)()步驟如果()則停止并輸出劃分矩陣和聚類原型礦,否則令返回步驟。口由以上算法不難看出,整個計算過程就是反復修改聚類中心和分類矩陣的過程,因此常稱這種方法為動態聚類或者逐步聚類
39、法。()聚類與模糊均值聚類不同的是,在聚類法中使用一種自適應的距離度量,使其更適合辨識出數據的特征劃分區域。聚類法中距離曩定義為:醵(一”)丁(鼠)()(一”),()式中,毋為聚類的模糊協方差:肛墜噶蠹。警)型聚類方法如下武漢理工大學碩士學位論文初始化參數,與方法相同。步驟計算聚類中心:號廣,江,釜(以)(。(。)”步驟計算協方差矩陣:()毋幽蔫學出一塒步驟計算距離:()毳(;一”:。)()(¨巧)一”:。),步驟更新劃分矩陣:()趔:蘑瓦面莉一。,()其它且,時越挈須滿足約束體條件直至()一(一)則停止,否貝令回步驟??冢ǎ┠:到y的設計每個聚類代表系統的一個特征域,聚類數目等于規
40、則數目。由劃分矩陣可以得到規則前提部分的模糊集。前面已說明,元素浩,】為數據點:屬于聚類的隸屬度。的第行包含一個定義在多維模糊子集上的個點。將多維模糊子集投影到輸入變量女的空間上就得到規則()中的單變量模糊集:(¥讓)()式中,為點投影操作。如圖。()然后可利用第章的方法辨識結論參數。武漢理工大學碩士學位論文圈:模糊聚類的投影得到規則前提中的模糊集合并相似隸屬函數模糊聚類能有效減少模糊規則數目,模糊的系統的最大優點體現在它們的語言可解釋性。然而這個問題經常被忽略,人們的大多將注意力放在模型的精確性上。正如和所說【。如果模型的可解釋性不是我們要關注的主要問題,還不如放棄模糊建模方法,使用其它方法
41、得到的結果可能更準確。為了保證模型的可解釋性,第一步就是要確定、合并隸屬函數的相似規則。使用聚類法得到的結構中存在許多含相似的隸屬函數。這樣模型的可解釋性很差,很對參數的調整顯得是多余的,需要消耗大量的計算資源。將非常相似的規則合并就很有意義了。這里對規則庫的簡化主要是建立在隸屬函數的相似分析上的,有很多文獻提出了不同的相似性測量方法,這里介紹下面這種相似測度方法:假設和是個模糊集,模糊集和的相似度定義為:(糕()式中,為集合的基數(),。很明顯,計算兩個模糊集的相似度就是計算兩個模糊集的交集和并集的比。當定義在離散域即瞄,)上時,可將式浯)寫成隸屬函數的形式為:厶;、,口山,川(。)跗,驢嘉
42、錙和是最小和最大算子。如果(,)則兩個模糊集合,是相等的。當兩個武漢理工大學碩士學位論文集合沒有重合部分的時候(,)。越大則認為兩個模糊集合,的相似度越大。這里設定兩個閥值兒(,)(集合與全集的相似度閥值),(,)(兩個集合間相似度閥值)。反復合并兩兩相似的模糊集,測量每個輸入變量的所有模糊集間的相似度。模糊集問的相似度則將它們合并。兩個模糊集合并后作為一個新的模糊集,減少了規則庫中的模糊集,更新規則庫,計算更新規則庫中模糊集間的相似度,直到沒有模糊集間的相似度為止。這樣可以減少模型中模糊集合的數目,同時可以增加模型的透明性。最后,檢查更新規則庫中的模糊集中是否存在與全集相似的集合,若存在則將它們從規則前提中刪除,如圖所示。,融莨盛崖忪蠱圖:相似集合的合并此算法總結為:已知初始模糊規則庫懇,):。:茹礦武漢理工大學碩士學位論文式中,(,吖)為模糊集。它的隸屬度為州:札一,】。選擇兩個閥值亂,(,)。:選擇規則庫中兩個最相似的模糊集。對每個輸
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 企業培訓計劃合同
- 2025葡萄酒銷售合同范本
- 2025建筑施工承包合同模板
- 2025瑞豐企業合同(項目管理咨詢)
- 2025醫療器械專業技術轉讓合同
- 《融資需求分析》課件
- 《手型彩繪 》教案
- 2025精致合約-設備安裝工程合同
- 2025年度基礎設施建設工程施工合同模板
- 2025辦公樓租賃合同書模板
- 英語-外研(一年級起點)-四年級下冊-學生單詞默寫專用表格
- 醫療機構消毒技術規范(2023年版)
- 完整版各城基本風壓
- GB/T 6672-2001塑料薄膜和薄片厚度測定機械測量法
- GB/T 4937.4-2012半導體器件機械和氣候試驗方法第4部分:強加速穩態濕熱試驗(HAST)
- 三角形的內角和-課件
- CO變換工藝發展過程及趨勢
- 北師大版數學六年級下冊-總復習課件(精編版)
- 經濟效益證明(模板)
- 汽車總裝車輛返工返修作業標準管理辦法
- D建筑消防設施故障維修記錄表
評論
0/150
提交評論