




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第3章
含糊模型識別1/37§3.1含糊模型識別模型識別已知某類事物若干標準模型,現有這類事物中一個詳細對象,問把它歸到哪一模型,這就是模型識別.模型識別在實際問題中是普遍存在.比如,學生到野外采集到一個植物標本,要識別它屬于哪一綱哪一目;投遞員(或分揀機)在分揀信件時要識別郵政編碼等等,這些都是模型識別.含糊模型識別所謂含糊模型識別,是指在模型識別中,模型是含糊.也就是說,標準模型庫中提供模型是含糊.2/37模型識別原理為了能識別待判斷對象x=(x1,x2,…,xn)T是屬于已知類A1,A2,…,Am中哪一類?
事先必須要有一個普通規則,一旦知道了x值,便能依據這個規則馬上作出判斷,稱這么一個規則為判別規則.
判別規則往往經過某個函數來表示,我們把它稱為判別函數,記作W(i;x).一旦知道了判別函數并確定了判別規則,最好將已知類別對象代入檢驗,這一過程稱為回代檢驗,方便檢驗你判別函數和判別規則是否正確.3/37§3.2最大隸屬標準含糊向量內積與外積
定義稱向量a=(a1,a2,…,an)是含糊向量,其中0≤ai≤1.
若ai只取0或1,則稱a=(a1,a2,…,an)是Boole向量.
設a=(a1,a2,…,an),b=(b1,b2,…,bn)都是含糊向量,則定義
內積:a
°
b
=∨{(ak∧bk)|1≤k≤n};
外積:a⊙b
=∧{(ak∨bk)|1≤k≤n}.內積與外積性質(a
°
b
)c=ac⊙bc
;(a⊙b
)c=ac
°
bc.4/37含糊向量集合族設A1,A2,…,An是論域X上n個含糊子集,稱以含糊集A1,A2,…,An為分量含糊向量為含糊向量集合族,記為A=(A1,A2,…,An).
若X上n個含糊子集A1,A2,…,An隸屬函數分別為A1(x),A2(x),…,An(x),則定義含糊向量集合族A=(A1,A2,…,An)隸屬函數為A(x)=∧{A1(x1),A2(x2),…,An(xn)}或者A(x)=[A1(x1)+A2(x2)+…+An(xn)]/n.其中x=(x1,x2,…,xn)為普通向量.5/37最大隸屬標準
最大隸屬標準Ⅰ設論域X={x1,x2,…,xn}上有m個含糊子集A1,A2,…,Am(即m個模型),組成了一個標準模型庫,若對任一x0∈X,有k∈{1,2,…,m},使得Ak(x0)=∨{A1(x0),A2(x0),…,Am(x0)},則認為x0相對隸屬于Ak.
最大隸屬標準Ⅱ設論域X上有一個標準模型A,待識別對象有n個:x1,x2,…,xn∈X,假如有某個xk滿足A(xk)=∨{A(x1),A(x2),…,A(xn)},
則應優先錄用xk.6/37例1在論域X=[0,100]分數上建立三個表示學習成績含糊集A=“優”,B=“良”,C=“差”.當一位同學成績為88分時,這個成績是屬于哪一類?A(88)=0.87/37B(88)=0.78/37A(88)=0.8,B(88)=0.7,C(88)=0.依據最大隸屬標準Ⅰ,88分這個成績應隸屬于A,即為“優”.
例2論域X={x1(71),x2(74),x3(78)}表示三個學生成績,那一位學生成績最差?C(71)=0.9,C(74)=0.6,C(78)=0.2,依據最大隸屬標準Ⅱ,x1(71)最差.9/37例3細胞染色體形狀含糊識別細胞染色體形狀含糊識別就是幾何圖形含糊識別,而幾何圖形經?;癁槿舾蓚€三角圖形,故設論域為三角形全體.即X={(A,B,C)|A+B+C=180,A≥B≥C}標準模型庫={E(正三角形),R(直角三角形),I(等腰三角形),I∩R(等腰直角三角形),T(任意三角形)}.某人在試驗中觀察到一染色體幾何形狀,測得其三個內角分別為94,50,36,即待識別對象為x0=(94,50,36).問x0應隸屬于哪一個三角形?10/37先建立標準模型庫中各種三角形隸屬函數.直角三角形隸屬函數R(A,B,C)應滿足以下約束條件:(1)當A=90時,R(A,B,C)=1;(2)當A=180時,R(A,B,C)=0;(3)0≤R(A,B,C)≤1.所以,不妨定義R(A,B,C)=1-|A-90|/90.則R(x0)=0.955.
或者其中p=|A–90|則R(x0)=0.54.11/37正三角形隸屬函數E(A,B,C)應滿足以下約束條件:(1)當A=B=C=60時,E(A,B,C)=1;(2)當A=180,B=C=0時,E(A,B,C)=0;(3)0≤E(A,B,C)≤1.
所以,不妨定義E(A,B,C)=1–(A–
C)/180.則E(x0)=0.677.
或者其中p=A–C
則E(x0)=0.02.12/37等腰三角形隸屬函數I(A,B,C)應滿足以下約束條件:(1)當A=B或者B=C時,I(A,B,C)=1;(2)當A=180,B=60,C=0時,I(A,B,C)=0;(3)0≤I(A,B,C)≤1.
所以,不妨定義I(A,B,C)=1–[(A–
B)∧(B–
C)]/60.則I(x0)=0.766.
或者
p=(A–
B)∧(B–
C)則I(x0)=0.10.13/37等腰直角三角形隸屬函數(I∩R)(A,B,C)=I(A,B,C)∧R(A,B,C);(I∩R)(x0)=0.766∧0.955=0.766.任意三角形隸屬函數T(A,B,C)=Ic∩Rc∩Ec=(I∪R∪E)c.T(x0)=(0.766∨0.955∨0.677)c=(0.955)c=0.045.
經過以上計算,R(x0)=0.955最大,所以x0應隸屬于直角三角形.或者(I∩R)(x0)=0.10;T(x0)=(0.54)c=0.46.依然是R(x0)=0.54最大,所以x0應隸屬于直角三角形.14/37例4大學生體質水平含糊識別.陳蓓菲等人在福建農學院對240名男生體質水平按《中國學生體質健康調查研究》手冊上要求,從18項體測指標中選出了反應體質水平4個主要指標(身高、體重、胸圍、肺活量),依據聚類分析法,將240名男生分成5類:A1(體質差),A2(體質中下),A3(體質中),A4(體質良),A5
(體質優),作為論域U(大學生)上一個標準模型庫,然后用最大隸屬標準,去識別一個詳細學生體質.5類標準體質4個主要指標觀察數據以下表所表示.15/37身高(cm)體重(kg)胸圍(cm)肺活量(cm3)A1158.4±3.047.9±8.484.2±2.43380±184A2163.4±4.850.0±8.689.0±6.23866±800A3166.9±3.655.3±9.488.3±7.04128±526A4172.6±4.657.7±8.289.2±6.44349±402A5178.4±4.261.9±8.690.9±8.04536±756現有一名待識別大學生x={x1,x2,x3,x4}={175,55.1,86,3900},他應屬于哪種類型?16/37閾值標準設論域X={x1,x2,…,xn}上有m個含糊子集A1,A2,…,Am(即m個模型),組成了一個標準模型庫,若對任一x0∈X,取定水平
∈[0,1].
若存在i1,i2,…,ik,使Aij(x0)≥
(j=1,2,…,k),則判決為:x0相對隸屬于
若∨{Ak(x0)|k=1,2,…,m}<
,則判決為:不能識別,應該找原因另作分析.該方法也適合用于判別x0是否隸屬于標準模型Ak.若Ak(x0)≥
,則判決為:x0相對隸屬于Ak;
若Ak(x0)<
,則判決為:x0相對不隸屬于Ak.17/37§3.3擇近標準設在論域X={x1,x2,…,xn}上有m個含糊子集A1,A2,…,Am(即m個模型),組成了一個標準模型庫.被識別對象B也是X上一個含糊集,它與標準模型庫中那一個模型最貼近?這是第二類含糊識別問題.
先將含糊向量內積與外積概念擴充.設A(x),B(x)是論域X上兩個含糊子集隸屬函數,定義
內積:A
°
B
=∨{A(x)
∧B(x)|x∈X};
外積:A⊙B
=∧{A(x)∨B(x)|x∈X}.18/37內積與外積性質(1)(A
°
B
)c=Ac⊙Bc;(2)(A⊙B
)c=Ac
°
Bc;(3)A
°
Ac
≤1/2;
(4)A⊙Ac≥1/2.證實(1)(A
°
B)c
=1-∨{A(x)
∧B(x)|x∈X}
=∧{[1-
A(x)]∨[1-
B(x)]|x∈X}=∧{Ac(x)∨Bc(x)|x∈X}=Ac⊙Bc.證實(3)A
°
Ac=∨{A(x)
∧[1-
A(x)]|x∈X}
≤∨{1/2|x∈X}≤1/2.19/37下面我們用
(A,B)表示兩個含糊集A,B之間貼近程度(簡稱貼近度),貼近度
(A,B)有一些不一樣定義.
0(A,B)=[A°B+(1-A⊙B)]/2(格貼近度)
1(A,B)=(A°B)∧(1-
A⊙B)擇近標準
設在論域X={x1,x2,…,xn}上有m個含糊子集A1,A2,…,
Am組成了一個標準模型庫,B是待識別模型.若有k∈{1,2,…,m},使得
(Ak,B)=∨{
(Ai,B)|1≤i≤m},則稱B與Ak最貼近,或者說把B歸于Ak類.這就是擇近標準.20/37小麥品種含糊識別(僅對百粒重考慮)21/37多個特征擇近標準設在論域X={x1,x2,…,xn}上有n個含糊子集A1,A2,…,An組成了一個標準模型庫,每個模型又由個特征來刻劃:Ai=(Ai1,Ai2,…,Aim),i=1,2,…,n,
待識別模型B=(B1,B2,…,Bm).先求兩個含糊向量集合族貼近度:si=∧{
(Aij,Bj)|1≤j≤m},i=1,2,…,n,若有k∈{1,2,…,n},使得
(Ak,B)=∨{si|1≤i≤n},則稱B與Ak最貼近,或者說把B歸于Ak類.這就是多個特征擇近標準.22/37貼近度改進格貼近度不足之處是普通
0(A,A)≠1.定義(公理化定義)若
(A,B)滿足①
(A,A)=1;②
(A,B)=
(B,A);③若A≤B≤C,則
(A,C)≤
(A,B)∧
(B,C).則稱
(A,B)為A與B貼近度.顯然,公理化定義顯得自然、合理、直觀,防止了格貼近度不足之處,它含有理論價值.不過公理化定義并未提供一個計算貼近度方法,不便于操作.于是,人們首先盡管以為格貼近度有缺點,但還是愿意采取易于計算格貼近度來處理一些實際問題;另首先,在實際工作中又給出了許多詳細定義(P145).23/37離散型連續型24/37離散型連續型25/37離散型連續型26/37實際上,擇近標準關鍵就是最大隸屬標準.如在小麥品種含糊識別(僅對百粒重考慮)中,可重新定義“早熟”、“矮稈”、“大粒”、“高肥豐產”、“中肥豐產”隸屬函數.重新定義“早熟”隸屬函數為重新定義“矮稈”隸屬函數為27/37蠓分類左圖給出了9只Af和6只Apf蠓觸角長和翼長數據,其中“●”表示Apf,“○”表示Af.依據觸角長和翼長來識別一個標本是Af還是Apf是主要.①給定一只Af族或Apf族蠓,怎樣正確地域分它屬于哪一族?②將你方法用于觸角長和翼長分別為(1.24,1.80),(1.28,1.84),(1.40,2.04)三個標本.28/3729/37含糊判別方法先將已知蠓重新進行分類.30/37當
=0.919時,分為3類{1,2,3,6,4,5,7,8},{9},{10,11,12,13,14,15},三類中心向量分別為(1.395,1.770),(1.560,2.080),(1.227,1.927).用平移極差變換將它們分別變為A1=(0.200,0.637)(Af蠓),A2=(0.390,1.000)(Af蠓),A3=(0.000,0.821)(Apf蠓),再將三只待識別蠓用上述變換分別變為B1=(0.015,0.672),B2=(0.062,0.719),B3=(0.203,0.953).31/37采取貼近度
3(A,B)=計算得:
3(A1,B1)=0.89,
3(A2,B1)=0.65,
3(A3,B1)=0.92.
3(A1,B2)=0.89,
3(A2,B2)=0.69,
3(A3,B2)=0.92.
3(A1,B3)=0.84,
3(A2,B3)=0.88,
3(A3,B3)=0.83.依據擇近標準及上述計算結果,第一只待識別蠓(1.24,1.80)屬于第三類,即Apf蠓
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論