




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、模糊數學方法及其應用論文題目: 模糊聚類方法案例分析 小組成員:王季光 宋申輝 蘭潔 陳倩蕓 肖侖 楊洋 吳云峰2013年 10 月 27 日模糊聚類分析方法1.1距離和相似系數為了將樣品(或指標)進行分類,就需要研究樣品之間關系。目前用得最多的方法有兩個:一種方法是用相似系數,性質越接近的樣品,它們的相似系數的絕對值越接近1,而彼此無關的樣品,它們的相似系數的絕對值越接近于零。比較相似的樣品歸為一類,不怎么相似的樣品歸為不同的類。另一種方法是將一個樣品看作P維空間的一個點,并在空間定義距離,距離越近的點歸為一類,距離較遠的點歸為不同的類。但相似系數和距離有各種各樣的定義,而這些定義與變量的類
2、型關系極大,因此先介紹變量的類型。由于實際問題中,遇到的指標有的是定量的(如長度、重量等),有的是定性的(如性別、職業等),因此將變量(指標)的類型按以下三種尺度劃分:間隔尺度:變量是用連續的量來表示的,如長度、重量、壓力、速度等等。在間隔尺度中,如果存在絕對零點,又稱比例尺度,本書并不嚴格區分比例尺度和間隔尺度。有序尺度:變量度量時沒有明確的數量表示,而是劃分一些等級,等級之間有次序關系,如某產品分上、中、下三等,此三等有次序關系,但沒有數量表示。名義尺度:變量度量時、既沒有數量表示,也沒有次序關系,如某物體有紅、黃、白三種顏色,又如醫學化驗中的陰性與陽性,市場供求中的“產”和“銷”等。不同
3、類型的變量,在定義距離和相似系數時,其方法有很大差異,使用時必須注意。研究比較多的是間隔尺度,因此本章主要給出間隔尺度的距離和相似系數的定義。設有個樣品,每個樣品測得項指標(變量),原始資料陣為其中為第個樣品的第個指標的觀測數據。第個樣品為矩陣的第行所描述,所以任何兩個樣品與之間的相似性,可以通過矩陣X中的第K行與第L行的相似程度來刻劃;任何兩個變量與之間的相似性,可以通過第列與第列的相似程度來刻劃。1.2 F相似關系 1.2.1定義設,如果具有自反和對稱關系,則稱為上的一個相似關系(表示模糊)當論域為有限時,相似關系可以用矩陣表示。具有F相似關系的矩陣,稱為相似矩陣。在實際應用時,通常只能得
4、到自反矩陣和對稱舉證,即相似矩陣。現在的問題是對具有相似關系的元素怎樣進行分類,也就是如何將相似矩陣改造為等價矩陣。1.2.2 定理若,則稱為對稱矩陣。(1)若(是單位矩陣),則稱為自反矩陣。(2)若,則稱為傳遞的關系。(3)若滿足上面三點則稱為等價矩陣。定理1:相似矩陣的傳遞閉包是等價矩陣,且。證 只需要證明是自反的、對稱的。因是自反的,故,。不難得到不減,因此,即是自反的。因為,故是對稱的。有定理1可見,要想將相似矩陣改變為等價矩陣,只需求相似矩陣的傳遞閉包。定理2:設是自反矩陣,則任意自然數,都有證由自反性推得當時,有1.3 聚類分析所謂聚類分析,就是用數學的方法對事物進行分類,它有廣泛
5、的實際應用。在模糊數學產生之前,聚類分析已是數理統計多元分析的一個分支,然而現實的分類問題往往伴有模糊性。例如,環境污染分類、春天連陰雨預報、臨床癥狀資料分類、巖石分類,等等。對這些伴有模糊性的聚類問題,用模糊數學語言來表達更為自然。模糊聚類分析的步驟:第一步:數據標準化數據矩陣設論域為被分類的對象,每個對象由m個指標表示其性狀,即于是得到原始數據矩陣為數據標準化在實際問題中,不同的數據一般有不同的量綱。為了使有不同的量綱的量也能進行比較,通常需要對數據作適當的變換。但是,即使這樣,得到的數據也不一定在區間0,1上。因此,這里說的數據標準化,就是要根據模糊矩陣的要求,將數據壓縮到區間0,1上。
6、通常需要作如下集中變換。1) 平移標準差變換2) 平移極差變換3) 對數變換第二步標定(建立模糊相似矩陣)設為待分類的全體。其中每一待分類對象由一組數據表征如下:現在的問題是如何建立和之間的相似關系。這有許多方法(這里選一些,列在下面),我們可以按照實際情況,選其中一種來求與的相似關系。(1)形似系數法數量積法其中M為一適當選擇之正數,滿足夾角余弦法相關系數法其中 最大最小法算術平均最小法幾何平均最小法絕對值指數法絕對值減數法其中,適當選取,使。(2)距離法1)直接距離法海明距離歐幾里得距離切比雪夫距離2) 倒數距離法3) 指數距離法選擇上述哪一個方法好,要按實際情況而定。在實際應用時,最好采
7、用多種方法,選取分類最符合實際的結果。第三步聚類(求動態聚類圖)。由第一步得到的矩陣一般只滿足自反性和對稱性,即是相似矩陣,需將它改造成模糊等價矩陣。為此,采用平方法求出的傳遞閉包,便是所求的模糊等價矩陣。通過便可對進行分類。實際應用具體問題如下:地區生產總值(當年價格)(億元);:第一產業增加值;:第二產業增加值;:第三產業增加值;:地方財政一般預算內收入;:工業企業數(個);:工業總產值(當年價格)(萬元);:從業人員年平均人數(萬人);:流動資產年平均余額(萬元) ;:主營業務收入(萬元):利潤總額(萬元);:移動電話年末用戶數(萬戶);:國際互聯網用戶數(戶);:公路里程;:普通中學學生數(萬人);:醫院、衛生院數(個);:醫生數(執業醫師+執業助理醫師)(個)。17項指標來描述江西省11各市區經濟發展水平情況。現將11個不同經濟發展水平的市區進行聚類。標準差變換下夾角余弦法構造相似矩陣R采用傳遞閉包法進行聚類,得到的動態聚類圖如下:標準差
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 云南施工建設建設合同
- 安置房工程合同書
- 技術入股協議合同
- 婚宴服務合同
- 代理記賬管理合同書
- 商鋪租賃經營合同書
- 建筑工程機械材料租賃合同
- 教師事業單位聘用合同
- 房屋維修合同協議書
- 整車協議合同
- 2023研發費用加計扣除課件
- 國家開放大學《小城鎮建設》形考任務1-4參考答案
- 安全生產月“一把手”講安全課件
- 初中文言文教學的現狀與對策研究
- 曾國藩人生修煉日課
- 2022年全國小學生天文知識競賽考試題庫(含答案)
- 竣工結算審計服務投標方案
- 深入淺出Serverless:技術原理與應用實踐課件
- 貴州省師范大學貴安新區附屬初級中學八年級下學期期中考試語文卷(含解析)
- 公路施工技術高職PPT完整全套教學課件
- 2023年專升本語文作文范文(26篇)
評論
0/150
提交評論