




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
聚類分析與判別分析第一頁,共二十八頁,2022年,8月28日7.1K-均值聚類分析
聚類分析簡介做什么?把沒有分類信息的資料按照相似程度歸類怎么做?系統(tǒng)聚類法和非系統(tǒng)聚類法第二頁,共二十八頁,2022年,8月28日K-均值聚類法基本原理第三頁,共二十八頁,2022年,8月28日K均值聚類法迭代終止條件兩次迭代計算的聚心之間距離的最大改變量小于初始聚心間最小距離的
倍到達(dá)迭代次數(shù)的上限第四頁,共二十八頁,2022年,8月28日K均值聚類的優(yōu)缺點優(yōu)點:占有內(nèi)存少、計算量小、處理速度快,特別適合大樣本的聚類分析缺點:1、應(yīng)用范圍有限,要求用戶指定分類數(shù)目;
2、只能對觀測量聚類,而不能對變量聚類;
3、所使用的聚類變量必須都是連續(xù)性變量。第五頁,共二十八頁,2022年,8月28日利用如下數(shù)據(jù)將以下城市按照空氣指標(biāo)分類第六頁,共二十八頁,2022年,8月28日
執(zhí)行【Analyze】/【Classify】/【K-meansCluster】命令,彈出如圖所示對話框第七頁,共二十八頁,2022年,8月28日結(jié)果解讀初始聚類中心表第八頁,共二十八頁,2022年,8月28日迭代史表6次終止迭代第九頁,共二十八頁,2022年,8月28日最終聚類中心表第十頁,共二十八頁,2022年,8月28日7.2系統(tǒng)聚類法
系統(tǒng)聚類法的基本思想是:視觀測量(或者變量)各自成為一類;找性質(zhì)最接近的兩個類合并成一個新類,計算在新的類別分劃下各類之間的距離;再將性質(zhì)最接近的兩類合并,直到所有模式聚成一類為止。第十一頁,共二十八頁,2022年,8月28日
系統(tǒng)聚類法優(yōu)點:既可以對觀測量也可以對變量進(jìn)行聚類;所使用的變量既可以是連續(xù)變量也可以是分類變量;提供的距離計算方法和結(jié)果顯示方法也很豐富。第十二頁,共二十八頁,2022年,8月28日觀測量聚類:按照交通情況對各地進(jìn)行聚類第十三頁,共二十八頁,2022年,8月28日
執(zhí)行【Analyze】/【Classify】/【HierarchicalCluster】命令,彈出如圖所示的對話框第十四頁,共二十八頁,2022年,8月28日結(jié)果解讀聚類進(jìn)度表第十五頁,共二十八頁,2022年,8月28日龍骨圖第十六頁,共二十八頁,2022年,8月28日變量聚類:按照日照數(shù)對月份進(jìn)行聚類
第十七頁,共二十八頁,2022年,8月28日
結(jié)果解讀聚類進(jìn)度表垂直冰柱圖從下往上看第十八頁,共二十八頁,2022年,8月28日龍骨圖第十九頁,共二十八頁,2022年,8月28日7.3判別分析——Discriminant過程
判別分析簡介干什么?判別樣品所屬類型的一種統(tǒng)計方法與聚類分析的關(guān)系相同點:解決分類問題不同點:判別分析是在已知研究對象分成若干類型,對未知類型的樣品進(jìn)行判別分類第二十頁,共二十八頁,2022年,8月28日判別分析的一般步驟第二十一頁,共二十八頁,2022年,8月28日
常用判別法距離判別法:根據(jù)已知分類的數(shù)據(jù),分別計算各類的均值(重心),判別準(zhǔn)則是任給一次觀測,若它與第i類的重心距離最近,就認(rèn)為它來自第i類。
◆注意:
距離一般采用馬氏距離;距離判別適合對自變量均為連續(xù)變量的情況進(jìn)行分類;距離判別對各類的分布無特定的要求。第二十二頁,共二十八頁,2022年,8月28日Fisher判別法:借助方差分析的思想構(gòu)造一個判別函數(shù),其中判別系數(shù)的確定原則是使得類間的區(qū)別最大,而且類內(nèi)的離差最小,利用判別函數(shù)計算出待判樣品的判別指標(biāo),然后與判別臨界值進(jìn)行比較,判別它的類屬。Fisher判別對各類分布、方差都沒有限制。但當(dāng)總體個數(shù)較多時,計算比較麻煩。第二十三頁,共二十八頁,2022年,8月28日Bayes判別法:在考慮先驗概率的前提下,利用Bayes公式計算樣品來自第i類的后驗概率,使用錯判損失最小的概念作判別準(zhǔn)則,建立判別函數(shù),將待判樣品歸入來自概率最大類。Bayes判別主要用于多類判別,它要求總體呈多元正態(tài)分布.第二十四頁,共二十八頁,2022年,8月28日逐步判別法:逐步判別法與逐步回歸法的基本思想類似,都是逐步引入變量,每引入一個“最重要”的變量進(jìn)入判別式,同時也考慮較早引入判別式的某些變量,若其判別能力不顯著了,應(yīng)及時從判別式中剔除去,直到判別式中沒有不重要的變量需要剔除,且也沒有重要的變量要引入為止。第二十五頁,共二十八頁,2022年,8月28
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 微生物檢驗技師考試實務(wù)案例分析及試題及答案
- 2025年特許金融分析師考試分析技巧試題及答案
- 項目管理團(tuán)隊互信構(gòu)建試題及答案
- 復(fù)習(xí)要點2025年特許金融分析師考試試題及答案
- 黑龍江鶴崗市本年度(2025)小學(xué)一年級數(shù)學(xué)統(tǒng)編版專題練習(xí)(下學(xué)期)試卷及答案
- 項目管理考試評估標(biāo)準(zhǔn)與試題及答案
- 2025年注會考試重要知識試題及答案
- 項目管理專業(yè)人士考試中的個人學(xué)習(xí)計劃試題及答案
- 適應(yīng)職場需求的注冊會計師考試課程設(shè)置分析試題及答案
- 深刻理解證券從業(yè)資格證試題及答案
- 教練技術(shù)紅黑游戲脫盔甲
- 數(shù)學(xué)作業(yè)登記表模板
- 重慶市特種設(shè)備檢驗檢測收費(fèi)標(biāo)準(zhǔn)
- 胸腔積液診斷治療指南
- 國網(wǎng)商城商戶入駐流程
- 關(guān)于申請調(diào)整材料價差的報告(精)
- 行政事業(yè)單位內(nèi)部控制自查表
- HPLC高壓泵系統(tǒng)的主要性能技術(shù)指標(biāo)
- Brother工業(yè)電腦縫紉機(jī)BAS-311H使用說明書
- 《地基與基礎(chǔ)工程》ppt課件
- 《標(biāo)準(zhǔn)韓國語》第一冊 課后答案
評論
0/150
提交評論