




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、 扌旨導教師 丿XXX 線 I I I I I I I I 題目: K_Means聚類算法分析與實現 院一 XXXXXXXXXXXXXXXXXXXX 業 XXXXXXXXXXXXXXXX 號一 XXXXXXXXXXX 名 XXXX 20 xx 年 x 月 xx H K-Means 聚類算法 KMeans算法的基本思想是初始隨機給定K個簇中心,按照最鄰近原則把待分類 樣本 點分到各個簇。然后按平均法重新計算各個簇的質心,從而確立新的簇心。一直 迭代,直 到簇心的移動距離小于某個給定的值。 K-Means聚類算法主要分為三個步驟: (1) 第一步是為待聚類的點尋找聚類中心 (2) 第二步是計算每個
2、點到聚類中心的距離,將每個點聚類到離該點最近的聚類中去 (3) 第三步是計算每個聚類中所有點的坐標平均值,并將這個平均值作為新的聚類中 心 反復執行(2)、(3),直到聚類中心不再進行大范圍移動或者聚類次數達到要求為止 下圖展示了對n個樣本點進行K-means聚類的效果,這里k取2: (a) 未聚類的初始點集 (b) 隨機選取兩個點作為聚類中心 (C)計算每個點到聚類中心的距離,并聚類到離該點最近的聚類中去 (d) 計算每個聚類中所有點的坐標平均值,并將這個平均值作為新的聚類中心 (e) 重復(c),計算每個點到聚類中心的距離,并聚類到離該點最近的聚類中去 (f) 的坐標平均值, 重復(d),
3、計算每個聚類中所有點 并將這個平均值作為新的聚類中 (c) (b) Mat lab 實現: %!機獲取150個點 X = randn (50, 2) +o nes (50, 2) ;ra ndn (50, 2)o nes (50, 2) ;ra ndn (50, 2) + o nes (50, 1), o nes ( 50,1); opts 二 statset( Displayfi naV): %調用Kmeans函數 %X N*P的數據矩陣 %Idx N*1的向量,存儲的是每個點的聚類標號 %Ctrs K*P的矩陣,存儲的是K個聚類質心位置 %SumD 1*的和向量,存儲的是類間所有點與該類質
4、心點距離之和 %DN*K的矩陣,存儲的是每個點與所有質心的距離;ldx, Ctrs,SumD, D = kmea ns (X, 3, Replicates , 3, Optio ns , opts); %8出聚類為1的點。X(Idx=l, 1),為第一類的樣本的第一個坐標;X(Idx=l,2)為第二類 的樣本 的第二個坐標 plot (X(ldx=l, 1), X(ldx=l, 2), r. , MarkerSize, 14) hold on plot (X (Idx=2, 1), X (Idx=2, 2)bMarkersize, 14) hold on plot (X(Idx=3, 1),
5、X (Idx=3, 2)MarkerSize, 14) %繪出聚類中心點,kx表示是圓形 plot (Ctrs (:, 1), Ctrs (:, 2), kx ,,Markersize,, 14, LineWidth , 4) plot (Ctrs (:, 1), Ctrs (:, 2)kx MarkerSize , 14, LineWidth , 4) plot (Ctrs(:, 1), Ctrs(:, 2),,kx , MarkerSize, 14, LineWidth, , 4) legendCluster 1 , Cluster 2, Cluster 3 , Centroids,, L
6、ocation , NW) Ctrs SumD 執行結果: Kmeans 6 iterations, 10 iterations, totai sum of distances 二 204.821 total sum of distances 二 205. 886 total sum of distances 二 204.821 9 iterations, total sum of distances 二 16 iterations, 205.886 9 iterations, totai sum of distances 二 205.886 8 iterations, 8 iterations, 14 iterations, total sum of distances 二 204. 821 total sum of distances 二 204. 821 total sum of distances 二 205. 886 14 it erations, t otel sum of dis tances 二 205. 886 6 iterations, total sum of distances 二 204.821 Ctrs 二 1.0754 1. 0482 -1
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 狗狗褥瘡的護理
- 供熱單位行政工作總結和工作打算
- 車庫認購定金協議書
- 酒店廚房合同協議書
- 龍蝦攤位承包協議書
- 飾品木條轉讓協議書
- 酒店寄存免責協議書
- 包子鋪股份合同協議書
- 道路安全運輸協議書
- 個體戶餐飲股東協議書
- 2025年家政服務行業考核考試試題及答案
- 美容診所合作協議書
- 2025年人教版小學一年級下學期奧林匹克數學競賽試卷(附答案解析)
- 江蘇省南通市2025屆高三三模語文試題(含答案)
- 護理6大核心制度
- 2025年滁州市軌道交通運營有限公司第二批次招聘31人筆試參考題庫附帶答案詳解
- 2025年高考英語考前熱點話題押題卷(新高考Ⅰ卷)-2025年高考英語模擬考試(解析版)
- 旅游退團協議書
- 浙江國企筆試題目及答案
- 線性代數中向量空間的概念與應用:課件
- 2025年小學教師資格考試《綜合素質》文化素養高頻考點專項練習及答案
評論
0/150
提交評論