一種高效的K_means聚類改進算法_圖文_第1頁
一種高效的K_means聚類改進算法_圖文_第2頁
一種高效的K_means聚類改進算法_圖文_第3頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、 · 542· 福州大學學報( 自然科學版) 第 42 卷 K means和 MD BKM 算法的計算冗余代價越大,相較之下 ECA 算法所節約的計算時間越多 故對于大 數據集聚類,改進的算法 ECA 的執行效率優勢更為明顯 圖3 Fig 3 算法初始化時間比較 Fig 4 圖4 算法執行時間比較 Comparison of the algorithmsinitialization time Comparison of the algorithmsexecution time 4 結語 提出聚類算法 ECA,該算法由空間劃分預聚類和鄰近簇優化調整兩個階段相結合 : 通過預聚

2、類劃 分,克服了 K means 聚類對初始點敏感的缺陷,避免較差的初始劃分所產生的局部極小值 ,有利于獲得 穩定的、較好的聚類結果; 已具備一定準確率的預聚類成果有效減少了后期聚類迭代的工作量,提高 了算法的收斂速度; 通過獲取鄰近簇和標識穩定狀態減少了計算冗余,有效提高算法的執行效率 實 驗證明,ECA 算法無論從聚類準確率還是運行效率方面 ,都比傳統 K means 算法有較大改進,是高效可 行的 關于 K means 算法對噪聲比較敏感的缺陷,ECA 算法僅通過在預聚類劃分過程中剔除單數據點的 簇實現對噪聲的初步過濾,對噪聲的全面檢測功能還不完善 ,有待在今后的研究工作中進一步改進 參

3、考文獻: 1 Tan P N,Steinbach M,Kumar V Introduction to data mining M 北京: 人民郵電出版社, 2011 2 Babu G P,Murty M N A near optimal initial seed value selection in K means algorithm using a genetic algorithm J Pattern ecognition Letters, 1993 , 14 ( 10 ) : 763 769 3 Faber V Clustering and the continuous K means

4、algorithm J Los Alamos Science, 1994 ( 22 ) : 138 144 4 張軍偉,王念濱,黃少濱,等 二分 K 均值聚類算法優化及并行研究 J 計算機工程, 2011 , 37 ( 17 ) : 23 25 5 Al Daoud M B,oberts S A New methods for the initialization of clusters J Pattern ecognition Letters,1996 ,17 ( 5 ) : 451 455 6 Guha S,astogi ,Shim K CUE: an efficient clusteri

5、ng algorithm for large databases J Information Systems,2001 ,26 ( 1 ) : 35 38 7 Lai J,Liaw Y Improvement of the K means clustering filtering algorithm J Pattern ecognition: The Journal of the Pattern ecognition Society, 2008 , 41 ( 12 ) : 3 677 3 681 8 Yu S,Tranchevent L C,Liu X,et al Optimized data

6、 fusion for kernel K means clusteringJ IEEE Trans Pattern Anal Mach Intell, 2012 , 34 ( 5 ) : 1 031 1 039 9 Pena J M,Lozano J A,Larranaga P An empirical comparison of four initialization methods for the K means algorithm J Pattern ecognition Letters, 1999 , 20 ( 10 ) : 1 027 1 040 10 Frank A,Asuncion A UCI machine learning repository EB / OL 2010 http: / / archive ics uci edu / ml / data

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論