人工智能基礎與應用(第2版)(微課版)課件 5-1 聚類分析_第1頁
人工智能基礎與應用(第2版)(微課版)課件 5-1 聚類分析_第2頁
人工智能基礎與應用(第2版)(微課版)課件 5-1 聚類分析_第3頁
人工智能基礎與應用(第2版)(微課版)課件 5-1 聚類分析_第4頁
人工智能基礎與應用(第2版)(微課版)課件 5-1 聚類分析_第5頁
已閱讀5頁,還剩5頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

5-1聚類分析模塊?物以類聚:發現新簇群目錄CONTENTS何為聚類分析01常見聚類方法02聚類性能度量03一.何為聚類分析1.定義聚類分析:他是一種典型的無監督學習,也就是在事先不知道每個樣本的類別、沒有對應標簽值的情況下,將未知類別的樣本按照一定的規則劃分成若干個相對獨立的簇。簇的特點:同一個簇中的樣本盡可能相似不同的簇中的樣本盡可能不相似一.何為聚類分析2.典型應用領域領域銷售領域醫學領域生物領域安全領域一.何為聚類分析3.幾個概念如何去描述簇?簇質心簇大小簇密度簇號…二.常見聚類方法1.基于劃分的聚類二.常見聚類方法2.基于層次的聚類二.常見聚類方法3.基于密度的聚類三.聚類性能度量2.三個概念無論使用什么聚類方法對樣本進行分簇,都會涉及如何對聚類后的結果進行評估,以度量聚類模型的性能的問題。聚類性能度量指標用于對聚類后的結果進行評估,分為內部指標和外部指標兩大類。外部指標要事先指定聚類模型作為參考來評估聚類結果的好壞,稱為有標簽的評估;而內部指標是指不借助任何外部參考,只用參與聚類的樣本本身評估聚類結果的好壞。內部指標慣性值輪廓系數CH分數該值越小越好,越小證明樣本在類間的分布越集中值越大,說明同類樣本相距越近,不同樣本相距越遠。當簇密集且分離較好時,CH分數更高,因此CH值越大

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論