數據挖掘入門_第1頁
數據挖掘入門_第2頁
數據挖掘入門_第3頁
數據挖掘入門_第4頁
數據挖掘入門_第5頁
已閱讀5頁,還剩86頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、2022-3-2212022-3-2222022-3-2232022-3-2242022-3-2252022-3-2262022-3-227數據清理篩選數據清理篩選數據數據目標數據目標數據預處理預處理及變換及變換變換后的數據變換后的數據數據挖掘數據挖掘解釋解釋/評估評估2022-3-2282022-3-2292022-3-22102022-3-22112022-3-22122022-3-22132022-3-2214數據倉庫數據倉庫數據清理數據清理 數據集成數據集成過濾過濾數據庫數據庫數據庫或數據倉庫服務器數據挖掘引擎模式評估圖形用戶界面 知識庫2022-3-22152022-3-221620

2、22-3-22172022-3-22182022-3-2219 定義:論域X=x上的模糊集合A由隸屬函數A(x)來表征。其中A(x)在實軸的閉區間0,1中取值,A(x)的大小反映x對于模糊集合A的隸屬程度。 A(x)的值接近1,表示x隸屬于A的程度很高。 A(x)的值接近0,表示x隸屬于A的程度很低。 特例,當A的值域取0,1閉區間的兩個端點,亦即0,1兩個值時,A便退化為一個普通的邏輯子集。隸屬函數也就退化為普通邏輯值。 2022-3-22202022-3-22212022-3-22222022-3-22232022-3-22242022-3-22252022-3-22262022-3-22

3、272022-3-22282022-3-22292022-3-22302022-3-22312022-3-22322022-3-22332022-3-22342022-3-22352022-3-2236數據清理數據清理數據集成數據集成數據轉換數據轉換數據歸約數據歸約2022-3-22372022-3-22382022-3-22392022-3-2240n簡單,但是沒有意義2022-3-22412022-3-22422022-3-22432022-3-22442022-3-22452022-3-22462022-3-2247xyy = x + 1X1Y1Y12022-3-22482022-3-2

4、2492022-3-22502022-3-2251BABAnBBAAr) 1()( )(,ABAB2022-3-22522022-3-2253AAminnewmaxnew_,_AAAAAAminnewminnewmaxnewminmaxminvv_)_(2022-3-2254Avv jvv10Where j is the smallest integer such that Max(| |)Reduced attribute set: A1, A4, A6YYYNNN2022-3-22622022-3-22632022-3-2264count51015202530123456789101-10

5、11-2021-30510152025132515PricePricecount2022-3-22652022-3-22662022-3-22672022-3-22682022-3-2269count51015202530123456789101-1011-2021-30510152025132515PricePricecount2022-3-22702022-3-22712022-3-2272n例例1:包含數據:包含數據:101、110、203、222、305、315n方法:最高位包含方法:最高位包含3個值(個值(1、2、3)n分成分成100,200),),200,300),),300,40

6、0)三段)三段n例例2:包含數據:包含數據:101、110、103、422、405、415,400n方法:最高位包含方法:最高位包含2個值(個值(1、4)n分成分成100,150),),150,200) ,400,450) ,450,500)四段)四段n例例3:包含數據:包含數據:101、210、203、322、305、415,500n方法:最高位包含方法:最高位包含5個值(個值(1、2、3、4、5)n分成分成100,200),),200,300) ,300,400) ,400,500),),500,600)五段五段2022-3-22732022-3-2274countryprovince_or_ statecitystreet15 distinct values65 distinct values3567 distinct values674,339 distinct values2022-3-2275主要內容主要內容l為什么需要數據預處理為什么需要數據預處理? ?l數據清洗數據清洗 l數據集成與轉換數據集成與轉換l數據歸約數據歸約l數據離散化與概念層次的構建數據離散化與概念層次的構建l本章小結本章小結2022-3-22762022-3-2277信息可視化數據挖掘可視化 數據挖掘2022-3-22782022-3-22792022-3-22802022-3-2281

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論