




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、2022-3-2212022-3-2222022-3-2232022-3-2242022-3-2252022-3-2262022-3-227數據清理篩選數據清理篩選數據數據目標數據目標數據預處理預處理及變換及變換變換后的數據變換后的數據數據挖掘數據挖掘解釋解釋/評估評估2022-3-2282022-3-2292022-3-22102022-3-22112022-3-22122022-3-22132022-3-2214數據倉庫數據倉庫數據清理數據清理 數據集成數據集成過濾過濾數據庫數據庫數據庫或數據倉庫服務器數據挖掘引擎模式評估圖形用戶界面 知識庫2022-3-22152022-3-221620
2、22-3-22172022-3-22182022-3-2219 定義:論域X=x上的模糊集合A由隸屬函數A(x)來表征。其中A(x)在實軸的閉區間0,1中取值,A(x)的大小反映x對于模糊集合A的隸屬程度。 A(x)的值接近1,表示x隸屬于A的程度很高。 A(x)的值接近0,表示x隸屬于A的程度很低。 特例,當A的值域取0,1閉區間的兩個端點,亦即0,1兩個值時,A便退化為一個普通的邏輯子集。隸屬函數也就退化為普通邏輯值。 2022-3-22202022-3-22212022-3-22222022-3-22232022-3-22242022-3-22252022-3-22262022-3-22
3、272022-3-22282022-3-22292022-3-22302022-3-22312022-3-22322022-3-22332022-3-22342022-3-22352022-3-2236數據清理數據清理數據集成數據集成數據轉換數據轉換數據歸約數據歸約2022-3-22372022-3-22382022-3-22392022-3-2240n簡單,但是沒有意義2022-3-22412022-3-22422022-3-22432022-3-22442022-3-22452022-3-22462022-3-2247xyy = x + 1X1Y1Y12022-3-22482022-3-2
4、2492022-3-22502022-3-2251BABAnBBAAr) 1()( )(,ABAB2022-3-22522022-3-2253AAminnewmaxnew_,_AAAAAAminnewminnewmaxnewminmaxminvv_)_(2022-3-2254Avv jvv10Where j is the smallest integer such that Max(| |)Reduced attribute set: A1, A4, A6YYYNNN2022-3-22622022-3-22632022-3-2264count51015202530123456789101-10
5、11-2021-30510152025132515PricePricecount2022-3-22652022-3-22662022-3-22672022-3-22682022-3-2269count51015202530123456789101-1011-2021-30510152025132515PricePricecount2022-3-22702022-3-22712022-3-2272n例例1:包含數據:包含數據:101、110、203、222、305、315n方法:最高位包含方法:最高位包含3個值(個值(1、2、3)n分成分成100,200),),200,300),),300,40
6、0)三段)三段n例例2:包含數據:包含數據:101、110、103、422、405、415,400n方法:最高位包含方法:最高位包含2個值(個值(1、4)n分成分成100,150),),150,200) ,400,450) ,450,500)四段)四段n例例3:包含數據:包含數據:101、210、203、322、305、415,500n方法:最高位包含方法:最高位包含5個值(個值(1、2、3、4、5)n分成分成100,200),),200,300) ,300,400) ,400,500),),500,600)五段五段2022-3-22732022-3-2274countryprovince_or_ statecitystreet15 distinct values65 distinct values3567 distinct values674,339 distinct values2022-3-2275主要內容主要內容l為什么需要數據預處理為什么需要數據預處理? ?l數據清洗數據清洗 l數據集成與轉換數據集成與轉換l數據歸約數據歸約l數據離散化與概念層次的構建數據離散化與概念層次的構建l本章小結本章小結2022-3-22762022-3-2277信息可視化數據挖掘可視化 數據挖掘2022-3-22782022-3-22792022-3-22802022-3-2281
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 籃球賽活動總結
- 園林噴灌系統講解課件
- 度假酒店商業空間設計
- 2025地鐵站廳制作安裝合同
- 2025標準設計印刷合同范例
- 2025房產交易居間合同
- 2025x物業管理有限公司物業管理服務合同
- 小學生公共安全教育主題班會
- 幼兒園體驗與探究課程開展匯報
- 2025電影配音錄制委托合同
- 任務5 制作學院網站導航條
- 衛星導航定位技術與應用知到智慧樹章節測試課后答案2024年秋南京工業大學
- 開封市第二屆職業技能大賽無人機裝調檢修項目技術文件(國賽項目)
- 開題報告:高等職業院校雙師型教師評價指標體系構建研究
- 醫療救助政策
- 浙江省寧波市余姚市2024年中考英語模擬試題(含答案)
- 服務質量保障措施方案
- 機場能源管理
- 高速公路路基及土石方工程施工方案與技術措施
- 技能人才評價新職業考評員培訓在線考試(四川省)
- AQ 1083-2011 煤礦建設安全規范 (正式版)
評論
0/150
提交評論