數(shù)據(jù)挖掘考試題庫完整_第1頁
數(shù)據(jù)挖掘考試題庫完整_第2頁
數(shù)據(jù)挖掘考試題庫完整_第3頁
數(shù)據(jù)挖掘考試題庫完整_第4頁
數(shù)據(jù)挖掘考試題庫完整_第5頁
已閱讀5頁,還剩13頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、 D 合,為企業(yè)決策支持系統(tǒng)提 的分析操作,側存 答查詢問題的細節(jié) 01)以提高數(shù)據(jù)挖掘效率的方法。規(guī)化的常用方法有:最大最小規(guī)化、零 其他屬性值進行 結構,通過直接偏移計 據(jù)中,提取隱含在其中 預測、聚類分析、趨勢 一 分析型數(shù)分析型數(shù)據(jù)歷史的、綜合的面向分析、分析驅動 幾乎不更新,定期追加 分析需求事先不知道 完全不同的生命周期對性能要求寬松操作型數(shù)據(jù)的面向應用、事務驅動 頻繁增、刪、改操作需求事先知道 對性能要求高一次操作數(shù)據(jù)量小支持日常事務操作一次操作數(shù)據(jù)量大支持管理決策需求P OLTOLTP OLAP 結構直接結構構 設計時主要考慮的因素有: 據(jù)序列、引入 同 據(jù)庫中,也可能存 數(shù)據(jù)

2、歸約:縮小數(shù)據(jù)的取值圍,使其更適合于數(shù)據(jù)挖掘算法的需要,并且能 統(tǒng)一權重法(又稱等深分箱法) 統(tǒng)一區(qū)間法(又稱等寬分箱法) 最小熵法 自定義區(qū)間法將數(shù)據(jù)按比例縮放(如更換大單位),使之落入一個特定的區(qū)域(如 0.0 1.0),稱為規(guī)化。規(guī)化的常用方法有:x = (x 一 min ) + min(max 一 min ) 0 00 0X0 維歸約分層 標號的訓練實例,屬于 客戶基本庫中發(fā)現(xiàn)不同的客戶群,并且用不同的 的分類,對基于進行分類,獲得對種群中固有結構 中相似地區(qū)的確定;各類保險投保人的分組;一個 據(jù)挖掘算法的預處理:即先進行聚類,然后再進行 術,它把基于相似數(shù)據(jù) 0. . 0法、粗 規(guī)則

3、;然后根據(jù)規(guī) 樹結構。它是 產(chǎn)生的。決策樹的根結點 點為根的子樹所包含的樣 的測試,從樹 數(shù)據(jù)挖掘中非常有效的 僅包含同一類型的數(shù)據(jù)為 個既含正例又含反例的子集(稱為窗口);中例子用所得決策樹進行類別判定,找出錯判的例 僅包含同一類型的數(shù)據(jù)為 k k kL持度%度%TA, DA, B3ABTD, EA, C3CATA, C, EA, D44.4AD6.7TA, B, D, EB, D3BDTA, B, CC, D3CDTA, B, DD, E3DETA, C, DTC, D, ETB, C, D 兩種性能;可時間加 非線性,有 j testtest-1 test-2 test-3 test-4 test-5 test-6Y N P N N N測試項目 對 象OBJ1OBJ2YNPNPNOBJ3NYNYNNk 個中心的距離,然后把每個對象歸入離它“最近” 平均值,然后重新選擇簇中心(離平均值“最近”的 、可理解的、可操 目標

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論