Clementine決策樹C5.0算法_第1頁
Clementine決策樹C5.0算法_第2頁
Clementine決策樹C5.0算法_第3頁
Clementine決策樹C5.0算法_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、1.C5.0輸出類型:指定分析輸出的內容。指定希望最終生成的模型是決策樹還是規則集。組符號:如果選擇該選項,C5.0會嘗試將所有與輸出字段格式相似的字符值合并(采用ChiMerge分箱法檢查當前分組變量個各個類別能否合并,如果可以應先合并后再分支)。如果沒有選擇該選項,C5.0會為用于拆分母節點的字符字段的每個值創建一個子節點。使用推進:提高其精確率。這種方法按序列建立多重模型。第一個模型以通常的方式建立。隨后,建立第二個模型,聚焦于被第一個模型錯誤分類的記錄。以此類推,最后應用整個模型集對樣本進行分類,使用加權投票過程把分散的預測合并成綜合預測。試驗次數選項允許控制用于助推的模型數量。交互驗

2、證:如果選擇了該選項,C5.0將使用一組基于訓練數據自己建立的模型,來估計基于全部數據建立的模型的精確度。如果數據集過小,不能拆分成傳統意義上的訓練集和測試集,這將非常有用。或用于交叉驗證的模型數目。模式:對于簡單的訓練,絕大多數C5.0參數是自動設置。高級訓練模式選項允許對訓練參數更多的直接控制。簡單模式:偏好(支持):選擇“準確性”C5.0會生成盡可能精確的決策樹,某些情況下,會導致過度擬合。選擇“普遍性”以使用不易受該問題影響的算法設置。預期噪聲(%):指定訓練集中的噪聲或錯誤數據期望比率專家模式:模式僱勇嚴重性:每個子分支的最小記錄數:0使用全局催剪宇段模型成本分析注解執行取消修剪純度

3、:決定生成決策樹或規則集被修剪的程度。提高純度值將獲得更小,更簡潔的決策樹。降低純度值將獲得更加精確的決策樹。子分支最小記錄數:子群大小可以用于限制決策樹任一分支的拆分數。全局修剪:第一階段:局部修剪;第二階段:全局修剪。辨別屬性:如果選擇了該選項,C5.0會在建立模型前檢測預測字段的有用性。被發現與分析無關的預測字段將不參與建模過程。這一選項對許多預測字段元的模型非常有用,并且有助于避免過度擬合。C5.0成本選項見“CHAID“成本”選項-誤判成本值,調整誤判C5.0的模型評價可通過Analysis節點實現。另外Analysis還可以實現不同模型之間的評估對比可通過Evaluation節點實現模型評估圏表類型:増益響應提升利弼投資回報率圄回累稅散點囹回包含基線包含最佳線-複型使用以下內容査找目標呼頁則孌重字段:檯型輸出寧段元數據寧眾名楷式備妝,亦炸T機已tfi巳彷)其他得分宇段繪制得分宇段目

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論