機器學習與數據挖掘復習._第1頁
機器學習與數據挖掘復習._第2頁
機器學習與數據挖掘復習._第3頁
免費預覽已結束,剩余1頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、機落學習與敷據挖掘復習 ;l人x; 人h" M <IM Oft<HV9M0<1U<VUM >1IA-«MXAXX 良卜*»whbh Maarta,、Met mmtw#*,I ue MKS) IMU BM aCBAM1. i(IL«&& It片 wefMtava «M W A w >!tih u«n*aft«atfA>尺0 ! IrdUMABMlIVAtA*. MM9Hd、MS啟倦4*'»«!«*T" 4勺QJUIf 二

2、"AHLSi» »mK.AaiE«» wetm«u Akrx . i«e JbiMw .ui niaM“ u»ft-4* -«wmRiMri annoe m ««Mi. rvui««a«««i«v Ma«MvmA«M> AAM. "H-代刊f o x疑.rowati. MjorMh*E eHwtihHB ”. 3tKt»« “« tn mwtsbf . F-t*

3、 vutaaMM.> 你 * a«wqa*5Hifim “fh « -!< N-« d4F, t»Mna«<ia«MatMra« !Kirytf >t«rs ,共冃 <naa.« 口. > zme “,Rei<yw$iim>bn> eAvaanra. ha丄t«fM*»« ti«w raxr m,卜撫YMta.nitTMkwwxm旣zm >«n««> SW,H “ MUH

4、e txt mt wm a. e? vr* 欽人 antewiMto MAi ,/ ».»«« ft «»>.H 住 «r.naMK>UAa PJC4尺,*:m« n k ",. fMI WtMn貝或!4 lt"r”fFQIC V !<,*-* <« yr mA*.*g|mat < - uuM.M<7-.n、M 、!*">.Cf e « ,?+ niiwr.w# BM. *«<- 從Gu awwtifiraa

5、i aaa.m 僞 一 H W “ MR ft.A MUMMUBIUCftmM NM*Na*M«Am<-ii nmtin«vvn<m m>i0«<a «»»<« t urnan <«iMtanttUN*a vftMm *"算ynuti*t 、Asm a>*<nM *«*E9 0C g一£:23m !<2口atd Afin. NH ' MBttH” If !« t>n»r<a«4

6、71;vM MoaHann H 舄IS IttV f!6f R tt*4* "e RaMRWift.nmvMa. BMe«>iAft Mtt MMf«<UIUI ««r«Mae、 *、,、7«l r»'" r>h.nan« mh 冃aawitwitx*«h MUtH M bftMK#”BL1 «a,人t*. 4fl wrevi幅M I.a«. nlticr,EAnHr 航9條/ MMHI饑r Kft«MT<rraiHi n*

7、4 i wqj y*>r«M J"N Al g te« IMM "!« sm 訊 汽, t ftu. “.,、貳貝,/劍 «« fftxiv fnwrfri-l-mit H/|n' 五 WftH»1 “ tawvawmfiB.a cw4ra«» r<i- «»;»M食t>N «WR<KBMR<1«V>1«0 4MHK N /.MAIVBVM«0 1個供sr»g .4 irt

8、ine “»IN/10 Wo>Z、,|W"*M . ,幫. H«t HWZWXltlZW *«ar wiv. ".K M9VMM#M 1<弊»«<丄出w i»>«dl 巧 SRM»««vrR»f MIS «,GB«MN»AM«9M、匚'-1_ ' J«». *-叫 O Au-. ,軋-栄Q M* SStUL a.殲 <y ttf-M«uRt*ne

9、87;t t < 1*e»4 。4仃:八Atr .-、R«>4atl<9,匕滋 Mattjr<Mon«i乂" “I蟲冷auRwtvacv *ti人I GtMJVRMMTH 、iw RBO 住處 Q»Wt >Ml、Y力 VMRAMMMUI IHtBM-A- «x«Mtw>a«食«u Aq«ee rr./>I»nn«t鼻 « tn w/>>itm »« F3 »/()q人4UJIMIIA

10、lfffmn V A» AVU 小md «« HBefttmoaaw va«n4 wewR MB.f «.'Jl, <BNLkMMA.*C T-f W. *K1H.lltetf V.«RW rem. 4XMO mct-RMMt»r t««Mt«»<"f «1'殲"0S.丿« I,= ntft2Mna<xf.A«»cni«iflrr>« 匚timwanaB 子實林習1

11、aKMO*9.4f冃 “ IBSBPrvfUL0 4*»«rt«UMaiTlftt. rf V«IOL|唱41 »V4m«VRa«M.fttWTRf AnRMHUMiB MaWtrWMe'rftXMiVWeAaNMr* 1 »NiaaagefMaa n. WJ til AS4Ml:o *« M«9MA lie*km口fcftA會殲 ; y . “SB* »"»<jwr)HN<H WBMM m«4««;4 "

12、 .敘、1t.«»1flilRw< oiutRitMcviaowBKiincii.M 七I » G>lVWe. SVtWHAS再柯沁i oa««e««ftm. MN«R ! M* ka ia« M. *匸1»Cfi»x»v 、!»i %CCUJMO(r) - ' K' I A1I 、,'*“*«” KK ”z1 .mM mc »fR. /» imeima »irv4A UV電他MA見M Q侖

13、KSW穴m «fanraiv"x、in«« ra Ma介“WJl£«utu«RII A UbH-U»M WX 0 smb rr««a W<KW "MM 瓠1M 4»駅A< fVVRM.【 *( >11 人<O t FM a»K«4I«Au 頁W t«R. r«Hea食J RWKM4«4f«t3AR nBRA«e K««l» tf憫“ifar&#

14、171;<A<A.B .»t<t 6-xKit穴 t«n«ahzik434i,iv * fit »<>.Tt RMft m ram«»«<&代、a ''v »etanRM , aMBitnvM !<,a *B ” tilt力<->L2- tK«' "i丄- :4*DM44BfM QMnBf- «*! 2卜 歐M43 tMfHfR Cfr* mtr?殲口靜MM- y土4 >«> n

15、a.M Mi *9*p>4 W" flRM.Ttt"“ < Mina« “寸0RHIf»Vtte4«an manBMAaitfMLaJ 4««M電M ",MM *3hM人9 !% «b MR *«VW» ” T< .'H類器進行投票。他適用于不穩定的學習過程,即數據集的一個小變動會產生大 的差別,例如 決策樹、多層感知器。 6. Boosting 方法:它能提高弱分類器的性 能。它是帶權值的抽樣,改變數據對象的權值,分 類好的數據給與小權值, 分類 不好的數據

16、給與大權值, 最終集成分類結果用加權投票的方法。 7. 一些經驗: a 如果分類器不穩定用 bagging。 b 如果分類器穩定且簡單用 boosting。 c 如果分類 器穩定且復雜用隨機注入。 d 如果數據有很多類,但是分類器只能處理兩個類時, 用錯誤糾正編碼。 8. 為什么集成學習有效: a 從統計學角度來說當假設空間很大 時, 有可能有一些假設有著相同的精度, 單一的 學習器只能找出他們中的一個假 設。 然而集成多個假設就有可能找到最可能的假設。 b 從計算角度來講, 很多單 一學習算法都只能找到一個局部最優假設, 當數據集很大 時,可能很難找到一個 最優假設,集成學習可以從多個起始點

17、去局部逼近,這樣就 有可能得到一個全局 最優的假設。 c 從表示角度來說, 很多情況下最好的假設并不存在于假設空間 中, 當用集成方法對 多個假設空間加權集成時就有可能突破假設空間找到最符合 的假設。 第十一章 聚類分析 1. 什么叫聚類分析:從給定對象中找出一些簇,使在 同一簇中的對象要相似,類與類之間 的對象要不相似。我們希望類內部越緊越 好,類之間界限要越明顯越好。 2. 聚類的三類方法和其代表算法思想: a 分層聚 類: 簇之間是一個嵌套的形式, 沒有必要定義有多少個類, 需要幾個都可以。 且 他可以定義多個含義,具體含義和問題有關。 兩種方法:聚合方法:每個數據點 都看為一個類,兩兩

18、合并直到合并為一個類。 分裂方法: 將所有的對象看做一個 簇, 分類直到每個類里包含一個點時 停下。 此方法一旦將兩個簇合并后就不能再 更改, 它也沒有定義一個明確的目標函數, 即 不是全局最優化;每種方法都有各 種缺點。 b 分區聚類:一個數據對象只屬于一個簇。 K-means: 1. 隨機選擇 k 個點 作為初始中心點。 2. 計算每個點到不同中心點的距離,將點劃分到幾個簇里。 3. 重新計算每個簇的中心點。 4. 重復簇的劃分直到簇的分布基本不變時停止。 c 基 于密度的聚類:對類的定義不同,他認為類是由一些密集的點組成,這些密集的 點被一些稀疏的點分開。 DBSCAN :認為類是基于密度的,它認為一個簇是由密 度連接的點組成的最大的集 合。 3. 層次局類中計算距離的方法: a 兩簇之間的最 近距離:可以劃分大小不同的類;對噪聲和例外點敏感。 b 兩簇之間的最遠距離: 對噪聲和例外點不是那么敏感單不易劃分大小相差很大的類。 c 組內平均距離:對 噪聲不是很敏感但是偏愛球形類。 d 中心點之間的距離。 11 / 13null置信度閾值。置信度具有后件反彈調性,前提是他們都是從同一頻繁項集中生 成

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論