




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
機器學習實戰演講人202x-11-1101版權聲明版權聲明02獻詞獻詞
03一分類一分類041機器學習基礎1機器學習基礎11.1何謂機器學習21.2關鍵術語31.3機器學習的主要任務41.4如何選擇合適的算法51.5開發機器學習應用程序的步驟61.6python語言的優勢1機器學習基礎1.7numpy函數庫基礎1.8本章小結1.8本章小結1機器學習基礎1.1何謂機器學習11.1.1傳感器和海量數據21.1.2機器學習非常重要1機器學習基礎1.6python語言的優勢11.6.1可執行偽代碼21.6.2python比較流行31.6.3python語言的特色41.6.4python語言的缺點052k-近鄰算法2k-近鄰算法2.1k-近鄰算法概述2.2示例:使用k近鄰算法改進約會網站的配對效果2.3示例:手寫識別系統2.4本章小結2k-近鄰算法2.1k-近鄰算法概述12.1.1準備:使用python導入數據22.1.2實施knn分類算法32.1.3如何測試分類器2k-近鄰算法2.2示例:使用k近鄰算法改進約會網站的配對效果2.2.1準備數據:從文本文件中解析數據012.2.2分析數據:使用matplotlib創建散點圖022.2.3準備數據:歸一化數值032.2.4測試算法:作為完整程序驗證分類器042.2.5使用算法:構建完整可用系統052k-近鄰算法2.3示例:手寫識別系統ab2.3.2測試算法:使用k近鄰算法識別手寫數字2.3.1準備數據:將圖像轉換為測試向量063決策樹3決策樹3.1決策樹的構造3.2在python中使用matplotlib注解繪制樹形圖3.3測試和存儲分類器3.4示例:使用決策樹預測隱形眼鏡類型3.5本章小結3.2在Python中使用Matplotlib注解繪制樹形圖3.3測試和存儲分類器3.4示例:使用決策樹預測隱形眼鏡類型3.5本章小結3決策樹3.1決策樹的構造3.1.2劃分數據集1323.1.1信息增益3.1.3遞歸構建決策樹3決策樹3.2在python中使用matplotlib注解繪制樹形圖a3.2.1matplotlib注解3.2.2構造注解樹b3決策樹3.3測試和存儲分類器ab3.3.2使用算法:決策樹的存儲3.3.1測試算法:使用決策樹執行分類074基于概率論的分類方法:樸素貝葉斯14.1基于貝葉斯決策理論的分類方法34.3使用條件概率來分類24.2條件概率44.4使用樸素貝葉斯進行文檔分類4基于概率論的分類方法:樸素貝葉斯54.5使用Python進行文本分類64.6示例:使用樸素貝葉斯過濾垃圾郵件4基于概率論的分類方法:樸素貝葉斯4.7示例:使用樸素貝葉斯分類器從個人廣告中獲取區域傾向4.8本章小結4基于概率論的分類方法:樸素貝葉斯4.5使用python進行文本分類4.5.1準備數據:從文本中構建詞向量014.5.2訓練算法:從詞向量計算概率024.5.3測試算法:根據現實情況修改分類器034.5.4準備數據:文檔詞袋模型044基于概率論的分類方法:樸素貝葉斯4.6示例:使用樸素貝葉斯過濾垃圾郵件01024.6.1準備數據:切分文本4.6.2測試算法:使用樸素貝葉斯進行交叉驗證4基于概率論的分類方法:樸素貝葉斯4.7示例:使用樸素貝葉斯分類器從個人廣告中獲取區域傾向14.7.1收集數據:導入rss源24.7.2分析數據:顯示地域相關的用詞085logistic回歸5logistic回歸5.1基于logistic回歸和sigmoid函數的分類
5.2基于最優化方法的最佳回歸系數確定5.2.1梯度上升法5.2.2訓練算法:使用梯度上升找到最佳參數5.2.3分析數據:畫出決策邊界5.2.4訓練算法:隨機梯度上升5.3示例:從疝氣病癥預測病馬的死亡率5.3.1準備數據:處理數據中的缺失值5.3.2測試算法:用logistic回歸進行分類5.4本章小結
5.2基于最優化方法的最佳回歸系數確定5.2.1梯度上升法5.2.2訓練算法:使用梯度上升找到最佳參數5.2.3分析數據:畫出決策邊界5.2.4訓練算法:隨機梯度上升5.3示例:從疝氣病癥預測病馬的死亡率5.3.1準備數據:處理數據中的缺失值5.3.2測試算法:用Logistic回歸進行分類5.4本章小結
096支持向量機6支持向量機ABCDEF6.1基于最大間隔分隔數據6.3smo高效優化算法6.5在復雜數據上應用核函數6.2尋找最大間隔6.4利用完整plattsmo算法加速優化6.6示例:手寫識別問題回顧6支持向量機6.7本章小結6支持向量機6.2尋找最大間隔16.2.1分類器求解的優化問題26.2.2svm應用的一般框架6支持向量機6.3smo高效優化算法ab6.3.2應用簡化版smo算法處理小規模數據集6.3.1platt的smo算法6支持向量機6.5在復雜數據上應用核函數6.5.1利用核函數將數據映射到高維空間6.5.2徑向基核函數6.5.3在測試中使用核函數107利用adaboost元算法提高分類性能17.1基于數據集多重抽樣的分類器37.3基于單層決策樹構建弱分類器27.2訓練算法:基于錯誤提升分類器的性能47.4完整AdaBoost算法的實現7利用adaboost元算法提高分類性能57.5測試算法:基于AdaBoost的分類67.6示例:在一個難數據集上應用AdaBoost7利用adaboost元算法提高分類性能7.1基于數據集多重抽樣的分類器017.1.1bagging:基于數據隨機重抽樣的分類器構建方法027.1.2boosting7利用adaboost元算法提高分類性能7.7非均衡分類問題單擊此處添加標題9,300million7.7.1其他分類性能度量指標:正確率、召回率及roc曲線7.7.2基于代價函數的分類器決策控制7.7.3處理非均衡問題的數據抽樣方法單擊此處輸入你的正文,文字是您思想的提煉,為了最終演示發布的良好效果,請盡量言簡意賅的闡述觀點;根據需要可酌情增減文字,以便觀者可以準確理解您所傳達的信息。11二利用回歸預測數值型數據二利用回歸預測數值型數據128預測數值型數據:回歸8預測數值型數據:回歸ABCDEF8.1用線性回歸找到最佳擬合直線8.3示例:預測鮑魚的年齡8.5權衡偏差與方差8.2局部加權線性回歸8.4縮減系數來「理解」數據8.6示例:預測樂高玩具套裝的價格8預測數值型數據:回歸8.7本章小結8預測數值型數據:回歸8.4縮減系數來「理解」數據8.4.1嶺回歸8.4.2lasso8.4.3前向逐步回歸8預測數值型數據:回歸8.6示例:預測樂高玩具套裝的價格18.6.1收集數據:使用google購物的api28.6.2訓練算法:建立模型139樹回歸9樹回歸19.1復雜數據的局部性建模29.2連續和離散型特征的樹的構建39.3將cart算法用于回歸49.4樹剪枝59.5模型樹69.6示例:樹回歸與標準回歸的比較9.7使用python的tkinter庫創建gui9.8本章小結9.8本章小結9樹回歸9樹回歸9.3將cart算法用于回歸9.3.1構建樹19.3.2運行代碼29樹回歸9.4樹剪枝9.4.1預剪枝19.4.2后剪枝29樹回歸9.7使用python的tkinter庫創建gui19.7.1用tkinter創建gui29.7.2集成matplotlib和tkinter14三無監督學習三無監督學習1510利用k-均值聚類算法對未標注數據分組10利用k-均值聚類算法對未標注數據分組10.1k均值聚類算法
10.2使用后處理來提高聚類性能
10.3二分k均值算法
10.4示例:對地圖上的點進行聚類10.4.1yahoo!placefinderapi10.4.2對地理坐標進行聚類10.4.2對地理坐標進行聚類10.5本章小結
1611使用apriori算法進行關聯分析11使用apriori算法進行關聯分析M.94275.CN111.1關聯分析211.2apriori原理311.3使用apriori算法來發現頻繁集411.4從頻繁項集中挖掘關聯規則511.5示例:發現國會投票中的模式611.6示例:發現毒蘑菇的相似特征11使用apriori算法進行關聯分析11.7本章小結11使用apriori算法進行關聯分析11.3使用apriori算法來發現頻繁集111.3.1生成候選項集211.3.2組織完整的apriori算法11使用apriori算法進行關聯分析11.5示例:發現國會投票中的模式11.5.1收集數據:構建美國國會投票記錄的事務數據集11.5.2測試算法:基于美國國會投票記錄挖掘關聯規則1712使用fp-growth算法來高效發現頻繁項集12使用fp-growth算法來高效發現頻繁項集
12.1fp樹:用于編碼數據集的有效方式lorem12.2.1創建fp樹的數據結構12.2.2構建fp樹12.2.2構建FP樹12.2構建fp樹12.3.1抽取條件模式基12.3.2創建條件fp樹12.3.2創建條件FP樹12.3從一棵fp樹中挖掘頻繁項集
12.6本章小結
12.5示例:從新聞網站點擊流中挖掘
12.4示例:在twitter源中發現一些共現詞loremloremloremloremlorem18四其他工具四其他工具1913利用pca來簡化數據
13.3示例:利用pca對半導體制造數據降維
13.4本章小結
13.1降維技術13.2.1移動坐標軸13.2.2在numpy中實現pca13.2.2在NumPy中實現PCA13.2pca單擊此處添加文本具體內容,簡明扼要的闡述您的觀點。添加標題單擊此處添加文本具體內容,簡明扼要的闡述您的觀點。添加標題66%36%13利用pca來簡化數據2014利用svd簡化數據14.1svd的應用14.2矩陣分解14.3利用python實現svd14.4基于協同過濾的推薦引擎14.5示例:餐館菜肴推薦引擎14.6示例:基于svd的圖像壓縮14利用svd簡化數據單擊此處添加文本具體內容,簡明扼要的闡述您的觀點。根據需要可酌情增減文字,以便觀者準確的理解您傳達的思想。單擊此處添加標題14利用svd簡化數據14.7本章小結14.1svd的應用14.1.2推薦系統14利用svd簡化數據14利用svd簡化數據14.4基于協同過濾的推薦引擎14.4.1相似度計算0114.4.2基于物品的相似度還是基于用戶的相似度?0214.4.3推薦引擎的評價0314利用svd簡化數據14.5示例:餐館菜肴推薦引擎114.5.1推薦未嘗過的菜肴214.5.2利用svd提高推薦的效果314.5.3構建推薦引擎面臨的挑戰2115大數據與mapreduce115.1MapReduce:分布式計算的框架315.3在Amazon網絡服務上運行Hadoop程序215.2Hadoop流415.4MapReduce上的機器學習15大數據與mapreduce515.5在Python中使用mrjob來自動化MapReduce615.6示例:分布式SVM的Pegasos算法15大數據與mapreduce15.7你真的需要mapreduce嗎?15.8本章小結15.8本章小結15大數據與mapreduce15.2hadoop流ab15.2.2分布式計算均值和方差的reducer15.2.1分布式計算均值和方差的mapper15大數據與mapreduce15.3在amazon網絡服務上運行hadoop程序115.3.1aws上的可用服務215.3.2開啟amazon網絡服務之旅315.3.3在emr上運行hadoop作業15大數據與mapreduce15.5在python中使用mrjob來自動化mapredu
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論