




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第三章機器學習3.1
應用場景CONTENTS目錄應用場景
01自動駕駛
02應用范圍文本分類基因識別空間數據處理衛星圖片分析客戶群的特征分類與價值分析……01OriginalPointsK-means(2Clusters)
01應用范圍經濟預測疾病自動診斷病人分類新聞分類郵件分類……01
01應用范圍應用范圍:01范圍領域模式識別機器學習數據挖掘機器學習+數據庫統計學習統計+機器學習計算機視覺圖像處理+機器學習語音識別語音處理+機器學習自然語言處理文本處理+機器學習
01應用范圍01視頻來源:/sv/cIfmOW4mUBP7UC.html?from=videoso_result
01自動駕駛駕駛輔助系統(DAS)
部分自動化系統高度自動化系統完全自動化01
02第三章機器學習3.2
機器人學習概述CONTENTS目錄人工智能,機器學習和深度學習的區別
01機器學習的發展
02機器學習的分類
03各主流框架基本情況
04人工智能,機器學習和深度學習的區別02人工智能:人工智能,簡稱AI,是指為機器賦予人的智能。人工智能是計算機科學的一個分支,它企圖了解智能的本質,并生產出一種新的能以人類智能相似的方式做出反應的智能機器,是研究、開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。機器學習:機器學習,簡稱ML,是一種實現人工智能的方法。機器學習屬于人工智能的一個分支,也是人工智能的和核心。機器學習理論主要是設計和分析一些讓計算機可以自動“”學習的算法。深度學習:深度學習,簡稱DL,是一種實現機器學習的技術。最初的深度學習是利用深度神經網絡來解決特征表達的一種學習過程。深度神經網絡本身并不是一個全新的概念,可大致理解為包含多個隱含層的神經網絡結構。
01人工智能,機器學習和深度學習的區別請分別討論下列各組數據的內部關系,并填空。02x131724y14.52.58.53.5?x236812y210.537.565.52.5?y1=x1+1.5y2=x22+1.5
01人工智能,機器學習和深度學習的區別定義:計算機利用已有的數據(經驗),得出了某種模型(規律),并利用此模型預測未來數據特征的一種方法。02人類學習VS機器學習
01人工智能,機器學習和深度學習的區別視頻來源:/video/BV1fA411a7X6?from=search&seid=1697965520941191505502
01機器學習的發展02機器學習的發展:在機器學習領域,計算機科學家不斷探索,基于不同的理論創建出不同的機器學習模型。從發展歷程來說,大致經歷了三個階段:符號主義時代(1980年左右)概率論時代(1990-2000年)聯結主義時代(2010年左右)
02機器學習的分類機器學習的分類:可以按照輸入的數據本身是否已被標定特定的標簽將機器學習區分為有監督學習、無監督學習以及半監督學習三類。02機器學習有監督學習無監督學習半監督學習
03機器學習的分類監督學習:從帶標簽(標注)的訓練樣本中建立一個模式(模型),并依此模式推測新的數據標簽的算法。無監督學習:在學習時并不知道其分類結果,其目的是對原始資料進行分類,以便了解資料內部結構算法。半監督學習:利用少量標注樣本和大量未標注樣本進行機器學習,利用數據分布上的模型假設,建立學習器對未標簽樣本進行標簽。02
03各主流框架基本情況各主流框架基本情況對比:02庫名發布者支持語言支持系統TensorFlowGooglePython/C++/Java/GoLinux/Mac
OS/Android/iOSCaffeUCBerkeleyPython/C++/MatlabLinux/Mac
OS/WindowsCNTKMicrosoftPython/C++/BrainScriptLinux/WindowsMXNetDMLC(分布式機器學習社區)Python/C++/Matlab/Julia/Go/R/ScalaLinux/Mac
OS/Windows/Android/iOSTorchFacebookC/Lua/Linux/Mac
OS/Windows/Android/iOSTheano蒙特利爾大學PythonLinux/Mac
OS/WindowsNeonIntelPythonLinux
04各主流框架基本情況各主流框架的性能對比:02庫名學習材料豐富程度CNN建模能力RNN建模能力易用程度運行速度多GPU支持程度TensorFlow★★★★★★★★★★★★★★★Caffe★★★★★★★CNTK★★★★★★★★★★★MXNet★★★★★★★★★★★★Torch★★★★★★★★★★★★★Theano★★★★★★★★★★★Neon★★★★★★★★★04第三章機器學習3.3監督學習及案例體驗CONTENTS目錄監督學習簡介
01案例體驗1:電影票房數據分析
02案例體驗2:鳶尾花分類
03監督學習簡介在監督學習中,每一個例子都是一對由一個輸入對象(通常是一個向量)和一個期望的輸出值(也被稱為監督信號)組成的。01
01監督學習簡介應用步驟:步驟1:數據集的創建和分類。步驟2:訓練。步驟3:驗證。步驟4:使用。01
01監督學習簡介回歸(Regression)y是連續值(實數或連續整數),f(x)的輸出也是連續值。這種類型的問題就是回歸問題。對于所有已知或未知的(x,y),使得f(x,θ)和y盡可能地一致。損失函數通常定義為平方誤差。分類(Classification)y是離散的類別標記(符號),就是分類問題。損失函數有一般用0-1損失函數或負對數似然函數等。在分類問題中,通過學習得到的決策函數f(x,θ)也叫分類器。01
01監督學習簡介回歸分析確定兩種或兩種以上變量間相互依賴的定量關系的一種統計分析方法。一元線性回歸只涉及一個自變量和一個因變量。因變量與自變量呈線性關系。因變量與自變量的關系可以用一個線性方程表示:01
01案例體驗1:電影票房數據分析步驟:數據讀取數據預處理模型建立與訓練數據可視化模型預測與可視化02
022.1數據讀取02案例體驗1:電影票房數據分析
0202案例體驗1:電影票房數據分析2.2數據預處理
0202案例體驗1:電影票房數據分析2.3模型建立與訓練(使用一元線性回歸進行分析)
0202案例體驗1:電影票房數據分析2.4數據可視化
0202案例體驗1:電影票房數據分析2.5模型預測與可視化
02案例體驗2:鳶尾花分類步驟:數據讀取數據預處理數據可視化模型建立與訓練模型評估03山鳶尾(setosa)
變色鳶尾(versicolor)
維吉尼亞鳶尾(virginica)
03使用K近鄰對鳶尾花進行分類(物以類聚,人以群分)K近鄰(K-NearestNeighbor,KNN)方法的核心思想是:在特征空間中,如果一個樣本的K個最相似的樣本中的大多數屬于某一個類別,則該樣本也屬于這個類別,并具有這個類別上樣本的特性。03案例體驗2:鳶尾花分類
03花萼長度(spepallength)花萼寬度(spepalwidth)花瓣長度(petallength)花瓣寬度(petalwidth)03案例體驗2:鳶尾花分類3.1數據讀取
03標簽映射03案例體驗2:鳶尾花分類3.2數據預處理
03四個特征值相關性03案例體驗2:鳶尾花分類3.3數據可視化
03四個特征值相關性03案例體驗2:鳶尾花分類3.3數據可視化
0303案例體驗2:鳶尾花分類3.4模型建立與訓練
0303案例體驗2:鳶尾花分類3.5模型評估
03第三章機器學習3.4無監督學習及案例體驗CONTENTS目錄無監督學習簡介
01案例體驗:使用K-Means對觀影用戶進行聚類
02無監督學習簡介無監督學習就是在樣本數據中只有數據,而沒有對數據進行標記。無監督學習的目的就是讓計算機對這些原始數據進行分析,讓計算機自己去學習、找到數據之間的某種關系。01視頻來源:/v?vid=11285795004709214679&pd=bjh&fr=bjhauthor&type=video視頻:監督學習、無監督學習、強化學習是什么?
01無監督學習簡介無監督學習主要包括:聚類聚類是對于未標記的數據,在訓練時根據數據本身的數據特征進行訓練,呈現出數據集聚的形式,每一個集聚群中的數據,彼此都有相似的性質,從而形成分組。降維降維是緩解維數災難的一種重要方法,就是通過某種數學變換將原始高維屬性空間轉變成一個低維子空間。01
01無監督學習簡介聚類主要方法:基于劃分的聚類方法(partitioningmethods):K-MEANS算法、K-MEDOIDS算法、CLARANS算法基于層次的聚類方法(hierarchicalmethods):BIRCH算法、CURE算法、CHAMELEON算法基于密度的聚類方法(density-basedmethods):DBSCAN算法、OPTICS算法、DENCLUE算法基于網格的聚類方法(grid-basedmethods):STING算法、CLIQUE算法、WAVE-CLUSTER算法基于模型的聚類方法(model-basedmethods):統計的方案和神經網絡的方案01聚類方法的優點:對數據輸入順序不敏感。聚類方法的缺點:在數據分布稀疏時,分類不準確;當高維數據集中存在大量無關的屬性時,使得在所有維中存在簇的可能性幾乎為零;缺乏處理“噪聲”數據的能力。
01案例體驗:使用K-Means對觀影用戶進行聚類K-Means算法原理:K-Means是典型的聚類方法。其中,K表示類別數,Means表示均值。顧名思義,K-Means是一種通過均值對數據點進行聚類的方法。K-Means算法的思想很簡單,對于給定的樣本集,按照樣本之間的距離大小,將樣本集劃分為K個簇。讓簇內的點盡量緊密的連在一起,而讓簇間的距離盡量的大。01視頻來源:/video/BV1ei4y1V7hX/?spm_id_from=333.788.recommend_more_video.-1
02案例體驗:使用K-Means對觀影用戶進行聚類K-Means算法步驟:(隨機)選擇K個聚類的初始中心;對任意一個樣本點,求其到K個聚類中心的距離,將樣本點歸類到距離最小的中心的聚類,如此迭代n次;每次迭代過程中,利用均值等方法更新各個聚類的中心點(質心);對K個聚類中心,利用2,3步迭代更新后,如果位置點變化很小(可以設置閾值),則認為達到穩定狀態,迭代結束,對不同的聚類塊和聚類中心可選擇不同的顏色標注。01
02案例體驗:使用K-Means對觀影用戶進行聚類K-Means算法的優缺點及應用領域:優點:算法簡單、快速。特別是在處理大數據集時,算法可伸縮性高,并且相對高效。當分類(簇)是密集的球狀或團狀,且簇與簇之間區別明顯時,聚類效果較好。缺點:只有在簇的平均值被定義的情況下才能使用,且對有些分類屬性的數據不適合;要求用戶必須事先給出要生成的簇的數目K;對初始值敏感:使用不同的初始值可能會形成不同的聚類結果;不適合于非凸面形狀的簇類分析,或者大小差別很大的簇;對于“噪聲”和孤立點數據敏感,少量的該類數據可能對平均值產生極大影響。應用:廣泛應用于統計學、生物學、數據庫技術和市場營銷等領域。01
02案例體驗:使用K-Means對觀影用戶進行聚類使用K-Means對觀影用戶進行聚類,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030年煤油儲罐項目商業計劃書
- 重度潔癖患者日常護理
- 2025-2030年汽車馬達零件項目投資價值分析報告
- 2025-2030年汽車油泵項目商業計劃書
- 2025-2030年汽缸管項目投資價值分析報告
- 2025-2030年水平模具項目投資價值分析報告
- 2025年私募股權投資項目合作計劃書
- 防洪安全知識培訓
- Unit2單元測試2024-2025學年譯林版英語七年級下冊2
- 演出經紀人資格證爭分奪秒的試題及答案
- 湖北省武漢市基層診所醫療機構衛生院社區衛生服務中心村衛生室地址信息
- 2023年高考數學求定義域專題練習(附答案)
- 贛州市興國縣鄉鎮街道社區行政村統計表
- 新員工入職健康聲明
- 小學 二年級 心理健康《你的感受我知道》心理課教案
- 半導體設備零部件公司質量檢驗
- WS 444.1-2014 醫療機構患者活動場所及坐臥設施安全要求 第1部分:活動場所
- 鋼結構工程監理規劃(整理)
- 單晶爐熱場結構ppt課件
- 安全保衛實務實訓教學大綱
- 《煉油設備培訓》ppt課件
評論
0/150
提交評論