畢業設計(論文):機器學習之非線性轉換模型及應用研究_第1頁
畢業設計(論文):機器學習之非線性轉換模型及應用研究_第2頁
畢業設計(論文):機器學習之非線性轉換模型及應用研究_第3頁
畢業設計(論文):機器學習之非線性轉換模型及應用研究_第4頁
畢業設計(論文):機器學習之非線性轉換模型及應用研究_第5頁
已閱讀5頁,還剩19頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

機器學習之非線性轉換及應用研究指導老師:答辯人:專業:信息與計算科學目錄CONTENTPART

ONEPART

TWOPARTTHREEPARTFOUR選題背景基本理論模型建立結果分析PARTONE選題背景PARTONE選題背景研究背景PM2.5是空氣質量標準中顆粒物(粒徑≤2.5μm)濃度限值。研究發現PM2.5因其粒徑較小、相對PM10表面積較大,因此更容易富集空氣中的有機污染物、酸性氧化物、有毒重金屬、細菌和病毒。當PM2.5被人吸入到體內時,通過呼吸進入血液就可以產生并導致人體呼吸、內分泌、心血管、神經及免疫等各系統疾病的發生。研究內容及意義本文主要對PM2.5進行預測,即通過PM2.5的歷史數據預測未來的發展趨勢,對未來一段時間的PM2.5的值作出預測,得出霧霾天氣的變化趨勢。國內外研究現狀詳見文獻綜述葉林華\文獻綜述葉林華.doc幻燈片2PART

TWO基本理論PARTTWO基本理論非線性幻變換一般來說,線性回歸是被我們使用最基本的描述變量間相互關系的方法,但是生活中大多數的模型都是非線性的。所以,我們利用數學手段把它轉換為線性問題再來進行處理,來解決更加廣泛的問題?;脽羝?高次非線性轉換上節內容介紹了二次假設,即轉換前的x空間只有二次,現在參考一個一般化的即高于二次的非線性變換,把二次變成Q次的多項式轉換。數據歸一化歸一化是一種標準化的形式,經常用于數據去量綱計算。在不同的標準體系下,不同評價指標往往具有不同的量綱和量綱單位,如果就這樣對數據進行對比分析,是不具有任何意義的。所以,我們需要在挖掘時將數據劃入同一標準內,即將數據歸一化。機器學習思路機器學習是人工智能領域的重要分支,它不僅僅可以用來簡單的使用數據,更可以研究如何使得計算機接收數據后,具備更強大的學習和分析能力。為了實現以上能力,我們就需要運用經典模型、算法模擬,實現人類一直在做的學習行為,從而獲得更多的知識和技能?;脽羝?2PARTTWO基本理論二次假設。假設非線性的空間為x空間(左圖),轉換過得線性空間為z空間(右圖),轉換過程如下:(二次空間)(一次空間)轉換↓↓幻燈片6PARTTWO基本理論機器學習思路機器學習的工作方式什么是機器學習?機器通過分析大量數據來進行學習。比如說,不需要通過編程來識別貓或人臉,它們可以通過使用圖片來進行訓練,從而歸納和識別特定的目標。機器學習和人工智能的關系機器學習是一種重在尋找數據中的模式并使用這些模式來做出預測的研究和算法的門類。機器學習是人工智能領域的一部分,并且和知識發現與數據挖掘有所交集。①選擇數據:將數據分成三組:訓練數據、驗證數據和測試數據②模型數據:使用訓練數據來構建使用相關特征的模型③驗證模型:使用你的驗證數據接入你的模型④測試模型:使用你的測試數據檢查被驗證的模型的表現⑤使用模型:使用完全訓練好的模型在新數據上做預測⑥調優模型:使用更多數據、不同的特征或調整過的參數來提升算法的性能表現幻燈片2PARTTHREE模型建立PARTTHREE模型建立數據介紹氣象污染數據均來自一個開放的網站。收集的主要氣象污染因素有:PM2.5、PM10、O3、NO、CO、SO2、NO2。選取的數據范圍從2016年1月至2016年6月,分為兩個季度作為兩組數據。為了提高訓練效率,減少相關性弱的因素對預測的干擾,最終選擇相關性較大四個影響因子,分別為O3、CO、NO、PM10。本文選取最終篩選過得大氣污染數據,將PM2.5作為輸出變量y,CO作為變量x1,NO作為變量x2,O3作為變量x3,PM10作為變量x4,首先對數據進行歸一化處理,然后用第二章公式進行轉換,得到最終數據如下:yz1z2z3z4z5z6z7z8z9z10z11z12z13z140.740.590.380.640.120.220.380.070.240.050.080.350.140.410.010.580.530.310.560.150.160.300.080.180.050.090.280.100.320.020.420.410.190.520.140.080.210.060.100.030.070.170.040.280.020.830.540.210.680.150.110.370.080.140.030.100.290.040.460.020.130.030.040.170.360.000.000.010.010.020.060.000.000.030.130.130.170.100.120.200.020.020.030.010.020.020.030.010.010.040.440.310.290.350.090.090.110.030.100.030.030.100.090.120.010.380.320.350.390.240.110.130.080.140.090.090.100.130.150.06PARTTHREE模型建立第一季度模型基于BP神經網絡的PM2.5預測模型基于支持向量機的PM2.5預測模型導入數據幻燈片12幻燈片14PARTTHREE模型建立基于BP神經網絡的PM2.5預測模型運行結果BP神經網絡模型系數圖

PARTTHREE模型建立基于BP神經網絡的PM2.5預測模型運行結果BP神經網絡系數數據圖幻燈片11PARTTHREE模型建立基于支持向量機的PM2.5預測模型運行結果支持向量機模型系數數據圖

回歸方程為PARTTHREE模型建立第二季度模型基于BP神經網絡的PM2.5預測模型基于支持向量機的PM2.5預測模型導入數據幻燈片16幻燈片18PARTTHREE模型建立基于BP神經網絡的PM2.5預測模型運行結果BP神經網絡模型系數圖

PARTTHREE模型建立基于BP神經網絡的PM2.5預測模型運行結果BP神經網絡系數數據圖幻燈片15PARTTHREE模型建立基于支持向量機的PM2.5預測模型運行結果支持向量機模型系數數據圖

回歸方程為PARTFOUR結果分析PARTFOUR結果分析交叉驗證第一步:導入數據(第一季度或第二季度),選擇交叉驗證第二步:在交叉驗證中繼續導入BP神經網絡算法,選擇應用模型,再執行,對模型進行驗證:BP神經網絡PARTFOUR結果分析交叉驗證第一步:導入數據(第一季度或第二季度),選擇交叉驗證第二步:在交叉驗證中繼續導入支持向量機,選擇應用模型,再執行,對模型進行驗證:支持向量機PARTFOUR結果分析BP神經網絡支持向量機BP神經網絡支持向量機1234第一季度結果第二季度結果PARTFOUR結果分析誤差對比表時間BP神經網絡誤差支持向量機誤差第一季度0.100+/-0.0440.656+/-0.452第二季度0.194+/-0.04

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論