《一種基于長短期記憶LSTM的神經網絡模型的空氣質量預測實證研究》10000字_第1頁
《一種基于長短期記憶LSTM的神經網絡模型的空氣質量預測實證研究》10000字_第2頁
《一種基于長短期記憶LSTM的神經網絡模型的空氣質量預測實證研究》10000字_第3頁
《一種基于長短期記憶LSTM的神經網絡模型的空氣質量預測實證研究》10000字_第4頁
《一種基于長短期記憶LSTM的神經網絡模型的空氣質量預測實證研究》10000字_第5頁
已閱讀5頁,還剩23頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

Ⅲ一種基于長短期記憶LSTM的神經網絡模型的空氣質量預測實證研究摘要隨著城市化和工業化的快速發展,空氣污染問題日益突出,空氣質量預測尤為重要。目前,一些有代表性的研究對空氣質量進行實時監測和預報。例如,周光強等人使用數值預測方法來分析華東地區的空氣質量,但是他們的實驗結果表明,這種方法很難預測非常嚴重的污染。SANKAR等使用多元線性回歸預測空氣質量,但實驗結果表明,線性模型預測的準確性較低且效率較低;PEREZ等用統計方法預測空氣質量,實驗結果證明統計方法的預測精度較低。Wang等使用的改進方法的BP神經網絡為空氣質量指數建立了預測模型。實驗證明,BP神經網絡收斂緩慢,容易陷入局部最優解。YANG等利用相鄰網格的空氣質量濃度效應建立了預測隨機森林的PM2.5濃度的模型。森林的PM2.5濃度預測模型通過實驗過程證明網格劃分過程削弱了后續空氣質量分析的質量和效率。從時間角度來看,這些方法很難建模,且較低的預測準確性是一個重要問題。由于預測精度低,可能會導致空氣質量預測結果出現較大誤差。針對空氣質量研究中預測精度低的問題,提出了一種基于長短期記憶(longshort-termmemory,LSTM)的神經網絡模型。該模型使用諸如MSE,MAE,RMSE和r2的指標來測試LSTM神經網絡和比較模型的預測性能。由于北京是一個空氣污染程度比較嚴重的城市,因此使用的實驗數據集來自一個美國駐北京大使館五年來的空氣質量數據,該數據報告了每小時的天氣和污染水平。LSTM神經網絡與多元線性回歸和回歸模型(SVR)的比較結果表明,LSTM神經網絡適用于多變量或多輸入的時間序列的預測問題,LSTM神經網絡具有較高的預測精度,速度快和較強的魯棒性等優點。關鍵詞:空氣質量,LSTM神經網絡,回歸,預測目錄TOC\o"1-3"\h\u1851摘要 .2國內外研究現狀及發展趨勢時間序列是按時間先后順序排列并且內部相關的一組數據。通過對歷史時間序列的分析,可以在一定程度上對未來的長期或短期進行準確的預測,從而為生產實踐帶來更大的收益。迄今為止,人們對時間序列的分析和研究工作已經擴展到氣象、經濟、醫藥、電力、交通等許多領域。對于時間序列的分析具有廣闊的應用前景和重大的現實意義。用于時間序列分析的模型在早期主要集中于傳統線性模型。這種分析模型比較簡單、計算快速。但是,這種傳統線性模型假定了將來值與過去值和隨機誤差之間存在一定的線性函數關系,因此它們通常限于平穩的時間序列研究REF_Ref10250\w\h[5]。隨著研究的逐步深入,線性模型不再能滿足人們的精度要求,無法應用于實際的復雜應用場景,因此出現了非線性模型分析方法,如人工神經網絡、支持向量回歸和遺傳規劃算法。非線性模型具有強大的學習和數據處理能力,并且不需要事先假設數據之間存在什么樣的函數關系。通過對大量樣本數據進行訓練,該模型可以自發地趨近復雜甚至難以用數學公式描述的非線性特征。對于常規的人工神經網絡,樣本輸入節點間是彼此相互離散的,也就是說,網絡本身并不關注輸入節點的時序關系,但是這種關系在某些特定問題中通常是必不可少的,例如對文本情感分析REF_Ref10338\w\h[6]、污染物監測分析REF_Ref10469\w\h[7,REF_Ref10580\w\h8]、醫療跟蹤REF_Ref10808\w\h[9]、價格預測REF_Ref10874\w\h[10]等其他問題的分析與前幾個時刻的輸入密切相關。在不同的輸入時序下,相同的數據將獲得完全不同的結果。為了解決上述問題,人們提出了遞歸神經網絡(RNN),它引入了輸入數據的時間先后順序,并使得分析結果得到了明顯改善。SaadREF_Ref10874\w\h[10]對RNN,時延網絡和概率網絡進行了實驗比較;Lin等REF_Ref11024\w\h[11]首先使用卷積網絡提取數據的高維特征,然后使用RNN網絡挖掘數據的內部時序特征。這種組合網絡改善了分類效果,同時提供了更好的模型可解釋性。然而,傳統的RNN網絡通常存在梯度消失和梯度爆炸的問題,這極大地限制了長時序列預測的效果。因此,Hochreiter等REF_Ref11109\w\h[12]提出了一個長短時記憶網絡(LSTM,即帶有LSTM存儲單元的RNN神經網絡)以有針對性的方式解決這種問題,極大地提升了分析結果,并吸引了大量研究人員研究相關模型的開發和優化。Zhang等REF_Ref11246\w\h[13]和Yang等REF_Ref11389\w\h[14]都使用LSTM網絡來預測海平面溫度(SST)。其中,Zhang等REF_Ref11246\w\h[13]使用LSTM層來挖掘數據內部間的時序聯系,然后通過全連接層將LSTM層的輸出映射到最終的預測結果。Yang等REF_Ref11389\w\h[14]人提出的網絡結構包括LSTM層和卷積層,將空間信息與數據時間信息同時使用,這提高了預測的精度。Karim等REF_Ref11788\w\h[15]提出了ALSTM-FCN網絡結構,簡化了數據集的預處理步驟并提高了分類效果。Zhang等REF_Ref10469\w\h[7]結合小波變換和LSTM網絡,首先對變化很劇烈的原始時間序列數據采用小波變換操作,以獲得多個變化相對較緩慢的子序列,然后為該子序列建立LSTM網絡,最終的預測結果為每個LSTM網絡的預測結果之和。Liu等REF_Ref11382\w\h[16]的ANR-SAE-VAL-STM模型首先對原始時間序列數據進行去噪,然后從經過去噪的數據中提取特征,并將其用作VALSTM網絡的輸入以生成預測結果。它在北京PM2.5和GEFCom2014上的實驗里被證明了網絡結構的有效性。Zhang等REF_Ref12033\w\h[17]提出了一種LSTM網絡和SVM的組合結構來預測電路故障,LSTM從大規模電力傳輸數據中提取時間特征。由于SVM具有出色的魯棒性,因此它負責生成最終的分類結果。也有許多研究人員致力于改善LSTM。例如,Cho等REF_Ref12105\w\h[18]提出了GRU,它減少了存儲單元中門的數量,并減少了參數數量,同時又保證了原始效果。之后Chen等REF_Ref12150\w\h[19]提出了一種基于GRU實施的基于社交平臺評論的預測未來股市波動的方法;Sun等REF_Ref12183\w\h[20]從LSTM和GRU得到啟發,并提出使用GM存儲單元網絡來完成手寫識別任務。綜上所述,隨著神經網絡在現實生活中越來越多的運用,針對較長時間序列的預測問題中,尤其是對于解決大型更加復雜的非線性深度神經網絡模型,首選LSTM是發展的大趨勢。相關技術介紹2.1深度學習(deeplearning)深度學習(也稱為分層學習)是基于數據學習表示的更廣泛的機器學習方法的一部分。它具有多層神經網絡,信息向量在神經元之間傳遞和轉換。上一層神經元輸出的信息向量將成為輸入信息,并傳輸到下一層神經元結構。深度學習分為三類:監督學習,半監督學習和無監督學習REF_Ref24468\w\h[21]。深度學習架構(例如深度神經網絡,深度置信網絡和遞歸神經網絡)已應用于計算機視覺,語音識別,自然語言處理,音頻識別,社交網絡過濾,機器翻譯,生物信息學,藥物設計,醫學圖像分析等其他領域,它們產生的結果可以與人類專家媲美,在某些情況下還比人類專家更好。傳統的表示學習很難從原始數據中提取高級特征或抽象特征,但是深度學習解決了這個問題,并且可以簡單,直接地呈現復雜的應用場景。與傳統的機器學習相比,傳統機器學習的特征提取步驟需要手動完成,不僅效率低下,執行時間長,而且需要大量領域專業知識;深度學習注重于自動學習功能,將學習到的規律性轉移到更深層的網絡組合中,把更簡單些的模型組合到一起,并將數據從一層轉移到另一層以構建更復雜的模型。通過訓練大量的數據,可以區分和簡化不同類型的問題,可以提取更復雜的特征,并且可以自動得出廣泛化模型,而無需人工提取特征,這不僅提高了效率,而且大大縮短了模型生成的時間。深度學習與機器學習對比圖如下圖2-1所示。圖2-1深度學習與機器學習對比圖2.2時間序列(timeseries)時間序列是按時間先后順序出現的數據點。時間間隔可以是不確定的,也可以是固定的。因此,時間序列不是連續數據。例如,大氣環流速度,細胞分裂數和未來的天氣狀況等離散數據REF_Ref24977\w\h[22]。時間序列可用于許多領域,例如計算機科學、歷史、醫學、氣象、軍事科學、管理學等,并且它主要用于涉及時間測量的任何應用科學和工程領域REF_Ref25118\w\h[23]。時間序列分析主要分析序列的潛在特征,并通過此特征來預測未來的時間序列。時間序列預測是使用獲取的數據去預測未來一段時間內的數據。回歸分析通常用于檢驗理論,即考慮兩個序列的當前值之間的關系和影響。時間序列數據具有自然的時間順序,這使得時間序列分析與橫斷面研究不同REF_Ref25219\w\h[24],不需要時間的自然順序(例如,通過參考人們的個人學習經歷來解釋人們的工資,其中他們的健康就沒有時間上的先后排列)。時間序列分析不同于空間數據分析,有必要觀察地理位置(例如,根據城市和距中心區域的距離來計算本地房價)。時間序列隨機模型的觀測結果它比單個觀測具有更強的泛化能力,此外,時間序列模型通常遵循時間的單向自然順序,并且僅受流逝的時間序列的影響,與未來的時間序列無關。當空氣質量預測模型中的初始值和預測值之間的特征關系逐漸變得清晰時,將從動態角度結合空間和地理因素研究空氣質量。許多研究證明,空氣質量或人們過去簡單地稱為天氣模型是一種混沌的時間序列模型REF_Ref25598\w\h[25]。它是自然產生的并具有無序性,但是當它與過去的數據關聯時,它會顯示出有序性,這表明人們可以通過適當的方法對其進行預測。從隨機時間序列的角度分析序列的平穩性。假設存在一個平穩的時間序列Y1Y2Y3Y4...Yt,則它具有以下特征:每個平穩的時間序列Y之間都具有固定的時間間隔,因此,它們之間的協方差之間沒有時間相關性。另外,Y是隨機分布的序列,并且均值和方差沒有時間相關性,并且是一個固定值。以上就是平穩時間序列的特征。2.3循環神經網絡(RNN,recurrentneuralnetworks)RNN是一種非常強大的算法,可以對數據(尤其是時間序列和文本)進行分類、聚類和預測。RNN可以看作是在體系結構中添加了環路的MLP網絡。在圖2-2中,你可以看到有一個輸入層(包含X1,X2之類的節點),一個隱藏層(包含h1,h2之類的節點)和一個輸出層(包含y1,y2之類的節點)),類似于MLP體系結構。區別在于隱藏層的節點相互連接。在普通的RNN中,節點沿一個方向連接,這意味著h2取決于h1,h3取決于h2。隱藏層中的節點由隱藏層中的上一個節點所決定REF_Ref25967\w\h[26]。RNN公式可以表示為式中:wxh是輸入到隱層的矩陣參數;whh是隱層到到隱層的矩陣參數;bh為隱層的偏置向量(bias)參數;σ可以為Sigmoid,tanh或ReLU函數。圖2-2RNN結構REF_Ref25967\w\h[26]2.4長短時記憶網絡(LSTM,longshort-termmemory)RNN神經網絡在處理長時序列時容易出現爆炸梯度REF_Ref26127\w\h[27]的問題,其準確性通常要差一些。為了解決這個問題,Hochreiter等REF_Ref11109\w\h[12]首先引入了LSTM,并成為成功的體系結構。LSTM神經網絡是RNN神經網絡結構的一種變體。其主要思想是引入自適應門控機制,該機制決定LSTM單元保持先前狀態的程度并記住當前數據輸入的提取特征。盡管已經提出了許多LSTM變體,但LSTMREF_Ref26891\w\h[28,REF_Ref26901\w\h29]的標準架構仍用于空氣質量模型預測。圖2-3顯示了帶有門的LSTM[30]存儲單元。通常,LSTM的遞歸神經網絡由以下組件組成:輸入門it具有對應的權重矩陣wxi,whi,wci,bi;遺忘門ft具有對應的權重矩陣wxf,whf,wcf,bf;輸出門ot具有對應的權重矩陣wxo,who,wco,bo。輸入門的功能是有選擇地將新信息記錄到細胞狀態中。遺忘門的功能是在單元狀態下有選擇地遺忘信息。輸出門的功能是輸出細胞的一些信息。所有這些門均設置為使用電流輸入xi生成一定的度數,在上一步中生成的狀態hi-1以及此單元ci-1的當前狀態(窺視孔),用于確定是否接受輸入并忘記先前的存儲內存,然后輸出稍后生成的狀態。圖2-3帶有門的LSTM存儲單元REF_Ref27097\w\h[30]2.5TensorFlow介紹TensorFlow是一個開源軟件庫,基于數據流程圖和跨越一系列任務的可區分編程。它是GoogleBrain團隊開發的第二代系統,并于2015年11月9日根據Apache2.0開源許可發布。TensorFlow支持從大到臺式機,GPU和CPU到平板電腦和手機的多種設備,開發人員都可以使用它。此外,該平臺還具有許多內置的機器學習模型,使用戶可以隨意選擇最合適的模型,而不必擔心如何實現底層代碼。TensorFlow支持多種開發語言。當前,被普遍使用的是Python,其他語言如JavaScript,C++,Java,Go和Swift也逐漸被廣泛使用。TensorFlow的名稱早已體現了它的兩個重要概念:Tensor“張量”和Flow“流”。它是一個編程系統,以計算圖的形式來表述。該模型的實現主要分為三個步驟:構造數據流圖,選擇和訓練模型以及應用模型。其中,TensorFlow的輸入“張量”包括輸入變量,模型中的變量和其他變量。TensorFlow它具有以下優點:(1)高靈活性,TensorFlow不是嚴格的“神經網絡”庫。你只需要確定適當的張量和過程即可構建自己的神經網絡模型,并且可以使用體系結構中現成的工具來構建自己的“上層庫”。并可以迎合自己的創造力,編寫出獨特的整合操作。底層數據庫也可以通過C++編碼添加。(2)可移植性,TensorFlow支持多種設備,并且可以在臺式機,GPU,CPU,平板電腦,移動電話和其他設備上同時運行,而無需修改代碼。訓練后的模型可以直接應用于移動應用端app或云服務服務器。(3)科學研究和產品聯系在一起。開發人員可以直接通過TensorFlow將科學研究中的新思想直接應用于產品,并將其直接提供給在線用戶,從而提高代碼共享的效率并提高科學研究的產出率。(4)TensorFlow支持多語言,具有C++的界面和易于使用的python界面。此外,還可以使用其他語言來創建用戶界面,例如Go,Java,Lua,JavaScript或R.(5)性能最優化。TensorFlow可以協調和管理線程,隊列和異步操作,從而可以充分利用硬件的性能,并將計算元素分配給設備的各個方面以提高操作效率。本文使用了TensorFlow平臺作為算法支撐。

3.基于LSTM網絡預測的研究方案本課題是基于LSTM網絡的空氣質量預測,對該課題的研究就是建立LSTM預測模型。LSTM預測模型由導入庫并讀取查看數據、數據預處理、建立模型并訓練、模型預測并可視化四部分構成。導入庫并讀取查看數據。本課題數據集使用的是一個五年來美國駐中國北京大使館每小時報告天氣和污染水平的數據集。將所給原始數據導入庫并讀取查看數據。數據預處理。在實際實驗中,待分析的時間序列時候往往會比較粗糙,由于人為原因或者機器系統問題,往往會存在很多的異常數據或者缺失值,數據之間的特征不明顯或者關聯性過低,但是數據的準確性與真是性對飾演的結果起了決定性的作用,所以為了提高計算的效率,減少冗余的計算步驟,經常會對數據進行必要的處理,比如清理,實例選擇,規范化,轉換,特征提取和零均值處理等。對數據的預處理包括以下步驟:定義讀取格式、丟棄編號列、更改列名、把所有NA值用0替換、丟棄前24小時、將預測數據PM2.5列放到最后一列、整理好的數據顯示。建立模型并訓練。建立模型包括以下幾個步驟:為LSTM模型做數據準備、在多變量輸入數據上擬合LSTM模型、將輸入變量轉變成LSTMs需要的三維格式、定義和擬合LSTM模型、LSTM模型訓練。在定義和擬合LSTM模型過程中,確定隱藏層和輸入層神經元個數,選擇合適的損失函數和優化算法。最后,記錄訓練集和測試集的損失,并在完成訓練和測試后繪制損失圖。模型預測并可視化。進行模型預測并可視化后,可以從輸出的圖形中看到真實輸出、測試數據的預測輸出。建立LSTM預測模型的流程圖如圖3-1所示。圖3-1LSTM預測模型流程圖

4.基于LSTM網絡的空氣質量預測的研究與分析4.1導入庫并讀取查看數據本課題數據集使用的是一個五年來美國駐中國北京大使館每小時報告天氣和污染水平的數據集BeijingPM2.5DataSet。這些數據包括日期時間、被稱為PM2.5濃度的污染,以及包括露點、溫度、氣壓、風向、風速和累計雨雪時數等天氣信息。原始數據中完整的特征列表如下表4-1:表4-1原始數據中完整的特征列表NO行號year該行記錄的年month該行記錄的月day該行記錄的日hour該行記錄的小時PM2.5PM2.5濃度(細顆粒物指環境空氣中空氣動力學當量直徑小于等于2.5微米的顆粒物。它能較長時間懸浮于空氣中,其在空氣中含量濃度越高,就代表空氣污染越嚴重)DEWP露點(又稱露點溫度(Dewpointtemperature),在氣象學中是指在固定氣壓之下,空氣中所含的氣態水達到飽和而凝結成液態水所需要降至的溫度)TEMP溫度PRES大氣壓力cbwd組合風向lws累計風速ls累計小時下雪量lr累計小時下雨量下面是原始數據集的前幾行,如下圖4-2所示。圖4-2原始數據前幾行至此,這些數據還不能使用。我們必須先做好準備,將其導入Spyder中并顯示出來。在經過如圖4-3所示代碼實現導入模塊、定義讀取格式后得到的數據如下圖4-4所示。圖4-3實現導入模塊、定義讀取格式的代碼圖4-4導入庫并讀取查看數據所得圖4.2數據預處理在上述導入庫并讀取查看數據后,接下來就是對數據進行處理以便于數據分析。可以看到日期和時間是分開的,第一步把日期時間合并為一個datetime,以便將其作為Pandas里的索引。看數據表可知,第一個24小時里,PM2.5這一列有很多空值。因此,我們把第一個24小時里的數據行刪掉。剩余的數據里面也有少部分空值,為了保持數據完整性和連續性,只要將空值填補為0即可。在經過如圖4-5所示代碼實現丟棄編號列、更改列名、把所有NA值用0替換、丟棄前24小時、將所預測數據PM2.5放到最后一列后得到的數據如圖4-6所示。圖4-5實現丟棄編號列、更改列名、把所有NA值用0替換、丟棄前24小時、將所預測數據PM2.5放到最后一列的代碼圖4-6數據預處理后得到的數據圖至此已經得到了易于使用的數據形式,接下來看看空氣污染時間序列的線性圖。經過如圖4-7所示代碼實現加載數據集、指定要繪制的列、繪制每一列后得到的線性圖如圖4-8、4-9所示。圖4-7實現加載數據集、指定要繪制的列、繪制每一列的代碼圖4-8露點、溫度、大氣壓力、組合風向的時間序列線性圖圖4-9累計小時下雪量、累計小時下雨量、PM2.5濃度的時間序列線性圖時間序列線性圖4-8、4-9展示出每一特征的分布圖表,是數據在圖表中的一種展現形式。再創建每一特征的相關性圖,得到每一特征的相關性圖如圖4-10所示。圖4-10每一特征的相關性圖圖4-10展示的是每一特征之間的相關性。4.3建立模型并訓練經過上述數據預處理后,接著就可以開始建立LSTM模型了。第一步為LSTM模型準備數據。將數據集構建為監督學習問題,并且對輸入變量進行標準化得到如圖4-11所示數據圖。圖4-11數據圖圖4-11所展示出的數據就是為LSTM模型所準備好的數據。為LSTM模型準備好數據后就可以在多變量輸入數據上擬合LSTM模型了。這一步是將數據分割為訓練集和測試集,然后將訓練集和測試集分別拆分為輸入和輸出變量。最后將輸入變量轉變成LSTMs需要的三維格式(即樣例、時間步、特征)。所執行的代碼如圖4-12所示,圖4-12在多變量輸入數據上擬合LSTM模型的代碼執行圖4-12所示代碼后,訓練和測試的數據劃分為:42000小時的數據用于訓練,1799小時的數據用于測試。現在就可以開始定義和擬合LSTM模型了。學習率函數取每隔100個epoch,學習率減小為原來的1/10。LSTM模型的構成:兩個LSTM層(第一個LSTM層有500個神經元,第二個LSTM層有256個神經元)、兩個drop層(drop比率為0.1)、一個普通神經網絡層(64個神經元)、激活函數(用的relu函數)、損失函數(用的mae函數)、優化器(用的Adam)、一個輸出層。該模型訓練100次,批量大小為200。建立LSTM模型的關鍵代碼如下圖4-13所示,LSTM模型結構如下圖4-14所示。圖4-13定義和擬合LSTM模型的關鍵代碼圖4-14LSTM模型結構LSTM模型建立好后就可以進行訓練了。訓練過程中的多元LSTM的訓練和測試損失趨勢線便可以繪制出來了,如圖4-15所示。圖4-15訓練過程中多元LSTM的訓練和測試損失的線圖圖4-15展示出多元LSTM訓練過程中的訓練損失和測試損失。4.4模型預測并可視化在經過代碼實現做出預測、計算預測指標后得出預測評價指標如下:MSE=0.003;MAE=0.029;RMSE=0.056;r2=0.927然后在經過如圖4-16所示代碼實現反向縮放預測值、反向縮放實際值、繪圖后得到PM2.5的真實值與預測值的圖,如圖4-17所示。圖4-16實現反向縮放預測值、反向縮放實際值、繪圖的代碼圖4-17PM2.5的真實值與預測值圖4-17展示出的是LSTM模型訓練完后對PM2.5濃度作出的預測值和真實值的曲線圖。4.5結果與分析上述通過建立LSTM網絡預測模型,利用訓練得到的模型對空氣質量的PM2.5濃度進行預測,根據課題的目的(針對已有的空氣質量數據,采用深度LSTM網絡模型,根據前幾個小時的空氣質量數據預測未來一小時的空氣污染情況)可知,在建立的LSTM模型得到的結果中,預測評價指標中MSE、MAE、RMSE越接近0,r2越接近1,則表示模型預測得到的PM2.5的濃度真實值與預測值越接近,即在如上圖4-15的曲線圖中,模型預測得到的PM2.5的濃度值的預測值曲線越趨近真實值曲線。要想得到更趨近于0的預測評價指標MSE、MAE、RMSE,更趨于1的預測評價指標r2,就要不斷調整LSTM模型中的參數(神經元個數、網絡層數、batchsize、epoch等)。取不同的模型參數所得到的預測評價指標就不同,當我取如圖4-19所示的LSTM模型2參數時,記圖4-14模型結構為LSTM模型1,則LSTM模型1與LSTM模型2的參數對比如表4-18所示,表4-18LSTM模型1與LSTM模型2的參數對比神經元個數bitchsizeepoch網絡層數LSTM模型1500,256,642001002,1LSTM模型250,256,641001002,1圖4-19LSTM模型2結構所得到的預測評價指標為:MSE=0.003;MAE=0.031;RMSE=0.058;r2=0.922相應的訓練過程中的多元LSTM的訓練和測試損失趨勢線如下圖4-20所示、圖4-20訓練過程中多元LSTM的訓練和測試損失的線圖從圖4-20所展示的多元LSTM訓練過程中訓練損失和測試損失曲線可以看出,LSTM模型2訓練過程中測試損失低于訓練損失,即LSTM模型2可能過度擬合訓練數據。PM2.5的真實值與預測值的圖則如下圖4-21所示。圖4-21PM2.5的真實值與預測值上述LSTM模型2預測評價指標(MSE、MAE、RMSE、r2)、訓練過程中的多元LSTM的訓練和測試損失趨勢線和PM2.5的真實值與預測值的圖與LSTM模型1的相對比可知,這組LSTM模型2參數選取的沒有LSTM模型2的參數選取的好。由以上分析可知,在LSTM模型中參數選取的越合適,模型所預測出的值就越越趨近與真實值。5.總結與展望5.1總結首先我們介紹了基于LSTM網絡的空氣質量預測這一課題的研究背景及意義;接著我對課題的相關技術做了簡單介紹;第三部分簡單介紹了我對該課題的研究方案;接著根據上述研究方案,進行了數據集導入庫并查看數據、數據預處理、建立模型并訓練、模型預測并可視化后得到結果并分析,我所訓練的模型中測試集的預測評價指標最好的一組是MSE=0.003、MAE=0.029、RMSE=0.056、r2=0.927.5.2展望雖然對于本篇論文所研究的課題,已經盡可能的對數據,特征,代碼的實現和修正進行了研究,由于本人能力有限,文章中還存在需要優化和改進的部分,主要從以下幾點進行說明:首先是本文數據的獲取是已給定的一個五年來美國駐中國北京大使館每小時報告天氣和污染水平的數據集。數據是以一天24小時每小時作為記錄,因此數據的質量不是非常高,在以后進行的研究可以基于半小時進行采樣和記錄,這樣數據的質量會更高一些,預測系統的搭建會更加完善一些。其次,在本文對于特征維度的選取過程中,選擇的是PM2.5的濃度,后續還可以考慮一些大氣主要污染物相關的維度,如二氧化硫SO2、氮氧化物NOX等一些指標,關聯到空氣質量指數中,以進行更深層次的數據關系的探討;并且在本文中,我們的目標值是PM2.5的濃度,我們進行的是回歸,當然我們有PM2.5濃度的數值,也能得出他所在的級別,根據我們的數據維度,也可以考慮對等級進行分類預測。最后就是在模型的訓練過程中,對于模型的參數調整的還不夠好,在以后的研究中,可以對于模型的不同參數實現更為詳細的調參過程。參考文獻付彥麗.基于神經網絡的PM2.5質量濃度預測研究[D].陜西西安:陜西科技大學,2016.PEREZVA,ARASAR,CODINAB,etal.Enhancingairqualityforecastsovercatalonia(spain)usingmodeloutputstatics[J].JournalofGeoscienceandEnvironmentProtection,2015,3(8):9-22.CHENJianjun,LUJin,AVISEJC,etal.SeasonalmodelingofPM2.5incalifornia’ssanjoaquinvalley[J].AtmosphericEnvironment,2014,92:182-190.ZHOUGuangqiang,XUJianming,XIEYing,etal.Numericalairqualityforecastingovereasternchina:anoperationalapplicationofwrf-chem[J].AtmosphericEnvironment,2017,153:94-108.SELVINS,VINAYAKUMARR,GOPALAKRISHNANEA,etal.StockpricepredictionusingLSTM,RNNandCNN-slidingwindowmodel[C]∥2017InternationalConferenceonAdvancesinComputing,CommunicationsandInformatics(ICACCI).IEEE,2017.SHIS,ZHAOM,GUANJ,etal.Ahierarchicallstmmodelwithmultiplefeaturesforsentimentanalysisofsinaweibotexts[C]InternationalConferenceonAsianLanguageProcessing.IEEE,2017:379-382.HUY,SUNX,NIEX,etal.AnEnhancedLSTMforTrendFollowingofTimeSeries[J].IEEEAccess,2019,7:34020-34030.ZHANGQ,LIF,LONGF,etal.VehicleEmissionForecastingBasedonWaveletTransformandLongShort-TermMemoryNetwork[J].IEEEAccess,2018,6:56984-56994.WANGR,LIANGX,ZHUX,etal.AFeasibilityofRespirationPredictionBasedonDeepBi-LSTMforReal-TimeTumorTracking[J].IEEEAccess,2018,6:51262-51268.SAADW.Comparativestudyofstocktrendpredictionusingtimedelay,recurrentandprobabilisticneuralnetwork[J].IEEETransactionsonNeuralNetworks,1998,9(6):1456-70.LINS,RUNGERGC.GCRNN:Group-ConstrainedConvolu-tionalRecurrentNeuralNetwork[J].IEEETransactionsonNeuralNetworksandLearningSystems,2018,29(10):4709-4718.HOCHREITERS,SCHMIDHUBERJ.Longshort-termmemo-ry[J].NeuralComputation,1997,9(8):1735-1780.ZHANGQ,WANGH,DONGJ,etal.PredictionofSeaSurfaceTemperatureUsingLongShort-TermMemory[J].IEEEGeo-scienceandRemoteSensingLetters,2017,14(10):1745-1749.YANGY,DONGJ,SUNX,etal.ACFCC-LSTMModelforSeaSurfaceTemperaturePrediction[J].IEEEGeoscienceandRemoteSensingLetters,2018,15(2):207-211.KARIMF,MAJUMDARS,DARABIH,etal.LSTMFullyConvolutionalNetworksforTimeSeriesClassification[J].IEEEAccess,2017,6(99):1662-1669.

LIUF,CAIM,WANGL,etal.AnEnsembleModelBasedonAdaptiveNoiseReducerandOver-FittingPreventionLSTMforMultivariateTimeSeriesForecasting[J].IEEEAccess,2019,6:26102-26115.ZHANGS,WANGY,LIUM,etal.Data-basedLineTripFaultPredictioninPowerSystemsUsingLSTMNetworksandSVM[J].IEEEAccess,2017,6:1-1.CHOK,VANMERRI?NBOERB,GULCEHREC,etal.LearningphraserepresentationsusingRNNencoder-decoderforstatisticalmachinetranslation[J].arXiv:1406.1078,2014.CHENW,ZHANGY,YEOCK,etal.Stockmarketpredictionusingneuralnetworkthroughnewsononlinesocialnetworks[C]∥2017InternationalSmartCitiesConference(ISC2).IEEE,2017:1-6.SUNL,SUT,ZHOUS,etal.GMU:ANovelRNNNeuronandI

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論