




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
LSTM神經網絡在極端天氣事件預測中的潛力與挑戰摘要的方法,并采用專門解決普通循環神經網絡長時依賴問題的長短時記憶網絡(LONG題,提出使用ReLU激活函數以及加入正則化手段改進等策略,通過優化后 32相關技術 42.1引言 52.2經典時間序列預測方法 52.2.1時間序列的概念 52.2.2氣溫時間序列預測技術和方法 62.2.3循環神經網絡 82.2.4LSTM神經網絡 2.3數據處理一般流程 2.4其它時間序列預測模型 2.5深度學習 2.5.1深度學習概念 2.5.2深度學習流程 2.5.3損失函數定義 2.6本章小節 3基于LSTM的氣象預測模型構建 3.1數據處理 3.2LSTM氣溫預測模型構建 4.LSTM模型實驗結果與分析 244.1模型環境搭建 4.2模型效果評估指標 4.3LSTM模型實驗結果與分析 4.4滑動時間窗改進 4.5本章小結 5總結與展望 335.1總結 5.2展望 參考文獻 31緒論生命危害和重大財產損失。據美國國家氣候數據中心報告,2012年間,美國有超過11從中可以看出一些端倪運輸部門的報告顯示,24%的汽車事故是因為天氣原因;天氣直在國外,MaqsoodI以及KhanMR等人通過對加拿大薩斯喀徹溫省南部天氣預報的適用性問題的考察,提出了多層感知器MLPN網絡,Elman簡單遞歸神經ERNN網絡、單層霍普菲爾德HFM模型和基于徑向基函數的RBFN網絡四種模型,并分別使用溫度,風速和相對濕度的數據在MATLAB中進行訓練和提前24小時的預測,但僅僅是對幾種預測方面,Singh,等人通過對氣象中提出了基于時間序列的遺傳算法(GA)和神經網絡相結合的綜合反向傳播溫度預測模型(GeneticAlgorithm)技術加BP神經網絡的實時溫度預測模型,在這特定情況下兩者都考4實驗,并未涉及精細化預測方面(薛宇峰,馬思敏,2021)。AznarteJL和SiebertN將四個機器學習算法,廣義線性模型(generalizedlinearmodels),多變量自適應回歸樣條(multivariateadaptiveregressionsplines),隨機森林(randomforests)和分位數隨機森林估實驗方法,將多任務學習線性評估的思想引入,對于進行溫度預測有很好借鑒意義(李國內針對氣象預測的研究總體相對滯后,但也出現了不少值得學習的成果,體現出國內專家學者們對數值天氣預測問題的重視。比如黃文杰,曹鴻興等人早在上個世紀就在長期氣象預測的應用中以ARIMA作為季節模型進行定量分析,這一時期ARIMA模型被廣泛應用于時間序列的預測研究(王書恒,陳怡靜,2022);劉星辰,鄧思潔為了提高降雨量的預測精度,提出了一種時間序列預測(ARIMA)并結合小波進行變換的降雨量預測模型;云南省水利水電科學研究院的白致威等人建立了SPEI序列自回歸移動平均模型(ARIMA),用于對干旱進行提前一步進行預測;就上述方案的調試而言,本文從理論探索與實踐求證兩方面著手。理論探索部分,深入分析了方案設計的核心理念與預期成效,通過構建理論框架與邏輯鏈條,為后續實驗奠定了堅實的理論基礎。緊接著,在實踐求證環節,本文精心策劃了一系列實驗,以驗證方案的有效性與可靠性。實驗過程中,采用了嚴謹的信息采集與分析策略,確保結果的真實無誤。同時,為深入評估方案在不同環境下的適用性,本文還考慮了多種典型應用場景,并據此調整了系統配置。這一過程不僅驗證了方案的正確性與可行性,也為后續科研提供了寶貴的參考材料。解放軍理工大學張俊豪,楊琳等人將貝葉斯分類應用到雷暴預測當中;南京信息工程大學的智協飛等即應用貝葉斯模式平均法(BMA)將中國氣象局(CMA)美國國家環境預報中心(NCEP)和ECMWF三個模式的預報結果進行多模式氣溫集成。但這些經典時間預測方法,未計及多元氣象因子。在此情勢發展下蘭州大學陳浩然,胡曼麗等提出了多維時間序列數據挖掘模型,將多維序列進行符號化,利用規則提取降雨天氣模型;馬廷淮,穆強等人分析了提出利用數據挖掘技術。在氣象業務中應用的問題,并結合氣象應用提出了氣象數據挖掘研究的重點,只是對數據挖掘技術的一般應用。段文廣,周曉軍等提出BP神經網絡進行精細化溫度預報的方法。該方法基于時序分析技術,通過在歷史序列的溫度樣本進行迭代學習來建立起預測模型。該模型僅使用了簡單的三層神經網絡,僅使用了溫度單一屬性對溫度進行預測研究,考慮了歷史24個小時的數據進行提前24小時的預測,對于歷史序列信息利5和非線性自回歸(NVR)神經網絡技術,來構建氣象要素時間序列預測;南京信息工2相關技術于統計經濟學技術以及基于機器學習等算技術的出現,無限拓2023)。有很多的預測問題,都包含著時間的分量,鑒于當前環境正因為包括著時間分方法分析氣象數據,特別是使用時間序列的分析方法,作為一個專門的研究方向,成時間序列可認為是表征系統在不同時間點動態特征或是由非線性動態方程描述的被控對象在某特定采樣間隔的一連串數據。對時間序列的研究,最早可追溯到公元前65000年,成果被廣泛應用于工業界、醫療學、氣象學、物理學、生物學、經濟學、環型,其表現出多方面的特征,一方面是其無序性,而另一方面它卻很“有序”,天氣的變化呈現出的自相似的分形結構也說明了天氣在短期內是具備可預這在理論上保證了從時間序列的角度分析序列平穩性,假設存在著一個平穩時間序列。那么,它將具有以下特征:序列Y的每個取值都是一個概率分布隨機序列,并且其滿足的均值、方差都是與時間t不相關的固定值,當時間間隔確定后,在這個脈絡里進行其協方差也與2021)。舉例來說,如圖示2.1所示顯示了30年間部分溫度抽樣數據在時間序列上的波2023)。圖中氣溫值隨著時間移動而呈現有規律周期性變化,在時間維度上表現出了較然,2022)。7溫度預測顧名思義是個預測問題,一想到分類問題,我們首先會想到的是神經網絡,神經網絡可以解決非線性回歸問題,通過監督學習獲得的數據和標簽之間的映射關系。其中,BP神經網絡(由Rumelhart,McCelland等提出,1986)是使用最廣泛的一種,它把神經網絡分為三層,輸入層,隱藏層,還有輸出層(吳服,王宛雪,2020)。每一層有很多個神經元構成,每一個神經元由加權求和,偏置向量,在這個脈絡范圍內還有激活函數三部分構成,激活函數具有連續可微的特性可以提高網絡建模能力以解決非線性回歸問題的能力。在多層神經網絡當中,如果缺少激活函數,即使網絡深度增大,也只能解決性通常情況下神經元的輸出可以表示為(周佳寧,魏Relu:常作為隱藏層的激活函數Sigmoid:通過用于輸出層處理二分類問題(李昊然,高佳琪,2022)Softmax:通過用于輸出層處理多分類問題8但在處理連續的溫度數據中,神經網絡有一種廣泛的缺陷,就是他只學習輸入數據和輸出的目標標簽之間的關系,這明顯體現了而沒有學習時間點前溫度和時間點后溫度之間的關系,這意味著神經網絡無法學習溫度變化的的連貫性(王天佑,趙昕婷,2020)。在模型中,沒有考慮到溫度變化的的連貫性和協調性,在一定程度上,魯棒性還有準確率的下降。與已有文獻結論的一致性,標志著前期研究構思的穩健性得到了實證的支撐。這一結果不僅加深了本文對特定領域內復雜關系的理解,還激發了本文對潛在未知因素的探索興趣。它提示本文,未來的研究可以更加聚焦于揭示那些尚未被充分理解的機制,以及它們如何與已知因素相互作用,共同塑造出觀察到的現象。同時神經網絡的可解釋2.2.3循環神經網絡循環神經網絡的鼻祖是RNN網絡,RNN網絡在某種程度上克服了傳統的BP神經網絡假設輸入向量是互不關聯的這一結構缺陷,添加了由時間序列產生的隱藏狀態,輸出也依賴于這個隱藏狀態,圖2.3為一個RNN模型展開一個完整的網絡,其數學表達如o"o"h?whWxo°”U↑vh"UhWWUxxxt是t時刻的輸入,h是在t時刻的隱藏層狀態,其計算公式如下所示(楊景華,蔡f?為激活函數函數的種類有在溫度預測問題當中我們使用一般Relu作為激活函數。和BP神經網絡只能讀取一個標量不一樣的是RNN神經元可以讀取一個向量。9CO+OutputoflastNonlinearities:Scalingof+x+O+bLSTM的輸入有輸入向量、上一層網絡輸出的狀態值Ct-1,ht-1三個部分。而其輸其中W是遺忘門的權重矩陣,bf是遺忘門的偏置項,表示了遺忘門輸出的輸入門輸出的計算,除此以外ht-1,xt還會構成一個新的候選值向量Ct用以生成新的細由上述公式也可以看出LSTM的神經元的隱藏層比RNN更加復雜,其在梯度求解時式子是累加的形式,服了RNN神經元在梯度求解時候由于累乘而導致gradient加注重理論與實踐的結合,通過實地調研、案例分析等方式,將研究成果應用于實際問題的解決中。同時也會積極尋求與業界、政府等機構的合作,共同推動研究成果的轉化和應用,為社會經濟發展貢獻力量。在后續的研究中會對已有的研究成果進一步從不同的角度進行優化,會積極尋求與其他學科的交叉融合通過跨學科的研究視角,本文期望能夠發現新的研究問題和研究方向,為相關領域的發展注入新的活力。在LSTM結構中,由于其獨特的三種門結構和其有存儲功能的單元狀態的存在,LSTM能夠較好地學習長時期的歷史數據信息,從而解決長期的數據依賴關系。首先,當前t時刻的單元狀態通過遺忘門控制上一時刻t-1的單元狀態C-1中有哪些信息需要舍棄,有哪些信息可以繼續保留下來(趙宇昊,李佳琳,2021)。其次,在這特定情況下基于單元狀態Ct在遺忘門中舍棄了一些信息,所以它需要通過輸入門中來學習新的信息。通過一系列計算之后單元狀態Ct得到了更新,此時LSTM利用輸出門,單元狀態C和一個tanh層決定最終的輸出值h。對于拿到的粗糙數據集,必須對數據進行篩查、清洗等相關預處理,同時為了提高計算效率,還會進行零均值處理,為了判斷序列是否平穩還將使用到白噪聲檢測(可通零均值處理是對屬性中的每個值分別對這一列的平均值求差,轉換后的一列數據取值范圍變小,但保留了原有變化規律。對于具有季節特征,鑒于當前環境如氣溫預測在預處理時,需要考慮加入周期性差分操作,減少由于季節因素帶來的周期性影響。迭代差分計算,使用平穩性檢測方法進行檢驗,直到得到平穩性序列為止。常用到的平穩性檢驗有圖檢驗、假設檢驗,如單位根ADF(Dicky-Fuller-Test)檢驗法。通過對均值、自相關系數(ACF)以及偏自相關系數(PACF)在序列樣本中的不同表現的判斷,確立模型各個參數。在這樣的情形下但這種觀察判別的方式,有時會帶來極大的誤差,使判別出的模型預測效果并不理想(劉清華,張悅琳,2022)。在定價過程中常常采用AIC或是BIC的方式,本文采用了通過BIC自動定階算法,算法的思想是通過判斷不同的p與q值取值,從而計算出不同的BIC取值,找到使BIC值最小的p和q組合,即為ARMA模型的階數,核心代碼見圖2-3,其中函數中的N為達到平穩時所通模型確定后,一般需要再次對確定好的模型階數,進行效驗檢查,以達到效驗模型所定價數的準確,從而確定最終模型,效驗方式與前面類似。可以采用絕對百分比誤差MAPE、絕對平均誤差MAE或是平方根誤差RMSE等一系列回歸預測中用到的度量方式。2.4其它時間序列預測模型其它的時間序列預測模型還有(楊怡菲,朱嘉欣,2020):基于灰色理論預測模型、基于混沌預測模型等。其中,灰色預測模型是在灰色系統的基礎上提出,灰色系統是介于全部信息未知的黑色系統和全部信息已知的白色系統之間的未知系統,在這個脈絡里進行而預測這個系統的模型就是灰色預測模型。灰色預測模型的概念源自于應用數據領域,是一種對未來要素系統進行預測的常見手段。它通過對預測對象時間序列特征進行分析與判別構造成灰色預測模型,從而預測下一個序列時間的值或獲悉到達某個設定值時間的方法。灰色預測模型有很多,常用到的有GM(L1),CGM(1,1),SGM(1,2.5深度學習1965年,Ivakhnenko以及V.G.Lapa發表了第一個具有多層次功能的深度學習網絡:GMDH,該網絡用到的學習算法被稱為數據處理組或稱GMDH組(張怡然,GMDH具有全自動結構和參數優化的模型,在這特定框架內其網絡節點的激活函數是允許加法和乘法的Kolmogorov-Gabor多項式。Ivakhnenko在1971年的文章又描述了具有8層深度前饋多層感知器的學習網絡,這比許多以往的網絡具備更加深入的層次結構MS。這種監督學習網絡逐層遞增傳播,每層通過回歸分析進行訓練,使用驗證集來檢測無用的神經元,并通過正則化修剪,所獲到網絡的大小和深度取決于問題。這種方法的出該方案相比于其他方案具有更好的性價比,同時它還強調了環境可持續性,通過減少能源消耗和廢物排放來支持綠色技術的發展。這一特點對于追求可持續發展目標的企業或組織來說尤為重要。深度學習(Deeplearning)通過較簡單直觀的表示來表達出復雜的應用和場景,解決了表示學習(RepresentationLearning)中的無法從原始數據中提取高層次、抽象特征等問題相對比于傳統的機器學習,在這個脈絡范圍內深度學習研究的模型涉及更多學到“功能"或學習到“概念規律性"的多層次組合(王志軒,劉雅婷,2020)。深度學習模型的典型例子是前饋深度網絡,也被稱為多層感知機(Multi-LayerPerceptron,MLP)網絡深度學習算法通過對多層結點的設置,從而使得不同類別的問題更加可分,可以學習到更加復雜的事物特征(陳睿,鄭玉菲,2022)。深度學習是機器學習體系的一種延伸,這明顯體現了由神經網絡向深度發展而來,除了可以學習到特征和任務之間的關聯,還能自動從簡單特征屮提取到更加復雜的特征。深度學習的一般步驟與機器學習和傳統學習步驟有很多相似之處,常規的深度學習流程,可分別從定義問題、數據預處理、特征學習、模型確立、組織訓練以及對模型評估等幾個方向,大體有如圖2-5所示幾個步驟。(1)問題定義問題定義指要明確深度學習需要探索的問題,充分了解問題背景,需要研究的相關領域的數據收集或業務開展情況,將具體問題解釋成能讓機器通過學習得到解的問題,(2)數據預處理實際的應用中,由于人為誤操作、系統故障、存儲丟失等各方面的原因,可能造成的數據的離散、重復冗余等情況,度好的數據來源是模型訓練成功與否的關鍵。因此,必須對數據進行必要的清洗預處理(王彥博,劉紫琪,2023)。同時,這明顯體現了為了滿足特定模型需要,還要結合實際任務,完成增加對數據集進行數據轉換,標準化等處理任務網。(3)特征學習深度學習除了可以學習特征以及任務之間的關聯外,還能從簡單特征中學習到更加復雜的特征。因此,特征選擇步設置對于深度學習過程也至關重要,經常也與數據預處理同步完成。(4)模型選擇深度學習工具的選擇根據不同的任務要求改變,不同的數據特征使用到的模型也會不同。對于特定的目標需求要確定合適的深度學習模型進行訓練,這里還會包括著更加具體的對模型優化以及代價函數、激活函數、輸入輸出單元等結構的定義與選擇。(5)模型訓練根據機器學習任務的模型的結構和數據特點等情況,選擇合適的學習型算法進行訓練,以貼近目標與期望。(6)模型評估模型評估通過相應的類別評價函數對結果效果進行度量。用于衡量模型的好壞。對于一個理想模型的定義,一般要求得到的預測值能較好的擬合訓練樣本中的真實值,使用某種“接近程度”來衡量預測值與真實值之間的差距,讓預測值越接近真實值越好,在本文的研究背景下我們兼顧了這種情況根據兩者的接近程度來進一步采用特定策略更新每層的權重大小,從而求解得到模型的估計(楊雯婷,王靜怡,2022)。這種應用于表達接近程度的度量函數我們一般定義為損失函數或代價函數,它被用于衡量預測值和目標值的差異性大小,通常采用可用一組特定的方程進行表達。常用的損失函數有均方誤差(errorofsquare),一般被以求解氣象溫度預測使用均方誤差為例,(y,y')是參數變量,也就是要迭代求解的值,實驗的過程可以簡單描述成對值的求解過程。從中可以看出一些端倪其中n是訓練集的樣本個數,對于時間序列,對于該損失函數的定義會有公式2-9表達式:可見,損失函數(代價函數)的輸出值越高則表示預測值與真實值差異性越大,預測效果越不理想(黃浩宇,王思怡,2023)。深度學習的過程實質就是在不斷縮小特定模型代價的過程。除此以外,對于損失函數的定義根據任務的不同,還可定義成最大似然誤差、最大后驗概率等。2.6本章小節本章首先分析了基于時序預測對天氣進行提前一步預測的可行性,介紹了基于時間序列的概念以及常用的預測技術,從這些現象中可以得出分別對傳統預測模型進行分析,重點對基于python的LSTM算法就行了分析和解釋,并對具體預測流程進行了設計。最后,提出深度學習的概念,并分別從深度學習一般流程、損失函數定義等方面進行了簡要介紹。3基于LSTM的氣象預測模型構建本文的數據來自MaxPlanckInstituteforBiogeochemistry的天氣這個數據集合包含14個不同的特征(壓強P,溫度T,濕度dew,風速wd等)從2003年開始,每10分鐘收集一次。為了提高效率,本文僅使用2009年至2016年之間收集的數據如圖所示,該氣象機構每十分鐘記錄一次觀察到的數據,一個小時內有六個觀測值,一天則有144(6×24)個觀測值T01234圖3.1觀測數據其數據要素包括采集數據的區站號、年、月、日、時次、氣壓、海平面氣壓、最高氣壓、最低氣壓、氣溫、最高氣溫、最低氣溫、相對濕度、水汽壓、最小相對濕度、降水量、水平能見度、風力、體感溫度,其中后面20個要素的單位分別為:攝氏度(℃)、百帕、百帕、百帕、百帕、米/秒、米/秒、度、度、米/秒、度、攝氏度(℃)、攝氏度(℃)首先我們進行確定所觀測到的氣溫數據是否為時間序列,在這特定情況下使用一個特征 (溫度)訓練模型,并在使用該模型做預測,如下圖3.2。123圖3.2數據集中提取溫度通過Python畫出特征溫度隨時間變化的波動圖像,我們可以從下圖3.3從數據集中提取到的溫度特征圖看出,該溫度變化特征符合時間序列圖3.3氣溫數據變化地面觀測站的數據往往都是能夠真實反應,但由于大部分氣象觀測臺的分布不均勻,因此造成氣象數據可能存在時間上的紕漏,在此情勢發展下會照成研究地區的氣象數據的缺少和遺失,等不足(陳文俊,李欣瑤,2022)。在此之外,氣象站所得到的數據并不完全符合情況,即可能存在一些錯誤值和重復值,所以為了保證數據的準確合理,所以必須對氣象站的數據進行相關預處理,主要分為以下兩個工作(劉宇飛,張依婷,2021)。此優化方案是基于對當前狀況的仔細評估及有效利用現有資源和技術來實現的。對比于傳使得操作效率得到提升,錯誤率降低,從而大幅提高了計劃的成功幾率。另一方面,從經濟效益出發,新的解決辦法降低了運行和保養成本,節約了資源,增加了財務效益。此外,還改善了系統整體的協調性和可伸縮性,使其更能適應未來的挑戰和需求變化。首先要處理的是數據表中的重復值,其中對氣溫預測來說沒有任何作用的值全部清空,因此刪除這一列;其次要處理的是數據表中的缺測值,鑒于當前環境由于本文采用的是Python語言環境,所以使用函數對空余的數據值進行填充,選擇中位數代替缺測值;最后將所有的日期時間信息整合成為一個日期時間,并將整合后的日期作為整個氣象時間序列數據的索引(李怡然,劉璇婷,2023)。而對氣溫影響的評估中,在這樣的情形下數據集中的氣溫,大氣壓力和空氣密度對大氣溫度的影響最為顯著,我們得到處理后的數據如下3.4:圖3.4重構的數據(2)標準化輸入氣象要素變量本文將表中的前三個主要的氣象要素作為輸入變量,由以上對采集的地面觀測數據的相關描述可知,這3個氣象要素的數量級和單位都各不相同。如果以這些數據作為模型的輸入,在這個脈絡里進行將會對氣溫預測的結果產生不利的影響(王沐昕,鄭思琪,2020)。對此,本文采用min-max的歸一化方式對輸入的氣象要素數據進行歸一化處理,其公式如下所示:其中,max為洗清好的各個氣象樣本數據的最大值,min為洗清好的每個樣本數據的最小值,在這特定框架內經過標準化后,各個輸入變量屬于同一數量級,這樣能加速如下圖3.2即為對數據標準化的實現代碼:3data_std=dataset[:TRAIN_SPLIT]45dataset=(dataset-da圖3.5觀測數據經過清洗處理后的數據我們通過Python的繪圖工具將其隨時間變化的特征表現出來,如下圖所示:圖3.6三特征隨時間的變化(3)對數據集進行劃分本文調用tf.data.Dataset.from_tensor_slices函數,改函數的作用是對給定的向量數據進行特征切片,將數據分為了訓練集和驗證集。在這個脈絡范圍內訓練集用于模型的訓練,而驗證集用于模型預測效果的驗證。1|train_data_multi-tf.data.Dataset.from_tensor_slice1|train_data_multi-tf.data.Dataset.from_tensor_slice2|train_data_multi=train_data_multi.cache().shuffle(BUFFER_SIZE).batch(BATCH_SIZE).repeat()34valdatamulti-tf.data.Dataset.fromtensorslices((xval_multi,y_v圖3.4特征數據切片因為后續需要進行單步預測,我們需要為模型提供20個溫度觀測值來預測下一個時間步長的溫度,對數據集進行如下圖3.5操作,將樣本劃分(彭俊杰,范詩琪,2021)。2univariate_future_target35x_train_uni,y_train_uni=univariate_data(un678x_val_uni,y_val_uni=univariate_data(uni_data,TRAIN_SPLIT,None,圖3.5樣本數據劃分這20個溫度點的數據如下圖3.6所示:4[-2.05439744]5[-2.0312405]6[-2.02660912]7[-2.00113649]8[-1.95134907]9[-1.95134907]圖3.6單步預測溫度值在繼續訓練模型之前,先設置一個簡單的基準。在給定輸入點的情況下,基線方法將查看所有歷史記錄,這明顯體現了并預測下一個點是上述單步預測的20個溫度觀測寸1寸1defbaseline(history):3show_plot([x_train_uni[0],y_train_uni[0],baseline(x_trai'BaselinePredictionExamp圖3.7基準測試代碼圖3.8基準測試方法用于氣溫預測的總體結構如圖3.9,結構由輸入層,隱藏層,輸出層,網絡訓練和LSTM單元,輸入的多要素時間序列首先通過LSTM單元,進入后使用Dropout操作防在這個公式中y;為預測的氣溫值,yi是實際測量的氣溫值,M是訓練集的樣本個鑒于當前環境在這個公式中,W為鏈接LSTX'11-(n-1)X'-(n-2)X'-1LSTMLSTMX'mX(n-1)圖3.9氣溫預測的總體結構總體結構主要分為3個部分,輸入層,隱藏層和輸出層,其中輸入層由于原始的氣象數據序列是龐大繁多的需要進行數據清洗,以及劃分訓練集和測試集,隱藏層我們采用LSTM算法進行學習,其中含有大量的LSTM單元,在這樣的情形下輸入的三大要素的時間序列首先進入LSTM單元進行學習然后為了正則化能調節神經元的協同適應和高預測能力,采用dropout操作將其傳輸到全連接層以進行預測,在這個過程中,我們對損失進行計算通過Adam算法進行優化處理(劉星辰,鄧思潔,2021)。在這個脈絡里進行值得注意的是LSTM(或長期短期記憶網絡)負責計算時間序列中各個觀測值之間的依賴性,這種機制使最終的隱藏狀態變化相對較慢,即使單元格的狀態變化很快。因此,單元狀態學習短期和長期依賴性,但最終的隱藏狀態僅反映短期依賴性和/或長期依賴性(張俊豪,楊琳,2020)。本文基于已有的策略設計出一種計算方式,并對其進行了適當簡化以提高其便捷性和實用性。通過對當前方案的細致研究和評判,排除了不必要的復雜環節,優化了工作流設計,創建了一個更高效簡潔的計算模型。此過程不僅降低了對資源的需求,還加快了處理速度,確保了本方案在不犧牲效能的情況下易于應用和推廣,添加了一系列檢驗和質量保證措施。當然在進行預測的過程中我們設置了兩種LSTM預測模型,第一種是單步預測,僅僅通過一個變量即一個時間序列數據集進行氣溫的預測其預測結果也是一個數據,第二種是多步預測,在這特定框架內通過多個變量即多個時間序列數據集進行氣溫的預測得到一系列的數據集合點,這能夠直接反應LSTM在處理多數據情況下是否具有優越性,以及更好的預測效果。4.LSTM模型實驗結果與分析為了驗證上面所提出的基于LSTM的氣溫預測模型的有效性和優越性,本文采用MaxPlanckInstituteforBiogeochemistry所觀測到的氣象時間序列數據對未來的氣溫進行Python解釋器顧名思義就像翻譯器一樣,它可以理解和翻譯Python語言,對代碼進行解釋執行需要進入官網地址下載.本文所使用的是python3.7.2版本,下載完成后安裝,注意勾選添加環境變量,如下圖4.1所示(陳浩然,胡曼麗,2023):SelectInstallNowtoinCustomizetoenableordisableC:\Users\Zhouyu\AppData\Local\Programs\Pyt?Installauncherfor圖4.1python解釋器下載頁面安裝python后我們需要安裝Anaconda,Anaconda是一個科學計算環境,其中有一些常用的庫,如numpy,scrip,matplotlib等庫。如下圖4.1即為Anaconda打開的界面(王珊彤,孫子琪,2022):OANACONDANAVIGATOR其中我們運行Spyder,是一個強大的交互式Python語言開發環境,其最大的優勢在于他是一個類Matlab的界面設計對初期開發者來說十分的友好,其次Spyder里除了擁有一般IDE普遍具有的編輯器、調試器、用戶圖形界面等組件外,還具有對象查看器、變量查看器、交互式命令窗口、歷史命令窗口等組件,除此之外還擁有數組編輯以及個性定制等多種軟件名稱版本內存為了實現對TensorFlow-GPU的支持,實驗在Windows+Python環境下,還安裝了用于支持神經網絡訓練,實驗中所用顯卡為GTX1080,該顯卡內建4組顯卡處理器集群GPC,每個GPC有5個SM(2x64個CUDA單元),共計2560個CUDA單元。同時,環境中還安裝了通用科學計算包,另外還有scikit-learn(0.18.1)、scipy(0.19.0)、sympy(1.0)等通用包。實驗使用的到的其它具體環境參數及配置見上表4.1所示。4.2模型效果評估指標當我們把所有模型都訓練完成后,我們就可以預測整個的測試集,然后將預測的氣溫數據逆縮放。為了評估模型的預測性能與情況,本文根據MaxPlanckInstituteforBiogeochemistry所觀測到的氣溫值選用了均方根誤差(RMSERootMeanSquaredError)、平均絕對誤差(MAE,MeanAbsoluteError)和平均絕對百分比誤差(MAPE,MeanA這里我們分別對它們進行介紹,RMSE(RootMeanSquareError)是均方根誤差衡量觀測值與真實值之間的偏差。常用來作為機器學習模型預測結果衡量的標準,MSE(MeanSquareError)是均方誤差通過平方的形式便于求導,所以常被用作線性回歸的損失函數MAE(MeanAbsoluteError)是平均絕對誤差是絕對誤差的平均值。可以更好地反映預測值誤差的實際情況。它們的計算公式分別如下所示(高明澤,林玉潔,2022):在上面的公式中y,為LSTM的預測結果,y,是測試集中樣本的個數,根據公式我們可知,當RMSE,MAE,MAPE的結果越小時說明預測得到的結果和實際觀測到的氣溫值之間的誤差越小,則能夠更進一步說明預測模型的性能的卓越性(周嘉懿,魏雯琪,我們搭建的LSTM長短期記憶網絡模型,是基于python平臺的Anaconda深度學習可以更快地整理出適合分析的數據集,并降低了由于繁瑣步驟因為60分鐘內不會發生劇烈變化。在這特定情況下因此,120個重采樣值表示最近五天的溫度狀況。對于單步預測模型,數據點的標簽是未來12小時的溫度(李俊杰,何玉婷2023)。所以,使用之后72(12*6)個觀測值作為標簽。通過plot繪制損失函數如下圖圖4.1單步預測損失函數從圖中可以看出單步預測模型所擬合出來的損失函數不斷波動,并沒有趨于平緩,在6次學習后Trainingloss在0.24附近波動,鑒于當前環境而Validationloss的波動還是非常大的。接下來通過輸入每小時過去5天采樣的三個特征的歷史記錄(120個數據點)進行測試,因為目標是預測溫度,所以該圖僅顯示過去的溫度。在這樣的情形下預測是在未來一天進行的如圖4.2所示(趙梓琪,邵怡然,2022):圖4.2單步預測氣溫結果都比真實值要小,有以下原因可能導致的預測不準確,在這個脈絡里進行第一可能由于訓練數據還不夠多,不能使LSTM模型更加完整的學習,第二可能由于氣溫劇烈變化影接下來我們進行多步預測的實驗,由于此處的任務比先前的任務復雜一些,因此該模型現在由兩個LSTM層組成。最后,在這特定框架內由于需要預測之后12個小時的數據,因此Dense層將輸出為72。多步預測就是每一次預測的時候輸入窗□預測未來n個值(也叫n步)。只預測未來一次,即只預測一個n輸入的n個輸出,n是滑動窗口個數,即輸入n個滑動窗□,直接輸出未來的n個,利用的輸入全部是歷史數據的2、3、4、5、6…,即輸入n個滑動窗口作為一次輸入,整體輸入是m次這樣的窗口,直接輸出未來的m×n個,利用的輸入第一次是歷史數據的真實值,第一次之后包含有下圖4.3即為多步預測模型模型進行10次Epoch的訓練日志。2|200/200[--------------------------]-735363ms/step-loss:0.5750-val_loss:0.313734200/200[----------]-735367ms/step56200/200[------------------------------]-79s393ms/step-lo78208/200[-=----------------------------]-85s426ms/step-loss:0.3062-val_l9200/200[=---------------------------=-]-985488ms/step-lo200/200------]-103s514ms/step-loss:0.200/200=a-------------=------------]-107s537ms/step-loss:0.2061-val_200/200[=--===========---=======]-108s539ms/step-loss:0.2016-va200/200[=--------------]-925462ms/step-loss:θ.2047200/200[=-aa-aaaa--a--]-985490ms/step圖4.3訓練日志在這個脈絡范圍內訓練數據包括每小時采樣的過去五天的記錄。但是,這里的模型需要學習預測接下來12小時的溫度。由于每10分鐘采樣一次數據,因此輸出為72個從圖4.2中可以看出,LSTM網絡訓練出來的模型,這明顯體現了預測結果基本上與實際溫度一致,雖然在開始預測的部分有些劇烈波動,但在后面的預測中甚至在某些時段重合,其中我們可以從第一段預測可以看的尤為明顯,在本文的研究背景下我們兼顧了這種情況所以我們提出的LSTM對于氣溫的預測擬合效果是優越的(李昊然,高佳琪,上圖4.3展示了模型訓練和測試過程中迭代10次的損失函數變化曲線圖,清晰看出,當迭代次數接近6時,從中可以看出一些端倪損失函數基本收斂,而后隨著迭代次的增加,損失基本保持不變,并且訓練和測試的損失函數曲線基本重疊,說明該模型在測試集上也有很好的效果,表現出了較好的泛化能力。針對環境因素可能對最終成果造成的不確定性影響,本研究在策略制定與執行時采取了一系列步驟以確保輸出的精確性及計劃的穩固性。首先全面考察了所有可能影響執行成效的外部變量,接著在設計初期應用了環境影響評估技術,通過不同情境的模擬測試它們對結果的作用,并據此優化設計要素,提升方案的靈活性與堅固度,使其能夠快速適應外界變動,持續保持其實用價值。混沌時間序列預測,是一種新型的非線性系統預測理論,研究如何由時間序列通過相空間重構,從另一個維度和視角來辨識系統,挖掘系統中蘊藏的規律,并預測系統的未來走勢,而忽略因變量背后眾多影響因素和復雜的影響機理,省卻了大量繁瑣的工作,非常適合于那些總體呈現確定性,從這些現象中可以得出但又具有某種程度隨機性的復混沌時間序列預測的基本思想:構造一個非線性映射來近似地還原原系統,這一非線性映射即為要建立的預測模型。混沌時間序列預測的優點(張逸軒,陳若琳,2023):(1)不必事先建立一個主觀模型,再通過對這個模型的微調來擬合原系統,而是直接根據序列本身的客觀規律進行預測,這樣可以最大限度地避免人為主觀性,提高預測的精度和可信度;(2)混沌方法有更廣闊的適用范圍,即系統適應性好,而不像傳統預測方法僅僅適用于某一類具有特定特征的系統。時間序列預測模型的建立主要基于兩類思想:(1)一類思想基于多變量回歸,即預測對象的未來行為取決于其他主導對象的當前或過去的行為,也就是說取決于另一個或多個時間序列。在這特定情況下這些起主導作用的時間序列與被預測的時間序列存在共振或同步,同時也要滿足領先于被預測的時間序列。(2)另一類思想基于單變量自回歸,即預測對象的未來行為主要由其歷史行為決定(吳宇昊,丁馨悅受混沌理論啟發,對于決定氣象系統長期演化的各種屬性(如溫、壓、濕等),均包含了氣象動力學系統長期演變的信息。鑒于當前環境通過前面介紹,在混沌理論中對其原動力系統重構,關鍵在于對空間時間延遲T以及維度求解,因此,可以從氣象各個參數屬性的一批時間序列氣象數據中提出或模擬出系統本來的狀態特征,本質上,這也是對于輸入變量所進行的特征工程。但在繁瑣的求解相空間過程中,我們不一定總能4.5本章小節本章首先提出了利用前饋神經網絡改造氣象預測模型,分別從網絡結構搭建、防優化等方面展開。然后,在這樣的情形下考慮到傳統神經網絡中出現的天氣參數常被認為是彼此獨立,并且時序關系一般不被考慮的缺點,在深度前饋神經網絡氣象預測模型的構建中,還加入了滑動時間窗手段,通過對輸入數據序列矩陣進行重構,在這個脈絡里進行可以讓深度前饋神經網絡也能學習到較好的時間序列特征(楊景華,蔡婷最后,考慮到循環神經網絡(RNN)良好的時間序列信息學習能力,提出使用RNN預測特征,來進行啟發式構建氣溫預測模型并對網絡架構、梯度算法選取進行了設計,重點對LSTM預測模型進行了搭建,針對實驗調參中出現的問題,還提出了加入L2正5總結與展望氣象要素時間序列通常表現出時空多樣性,并受物理過程的非線性、時空尺度沖突及眾多參數估計等不確定性因素困擾。本文從時間序列的角度,選擇了氣象氣溫屬性進行提前24小時的精細化預報研究,實驗中,采用了最先進的機器學習庫TensorFlow來代替傳統機器學習算法,通過改進深度前饋神經網絡以及循環神經網絡,構建起適合可用的氣溫預測模型,實驗除了有深度學習模型間的對比,還加入傳統模型比較,以期找到最為理想的精細化氣溫預測模型。在這個脈絡范圍內通過對氣象氣溫以基于時間序列的預測研究,探索了局地精細化天氣預報方法,解決了深度學習中前沿技術在氣象溫度預測上的應用問題。本文得出如下結論:深度學習模型均能表現出了良好的預測性能,尤其是LSTM序列模型憑借較強的序列學習與預測能力,可作為精準化溫度預測的一種常規手段。二是對于深度前饋神經網絡,考慮多元屬性特征并加入滑動時間窗手段后,預測效果提升明顯。這說明了計及多元屬性和時序特征,能直接影響預測的精準度。三是對于在深度學習模型中加入RELU激活函數改進和正則化優化后,實驗中收斂效果表現得更好,這預示著對于將來的工作,針對深度學習模型用作氣溫預測時,可通過不斷學習各種優化方式提升實踐應用效果。同時,也暴露出一些問題:一是受到獲取資料限制,實驗數據僅是單站,考慮的屬性維度并不高,也并未加入更多地理位置氣象數據進行模型的交又驗證,這明顯體現了局地氣溫特征差異性會較大,模型帶有較強的區域特征,將來的工作除了要考慮更多維度屬性外,還要將站點二是神經網絡的訓練是個不斷調參的過程,調參難是訓練神經網絡最大障礙。實驗中選定的參數僅是本文通過多次測試在特定場景得到的較好參數值,但無法確定已是全局最優。下一步,仍需大量實驗驗證。氣象領域與人工智能相結合的研究越來越熱,本文在長短期記憶網絡的基礎上,進行了氣溫預測和短時降雨預測的研究。盡管本文所提出的預測模型相比于其他模型,準確率都有明顯提升,但與我們實際生活中的應用還存在一定的距離,因此,未來的研究可以做以下幾點改進:(1)本文所用的算法使用了氣壓、相對濕度等氣象要素與氣溫的關聯程度,其實可以選擇嘗試其他方法,尋找出與氣溫最高度相關的氣象要素。(2)對于氣溫預測問題,本文只對少數地區的數據進行了仿真實驗,具有一定的片面性。不同地區之間的氣象要素關聯性可能會有所差異,在以后的研究中,會增加多個地區的數據分別進行分析,研究不同地區氣象要素之間的關聯性差異,并且對每個地區的數據進一步擴充。(3)本文所提出LSTM模型雖然在氣溫的的準確率是最高的,但是使用的參數也是最多的,計算量過大,可以嘗試改善網絡結構,減小該模型的復雜度。(5)氣溫預測方面本文僅使用了單一的數據源,為了更加全面有效地進行氣象預測,可以增加數據源,比如增加用戶參與感知的數據,進行數據融合研究。(6)在以后研究中,將使用多種類型的數據對氣象問題進行分析和研究,比如地基云圖、多光譜衛星云圖等。[1]彭鵬飛,邱俊宏.短期天氣預報的新方法和問題[M].科學出版社,2022.[3]彭俊杰,范詩琪.中長期天氣預報基礎[M].氣象出版社,2021.[5]李凱文,周子凡.人類對天氣和氣候的影響P].國外科技新書評介,2008(2):19-20.丁[6]王書恒,陳怡靜.現代天氣學原理[M].高等教育出版社,199[7]劉星辰,鄧思潔.數值天氣預報業務模式現狀與展望[J].氣象學報,2004,62(5):623-633.[9]陳浩然,胡曼麗.淺探現代天氣預報技術發展的基礎和特點[J].科技資訊,2008(33):217-217.[10]王珊彤,孫子琪.淺談現代天氣預報的主要方法[J].城市建設理論研究:電子版,2011(14).[12]MaqsoodI,KhanMR,AbrahamA.WeatherForecastingModelsUsingEnsemblesofNeuralNetworks[M]//Intelligent陳欣妍,劉梓軒temsDesignandApplications.SpringerBerlinHeidelberg,2007:33-42.[13]BartokJ,HabalaO,BednarP,etal.Dataminingandimeteorologicalphenomena[J].ProcediaComputerScie
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 建房施工合同書與建材買賣合同8篇
- 家具導購合同協議
- 寄售行加盟合同協議
- 賓館保潔公司合同協議
- 家庭房屋裝修合同協議
- 賓館家具定做合同協議
- 安裝儀器儀表合同協議
- 賓館經理營銷合同協議
- 室內門供貨合同協議
- 賓館商業出售合同協議
- 汽車裝潢服務合同范本
- 2025年03月江蘇鎮江市揚中市事業單位集開招聘48人筆試歷年典型考題(歷年真題考點)解題思路附帶答案詳解
- 口腔科設備器具項目深度研究分析報告
- 2025四川瀘天化弘旭工程建設有限公司社會招聘3人筆試參考題庫附帶答案詳解
- 2025中國煤炭地質總局招聘20人筆試參考題庫附帶答案詳解
- 中國文化傳媒集團招聘筆試真題2024
- 國家機關事務管理局所屬事業單位招聘筆試真題2024
- 2025年中考歷史試題圖解及答案
- 2024年新高考廣西高考生物真題試卷及答案
- 精神科安全健康教育
- 《濃醬白酒企業四川郎酒企業存貨管理問題研究(論文9300字)》
評論
0/150
提交評論