




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
基于LSTM神經(jīng)網(wǎng)絡(luò)的疫情發(fā)展的時(shí)間預(yù)測(cè)模型分析TOC\o"1-2"\h\u109161緒論 168991.1研究背景 1213151.2時(shí)間序列分析方法的發(fā)展 2250991.3研究目的 3215701.4研究?jī)?nèi)容 443202基于ARIMA算法的時(shí)間序列預(yù)測(cè) 652282.1ARIMA原理介紹 6174102.2ARIMA模型的建立 849273基于LSTM神經(jīng)網(wǎng)絡(luò)的時(shí)間序列預(yù)測(cè) 1695983.1LSTM原理介紹 16248433.2建立LSTM神經(jīng)網(wǎng)絡(luò) 18166254ARIMA算法與LSTM神經(jīng)網(wǎng)絡(luò)對(duì)比分析 22279764.1ARIMA模型預(yù)測(cè)結(jié)果與LSTM神經(jīng)網(wǎng)絡(luò)結(jié)果比較 22146194.2猜想驗(yàn)證 2311015結(jié)論 24294765.1研究成果 24245915.2展望 24緒論1.1研究背景傳染病在人類(lèi)歷史上一直是影響人類(lèi)社會(huì)發(fā)展的重大因素,它對(duì)人類(lèi)文明產(chǎn)生的后果,甚至比戰(zhàn)爭(zhēng)、自然災(zāi)害、饑荒造成的影響還要更嚴(yán)重。因?yàn)閭魅静〉谋l(fā),使得世界人口數(shù)量做不到穩(wěn)定增加,古代人甚至認(rèn)為在傳染病的影響下,人類(lèi)社會(huì)是很難進(jìn)步的。因?yàn)槿丝跀?shù)量不足,社會(huì)生產(chǎn)效率得不到有效提高。在人類(lèi)的記錄中,對(duì)歷史發(fā)展造成最大影響的正是傳染病ADDINEN.CITE<EndNote><Cite><Author>廖超</Author><Year>2005</Year><RecNum>34</RecNum><DisplayText><styleface="superscript">[1]</style></DisplayText><record><rec-number>34</rec-number><foreign-keys><keyapp="EN"db-id="f5pwswfdrw2e0refr95xtr2gdfrpfrafd5dt"timestamp="1623104257">34</key></foreign-keys><ref-typename="Thesis">32</ref-type><contributors><authors><author>廖超</author></authors><tertiary-authors><author>王加陽(yáng),</author></tertiary-authors></contributors><titles><title>基于粗糙集理論的時(shí)間序列數(shù)據(jù)分析</title></titles><keywords><keyword>時(shí)間序列</keyword><keyword>粗糙集</keyword><keyword>數(shù)據(jù)挖掘</keyword><keyword>屬性約簡(jiǎn)</keyword><keyword>規(guī)則獲取</keyword></keywords><dates><year>2005</year></dates><publisher>中南大學(xué)</publisher><work-type>碩士</work-type><urls></urls><remote-database-provider>Cnki</remote-database-provider></record></Cite></EndNote>[1]。于14世紀(jì)30年代開(kāi)始于東亞的黑死病,通過(guò)跳蚤叮咬感染人類(lèi),再由人類(lèi)被叮咬后病人呼吸道分泌物帶有大量的鼠疫耶爾森菌。這個(gè)黑死病會(huì)讓人組織壞死,最后劇烈嘔吐而死。這場(chǎng)瘟疫迅速蔓延全亞洲,歐洲和北非,到20世紀(jì)50年代的時(shí)候,造成了大約快2億人的死亡,這個(gè)死亡人數(shù)超過(guò)了但是歐亞大陸人口的四分之一,當(dāng)時(shí)的英國(guó)人口從370萬(wàn)降到220萬(wàn),佛羅倫薩的死亡一半。從人類(lèi)記載的第一次傳染病——雅典大瘟疫開(kāi)始,先后爆發(fā)的黑死病、黃熱病、天花等流行性疾病在世界范圍內(nèi)造成了幾億人的死亡,死于傳染病的人數(shù)遠(yuǎn)遠(yuǎn)高于死于戰(zhàn)爭(zhēng)等其他因素。近年來(lái),隨著社會(huì)的發(fā)展,醫(yī)學(xué)逐漸發(fā)展,人類(lèi)戰(zhàn)勝了很多以前無(wú)法戰(zhàn)勝的烈性傳染病,但是隨之而來(lái)的SARS、高致病性禽流感等新發(fā)性傳染病不斷出現(xiàn),說(shuō)明人類(lèi)對(duì)傳染病的戰(zhàn)爭(zhēng)還沒(méi)有結(jié)束。突然爆發(fā)的高傳染性傳染病對(duì)人類(lèi)的生命和全球的經(jīng)濟(jì)社會(huì)都會(huì)造成了很大的影響。離我們最近一次傳染病大爆發(fā)就是2019年新型冠狀肺炎ADDINEN.CITE<EndNote><Cite><Author>紀(jì)安之</Author><Year>2020</Year><RecNum>33</RecNum><DisplayText><styleface="superscript">[2]</style></DisplayText><record><rec-number>33</rec-number><foreign-keys><keyapp="EN"db-id="f5pwswfdrw2e0refr95xtr2gdfrpfrafd5dt"timestamp="1623104257">33</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author>紀(jì)安之</author><author>楊雪梅</author></authors></contributors><auth-address>咸陽(yáng)師范學(xué)院數(shù)學(xué)與信息科學(xué)學(xué)院;</auth-address><titles><title>基于ARIMA模型的新冠肺炎序列分析預(yù)測(cè)</title><secondary-title>價(jià)值工程</secondary-title></titles><periodical><full-title>價(jià)值工程</full-title></periodical><pages>107-109</pages><volume>39</volume><number>18</number><keywords><keyword>新型冠狀病毒肺炎</keyword><keyword>時(shí)間序列</keyword><keyword>ARIMA</keyword><keyword>預(yù)測(cè)</keyword><keyword>SAS</keyword></keywords><dates><year>2020</year></dates><isbn>1006-4311</isbn><call-num>13-1085/N</call-num><urls></urls><remote-database-provider>Cnki</remote-database-provider></record></Cite></EndNote>[2]。2019年在全球爆發(fā)的新冠肺炎疫情不僅威脅到了世界各國(guó)人民的生命財(cái)產(chǎn)安全,更是對(duì)世界經(jīng)濟(jì)產(chǎn)生了巨大的影響。首先,各國(guó)采取了封城、停工、隔離等措施,停止了大部分經(jīng)濟(jì)活動(dòng),使得各國(guó)經(jīng)濟(jì)限于停滯。其次,為了防止疫情在各國(guó)之間擴(kuò)散,各國(guó)出入境政策變得更加嚴(yán)格,國(guó)際貿(mào)易嚴(yán)重萎縮。根據(jù)國(guó)際貿(mào)易組織預(yù)測(cè),全球貿(mào)易量將降低13%至32%,此次新冠肺炎疫情在經(jīng)濟(jì)上造成的影響可能超過(guò)2008年國(guó)際金融危機(jī)水平。受到疫情影響,各國(guó)經(jīng)濟(jì)活動(dòng)停滯,引發(fā)了全球供應(yīng)鏈?zhǔn)茏枭踔林袛唷?duì)于中國(guó)而言,新冠肺炎疫情對(duì)中國(guó)的經(jīng)濟(jì)及社會(huì)發(fā)展帶來(lái)了極大的沖擊,省市之間限制交通和部分物流運(yùn)輸使得各大企業(yè)生產(chǎn)經(jīng)營(yíng)安排因?yàn)檠舆t復(fù)工受到了極大的影響,同時(shí),餐飲、旅游等消費(fèi)支出明顯降低,中國(guó)呼吁人民居家隔離減少了商場(chǎng)、影院等企業(yè)收入降低。因?yàn)槠髽I(yè)收入減少,造成了職工失業(yè)等大問(wèn)題。失業(yè)率是體現(xiàn)國(guó)家經(jīng)濟(jì)狀況的重要指標(biāo),在2020年1月至5月期間,全國(guó)城鎮(zhèn)調(diào)查失業(yè)率分別為5.3%、6.2、5.9%、6.0%、5.9%。31個(gè)大城市城鎮(zhèn)失業(yè)調(diào)查率分別為5.2%、5.7%、5.7%、5.8%、5.9%。失業(yè)率的增加會(huì)導(dǎo)致消費(fèi)萎縮,消費(fèi)萎縮就意味著生產(chǎn)的產(chǎn)品滯銷(xiāo),進(jìn)而導(dǎo)致企業(yè)倒閉或裁員,形成了惡行循環(huán)。除了經(jīng)濟(jì)方面的影響,失業(yè)率增高同時(shí)造成了社會(huì)動(dòng)蕩,研究表明失業(yè)率增高時(shí)犯罪率也隨之增高。所以控制新冠肺炎的進(jìn)一步傳播是各國(guó)的首要任務(wù)ADDINEN.CITE<EndNote><Cite><Author>賈康</Author><Year>2021</Year><RecNum>36</RecNum><DisplayText><styleface="superscript">[3]</style></DisplayText><record><rec-number>36</rec-number><foreign-keys><keyapp="EN"db-id="f5pwswfdrw2e0refr95xtr2gdfrpfrafd5dt"timestamp="1623105308">36</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author>賈康</author><author>蘇京春</author><author>郭金</author></authors></contributors><auth-address>華夏新供給經(jīng)濟(jì)學(xué)研究院;財(cái)政部財(cái)政科學(xué)研究所;中國(guó)財(cái)政科學(xué)研究院;共生態(tài)經(jīng)濟(jì)研究院;</auth-address><titles><title>新冠疫情以來(lái)財(cái)政政策落實(shí)“六穩(wěn)”評(píng)價(jià)</title><secondary-title>上海商學(xué)院學(xué)報(bào)</secondary-title></titles><periodical><full-title>上海商學(xué)院學(xué)報(bào)</full-title></periodical><pages>27-44</pages><number>03</number><keywords><keyword>新冠疫情</keyword><keyword>財(cái)政政策</keyword><keyword>宏觀調(diào)控</keyword><keyword>六穩(wěn)</keyword><keyword>六保</keyword></keywords><dates><year>2021</year></dates><isbn>1673-324X</isbn><call-num>31-1957/F</call-num><urls></urls><remote-database-provider>Cnki</remote-database-provider></record></Cite></EndNote>[3]。截至目前,新冠肺炎疫情共影響了212個(gè)國(guó)家,世界范圍內(nèi)累計(jì)確診人數(shù)超過(guò)1.6億,累計(jì)死亡人數(shù)超過(guò)300萬(wàn),死亡率為2.1%。傳染病的防治工作是全世界共同的責(zé)任,通常研究傳染病的研究方向有:傳播規(guī)律、發(fā)病機(jī)制、傳染源傳播傾向等。雖然目前我們已經(jīng)研制出新冠肺炎疫苗并有效控制住疫情,不過(guò)為了避免之后出現(xiàn)相似的疫情,我們還是有必要分析新冠肺炎疫情的數(shù)據(jù)特點(diǎn),同時(shí)通過(guò)構(gòu)建不同國(guó)家新冠肺炎疫情變化趨勢(shì)預(yù)測(cè)模型,對(duì)比體現(xiàn)出強(qiáng)有力的防疫政策在控制疫情方面的作用。通過(guò)研究新冠肺炎累計(jì)確診人數(shù)數(shù)據(jù)特點(diǎn),發(fā)現(xiàn)數(shù)據(jù)隨時(shí)間變化符合時(shí)間序列特征,所以本次分別實(shí)現(xiàn)ARIMA模型和LSTM模型進(jìn)行肺炎數(shù)據(jù)預(yù)測(cè),并分析兩種模型的準(zhǔn)確性得到預(yù)測(cè)準(zhǔn)確度更高的模型,為我國(guó)新冠肺炎防控工作提供更準(zhǔn)確的參考。1.2時(shí)間序列分析方法的發(fā)展時(shí)間序列是按照時(shí)間排序的一組隨機(jī)變量,時(shí)間序列分析研究的是隨機(jī)變量在時(shí)間不斷發(fā)展后的變化趨勢(shì)。時(shí)間序列分析方法要實(shí)現(xiàn)的目標(biāo)是,從時(shí)間序列數(shù)據(jù)中發(fā)現(xiàn)出其隨時(shí)間變化的趨勢(shì),通過(guò)分析數(shù)據(jù)趨勢(shì)實(shí)現(xiàn)未來(lái)數(shù)據(jù)的預(yù)測(cè)。時(shí)間序列分析的歷史很悠久。最開(kāi)始由.古埃及人發(fā)現(xiàn)尼羅河每天的漲落存在某種規(guī)律,他們通過(guò)記錄下每天的漲落情況,并對(duì)這個(gè)漲落情況的時(shí)間序列進(jìn)行長(zhǎng)期的分析,使他們發(fā)現(xiàn)尼羅河漲落具備的規(guī)律性,并通過(guò)將這種規(guī)律應(yīng)用的農(nóng)業(yè)上,使得古埃及的農(nóng)業(yè)得到迅速發(fā)展。這種從觀測(cè)序列得到直觀規(guī)律的方法即為描述性分析方法。雖然時(shí)間序列很早被發(fā)現(xiàn),但是因?yàn)楫?dāng)時(shí)人類(lèi)的社會(huì)與科學(xué)都比較落后,在很長(zhǎng)的時(shí)間里時(shí)間序列分析都局限于直接的數(shù)據(jù)比較和簡(jiǎn)單的繪圖預(yù)測(cè)。傳統(tǒng)時(shí)間序列分析方法中范圍較廣的是1970年發(fā)明的自回歸移動(dòng)平均模型ARIMA模型,一些時(shí)間序列中有季節(jié)性因素,季節(jié)性影響指的是數(shù)據(jù)受到季節(jié)變化和各種環(huán)境因素的影響,為了避免季節(jié)性因素使得模型預(yù)測(cè)結(jié)果不準(zhǔn),可以通過(guò)季節(jié)調(diào)整來(lái)剔除時(shí)間序列中的季節(jié)因素,實(shí)現(xiàn)季節(jié)性ARIMA模型,常用的季節(jié)性ARIMA模型有X-12方法及其變.種,此外也可以采用BV4方法ADDINEN.CITE<EndNote><Cite><Author>范波</Author><Year>2021</Year><RecNum>25</RecNum><DisplayText><styleface="superscript">[4]</style></DisplayText><record><rec-number>25</rec-number><foreign-keys><keyapp="EN"db-id="f5pwswfdrw2e0refr95xtr2gdfrpfrafd5dt"timestamp="1623104257">25</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author>范波</author><author>宋文彬</author></authors></contributors><auth-address>東南大學(xué)自動(dòng)化學(xué)院;</auth-address><titles><title>基于ARIMA模型的產(chǎn)品銷(xiāo)售量預(yù)測(cè)研究</title><secondary-title>工業(yè)控制計(jì)算機(jī)</secondary-title></titles><periodical><full-title>工業(yè)控制計(jì)算機(jī)</full-title></periodical><pages>128-129+125</pages><volume>34</volume><number>05</number><keywords><keyword>ARIMA</keyword><keyword>預(yù)測(cè)</keyword><keyword>銷(xiāo)售量</keyword></keywords><dates><year>2021</year></dates><isbn>1001-182X</isbn><call-num>32-1764/TP</call-num><urls></urls><remote-database-provider>Cnki</remote-database-provider></record></Cite></EndNote>[4]。近年來(lái)時(shí)間序列應(yīng)用可以在建模之前要分析時(shí)間序列數(shù)據(jù)特點(diǎn),結(jié)合數(shù)據(jù)實(shí)情選用合適的分析研究方法。在傳統(tǒng).方法的改進(jìn)方面,具體的實(shí)例有:韓國(guó)銀行應(yīng)用季節(jié)性ARIMA模型分析韓國(guó)的經(jīng)濟(jì)時(shí)間序列時(shí),發(fā)現(xiàn)常用的季節(jié)性X-21-ARIMA方法并不適用于韓國(guó)銀行數(shù)據(jù),因?yàn)閄-21-ARIMA使用于西方國(guó)家,只考慮了西方國(guó)家的節(jié)日因素,因?yàn)閮蓢?guó)的節(jié)日因素不同,所以X-21-ARIMA無(wú)法去除韓國(guó)節(jié)日季節(jié)性影響,造成最后結(jié)果與實(shí)際值有較大的誤差。為此,韓國(guó)學(xué)者引入了啞元這一概念,反映了韓國(guó)的特定節(jié)假日因素,成功使用X-21-ARIMA分析了韓國(guó)的經(jīng)濟(jì)時(shí)間序列。時(shí)間序列分析預(yù)測(cè)法的前提是假定事物的未來(lái)同樣會(huì)按照市場(chǎng)歷史趨勢(shì)進(jìn)行發(fā)展ADDINEN.CITE<EndNote><Cite><Author>孟盈竹</Author><Year>2021</Year><RecNum>26</RecNum><DisplayText><styleface="superscript">[5]</style></DisplayText><record><rec-number>26</rec-number><foreign-keys><keyapp="EN"db-id="f5pwswfdrw2e0refr95xtr2gdfrpfrafd5dt"timestamp="1623104257">26</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author>孟盈竹</author><author>孫勝男</author></authors></contributors><auth-address>聊城大學(xué)建筑工程學(xué)院;</auth-address><titles><title>基于ARIMA時(shí)間序列模型的房地產(chǎn)價(jià)格預(yù)測(cè)——以沈陽(yáng)市為例</title><secondary-title>內(nèi)江科技</secondary-title></titles><periodical><full-title>內(nèi)江科技</full-title></periodical><pages>65+74</pages><volume>42</volume><number>05</number><keywords><keyword>時(shí)間序列模型</keyword><keyword>房地產(chǎn)</keyword><keyword>ARIMA</keyword><keyword>沈陽(yáng)市</keyword><keyword>價(jià)格預(yù)測(cè)</keyword></keywords><dates><year>2021</year></dates><isbn>1006-1436</isbn><call-num>51-1185/T</call-num><urls></urls><remote-database-provider>Cnki</remote-database-provider></record></Cite></EndNote>[5]。事物的現(xiàn)實(shí)和其歷史發(fā)展是息息相關(guān)的。時(shí)間序列預(yù)測(cè)數(shù)據(jù),就是通過(guò)事物發(fā)展的連續(xù)規(guī)律性,通過(guò)統(tǒng)計(jì)分析歷史數(shù)據(jù)特點(diǎn),進(jìn)一步推測(cè)其未來(lái)的發(fā)展趨勢(shì)。隨著時(shí)間序列分析的理論與應(yīng)用的深入研究,時(shí)序分析法已經(jīng)應(yīng)用的各大領(lǐng)域中。目前,它已涉及物理、化學(xué)、地理、天文、生物等自然科學(xué)領(lǐng)域,另外在工程技術(shù)領(lǐng)域和社會(huì)經(jīng)濟(jì)也取得了重要的應(yīng)用結(jié)果,例如:環(huán)境工程、醫(yī)學(xué)工程、海洋工程、圖像識(shí)別、語(yǔ)音通信、聲吶技術(shù)、市場(chǎng)等。1.3研究目的目前整個(gè)世界同新冠肺炎的斗爭(zhēng)仍在繼續(xù),從新冠肺炎爆發(fā)以來(lái),很多人都提出了各種各樣的模型來(lái)預(yù)測(cè)肺炎疫情的發(fā)展。傳統(tǒng)的傳染病數(shù)學(xué)模型常見(jiàn)的有SI、SIR、SIRS、SEIR模型等,研究方向?yàn)檠芯總魅静〉膫鞑ニ俣取⒖臻g范圍、傳播途徑、動(dòng)力學(xué)機(jī)理等問(wèn)題。分析新冠肺炎累計(jì)確診人數(shù)數(shù)據(jù),可以發(fā)現(xiàn)數(shù)據(jù)符合時(shí)間序列,可以采用時(shí)間序列分析法。基于時(shí)間序列分析的疫情數(shù)據(jù)分析與預(yù)測(cè)對(duì)于人們掌握新冠肺炎發(fā)展情況具有一定的應(yīng)用價(jià)值。在時(shí)間序列分析中,為了準(zhǔn)確預(yù)測(cè)未來(lái)發(fā)展趨勢(shì),時(shí)間序列數(shù)據(jù)需要滿(mǎn)足:一、數(shù)據(jù)不會(huì)發(fā)生跳躍性變化,是按照穩(wěn)定趨勢(shì)向前發(fā)展的;二、要保證未來(lái)預(yù)測(cè)需要和歷史發(fā)展趨勢(shì)相同,證明預(yù)測(cè)模型的準(zhǔn)確性。基于這兩種要求,時(shí)間序列分析算法更適用于實(shí)現(xiàn)短期預(yù)測(cè),如果進(jìn)行長(zhǎng)期預(yù)測(cè),就會(huì)出現(xiàn)很大的局限性,導(dǎo)致預(yù)測(cè)值與實(shí)際值相差很大,使得預(yù)測(cè)數(shù)據(jù)失去了參考意義ADDINEN.CITE<EndNote><Cite><Author>吳琦琦</Author><Year>2021</Year><RecNum>35</RecNum><DisplayText><styleface="superscript">[6]</style></DisplayText><record><rec-number>35</rec-number><foreign-keys><keyapp="EN"db-id="f5pwswfdrw2e0refr95xtr2gdfrpfrafd5dt"timestamp="1623105308">35</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author>吳琦琦</author><author>黃志甲</author><author>周恒</author><author>卞夢(mèng)園</author><author>寇遵麗</author><author>張金星</author></authors></contributors><auth-address>安徽工業(yè)大學(xué)建筑工程學(xué)院;</auth-address><titles><title>基于時(shí)間序列神經(jīng)網(wǎng)絡(luò)的新冠肺炎疫情預(yù)測(cè)</title><secondary-title>安徽工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版)</secondary-title></titles><periodical><full-title>安徽工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版)</full-title></periodical><pages>188-194</pages><volume>38</volume><number>02</number><keywords><keyword>新冠肺炎</keyword><keyword>時(shí)間序列</keyword><keyword>預(yù)測(cè)</keyword><keyword>神經(jīng)網(wǎng)絡(luò)</keyword></keywords><dates><year>2021</year></dates><isbn>1671-7872</isbn><call-num>34-1254/N</call-num><urls></urls><remote-database-provider>Cnki</remote-database-provider></record></Cite></EndNote>[6]。觀察原始數(shù)據(jù)后發(fā)現(xiàn),中國(guó)新冠肺炎累計(jì)確診人數(shù)隨時(shí)間變化而變化,符合時(shí)間序列數(shù)據(jù)特點(diǎn).,經(jīng)差分后可以得到平穩(wěn)序列,所以符合時(shí)間序列分析方法數(shù)據(jù)要求.,可以建立新型冠狀病毒肺炎日累計(jì)病例數(shù)分析模型。通過(guò)模型擬合實(shí)現(xiàn)預(yù)測(cè)疾病未來(lái)幾天內(nèi)的累計(jì)病例數(shù),并求出預(yù)測(cè)的新冠累計(jì)確診人數(shù)預(yù)測(cè)值與實(shí)際的累計(jì)確診人數(shù)的誤差.,保證預(yù)測(cè)模型的準(zhǔn)確性.。在現(xiàn)實(shí)中通過(guò)建立時(shí)間序列分析模型.、得到新冠肺炎發(fā)展的預(yù)測(cè)數(shù)據(jù)的意義在于,能夠?yàn)槲覈?guó)新冠肺炎疫情防疫工作提供數(shù)據(jù)參考,也可以對(duì)未來(lái)可能出現(xiàn)的類(lèi)似疫情提供借鑒。1.4研究?jī)?nèi)容根據(jù)使用數(shù)據(jù)不同,可以將時(shí)間序列分為兩類(lèi)適用于原始數(shù)據(jù)平穩(wěn)的序列和適用于原始數(shù)據(jù)差分后平穩(wěn)的序列。適用于原始數(shù)據(jù)平穩(wěn)的序列模型有:自回歸模型AR(AutoRegressiveModel):通過(guò)統(tǒng)計(jì)分析前期不同時(shí)刻隨機(jī)變量的線性組合來(lái)預(yù)測(cè)未來(lái)某時(shí)刻的隨機(jī)變量,用自身歷史數(shù)據(jù)做回歸變量分析。移動(dòng)平均模型MA(MovingAverageModel):和自回歸模型有相似之處,不同之處在于移動(dòng)平均是以過(guò)去的殘差項(xiàng)也就是白噪聲來(lái)做線性組合,而AR模型是以過(guò)去的觀察值來(lái)做線性組合。MA的出發(fā)點(diǎn)是通過(guò)組合殘差項(xiàng)來(lái)觀察殘差的振動(dòng)ADDINEN.CITE<EndNote><Cite><Author>任永泰</Author><Year>2021</Year><RecNum>27</RecNum><DisplayText><styleface="superscript">[7]</style></DisplayText><record><rec-number>27</rec-number><foreign-keys><keyapp="EN"db-id="f5pwswfdrw2e0refr95xtr2gdfrpfrafd5dt"timestamp="1623104257">27</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author>任永泰</author><author>于浩然</author><author>杜晶</author><author>范亞?wèn)|</author><author>王積田</author></authors></contributors><auth-address>東北農(nóng)業(yè)大學(xué)文理學(xué)院;東北農(nóng)業(yè)大學(xué)工程學(xué)院;東北農(nóng)業(yè)大學(xué)經(jīng)濟(jì)管理學(xué)院;</auth-address><titles><title>基于ARIMA-Holt模型的黑龍江省農(nóng)業(yè)科技水平預(yù)測(cè)</title><secondary-title>商業(yè)經(jīng)濟(jì)</secondary-title></titles><periodical><full-title>商業(yè)經(jīng)濟(jì)</full-title></periodical><pages>9-12</pages><number>05</number><keywords><keyword>農(nóng)業(yè)科技水平</keyword><keyword>指標(biāo)體系</keyword><keyword>ARIMA-Holt預(yù)測(cè)模型</keyword><keyword>科技成果推廣</keyword><keyword>組合預(yù)測(cè)</keyword></keywords><dates><year>2021</year></dates><isbn>1009-6043</isbn><call-num>23-1057/F</call-num><urls></urls><remote-database-provider>Cnki</remote-database-provider></record></Cite></EndNote>[7]。自回歸滑動(dòng)平均模型ARMA(Autoregressivemovingaveragemodel):比起AR模型和MA模型,ARMA模型有更準(zhǔn)確的譜估計(jì)值和譜分辨率性能,但它的缺點(diǎn)是參數(shù)估計(jì)比較復(fù)雜。自回歸滑動(dòng)平均模型綜合了自回歸模型(AR模型)與移動(dòng)平均模型(MA模型)的特點(diǎn)。適用于原始數(shù)據(jù)差分后平穩(wěn)的序列模型有:差分自回歸移動(dòng)平均模型ARIMA(AutoRegressiveIntegrateMovingAverageModel):是在ARMA模型的基礎(chǔ)上解決非平穩(wěn)序列的模型,在ARIMA模型中會(huì)對(duì)原序列進(jìn)行差分,應(yīng)用差分后平穩(wěn)數(shù)據(jù)進(jìn)行建模。ARIMA模型同樣只需要自身歷史數(shù)據(jù)進(jìn)行變量分析ADDINEN.CITE<EndNote><Cite><Author>林志添</Author><Year>2021</Year><RecNum>28</RecNum><DisplayText><styleface="superscript">[8]</style></DisplayText><record><rec-number>28</rec-number><foreign-keys><keyapp="EN"db-id="f5pwswfdrw2e0refr95xtr2gdfrpfrafd5dt"timestamp="1623104257">28</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author>林志添</author><author>張健明</author><author>丁海峰</author></authors></contributors><auth-address>上海工程技術(shù)大學(xué)管理學(xué)院;上海市社會(huì)保障問(wèn)題研究中心,上海工程技術(shù)大學(xué)社會(huì)科學(xué)學(xué)院;</auth-address><titles><title>基于ARIMA模型的我國(guó)長(zhǎng)三角地區(qū)衛(wèi)生人力資源需求預(yù)測(cè)分析</title><secondary-title>中國(guó)醫(yī)療管理科學(xué)</secondary-title></titles><periodical><full-title>中國(guó)醫(yī)療管理科學(xué)</full-title></periodical><pages>5-11</pages><volume>11</volume><number>03</number><keywords><keyword>衛(wèi)生人力資源</keyword><keyword>ARIMA模型</keyword><keyword>衛(wèi)生人力需求預(yù)測(cè)</keyword><keyword>長(zhǎng)三角一體化</keyword></keywords><dates><year>2021</year></dates><isbn>2095-7432</isbn><call-num>10-1208/R</call-num><urls></urls><remote-database-provider>Cnki</remote-database-provider></record></Cite></EndNote>[8]。長(zhǎng)短期記憶網(wǎng)絡(luò)LSTM(LongShort-TermMemory):LSTM原理是計(jì)算時(shí)間序列中各個(gè)觀測(cè)值之間的依賴(lài)性。與ARIMA模型相比,LSTM傾向于在具有更多固定成分的不穩(wěn)定時(shí)間序列上做得更好。指數(shù)平滑法ES(ExponentialSmoothing):指數(shù)平滑法在加權(quán)移動(dòng)平均法的基礎(chǔ)上,對(duì)不同時(shí)間的觀察值賦予不同的權(quán)數(shù),使預(yù)測(cè)值能夠更快地反映未來(lái)的變化ADDINEN.CITE<EndNote><Cite><Author>許俐穎</Author><Year>2020</Year><RecNum>32</RecNum><DisplayText><styleface="superscript">[9]</style></DisplayText><record><rec-number>32</rec-number><foreign-keys><keyapp="EN"db-id="f5pwswfdrw2e0refr95xtr2gdfrpfrafd5dt"timestamp="1623104257">32</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author>許俐穎</author><author>秦國(guó)友</author></authors></contributors><auth-address>蘇州衛(wèi)生職業(yè)技術(shù)學(xué)院;復(fù)旦大學(xué)公共衛(wèi)生學(xué)院;</auth-address><titles><title>ARIMA模型和指數(shù)平滑法在我國(guó)北方流感樣病例預(yù)測(cè)中的應(yīng)用和比較</title><secondary-title>實(shí)用預(yù)防醫(yī)學(xué)</secondary-title></titles><periodical><full-title>實(shí)用預(yù)防醫(yī)學(xué)</full-title></periodical><pages>889-893</pages><volume>27</volume><number>07</number><keywords><keyword>流感樣病例</keyword><keyword>ARIMA</keyword><keyword>指數(shù)平滑</keyword><keyword>預(yù)測(cè)</keyword></keywords><dates><year>2020</year></dates><isbn>1006-3110</isbn><call-num>43-1223/R</call-num><urls></urls><remote-database-provider>Cnki</remote-database-provider></record></Cite></EndNote>[9]。本次我將使用中國(guó)2020年1月23日至2020年6月25日之間的新冠肺炎累計(jì)確診數(shù)據(jù)進(jìn)行實(shí)驗(yàn),分別建立ARIMA模型和LSTM神經(jīng)網(wǎng)絡(luò)。根據(jù)ARIMA模型和LSTM更適合短期預(yù)測(cè)的特點(diǎn),決定預(yù)測(cè)未來(lái)7天的新冠肺炎累計(jì)確診數(shù)據(jù),之后對(duì)比分析ARIMA時(shí)間序列分析模型結(jié)果與LSTM神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果的準(zhǔn)確性,得到較為適合目前中國(guó)新冠肺炎疫情發(fā)展的預(yù)測(cè)模型。之后,分析ARIMA模型與LSTM模型分別更適合什么數(shù)據(jù),并使用符合猜想的測(cè)試數(shù)據(jù)驗(yàn)證猜想。
2基于ARIMA算法的時(shí)間序列預(yù)測(cè)2.1ARIMA原理介紹ARIMA模型即差分自回歸移動(dòng)平均模型。在ARIMA模型中,三個(gè)系數(shù)分別為p、q、d.,它們分別代表:p為自回歸項(xiàng)數(shù);q為滑動(dòng)平均項(xiàng)數(shù);d為獲得平穩(wěn)數(shù)據(jù)進(jìn)行的差分次。ARIMA模型中最重要的是確認(rèn)p、q值.,自相關(guān)系數(shù)(ACF)能決定q的取值,偏自相關(guān)系數(shù)(PACF)能夠決定q的取值A(chǔ)DDINEN.CITE<EndNote><Cite><Author>張曉卉</Author><Year>2020</Year><RecNum>31</RecNum><DisplayText><styleface="superscript">[10]</style></DisplayText><record><rec-number>31</rec-number><foreign-keys><keyapp="EN"db-id="f5pwswfdrw2e0refr95xtr2gdfrpfrafd5dt"timestamp="1623104257">31</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author>張曉卉</author><author>姚婷婷</author><author>陳陽(yáng)</author><author>張?zhí)鹛?lt;/author><author>馬駿</author></authors></contributors><auth-address>天津醫(yī)科大學(xué)公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)系;</auth-address><titles><title>基于Python語(yǔ)言的ARIMA模型在天津市結(jié)核病發(fā)病率預(yù)測(cè)中的應(yīng)用</title><secondary-title>中國(guó)感染控制雜志</secondary-title></titles><periodical><full-title>中國(guó)感染控制雜志</full-title></periodical><pages>634-642</pages><volume>19</volume><number>07</number><keywords><keyword>結(jié)核病</keyword><keyword>ARIMA時(shí)間序列</keyword><keyword>Python語(yǔ)言</keyword><keyword>發(fā)病率</keyword><keyword>預(yù)測(cè)</keyword></keywords><dates><year>2020</year></dates><isbn>1671-9638</isbn><call-num>43-1390/R</call-num><urls></urls><remote-database-provider>Cnki</remote-database-provider></record></Cite></EndNote>[10]。自回歸模型(AR)。AR自回歸模型的目的是描述當(dāng)前值與歷史值之間的關(guān)系,通過(guò)分析變量自身的歷史時(shí)間數(shù)據(jù)的特征,對(duì)自身進(jìn)行預(yù)測(cè),所以自回歸只適用于預(yù)測(cè)與自身相關(guān)的現(xiàn)象。AR模型要求:第一、必須滿(mǎn)足平穩(wěn)性要求;第二、必須具有自相關(guān)性,若自相關(guān)系數(shù)(φi)小于0.5p階自回歸過(guò)程的公式定義: yt=μ+yt是當(dāng)前值,μ是常數(shù)項(xiàng),p是階數(shù),γi是自相關(guān)系數(shù),與自回歸模型不同的是,移動(dòng)平均模型(MA)能有效地消除預(yù)測(cè)中的隨機(jī)波動(dòng),關(guān)注的是自回歸模型中的誤差項(xiàng)的累加。q階自回歸過(guò)程的公式定義: yt=φ+ARIMA模型定義為: ΦB?dx Eεt=0,Var ExsεtARIMA模型公式定義為: yt=μ+ARIMA模型建模步驟分為:平穩(wěn)性分析、差分運(yùn)算、白噪聲檢驗(yàn)、估計(jì)p、q值。具體流程圖如圖2-1所示。圖2-1差分平穩(wěn)時(shí)間序列ARIMA模型建模步驟(1)平穩(wěn)性檢驗(yàn):平穩(wěn)序列特征是時(shí)間序列在某一常數(shù)附近波動(dòng)且波動(dòng)范圍有限。使用ARIMA模型前,我們需要保證使用的時(shí)間序列數(shù)據(jù)在進(jìn)行n階差分運(yùn)算后,可以得到平穩(wěn)序列。直觀上看當(dāng)數(shù)據(jù)沒(méi)有明顯的模式特征的話(趨勢(shì)性、季節(jié)性),我們認(rèn)為它是平穩(wěn)的。平穩(wěn)性檢驗(yàn)可以通過(guò)觀察數(shù)據(jù)時(shí)序圖趨勢(shì)是否平穩(wěn)或者采用自相關(guān)檢驗(yàn)和單位根檢驗(yàn)法,此次實(shí)驗(yàn)中為了保證預(yù)測(cè)結(jié)果的準(zhǔn)確性我同時(shí)采用了直接觀察法和單位根檢驗(yàn)法。自相關(guān)檢驗(yàn)是檢驗(yàn)自相關(guān)系數(shù)是否長(zhǎng)期大于零,如果自相關(guān)系數(shù)長(zhǎng)期大于零,說(shuō)明序列間具有很強(qiáng)的長(zhǎng)期相關(guān)性,不能進(jìn)行下一步建模。單位根檢驗(yàn)是檢測(cè)序列中是否存在單位根,對(duì)時(shí)間序列進(jìn)行單位根的檢驗(yàn)的目的也是為了保證序列是平穩(wěn)序列,非平穩(wěn)時(shí)間序列如果存在單位根,一般都顯示出明顯的記憶性和波動(dòng)的持續(xù)性,所以有單位根的時(shí)間序列是非平穩(wěn)序列ADDINEN.CITE<EndNote><Cite><Author>Na</Author><Year>2021</Year><RecNum>29</RecNum><DisplayText><styleface="superscript">[11]</style></DisplayText><record><rec-number>29</rec-number><foreign-keys><keyapp="EN"db-id="f5pwswfdrw2e0refr95xtr2gdfrpfrafd5dt"timestamp="1623104257">29</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author>LiNa</author><author>LiYong</author><author>FengJiaCheng</author><author>ShanYaJie</author><author>QianJiaNing</author></authors></contributors><auth-address>KeyLaboratoryofIntegratedRegulationandResourcesDevelopmentonShallowLakes,MinistryofEducation,HohaiUniversity,Nanjing210098,China.;CollegeofEnvironment,HohaiUniversity,Nanjing210098,China.</auth-address><titles><title>[ConstructionandApplicationOptimizationoftheChl-aForecastModelARIMAforLakeTaihu]</title><secondary-title>Huanjingkexue=Huanjingkexue</secondary-title></titles><periodical><full-title>Huanjingkexue=Huanjingkexue</full-title></periodical><volume>42</volume><number>5</number><keywords><keyword>ARIMAmodel</keyword><keyword>LakeTaihu</keyword><keyword>chlorophyll-a</keyword><keyword>environmentalfactors</keyword><keyword>multiplelinearstepwiseregressionmodel</keyword></keywords><dates><year>2021</year></dates><isbn>0250-3301</isbn><urls></urls><remote-database-provider>Cnki</remote-database-provider></record></Cite></EndNote>[11]。那么我們就需要對(duì)有單位根的序列進(jìn)行n階差分的方法來(lái)獲得平穩(wěn)序列并消除單位根。這次我用ADF方法檢驗(yàn),判斷序列是否存在單位根。(2)差分運(yùn)算:ARIMA模型對(duì)比ARMA模型的限制最開(kāi)始在于只能分析平穩(wěn)序列,引入差分運(yùn)算后,就可以使用差分后是平穩(wěn)序列的數(shù)據(jù)進(jìn)行分析了。首先對(duì)原始數(shù)據(jù)進(jìn)行平穩(wěn)性分析,如果是非平穩(wěn)序列,就需要對(duì)其進(jìn)行差分運(yùn)算,來(lái)獲得符合ARIMA模型使用要求的平穩(wěn)序列。一階差分運(yùn)算是對(duì)兩個(gè)相鄰數(shù)據(jù)進(jìn)行差運(yùn)算,當(dāng)自變量從x變到x+1時(shí),函數(shù)y=y(x)的改變量就是函數(shù)y(x)在點(diǎn)x的一階差分,函數(shù)y(x)的改變量公式為: ?yx=y差分運(yùn)算過(guò)程就是對(duì)原始數(shù)據(jù)依次進(jìn)行1階、2階、3階…差分,直到其平穩(wěn)為止。在此次實(shí)驗(yàn)中,我選擇調(diào)用python的pandas庫(kù)的diff()函數(shù)進(jìn)行非平穩(wěn)時(shí)間序列數(shù)據(jù)的差分運(yùn)算并獲得差分次數(shù)。(3)白噪聲檢驗(yàn):如果一個(gè)序列是白噪聲序列(純隨機(jī)序列),那么序列值之間沒(méi)有關(guān)系,則自相關(guān)系數(shù)為零或者接近于零。在進(jìn)行時(shí)序分析之前,我們需要確認(rèn)這個(gè)時(shí)序不是一個(gè)單純的噪音,而是蘊(yùn)含著可以用模型描述的信息。因此需要對(duì)時(shí)序進(jìn)行純隨機(jī)性檢驗(yàn)。白噪聲序列的特點(diǎn)表現(xiàn)在任何兩個(gè)時(shí)點(diǎn)的隨機(jī)變量都不相關(guān),序列中沒(méi)有任何可以利用的動(dòng)態(tài)規(guī)律,因此不能用歷史數(shù)據(jù)對(duì)未來(lái)進(jìn)行預(yù)測(cè)和推斷ADDINEN.CITE<EndNote><Cite><Author>Gülhan</Author><Year>2021</Year><RecNum>30</RecNum><DisplayText><styleface="superscript">[12]</style></DisplayText><record><rec-number>30</rec-number><foreign-keys><keyapp="EN"db-id="f5pwswfdrw2e0refr95xtr2gdfrpfrafd5dt"timestamp="1623104257">30</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author>To?aGülhan</author><author>AtalayBerrin</author><author>ToksariM.Duran</author></authors></contributors><auth-address>ErciyesUniversity,EngineeringFaculty,IndustrialEngineeringDepartment,Kayseri,Turkey</auth-address><titles><title>COVID-19PrevalenceForecastingusingAutoregressiveIntegratedMovingAverage(ARIMA)andArtificialNeuralNetworks(ANN):CaseofTurkey</title><secondary-title>JournalofInfectionandPublicHealth</secondary-title></titles><periodical><full-title>JournalofInfectionandPublicHealth</full-title></periodical><number>prepublish</number><keywords><keyword>ARIMA</keyword><keyword>ANN</keyword><keyword>COVID-19</keyword><keyword>Turkey</keyword><keyword>Forecasting</keyword></keywords><dates><year>2021</year></dates><isbn>1876-0341</isbn><urls></urls><remote-database-provider>Cnki</remote-database-provider></record></Cite></EndNote>[12]。白噪聲序列滿(mǎn)足下列三個(gè)條件: EXt=μ VarXt CovXt,Xt白噪聲滿(mǎn)足均值與方差均為常數(shù),且不同時(shí)刻上的隨機(jī)變量不相關(guān)。顯然,白噪聲是一種平穩(wěn)時(shí)序。從白噪聲的定義中可以看出,對(duì)于白噪聲時(shí)序,歷史數(shù)據(jù)不能提供關(guān)于未來(lái)的信息,此時(shí)建立時(shí)序模型將會(huì)是徒勞的。因此在時(shí)序建模前需要進(jìn)行白噪聲檢驗(yàn)。同時(shí),白噪聲還可以用來(lái)判斷時(shí)序模型總體的顯著性,當(dāng)模型殘差是白噪聲序列時(shí),就可以認(rèn)為模型已經(jīng)充分提取了時(shí)序信息。在建模之前,我們需要檢查數(shù)據(jù)是否滿(mǎn)足白噪聲檢驗(yàn),非白噪聲才能進(jìn)一步檢驗(yàn)。建模后,檢驗(yàn)殘差是否滿(mǎn)足白噪聲檢驗(yàn),通過(guò)檢驗(yàn)建模才成立。(4)估計(jì)p、q值:確定ARIMA模型的p、q值,我們可以采用人工識(shí)圖、參數(shù)調(diào)優(yōu)BIC方法等。人工識(shí)圖法我們需要畫(huà)出自相關(guān)圖與非自相關(guān)圖,并觀察p、q階的截尾性。p、q階截尾與自相關(guān)系數(shù)ACF與偏自相關(guān)系數(shù)PACF的關(guān)系如表2-1所示。表2-1模型截尾拖尾性質(zhì)統(tǒng)計(jì)量平穩(wěn)AR(p)模型性質(zhì)平穩(wěn)MA(q)模型性質(zhì)平穩(wěn)ARMA(p、q)模型性質(zhì)均值常數(shù)常數(shù)常數(shù)方差常數(shù)常數(shù)常數(shù)自相關(guān)系數(shù)ACF拖尾q階截尾拖尾偏自相關(guān)系數(shù)PACFp階截尾拖尾拖尾適合ARIMA模型的平穩(wěn)序列特征是其偏自相關(guān)函數(shù)和自相關(guān)函數(shù)都是拖尾的ADDINEN.CITE<EndNote><Cite><Author>景楠</Author><Year>2020</Year><RecNum>47</RecNum><DisplayText><styleface="superscript">[13]</style></DisplayText><record><rec-number>47</rec-number><foreign-keys><keyapp="EN"db-id="f5pwswfdrw2e0refr95xtr2gdfrpfrafd5dt"timestamp="1623106131">47</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author>景楠</author><author>胡怡</author><author>韓喜雙</author></authors></contributors><auth-address>上海大學(xué)悉尼工商學(xué)院;哈爾濱工業(yè)大學(xué)深圳研究生院;</auth-address><titles><title>基于ARIMA與LSTM的新冠肺炎網(wǎng)絡(luò)關(guān)注度趨勢(shì)研究</title><secondary-title>中國(guó)安全科學(xué)學(xué)報(bào)</secondary-title></titles><periodical><full-title>中國(guó)安全科學(xué)學(xué)報(bào)</full-title></periodical><pages>37-42</pages><volume>30</volume><number>12</number><keywords><keyword>自回歸移動(dòng)平均(ARIMA)模型</keyword><keyword>長(zhǎng)短期記憶(LSTM)</keyword><keyword>新型冠狀病毒肺炎(COVID-19)</keyword><keyword>網(wǎng)絡(luò)輿情</keyword><keyword>時(shí)間序列</keyword></keywords><dates><year>2020</year></dates><isbn>1003-3033</isbn><call-num>11-2865/X</call-num><urls></urls><remote-database-provider>Cnki</remote-database-provider></record></Cite></EndNote>[13]。自相關(guān)函數(shù)ACF是用來(lái)度量的是時(shí)間序列中每隔k個(gè)時(shí)間單位(yt和y自相關(guān)函數(shù)ACF公式: ACFk=ρkρk的取值范圍是[-1,1]可以通過(guò)觀察自相關(guān)圖和偏自相關(guān)圖的截尾性和拖尾性來(lái)確定ARIMA模型的p、q值。同時(shí)檢查每個(gè)滯后處的峰值以確定它們是否顯著。2.2ARIMA模型的建立2.2.1實(shí)驗(yàn)數(shù)據(jù)特征此次新冠肺炎疫情是突發(fā)的全球性災(zāi)難。新冠肺炎疫情與突發(fā)性自然災(zāi)害,例如地震、臺(tái)風(fēng)不同,也不同于恐怖襲擊事件例如911。其影響又取決于全球的防疫措施,新冠肺炎病毒的傳染性極強(qiáng),世界各國(guó)疫情初期的感染人數(shù)、每日新增確診數(shù)量,都證明新冠肺炎傳染性極強(qiáng)。同時(shí)新冠肺炎病毒的隱蔽性強(qiáng)、潛伏周期長(zhǎng),同時(shí)伴有無(wú)癥狀感染者的出現(xiàn),使得疫情擴(kuò)散得更為快速。由于疫情的演變?nèi)Q于外生與內(nèi)生的相互作用,各國(guó)政府的應(yīng)對(duì)措施是否得當(dāng),以及全球政策是否能夠協(xié)調(diào)配合,對(duì)控制疫情在全球蔓延有著決定性的作用。而疫情的逐步擴(kuò)散,以及其嚴(yán)重程度的不斷增加,也導(dǎo)致了政府的應(yīng)對(duì)模式從常態(tài)管理模式急速轉(zhuǎn)變?yōu)榉浅B(tài)模式,并且應(yīng)對(duì)措施不斷升級(jí)加碼ADDINEN.CITE<EndNote><Cite><Author>景楠</Author><Year>2020</Year><RecNum>47</RecNum><DisplayText><styleface="superscript">[13]</style></DisplayText><record><rec-number>47</rec-number><foreign-keys><keyapp="EN"db-id="f5pwswfdrw2e0refr95xtr2gdfrpfrafd5dt"timestamp="1623106131">47</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author>景楠</author><author>胡怡</author><author>韓喜雙</author></authors></contributors><auth-address>上海大學(xué)悉尼工商學(xué)院;哈爾濱工業(yè)大學(xué)深圳研究生院;</auth-address><titles><title>基于ARIMA與LSTM的新冠肺炎網(wǎng)絡(luò)關(guān)注度趨勢(shì)研究</title><secondary-title>中國(guó)安全科學(xué)學(xué)報(bào)</secondary-title></titles><periodical><full-title>中國(guó)安全科學(xué)學(xué)報(bào)</full-title></periodical><pages>37-42</pages><volume>30</volume><number>12</number><keywords><keyword>自回歸移動(dòng)平均(ARIMA)模型</keyword><keyword>長(zhǎng)短期記憶(LSTM)</keyword><keyword>新型冠狀病毒肺炎(COVID-19)</keyword><keyword>網(wǎng)絡(luò)輿情</keyword><keyword>時(shí)間序列</keyword></keywords><dates><year>2020</year></dates><isbn>1003-3033</isbn><call-num>11-2865/X</call-num><urls></urls><remote-database-provider>Cnki</remote-database-provider></record></Cite></EndNote>[13]。同時(shí),新冠肺炎疫情數(shù)據(jù)符合時(shí)間序列,具有時(shí)間序列的基本特點(diǎn)。特點(diǎn)如下:(1)隨機(jī)性:整體呈統(tǒng)計(jì)規(guī)律,僅有部分變量為隨機(jī)變動(dòng)。(2)趨勢(shì)性:變量隨著時(shí)間進(jìn)展或自變量變化,會(huì)呈現(xiàn)同性質(zhì)變動(dòng)趨向,但變動(dòng)幅度可能不等。(3)周期性:由于外部影響隨著自然季節(jié)或時(shí)段的交替造成某因素出現(xiàn)高峰與低谷的規(guī)律。(4)綜合性:實(shí)際變化情況一般是幾種變動(dòng)的疊加或組合。預(yù)測(cè)時(shí)需要除去不規(guī)則變動(dòng)ADDINEN.CITE<EndNote><Cite><Author>VidhyaVani</Author><Year>2019</Year><RecNum>77</RecNum><DisplayText><styleface="superscript">[20]</style></DisplayText><record><rec-number>77</rec-number><foreign-keys><keyapp="EN"db-id="f5pwswfdrw2e0refr95xtr2gdfrpfrafd5dt"timestamp="1623107146">77</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author>VidhyaVani</author><author>NitheeshVarma</author><author>Lakshman</author><author>GopiKrishna</author></authors></contributors><titles><title>StocksPredictionUsingAutoArima&LSTM</title><secondary-title>InternationalJournalofEngineeringandAdvancedTechnology(IJEAT)</secondary-title></titles><periodical><full-title>InternationalJournalofEngineeringandAdvancedTechnology(IJEAT)</full-title></periodical><volume>8</volume><number>4</number><dates><year>2019</year></dates><isbn>2249-8958</isbn><urls></urls><remote-database-provider>Cnki</remote-database-provider></record></Cite></EndNote>[20]。2.2.1數(shù)據(jù)來(lái)源在此次研究中,我使用的是中國(guó)自2020年1月23日至2020年6月25日范圍內(nèi)的新冠肺炎累計(jì)確診人數(shù)來(lái)建立ARIMA模型,使用的部分?jǐn)?shù)據(jù)如表2-2所示。表2-2部分中國(guó)肺炎疫情累計(jì)確診數(shù)據(jù)日期累計(jì)確診人數(shù)日期累計(jì)確診人數(shù)1月23日2172月7日204711月24日2912月8日243631月25日4402月9日280601月26日5712月10日312111月27日8352月11日345981月28日12972月12日372511月29日19852月13日401741月30日27622月14日426411月31日45352月15日446562月1日59992月16日609212月2日77362月17日639322月3日97202月18日665762月4日118212月19日685842月5日144112月20日706352月6日172382月21日72528
2.2.3建立ARIMA模型(1)平穩(wěn)性檢驗(yàn)中國(guó)原始序列的時(shí)序圖如圖2-2所示,可以發(fā)現(xiàn)中國(guó)新冠肺炎原始序列為遞增序列,是非平穩(wěn)性序列。圖2-2中國(guó)新冠肺炎累計(jì)確診原始數(shù)據(jù)時(shí)序圖為了避免誤差,這里同時(shí)畫(huà)出來(lái)原始序列的自相關(guān)圖,如圖2-3所示,可以發(fā)現(xiàn)自圖2-3中國(guó)新冠肺炎累計(jì)確診原始數(shù)據(jù)自相關(guān)圖相關(guān)系數(shù)長(zhǎng)期大于零,沒(méi)有趨向于零,說(shuō)明序列間具有很強(qiáng)的長(zhǎng)期相關(guān)性,所以原始序列確實(shí)為非平穩(wěn)序列。(2)差分運(yùn)算為得到平穩(wěn)序列,對(duì)原始數(shù)列進(jìn)行差分運(yùn)算,一階差分后數(shù)據(jù)時(shí)序圖結(jié)果如圖2-4所示,二階差分后數(shù)據(jù)時(shí)序圖結(jié)果如圖2-5所示。圖2-4中國(guó)新冠肺炎累計(jì)確診原始數(shù)據(jù)一階差分后時(shí)序圖圖2-5中國(guó)新冠肺炎累計(jì)確診原始數(shù)據(jù)二階差分后時(shí)序可以觀察到2階差分后序列始終圍繞在均值附近隨機(jī)波動(dòng),沒(méi)有顯著非平穩(wěn)特征。除了觀察時(shí)序圖,我還采用了ADF檢驗(yàn)驗(yàn)證二階差分序列是平穩(wěn)序列,ADF檢驗(yàn)結(jié)果如表2-3所示。ADF檢驗(yàn)結(jié)果顯示,二階差分后ADF求出p值小于0.05,拒絕原假設(shè):數(shù)據(jù)是非平穩(wěn)序列,證明原始數(shù)據(jù)進(jìn)行二階差分后得到的是平穩(wěn)序列。除了ADF檢驗(yàn),畫(huà)出二階差分結(jié)果自相關(guān)圖如圖2-6所示,發(fā)現(xiàn)二階差分序列自相關(guān)系數(shù)逐漸趨向于零,說(shuō)明序列間不具有很強(qiáng)的長(zhǎng)期相關(guān)性。圖2-6中國(guó)新冠肺炎累計(jì)確診原始數(shù)據(jù)二階差分后自相關(guān)因?yàn)闊o(wú)論自相關(guān)系數(shù)還是偏自相關(guān)系數(shù)都僅僅考慮是否存在某一特定滯后階數(shù)的相關(guān)性,所以需要對(duì)序列進(jìn)行平穩(wěn)性檢驗(yàn)后再進(jìn)行白噪聲檢驗(yàn)判斷差分后序列是否還有研究?jī)r(jià)值。二階差分后序列通過(guò)LB檢驗(yàn)得到p值為2.49058218e-10,小于0.05,通過(guò)白噪聲檢驗(yàn),說(shuō)明二階差分序列是非純隨機(jī)序列,具有研究?jī)r(jià)值。LB檢驗(yàn)是對(duì)時(shí)間序列是否存在滯后相關(guān)的一種統(tǒng)計(jì)檢驗(yàn)。LB檢驗(yàn)則是基于一系列滯后階數(shù),判斷序列是否存在總體的相關(guān)性或者說(shuō)隨機(jī)性。如果對(duì)ARIMA模型建模后殘差結(jié)果進(jìn)行LB檢驗(yàn)是不通過(guò),那么就說(shuō)明此ARIMA模型并不適合對(duì)該數(shù)據(jù)進(jìn)行時(shí)間序列分析。表2-3差分運(yùn)算ADF檢驗(yàn)結(jié)果差分次數(shù)P值顯著水平一次差分0.15805396283988510.05二次差分3.6377830023418e-140.05(3)確定p、q值二階差分序列自相關(guān)圖如圖3-5所示,可以觀察到二階差分序列的自相關(guān)系數(shù)(ACF)很快趨向于零,自相關(guān)圖顯現(xiàn)出1階截尾性即q=1。觀察二階差分序列偏自相關(guān)圖(圖2-7),觀察到二階差分序列偏自相關(guān)圖緩慢趨向于零,呈現(xiàn)出拖尾性特征,模型定階為p=0。圖2-7中國(guó)新冠肺炎累計(jì)確診原始數(shù)據(jù)二階差分后偏自相關(guān)(4)建立模型并進(jìn)行殘差檢驗(yàn)通過(guò)使用Python庫(kù)中statsmodels模塊的ARIMA方法建立模型。進(jìn)行殘差檢驗(yàn),檢驗(yàn)殘差是否滿(mǎn)足白噪聲檢驗(yàn),通過(guò)檢驗(yàn)建模才成立。通過(guò)觀察殘差的自相關(guān)圖(圖3-10),可以發(fā)現(xiàn),從1階開(kāi)始,所有數(shù)值都接近于零,說(shuō)明數(shù)據(jù)間相關(guān)性很小。同樣觀察殘差的偏自相關(guān)圖(圖3-11),同樣發(fā)現(xiàn)從1階開(kāi)始,所有數(shù)值都接近于零,說(shuō)明該序列為白噪聲序列,殘差中已經(jīng)不存在有價(jià)值的信息,故模型成立。為了嚴(yán)謹(jǐn),我們?cè)俨捎肣Q圖的方式來(lái)驗(yàn)證殘差是否為白噪聲序列。QQ圖是一種散點(diǎn)圖,它的橫坐標(biāo)是標(biāo)準(zhǔn)正態(tài)分布的分位數(shù),它的縱坐標(biāo)是樣本值。通過(guò)觀察QQ圖上的數(shù)據(jù)點(diǎn)是否符合線性分布,即數(shù)據(jù)點(diǎn)是否近似地在一條直線上,就可以鑒別樣本數(shù)據(jù)是否近似于正態(tài)分布,而且該直線的斜率為標(biāo)準(zhǔn)差,截距為均值。如果殘差符合正態(tài)分布,那么它就是一個(gè)純隨機(jī)序列。QQ圖如圖2-8所示。可以觀察到QQ圖上數(shù)據(jù)基本在同一直線上,呈現(xiàn)線性分布,說(shuō)明該序列符合正態(tài)分布,均值為零,方差為常數(shù),即殘差序列為純隨機(jī)序列。圖2-8殘差數(shù)據(jù)QQ(5)預(yù)測(cè)未來(lái)7天數(shù)據(jù)使用python時(shí)間序列分析模型中的forecast方法預(yù)測(cè)2020年6月25至2020年7月2日中國(guó)新冠肺炎累計(jì)確診數(shù)據(jù)。最后結(jié)果如圖2-9所示。計(jì)算預(yù)測(cè)值和真實(shí)值的相對(duì)誤差,相對(duì)誤差計(jì)算公式為: REP=yt相對(duì)誤差計(jì)算結(jié)果如表2-4所示。計(jì)算結(jié)果顯示,ARIMA模型預(yù)測(cè)結(jié)果與真實(shí)值比較貼合,所以ARIMA(0,2,1)模型對(duì)中國(guó)新冠肺炎數(shù)據(jù)預(yù)測(cè)結(jié)果比較理想。圖2-9中國(guó)新冠肺炎疫情預(yù)測(cè)結(jié)果表2-4ARIMA模型相對(duì)誤差日期ARIMA預(yù)測(cè)結(jié)果真實(shí)值相對(duì)誤差%2020年6月25日85038.889700851480.1282020年6月26日85057.178058851720.1352020年6月27日85073.008975851900.1372020年6月28日85086.374141852040.1382020年6月29日85097.274034852270.1522020年6月30日85105.708627852320.1482020年7月1日85111.677921852630.177
3基于LSTM神經(jīng)網(wǎng)絡(luò)的時(shí)間序列預(yù)測(cè)3.1LSTM原理介紹LSTM(longshort-termmemory),長(zhǎng)短期記憶網(wǎng)絡(luò),是循環(huán)神經(jīng)網(wǎng)路(RNN)的一種變體。循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)分析的每個(gè)序列當(dāng)前的輸出與前面的輸出有關(guān)ADDINEN.CITE<EndNote><Cite><Author>王志剛</Author><RecNum>37</RecNum><DisplayText><styleface="superscript">[14]</style></DisplayText><record><rec-number>37</rec-number><foreign-keys><keyapp="EN"db-id="f5pwswfdrw2e0refr95xtr2gdfrpfrafd5dt"timestamp="1623106131">37</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author>王志剛</author><author>王業(yè)光</author><author>楊寧</author><author>米禹豐</author><author>曲曉雷</author></authors></contributors><auth-address>沈陽(yáng)飛機(jī)設(shè)計(jì)研究所飛行控制部;</auth-address><titles><title>基于LSTM的飛行數(shù)據(jù)挖掘模型構(gòu)建方法研究</title><secondary-title>航空學(xué)報(bào)</secondary-title></titles><periodical><full-title>航空學(xué)報(bào)</full-title></periodical><pages>1-10</pages><keywords><keyword>LSTM</keyword><keyword>飛行歷史數(shù)據(jù)</keyword><keyword>數(shù)據(jù)挖掘</keyword><keyword>模式識(shí)別</keyword><keyword>模型構(gòu)建</keyword></keywords><dates></dates><isbn>1000-6893</isbn><call-num>11-1929/V</call-num><urls></urls><remote-database-provider>Cnki</remote-database-provider></record></Cite></EndNote>[14]。循環(huán)神經(jīng)網(wǎng)絡(luò)會(huì)記憶序列前面的信息,并應(yīng)用于當(dāng)前輸出的計(jì)算中,在隱藏層之間的節(jié)點(diǎn)間加入連接,就可以將上一時(shí)刻隱藏層的輸出加入到下一個(gè)輸入中。因?yàn)榍梆伾窠?jīng)網(wǎng)絡(luò)只從輸入節(jié)點(diǎn)接受信息,只能對(duì)輸入空間進(jìn)行操作,對(duì)不同時(shí)間序列的輸入沒(méi)有“記憶”A
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 人教版數(shù)學(xué)六年級(jí)下冊(cè)《練習(xí)五》具體內(nèi)容及教學(xué)建議
- 長(zhǎng)沙醫(yī)學(xué)院《兼并與收購(gòu)》2023-2024學(xué)年第二學(xué)期期末試卷
- 手足口病合并肺炎護(hù)理
- 山東省日照市嵐山區(qū)2025屆數(shù)學(xué)五年級(jí)第二學(xué)期期末達(dá)標(biāo)檢測(cè)試題含答案
- Web即時(shí)通訊系統(tǒng)課程
- 湖南三一工業(yè)職業(yè)技術(shù)學(xué)院《物流分析與設(shè)施規(guī)劃》2023-2024學(xué)年第二學(xué)期期末試卷
- 濰坊護(hù)理職業(yè)學(xué)院《企業(yè)文化研究》2023-2024學(xué)年第二學(xué)期期末試卷
- 常德職業(yè)技術(shù)學(xué)院《化工制圖與CAD實(shí)驗(yàn)》2023-2024學(xué)年第二學(xué)期期末試卷
- 西藏民族大學(xué)《實(shí)驗(yàn)室安全與規(guī)范》2023-2024學(xué)年第二學(xué)期期末試卷
- 廣安職業(yè)技術(shù)學(xué)院《教學(xué)設(shè)計(jì)團(tuán)體操創(chuàng)編理論與實(shí)踐》2023-2024學(xué)年第二學(xué)期期末試卷
- 護(hù)理安全與護(hù)理質(zhì)量管理課件
- 行政事業(yè)差旅費(fèi)報(bào)銷(xiāo)培訓(xùn)
- 光榮院建設(shè)可行性研究報(bào)告
- DB32T 5061.1-2025中小學(xué)生健康管理技術(shù)規(guī)范 第1部分:心理健康
- 2025年河南經(jīng)貿(mào)職業(yè)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫(kù)完整版
- 糖尿病酮癥酸中毒患者的護(hù)理查房
- 2025年河南經(jīng)貿(mào)職業(yè)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫(kù)往年題考
- 企業(yè)電動(dòng)叉車(chē)充電安全管理辦法
- 養(yǎng)老服務(wù)中心經(jīng)濟(jì)效益分析
- 網(wǎng)絡(luò)周期竊取演變-洞察分析
- 2025年度貨車(chē)司機(jī)招聘廣告發(fā)布合同3篇
評(píng)論
0/150
提交評(píng)論