




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、組合預測模型在全國能源消耗總量中的應用學院:統數 班級:091數學0 姓名:彭賀 學號:2009720002摘要:能源影響著我國社會經濟的穩定持續發展,對未來能源消耗的準確預測具有重要的意義。本文以我國1981-2011年的全國能源消耗總量數據為基礎,建立了ARIMA預測模型、灰色預測模型、三次多項式預測模型和基于這三種模型的組合模型,并進行了精度比較,最后選擇最優的組合預測模型對2012-2014年的全國能源消耗總量進行預測。關鍵詞:ARIMA模型;灰色預測模型;三次多項式;組合模型;能源消耗1 引言:能源是國民經濟發展和人民生活水平提高的重要物質基礎,能源短缺曾經長期制約我國經濟的發展。近
2、幾年由于能源工業的發展,短缺局面雖然得到了緩解,但從長遠來看能源供需形勢仍然非常嚴峻,因此做好未來能源消費預測分析,為能源規劃及政策的制定提供科學的依據,對于保持我國社會經濟健康、持續、穩定發展具有重要的理論與現實意義。本文利用中國統計年鑒得到31期全國能源消耗總量y的時間序列如下表一所示:表一:全國能源消耗總量(單位:萬噸標準煤)年份198119821983198419851986198719881989y571445858860275594476206766040709047668280850年份199019911992199319941995199619971998y8663292997
3、9693498703103783109170115993122737131176年份199920002001200220032004200520062007y138948137798132214133831138552.6143199.2151797.3174990.3203226.7年份2008200920102011y2246822462702655832850002 預測方法介紹2.1 ARIMA模型的基本原理ARIMA模型是Box和Jenkins1970年提出的以隨機理論為基礎的時間序列分析方法,又稱為“Box-Jenkins模型”,這以模型在經濟領域的預測分析中得到了廣泛的應用。時間
4、序列是依賴時間t的一組隨機變量,構成該時序的單個序列值雖然具有不確定性,但對整個時間序列來說,它的變化卻有一定的規律性,可以用相應的數學模型來近似描述。ARIMA模型有三種基本類型:自回歸模型、移動平均模型、單整自回歸移動平均模型。單整是指將一個時間序列有非平穩性變為平穩性所要經過的差分的次數,這是對非平穩時間序列進行時間序列分析的必經步驟。假設一個隨機過程含有d個單位根,其經過d次差分之后可以變換為一個平穩的自回歸移動平均過程。則該隨機過程稱為單整自回歸移動平均模型。模型中AR稱為自回歸分量,P為自回歸分量的階數;MA為移動平均分量,q為移動平均分量的階數;I為差分,d為使時間序列具有平穩性
5、所需要的差分次數。p階自回歸過程AR(p)的一般表達式為: 其中白噪聲過程。q階的移動平均過程MA(q)可以表示為:,為白噪聲過程。ARIMA( p,d, q)模型一般表達式為:2.2 灰色預測法灰色預測法是一種對含有不確定因素的系統進行預測的方法。一般是利用時間序列數據,通過建立GM(1,1)模型進行預測。灰色預測模型的預測步驟如下:(1) 首先對原始時間序列數據,做一次累加生成,得到新的序列(2) 利用一次累加生成序列擬合微分方程:,得到參數和(3) 解微分方程得到預測模型函數:(4) 將得到的序列進行一次累減得到預測序列(5) 利用歷史數據對數據模型進行精度檢驗,若通不過檢驗,則利用殘差
6、對原模型進行修正。(6) 通過預測方程進行預測。2.3組合預測模型不同的預測方法根據相同的信息,往往會提供不同的結果,如果簡單的將誤差較大的一些方法舍棄掉,將會丟棄一些有用的信息,使得模型的精度不高。組合預測法是指通過建立一個組合預測模型,把多種預測方法所得到的預測結果進行綜合。由于組合模型能夠較大限度地利用各種預測樣本信息,所以它比單項預測模型考慮問題更系統、更全面,因而能夠有效地減少單個預測模型受隨機因素的影響,可以提高預測的精度和穩定性。3 全國能源消耗總量的實證分析3.1 建立ARIMA模型3.11平穩化處理用ARIMA模型擬合的時間序列必須是平穩的,如果序列不平穩,則要通過差分或序列
7、變換等先將序列平穩化。繪制原始序列的時序圖得到圖形如圖一所示:50,000100,000150,000200,000250,000300,0001983198819931998200320082013Y圖一:y時序圖由圖可從直觀上看出原始序列存在明顯的長期遞增趨勢,原始序列不平穩。利用軟件EViews,運用單位根檢驗方法對序列進行平穩性檢驗發現原始序列確定不平穩,因此本文先對該序列取對數,令,然后對yl進行差分,差分兩次之后得到平穩的序列ylii。單位根檢驗結果如下表二所示:表二:單位根檢驗結果ADF值P值臨界值a=1%臨界值a=5%臨界值a=10%原始序列y1.7585820.9995-3.
8、68919-2.97185-2.62512取對數后yl0.6275170.988-3.68919-2.97185-2.62512一階差分yli-2.958250.0529-3.72407-2.98623-2.6326二階差分ylii-4.765430.0007-3.69987-2.97626-2.62742由表可知,取對數后再做兩次一步差分之后的序列yliiADF檢驗的p值為0.0007,小于0.05,因此拒絕序列非平穩的原假設,可以接受序列為平穩的備擇假設。在此可知ARIMA模型定階為d=2。也可由圖標直觀說明序列的平穩性,作出ylii的時序圖如圖一所示:-.08-.06-.04-.02.0
9、0.02.04.06.08.101983198819931998200320082013YLII圖二:ylii時序圖時序圖也顯示ylii序列平穩,結果與單位根檢驗相符。3.12模型定階模型定階的方法有多中,本文選擇基于自相關函數和偏自相關函數的定階方法確定模型的階數。首先,考察平穩序列ylii的自相關圖和偏自相關的性質,為擬合模型定階,自相關函數(ACF)和偏自相關函數(PACF)圖形如圖三所示;圖三:由圖形可知,對處理后的序列ylii可以選擇建立ARIMA(1,2,1)、ARIMA(1,2,2)、ARMA(2,2,1)、ARIMA(2,2,2)4種模型。分別擬合這四種模型得到結果如表三所示:
10、表三:4種模型擬合結果模型變量估計系數T統計量伴生概率P值調整AICSCARIMA(1,2,1)AR(1)-0.37510 -1.22811 0.23040 0.17179 -4.13804 -4.04288 MA(1)0.74524 3.23898 0.00330 ARIMA(1.2,2)AR(1)0.32632 1.53493 0.13740 0.27357 -4.23696 -4.09422 MA(1)-0.25253 -1.74264 0.09370 MA(2)-0.73255 -5.34026 0.00000 ARIMA(2,2,1)AR(1)-0.25552 -0.95215 0.
11、35050 0.18863 -4.15745 -4.01347 AR(2)-0.23472 -1.22733 0.23160 MA(1)0.59424 2.30532 0.03010 ARIMA(2,2,2)AR(1)-0.76684 -5.24699 0.00000 0.28900 -4.25798 -4.06601 AR(2)-0.59005 -3.94857 0.00060 MA(1)1.24653 20.40994 0.00000 MA(2)0.92659 20.03634 0.00000 其中只有ARIMA(2,2,2)模型的各系數通過了顯著性檢驗,而且其模型的調整是四個模型中最大的
12、,雖然它的AIC,SC的絕對值不是最小的,ARIMA(1,2,1)模型的AIC最小,ARIMA(2,2,1)的SC最小,但它們的系數都沒有通過顯著性檢驗,而且調整也較小,所以本文選擇ARIMA(2,2,2)模型,模型表達式為:3.13 模型檢驗用ARIMA(2,2,2)模型做擬合得到殘差序列,對殘差序列進行自相關和偏自相關分析,得到結果如圖三所示:圖三由圖可知。殘差序列P值幾乎都是大于0.05的,說明殘差序列近于白噪聲,基本沒有可提取的信息了,模型已經提取了有規律的信息,說明模型擬合效果較好。3.14模型預測利用1981-2011年的時間序列建立的ARMA(2,2,2)模型:來預測2007-2
13、014年的能源消耗總量,結果如表四所示:表四:2007-2014年全國能源消耗總量ARIMA(2,2,2)模型預測值年份2007.00 2008.00 2009.00 2010.00 2011.00 2012.00 2013.00 2014.00 實際值203226.68 224682.00 246270.00 265583.00 285000.00 預測值202971.88 233243.50 268974.47 311049.59 358189.95 413129.35 477104.00 549931.36 絕對相對誤差百分比(%)0.13 3.81 9.22 17.12 25.68 3
14、.2 灰色模型預測根據歷史數據序列,做一次累加得到生成序列,對于微分方程,構造數據矩陣B和數據向量Y,解該微分方程,得到其中: 進行矩陣運算得到發展灰數a=-0.055673,內生控制灰數=45508.908,得到預測模型為:。3.21殘差檢驗將得到的序列進行一次累減生成預測序列,將預測值與真實值比較得到絕對誤差序列為:=0、8516.84、7337.171、3478.379、2894.069、3479.306、4761.587、6752.808、6917.228、8466.436、10356.31、9561.971、6328.756、6120.155、5915.771、6827.269、73
15、21.323、9152.556、9938.481、1402.44、11990.47、18629.48、22636.52、27218.27、28376.96、15499.22、1831.269、11756.32、21153.92、27578.59、33369.39計算相對誤差后發現其中有些較大,甚至大于10%,最后五項的平均相對誤差為7.36319507%。殘差檢驗沒有通過,下面進行關聯度檢驗。當=0.5時,關聯度大于0.6時就可以通過關聯度檢驗了。由殘差的絕對序列可知=0, =33369.39。然后根據公式計算每個序列值的關聯系數,再求平均得到關聯度r=0.650237。本文取取=0.5,r&
16、gt;0.6,因此模型通過了關聯度檢驗。雖然模型通過了關聯度檢驗,但模型沒有通過殘差檢驗,精度不夠理想,所以本文對該模型進行殘差修正。3.22模型修正根據模型得到的殘差序列,去掉第一項得到新的序列,然后進行累加得到序列,在此基礎上建立相應的模型:,模型兩邊求導得到殘差修正項為:。原預測模型加上此修正項得到修正后的預測模型為:,其中為修正系數。最后進行累減得到原始序列預測模型:。根據所得數據,利用Excel軟件,得到=-0.06924,=2893.212。根據修正項的計算公式,可得,這樣經過殘差修正后的模型為:其中。在此序列的基礎上進行累減得到2007-2014年的全國能源消耗總量的預測值如下表
17、五所示:表五:2007-2014年全國能源消耗總量灰色模型預測值年份20072008200920102011201220132014實際值203226.7224682246270265583285000預測值201439.6212966.946225154.6238040.3251664.1266068.2281297.3297398.4相對誤差百分比(%)0.875.218.5710.3711.693.3三次多項式當預測對象依時間變化呈現某種上升或下降的趨勢,并且無明顯的季節波動,又能找到一條合適的函數曲線反應這種變化趨勢時,就可用時間t為自變量,時序數值y為因變量,建立趨勢模型:。 三次多
18、項式預測模型是趨勢外推預測模型中的一種比較常用的模型。為了探究時序數據變化的趨勢,作出全國能源消費總量y的散點圖如圖四所示:圖四:散點圖由圖可知全國能源消耗總量沒有明顯的季節波動,而且大致呈拋物線或指數的趨勢上升,但經過精度比較之后,三次多項式的擬合的最好,所以本文采用三次多項式模型進行擬合。利用軟件Eviews 進行回歸得到結果如下表六所示:表六:三次多項式模型結果變量系數標準差T統計量P值常數項34209.538549.9254.0011500.0004T10136.882277.3004.4512700.0001T2-646.4941163.9748-3.9426440.0005T318
19、.582983.3716555.5115310.0000其中模型的F統計量為345.9252,相伴概率為0.00,小于0.05,所以拒絕原假設,即模型是顯著的。而且各系數的顯著性檢驗的P值都小于0.05,通過了顯著性檢驗。模型的調整的為0.971825,接近于1,說明模型擬合效果好。因此,建立三次多項式模型如下:用該模型對2007-2014年的全國能源消費總量進行預測得到結果如表七所示:表七:2007-2014年全國能源消費總量三次多項式預測值年份20072008200920102011201220132014真實值203226.7224682246270265583285000預測值2023
20、80.4219124.89237698.4258212.3280778.2305507.6332511.9361902.6相對誤差百分比(%)0.412.473.482.771.483.4組合模型以上三種方法有些精度較高,有些精度較低,但由于各自理論的缺陷,會使預測產生系統偏差。為了更充分的提取樣本信息,提高預測精度,本文將以上三種預測模型進行組合得到一個組合的預測模型。組合模型的權重有多種,可以等概率取權重,可以采用最小二乘估計法取權重,也可以使權重,其中為殘差標準差,m為單一模型的個數,或者使權重,其中為第i個單一模型誤差平方和,m為單一模型個數。本文采用第三種取取權重的方法,即。利用Excel軟件求得權重分別為:=0.466858,=0.171932824,=0.361209557根據預測模型:對2007-2014年的全國能源消耗總量進行預測結果如下表八所示:表八:2007-2014年全國能源消耗總量組合預測值年份20072008200920102011201220132014真實值203226.68224682246270265583285000預測值202142.34219328.12238544.92260010.57283571.66309765.5338872.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 四川雅安中學2025屆高三下學期期末學習能力診斷數學試題含解析
- 內蒙巴彥淖爾市2025年高三畢業班3月教學質量檢查語文試題含解析
- 山東省日照市五蓮二中學2025屆初三化學試題下學期期末考試試題含解析
- 武夷山職業學院《建筑與裝飾工程計量與計價課程設計》2023-2024學年第二學期期末試卷
- 山東省濟南市歷城區2025屆初三4月模擬(二模)考試生物試題理試題含解析
- 遼寧中醫藥大學《藥學綜合實驗》2023-2024學年第二學期期末試卷
- 六盤水幼兒師范高等專科學校《日語文學》2023-2024學年第二學期期末試卷
- 山西林業職業技術學院《遙感原理與方法》2023-2024學年第一學期期末試卷
- 二零二五房屋及土地租賃協議
- 智能駕駛之路
- 創新創業教育課程體系建設方案
- 期中 (試題) -2024-2025學年人教精通版(2024)英語三年級上冊
- 鐵路客車車輛電氣系統維護考核試卷
- DB34∕T 4235-2022 濃香窖泥檢測操作規程
- 統編版高中語文必修下:辨識媒介信息
- 2024年東南亞紙巾商銷(AFH)市場深度研究及預測報告
- 服務質量保障措施及進度保障措施
- 七層垂直循環式立體車庫
- 中國子宮內膜增生管理指南(2022)解讀
- 電力設備保修承諾書范本
- 酸棗仁湯的劑型研究
評論
0/150
提交評論