過程建模11-時間序列分析模型ppt課件_第1頁
過程建模11-時間序列分析模型ppt課件_第2頁
過程建模11-時間序列分析模型ppt課件_第3頁
過程建模11-時間序列分析模型ppt課件_第4頁
過程建模11-時間序列分析模型ppt課件_第5頁
已閱讀5頁,還剩42頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第十一章 時間序列分析模型1 時間序列分析模型簡介 2 長江水質污染的開展趨勢預測 【CUMCM 2005A】一、問題分析二、模型假設三、模型建立四、模型預測五、結果分析六、模型評價與改良一、時間序列分析模型概述1、自回歸模型2、挪動平均模型3、自回歸挪動平均模型二、隨機時間序列的特性分析三、模型的識別與建立四、模型的預測1 時間序列分析模型【ARMA模型 】簡介 ARMA模型是一類常用的隨機時間序列模型,是一種精度較高的時間序列短期預測方法,其根本思想是:某些時間序列是依賴于時間 的一族隨機變量,構成該時間序列的單個序列值雖然具有不確定性,但整個序列的變化卻有一定的規律性,可以用相應的數學模

2、型近似描畫. 經過對該數學模型的分析研討,可以更本質地認識時間序列的構造與特征,到達最小方差意義下的最優預測. ARMA模型有三種根本類型:自回歸AR:Auto-regressive模型挪動平均MA:Moving Average模型自回歸挪動平均ARMA:Auto-regressive Moving Average模型 一、概 述1 時間序列分析模型【ARMA模型 】簡介 1、自回歸【 AR 】模型自回歸序列 : 假設時間序列 是它的前期值和隨機項的線性函數,即可表示為【1】【1】式稱為 階自回歸模型,記為AR 注1:實參數 稱為自回歸系數,是待估參數.隨機項 是相互獨立的白噪聲序列,且服從均

3、值為0、方差為 的正態分布.隨機項與滯后變量不相關。 注2:普通假定 均值為0,否那么令 1 時間序列分析模型【ARMA模型 】簡介 記 為 步滯后算子,即 ,那么模型【1】可表示為令 ,模型可簡寫為AR 過程平穩的條件是滯后多項式 的根均在單位圓外,即 的根大于1 【2】1 時間序列分析模型【ARMA模型 】簡介 2、挪動平均【MA】模型挪動平均序列 : 假設時間序列 是它的當期和前期的隨機誤差項的線性函數,即可表示為 【3】式【3】稱為階挪動平均模型,記為MA 注:實參數為挪動平均系數,是待估參數 1 時間序列分析模型【ARMA模型 】簡介 引入滯后算子,并令那么模型【3】可簡寫為 注1:

4、挪動平均過程無條件平穩 注2:滯后多項式的根都在單位圓外時,AR過程與MA過程能相互表出,即過程可逆,【4】即為MA過程的逆轉方式,也就是MA過程等價于無窮階的AR過程注3:【2】滿足平穩條件時, AR過程等價于無窮階的MA 過程,即1 時間序列分析模型【ARMA模型 】簡介 3、自回歸挪動平均【ARMA】模型【B-J方法建模】自回歸挪動平均序列 :假設時間序列是它的當期和前期的隨機誤差項以及前期值的線性函數,即可表示為【5】式【5】稱為階的自回歸挪動平均模型,記為ARMA注1:實參數稱為自回歸系數,為挪動平均系數,都是模型的待估參數注2:【1】和【3】是【5】的特殊情形注3:引入滯后算子,模

5、型【5】可簡記為【6】注4:ARMA過程的平穩條件是滯后多項式 的根均在單位圓外 可逆條件是滯后多項式的根都在單位圓外 1 時間序列分析模型【ARMA模型 】簡介 二、隨機時間序列的特性分析1、時序特性的研討工具1自相關構成時間序列的每個序列值相關關系稱為自相關。自相關程度由自相關系數表示時間序列中相隔期的觀測值之間的相關程度。 之間的簡單度量,注1:是樣本量,為滯后期,代表樣本數據的算術平均值 注2:自相關系數 的取值范圍是 且越接近1,自相關程度越高 1 時間序列分析模型【ARMA模型 】簡介 2偏自相關偏自相關是指對于時間序列,在給定的條件下,與之間的條件相關關系。 其相關程度用度量,有

6、 偏自相關系數其中是滯后期的自相關系數, 1 時間序列分析模型【ARMA模型 】簡介 2、時間序列的特性分析1隨機性 假設一個時間序列是純隨機序列,意味著序列沒有任何規律性,序列諸項之間不存在相關,即序列是白噪聲序列,其自相關系數應該與0沒有顯著差別。可以利用置信區間實際進展斷定。 在B-J方法中,測定序列的隨機性,多用于模型殘差以及評價模型的優劣。2平穩性假設時間序列 滿足 1對恣意時間,其均值恒為常數; 2對恣意時間和,其自相關系數只與時間間隔 有關,而與 的起始點無關。 那么,這個時間序列就稱為平穩時間序列 。 和1 時間序列分析模型【ARMA模型 】簡介 序列的平穩性也可以利用置信區間

7、實際進展斷定.需求留意的是,在B-J方法中,只需平穩時間序列才干直接建立ARMA模型,否那么必需經過適當處置使序列滿足平穩性要求 在實踐中,常見的時間序列多具有某種趨勢,但很多序列經過差分可以平穩 判別時間序列的趨勢能否消除,只需調查經過差分后序列的自相關系數 3季節性 時間序列的季節性是指在某一固定的時間間隔上,序列反復出現某種特性.比如地域降雨量、旅游收入和空調銷售額等時間序列都具有明顯的季節變化. 普通地,月度資料的時間序列,其季節周期為12個月; 季度資料的時間序列,季節周期為4個季. 1 時間序列分析模型【ARMA模型 】簡介 判別時間序列季節性的規范為: 月度數據,調查 時的自相關

8、系數能否與0有顯著差別;季度數據,調查 系數能否與0有顯著差別。 時的自相關闡明各年中同一月季不相關,序列不存在季節性,否那么存在季節性. 假設自相關系數與0無顯著不同, 實踐問題中,常會遇到季節性和趨勢性同時存在的情況,這時必需事先剔除序列趨勢性再用上述方法識別序列的季節性,否那么季節性會被強趨勢性所掩蓋,以致判別錯誤. 包含季節性的時間序列也不能直接建立ARMA模型,需進展季節差分消除序列的季節性,差分步長應與季節周期一致. 1 時間序列分析模型【ARMA模型 】簡介 三、模型的識別與建立在需求對一個時間序列運用B-J方法建模時,應運用序列的自相關與偏自相關對序列適宜的模型類型進展識別,確

9、定適宜的階數以及 消除季節趨勢性后的平穩序列 1、自相關函數與偏自相關函數1MA的自相關與偏自相關函數自協方差函數 是白噪聲序列的方差 1 時間序列分析模型【ARMA模型 】簡介 樣本自相關函數 MA序列的自相關函數在這種性質稱為自相關函數的步截尾性; 以后全都是0,隨著滯后期 這種特性稱為偏自相關函數的拖尾性 的添加,呈現指數或者正弦波衰減,趨向于0,偏自相關函數1 時間序列分析模型【ARMA模型 】簡介 2AR序列的自相關與偏自相關函數偏自相關函數 是步截尾的 ;自協方差函數 滿足 自相關函數 滿足 它們呈指數或者正弦波衰減,具有拖尾性 3ARMA序列的自相關與偏自相關函數均是拖尾的1 時

10、間序列分析模型【ARMA模型 】簡介 2、模型的識別 自相關函數與偏自相關函數是識別ARMA模型的最主要工具,B-J方法主要利用相關分析法確定模型的階數. 假設樣本自協方差函數 在步截尾,那么判別 是MA 序列 假設樣本偏自相關函數在步截尾,那么可判別是AR序列 假設,都不截尾,而僅是依負指數衰減,這時可初步以為ARMA序列,它的階要由從低階到高階逐漸添加,再經過檢驗來確定. 在,是但實踐數據處置中,得到的樣本自協方差函數和樣本偏自相關函數只是 和的估計,要使它們在某一步之后全部為0幾乎是而只能是在某步之后圍繞零值上下動搖,故對于 和不能夠的,的截尾性 只能借助于統計手段進展檢驗和斷定。 1

11、時間序列分析模型【ARMA模型 】簡介 1的截尾性判別對于每一個 ,計算 普通取左右,調查其中滿足或 的個數能否為 的68.3%或95.5%。 假設當時, 明顯地異于0,而 近似為0,且滿足上述不等式的個數到達了相應的比例, 那么可近似地以為 在步截尾 1 時間序列分析模型【ARMA模型 】簡介 2的截尾性判別作如下假設檢驗: 存在某個,使,且 統計量表示自在度為的分布 的上側分位數點 對于給定的顯著性程度 ,假設 ,那么以為 樣本不是來自AR模型 ;,可以為 樣本來自AR模型 。注:實踐中,此判別方法比較粗糙,還不能定階,目前流行的方法是H.Akaike信息定階準那么AIC1 時間序列分析模

12、型【ARMA模型 】簡介 3AIC準那么確定模型的階數AIC定階準那么: 是模型的未知參數的總數是用某種方法得到的方差的估計為樣本大小,那么定義AIC準那么函數 用AIC準那么定階是指在 的一定變化范圍內,尋求使得 最小的點 作為的估計。 AR模型 :ARMA模型 :1 時間序列分析模型【ARMA模型 】簡介 3、參數估計在階數給定的情形下模型參數的估計有三種根本方法:矩估計法、逆函數估計法和最小二乘估計法,這里僅引見矩估計法 1AR模型 白噪聲序列的方差的矩估計為1 時間序列分析模型【ARMA模型 】簡介 2MA模型 3ARMA模型的參數矩估計分三步: i求的估計 1 時間序列分析模型【AR

13、MA模型 】簡介 ii令,那么的自協方差函數的矩估計為 iii把近似看作MA序列,利用2 對MA序列的參數估計方法即可 1 時間序列分析模型【ARMA模型 】簡介 4、模型檢驗對于給定的樣本數據AIC準那么確定了模型的類型和階數,用矩估計法確定了模型中的參數,從而建立了一個ARMA模型,來擬合真正的隨機序列。但這種擬合的優劣程度如何,主要應經過實踐運用效果來檢驗,也可經過數學方法來檢驗。,我們經過相關分析法和下面引見模型擬合的殘量自相關檢驗,即白噪聲檢驗: 對于ARMA模型,應逐漸由ARMA1,1,ARMA2,1,ARMA1,2,ARMA2,2,依次求出參數估計,對AR和MA模型,先由和初步定

14、階,再求參數估計。 的截尾性1 時間序列分析模型【ARMA模型 】簡介 普通地,對ARMA模型 取初值和它們均值為0,可遞推得到殘量估計現作假設檢驗:可取它們等于0,由于是來自白噪聲的樣本 令1 時間序列分析模型【ARMA模型 】簡介 其中取左右。 那么當成立時,服從自在度為的分布。 對給定的顯著性程度,假設,那么回絕,即模型與原隨機序列之間擬合得不好,那么以為模型與原隨機序列之間擬合需重新思索得較好,模型檢驗被經過。建模;假設1 時間序列分析模型【ARMA模型 】簡介 四、模型的預測假設模型經檢驗是適宜的,也符合實踐意義,可用作短期預測. B-J方法采用L步預測,即根據知 個時辰的序列觀測值

15、 ,對未來的 個時辰的序列值做出估計, 線性最小方差預測是常用的一種方法. 誤差的方差到達最小. 其主要思想是使預測假設表示用模型做的L步平穩線性最小方差預測,那么,預測誤差并使 到達最小. 1 時間序列分析模型【ARMA模型 】簡介 1、AR序列預測模型1: 的L步預測值為其中 1 時間序列分析模型【ARMA模型 】簡介 2、MA的預測對模型3: 當時,由于可見一切白噪聲的時辰都大于,故與歷史取值無關,; 從而當時,各步預測值可寫成矩陣方式: 1 時間序列分析模型【ARMA模型 】簡介 遞推時,初值均取為0。 2 長江水質污染的開展趨勢預測 【CUMCM 2005A】題中給出了“199520

16、04年長江流域水質報告中的主要統計數據和關于的國標GB3838-2002中4個主要工程規范限值見附錄1,其中I、II、III類為可飲用水.假設不采取更為有效的治理措施,根據過去10年的主要統計數據見附錄2,對長江未來水質污染的開展趨勢做出預測分析,比如研討未來10年的情況. 2 長江水質污染的開展趨勢預測 【CUMCM 2005A】一、問題分析 為了分析長江水質的開展變化情況,對未來10年全流域、支流、干流中三類水所占的比例做出預測.思索到假設僅用10年水文年的觀測數據來預測后10年的數據,顯然可利用的數據量太少,所以我們將充分利用枯水期、豐水期和水文年的數據. 由于建立時間序列模型需求相等的

17、時間間隔,所以我們將一年分為三段,1-4月、5-8月、9-12月. 對于每一年,1-4月的平均數據可直接取為枯水期的數據,5-8月的平均數據可直接取為豐水期的數據,而9-12月的數據可用【水文年*12-枯水期*4-豐水期*4/4=水文年*3-枯水期-豐水期】來估計詳細數據見附錄3.我們分別對全流域、干流、支流來建立時間序列模型,并將水質分為飲用水I、II、III類、污水IV、V類和劣V類水三類,留意到飲用水的比例可由其它兩類水的比例推算出來. 2 長江水質污染的開展趨勢預測 【CUMCM 2005A】二、模型假設2假設枯水期、豐水期和水文年中,每個月各類水質的百分比不變. 1問題中所給出的數據

18、能客觀反映現實情況;2 長江水質污染的開展趨勢預測 【CUMCM 2005A】三、模型建立 對于各類水,根據它在各個時期所占的比例,經過作圖容易察看發現,時間序列是非平穩的,而經過適當差分那么會顯示出平穩序列的性質,所以我們將建立自回歸挪動平均模型ARIMA. 在實踐建模中,思索到一期的數據應該與前期的數據有關,所以對差分后的平穩序列我們建立ARMA模型. 在這里,我們不思索隨機干擾項,即,因此建立AR模型 僅以預測干流中劣類水所占比例的 ARIMA 模型為例,詳細表達一下 ARIMA 建模過程。2 長江水質污染的開展趨勢預測 【CUMCM 2005A】 1、數據挑選與處置 根據需求,我們將數

19、據挑選并處置得到干流中劣類水所占比例的時間序列:=0,4,-4,0,1.5,-1.5,0,0,0,0,0,0,0,0,0,0,0,0,6.9,5.1,5.4,7.9,4.8,13.4,0,0,0,14.2,9.3,3.5,2、對序列平穩化 察看序列時序圖,發現序列有遞增趨勢, 因此,我們對序,得到序列 列進展一階差分2 長江水質污染的開展趨勢預測 【CUMCM 2005A】0,4,-8,4,1.5,-3,1.5,0,0,0,0,0,0,0,0,0,0,0,6.9,-1.8,0.3,2.5,-3.1,8.6,-13.4,0,0,14.2,-4.9,-5.8 劣類水所占比例時序圖2 長江水質污染的

20、開展趨勢預測 【CUMCM 2005A】利用公式計算此序列的自相關系數可看出, 明顯異于0,闡明此序列短期內具有很強的相關性 因此可初步以為經1階差分后的序列平穩,即1階差分后的白噪聲檢驗結果如下: 延遲階數 統計量P值610.760.0960在檢驗的顯著性程度取為0.05的條件下,P值大于0.05,故該差分后序列可視為白噪聲序列 2 長江水質污染的開展趨勢預測 【CUMCM 2005A】3、對序列進展零均值化對序列進展零均值化,得到新序列 =-0.11667,3.88333,-8.11667,3.88333,1.38333,-3.11667,1.38333,-0.11667,-0.11667

21、,-0.11667,-0.11667,-0.11667,-0.11667,-0.11667,-0.11667,-0.11667,-0.11667,-0.11667,6.78333,-1.91667,0.18333,2.38333,-3.21667,8.48333,-13.51667,-0.11667,-0.11667,14.08333,-5.01667,-5.916672 長江水質污染的開展趨勢預測 【CUMCM 2005A】4、對序列求樣本自協方差函數與樣本偏自相關函數 利用得樣本自協方差函數估計 利用,計算樣本自相關函數 經過 估計樣本偏自相關函數,得到 2 長江水質污染的開展趨勢預測 【

22、CUMCM 2005A】當時,具有截尾性 用AR3模型擬合序列模型擬合原序列。對殘差序列進展檢驗,得到 ,即用ARIMA3,1,0殘差白噪聲檢驗參數顯著性檢驗延遲階數 統計量P值待估參數t統計量P值63.070.3803AR1.1-3.160.0039123.600.9360AR1.2-2.750.0160186.800.9629AR1.3-3.300.0028 擬合檢驗統計量的概率P值都顯著大于顯著性檢驗程度0.05,可以為該殘差序列為白噪聲序列, 系數顯著性檢驗顯示三個參數均顯著。從而ARIMA3,1,0模型對該序列建模勝利。2 長江水質污染的開展趨勢預測 【CUMCM 2005A】5、模

23、型參數估計經過公式得到與上述參數顯著性檢驗一樣的結果:= -3.16,= -2.75,= -3.30,因此ARIMA3,1,0模型即為:注:利用同樣的方法可以建立預測干流中其他兩類水、全流域和支流中的三類水所占比例的時間序列分析模型。 2 長江水質污染的開展趨勢預測 【CUMCM 2005A】四、模型預測利用上述模型,預測干流中劣類水未來10年所占比例,得到:年份月份劣V類水年份月份劣V類水20051-40.211120061-40.22925-80.27795-80.29309-120.27669-120.292320071-40.244520081-40.25995-80.30845-80

24、.32389-120.30789-120.323220091-40.275320101-40.29075-80.33925-80.35469-120.33599-120.354020111-40.306120121-40.32145-80.37005-80.38549-120.36919-120.384620131-40.336820141-40.35225-80.40075-80.41619-120.40019-120.41552 長江水質污染的開展趨勢預測 【CUMCM 2005A】五、結果分析 在上述模型預測結果中,我們得到的數據為枯水期、豐水期和8-12月的平均值,并不包含水文年的數據

25、,故還需求復原水文年的數據,可以經過公式: 水文年=枯水期+豐水期+8-12月平均值/3對于三類水所占的比例滿足:飲用水+污水+劣V類水=100%.詳細預測結果見附錄4。 從預測結果中可以看出,干流中污水和劣V類水所占的比例只需微小的增長,支流中劣V類水的比例增長速度較快。全流域中劣V類水所占比例增長速度也較快。雖然干流中和全流域中污水所占比例增長并不大,但長期開展下去,全流域和支流中可飲用水的比例將低于50%,而在干流中可飲用水比例也僅僅是略高于50%,假設不采取措施防污治污,后果不堪想象! 2 長江水質污染的開展趨勢預測 【CUMCM 2005A】六、模型評價與改良 在標題中僅僅給出了10

26、年水文年的觀測數據,要用來預測后10年的數據,顯然數據量太小。雖然我們經過了數據處置,將數據合理地添加到30個,但是對于利用時間序列分析模型進展短期的預測,數據量依然顯得太少,這樣難免導致數據的預測誤差較大。但就此標題而言,我們還是得到了較為稱心的結果。現實上,我們還可以對數據進一步進展處置,以添加數據量,提高預測的精度。對上述的原始序列 ,我們可以在保證序列的平穩性的條件下,進展平滑技術處置: 然后與原始序列交融得到一個新的時間序列,新序列的時期長度將接近于原始序列的兩倍,數據個數大大增多,關鍵是可以降低預測的誤差。 2 長江水質污染的開展趨勢預測 【CUMCM 2005A】2 長江水質污染

27、的開展趨勢預測 【CUMCM 2005A】2 長江水質污染的開展趨勢預測 【CUMCM 2005A】附錄1:附表: GB38382002中4個主要工程規范限值 單位:mg/L序號 分 類標準值 項 目類類類類類劣類1溶解氧(DO)7.5(或飽和率90%)6532 02高錳酸鹽指數(CODMn) 24610153氨氮(NH3-N) 0.150.51.01.52.04PH值(無量綱)6-92 長江水質污染的開展趨勢預測 【CUMCM 2005A】附錄2:1995年-2004年長江流域水質報告【干流劣V類】 年份時段評價范圍評價河長劣類【河 長】劣類【%】年份時段評價范圍評價河長劣類【河 長】劣類【%】1995枯水期干流4456002000枯水期干流5285001995豐水期干流44561794.02000豐水期干流5285001995水文年干流4456002000水文年干流5285001996枯水期干流4479002001枯水期干流60124156.91996豐水期干流4479681.52001豐水期干流60123075.11996水文年干流4479002001水文年

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論