




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第4章 違背基本假設的情況信14.2 序列相關性(Serial Correlation)序列相關性實際經濟問題中的序列相關性序列相關性的后果序列相關性的檢驗解決自相關的方法2 如果模型的隨機誤差項違背了不相關的基本假設的情況,稱為序列相關性。 普通最小二乘法(OLS)要求模型的隨機誤差項序列不相關或相互獨立(正態假設下)。注意:自相關現象不是指兩個或兩個以上的變量之間的相關關系,而指的是一個變量前后期數值之間存在的相關關系。3一 序列相關性41 序列相關的概念對于模型 隨機誤差項不相關的基本假設表現為: 如果出現 即對于不同的樣本點,隨機誤差項之間不再是完全互相獨立,而是存在某種相關性,則認為
2、出現了序列相關性。5如果僅存在 稱為一階序列相關,或自相關。這是最常見的一種序列相關問題。 自相關往往可寫成如下形式: 其中, 被稱為一階自相關系數。在其他假設仍成立的條件下,序列相關即意味著6 二 實際經濟問題中的序列相關性7為什么會出現序列相關性?下面通過兩個例子加以說明。例如,建立行業生產函數模型,以產出量為被解釋變量,資本、勞動、技術為解釋變量,選擇時間序列數據作為樣本觀測值。于是有: 在該模型中,政策因素等,沒有包括在解釋變量中,但它們對產出量是有影響的,該影響被包含在隨機誤差項中。如果該影響構成隨機誤差項的主要部分,則可能出現序列相關性。如果政策因素對前一年產出量的影響是正的,后一
3、年的該影響往往也是正的。于是在不同的樣本點之間,隨機誤差項出現了相關性,這就產生了序列相關性。8 再如,以絕對收入假設為理論假設、以時間序列數據作樣本建立居民總消費函數模型: 消費習慣沒有包括在解釋變量中,其對消費量的影響被包含在隨機誤差項中。如果該項影響構成隨機誤差項的主要部分,可能出現序列相關性。因為消費習慣對消費量的影響是具有內在聯系的。前一年是正的影響,后一年往往也是正的影響。于是在不同的樣本點之間,隨機誤差項出現了相關性,這就產生了序列相關性。 91 遺漏關鍵變量時會產生序列的自相關性2 經濟變量的滯后性會給序列帶來自相關性3 采用錯誤的回歸函數形式也可能引起自相關性4 蛛網現象可能
4、帶來序列的自相關性5 因對數據加工整理而導致誤差項之間產生自相 關性產生序列自相關的原因主要有以下幾個方面:10 11三 序列相關性的后果121 參數估計量非有效 OLS參數估計量仍具無偏性 OLS估計量不具有有效性 在大樣本情況下,參數估計量仍然不具有漸近有效性,這就是說參數估計量不具有一致性 13 2 變量的顯著性檢驗失去意義 在關于變量的顯著性檢驗中,當存在序列相關時,參數的OLS估計量的方差增大,標準差也增大,因此實際的 t 統計量變小,從而接受原假設 的可能性增大, 檢驗就失去意義。 采用其它檢驗也是如此。143 模型的預測失效 區間預測與參數估計量的方差有關,在方差有偏誤的情況下,
5、使得預測估計不準確,預測精度降低。所以,當模型出現序列相關性時,它的預測功能失效。15四 序列相關性的檢驗161 基本思路序列相關性檢驗方法有多種,但基本思路是相同的。首先采用普通最小二乘法估計模型,以求得隨機誤差項的“近似估計量”: 然后,通過分析這些“近似估計量”之間的相關 性,以達到判斷隨機誤差項是否具有序列相關 性的目的。172 圖示法由于殘差 可以作為 的估計,因此如果 存在序列相關,必然會由殘差項 反映出來,因此可利用 的變化圖形來判斷隨機誤差項的序列相關性。 (1)繪制 的散點圖 (2)按照時間順序繪制回歸殘差項 的圖形18192 解析法(1) 回歸檢驗法以 為被解釋變量,以各種
6、可能的相關量,諸如以 等為解釋變量,建立各種方程: 20 具體應用時需要反復試算。 回歸檢驗法的優點是: 一旦確定了模型存在序列相關性,也就同時知道了相關的形式; 它適用于任何類型的序列相關性問題的檢驗。 對各方程估計并進行顯著性檢驗,如果存在某一種函數形式,使得方程顯著成立,則說明原模型存在序列相關性。21(2) 馮諾曼比檢驗法馮諾曼比檢驗法在于構造統計量 該統計量被稱為馮諾曼比。當樣本容量足夠大時(大于30),該統計量近似服從正態分布。計算該 統計量的值,將它與具有正態分布的理論分布值進行比較,如果大于臨界值,表示不存在序列相關,如果小于臨界值,表示存在序列相關。 22(3)自相關系數法誤
7、差序列 的自相關系數定義為自相關系數的取值范圍是-1,1,當 時,表明誤差序列存在正相關,當 時,表明誤差序列存在負相關。在實際應用中,誤差序列的真實值未知,用其估計值 代替,得自相關系數的估計值為(4.10)23(4.11) 作為自相關系數 的估計值與樣本量有關,需要做統計顯著性檢驗才能確定自相關性的存在。通常采用下面的DW檢驗代替對 的檢驗。24(3)D.W.檢驗 D.W.檢驗是杜賓(J.Durbin)和沃特森(G.S. Watson)于1951年提出的一種檢驗序列自相關的方法(小樣本情形)。25D.W.檢驗只能用于檢驗隨機誤差項具有一階自回歸形式的序列相關問題。隨機誤差項的一階自回歸形式
8、為檢驗步驟(僅適用于一階自相關的檢驗)(1) 為了檢驗序列的相關性,構造假設26 (2) 計算D.W.統計量的值 (4.13)27說明:DW的表達式可以近似為結合(4.11)式又可以寫成(4.17 )28于是得到D.W.的取值范圍D.W.值與 的對應關系如下表1(1,0)0(0,1)1D.W.誤差項的自相關性4(2,4)2(0,2)0完全負自相關負自相關無自相關正自相關完全正自相關29 根據樣本容量n和解釋變量數目p查D.W.分布表 得到臨界值 和 ;(4) 按照下列準則考察計算得到的D.W.值,以判斷模型的自相關狀態。3031 D.W.的取值范圍為 D.W. 0時,模型存在完全一階正相關 D
9、.W. 4時,模型存在完全一階負相關 當D.W.值在2左右時,模型不存在一階自相關32 (1)從判斷準則看到,存在一個不能確定的D.W.值區域,這是這種檢驗方法的一大缺陷。 (2)D.W.檢驗雖然只能檢驗一階自相關,但在實際計量經濟學問題中,一階自相關是出現最多的一類序列相關; (3)經驗表明,如果不存在一階自相關,一般也不存在高階序列相關。 所以在實際應用中,對于序列相關問題一般只進行D.W.檢驗。注意:33五 解決自相關的方法34如果模型被檢驗證明存在序列相關性,則需要發展新的方法估計模型。最常用的方法是廣義最小二乘法、迭代法、一階差分法和廣義差分法35 1、廣義最小二乘法(GLS) 對于
10、模型如果存在序列相關,同時存在異方差,即有(5.1)對稱正定陣36 設 用 左乘(5.1)兩邊,得到一個新的模型:該模型具有同方差性和隨機誤差項互相獨立性。即(5.2)37 于是,可以用OLS法估計模型(5.2),得(5.3) 這就是原模型(5.1)的廣義最小二乘估計量,是無偏的、有效的估計量。38 如何得到矩陣 ? 仍然是對原模型(5.1)首先采用普通最小二乘法,得到隨機誤差項的近似估計量,以此構成矩陣的估計量 ,即392 迭代法設一元線性回歸模型的誤差項存在一階自相關(4.18)(4.19)(4.20)(4.19)式表明誤差項 存在一階自相關,(4.20)式表明 滿足隨機擾動項的基本假設。
11、40根據回歸模型(4.18)式,有(4.21)用(4.18)式減去乘以 的(4.21)式,則有令則(4.22)式變成(4.22)(4.24)(4.23)41模型(4.24)式有獨立隨機誤差項,它已滿足線性回歸模型的基本假設,用普通最小二乘法估計的參數估計量具有通常的優良性。(4.23)式中要用到 ,并計算 ,然后用(4.24)式作普通最小二乘回歸。如果誤差項確實是(4.19)式的一階自相關模型,通過以上變換,模型(4.24)式已經消除自相關,迭代結束。423 一階差分法(原模型存在完全一階正自相關 ) 一階差分法是將原模型 變換為 其中 (4.26)43 由于 不存在序列相關,該差分模型滿足應
12、用OLS法的基本假設,用OLS法估計可得到原模型參數的無偏的、有效的估計量。即使對于非完全一階正相關的情況,只要存在一定程度的一階正相關,差分模型就可以有效地加以克服。44 模型(4.27)為廣義差分模型,該模型不存在序列相關問題。采用OLS法估計可以得到原模型參數的無偏、有效的估計量。 廣義差分法可以克服所有類型的序列相關帶來的問題,一階差分法是它的一個特例。如果原模型存在: 可以將原模型變換為: (4.27)4 廣義差分法455 隨機誤差項相關系數 的估計 應用廣義差分法,必須已知不同樣本點之間隨機誤差項的相關系數 。實際上,人們并不知道它們的具體數值,所以必須首先對它們進行估計。 常用的
13、方法有:迭代法、杜賓兩步法。 (1) 迭代法其基本思路是采用普通最小二乘法估計原模型,得到隨機誤差項的“近似估計值”,然后利用該“近似估計值”求得隨機誤差項相關系數的估計量。 46(2)杜賓(durbin)兩步法 該方法仍是先估計 ,再對差分模型進行估計。第一步,變換差分模型為下列形式: 采用OLS法估計該方程,得各前的系數 的估計值 。 47第二步,將估計的 代入差分模型 采用OLS法估計,得到參數 的估計量48例題分析在研究我國人均消費水平的問題中,把全國人均消費金額記作 ,人均國民收入為 ,收集到1980-1998年數據。計算出DW0.873,查DW表,n=19,k=2, ,得 ,由DW
14、1.39,可知殘差序列 不存在自相關,一階差分法成功地消除了序列自相關性。差分法的回歸標準差為29.34,大于一步迭代的標準差 小于 的標準差 ,因而差分法的效果低于迭代法的效果。55對 的回歸方程為將 代入,還原為原始變量的方程56年份序號x_ty_te_tx_ty_te_t19801460234.75-12.1119812489259.26-0.82924.5115.0719823525280.584.133621.328.5819834580305.974.485525.393.6819845692347.15-5.3311241.18-7.4319856853433.537.75161
15、86.3814.6419867956481.368.6910347.833.46198781104545.45.3514864.03-1.57198891355687.5133.19251142.1127.881989101512756.2730.4715768.77-1.091990111634797.0815.7412240.8-12.531991121879890.66-2.2224593.59-17.8119921322871063.39-15.24408172.73-15.619931429391323.22-52.24652259.83-43.6619941539231736.32
16、-87.12984413.1-47.119951648542224.59-22.7931488.2753.0919961755762627.0651.07722402.4665.9319971860532819.3626.21477192.3-28.619981963922958.1810.7339138.83-16.9357Model Summary (d)ModelRR SquareAdjusted R SquareStd. Error of the EstimateDurbin-Watson10.9910.9810.98029.338571.569d. Linear Regression
17、 through the OriginANOVAModel Sum of SquaresdfMean SquareFSig.1Regression762,593.891762,593.89885.960.000Residual14,632.77817860.752Total777,226.671858CoefficientsModel Unstandardized CoefficientsStandardized CoefficientstSig.BStd. ErrorBeta1X20.4650.0160.99129.7650.000以上對例2.2數據的分析中,使用了一步迭代法、二步迭代法和差
18、分法,這三種方法各有利弊。一步迭代法的DW1.372,略小于臨界值 ,沒有徹底消除誤差項的自相關性,但是回歸標準差從31.75減小到26.96,說明一步迭代的效果是顯著的。再進行二步迭代后,DW1.701,完全消除了自相關性,但是回歸標準差僅從一步迭代的26.96減小為二步迭代的26.4,改進不大。差分法的DW1.569,徹底消除了自相關性,但回歸標準差29.34,高于一步迭代的標準差26.96。由此可以認為選用一步迭代回歸模型是可行的。59 異常值:這些觀測值與其他數據遠遠分開,可能引起較大的殘差,極大地影響回歸擬合的效果 一 關于因變量y的異常值 二 關于自變量x的異常值4.3 異常值與強
19、影響點60有影響的觀測值1. 如果某一個或某一些觀測值對回歸的結果有強烈的影響,那么該觀測值或這些觀測值就是有影響的觀測值 2. 一個有影響的觀測值可能是 一個異常值,即有一個值遠遠偏離了散點圖中的趨勢線 對應一個遠離自變量平均值的觀測值 或者是這二者組合而形成的觀測值, 61有影響的觀測值(圖示)不存在影響值的趨勢有影響的觀測值存在影響值的趨勢62一 關于因變量y的異常值在殘差分析中,認為超過 的殘差為異常值。由于普通殘差 的方差 不等,用 作判斷會帶來一定的麻煩,可以引入標準化殘差和學生化殘差,以改進普通殘差的性質。標準化殘差學生化殘差63標準化殘差使殘差具有可比性, 的相應 觀測值即判定
20、為異常值。學生化殘差可以進一步 解決方差不等的問題,比標準化殘差又有所改進 當觀測數據中存在關于y的異常觀測值時,普通殘差 、標準化殘差、學生化殘差都不再適用,這是由于異常值把回歸線拉向自身,使異常值本身的殘差減少,而其余觀測值的殘差增大,這時回歸標準差 也會增大,因而“ ”準則不能正確分辨出異常值,改用刪除殘差。64刪除殘差的構造思想:在計算第i個觀測值的殘差時,用刪除掉這第i個觀測值的其余n-1個觀測值擬合回歸方程,計算出第i個觀測值的刪除擬合值 ,這個刪除擬合值與第i個值無關,不受第i個值是否為異常值的影響,由此定義第i個觀測值的刪除殘差為刪除學生化殘差的觀測值即判定為異常值。65二 關
21、于自變量x的異常值在式 中,杠桿值 表示自變量的第i次觀測值與自變量平均值之間距離的遠近,是調節 方差大小的杠桿,較大的杠桿值的殘差偏小,這是因為大杠桿值的觀測點遠離樣本中心,能夠把回歸方程拉向自身,因而把杠桿值大的樣本點稱為強影響點。 強影響點并一定是y值的異常值點,因而并不總會對回歸方程造成不良影響。但對回歸效果通常有較強的影響。66由于強影響點并不總是y的異常值點,因而不能單純根據 的大小判斷強影響點是否異常。為此,引入庫克距離來判斷強影響點是否為y的異常值點。庫克距離反映了杠桿值 與殘差 大小的一個綜合效應。根據(3.22)式, ,則 的平均值為67這樣,如果杠桿值 就認為是大的。用庫
22、克距離來判定的一個粗略標準是:當 時,認為不是異常值;當 時,認為是異常值。用SPSS計算出的是中心化的杠桿值,即自變量中心化后生成的帽子矩陣的主對角線元素:可以證明 ,中心化杠桿值 的平均值是68例題分析以例3.2的北京開發區的數據為例,作異常值的診斷分析。分別計算普通殘差 ,學生化殘差 ,刪除殘差 ,刪除學生化殘差 ,杠桿值 ,庫克距離 ,見下表。69序號x1x2yeiSREie(i)SRE(i)chiiDi1253548554-832-2.34-1491-3.040.3751.447220896.3208.675.050.16784.250.160.0430.00136750.33.1-
23、33.5-0.08-38.1-0.070.0543E-044100120872815126.80.376252.80.3620.4320.047552516391052-458-1.03-529-1.040.0680.056682533583427501.51.305767.91.3480.280.3017120808.5442.8146.90.326163.70.3130.0360.004828520.370.1296.50.218111.80.2090.070.00397671.1122.2120.70.272138.20.2610.060.0041053228621400-697-1.6
24、1-836-1.730.10.17211751160464950.209104.10.2010.0210.0011240862.87.5-151-0.34-169-0.320.040.00513187673224.2-145-0.32-164-0.310.0520.00514122901.8538.9195.20.431215.80.4160.0290.0071574354624439582.61316133.810.3391.55570從表中看到,絕對值最大的學生化殘差為 2.631,小于3,因而根據學生化殘差診斷認為數據不存在異常值。絕對值最大的刪除學生化殘差為 ,因而根據學生化殘差診斷認
25、為第15個數據為異常值。其 位于第三大,庫克距離 位于第一大。由于第15個數據 ,因而從杠桿值看第15個數據是自變量的異常值,同時 ,這樣第15個數據為異常值的原因是由自變量與因變71量異常兩個原因共同引起的。 診斷出異常值后,要判斷引起異常值的原因。異常值原因異常值消除方法1.數據登記誤差,存在抄寫錯誤重新核實數據2.數據測量誤差重新測量數據3.數據隨機誤差刪除或重新觀測異常值數據4.缺少重要自變量增加必要的自變量5.缺少觀測數據增加觀測數據,適當擴大自變量取值范圍6.存在異方差采用加權線性回歸7.模型選用錯誤,線性模型不適用改用非線性回歸模型72對引起異常值的不同原因,需要采取不同的處理方法。對本例數據,刪除第15組數據,用其余14組數據擬合回歸方程,發現第6組數據的刪除學生化殘差增加為 ,仍然存在異常值現象,因而認為異常值的原因不是由于數據的隨機誤差。此數據存在異方差,用加權最小二乘回歸。權數為 ,用SPSS計算出加權最小二乘回歸的有關變量值如下表。73序號x1x2yeiSREie(i)SRE(i)chiiDi1253547.79553.96-890-1.14883-1165.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030塑料類防水卷材行業發展分析及投資價值研究咨詢報告
- 2025-2030基于散射的光學傳感器行業市場現狀供需分析及投資評估規劃分析研究報告
- 2025-2030國內男士內褲行業市場發展分析及競爭格局與投資前景研究報告
- tiepai酒合同標準文本
- 2025-2030咖啡機行業市場現狀供需分析及投資評估規劃分析研究報告
- 2025-2030臺式杯形封口機行業市場現狀供需分析及投資評估規劃分析研究報告
- 2025-2030衛生組織行業市場現狀供需分析及投資評估規劃分析研究報告
- 2025-2030出血性疾病治療行業市場現狀供需分析及重點企業投資評估規劃分析研究報告
- 加工鋼板合同標準文本
- 2025-2030農業養殖行業市場深度分析及前景趨勢與投資研究報告
- 《壽險的功能與意義》課件
- DB15-T 3738-2024 家政服務機構星級劃分及評定規范
- 實驗室危險化學品安全管理
- 新疆烏魯木齊市(2024年-2025年小學六年級語文)部編版期末考試(上學期)試卷及答案
- 初中數學新課程標準(2024年版)
- 計算機網絡技術基礎(微課版)(周舸第6版) 各章課后習題
- 中華傳統文化進中小學課程教材指南
- 醫療搶救設備儀器培訓
- 多模態數據應用案例分析
- 2025年中國電信云網資源管理技能認證考試題庫(含各題型)
- 青春自護-遠離不良誘惑主題班會
評論
0/150
提交評論