計量經濟學課件:第七章 多重共線性_第1頁
計量經濟學課件:第七章 多重共線性_第2頁
計量經濟學課件:第七章 多重共線性_第3頁
計量經濟學課件:第七章 多重共線性_第4頁
計量經濟學課件:第七章 多重共線性_第5頁
已閱讀5頁,還剩37頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第七章 多重共線性計量經濟學引子:發展農業會減少財政收入嗎? 為了分析各主要因素對財政收入的影響,建立財政收入模型:其中: CS財政收入(億元) ; NZ農業增加值(億元); GZ工業增加值(億元); JZZ建筑業增加值(億元); TPOP總人口(萬人); CUM最終消費(億元); SZM受災面積(萬公頃) 數據樣本時期1978年-2007年(資料來源:中國統計年鑒2008,中國統計出版社2008年版) 采用普通最小二乘法得到以下估計結果財政收入模型的EViews估計結果VariableCoefficient Std. Error t-Statistic Prob. 農業增加值工業增加值建筑業

2、增加值總人口最終消費受災面積截距-1.9075480.0459476.4583740.0960220.003108-0.027627-5432.5070.3420450.0427460.7657670.0916600.0428070.0489048607.753-5.5768881.0748928.4338671.0475910.072609-0.564916-0.6311180.00000.29360.00000.30570.94270.57760.5342R-squared 0.989654Adjusted R-squared 0.986955S.E. of regression 1437

3、.448Sum squared resid 47523916Log likelihood -256.7013Durbin-Watson stat 1.654140Mean dependent var 10049.04S.D. dependent var 12585.51Akaike info criterion 17.58009Schwarz criterion 17.90704F-statistic 366.6801Prob(F-statistic) 0.000000 可決系數為0.9897 ,校正的可決系數為0.9870,模型擬合很好。模型對財政收入的解釋程度高達98.9%。 F統計量為3

4、66.68,說明0.05水平下回歸方程整體上顯著。 t 檢驗結果表明,除了農業增加值、建筑業增加值以外,其他因素對財政收入的影響均不顯著。 農業增加值的回歸系數是負數。 農業的發展反而會使財政收入減少嗎?! 這樣的異常結果顯然與理論分析和實踐經驗不相符。 若模型設定和數據真實性沒問題,問題出在哪里呢?模型估計與檢驗結果分析第七章 多重共線性 本章討論四個問題: 什么是多重共線性 多重共線性產生的后果 多重共線性的檢驗 多重共線性的補救措施第一節 什么是多重共線性 本節基本內容: 多重共線性的含義 產生多重共線性的背景 在計量經濟學中所謂的多重共線性(Multi-Collinearity), 不

5、僅包括完全的多重共線性,還包括不完全的多重共線性。 在有截距項的模型中,截距項可以視為其對應的解釋變量總 是為1。對于解釋變量 ,如果存在不全為0的 數 ,使得 則稱解釋變量 之間存在著完全的多重共 線性。一、多重共線性的含義或者說,當 時,表明在數據矩陣 中,至少有一個列向量可以用其余的列向量線性表示,則說明存在完全的多重共線性。不完全的多重共線性 實際中,常見的情形是解釋變量之間存在不完全的多重共線性。 對于解釋變量 ,存在不全為0的數,使得 為隨機變量。這表明解釋變量只是一種近似的線性關系。其中, ,解釋變量間毫無線性關系,變量間相互正交。這時已不需要作多元回歸,每個參數j都可以通過Y

6、對 Xj 的一元回歸來估計。回歸模型中解釋變量的關系 可能表現為三種情形:(1) ,解釋變量間完全共線性。此時模型參數將無法確定。 ,解釋變量間存在一定程度的線性關系。實際中常遇到的情形。(2)(3) 二、產生多重共線性的背景 多重共線性產生的經濟背景主要有幾種情形: 1.經濟變量之間具有共同變化趨勢。 2.模型中包含滯后變量。 3.利用截面數據建立模型也可能出現多重共線性。 4.樣本數據自身的原因。 第二節 多重共線性產生的后果 本節基本內容: 完全多重共線性產生的后果 不完全多重共線性產生的后果一、完全多重共線性產生的后果1.參數的估計值不確定當解釋變量完全線性相關時 OLS 估計式不確定

7、 從偏回歸系數意義看:在 和 完全共線性時,無法保持 不變,去單獨考慮 對 的影響( 和 的影響不可區分) 從OLS估計式看:可以證明此時2.參數估計值的方差無限大OLS估計式的方差成為無窮大: 二、不完全多重共線性產生的后果 如果模型中存在不完全的多重共線性,可以得到參數的估計值,但是對計量經濟分析可能會產生一系列的影響。 1.參數估計值的方差增大 當 增大時 也增大 2.對參數區間估計時,置信區間趨于變大3.假設檢驗容易作出錯誤的判斷4.可能造成可決系數較高,但對各個參數單獨的 t 檢驗卻可能不顯著,甚至可能使估計的回歸系數符號相反,得出完全錯誤的結論。 第三節 多重共線性的檢驗 本節基本

8、內容: 簡單相關系數檢驗法 方差擴大(膨脹)因子法 直觀判斷法 逐步回歸法一、簡單相關系數檢驗法 含義:簡單相關系數檢驗法是利用解釋變量之間的線性相關程度去判斷是否存在嚴重多重共線性的一種簡便方法。 判斷規則:一般而言,如果每兩個解釋變量的簡單相關系數(零階相關系數)比較高,例如大于0.8,則可認為存在著較嚴重的多重共線性。 注意: 較高的簡單相關系數只是多重共線性存在的充分條件,而不是必要條件。特別是在多于兩個解釋變量的回歸模型中,有時較低的簡單相關系數也可能存在多重共線性。因此并不能簡單地依據相關系數進行多重共線性的準確判斷。 二、方差擴大(膨脹)因子法 統計上可以證明,解釋變量的參數估計

9、式的方差可表示為 其中的是變量(Variance Inflation Factor),即的方差擴大因子其中 是多個解釋變量輔助回歸的可決系數 經驗規則方差膨脹因子越大,表明解釋變量之間的多重共性越嚴重。反過來,方差膨脹因子越接近于1,多重共線性越弱。經驗表明,方差膨脹因子10時,說明解釋變量與其余解釋變量之間有嚴重的多重共線性,且這種多重共線性可能會過度地影響最小二乘估計。三、直觀判斷法 1. 當增加或剔除一個解釋變量,或者改變一個觀測值時,回歸參數的估計值發生較大變化,回歸方程可能存在嚴重的多重共線性。 2. 從定性分析認為,一些重要的解釋變量的回歸系數的標準誤差較大,在回歸方程中沒有通過顯

10、著性檢驗時,可初步判斷可能存在嚴重的多重共線性。3. 有些解釋變量的回歸系數所帶正負號與定性分析結果違背時,很可能存在多重共線性。4. 解釋變量的相關矩陣中,自變量之間的相關系數較大時,可能會存在多重共線性問題。四、逐步回歸檢測法 逐步回歸的基本思想 將變量逐個的引入模型,每引入一個解釋變量后,都要進行檢驗,并對已經選入的解釋變量逐個進行t 檢驗,當原來引入的解釋變量由于后面解釋變量的引入而變得不再顯著時,則將其剔除。以確保每次引入新的變量之前回歸方程中只包含顯著的變量。 在逐步回歸中,高度相關的解釋變量,在引入時會被剔除。因而也是一種檢測多重共線性的有效方法。第四節 多重共線性的補救措施 本

11、節基本內容: 修正多重共線性的經驗方法 逐步回歸法一、修正多重共線性的經驗方法 1. 剔除變量法把方差擴大因子最大者所對應的自變量首先剔除再重新建立回歸方程,直至回歸方程中不再存在嚴重的多重共線性。注意: 若剔除了重要變量,可能引起模型的設定誤差。 2. 增大樣本容量如果樣本容量增加,會減小回歸參數的方差,標準誤差也同樣會減小。因此盡可能地收集足夠多的樣本數據可以改進模型參數的估計。問題:增加樣本數據在實際計量分析中常面臨許多困難。 3. 變換模型形式一般而言,差分后變量之間的相關性要比差分前弱得多,所以差分后的模型可能降低出現共線性的可能性,此時可直接估計差分方程。問題:差分會丟失一些信息,

12、差分模型的誤差項可能存在序列相關,可能會違背經典線性回歸模型的相關假設,在具體運用時要慎重。對數化也可以降低多重共線性。 4. 利用非樣本先驗信息通過經濟理論分析能夠得到某些參數之間的關系,可以將這種關系作為約束條件,將此約束條件和樣本信息結合起來進行約束最小二乘估計。如利用參數、解釋變量之間的關系。 5. 橫截面數據與時序數據并用首先利用橫截面數據估計出部分參數,再利用時序數據估計出另外的部分參數,最后得到整個方程參數的估計。 注意:這里包含著假設,即參數的橫截面估計和從純粹時間序列分析中得到的估計是一樣的。 6. 變量變換變量變換的主要方法:(1)計算相對指標 (2)將名義數據轉換為實際數

13、據 (3)將小類指標合并成大類指標 變量數據的變換有時可得到較好的結果,但無法保證一定可以得到很好的結果。7. 用被解釋變量的滯后值代替解釋變量的滯后值;8.對數據進行中心化處理。 二、逐步回歸法(1)用被解釋變量對每一個所考慮的解釋變量做簡單回歸。(2)以對被解釋變量貢獻最大的解釋變量所對應的回歸方程為基礎,按對被解釋變量貢獻大小的順序逐個引入其余的解釋變量。若新變量的引入改進了 和 檢驗,且回歸參數的t 檢驗在統計上也是顯著的,則在模型中保留該變量。若新變量的引入未能改進 和 檢驗,且對其他回歸參數估計值的t 檢驗也未帶來什么影響,則認為該變量是多余變量。若新變量的引入未能改進 和 檢驗,

14、且顯著地影響了其他回歸參數估計值的數值或符號,同時本身的回歸參數也通不過t 檢驗,說明出現了嚴重的多重共線性。 第五節 案例分析一、研究的目的要求提出研究的問題為了規劃中國未來國內旅游產業的發展,需要定量地分析影響中國國內旅游市場發展的主要因素。二、模型設定及其估計影響因素分析與確定影響因素主要有國內旅游人數 ,城鎮居民人均旅游支出 ,農村居民人均旅游支出 ,并以公路里程次 和鐵路里程 作為相關基礎設施的代表 理論模型的設定其中 : 第 t 年全國國內旅游收入年份國內旅游收入Y(億元)國內旅游人數X2(萬人次)城鎮居民人均旅游花費X3(元)農村居民人均旅游花費X4 (元)公路里程 X5(萬km

15、)鐵路里程X6(萬km)19941023.552400414.754.9111.785.9019951375.762900464.061.5115.705.9719961638.463900534.170.5118.586.4919972112.764400599.8145.7122.646.6019982391.269450607.0197.0127.856.6419992831.971900614.8249.5135.176.7420003175.574400678.6226.6140.276.8720013522.478400708.3212.7169.807.0120023878.48

16、7800739.7209.1176.527.1920033442.387000684.9200.0180.987.3020044710.7110200731.8210.2187.077.4420055285.9121200737.1227.6193.057.5420066229.74139400766.4221.9345.707.7120077770.62161000906.9222.5358.377.80數據的收集與處理1994年2007年中國旅游收入及相關數據 該模型,可決系數很高,F檢驗值593.4168,明顯顯著。但是當時、不僅 、 系數的t檢驗不顯著,而且 系數的符號與預期的相反,這

17、表明很可能存在嚴重的多重共線性。 OLS 估計的結果計算各解釋變量的相關系數 表明各解釋變量間確實存在嚴重的多重共線性X2X3X4X5X6X21.0000000.8671920.5660240.9455390.891303X30.8671921.0000000.8117260.8051290.956903X40.5660240.8117261.0000000.4876690.790144X50.9455390.8051290.4876691.0000000.812921X60.8913030.9569030.7901440.8129211.000000三、消除多重共線性采用逐步回歸法檢驗和解決

18、多重供線性問題。分別作Y 對X2、X3、X4、X5、X6的一元回歸 的大小排序為: X2、 X3、X6、X5、X4。以X2為基礎,順次加入其他變量逐步回歸,過程從略(見教材) 變量參數估計值0.058814.022519.610322.59573025.062t 統計量18.24889.30903.27108.70849.13920.96520.87840.47140.86340.87440.96230.86820.42730.85200.8639 最后消除多重共線性的結果 = -3136.713 +0.0435 + 3.6660 + 2.1786 t=(-10.5998)(16.0418) (3

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論