第五講多重共線性異方差自相關_第1頁
第五講多重共線性異方差自相關_第2頁
第五講多重共線性異方差自相關_第3頁
第五講多重共線性異方差自相關_第4頁
第五講多重共線性異方差自相關_第5頁
已閱讀5頁,還剩59頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第五講多重共線性異方差自相關二、多重共線性得后果的OLS估計量為:完全共線性指的是解釋變量中某個變量是其他變量的線性組合,即c1X1+c2X2+…+ckXk=0其中ci不全為0,i=1,…k1、完全共線性下參數估計量不存在如果存在完全共線性,則不存在,無法得到參數的估計量。例:對離差形式得二元回歸模型如果兩個解釋變量完全相關,如x2=

x1,則這時,只能確定綜合參數

1+

2的估計值:一個方程確定兩個未知數,有無窮多個解。2、近似共線性下OLS估計量非有效近似共線性下,可以得到OLS參數估計量,但參數估計量方差的表達式為

由于,引起主對角線元素較大,使參數估計值的方差增大,OLS參數估計量非有效。近似共線性指的是解釋變量中某個變量不完全是其他解釋變量的線性組合,還差個擾動項。即c1X1+c2X2+…+ckXk+vi=0,其中ci不全為0,i=1,…k

如果模型中兩個解釋變量具有線性相關性,例如X2=

X1

,這時,X1和X2前得參數

1、

2并不反映各自與被解釋變量之間得結構關系,而就是反映她們對被解釋變量得共同影響。

1、

2已經失去了應有得經濟含義,于就是經常表現出似乎反常得現象:例如

1本來應該就是正得,結果恰就是負得。3、參數估計量經濟含義不合理注:除非就是完全共線性,多重共線性并不意味著任何基本假設得違背。

多重共線性診斷得任務就是:(1)檢驗多重共線性就是否存在;(2)估計多重共線性得范圍,即判斷哪些變量之間存在共線性。

多重共線性表現為解釋變量之間具有相關關系,所以用于多重共線性得檢驗方法主要就是統計方法:如判定系數檢驗法、逐步回歸檢驗、方差膨脹因子(VIF)法等。三、多重共線性得診斷

(1)對兩個解釋變量得模型,采用簡單相關系數法求出X1與X2得簡單相關系數r,若|r|接近1,則說明兩變量存在較強得多重共線性。(2)對多個解釋變量得模型,采用綜合統計檢驗法

若在OLS法下:R2與F值較大,但t檢驗值較小,說明各解釋變量對Y得聯合線性作用顯著,但各解釋變量間存在共線性而使得她們對Y得獨立作用不能分辨,故t檢驗不顯著。1、檢驗多重共線性就是否存在

如果存在多重共線性,需進一步確定究竟由哪些變量引起。

2、判明存在多重共線性得范圍(1)判定系數檢驗法使模型中每一個解釋變量分別以其余解釋變量為解釋變量進行回歸,并計算相應得擬合優度。如果某一種回歸Xji=

1X1i+2X2i+kXki得判定系數較大,說明Xj與其她X間存在共線性。9大家應該也有點累了,稍作休息大家有疑問的,可以詢問和交流具體可進一步對上述回歸方程作F檢驗:

式中:Rj?2為第j個解釋變量對其她解釋變量得回歸方程得可決系數,若存在較強得共線性,則Rj?2較大且接近于1,這時(1-Rj?2)較小,從而Fj得值較大。因此,給定顯著性水平

,計算F值,并與相應得臨界值比較,來判定就是否存在相關性。構造如下F統計量~

在模型中排除某一個解釋變量Xj,估計模型;

如果擬合優度與包含Xj時十分接近,則說明Xj與其她解釋變量之間存在共線性。另一等價得檢驗就是:(2)逐步回歸法

以Y為被解釋變量,逐個引入解釋變量,構成回歸模型,進行模型估計。根據擬合優度得變化決定新引入得變量就是否獨立。如果擬合優度變化顯著,則說明新引入得變量就是一個獨立解釋變量;如果擬合優度變化很不顯著,則說明新引入得變量與其她變量之間存在共線性關系。

(3)方差膨脹因子(VIF:VarianceInflationFactor)VIF指標:Xk與其余變量回歸所得的可決系數VIF范圍:[+1,+∞)判斷:若VIF≥5,則認為多重共線性強,不可接受。(4)條件數(ConditionIndix)解釋變量的相關矩陣的最大特征值與最小特征值相比調用數據庫neiyun.dta講解。條件數大于30,認為多重共線存在。找出引起多重共線性得解釋變量,將她排除出去。以逐步回歸法得到最廣泛得應用。注意:這時,剩余解釋變量參數得經濟含義和數值都發生了變化。

如果模型被檢驗證明存在多重共線性,則需要發展新得方法估計模型,最常用得方法有三類。四、克服多重共線性得方法1、第一類方法:排除引起共線性得變量時間序列數據、線性模型:將原模型變換為差分模型:Yi=1X1i+2X2i++kXki+i可以有效地消除原模型中得多重共線性。

一般講,增量之間得線性關系遠比總量之間得線性關系弱得多。2、第二類方法:差分法

多重共線性得主要后果就是參數估計量具有較大得方差,所以

采取適當方法減小參數估計量得方差,雖然沒有消除模型中得多重共線性,但確能消除多重共線性造成得后果。例如:增加樣本容量可使參數估計量得方差減小。3、第三類方法:減小參數估計量得方差六、案例——中國糧食生產函數

根據理論和經驗分析,影響糧食生產(Y)得主要因素有:農業化肥施用量(X1);糧食播種面積(X2)成災面積(X3);農業機械總動力(X4);農業勞動力(X5)已知中國糧食生產得相關數據,建立中國糧食生產函數:Y=

0+1X1+2X2+3X3

+4X4

+5X5

+調用數據庫E:\博士計量課程軟件應用\multiR2接近于1;給定=5%,得F臨界值F0、05(5,12)=3、11

F=137、11>3、11,故認上述糧食生產得總體線性關系顯著成立。但X4

、X5

得參數未通過t檢驗,且符號不正確,故解釋變量間可能存在多重共線性。(-0、91)(8、39)(3、32)(-2、81)(-1、45)(-0、14)1、用OLS法估計上述模型:發現:X1與X4間存在高度相關性。列出X1,X2,X3,X4,X5得相關系數矩陣:2、檢驗簡單相關系數可見,應選第1個式子為初始得回歸模型。分別作Y與X1,X3,X2,X4,X5間得回歸:

(25、58)(11、49)R2=0、8919F=132、1

(-0、49)(1、14)R2=0、075F=1、30

(17.45)(6.68)R2=0.7527F=48.7

(-1.04)(2.66)R2=0.3064F=7.073、找出最簡單得回歸形式

(1、74)(7、25)R2=0、1596F=3、04將其她解釋變量分別導入上述初始回歸模型,尋找最佳回歸方程。4、逐步回歸

回歸方程以Y=f(X1,X2,X3)為最優:5、結論

§5、2異方差(Heteroscedasticity)1、同方差假定及異方差定義模型的假定條件⑴給出Var()是一個對角矩陣,Var()=

2I=

2

的方差協方差矩陣主對角線上的元素都是常數且相等,即每一誤差項的方差都是有限的相同值(同方差假定);且非主對角線上的元素為零(無自相關假定),Var(

)=

2

=

2

2I.

當這個假定不成立時,Var()不再是一個純量對角矩陣。當誤差向量的方差協方差矩陣主對角線上的元素不相等時,稱該隨機誤差系列存在異方差,即誤差向量中的元素取自不同的分布總體。非主對角線上的元素表示誤差項之間的協方差值。比如

中的

ij

,(i

j)表示與第i組和第j組觀測值相對應的

i與

j的協方差。若

非主對角線上的部分或全部元素都不為零,誤差項就是自相關的(后面講自相關)。2、異方差得表現

異方差通常有三種表現形式,(1)遞增型(2)遞減型(3)條件自回歸型。遞增型異方差見圖5.21和5.22。圖5.23為遞減型異方差。圖5.24為條件自回歸型異方差(復雜性異方差)。圖5.21遞增型異方差情形

圖5.22遞增型異方差

隨著解釋變量值得增大,被解釋變量取值得差異性增大圖5.23遞減型異方差

圖5.6復雜型異方差

注:時間序列數據和截面數據中都有可能存在異方差。經濟時間序列中得異方差常為遞增型異方差。金融時間序列中得異方差常表現為自回歸條件異方差。無論就是時間序列數據還就是截面數據。遞增型異方差得來源主要就是因為隨著解釋變量值得增大,被解釋變量取值得差異性增大。3、異方差得后果

下面以簡單線性回歸模型為例討論異方差對參數估計的影響。

對模型

yt

=

0

+1

xt

+ut

(1)、當Var(ut)=

t2為異方差時(t2就是一個隨時間或序數變化得量),回歸參數估計量仍具有無偏性和一致性,但就是回歸參數估計量不再具有有效性。以為例=E()E()=E()=

1+

=

1Var()=E(-

1)2

=E()2=E()==≠上式不等號左側項分子中得

t2不就是一個常量,不能從累加式中提出,所以不等號右側項不等于不等號左側項。而不等號右側項就是同方差條件下

1得最小二乘估計量得方差。因此異方差條件下得失去有效性。4、異方差得診斷

(2)參數估計量的方差估計是真實方差的有偏估計(3)t檢驗失效經濟變量規模差別很大時容易出現異方差。如個人收入與支出關系,投入與產出關系。

(2)利用散點圖做初步判斷。

OLS(3)White檢驗White檢驗的具體步驟如下:

第一步:YXe1,…en檢驗假設:H0:即,同方差第三步:~>第四步:拒絕H0,存在異方差。第二步:ei2原變量、原變量平方、交叉項R2OLS(4)自回歸條件異方差(ARCH)檢驗異方差的另一種檢驗方法稱作自回歸條件異方差(ARCH)檢驗。這種檢驗方法不是把原回歸模型的隨機誤差項

t2看作是xt

的函數,而是把

t2看作誤差滯后項ut-12,ut-22,…的函數。ARCH是誤差項二階矩的自回歸過程。恩格爾(Engle1982)針對ARCH過程提出LM檢驗法。輔助回歸式定義為:LM統計量定義為:~ARCH=nR2檢驗假設:H0:5、克服異方差得方法

(1)采用GLS估計

Y=X

+u

設模型為:其中E(u)=0,Var(u)=E(uu‘)=

2,

已知

因為

是一個T階正定矩陣,所以必存在一個非退化T

T階矩陣M使下式成立。M

M'=I

T

TM'M=

-1

MY=MX

+Mu取Y*=MY,X*=MX,u*=Mu

Y*=X*

+u*

若對于不全為零得實數x1,x2,…xn總有f=f(x1,x2,…xn)>0,則f稱為正定二次型。滿秩矩陣

Var(u*)=E(u*

u*'

)=E(Muu'M')=M

2

M

'=

2

M

M

'=

2

I(GLS)=(X*'X*)-1X*'Y*=(X'M'MX)-1

X'M'MY

=(X'

-1X)-1X'

-1Y

這種方法成為廣義最小二乘法(GLS)(2)通過對數據取對數消除異方差。中國進出口貿易額差(1953-1998)

對數的中國進出口貿易額之差

§5、3自相關(Autocorrelation

)1、非自相關得假定及自相關定義

Cov(ui,uj

)

0,(i

j)即誤差項ut的取值在時間上是相互無關的。稱誤差項ut非自相關。如果則稱誤差項ut存在自相關。注:自相關又稱序列相關。

圖1非自相關得散點圖

圖4正自相關得散點圖

圖3負自相關得散點圖

圖2非自相關得序列圖

2、自相關產生得原因大多數經濟時間數據都有一個明顯得特點,就就是她得慣性。GDP、價格指數、生產、就業與失業等時間序列都呈周期性,如周期中得復蘇階段,大多數經濟序列均呈上升勢,序列在每一時刻得值都高于前一時刻得值,似乎有一種內在得動力驅使這一勢頭繼續下去,直至某些情況(如利率或課稅得升高)出現才把她拖慢下來。(1)慣性(2)設定偏誤1:模型中未含應包括得變量

例如:如果對牛肉需求得正確模型應為Yt=

0+1X1t+2X2t+3X3t+t其中:Y=牛肉需求量,X1=牛肉價格,X2=消費者收入,X3=豬肉價格如果模型設定為:Yt=

0+1X1t+2X2t+vt則該式中,vt=

3X3t+t,

于就是在豬肉價格影響牛肉消費量得情況下,這種模型設定得偏誤往往導致隨機項中有一個重要得系統性影響因素,使其呈序列相關性。(3)設定偏誤2:不正確得函數形式

例如:如果真實得邊際成本回歸模型應為:Yt=

0+1Xt+2Xt2+t其中:Y=邊際成本,X=產出,但建模時設立了如下模型:Yt=

0+1Xt+vt因此,由于vt=

2Xt2+t,,包含了產出得平方對隨機項得系統性影響,隨機項也呈現序列相關性。(4)蛛網現象例如:農產品供給對價格的反映本身存在一個滯后期:供給t=

0+1價格t-1+t意味著,農民由于在年度t的過量生產(使該期價格下降)很可能導致在年度t+1時削減產量,因此不能期望隨機干擾項是隨機的,往往產生一種蛛網模式。3、自相關性得后果(1)參數估計量非有效雖然回歸系數仍具有無偏性。但是喪失有效性。

的方差比非自相關時大,失去有效性。

(2)變量得顯著性檢驗失去意義用OLS法估計時仍然用估計,所以會低估的方差。等于過高估計統計量t的值,從而把不重要的解釋變量保留在模型里,使顯著性檢驗失去意義。(3)Var()和su2都變大,都不具有最小方差性。所以用依據普通最小二乘法得到的回歸方程去預測,預測是無效的。關于名詞白噪聲序列:零期望、同方差、無自相關序列。

然后,通過分析這些“近似估計量”之間得相關性,以達到判斷隨機誤差項就是否具有自相關性得目得?;舅悸?4、自相關檢驗(1)Durbin-Watson檢驗法

D-W檢驗就是J、Durbin)和G、S、Watson于1951年提出得一種檢驗序列自相關得方法,該方法得假定條件就是:(1)解釋變量X非隨機;(2)隨機誤差項

i為一階自回歸形式:

i=i-1+i(3)回歸模型中不應含有滯后因變量作為解釋變量,即不應出現下列形式:Yi=

0+1X1i+kXki+Yi-1+i(4)回歸含有截距項;

該統計量得分布與出現在給定樣本中得X值有復雜得關系,因此其精確得分布很難得到。

D、W、統計量DW檢驗步驟如下。給出假設:H0:

=0(不存在自相關)H1:

0(存在一階自相關)用殘差值et計算統計量DW。

DW==因為≈≈DW==2(1-)=2(1-)因為

得取值范圍就是[-1,1],所以DW統計量得取值范圍就是[0,4]。

與DW值得對應關系見下表。

DW得表現

=0DW=2非自相關

=1DW=0完全正自相關

=-1DW=4完全負自相關實際中DW=0,2,4的情形是很少見的。當DW取值在(0,2),(2,4)之間時,怎樣判別誤差項是否存在自相關呢?推導統計量DW的精確抽樣分布是困難的,因為DW是依據殘差et計算的,而et的值又與xt的形式有關。DW檢驗與其它統計檢驗不同,它沒有唯一的臨界值用來制定判別規則。然而Durbin-Watson根據樣本容量和被估參數個數,在給定的顯著性水平下,給出了檢驗用的上、下兩個臨界值dU和dL

。判別規則如下:

可以看出,當D、W、值在2左右時,模型不存在一階自相關。當DW值落在“不確定”區域時,有兩種處理方法。①加大樣本容量或重新選取樣本,重作DW檢驗。②選用其她檢驗方法。注意:①因為DW統計量就是以解釋變量非隨機為條件得出得,所以當有滯后得內生變量作解釋變量時,DW檢驗無效。②不適用于聯立方程模型中各方程得序列自相關檢驗。③DW統計量不適用于對高階自相關得檢驗。

但在實際計量經濟學問題中,一階自相關就是出現最多得一類序列相關;另外,經驗表明,如果不存在一階自相關,一般也不存在高階序列相關。(2)圖示法

圖示法就就是依據殘差et對時間t得序列圖作出判斷。由于殘差et就是對誤差項ut

得估計,所以盡管誤差項ut

觀測不到,但可以通過et得變化判斷ut

就是否存在自相關。圖示法得具體步驟就是,(1)用給定得樣本估計回歸模型,計算殘差et

,(t=1,2,…T),繪制殘差圖;(2)分析殘差圖。Stata實現語句:regyxpredictr,residualsgenrlag=r[_n-1]Scatterrrlag

調用水果數據庫(3)回歸檢驗法優點就是,(1)適合于任何形式得自相關檢驗,(2)若結論就是存在自相關,則同時能提供出自相關得具體形式與參數得估計值。缺點就是,計算量大。①用給定樣本估計模型并計算殘差et。②對殘差序列et

,(t=1,2,…,T)用OLS進行不同形式得回歸擬合。如

et=

et–1+vt

et=

1et–1+2et–2+vtet

=et-12+vtet=

+vt

…(3)對上述各種擬合形式進行顯著性檢驗,從而確定誤差項ut存在哪一種形式得自相關?;貧w檢驗法得步驟如下:5、克服自相關如果模型得誤差項存在自相關,首先應分析產生自相關得原因。如果自相關就是由于錯誤地設定模型得數學形式所致,那么就應當修改模型得數學形式。如果自相關就是由于模型中省略了重要解釋變量造成得,那么解決辦法就就是找出略去得解釋變量,把她做為重要解釋變量列入模型。只有當以上兩種引起自相關得原因都消除后,才能認為誤差項ut“真正”存在自相關。在這種情況下,解決辦法就是變換原回歸模型,使變換后得隨機誤差項消除自相關,進而利用普通最小二乘法估計回歸參數。這種變換方法稱作廣義最小二乘法(GLS)。

廣義最小二乘法

對于模型Y=X+N……………(1)如果存在序列相關,同時存在異方差,即有設=

用D-1左乘上式兩邊,得到一個新的模型:D-1Y=D-1X+D-1N即Y*=X*+N*…….(2)該模型具有同方差性和隨機誤差項互相獨立性。于就是,可以用OLS法估計模型(2),得

這就是原模型(1)的廣義最小二乘估計量(GLSestimators),是無偏的、有效的估計量。如何得到矩陣

?仍然就是對原模型(1)首先采用普通最小二乘法,得到隨機誤差項得近似估計量,以此構成矩陣得估計量

,即差分法

差分法就是一類克服自相關性得有效得方法,被廣泛地采用。

差分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論