stata面板數據計量知識和參考資料_第1頁
stata面板數據計量知識和參考資料_第2頁
stata面板數據計量知識和參考資料_第3頁
stata面板數據計量知識和參考資料_第4頁
stata面板數據計量知識和參考資料_第5頁
已閱讀5頁,還剩134頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

計量知識:

1、橫截面數據、時間序列、面板數據:

橫截面數據是在同一時間,不同統計單位相同統計指標組成的數據列。橫截

面數據是按照統計單位排列的。因此,橫截面數據不要求統計對象及其范圍相同,

但要求統計的時間相同。也就是說必須是同一時間截面上的數據。

TumoverH

Premium,,PremiakTurnover,SizeA+Hso,,Iso才/端01mlmy

時間序列數據:

在不同時間點上收集到的數據,這類數據反映了某一事物、現象等隨時間的

變化狀態或程度。

面板數據:

是截面數據與時間序列數據綜合起來的一種數據類型。其有時間序列和截面

兩個維度,當這類數據按兩個維度排列時,是排在一個平面上,與只有一個維度

的數據排在一條線上有著明顯的不同,整個表格像是一個面板,所以把panel

data譯作“面板數據”。

舉例:

如:城市名:北京、上海、重慶、天津的GDP分別為10、11、9、8(單位億

元).這就是截面數據,在一個時間點處切開,看各個城市的不同就是截面數據。

如:2000、2001,2002,2003、2004各年的北京市GDP分別為8、9、10、

11,12(單位億元)。這就是時間序列,選一個城市,看各個樣本時間點的不同

就是時間序列。

如:2000、2001、2002、2003、2004各年中國所有直轄市的GDP分別為:

北京市分別為8、9、10、11、12;

上海市分別為9、10、11、12、13;

天津市分別為5、6、7、8、9:

重慶市分別為7、8、9、10、11(單位億元)。

這就是面板數據。

*變量合并

2、截面數據,多重共線性和異方差都需要考慮,截面數據不需要檢測DW

值!你做出來R方比較小,可能原因是你的回歸方程中沒有納入關鍵變量,建

議你采用逐步回歸方法,以提高R方!對于截面數據來說,R方一般在0.7左

右都能接受!相關分析不是必要做的,在模型中加入什么變量進行回歸,主要

是依據前期的理論分析和研究目的!僅就計量回何而言,這些步驟只是告訴

你,自變量與因變量的相關性會影響變量在模型中的顯著性,而自變量間的相

關則會帶來多重共線性!

3、線性相關,也叫自相關:可以用來看x和y的相關性,常用來考察各個x

自變量之間是否存在相關關系。

相天

本例命令pwcorrxy,sig

pwcorrxy,sig

x1.0000

I

y0.59941.0000

0.0182

Pearson相關系數二0.5994,P值=0.0182<0.05,因此可以認為身高與體

重呈正線性相關。

4、保留字符串中的前四個字符、excel自動重算

genvar2=substr(var1,1,4)從第1位開始提取后面的4位數

excel有時候填充柄功能不行,下拉只能是復制,而不能把公式一直用下來,這

個時候,應該操作:文件-選項-公式-自動重算。即可。

5、Stata的單引號很特別,是''有兩個符號,左邊是Tab鍵上面那個

鍵,即~鍵,右邊是引號鍵,即回車鍵左邊這個。要分別按兩個組成一個單引

號。

6、把字符型日期改成數值型

destringdate,repIaceignore-")

這個命令的意思是,杷date時間那一列,原來這一列是字符型格式,如2016-

01-13,那么要做時間序列來處理的話,先要改成數值型格式,比如20160113,

這個命令就是把這個字符串里面的給刪除掉。

destringgov_0,repIace

或者可以直接通過這個語句來把一個變量由字符串變成數值型。

7、截面數據的回歸

regyx1x2x3x4x5,robust截面數據一定要加robust

.regvar2var3var4var5

SourceSSdfMSNunb?sofoba■473

F(3,469)?108.13

Model19.608791636.53626385Prob>F=0.0000

Residual28.3504347469.060448688R-squaredr=6.408>

AdjR-squared=0.4051

Total47.9592263472.10160853RootMSZ?.24586

var2Coef.Std.£rrzP>ltl[95%Conf.Interval]

var3Z.0023668\.00058644.04/o.ooo\.0012145.0035191

I0.000

vas41.63?-12-7.91-9.71?-12

vasSV21.726491.23444217.60\.ooo119.3007724.15221

/-19.32279

_cons1.058402-16.29O\DO-15.16319

R方是可以解釋y變量的40%左右,不好。Cons是常數項,p小于0.1比較好。

8、廣義差分法

2.廣義差分法

廣義差分法是將原模型變換為滿足OLS法的

差分模型,再進行OLS估計。

①設有一元線性模型匕=&+萬陽+自(1)

存在一階自相關4=p禺T+V,

其中:5為滿足基本假定的擾動項

將模型滯后一期有:匕_產用+4陽.1+〃1

方程兩邊同乘P,并與原模型(1)相減得

z—aT=你1—2)+力(用一曲-)+(4-0?。?)

定義變量變換:①)

然,TJ

稱(3)式為廣義差分變換。(2)式可表示為:

Y;川B、X:+v,(4)

其中:月=4(1—,)

(4)式是經廣義差分變換得到的模型,稱為廣義差分模型。

變換后擾動項滿足基本假定,故對(4)式作OLS回歸,得估

計值說、£,進而得平Q

此法稱廣義差分估計法、_

在(3)式中,若。=1,貝IJ(3)式變為:

Y:=Y,-Y,_,=AY,

X;=X「X,_a(5)

此時(5)式稱為差分變換。只要DW^O,則"=1

就可以用一階差分法對模型進行變換。

②若有多元回歸模型

匕=4+四X”+P2Xlt+...+J3kxh+fl,(t=l,2...n)(6)

存在一階自相關:兒=0AT+匕

其中:%為滿足基本假定的擾動項

同理可吵空駕的T/差分飛:

(X;=X.2,...,k

可得滿足捻*假定敢亡&:

=A+M+M+--+4罵+匕(t=2,3,…,k)

="中:優=^他&

禽=風八一6f

S士中的義…:粼4鍥原模型⑹中的兒…,4

廣義差分跑不需在序列才於市菽)

可進行OLS浙七-----

9、序列相關、自相關

序列相關性,在計量經濟學中指對于不同的樣本值,隨機干擾之間不再是完全相互獨立的,而是存在某種相關性。

又稱自相關(autocorrelation),是指總體回歸模型的隨機誤差項之間存在相關關系。在回歸模型的古典假定中是

假設隨機誤差項是無自相關的,即在不同觀測點之間是不相關的。如果該假定不能滿足,就稱與存在自相關,即不

同雙;咚面肉舌際符甘柏能.相芋的理府H用自相關系紇表示.根據自相關系數的符號可以判斷自相關的狀

態,則ut與Ut-1為正關;如果=0,則ut與ut-1不相關斗

10、截面數據、時間序列、面板數據示例

截面數據:一個時間節點

AD

中興通訊

PV'、0.8629—1962

TR\12.98751414T0227710.546855

VA\411237036854.4E+103.97E+10

LI0.8607000984.4485314.378575

時間序列:多個時間節點,一家企業

日期中集集團I中集集團I中集集團卬集藁團)_______

1-J相對操手聞市值--------

/^014-trk030.85494.65969401305216140.860700098

/2014-01-0K0.906011.92745388874786650.860700098

2014-01-07、0.935020.91763393801965340.860700098

\2014-01-08\0.89286.091896400509043540.860700098

\0.9069

4-01-0913.29034399772566470.860700098

20iMj-10J0.901214.05305391373415600.860700098

面板數據:不同公司,不同時間點

[date

companyP_trsize1i

000039SZ=矣其可’000039var8

'0000390860700T'000039

000039SZ=冥賓532014-01-060.906006711.92745338887478665

000039SZu美矣無'000039201?1-070.934977920.9176253938019653408607001’000039

000039.SZ=笑臭文'0000392(/4-0\-080.89279196.09189634005090435408607001‘000039

000039.SZ=吳矣藥’000039i6l4-01)090.906885213.290341399772S66470.8607001’000039

000039.SZu案關靈'0000392014-01-\00.901202514.053051391373415600.8607001'000039

000039.SZu案笑罡'0000392014-01-1B0.874245610.806742399356596870.8607001’000039

000039.SZU案美麥’0000392014-01-140.860153715.639866404328931580.8607001’000039

000039.SZ-’0000392014-01-150.858635915.993744405471640930.8607001'000039

U案矣矛

0000391^Z’0000392014-01-16862869512.987514411237036850.8607001’000039

000063%Z’000063‘000039

u其2由/2014-01-030.973811.183936474277809744.4485306

0000?3.£-'0000632014-01-06(.98901780.6768784460259394004.4485306‘000063

0000C3.SZu義:4由’0000632014-01-07:.04490330.41303354502579018644485306‘000063

000003SZu共疸訊'00006320144)1-08C99998760.59528284522239882944485306'000063

OOOOC3.SZU義理訊’00006320143,9C95671321.2822934522426408744485306‘000063

000003SZU桌速粗'00006320144)1-10G96864551.56047694436281087644485306’000063

0000?3.SZU興也說'0000632014X)1-13C96480782.57911284253870023244485306‘000063

000063.SZU共電訊'0000632014^)1.14C96495432.07613814251641441844485306‘000063

000063.SZ匚義恚J二0000632014X)1-15C.92S62690.86562894232425968144485306‘000063

000063.SZ/訊叫》632014^)1-16(90761221.02277084395541325844485306'000063

000157S3宣科'0001572014^)1X)3150243840.86827614139825542243785753"000063

,5634584

000157SZ'電宣科'000157£014^1^)60.86490484027726759843785753'000157

15642388

000157SZ=經重科00015710144)1-071.03906514034399618343785753000157

000157SZ二專重容'0001572014-01-0^153680550.86429944038526185443785753,000157

000157SZ=專案科'0001572034-01>09155395091.11266353982182954643785753’000157

000157SZ=專重駕'00015720lWl-10153987341.0376249393245165314.3785753'000157

000157SZ=衰重為'00015720142301062396065017914.3785753'000157

000157,SZ=款重科'0001572014*01-141497go440.8243779398165524574.3785753’000157

000157.SZ=裂重科'0001571.0072694397120243464.3785753’000157

11、時間序列、面板數據回歸分析

時間序列:

先要tssetvar1\*var1是時間的一列,先用這個命令表示這一列是時間序

再用regyx1x2x3x4x5

面板序列:

xtsetvar1date

這是想要設定前兩個變量,必須這樣弄,才可以進行面板數據的后續探討

xtsetvarldate

panelvariable:varl(stronglybalanced)

timevariable:date,20140103to20140116,butwithgaps

delta:1unit

12、把字符型改成數值型

destringvarl,replace把varl改成數值型,原來是字符型

13、面板數據先用隨機效應和固定效應都試一下,看哪個好,語句:

Hausman檢驗有兩種,一種做隨機模型和固定效應模型,一種是檢驗OLS和IV估

一般而言估計面板數據容易走到兩個極端:一個是把其看成截面數據而進行混合回歸,

要求每個個體都有完全相同的回歸方程;另一個是為每個個體估計一個單獨的回歸方程。前

者忽略個體間不可預測或被遺漏的異質性,而該異質性與解釋變量相關而導致估計不一致,

后者則忽略個體間的共性,也可能沒有足夠大的樣本容量。折中的估計策略:假定個體的回

歸方程擁有相同的斜率,但可以有不同的截距項,來捕捉異質性,這稱為“個體效應模型

包括個體固定效應、個體隨機效應、混合效應。

xtregvar3var4var5var6,fe\*固定效應估計

eststorefe\*儲存結果

xtregvar3var4var5var6,re\*隨機效應估計

eststorere\*儲存結果

hausmanfere,constantsigmamore\*這是hausman檢臉的語句

面板數據的hausman檢驗

原假設是隨機效應,p值太小可以拒絕原假設,如果hausman檢驗■的結果

(Prob>chi2)小于0.1,那么選擇固定效應:如果(Prob>chi2)大于0.1,或者chi2

的值小于0,那么選擇隨機效應。

:注意:術語“隨機效應模型”和“固

庭效應模型”用得并不十分恰當,

;容易產生誤解。其實固定效應模型

應該稱之魚殛逐應模型)而隨

機效應模矗該稱之力飛畫?美效一二

:應模型”。因為固定效應模型和隨機

:效應模型中的0都是隨機變量。

14、總體參數的實際值與其估計值相等時,估計量具有無偏性

樣本相同、用不同的方法估計參數,可以找到若干個不同的估計式,其中抽樣分

布具有最小方差的估計式(最小方差準則),稱為最佳性準則。既是無偏的同時

又具有最小方差的估計式,稱為最佳無偏估計式。

當樣本容量較小時,有時很難找到最佳無偏估計,需要考慮樣本擴大后的性質:

一致性:當樣本容量n趨于無窮大時,如果估計式依概率收斂于總體參數的真

實值,就稱這個估計式是其實值的一致估計式。漸近有效性:當樣本容量n趨

于無窮大時,在所有的一致估計式中,具有最小的漸近方差。

無偏性編段回目錄

一個總體參數的無偏性是,其期更值等于參數真值檄計量

這意味著無論你取無數個樣本,計算每個樣本的估計值,曲彳晶平均值將會等于吃些少

也就是說樣本統計量

一致性痛肺段回目錄

如果隨著樣本容量的增大,跑訐痂金血差云灣么我們說這個無偏估計量具有一致性

用方差來測度二者相似的程度。

有效性:扁揖本段回目錄

如果T參數有兩個無制古計量,我們說方差卒爻小的估計蚩是相對有效的。方估計量就是嬴就

估計量的一致性

是指:爐t靈器

尢觸根腌威耦標犍楝具有飯藪由)

15、注釋語句

xtregvar3var4var5var6,re/*隨機效應估計*/

備注語句在command窗口不行,但是在do窗口可以

16、平穩序列、單位根檢驗、隨機游走、白噪聲序列

某人認為:面板數據的單位根檢臉出來的最優滯后階,只是看出來面板數據

的平穩性,之所以從后面比較大的數字往回走,是因為數字越大,可能越難滿足,

因此從后面階數往回走,滿足平穩性的要求,更加有說服力。

某人認為:滯后階越大,說明變量越多,越好?沒懂。。

先用dfuller來看觀察值個數【為什么觀察值比原始數據的值少一百多個?】

dfullervar2

(^377^

Dickey-FullertestforunitrootNuziberofobs

10%Critical

StatisticValueValueValue

單位根檢驗,選擇最大最合適的滯后階、最優滯后階

di12*(122/100)A(1/4)122是表示觀察值個數di12*(122/100)A(1/4)

.di12*(377/100)*(1/4)

16.721167

取值16階

dfullervar2,lags(16)reg

【但由于存在gap,就是時間不連續的問題,所以直接用16階會出現,選擇更小的階

數?】

reg

是因為時間不連續,出現了gap,可自己重新定義連續的時間變量。

數據變量的平穩性是傳統的計量經濟分析的基本要求之一。只有模型中的變

量滿足平穩性要求時,傳統的計量經濟分析方法才是有效的。而在模型中含有非

平穩時間序列式,基于傳統的計量經濟分析方法的估計和檢臉統計計量將失去通

常的性質,從而推斷得出的結論可能是錯誤的。因此,在建立模型之前有必要檢

驗數據的平穩性。這就是平穩性檢驗。

平穩性檢臉就是單位根檢臉,單位根檢臉是指檢臉序列中是否存在單位根,

因為存在單位根就是非平穩時間序列了。單位根就是指單位根過程,可以證明,

序列中存在單位根過程就不平穩,會使回歸分析中存在偽回歸。

平穩時間序列是意義上,隨便截一個時間段內的樣本值,他們的聯合概率分

布都是一樣的,不會有差別。但是這跟樣本值之間的相關性不沖突,樣本值之間

也許存在高度相關。

?給出一個隨機時間序列,首先可通過該

序列的時間路徑圖來粗略地判斷它是否

是平穩的。

??個平穩(的麗朝I在圖形上往往表現

出一種圍變其均值外艇刎過程;

?而羿平穩呼磔往表現出在不同的時

間的有刷磔值(如持續上升或持

續下降)。"一

圖9.1平穩時間序列與非平穩時間序列圖

意思就是,如果有單位根,那么不平穩,變量之間的相關關系可能是假的,

他們之所以相關,很可能是因為他們隨時間變化本來就變化,比如隨著時間的推

移,數值都會變大,那么他們之間的正相關關系也是假的,回歸關系也是假的。

幾種主要的平穩性檢驗方法

D"C1AI>臉蛤法

PP檢驗法

霍爾工具變量法

DF-GLS檢蠟法

KPSS檢瞼法

LMC檢險法

17、刪除行、excel插入多行

dropin489\*刪除第489行

dropin1/3刪除1至3行

dropifvar2==.\*刪除空值的行,制定一個變量只有空值行才會出現空值

就可以啦

excel插入多行:你可以先插入一行,再插入一行之后,你選中兩行,右鍵點擊

插入的話,會直接插入兩行的,這時就插入了四行,以次類推

18、白噪聲序列

得到白噪聲序列,就說明時間序列中有用的信息已經被提取完畢了,剩下的全

是隨機擾動,是無法預測和使用的,殘差序列如果通過了白噪聲檢臉,則建模就

可以終止了,因為沒有信息可以繼續提取。

19、格蘭杰檢驗步驟

通過了平穩檢驗就不用做協整分析了,如果差分n階單整就要做協整檢驗,否則就不用做。

相關的stata命令可以有三種。

方法一:

regyL.yL.x(滯后1期)

estatic(顯示AIC與BIC取值,以便選擇最佳滯后期)

regyL.yL.xL2.yL2.x

estatic(顯示AIC與BIC取值,以便選擇最佳滯后期)

根據信息準則確定p,q后,檢驗;所用的命令就是test

特別說明,此處p和q的取值完全可以不同,而且應該不同,這樣才能獲得最有說服力的結

果,這也是該方法與其他兩個方法相比的最大優點,該方法缺點是命令過于繁瑣。

方法二:

sscinstallgcause(下載格蘭杰因果檢驗程序gcause)

gcauseyx,lags(1)(滯后1期)

estatic(顯示AIC與BIC取值,以便選擇最佳滯后期)

gcauseyx,lags(2)(滯后2期)

estatic(顯示AIC與BIC取值,以便選擇最佳滯后期)

特別說明,在選定滯后期后,對于因果關系檢驗,該方法提供F檢驗和卡方檢驗。如果兩個

檢驗結論不一致,原則上用F檢驗更好些。因為卡方檢驗是一個大樣本檢驗,而實證檢驗所

能獲得的樣本容量通常并不大,如果采用的是大樣本,則以卡方檢驗結果為準。不過,通常

情況下,大樣本下兩個檢驗結論一致,所以不用擔心。綜上,F檢驗適用范圍更廣。

方法三:

varyx(向量自回歸)\*建立向量自回歸模型

vargranger

注意:2、如果實際檢驗過程中AIC和BIC越來越小,直到不能再滯后(時間序列長度所

限卜這樣的話,可能數據確實存在高階自相關。在這種情況下,可以限制p的取值,比如

取最大的或,。

2、回歸結果中各期系數顯著性不同,有的不顯著有的顯著,如實匯報就可以。最好全部匯

報。不顯著的期數可能意味著那一期的自相關很弱。

最后做格蘭杰,是想對每個公司都做一遍,那前面做單位根檢驗、以及協整檢驗是否錯誤了,

因為那是對面板數據進行檢驗?批注[B1]:

三,格蘭杰因果關系檢驗的步驟

(1)蓼逾的上時所有的滯后項y以及別的什么變量(型有的話)做回歸,即y對y

的滯后yt?2:…,ytp及其他變量的回歸,但在這二麗牛沒在把一后項x包括進

來,這"■氽曼的甫的問III舔后從此問歸得到受約度的殘差平#和RSSR.

(2)做一個含有滯后項x的回歸,即在前面的回歸式中加進滯后項x,這是一個無約束的

回歸,由此回歸得到無約束的殘差平方和RSSUR.

(3)零假設是HO:al=a2=...=aq=0,即滯后項x不屬于此回歸.

它遵循自由度為q和(n?k)的F分布.在這里,n是樣木容量,q等于滯后項x的個數,即有

約束回歸方程中待估參數的個數,k是無約束回歸中待估參數的個數。

(5)如果在選定的顯著性水平a上計算的F值炒股臨界Fa值,則拒絕零假設,這樣滯后

x項就屬于此回歸,表明x是y的原因。

(6)同樣,為了檢驗y是否是x的原因,可將變量y與x相互替換,重復步驟(1)?(5)?

20、自相關系數、卡方檢險

相關系數度量的照里吃螃螃間的相互彩的程度,而自相關系觸度里的是同一事住在兩個不同時期之間的相關程m,

彩彖的講就是度里的行為對金惠企y晌,

RMSEMSS就是standarderror

R-sqSR73

R?福^方的耀色〉

次J2個木毓的p宿

20、一階單整

如果一個時間序列經過一次差分變成平穩的,則稱原序列是2階單整的,記為I

(2),一般地,如果時間序列經過d次差分后變成平穩序列,則稱原序列是d

階單整序列,記為I(d)。因此同階單整是指兩個時間序列同為d階單整。

22、單位根檢驗、協整檢驗和格蘭杰因果關系檢驗三者之間的關系

做差分才平穩的,成為n階單整,只要是同階單整,就可以往下做協整,都

是用原數據來做協整分析和回歸分析的!

補充文中的一點,只要是同階單整就可以直接用原數據做協整當存在協整

關系后還是用原數據做格蘭杰以及后面的VAR/VEC等

實證檢臉步驟:先做單位根檢驗,看變量序列是否平穩序列,若平穩,可構造回

歸模型等經典計量經濟學模型;若非平穩,進行差分,當進行到第i次差分時序

列平穩,則服從i階單整(注意趨勢、截距不同情況選擇,根據P值和原假設判

定)。

若所有檢臉序列均服從同階單整,可構先做單位根檢驗,看變量序列是否平穩序

列,若平穩,可構造回歸模型等經典計量經濟學模型:若非平穩,進行差分,當

進行到第i次差分時序列平穩,則服從i階單整(注意趨勢、截距不同情況選

擇,根據P值和原假設判定)。

造VAR模型,做協整檢驗(注意滯后期的選擇),判斷模型內部變量間是否存在

協整關系,即是否存在長期均衡關系。協整檢驗的原假設就是,變量回歸后的殘

差是平穩序列.如若殘差是平穩序列,說明存在協整關系,如果殘差序列有單位

根,則協整關系不存在。

如果有協整關系,則可以構造VEC模型或者進行Granger因果檢臉,檢驗變量之

間“誰引起誰變化”,即因果關系。

一、討論一

1,單位根檢驗是序列的平穩性檢驗,如果不檢驗序列的平穩性直接OLS容易導

致偽回歸。

2、當檢臉的數據是平穩的(即不存在單位根),要想進一步考察變量的因果聯系,

可以采用格蘭杰因果檢臉,但要做格蘭杰檢驗的前提是數據必須是平穩的,否則

不能做。

3、當檢驗的數據是非平穩(即存在單位根),并且各個序列是同階單整(協整檢

臉的前提),想進一步確定變量之間是否存在協整關系,可以進行協整檢臉,協

整檢驗主要有EG兩步法和JJ檢驗A、EG兩步法是基于回歸殘差的檢驗,可以通

過建立OLS模型檢臉其殘差平穩性B、JJ檢驗是基于回歸系數的檢臉,前提是建

立VAR模型(即模型符合ADL模式)

4,當變量之間存在協整關系時,可以建立ECM進一步考察短期關系,Eviews這

里還提供了一個Wald—Granger檢臉,但此時的格蘭杰已經不是因果關系檢驗,

而是變量外生性檢驗,請注意識別

二、討論二

1、格蘭杰檢驗只能用于平穩序列!這是格蘭杰檢驗的前提,而其因果關系并非

我們通常理解的因與果的關系,而是說x的前期變化能有效地解釋y的變化,

所以稱其為“格蘭杰原因”。

2、非平穩序列很可能出現偽回歸,協整的意義就是檢臉它們的回歸方程所描述

的因果關系是否是偽回歸,即檢驗變量之間是否存在穩定的關系。所以,非平穩

序列的因果關系檢臉就是協整檢臉。

3、平穩性檢驗有3個作用:2)檢驗平穩性,若平穩,做格蘭杰檢驗,非平穩,

作協正檢臉。2)協整檢驗中要用到每個序列的單整階數。3)判斷時間學列的數

據生成過程。

三、討論三其實很多人存在誤解。有如下幾點,需要澄清:

第一,格蘭杰因果檢驗是檢驗統計上的時間先后順序,并不表示而這真正存在因

果關系,是否呈因果關系需要根據理論、經驗和模型來判定。

第二,格蘭杰因果檢驗的變量應是平穩的,如果單位根檢驗發現兩個變量是不穩

定的,那么,不能直接進行格蘭杰因果檢臉,所以,很多人對不平穩的變量進行

格蘭杰因果檢驗,這是錯誤的。

第三,協整結果僅表示變量間存在長期均衡關系,那么,到底是先做格蘭杰還是

先做協整呢?因為變量不平穩才需要協整,所以,首先因對變量進行差分,平穩

后,可以用差分項進行格蘭杰因果檢驗,來判定變量變化的先后時序,之后,進

行協整,看變量是否存在長期均衡。

第四,長期均衡并不意味著分析的結束,還應考慮短期波動,要做誤差修正檢驗。

22、AR模型、平穩時間序列

AR模型是一種線性預測,即已知N個數據,可由模型推出第N點前面或后面的

數據(設推出P點),所以其本質類似于插值,其目的都是為了增加有效數據,

只是AR模型是由N點遞推,而插值是由兩點(或少數幾點)去推導多點,所以

AR模型要比插值方法效果更好。

平穩時間序列粗略地講,一個時間序列,如果均值沒有系統的變化(無趨勢)、

方差沒有系統變化,且嚴格消除了周期性變化,就稱之是平穩的。

23、AIC、SC最小原則

AIC最小原則是判定模型好壞標準之一,猶如R2(R平方)一樣。AIC和SC(舒

瓦茨信息)常常一并作為判斷模型擬合程度的標準之一,特別是在滯后階數的選

擇上。比如說,一個VAR(向量自回歸模型),經濟理論往往無法確定滯后階數,

這時往往采用AIC或者SC最小原則,即觀察不同的階數的VAR模型,哪個模型

的AIC或者SC值最小就選用哪個模型進行分析。AIC、SC都會在模型參數中給

出。除了R2、AIC、SC之外,常用的判斷標準還有Lg(極大似然法...

Stata如何運用?

自回歸:

是統計上一種處理時間序列的方法,是用同一變量之前各期的表現情況,來預測

該變量本期的表現情況,并假設它們為一元線性關系。因為這是從回歸分析中的

線性回歸發展而來,只是不是用來預測其他變量,而是用來預測自己:所以叫做

自回歸。

條件:

2、必須具有自相關,自相關系數()是關鍵。如果自相關系數(R)小于0.5,則

不宜采用,否則預測結果極不準確。

2、自回歸只能適用于預測與自身前期相關的經濟現象,即受自身歷史因素影響

較大的經濟現象,如礦的開采量,各種自然資源產量等;對于受社會因素影響較

大的經濟現象,不宜采用自回歸,而應改采可納入其他變數的向量自回歸模型。

24、滯后階和差分的關系

滯后一階,Y對Xt-2的反映程度,由于滯后,Y可能跟上一期的X有關系。

有些變量的反應會出現延遲現象,所以一個變量可能跟它自己的前一期有密切的

關系,這個就叫做變量存在滯后情況。

滯后項一般是指該變量的前一期的值,而差分則是當期值與前一期的值之差;

滯后二階就是前兩期的值,二階差分就是后一期一階差分減去前一期一階差分。

差分是為了更簡便有效的提取觀察序列中的確定性信息,其實質是使用自回歸

的方式提取確定性信息。

25、刪除缺失值所在的行

egenmis=rowmiss(_aII)

dropifmis

如果樣本量比較大,且樣本是隨機抽樣得到的,那么刪除含有缺失值的樣本比較

好;

如果樣本量比較小,可以用均值代替缺失值。這里的均值可以是總體樣本該缺失

值指標的均值,也可以是缺失值上下兩期間的均值(個人因為后者可能相對好些)。

沒有太嚴格的標準,看你自己抉擇的。祝好運。

缺失值大于任何一個數值

將上述數據復制到STATA中,然后退出數據編輯器。

.genagegrp1=(age>=65)

生成的數據中,將缺失值視為65歲以上分在了高齡組,這是錯誤的

.genagegrp2=(age>=65)ifcige<.

生成的數據中,將缺失值排除在外,正確!這一命令常被用于生成虛擬變量.

,gen(igegrp3-(age=z=65)ifage<.〃僅判斷是否恰好為65歲

.list〃比較agegrpl、agegrp2和agegrp3的差異,體會的作用:

ageAgegrplAgcgrp2Agegrp3

38000

1

65111

42000

26、在做單位根時,多個公司只有一個收益率的指標,也應該弄成面板

數據

ABC

12014-01-024.1723

12014-01-031.5504

12014-01-06-3.3079

12014-01-073.0263

12014-01-08-0.4470

12014-01-091.7960

12014-01-10-3.0876

12014-01-13-0.1951

12014-01-143.9739

12014-01-150.5639

12014-01-162.9283

12014-01-17-1.3317

12014-01-200.1840

12014-01-213.7967

12014-01-22-0.2950

12014-01-23-0.5917

12014-01-24-0.5357

第一列是公司,第二列是日期,日期不能有gap,要重新弄,緊密的

EFGH

varl/L呼var3

1[2014010^

4.1723

20140103、、1.5504

1\20140104、.3O79

1)

2014010510263

\20140106

-0W470

\20140107

1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論