




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
工具變量回歸由來估計矩估計(不好)2SLS(最常用)GMM(異方差自相關);LIML(若IV)工具變量有效性檢驗相關性
F檢驗;PartialR2,單內(nèi)生解釋變量Minimumeigenvaluestatistic,最小特征值統(tǒng)計量,用于多內(nèi)生解釋變量外生性
過度識別約束檢驗J統(tǒng)計量
(又稱Sargan統(tǒng)計量)解釋變量內(nèi)生性檢驗Hausman檢驗尋找工具變量的方法:幾個實例方法例子由來經(jīng)典假設
所有的解釋變量Xi與隨機誤差項彼此之間不相關。若解釋變量Xi和ui相關,則OLS估計量是非一致的,也就是即使當樣本容量很大時,OLS估計量也不會接近回歸系數(shù)的真值。造成誤差項與回歸變量相關(內(nèi)生性)的原因很多,但我們主要考慮如下幾個方面:遺漏變量變量變量有測量誤差雙向因果關系。遺漏變量偏差可采用在多元回歸中加入遺漏變量的方法加以解決,但前提是只有當你有遺漏變量數(shù)據(jù)時上述方法才可行。雙向因果關系偏差是指如果有時因果關系是從X到Y又從Y到X時,此時僅用多元回歸無法消除這一偏差。同樣,變量有測量誤差也無法用我們前面學過的方法解決。因此我們就必須尋找一種新的方法。工具變量(instrumentalvariable,IV)回歸是當回歸變量X與誤差項u相關時獲得總體回歸方程未知系數(shù)一致估計量的一般方法。我們經(jīng)常稱其為IV估計。其基本思想是:假設方程是:我們假設ui與Xi相關,則OLS估計量一定是有偏的和非一致的。工具變量估計是利用另一個“工具”變量Z將Xi分離成與ui相關和不相關的兩部分。在經(jīng)濟學中:(1)內(nèi)生變量:由模型內(nèi)的變量所決定的變量稱作內(nèi)生變量。(2)外生變量:由模型外的變量所決定的變量稱作外生變量。重要概念:內(nèi)生變量和外生變量在計量經(jīng)濟學中,把所有與擾動項相關的解釋變量都稱為“內(nèi)生變量”。這與一般經(jīng)濟學理論中的定義有所不同。1。與誤差項相關的變量稱為內(nèi)生變量(endogenousvariable)。2。與誤差項不相關的變量稱為外生變量(exogenousvariable)。我們的工作就是要尋找相應的工具變量將解釋變量分解成內(nèi)生變量和外生變量,然后利用兩階段最小二乘法(TSLS)進行估計。一個例子:考慮貨幣政策對宏觀經(jīng)濟的影響。由于貨幣政策的制定者會根據(jù)宏觀經(jīng)濟的運行情況來調(diào)整貨幣政策,故貨幣政策是個內(nèi)生變量(雙向因果關系)。Romer(2004)通過閱讀歷史文獻將貨幣政策的變動分解為“內(nèi)生”(對經(jīng)濟的反應)與“外生”(貨幣當局的自主調(diào)整)的兩部分。誰開創(chuàng)了工具變量回歸?1928年的著作的“TheTariffonAnimalandVegetableOils”的附錄B。作者是誰?PhilipWright還是他的兒子SewallWright文體計量學的分析為什么IV回歸是有效的?例1:PhilipWright的問題PhilipWright關心的是那個時期的一個重要經(jīng)濟問題:即如何對諸如黃油,大豆油這樣的動植物油和食用動物設置進口關稅。在20世紀20年代,進口關稅是美國主要的稅收收入來源。而理解關稅的經(jīng)濟效應的關鍵在于要有商品需求和供給曲線的定量估計。由前知供給彈性為價格上漲1%引起的供給量變化的百分率,而需求彈性為價格上漲1%引起的需求量的百分率變化。例如具休考慮黃油的需求彈性估計問題:根據(jù)11個均衡樣本點估計的方程究竟是需求函數(shù)還是供給函數(shù)?兩者都不是。由于這些點是由需求和供給兩者的變化確定的,因此用OLS擬合這些點的直線既不是需求曲線也不是供給曲線的估計。利用這些樣本點估計出來的OLS擬合線是需求曲線還是供給曲線,都不是!兩個極端的情況如圖:因此,由于這些點是由需求和供給兩者的變化確定的,因此用OLS擬合這些點的直線既不是需求曲線也不是供給曲線的估計。Wright的解決辦法:1。找到第三個變量,這個變量影響供給但不影響需求。這樣,所有的均衡價格和均衡量對都落在這條穩(wěn)定的需求曲線上,此時很容易估計出它的斜率。2。可見,這第三個變量,也就是工具變量,它與價格相關(它使供給曲線移動,于是導致價格發(fā)生變化),但與u無關(需求曲線保持不變)。3。Wright考慮了幾個可能的工具變量;其中一個是天氣。例如,某牧場的降雨量低于平均值會使牧草減少從而減少給定價格時黃油的產(chǎn)量(會使供給曲線向左移動而使均衡價格上升),因此牧場地區(qū)降雨量滿足工具變量相關性的條件。但牧場地區(qū)降雨量對黃油的需求沒有直接影響,因此牧場地區(qū)降雨量與ui的相關系數(shù)為零;也就是牧場地區(qū)降雨量滿足工具變量外生性條件。上圖表明若某個變量使供給曲線移動而使需求保待不變時會發(fā)生什么樣的情況。現(xiàn)在所有的均衡價格和均衡量對都落在這條穩(wěn)定的需求曲線工具變量法的本質(zhì)是聯(lián)立方程,只不過,我們只關心原方程的可識別性估計:矩估計、TSLS、GMM、LIMLGMM估計TSLS估計量的抽樣分布為了簡單起見,我們僅考慮只有一個回歸變量X和一個工具變量Z的情況。即,參數(shù)的TSLS估計量為Z和Y的樣本協(xié)方差與Z和X的樣本協(xié)方差之比。假設原方程為:即總體系數(shù)為Z和Y的總體協(xié)方差與Z和X的總體協(xié)方差之比。在香煙需求中的應用為了減少由于吸煙導致的疾病和死亡,以及這些生病的人對社會其他成員產(chǎn)生的成本或外部性,一種方法是對香煙征收重稅從而減少吸煙同時阻止?jié)撛诘男挛鼰熣摺5唧w需要增加多大幅度的稅收來削減香煙的消費呢?例如,若要使香煙消費減少20%則香煙的稅后售價應該是多少?若需求彈性為-1,使價格上漲20%就能達到減少20%消費量的目標。若彈性為-0.5,則價格必須上漲40%才能使消費下降20%。同philipWright對黃油的研究一樣。我們無法通過數(shù)量對數(shù)關于價格對數(shù)的OLS回歸得到香煙需求彈性的一致估計。我們利用TSLS和1985-1995年美國48個大陸州的年度數(shù)據(jù)估計了香煙的需求彈性。模型假定:被解釋變量:香煙消費,即為州內(nèi)每人購買的香煙包數(shù)。內(nèi)生解釋變量:包含所有稅收的每包香煙的實際平均價格。工具變量:由一般銷售稅征收的香煙稅收。這個工具變量設定是否合理?
工具變量的相關性:由于高銷售稅增加了總的銷售價格,因此每包香煙的銷售稅滿足工具變量相關性的條件。工具變量的外生性:若銷售稅是外生的,則必須與需求方程中的誤差無關;即銷售稅必然只是通過價格間接影響香煙的需求。這看上去是合理的:主要是因為不同州選擇了不同的銷售額、收入、財產(chǎn)和其他公共財政事業(yè)的混合稅收,所以不同州的一般銷售稅是不同的。其中關于公共財政的選擇受到政治考量的驅使而不是受香煙需求有關的因素影響。結論:這種工具變量的設置方法是合理的。因此我們利用兩階段最小二乘法(TSLS):第一階段結果:第二階段結果:66香煙需求(續(xù))
67STATA實例:香煙需求,第一階段68第二階段69結合到一個命令中一般IV回歸模型一般IV回歸模型因變量Yi。外生解釋變量Wi。內(nèi)生解釋變量Xi。我們引入的工具變量Zi。更為詳細的說明引入工具變量的個數(shù)假設我們有n個內(nèi)生解釋變量,引入了m個工具變量,n和m的關系是什么?n=m恰好識別n<m過度識別n>m不可識別只有恰好識別和過度識別才能用IV方法估計。一般IV模型的TSLS對一般的IV回歸模型,我們需要修改工具變量的相關性和外生性條件。相關性條件:1.當包含一個內(nèi)生變量但有多個工具變量時,工具變量相關性的條件為給定W時至少有一個Z對預測X是有用的(相關的)。2.當包含多個內(nèi)生變量時,不但要排除完全多重共線性問題,而且工具變量必須提供關于這些變量外生性變動的足夠信息,以分離出它們各自對Y的效應。外生性條件:工具變量外生性條件的一般敘述為每個工具變量必須與誤差項ui不相關。一般IV模型中的工具變量相關性和外生性IV回歸假設和TSLS估計量的抽樣分布基于TSLS估計量的推斷在香煙需求中的應用在上一節(jié)中,我們基于1995年美國48個州的年消費數(shù)據(jù)利用包含一個回歸變量(每包香煙的實際價格對數(shù))和一個工具變量(每包香煙的實際銷售稅)的TSLS估計了香煙的需求彈性。但這個估計并非沒有問題的。收入會影響需求,它是總體回歸誤差的一部分。若州銷售稅與州的收入有關,則它與香煙需求方程誤差項中的某個變量相關。這違反了工具變量外生性的條件。會導致IV估計量是非一致的。因此我們需要在回歸中加入收入這一變量。除了工具變量SaleTaxi外,我們增加一個新的工具變量香煙專項稅CigTaxi,香煙專項稅提高了消費者支付的香煙價格,因此可證明它滿足工具變量相關性的條件。同時它與州香煙需求方程中的誤差項不相關,因此它是外生工具變量。有了這個工具變量后我們就有了每包香煙的實際銷售稅和每包香煙的實際州專項稅兩個工具變量。因此需求彈性是過度識別的,即工具變量的個數(shù)(m=2)大于包含的內(nèi)生變量個數(shù)(k=1)。現(xiàn)在我們就可以利用TSLS估計需求彈性了,其中第一階段回歸中的回歸變量為包含的外生變帚ln(Inci)和兩個工具變量。結果,使得標準誤差變小。85實例:香煙的需求86實例:香煙需求,一個工具
87實例:香煙需求,兩個工具88工具變量有效性檢驗1.相關性:為什么弱工具變量是個問題如果工具變量是弱的,那么即使當樣本容量較大時用正態(tài)分布近似TSLS估計量的抽樣分布效果仍然很差。因此即便是在大樣本下仍然缺乏常用統(tǒng)計推斷方法的理論依據(jù)。事實上,如果工具變量較弱,則TSLS估計量嚴重偏離OLS估計量的方向。弱工具變量會使得分母變得很小,甚至為0,導致結果嚴重偏離。直觀上看,由于"z"中僅包含很少與"x"有關的信息,利用這部分信息進行的工具變量法估計就不準確,即使樣本容量很大也很難收斂到真實的參數(shù)值。這種工具變量稱為弱工具變量,將使??
?_"IV"的小樣本性質(zhì)變得很差,且基于大樣本理論的統(tǒng)計推斷失效此外,用TSLS估計量1.96標準誤差構造的95%置信區(qū)問包含系數(shù)真值的次數(shù)遠小于95%,簡言之,若工具變量較弱則TSLS不再是可靠的了。F檢驗(只有一個內(nèi)生解釋變量)當只有一個內(nèi)生解釋變量時檢驗弱工具變量的一種方法是利用F統(tǒng)計量檢驗TSLS第一階段回歸中工具變量系數(shù)都為零的假設。第一階段F統(tǒng)計量,度量了工具變量中包含的信息:包含的信息越多,則F統(tǒng)計量的期望值越大。經(jīng)驗法則是如果第一階段F統(tǒng)計量應該超過10。即檢驗Z1、Z2、…、Zm的聯(lián)合顯著性。testZ1=Z2=…=Zm=0計算F值然后和10比較。偏R2檢驗(只有一個內(nèi)生解釋變量)Minimumeigenvaluestatistic(最小特征值統(tǒng)計量)經(jīng)驗上此數(shù)應該大于10。這個方法類似于與書上的“第一階段F統(tǒng)計量”(但允許有多個內(nèi)生變量)。如果存在弱工具變量該怎么辦?1.如果有很多工具變量,有少數(shù)強工具變量和許多弱工具變量,可以忽略最弱的工具變量而選用相關性最強的工具變量子集。2.但如果系數(shù)是恰好識別的,則你不能略去弱工具變量。即使系數(shù)是過度識別的,但你可能沒有足夠的強工具變量用于識別,因此略去一些弱工具變量也沒有什么幫助。在這種情況下,有兩個選擇:第一個選擇是尋找其他較強的工具變量。(難度較大)第二個選擇是利用弱工具變量繼續(xù)進行實證分析,但采用的方法不再是TSLS。而是對弱工具變量不太敏感的有限信息極大似然法(LIML)。在大樣本下,LIML與2SLS是漸近等價的,但在存在弱工具變量的情況下,LIML的小樣本性質(zhì)可能優(yōu)于2SLS。按:從更根本上說,應該跳出IV框架,尋找IV方法本身的替代工具,這就是DID和RegressionDiscontinuity的作用——有可能正式其由來。參教育報酬率的文獻,Angrist&Kruger(1991);Oreopoulos(2006,AER)2.外生性:過度識別約束檢驗剛才我們提到:只有恰好識別和過度識別才能用IV方法估計。恰好識別:工具變量個數(shù)=內(nèi)生變量個數(shù)過度識別:工具變量個數(shù)>內(nèi)生變量個數(shù)一個很重要的命題是:只有過度識別情況下才能檢驗工具變量的外生性,而恰好識別情況下無法檢驗。過度識別條件下,可以檢驗外生性又稱Sargan統(tǒng)計量在恰好識別情況下,假設考慮只包含一個內(nèi)生變量(k=1)的情況。此時如果有兩個工具變量,可以計算出兩個TSLS估計量,其中每個工具變量對應一個估計量,然后可以將兩者進行比較看看它們是否接近。但如果你只有一個工具變量,則只能計算出一個TSLS估計量,這樣就無法進行比較了。更直觀地看,如果系數(shù)是恰好識別的,此時m=k,那么過度識別檢驗統(tǒng)計量J恰好為零。解釋變量內(nèi)生性檢驗究竟該用OLS還是IV還有一個重要問題沒有考慮:我們只是假設解釋變量中具有內(nèi)生性。那么解釋變量是否真的存在內(nèi)生性?假設能夠找到方程外的工具變量。1。如果所有解釋變量都是外生變量,則OLS比IV更有效。在這種情況下使用IV,雖然估計量仍然是一致的,會增大估計量的方差。2。如果存在內(nèi)生解釋變量,則OLS是不一致的,而IV是一致的。檢驗方法:豪斯曼檢驗豪斯曼檢驗(Hausmanspecificationtest)H0:所有解釋變量均為外生變量。H1:至少有一個解釋變量為內(nèi)生變量。
quietlyreglw80s80expr80tenure80iqeststoreolsquietlyivregress2slslw80expr80tenure80(s80iq=medkwwmrtage)eststoreivhausmanivols在香煙需求中的應用在香煙的案例中我們增加了兩個工具變量:銷售稅與香煙專項稅。我們現(xiàn)在判定這兩個工具變量的外生性。我們發(fā)現(xiàn):香煙專項稅可能不具有外生性,例如,種植煙草的州的吸煙率要高于大多數(shù)其他州的吸煙率。而這個因素與稅收相關,原因是如果煙草種植和香煙生產(chǎn)是這個州的重要產(chǎn)業(yè),那么這些企業(yè)會努力讓香煙專項稅維持在低水平上,所以,這個州是否種植煙草和生產(chǎn)香煙,它可能與香煙專項稅相關。1.由于這是一份面板數(shù)據(jù),所以我們可以利用離差的形式消除這種不隨時間變化的內(nèi)生變量的影響。2.兩個不同年份間的時間跨度會影響彈性估計的解釋。這是因為香煙是能讓人上癮的,所以只有在較長的時間范圍,價格的改變才會改變吸煙者的習慣。即對于香煙來說,短期內(nèi)的需求可能沒有彈性,但長期內(nèi)可能富有彈性。3.因此,我們把時間差定為10年。被解釋變量內(nèi)生解釋變量外生解釋變量工具變量1工具變量2尋找工具變量的方法:幾個實例獲得工具變量的方法使用工具變量法的前提是存在有效的工具變量。因此,如果尋找工具變量在實踐中十分重要。由于工具變量的兩個要求(“相關性”與“外生性”)常常是自相矛盾的,即與內(nèi)生解釋變量相關的變量常常與被解釋變量的擾動項也相關。故在實踐上尋找合適的工具變量常常比較困難,有時需要一定的創(chuàng)造性與想象力。第一種方法是利用經(jīng)濟理論提出工具變量。例如,PhilipWright對農(nóng)業(yè)市場經(jīng)濟的了解促使他找尋使供給曲線移動但需求曲線不動的工具變量,于是他找到了天氣。第二種構造工具變量的方法是找出實際上是由導致內(nèi)生回歸變量移動的隨機現(xiàn)象引起的內(nèi)生回歸變量X變化的某個外生因素。例如,在上面的假想例子中,地震造成的損害使某些學區(qū)的平均班級規(guī)校增大了,顯然班級規(guī)模的這種變動與影響學生成績的潛在遺漏變量不相關。在實際操作中:尋找工具變量的步驟大致可以分為兩步,(i)列出與內(nèi)生解釋變量(X)相關的盡可能多的變量的清單(這一步較容易);(ii)從這一清單中剔除與擾動項相關的變量(這一步較難)。幾個實例例1。把罪犯關進監(jiān)獄會減少犯罪嗎?要考察的問題:入獄人口增加1%引起的犯罪率的變化。估計這個效應的一種方法是利用美國的州的年度數(shù)據(jù)建立犯罪率對監(jiān)禁率的回歸。此外,該回歸中應該包含一些衡量經(jīng)濟環(huán)境的控制變量,人口統(tǒng)計變量等等。遺漏變量偏差問題:雙向因果偏差:一方面,被監(jiān)禁的人增多使犯罪率下降;但另一方面,犯罪率上升會有更多的人被監(jiān)禁。因此,我們必須選擇工具變量,這個工具變量必須與監(jiān)禁率相關(它必須是相關的),同時也必須與感興趣犯罪率方程中的誤差項無關(它必須是外生的)。Levitt(1996)尋找了以下工具變量:監(jiān)獄容量,即減少監(jiān)獄過分擁擠的訴訟。1。監(jiān)獄過度擁擠訴訟減慢了數(shù)據(jù)中囚犯監(jiān)禁的發(fā)展速度,這表明這個工具變量是相關的。2。監(jiān)獄過度擁擠訴訟是由監(jiān)獄條件而不是由犯罪率或其決定因素導致的程度,我們得出這個工具變量是外生的。例2。縮小班級規(guī)模能提高測試成績嗎?第二篇我們看到了,小班的學校往往比較富有,并且他們的學生也能獲得更多的校內(nèi)和校外學習機會,所以當時我們控制了各種度量學生富裕狀況和英語學習能力等的變量,利用多元回歸解決了遺漏變量偏差的威脅。遺漏變量偏差:但還有可能遺漏掉其他無法獲得的變量,如校外的學習機會等。因此我們需要找到一個工具變量,這個變量與班級規(guī)模相關(相關性),但與組成誤差項的因素(如父母對學習的興趣、課外的學習機會、教師的質(zhì)量和學校設施)等不相關(外生性)。Hoxby(2000)找到的工具變量:出生日期導致的潛在入學人數(shù)距離其長期趨勢的偏差1。這一變量與班級規(guī)模相關。2。這一變量與隨機誤差項不相關。例3。對心臟病的積極治療能延長壽命嗎?模型的設置:被解釋變量是患者期望壽命,解釋變量包括二元治療變量(患者是否接受了心導管術)和其他影響死亡率的控制變量(年齡、體重、其他健康狀況指標等等)。變量內(nèi)生性問題:所有決定接受治療的人都是被認為治療有效的人,如果他們的決定部分取決于數(shù)據(jù)集中沒有包含的但與健康結果有關的不可觀測因素,則治療決定與回歸誤差項相關。McClellan,McNeil和Newhouse(1994)找到的工具變量:地理位置。大部分醫(yī)院都不是專攻心導管術的。因此許多患者到?jīng)]有提供這種治療的“普通”醫(yī)院的距離比到心導管術醫(yī)院的距離近。所以可以把患者的家到最近的心導管術醫(yī)院的距離和到最近的任何類型醫(yī)院的距離之差作為工具變量,若距離最近的醫(yī)院為心導管術醫(yī)院,則距離之差為零,否則取正。如果這個相對距離影響到患者接受這種治療的概率則它是相關的。同時它在患者間是隨機分配的,因此它是外生的。例4:警力與犯罪率。一般認為,警察人數(shù)越多,執(zhí)法力度越大,則犯罪率應該越低。為了度
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年中學教師資格考試《綜合素質(zhì)》教育信息化應用能力高分突破試題集
- 江蘇省徐州市樹人初級中學2025年初三中考全真模擬卷(七)化學試題含解析
- 內(nèi)蒙古能源職業(yè)學院《建筑設備(水)》2023-2024學年第二學期期末試卷
- 湖南長沙縣三中2025年高三下學期考前最后一次模擬生物試題含解析
- 2024年湖南益陽市銀湘集團公司招聘5人筆試參考題庫附帶答案詳解
- 2024年大連石化分公司秋季高校畢業(yè)生招聘180人筆試參考題庫附帶答案詳解
- 2024山東青島東鼎產(chǎn)業(yè)發(fā)展集團有限公司招聘1人筆試參考題庫附帶答案詳解
- 會計人員擔保合同
- 個人租房協(xié)議合同書模板二零二五年
- 房地產(chǎn)買賣中介合同二零二五年
- 2025年東北三省四城市(哈爾濱、沈陽、長春、大連)聯(lián)考暨沈陽市高三質(zhì)量監(jiān)測語文(二)
- (省統(tǒng)測)貴州省2025年4月高三年級適應性考試(選擇性考試科目)地理
- 香港專才移民合同協(xié)議
- 2025-2030中國汽車沖壓件行業(yè)發(fā)展分析及投資前景預測研究報告
- 銷售人員提成及薪酬制度++副本
- 第四章 問題解決策略:特殊化 課件 2024-2025學年北師大版七年級數(shù)學下冊
- 高空清洗施工安全的協(xié)議書6篇
- 口腔科防控課件
- 針對項目實施的重點、難點的分析和解決方案
- 南寧2025年3月高三二模英語試卷
- 2025年駕駛三力測試題及答案
評論
0/150
提交評論