




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第九講第九講 模型設(shè)定和數(shù)據(jù)問題模型設(shè)定和數(shù)據(jù)問題一、函數(shù)形式誤設(shè)一、函數(shù)形式誤設(shè)二、代理變量二、代理變量三、測(cè)量誤差三、測(cè)量誤差四、數(shù)據(jù)缺失、非隨機(jī)樣本和異常觀測(cè)四、數(shù)據(jù)缺失、非隨機(jī)樣本和異常觀測(cè)第一節(jié)第一節(jié) 函數(shù)形式誤設(shè)函數(shù)形式誤設(shè)一、函數(shù)形式誤設(shè)的情形一、函數(shù)形式誤設(shè)的情形 如果如果多元回歸模型沒有正確地刻畫因變量與所觀測(cè)多元回歸模型沒有正確地刻畫因變量與所觀測(cè)的解釋變量之間的關(guān)系,那它就存在函數(shù)形式誤設(shè)問題的解釋變量之間的關(guān)系,那它就存在函數(shù)形式誤設(shè)問題1.遺漏變量遺漏變量 并非所有的遺漏變量都屬于函數(shù)形式誤設(shè)的情形,只有當(dāng)被并非所有的遺漏變量都屬于函數(shù)形式誤設(shè)的情形,只有當(dāng)被遺漏的變
2、量是某一解釋變量的函數(shù)時(shí),我們才稱這種對(duì)變量的遺遺漏的變量是某一解釋變量的函數(shù)時(shí),我們才稱這種對(duì)變量的遺漏為函數(shù)形式誤設(shè)。漏為函數(shù)形式誤設(shè)。 如果模型中遺漏的變量與已有的解釋變量之間存在函數(shù)關(guān)系,如果模型中遺漏的變量與已有的解釋變量之間存在函數(shù)關(guān)系,那么誤差項(xiàng)一定不滿足那么誤差項(xiàng)一定不滿足MLR.4(零條件均值的假定)。因此,在(零條件均值的假定)。因此,在這種情況下,這種情況下,OLS估計(jì)量一定是有偏的。估計(jì)量一定是有偏的。假定真實(shí)模型為:假定真實(shí)模型為:uxxy22110但我們估計(jì)的是:但我們估計(jì)的是:uxy110則有:則有: 1211E 其中,其中, 為變量為變量x2對(duì)變量對(duì)變量x1回歸
3、時(shí)的斜率估計(jì)值,在回歸時(shí)的斜率估計(jì)值,在x2與與x1之間存在函數(shù)關(guān)系時(shí),之間存在函數(shù)關(guān)系時(shí), ,而作為原模型中應(yīng)該有,而作為原模型中應(yīng)該有的變量,的變量, ,因此,在這種情況下,因此,在這種情況下, OLS估計(jì)量一定估計(jì)量一定是有偏的。是有偏的。10102例例1.遺漏了解釋變量的平方項(xiàng)遺漏了解釋變量的平方項(xiàng)工資方程中,正確的方程為:工資方程中,正確的方程為:實(shí)際估計(jì)時(shí)漏掉了實(shí)際估計(jì)時(shí)漏掉了 exper2 ,所以實(shí)際估計(jì)的方程為:,所以實(shí)際估計(jì)的方程為: 這種遺漏所造成的函數(shù)形式誤設(shè)通常會(huì)導(dǎo)致這種遺漏所造成的函數(shù)形式誤設(shè)通常會(huì)導(dǎo)致OLS估計(jì)量有偏,估計(jì)量有偏,即使即使educ的參數(shù)估計(jì)量無(wú)偏,也
4、會(huì)錯(cuò)誤地估計(jì)工作經(jīng)歷對(duì)工資的的參數(shù)估計(jì)量無(wú)偏,也會(huì)錯(cuò)誤地估計(jì)工作經(jīng)歷對(duì)工資的影響,因?yàn)楣ぷ鹘?jīng)歷的實(shí)際回報(bào)率為影響,因?yàn)楣ぷ鹘?jīng)歷的實(shí)際回報(bào)率為 ,但在誤設(shè)的模型中,只計(jì)算了但在誤設(shè)的模型中,只計(jì)算了 。uerereducwage23210expexp)log(uereducwageexp)log(210erexp2322例例9.1 犯罪的經(jīng)濟(jì)模型(犯罪的經(jīng)濟(jì)模型(P294)被解釋變量:被解釋變量:Narr86(1986年被捕次數(shù))年被捕次數(shù))解釋變量:解釋變量: pcnv 以前被定罪比例以前被定罪比例 avgsen 平均判刑期限,平均判刑期限, 單位:月單位:月 tottime 18歲以來的服刑
5、時(shí)間,歲以來的服刑時(shí)間, 單位:月單位:月 ptime86 1986年的服刑時(shí)間,年的服刑時(shí)間, 單位:月單位:月 qemp86 1986年被雇傭季度數(shù)年被雇傭季度數(shù) inc86 1986年合法收入,年合法收入, 單位:百美元單位:百美元 black 如果是黑人,如果是黑人,black=1 hispan 如果是西班牙裔,如果是西班牙裔,hispan=1 _cons . .5 56 68 86 68 85 55 5 . .0 03 36 60 04 46 61 1 1 15 5. .7 78 8 0 0. .0 00 00 0 . .4 49 98 80 00 04 48 8 . .6 63 3
6、9 93 36 66 61 1 hispan . .1 19 93 39 91 14 44 4 . .0 03 39 97 71 11 13 3 4 4. .8 88 8 0 0. .0 00 00 0 . .1 11 16 60 04 46 69 9 . .2 27 71 17 78 81 18 8 black . .3 32 26 65 50 03 35 5 . .0 04 45 54 41 15 56 6 7 7. .1 19 9 0 0. .0 00 00 0 . .2 23 37 74 45 50 08 8 . .4 41 15 55 55 56 61 1 inc86 - -. .0
7、 00 01 14 48 88 87 7 . .0 00 00 03 34 40 06 6 - -4 4. .3 37 7 0 0. .0 00 00 0 - -. .0 00 02 21 15 56 66 6 - -. .0 00 00 08 82 20 07 7 qemp86 - -. .0 05 50 05 53 39 98 8 . .0 01 14 44 43 39 97 7 - -3 3. .5 50 0 0 0. .0 00 00 0 - -. .0 07 78 88 85 53 38 8 - -. .0 02 22 22 22 25 58 8 ptime86 - -. .0 04
8、 40 08 84 41 17 7 . .0 00 08 88 81 12 2 - -4 4. .6 63 3 0 0. .0 00 00 0 - -. .0 05 58 81 12 20 06 6 - -. .0 02 23 35 56 62 27 7 tottime . .0 01 12 20 02 22 24 4 . .0 00 09 94 43 35 52 2 1 1. .2 27 7 0 0. .2 20 03 3 - -. .0 00 06 64 47 78 85 5 . .0 03 30 05 52 23 33 3 avgsen - -. .0 01 11 13 31 17 77
9、 7 . .0 01 12 22 24 40 01 1 - -0 0. .9 92 2 0 0. .3 35 55 5 - -. .0 03 35 53 31 18 85 5 . .0 01 12 26 68 83 31 1 pcnv - -. .1 13 33 32 23 34 44 4 . .0 04 40 03 35 50 02 2 - -3 3. .3 30 0 0 0. .0 00 01 1 - -. .2 21 12 23 35 54 46 6 - -. .0 05 54 41 11 14 41 1 narr86 Coef. Std. Err. t P|t| 95% Conf. I
10、nterval Total 2 20 01 10 0. .3 34 47 71 16 6 2 27 72 24 4 . .7 73 38 80 01 12 29 90 06 6 Root MSE = . .8 82 28 86 65 5 Adj R-squared = 0 0. .0 06 69 96 6 Residual 1 18 86 64 4. .9 95 57 70 05 5 2 27 71 16 6 . .6 68 86 66 65 55 57 76 63 3 R-squared = 0 0. .0 07 72 23 3 Model 1 14 45 5. .3 39 90 01 10
11、 04 4 8 8 1 18 8. .1 17 73 37 76 63 3 Prob F = 0 0. .0 00 00 00 0 F( 8, 2716) = 2 26 6. .4 47 7 Source SS df MS Number of obs = 2 27 72 25 5首先我們將被解釋變量向解釋變量回歸,不包含任何平方項(xiàng)。首先我們將被解釋變量向解釋變量回歸,不包含任何平方項(xiàng)。回歸的結(jié)果如下:回歸的結(jié)果如下: 回歸的結(jié)果表明,除平均判刑期限(回歸的結(jié)果表明,除平均判刑期限(avgsen)和)和18歲以來的歲以來的服刑時(shí)間(服刑時(shí)間(tottime)之外,其他解釋變量均在)之外,其他解釋
12、變量均在1%的水平上顯著,的水平上顯著,但一些變量的系數(shù)符號(hào)似乎有些不合常理。如但一些變量的系數(shù)符號(hào)似乎有些不合常理。如pcnv,ptime86。 從常理理解,以前被定罪比例(從常理理解,以前被定罪比例(pcnv)越高,說明這一樣本)越高,說明這一樣本觀測(cè)點(diǎn)犯罪傾向也就越高,那么其在觀測(cè)點(diǎn)犯罪傾向也就越高,那么其在1986年被捕的次數(shù)也就會(huì)越年被捕的次數(shù)也就會(huì)越多,按照這一假設(shè)和推理,以前被定罪比例(多,按照這一假設(shè)和推理,以前被定罪比例(pcnv)的系數(shù)應(yīng)該)的系數(shù)應(yīng)該為正,但不含平方項(xiàng)的回歸結(jié)果表明這一系數(shù)為負(fù)。為正,但不含平方項(xiàng)的回歸結(jié)果表明這一系數(shù)為負(fù)。 同樣,一般情況下,若某樣本觀測(cè)
13、點(diǎn)在同樣,一般情況下,若某樣本觀測(cè)點(diǎn)在1986年的服刑時(shí)間年的服刑時(shí)間(ptime86)越高,他在)越高,他在1986年被捕的次數(shù)也就會(huì)越多,按照這一年被捕的次數(shù)也就會(huì)越多,按照這一假設(shè)和推理,假設(shè)和推理, 1986年的服刑時(shí)間(年的服刑時(shí)間(ptime86)的系數(shù)也應(yīng)該為正,)的系數(shù)也應(yīng)該為正,但不含平方項(xiàng)的回歸結(jié)果表明這一系數(shù)為負(fù)。但不含平方項(xiàng)的回歸結(jié)果表明這一系數(shù)為負(fù)。 而這些不合常理的系數(shù)卻都高度顯著,因此,我們對(duì)這些解而這些不合常理的系數(shù)卻都高度顯著,因此,我們對(duì)這些解釋變量對(duì)被解釋變量的影響方式必須要進(jìn)一步核準(zhǔn),從而確定他釋變量對(duì)被解釋變量的影響方式必須要進(jìn)一步核準(zhǔn),從而確定他們對(duì)
14、被解釋變量有意義的解釋。們對(duì)被解釋變量有意義的解釋。 _cons . .5 50 04 46 60 06 65 5 . .0 03 36 68 83 35 53 3 1 13 3. .7 70 0 0 0. .0 00 00 0 . .4 43 32 23 37 78 84 4 . .5 57 76 68 83 34 47 7 hispan . .1 16 63 36 61 17 75 5 . .0 03 39 94 45 50 07 7 4 4. .1 15 5 0 0. .0 00 00 0 . .0 08 86 62 26 60 09 9 . .2 24 40 09 97 74 4 bl
15、ack . .2 29 92 22 29 96 6 . .0 04 44 48 83 3 6 6. .5 52 2 0 0. .0 00 00 0 . .2 20 04 43 39 91 16 6 . .3 38 80 02 20 00 04 4 inc86sq 7 7. .1 19 9e e- -0 06 6 2 2. .5 56 6e e- -0 06 6 2 2. .8 81 1 0 0. .0 00 05 5 2 2. .1 17 7e e- -0 06 6 . .0 00 00 00 01 12 22 2 inc86 - -. .0 00 03 34 41 15 52 2 . .0
16、00 00 08 80 03 37 7 - -4 4. .2 25 5 0 0. .0 00 00 0 - -. .0 00 04 49 99 91 12 2 - -. .0 00 01 18 83 39 92 2 qemp86 - -. .0 01 14 40 09 94 41 1 . .0 01 17 73 36 61 12 2 - -0 0. .8 81 1 0 0. .4 41 17 7 - -. .0 04 48 81 13 36 66 6 . .0 01 19 99 94 48 85 5 pt86sq - -. .0 02 29 96 60 07 76 6 . .0 00 03 3
17、8 86 63 34 4 - -7 7. .6 66 6 0 0. .0 00 00 0 - -. .0 03 37 71 18 83 3 - -. .0 02 22 20 03 32 21 1 ptime86 . .2 28 87 74 43 33 34 4 . .0 04 44 42 25 58 82 2 6 6. .4 49 9 0 0. .0 00 00 0 . .2 20 00 06 65 50 01 1 . .3 37 74 42 21 16 66 6 tottime . .0 01 11 19 95 54 4 . .0 00 09 92 28 82 25 5 1 1. .2 29
18、 9 0 0. .1 19 98 8 - -. .0 00 06 62 24 47 74 4 . .0 03 30 01 15 55 54 4 avgsen - -. .0 01 17 70 02 21 16 6 . .0 01 12 20 05 53 39 9 - -1 1. .4 41 1 0 0. .1 15 58 8 - -. .0 04 40 06 65 57 74 4 . .0 00 06 66 61 14 42 2 pcnvsq - -. .7 73 30 02 21 11 19 9 . .1 15 56 61 11 17 77 7 - -4 4. .6 68 8 0 0. .0
19、 00 00 0 - -1 1. .0 03 36 63 33 34 4 - -. .4 42 24 40 09 90 03 3 pcnv . .5 55 52 25 52 23 36 6 . .1 15 54 42 23 37 72 2 3 3. .5 58 8 0 0. .0 00 00 0 . .2 25 50 00 08 89 92 2 . .8 85 54 49 95 58 8 narr86 Coef. Std. Err. t P|t| 95% Conf. Interval Total 2 20 01 10 0. .3 34 47 71 16 6 2 27 72 24 4 . .7
20、73 38 80 01 12 29 90 06 6 Root MSE = . .8 81 15 50 07 7 Adj R-squared = 0 0. .0 09 99 98 8 Residual 1 18 80 02 2. .3 36 68 81 15 5 2 27 71 13 3 . .6 66 64 43 34 45 50 06 6 R-squared = 0 0. .1 10 03 35 5 Model 2 20 07 7. .9 97 79 90 00 08 8 1 11 1 1 18 8. .9 90 07 71 18 82 26 6 Prob F = 0 0. .0 00 00
21、 00 0 F( 11, 2713) = 2 28 8. .4 46 6 Source SS df MS Number of obs = 2 27 72 25 5加入重要變量的平方項(xiàng)之后,回歸結(jié)果如下:加入重要變量的平方項(xiàng)之后,回歸結(jié)果如下: 加入平方項(xiàng)之后,除加入平方項(xiàng)之后,除1986年被雇傭季度數(shù)(年被雇傭季度數(shù)( qemp86 )之外,)之外,各變量的顯著性并沒有太大的影響,而且所有的平方項(xiàng)都是顯著各變量的顯著性并沒有太大的影響,而且所有的平方項(xiàng)都是顯著的,這就意味著不加平方項(xiàng)的模型的確存在誤設(shè)的可能,而且加的,這就意味著不加平方項(xiàng)的模型的確存在誤設(shè)的可能,而且加入平方項(xiàng)之后,相關(guān)變量的
22、系數(shù)也更有意義了。見教材入平方項(xiàng)之后,相關(guān)變量的系數(shù)也更有意義了。見教材P295注意:注意:u如果原模型滿足假定如果原模型滿足假定MLR.4,那么在方程中添加自變量的非線,那么在方程中添加自變量的非線性關(guān)系應(yīng)該是不顯著的;性關(guān)系應(yīng)該是不顯著的;u在例在例9.1中添加了顯著的二次項(xiàng),檢驗(yàn)出函數(shù)形式誤設(shè)定;中添加了顯著的二次項(xiàng),檢驗(yàn)出函數(shù)形式誤設(shè)定;u如果原模型中有許多解釋變量,使用掉大量自由度缺失;如果原模型中有許多解釋變量,使用掉大量自由度缺失;u添加二次項(xiàng)也不能得到被忽視的某種特定非線性關(guān)系;添加二次項(xiàng)也不能得到被忽視的某種特定非線性關(guān)系;例例2.遺漏了解釋變量的交互項(xiàng)遺漏了解釋變量的交互項(xiàng)
23、工資方程中,正確的方程為:工資方程中,正確的方程為:實(shí)際估計(jì)時(shí)漏掉了實(shí)際估計(jì)時(shí)漏掉了 femaleeduc,所以實(shí)際估計(jì)的方程為:,所以實(shí)際估計(jì)的方程為:ueducfemalefemaleerereducwage5423210expexp)log(ufemaleerereducwage423210expexp)log( 在原始模型中,教育的回報(bào)率會(huì)因性別的不同而有所不同,在原始模型中,教育的回報(bào)率會(huì)因性別的不同而有所不同,但這一性質(zhì)在遺漏了交互項(xiàng)的模型中無(wú)法得到體現(xiàn),從而造成但這一性質(zhì)在遺漏了交互項(xiàng)的模型中無(wú)法得到體現(xiàn),從而造成OLS估計(jì)值產(chǎn)生偏誤。估計(jì)值產(chǎn)生偏誤。2.變量形式誤設(shè)變量形式誤設(shè)
24、 當(dāng)模型中一些變量原本應(yīng)該采用對(duì)數(shù)形式,而在實(shí)際回歸過當(dāng)模型中一些變量原本應(yīng)該采用對(duì)數(shù)形式,而在實(shí)際回歸過程中卻錯(cuò)誤地采用了水平形式時(shí),也會(huì)導(dǎo)致模型誤設(shè),從而造成程中卻錯(cuò)誤地采用了水平形式時(shí),也會(huì)導(dǎo)致模型誤設(shè),從而造成OLS估計(jì)值產(chǎn)生偏誤。估計(jì)值產(chǎn)生偏誤。二、函數(shù)形式誤設(shè)的一般檢驗(yàn)(二、函數(shù)形式誤設(shè)的一般檢驗(yàn)(RESET)1.基本思想基本思想 如果原模型滿足如果原模型滿足MLR.4,那么在回歸方程中添加解釋變量的,那么在回歸方程中添加解釋變量的非線性關(guān)系應(yīng)該不顯著。當(dāng)解釋變量較多時(shí),這么做會(huì)產(chǎn)生更多非線性關(guān)系應(yīng)該不顯著。當(dāng)解釋變量較多時(shí),這么做會(huì)產(chǎn)生更多的解釋變量,從而損失很大一部分自由度,因
25、此可以考慮在模型的解釋變量,從而損失很大一部分自由度,因此可以考慮在模型中添加被解釋變量擬合值的平方項(xiàng)或立方項(xiàng)。中添加被解釋變量擬合值的平方項(xiàng)或立方項(xiàng)。估計(jì):估計(jì): y = 0 + 1x1 + + kxk + 12 + 23 +u檢驗(yàn):檢驗(yàn): H0: 1=0, 2 =0用用F統(tǒng)計(jì)量或統(tǒng)計(jì)量或LM統(tǒng)計(jì)量進(jìn)行檢驗(yàn),一個(gè)顯著的統(tǒng)計(jì)量進(jìn)行檢驗(yàn),一個(gè)顯著的F統(tǒng)計(jì)量或者統(tǒng)計(jì)量或者LM統(tǒng)計(jì)量說明函數(shù)形式可能存在問題統(tǒng)計(jì)量說明函數(shù)形式可能存在問題2.使用使用RESET對(duì)模型誤設(shè)檢驗(yàn)時(shí)應(yīng)該注意的問題:對(duì)模型誤設(shè)檢驗(yàn)時(shí)應(yīng)該注意的問題:uRESET在探測(cè)在探測(cè)非線性形式非線性形式的函數(shù)誤設(shè)時(shí)很好用,而不是一般的的函
26、數(shù)誤設(shè)時(shí)很好用,而不是一般的遺漏變量;遺漏變量;uWooldridge在在1995年證明:當(dāng)被遺漏變量的期望值是所包含自年證明:當(dāng)被遺漏變量的期望值是所包含自變量的變量的線性函數(shù)線性函數(shù)時(shí),時(shí),RESET無(wú)法探測(cè)出遺漏變量問題;無(wú)法探測(cè)出遺漏變量問題;u如果正確設(shè)定了模型形式,如果正確設(shè)定了模型形式, RESET對(duì)檢驗(yàn)異方差無(wú)能為力;對(duì)檢驗(yàn)異方差無(wú)能為力;u盡管如此,如果被遺漏變量的期望是自變量的非線性形式時(shí),盡管如此,如果被遺漏變量的期望是自變量的非線性形式時(shí),一個(gè)顯著的一個(gè)顯著的RESET可以指出遺漏變量問題;可以指出遺漏變量問題;u也要注意到,也要注意到,RESET檢驗(yàn)的一個(gè)缺陷是,當(dāng)零
27、假設(shè)被拒絕后,檢驗(yàn)的一個(gè)缺陷是,當(dāng)零假設(shè)被拒絕后,它并不能建議我們下一步怎么做。它并不能建議我們下一步怎么做。例例9.2:住房?jī)r(jià)格方程(:住房?jī)r(jià)格方程(P296)相關(guān)變量為水平值時(shí)的待估方程:相關(guān)變量為水平值時(shí)的待估方程:相關(guān)變量用對(duì)數(shù)形式時(shí)的待估方程為:相關(guān)變量用對(duì)數(shù)形式時(shí)的待估方程為:ubdrmssqrftlotsizeprice3210ubdrmslsqrftllotsizelprice3210uprice (房?jī)r(jià),(房?jī)r(jià), 單位:千美元)單位:千美元)ulotsize (土地的面積,單位:平方英尺)(土地的面積,單位:平方英尺)usqrft (房屋的面積,單位:平方英尺)(房屋的面積,
28、單位:平方英尺)ubdrms (臥室數(shù))(臥室數(shù)). reg price lotsize sqrft bdrms. predict y, xb. gen y2 = y 2. gen y3 = y * y2. reg price lotsize sqrft bdrms y2 y3. test y2 y3 ( 1) y2 = 0 ( 2) y3 = 0 F( 2, 82) = 4.67 Prob F = 0.0120檢驗(yàn)結(jié)果表明:用水平值回歸的模型存在函數(shù)形式誤設(shè)定的問題檢驗(yàn)結(jié)果表明:用水平值回歸的模型存在函數(shù)形式誤設(shè)定的問題u用相關(guān)變量的水平值時(shí)進(jìn)行估計(jì)檢驗(yàn)的結(jié)果:用相關(guān)變量的水平值時(shí)進(jìn)行估計(jì)檢
29、驗(yàn)的結(jié)果:u用相關(guān)變量的對(duì)數(shù)值時(shí)進(jìn)行估計(jì)檢驗(yàn)的結(jié)果:用相關(guān)變量的對(duì)數(shù)值時(shí)進(jìn)行估計(jì)檢驗(yàn)的結(jié)果:. reg lprice llotsize lsqrft bdrms . predict yy, xb. gen yy2 = yy 2. gen yy3 = yy * yy2. reg lprice llotsize lsqrft bdrms yy2 yy3. test yy2 yy3 ( 1) yy2 = 0 ( 2) yy3 = 0 F( 2, 82) = 2.57 Prob F = 0.0831結(jié)果表明:在結(jié)果表明:在5%的水平上無(wú)法拒絕原假設(shè),即采用對(duì)數(shù)形式的回的水平上無(wú)法拒絕原假設(shè),即采用對(duì)數(shù)
30、形式的回歸可能不存在函數(shù)形式誤設(shè)的問題。歸可能不存在函數(shù)形式誤設(shè)的問題。3.對(duì)非嵌套模型的檢驗(yàn)對(duì)非嵌套模型的檢驗(yàn)當(dāng)要檢驗(yàn)兩個(gè)非嵌套模型:當(dāng)要檢驗(yàn)兩個(gè)非嵌套模型:到底哪一個(gè)才是正確的時(shí)候,有一下兩種方法:到底哪一個(gè)才是正確的時(shí)候,有一下兩種方法:uxxyuxxy2211022110)log()log(1)構(gòu)造一個(gè)綜合模型:)構(gòu)造一個(gè)綜合模型:uxxxxy)log()log(241322110u我們可以檢驗(yàn)我們可以檢驗(yàn)H0: , 作為對(duì)水平值模型的檢驗(yàn);作為對(duì)水平值模型的檢驗(yàn);0,043u我們可以檢驗(yàn)我們可以檢驗(yàn)H0: , 作為對(duì)對(duì)數(shù)模型的檢驗(yàn);作為對(duì)對(duì)數(shù)模型的檢驗(yàn);0,0212)Davidson
31、-Mackinnon檢驗(yàn):檢驗(yàn): 如果水平值模型是正確的,則從對(duì)數(shù)模型中得到的擬合值在如果水平值模型是正確的,則從對(duì)數(shù)模型中得到的擬合值在水平值模型中應(yīng)該是不顯著的。水平值模型中應(yīng)該是不顯著的。因此,基于方程:因此,基于方程: (其中,(其中, 為從對(duì)數(shù)模型中得到的擬合值)為從對(duì)數(shù)模型中得到的擬合值)中中 的的t統(tǒng)計(jì)量是否顯著,就可以決定是否拒絕水平值模型;統(tǒng)計(jì)量是否顯著,就可以決定是否拒絕水平值模型;反過來,也可以按照這種方法檢驗(yàn)對(duì)數(shù)模型正確與否。反過來,也可以按照這種方法檢驗(yàn)對(duì)數(shù)模型正確與否。uyxxy122110y 13)非嵌套檢驗(yàn)的注意問題:)非嵌套檢驗(yàn)的注意問題: 不一定會(huì)出現(xiàn)一個(gè)明
32、顯好的模型。兩個(gè)模型可能都被拒絕,不一定會(huì)出現(xiàn)一個(gè)明顯好的模型。兩個(gè)模型可能都被拒絕,也可能沒有一個(gè)被拒絕;也可能沒有一個(gè)被拒絕; 如果用如果用DM檢驗(yàn)拒絕了水平值模型,這并不意味著對(duì)數(shù)模型檢驗(yàn)拒絕了水平值模型,這并不意味著對(duì)數(shù)模型就是正確的模型,顯著性的結(jié)論可能來自于其他形式的函數(shù)就是正確的模型,顯著性的結(jié)論可能來自于其他形式的函數(shù)形式誤設(shè)。形式誤設(shè)。u若兩個(gè)模型都無(wú)法被拒絕:我們可以用調(diào)整若兩個(gè)模型都無(wú)法被拒絕:我們可以用調(diào)整R2來對(duì)模型進(jìn)來對(duì)模型進(jìn)行取舍;行取舍;u若兩個(gè)模型都被拒絕:檢驗(yàn)的結(jié)果并不能告訴我們下一步若兩個(gè)模型都被拒絕:檢驗(yàn)的結(jié)果并不能告訴我們下一步該怎么做,而如果關(guān)鍵自變
33、量在經(jīng)濟(jì)意義上對(duì)因變量的影響該怎么做,而如果關(guān)鍵自變量在經(jīng)濟(jì)意義上對(duì)因變量的影響并不顯著,則使用哪個(gè)模型實(shí)際上無(wú)關(guān)緊要并不顯著,則使用哪個(gè)模型實(shí)際上無(wú)關(guān)緊要第二節(jié)第二節(jié) 代理變量代理變量一、使用代理變量的原因一、使用代理變量的原因 在實(shí)際回歸的過程中,常常會(huì)遇到有些關(guān)鍵變量我們無(wú)法觀在實(shí)際回歸的過程中,常常會(huì)遇到有些關(guān)鍵變量我們無(wú)法觀測(cè)到的情況,但這些無(wú)法觀測(cè)到的變量對(duì)于回歸來說又是非常必測(cè)到的情況,但這些無(wú)法觀測(cè)到的變量對(duì)于回歸來說又是非常必要的,如果將其放到誤差項(xiàng)里面,就會(huì)導(dǎo)致其他參數(shù)的估計(jì)有偏要的,如果將其放到誤差項(xiàng)里面,就會(huì)導(dǎo)致其他參數(shù)的估計(jì)有偏和不一致和不一致。 在這種情況下,如果能
34、夠在這種情況下,如果能夠找到一個(gè)可以間接度量這一變量的找到一個(gè)可以間接度量這一變量的代理變量進(jìn)行回歸,就可以保證其他變量的參數(shù)回歸是無(wú)偏的。代理變量進(jìn)行回歸,就可以保證其他變量的參數(shù)回歸是無(wú)偏的。 代理變量就是與我們?cè)诜治鲋性噲D控制而又觀測(cè)不到的變量代理變量就是與我們?cè)诜治鲋性噲D控制而又觀測(cè)不到的變量相關(guān)的、能夠代替這一變量進(jìn)行回歸的變量。相關(guān)的、能夠代替這一變量進(jìn)行回歸的變量。 個(gè)人能力個(gè)人能力abil肯定會(huì)對(duì)工資水平肯定會(huì)對(duì)工資水平log(wage)產(chǎn)生影響,但個(gè)人產(chǎn)生影響,但個(gè)人能力能力abil常常難以測(cè)度,或者根本無(wú)法獲得。如果個(gè)人能力常常難以測(cè)度,或者根本無(wú)法獲得。如果個(gè)人能力abi
35、l與與其受教育水平其受教育水平educ相關(guān),那么,因?yàn)橄嚓P(guān),那么,因?yàn)閍bil無(wú)法測(cè)度而將其放入隨無(wú)法測(cè)度而將其放入隨機(jī)誤差項(xiàng),必然導(dǎo)致參數(shù)估計(jì)有偏。機(jī)誤差項(xiàng),必然導(dǎo)致參數(shù)估計(jì)有偏。 如果能夠找到一個(gè)大致反映能力高低又方便測(cè)度的變量來代如果能夠找到一個(gè)大致反映能力高低又方便測(cè)度的變量來代替?zhèn)€人能力替?zhèn)€人能力abil參與回歸,就能夠解決參數(shù)估計(jì)有偏的問題。參與回歸,就能夠解決參數(shù)估計(jì)有偏的問題。 具體就工資方程而言,常見的個(gè)人能力具體就工資方程而言,常見的個(gè)人能力abil的替代變量為的替代變量為IQ,我們并不要求我們并不要求IQ能夠準(zhǔn)確無(wú)誤地反應(yīng)一個(gè)人的能力水平,只要其能夠準(zhǔn)確無(wú)誤地反應(yīng)一個(gè)人的
36、能力水平,只要其與個(gè)人能力相關(guān)就可以了。與個(gè)人能力相關(guān)就可以了。例如,在工資方程中:例如,在工資方程中:uabilereducwage3210exp)log(二、引入代理變量的具體方法二、引入代理變量的具體方法例如,要回歸的模型為:例如,要回歸的模型為:uxxxy*3322110但其中變量但其中變量x3*的數(shù)據(jù)觀測(cè)不到,但該變量對(duì)模型至關(guān)重要,如果的數(shù)據(jù)觀測(cè)不到,但該變量對(duì)模型至關(guān)重要,如果在模型中舍去這一變量,將會(huì)引起回歸的結(jié)果有偏。在模型中舍去這一變量,將會(huì)引起回歸的結(jié)果有偏。如果可觀測(cè)的變量如果可觀測(cè)的變量x3與之間存在相關(guān)關(guān)系:與之間存在相關(guān)關(guān)系:3330*3vxx其中其中 v3是變量
37、是變量x3與變量與變量x3*并非完全相關(guān)所導(dǎo)致的誤差,參數(shù)并非完全相關(guān)所導(dǎo)致的誤差,參數(shù)3度度量了變量量了變量x3與變量與變量x3*之間的關(guān)系。之間的關(guān)系。通常情況下,我們會(huì)認(rèn)為變量通常情況下,我們會(huì)認(rèn)為變量x3與變量與變量x3*正相關(guān),所以正相關(guān),所以 3 0;但如果但如果 3 =0 ,則意味著則意味著x3并不是并不是x3*合適的代理變量。合適的代理變量。 選擇代理變量之后,將變量選擇代理變量之后,將變量x3當(dāng)做變量當(dāng)做變量x3*帶入模型進(jìn)行回帶入模型進(jìn)行回歸估計(jì),這種處理無(wú)法觀測(cè)解釋變量的方法稱為遺漏變量問題的歸估計(jì),這種處理無(wú)法觀測(cè)解釋變量的方法稱為遺漏變量問題的植入解植入解(plug-
38、in solution to the omitted variables problem)。 這種方法雖然解決了因?yàn)槟骋唤忉屪兞繜o(wú)法觀測(cè)而可能造這種方法雖然解決了因?yàn)槟骋唤忉屪兞繜o(wú)法觀測(cè)而可能造成的遺漏變量的問題,但代理變量畢竟不同于原始變量,要想通成的遺漏變量的問題,但代理變量畢竟不同于原始變量,要想通過采用代理變量的方法獲得一致的估計(jì)量,還需如下假設(shè):過采用代理變量的方法獲得一致的估計(jì)量,還需如下假設(shè):3303*3321*3*321,0,xxxExxxxExxxuEu當(dāng)這兩個(gè)假設(shè)不滿足時(shí),我們不能得到一致的估計(jì)量當(dāng)這兩個(gè)假設(shè)不滿足時(shí),我們不能得到一致的估計(jì)量比如比如x3* = 0 + 1x
39、1 + 2x2 + d3x3 + v3實(shí)際上,我們可以估計(jì):實(shí)際上,我們可以估計(jì):y = ( 0 3 3 0 0) + ( 1 1 3 3 1 1) x1+ ( 2 2 3 3 2 2) x2 + 3 3 3 3x3 + (u + 3 3v3)偏誤方向?qū)⒁蕾囉谄`方向?qū)⒁蕾囉?3 3 和和 j的符號(hào)的符號(hào)u當(dāng)這兩個(gè)假設(shè)被滿足,我們作回歸:當(dāng)這兩個(gè)假設(shè)被滿足,我們作回歸:y = ( 0 + 3 0) + 1x1+ 2x2 + 3 3x3 + (u + 3v3) 只要重新定義截距項(xiàng),誤差項(xiàng)和只要重新定義截距項(xiàng),誤差項(xiàng)和x3系數(shù),即可得到一致的估計(jì)量系數(shù),即可得到一致的估計(jì)量例例9.3 IQ作為能力
40、的代理變量(作為能力的代理變量(P300)三、用滯后變量作為代理變量三、用滯后變量作為代理變量 在實(shí)際研究中,有時(shí)即使知道隨機(jī)誤差項(xiàng)中包含某個(gè)觀測(cè)不在實(shí)際研究中,有時(shí)即使知道隨機(jī)誤差項(xiàng)中包含某個(gè)觀測(cè)不到的變量與一個(gè)或多個(gè)解釋變量相關(guān),從而導(dǎo)致參數(shù)估計(jì)有偏,到的變量與一個(gè)或多個(gè)解釋變量相關(guān),從而導(dǎo)致參數(shù)估計(jì)有偏,但是對(duì)于怎樣選取一個(gè)合適的代理變量卻無(wú)從下手但是對(duì)于怎樣選取一個(gè)合適的代理變量卻無(wú)從下手 此時(shí),用過去的因變量(或稱滯后因變量)作為代理變量,此時(shí),用過去的因變量(或稱滯后因變量)作為代理變量,在許多應(yīng)用中可以得到很好的效果在許多應(yīng)用中可以得到很好的效果例例9.4 城市犯罪率(城市犯罪率
41、(P303)第三節(jié)第三節(jié) 測(cè)量誤差測(cè)量誤差一、出現(xiàn)測(cè)量誤差的原因一、出現(xiàn)測(cè)量誤差的原因 當(dāng)我們不能精確度量一個(gè)回歸模型中的經(jīng)濟(jì)變量,就可能存當(dāng)我們不能精確度量一個(gè)回歸模型中的經(jīng)濟(jì)變量,就可能存在測(cè)量誤差問題。在測(cè)量誤差問題。 比如,我們調(diào)查得到的收入或支出數(shù)據(jù)是人們報(bào)告的,但每比如,我們調(diào)查得到的收入或支出數(shù)據(jù)是人們報(bào)告的,但每個(gè)人都不可能完全地知道自己的真實(shí)收入和支出;即使知道也可個(gè)人都不可能完全地知道自己的真實(shí)收入和支出;即使知道也可能會(huì)隱瞞能會(huì)隱瞞二、測(cè)量誤差與不可觀測(cè)變量的異同之處二、測(cè)量誤差與不可觀測(cè)變量的異同之處u第一,在觀測(cè)不到的變量情形中,我們無(wú)法準(zhǔn)確地度量它,第一,在觀測(cè)不到
42、的變量情形中,我們無(wú)法準(zhǔn)確地度量它,而只能找到與它存在某些相關(guān)的代理變量;而測(cè)量誤差情形而只能找到與它存在某些相關(guān)的代理變量;而測(cè)量誤差情形中,變量具有完好的定量含義,只是我們對(duì)它測(cè)量的記錄可中,變量具有完好的定量含義,只是我們對(duì)它測(cè)量的記錄可能包含了誤差能包含了誤差u第二,在測(cè)量誤差問題中,被誤測(cè)的自變量是我們關(guān)注的第二,在測(cè)量誤差問題中,被誤測(cè)的自變量是我們關(guān)注的焦點(diǎn);在代理變量情形中,被遺漏變量的偏效應(yīng)本身很少成焦點(diǎn);在代理變量情形中,被遺漏變量的偏效應(yīng)本身很少成為我們關(guān)注的核心,我們關(guān)注的是其他自變量的影響為我們關(guān)注的核心,我們關(guān)注的是其他自變量的影響三、因變量存在測(cè)量誤差的情形三、因
43、變量存在測(cè)量誤差的情形假定我們要回歸的模型:假定我們要回歸的模型:uxxxykk22110*滿足高斯?jié)M足高斯-馬爾科夫假定,但因?yàn)榇嬖跍y(cè)量誤差,因變量馬爾科夫假定,但因?yàn)榇嬖跍y(cè)量誤差,因變量y*和它的和它的觀測(cè)值觀測(cè)值y之間存在測(cè)量誤差之間存在測(cè)量誤差e0 = y y* 因此,我們實(shí)際估計(jì)的模型為:因此,我們實(shí)際估計(jì)的模型為:022110euxxxykk由于原模型滿足高斯由于原模型滿足高斯-馬爾科夫假定,對(duì)原模型的馬爾科夫假定,對(duì)原模型的OLS估計(jì)將是估計(jì)將是無(wú)偏的,但在實(shí)際估計(jì)的過程中,我們只能觀測(cè)到無(wú)偏的,但在實(shí)際估計(jì)的過程中,我們只能觀測(cè)到y(tǒng),而不是真,而不是真實(shí)的實(shí)的y*,誤差的存在使
44、得我們不得不考慮:這樣一種替代是否能,誤差的存在使得我們不得不考慮:這樣一種替代是否能夠得到一致的估計(jì)量。夠得到一致的估計(jì)量。1.因變量為水平值形式因變量為水平值形式 在實(shí)際估計(jì)的模型中,誤差項(xiàng)在實(shí)際估計(jì)的模型中,誤差項(xiàng)u+e0如果也滿足零條件均值的如果也滿足零條件均值的假定,假定,OLS估計(jì)量將和原模型的性質(zhì)一樣好,因?yàn)樵P椭械恼`估計(jì)量將和原模型的性質(zhì)一樣好,因?yàn)樵P椭械恼`差項(xiàng)差項(xiàng)u滿足令條件均值假定。因此,如果測(cè)量誤差滿足令條件均值假定。因此,如果測(cè)量誤差e0也滿足零條件也滿足零條件均值的假定,那么實(shí)際估計(jì)模型中的誤差項(xiàng)均值的假定,那么實(shí)際估計(jì)模型中的誤差項(xiàng)u+e0就滿足零條件均就滿足
45、零條件均值的假定。從而,從實(shí)際模型中得到的值的假定。從而,從實(shí)際模型中得到的OLS估計(jì)量就是無(wú)偏和一估計(jì)量就是無(wú)偏和一致的,相應(yīng)的統(tǒng)計(jì)推斷也都是有效的。致的,相應(yīng)的統(tǒng)計(jì)推斷也都是有效的。 在這種情況下,實(shí)際估計(jì)模型中的誤差項(xiàng)方差:在這種情況下,實(shí)際估計(jì)模型中的誤差項(xiàng)方差: 如果測(cè)量誤差如果測(cè)量誤差e0不滿足零條件均值的假定,那么只有截距項(xiàng)不滿足零條件均值的假定,那么只有截距項(xiàng)會(huì)是一個(gè)有偏的估計(jì)量,通常情況下,這一偏誤并不會(huì)對(duì)我們的會(huì)是一個(gè)有偏的估計(jì)量,通常情況下,這一偏誤并不會(huì)對(duì)我們的解釋產(chǎn)生太大的影響。解釋產(chǎn)生太大的影響。2220)(ueueuVar也就是說,雖然估計(jì)量無(wú)偏,但我們面臨著更大
46、的估計(jì)量方差。也就是說,雖然估計(jì)量無(wú)偏,但我們面臨著更大的估計(jì)量方差。2.因變量為對(duì)數(shù)值形式因變量為對(duì)數(shù)值形式在因變量為對(duì)數(shù)值形式時(shí),假定我們要回歸的模型:在因變量為對(duì)數(shù)值形式時(shí),假定我們要回歸的模型: uxxxykk22110*log在存在測(cè)量誤差的情況下,實(shí)際回歸的模型:在存在測(cè)量誤差的情況下,實(shí)際回歸的模型: 022110logeuxxxykk測(cè)量誤差為測(cè)量誤差為倍乘測(cè)量誤差(倍乘測(cè)量誤差(multiplicative measurement error))log(, 0,0000*aeaayy其中,只要這樣一個(gè)測(cè)量誤差與解釋變量不相關(guān),只要這樣一個(gè)測(cè)量誤差與解釋變量不相關(guān),OLS估計(jì)量
47、同樣是估計(jì)量同樣是無(wú)偏和一致的。無(wú)偏和一致的。四、自變量存在測(cè)量誤差的情形四、自變量存在測(cè)量誤差的情形假定我們要回歸的模型:假定我們要回歸的模型:uxy*110至少滿足至少滿足MLR.1-MLR.4,但因?yàn)榇嬖跍y(cè)量誤差,自變量,但因?yàn)榇嬖跍y(cè)量誤差,自變量x1*和它和它的觀測(cè)值的觀測(cè)值x1之間存在測(cè)量誤差之間存在測(cè)量誤差e1 = x1 x1* ,假定總體中平均的測(cè),假定總體中平均的測(cè)量誤差為零,也就是量誤差為零,也就是E(e1 )=0。1.簡(jiǎn)單回歸模型條件下簡(jiǎn)單回歸模型條件下而且,我們還假定,而且,我們還假定,原模型中的誤差項(xiàng)原模型中的誤差項(xiàng)u不僅與變量不僅與變量x1*不相關(guān),不相關(guān),與其觀測(cè)值
48、與其觀測(cè)值x1也不相關(guān),此時(shí),也不相關(guān),此時(shí), x1可以取代可以取代x1*放入原模型進(jìn)行放入原模型進(jìn)行OLS估計(jì),實(shí)際估計(jì)方程為:估計(jì),實(shí)際估計(jì)方程為:11110euxy 雖然我們前面假定過雖然我們前面假定過原模型中的誤差項(xiàng)原模型中的誤差項(xiàng)u不僅與變量不僅與變量x1*不相不相關(guān),與其觀測(cè)值關(guān),與其觀測(cè)值x1也不相關(guān),但新的誤差項(xiàng)中包含了測(cè)量誤差也不相關(guān),但新的誤差項(xiàng)中包含了測(cè)量誤差e1 ,因此,實(shí)際估計(jì)方程中因此,實(shí)際估計(jì)方程中OLS估計(jì)量的性質(zhì)依賴于我們對(duì)估計(jì)量的性質(zhì)依賴于我們對(duì)e1和和x1相關(guān)相關(guān)性的假設(shè):性的假設(shè):11eu111011 111 122221 11(1)cov(,)0()0
49、,cov(,)0,cov()ueux eE uex ueue 時(shí),可以得到和的無(wú)偏和一致估計(jì), 因?yàn)榍?但方差的誤差變大了,+在實(shí)際估計(jì)的模型中,誤差項(xiàng)為:在實(shí)際估計(jì)的模型中,誤差項(xiàng)為:11111222111111 11111 1211 1111111(2),cov(,)()()()0,=cov(,)=lim()eeexexxex eE x eE x eE euexuex eOLSp ,經(jīng)典的含誤差變量(CEV)假定:cov()=0 自變量與測(cè)量誤差肯定相關(guān),因此自變量與合成誤差也必然 相關(guān) cov( ,),co 此時(shí)估計(jì)量是有偏而又不一致的 11111111111 1122211111222
50、2221111var()(1)()0,eexeeexxxxuexOLS v( ,) 此時(shí)估計(jì)量比更加接近于我們稱這一偏誤為衰減偏誤。 若為正,傾向于低估。 測(cè)量誤差測(cè)量誤差e1與變量的實(shí)際觀測(cè)值與變量的實(shí)際觀測(cè)值x1無(wú)關(guān),就意味著無(wú)關(guān),就意味著OLS估計(jì)量估計(jì)量具備全部?jī)?yōu)良性質(zhì)。更多的情況下,測(cè)量誤差具備全部?jī)?yōu)良性質(zhì)。更多的情況下,測(cè)量誤差e1雖然與變量雖然與變量x1*無(wú)無(wú)關(guān),但與實(shí)際觀測(cè)值關(guān),但與實(shí)際觀測(cè)值x1有關(guān),這將會(huì)使實(shí)際回歸模型不滿足零條有關(guān),這將會(huì)使實(shí)際回歸模型不滿足零條件均值的假定,件均值的假定, OLS估計(jì)量會(huì)產(chǎn)生偏誤。估計(jì)量會(huì)產(chǎn)生偏誤。2.多元回歸模型條件下多元回歸模型條件下
51、考慮三個(gè)解釋變量的回歸模型:考慮三個(gè)解釋變量的回歸模型:uxxxy3322*110自變量自變量x1*和它的觀測(cè)值和它的觀測(cè)值x1之間存在測(cè)量誤差之間存在測(cè)量誤差e1 = x1 x1* 因此,實(shí)際估計(jì)方程為:因此,實(shí)際估計(jì)方程為:113322110euxxxyu當(dāng)測(cè)量誤差當(dāng)測(cè)量誤差e1與實(shí)際觀測(cè)值與實(shí)際觀測(cè)值x1無(wú)關(guān)時(shí),無(wú)關(guān)時(shí),OLS估計(jì)同樣是無(wú)偏的。估計(jì)同樣是無(wú)偏的。u當(dāng)測(cè)量誤差當(dāng)測(cè)量誤差e1與實(shí)際觀測(cè)值與實(shí)際觀測(cè)值x1相關(guān)時(shí),相關(guān)時(shí),OLS估計(jì)有偏:估計(jì)有偏: 22211*1*1limerrp其中:其中:r1*為方程:為方程:x1*=0+2x2+3x3+ r1*中的總體偏誤中的總體偏誤當(dāng)當(dāng)x
52、1*與與x2和和x3不相關(guān)時(shí),不相關(guān)時(shí), 和和 是一致的,但這種情況極少是一致的,但這種情況極少出現(xiàn),一般情況下,所有參數(shù)的估計(jì)值都是有偏和不一致的。出現(xiàn),一般情況下,所有參數(shù)的估計(jì)值都是有偏和不一致的。23第四節(jié)第四節(jié) 數(shù)據(jù)缺失、非隨機(jī)樣本和異常觀測(cè)數(shù)據(jù)缺失、非隨機(jī)樣本和異常觀測(cè)一、數(shù)據(jù)缺失一、數(shù)據(jù)缺失u如果一個(gè)樣本缺失了其因變量或自變量中的部分?jǐn)?shù)據(jù),那么這如果一個(gè)樣本缺失了其因變量或自變量中的部分?jǐn)?shù)據(jù),那么這個(gè)樣本就不能用到回歸分析中。實(shí)際上個(gè)樣本就不能用到回歸分析中。實(shí)際上stata會(huì)直接把缺失數(shù)據(jù)的會(huì)直接把缺失數(shù)據(jù)的樣本觀測(cè)點(diǎn)直接忽略掉,然后進(jìn)行回歸。樣本觀測(cè)點(diǎn)直接忽略掉,然后進(jìn)行回歸
53、。u如果數(shù)據(jù)缺失是隨機(jī)的,那么僅僅相當(dāng)于相當(dāng)于減小了樣本容如果數(shù)據(jù)缺失是隨機(jī)的,那么僅僅相當(dāng)于相當(dāng)于減小了樣本容量,可能因?yàn)闃颖救萘繙p小而使得估計(jì)量的準(zhǔn)確度下降,但并不量,可能因?yàn)闃颖救萘繙p小而使得估計(jì)量的準(zhǔn)確度下降,但并不會(huì)影響估計(jì)量的無(wú)偏性;會(huì)影響估計(jì)量的無(wú)偏性;u但如果數(shù)據(jù)的缺失并不是隨機(jī)的,就會(huì)使得回歸中使用的樣本但如果數(shù)據(jù)的缺失并不是隨機(jī)的,就會(huì)使得回歸中使用的樣本不滿足不滿足隨機(jī)抽樣隨機(jī)抽樣的假定,從而造成估計(jì)的偏誤。的假定,從而造成估計(jì)的偏誤。二、非隨機(jī)樣本二、非隨機(jī)樣本 一般情況下,因?yàn)閿?shù)據(jù)缺失而導(dǎo)致樣本非隨機(jī),或者因?yàn)闃右话闱闆r下,因?yàn)閿?shù)據(jù)缺失而導(dǎo)致樣本非隨機(jī),或者因?yàn)闃颖颈?/p>
54、身就存在非隨機(jī)現(xiàn)象,都會(huì)使得回歸不滿足本本身就存在非隨機(jī)現(xiàn)象,都會(huì)使得回歸不滿足MLR.2非隨機(jī)抽非隨機(jī)抽樣的假定時(shí),樣的假定時(shí),OLS估計(jì)會(huì)存在偏誤。但在某些特定情況下,非隨估計(jì)會(huì)存在偏誤。但在某些特定情況下,非隨機(jī)樣本即便是不滿足非隨機(jī)抽樣的假定,也不會(huì)導(dǎo)致機(jī)樣本即便是不滿足非隨機(jī)抽樣的假定,也不會(huì)導(dǎo)致OLS估計(jì)出估計(jì)出現(xiàn)偏誤和不一致的情況。現(xiàn)偏誤和不一致的情況。1.外生樣本選擇不會(huì)導(dǎo)致外生樣本選擇不會(huì)導(dǎo)致OLS估計(jì)出現(xiàn)偏誤估計(jì)出現(xiàn)偏誤u基于自變量的樣本選擇(例如儲(chǔ)蓄函數(shù)和基于自變量的樣本選擇(例如儲(chǔ)蓄函數(shù)和IQ的例子的例子P313););u決定樣本選擇的因素獨(dú)立于總體方程中的誤差項(xiàng)。決定
55、樣本選擇的因素獨(dú)立于總體方程中的誤差項(xiàng)。 2.內(nèi)生樣本選擇會(huì)導(dǎo)致內(nèi)生樣本選擇會(huì)導(dǎo)致OLS估計(jì)出現(xiàn)偏誤和不一致(估計(jì)出現(xiàn)偏誤和不一致(P313-314)u基于因變量的樣本選擇:基于因變量某個(gè)特定范圍選擇樣本;基于因變量的樣本選擇:基于因變量某個(gè)特定范圍選擇樣本;u故意得到總體的非隨機(jī)樣本,如分層抽樣中分層是內(nèi)生時(shí)。故意得到總體的非隨機(jī)樣本,如分層抽樣中分層是內(nèi)生時(shí)。 三、異常觀測(cè)三、異常觀測(cè)u如果如果OLS估計(jì)受一個(gè)或幾個(gè)觀測(cè)值的影響,就稱存在異常數(shù)據(jù)。估計(jì)受一個(gè)或幾個(gè)觀測(cè)值的影響,就稱存在異常數(shù)據(jù)。u如果將某一個(gè)或幾個(gè)觀測(cè)點(diǎn)從回歸分析中去掉后,如果將某一個(gè)或幾個(gè)觀測(cè)點(diǎn)從回歸分析中去掉后,OLS
56、估計(jì)發(fā)估計(jì)發(fā)生較為明顯的變化,這一個(gè)或幾個(gè)觀測(cè)點(diǎn)就是異常數(shù)據(jù)。生較為明顯的變化,這一個(gè)或幾個(gè)觀測(cè)點(diǎn)就是異常數(shù)據(jù)。1.異常觀測(cè)的定義及判斷方法異常觀測(cè)的定義及判斷方法2.異常觀測(cè)出現(xiàn)的原因主要有兩個(gè):異常觀測(cè)出現(xiàn)的原因主要有兩個(gè):u數(shù)據(jù)錄入有誤;數(shù)據(jù)錄入有誤;u總體較小,且總體中一個(gè)或幾個(gè)元素與其他元素差異很大。總體較小,且總體中一個(gè)或幾個(gè)元素與其他元素差異很大。3.異常觀測(cè)的影響及處理異常觀測(cè)的影響及處理u異常觀測(cè)可能帶來參數(shù)估計(jì)的偏誤,也可能因?yàn)樵鰪?qiáng)了解釋異常觀測(cè)可能帶來參數(shù)估計(jì)的偏誤,也可能因?yàn)樵鰪?qiáng)了解釋變量的變異而提供重要信息,因而決定異常觀測(cè)的去留是一個(gè)變量的變異而提供重要信息,因而決
57、定異常觀測(cè)的去留是一個(gè)復(fù)雜的問題復(fù)雜的問題;u當(dāng)一個(gè)或幾個(gè)數(shù)據(jù)點(diǎn)會(huì)顯著改變結(jié)論時(shí),應(yīng)同時(shí)報(bào)告包括和當(dāng)一個(gè)或幾個(gè)數(shù)據(jù)點(diǎn)會(huì)顯著改變結(jié)論時(shí),應(yīng)同時(shí)報(bào)告包括和不包括這些異常觀測(cè)的不包括這些異常觀測(cè)的OLS結(jié)果。如果根據(jù)直覺可以判斷潛在的結(jié)果。如果根據(jù)直覺可以判斷潛在的異常觀測(cè)值,就能決定是否去掉這個(gè)觀測(cè)值異常觀測(cè)值,就能決定是否去掉這個(gè)觀測(cè)值。例例9.8 R&D的強(qiáng)度與企業(yè)規(guī)模(的強(qiáng)度與企業(yè)規(guī)模(P315)被解釋變量:被解釋變量:rdintens: R&D支出占銷售額的百分比支出占銷售額的百分比解釋變量:解釋變量: sales: 企業(yè)銷售額(百萬(wàn)美元)企業(yè)銷售額(百萬(wàn)美元) profmarg: 利潤(rùn)占銷售的百分比利潤(rùn)占銷售的百分比 _cons 2 2. .6 62 25 52 26 61 1 . .5 58 85 55 53 32 28 8 4 4. .4 48 8 0 0. .0 00 00 0 1 1. .4 42 27 77 71 12 2 3 3. .8 82 22 28 81 1 profmarg . .0 04 44 46 61 16 66 6 . .0 04 46 61 18 80 05 5 0 0. .9 97 7 0 0. .3 34 42 2 - -. .0 04 49 9
溫馨提示
- 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年人教版小升初數(shù)學(xué)專項(xiàng)訓(xùn)練-雞兔同籠(含答案)
- 精彩視頻分享廣告設(shè)計(jì)師試題及答案
- 2024紡織品設(shè)計(jì)師證書考試重要試題及答案
- 生理學(xué)解剖試題及答案
- 冰雕設(shè)計(jì)考試題及答案
- 保密在線考試題庫(kù)及答案
- .net專業(yè)面試題目及答案
- 市場(chǎng)競(jìng)爭(zhēng)下的紡織研發(fā)戰(zhàn)略試題及答案
- 開發(fā)潛能的廣告設(shè)計(jì)師考試試題及答案
- 新聞夜航考試題及答案
- 韋氏測(cè)試題及答案
- 歷年貴州特崗試題及答案
- 2025怎樣正確理解全過程人民民主的歷史邏輯、實(shí)踐邏輯與理論邏輯?(答案3份)
- 國(guó)家開放大學(xué)《工具書與文獻(xiàn)檢索》形考任務(wù)1-4參考答案及作業(yè)1
- GB/T 45501-2025工業(yè)機(jī)器人三維視覺引導(dǎo)系統(tǒng)通用技術(shù)要求
- 淺談南京市區(qū)地形地貌和工程地質(zhì)層構(gòu)成
- 北師大版四年級(jí)數(shù)學(xué)下冊(cè)第五單元 認(rèn)識(shí)方程標(biāo)準(zhǔn)檢測(cè)卷(含答案)
- 人工智能在環(huán)保領(lǐng)域的應(yīng)用及挑戰(zhàn)
- 2025年陜西省初中學(xué)業(yè)水平考試英語(yǔ) 例析與指導(dǎo) 試卷示例題答案及聽力材料
- 泉州地理會(huì)考題目及答案
- 2025年工會(huì)知識(shí)競(jìng)賽題庫(kù)200題及答案(完整版)
評(píng)論
0/150
提交評(píng)論