




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、如果回歸模型的解釋變量中含有定性變量,則可以用虛擬變量處理之。在實(shí)際經(jīng)濟(jì)問(wèn)題中,被解釋變量也可能是定性變量。如通過(guò)一系列解釋變量的觀測(cè)值觀察人們對(duì)某項(xiàng)動(dòng)議的態(tài)度,某件事情的成功和失敗等。當(dāng)被解釋變量為定性變量時(shí)怎樣建立模型呢?這就是要介紹的二元選擇模型或多元選擇模型,統(tǒng)稱離散選擇模型。這里主要介紹Tobit(線性概率)模型,Probit(概率單位)模型和Logit模型。1Tobit(線性概率)模型Tobit模型的形式如下,yi = a + b xi+ui (1)其中ui為隨機(jī)誤差項(xiàng),xi為定量解釋變量。yi為二元選擇變量。此模型由James Tobin 1958年提出,因此得名。如利息稅、機(jī)動(dòng)
2、車的費(fèi)改稅問(wèn)題等。設(shè) 1 (若是第一種選擇)yi = 0 (若是第二種選擇)對(duì)yi取期望,E(yi) = a + b xi (2)下面研究yi的分布。因?yàn)閥i只能取兩個(gè)值,0和1,所以yi服從兩點(diǎn)分布。把yi的分布記為,P ( yi = 1) = piP ( yi = 0) = 1 - pi則E(yi) = 1 (pi) + 0 (1 - pi) = pi (3)由(2)和(3)式有pi= a +b xi(yi的樣本值是0或1,而預(yù)測(cè)值是概率。) (4)以pi = -5 xi 為例,說(shuō)明xi每增加一個(gè)單位,則采用第一種選擇的概率增加5。現(xiàn)在分析Tobit模型誤差的分布。由Tobit模型(1)有
3、,ui = yi-a-b xi=E(ui) = (1-a-b xi) pi + (-a-b xi) (1 - pi) = pi -a-b xi由(4)式,有E(ui) = pi -a-b xi = 0因?yàn)閥i只能取0, 1兩個(gè)值,所以,E(ui2) = (1-a-b xi)2pi + (-a-b xi)2 (1 - pi) = (1-a-b xi)2(a + b xi) + (a+b xi)2 (1 - a-b xi), (依據(jù)(4)式) = (1-a-b xi) (a + b xi) = pi (1 - pi) , (依據(jù)(4)式) = E(yi) 1- E(yi) 上兩式說(shuō)明,誤差項(xiàng)的期望
4、為零,方差具有異方差。當(dāng)pi接近0或1時(shí),ui具有較小的方差,當(dāng)pi接近1/2時(shí),ui具有較大的方差。所以Tobit模型(1)回歸系數(shù)的OLS估計(jì)量具有無(wú)偏性和一致性,但不具有有效性。假設(shè)用模型(4)進(jìn)行預(yù)測(cè),當(dāng)預(yù)測(cè)值落在 0,1 區(qū)間之內(nèi)(即xi取值在4, 24 之內(nèi))時(shí),則沒有什么問(wèn)題;但當(dāng)預(yù)測(cè)值落在0,1 區(qū)間之外時(shí),則會(huì)暴露出該模型的嚴(yán)重缺點(diǎn)。因?yàn)楦怕实娜≈捣秶?0,1,所以此時(shí)必須強(qiáng)令預(yù)測(cè)值(概率值)相應(yīng)等于0或1(見圖1)。線性概率模型常寫成如下形式,圖1 1, a + b xi³ 1pi =a + b xi , 0 < a + b xi < 1 (5) 0
5、,a + b xi£ 0 然而這樣做是有問(wèn)題的。假設(shè)預(yù)測(cè)某個(gè)事件發(fā)生的概率等于1,但是實(shí)際中該事件可能根本不會(huì)發(fā)生。反之,預(yù)測(cè)某個(gè)事件發(fā)生的概率等于0,但是實(shí)際中該事件卻可能發(fā)生了。雖然估計(jì)過(guò)程是無(wú)偏的,但是由估計(jì)過(guò)程得出的預(yù)測(cè)結(jié)果卻是有偏的。由于線性概率模型的上述缺點(diǎn),希望能找到一種變換方法,(1)使解釋變量xi所對(duì)應(yīng)的所有預(yù)測(cè)值(概率值)都落在(0,1)之間。(2)同時(shí)對(duì)于所有的xi,當(dāng)xi增加時(shí),希望yi也單調(diào)增加或單調(diào)減少。顯然累積概率分布函數(shù)F(zi) 能滿足這樣的要求。采用累積正態(tài)概率分布函數(shù)的模型稱作Probit模型。用正態(tài)分布的累積概率作為Probit模型的預(yù)測(cè)概率。
6、另外logistic函數(shù)也能滿足這樣的要求。采用logistic函數(shù)的模型稱作logit模型。累積正態(tài)概率分布曲線 logistic曲線 2Probit(概率單位)模型,仍假定yi = a + b xi ,而pi = F ( yi) = (6)累積概率分布函數(shù)曲線在pi =附近的斜率最大。對(duì)應(yīng)yi在實(shí)軸上的值,相應(yīng)概率值永遠(yuǎn)大于0、小于1。顯然Probit模型比Tobit模型更合理。Probit模型需要假定yi 服從正態(tài)分布。3logit模型該模型是McFadden于1973年首次提出。其采用的是logistic概率分布函數(shù)。其形式是pi =F(yi) = F(a + b xi) = = (7
7、)對(duì)于給定的xi,pi表示相應(yīng)個(gè)體做出某種選擇的概率。Probit曲線和logit曲線很相似。兩條曲線都是在pi = 0.5處有拐點(diǎn),但logit曲線在兩個(gè)尾部要比Probit曲線厚。利用(6)和(7)式得到的概率值見表1。表1 Probit模型和logit模型概率值yi正態(tài)分布函數(shù)pi = 邏輯概率分布pi =-1.5Probit曲線logit曲線圖2Probit曲線、logit曲線比較示意圖logit曲線計(jì)算上也比較方便,所以Logit模型比Probit模型更常用。對(duì)上式作如下變換,pi(1+ ) = 1 (8)對(duì)上式除以pi,并減1得e-yi = -1 = 取倒數(shù)后,再取對(duì)數(shù),yi =l
8、og ()所以 log () = yi =a + b xi (9)由上式知回歸方程的因變量是對(duì)數(shù)的某個(gè)具體選擇的機(jī)會(huì)比。logit模型的一個(gè)重要優(yōu)點(diǎn)是把在 0,1 區(qū)間上預(yù)測(cè)概率的問(wèn)題轉(zhuǎn)化為在實(shí)數(shù)軸上預(yù)測(cè)一個(gè)事件發(fā)生的機(jī)會(huì)比問(wèn)題。logit累積概率分布函數(shù)的斜率在pi = 時(shí)最大,在累積分布兩個(gè)尾端的斜率逐漸減小。說(shuō)明相對(duì)于pi = 附近的解釋變量xi的變化對(duì)概率的變化影響較大,而相對(duì)于pi接近0和1附近的xi值的變化對(duì)概率的變化影響較小。對(duì)于Logit模型使用極大似然法估計(jì)參數(shù)是一個(gè)很好的選擇。首先分析含有兩個(gè)參數(shù)(a和b)的隨機(jī)試驗(yàn)。假設(shè)被估計(jì)的模型如下pi = (10)在樣本中pi是觀測(cè)
9、不到的。相對(duì)于xi的值,只能得到因變量yi取值為0或1的信息。極大似然估計(jì)的出發(fā)點(diǎn)就是尋找樣本觀測(cè)值最有可能發(fā)生條件下的a和b的估計(jì)值。從樣本看,如果第一種選擇發(fā)生了n次,第二種選擇發(fā)生了N-n次。設(shè)采取第一種選擇的概率是pi。采取第二種選擇的概率是(1- pi)。重新將樣本數(shù)據(jù)排列,使前n個(gè)觀測(cè)值為第一種選擇,后N-n個(gè)觀測(cè)值為第二種選擇(觀測(cè)值是0,1的,但相應(yīng)估計(jì)的概率卻各不相同)。例1 (file:case5)南開大學(xué)國(guó)際經(jīng)濟(jì)研究所1999級(jí)研究生考試分?jǐn)?shù)及錄取情況見數(shù)據(jù)表(N = 95)。定義變量SCORE:考生考試分?jǐn)?shù);Y:考生錄取為1,未錄取為0;虛擬變量D1:應(yīng)屆生為1,非應(yīng)屆
10、生為0。圖1 樣本觀測(cè)值(file:logit1)得Logit模型估計(jì)結(jié)果如下(EViews命令:Quick, estimate equation分別選Probit或Logit):注:Akaike information criterion = -2+ 2Schwarz criterion = -2+ k Hannan-Quinn criterion = -2+ 2 k Average Log likelihood function = 其中k為被估參數(shù)個(gè)數(shù),T為樣本容量。McFadden R-squared = 1-因?yàn)镈1的系數(shù)沒有顯著性。說(shuō)明“應(yīng)屆生”和“非應(yīng)屆生”不是決定是否錄取的重要
11、因素。剔除D1。得Logit模型估計(jì)結(jié)果如下 pi =F(yi) =拐點(diǎn)坐標(biāo) (358.7, 0.5)注意:表達(dá)式中指數(shù)的寫法。圖2 Logit模型預(yù)測(cè)值,拐點(diǎn)坐標(biāo) (358.7, 0.5)在估計(jì)Probit模型過(guò)程中,D1的系數(shù)也沒有顯著性。剔除D1,Probit模型最終估計(jì)結(jié)果是pi =F(yi) =F xi) 拐點(diǎn)坐標(biāo) (358.5, 0.5)圖3 Probit模型預(yù)測(cè)值,拐點(diǎn)坐標(biāo) (358.5, 0.5)兩種估計(jì)模型的若干預(yù)測(cè)結(jié)果如下表,Probit模型Logit模型scoreYpiYpi350355359360365370表2 數(shù)據(jù)表obsYSCORED1obsYSCORED1obs
12、YSCORED11140113403321670275021401035033216802730313921360332169027314138703703311700272151384138033017102670613790390328172026617137804003281730263181378041032817402611913761420321175026001013710430321176025601113620440318177025201213621450318078025211313611460316179024511403591470308080024311503581
13、480308181024201613561490304082024101703561500303183023911803551510303184023501903541520299185023202003540530297186022812103531540294087021912203500550293188021912303490560293189021412403490570292090021012503481580291191020412603471590291192019802703471600287193018912803441610286194018812903391620286
14、095018213003380630282196016613103381640282197012303203361650282033033406602780例3:農(nóng)戶勞動(dòng)力的非農(nóng)業(yè)就業(yè)模型(file:logitzhou)。本例的主要任務(wù)之一是要考察影響農(nóng)村居民家庭勞動(dòng)力非農(nóng)業(yè)就業(yè)的主要因素,尤其重點(diǎn)考察教育程度對(duì)非農(nóng)業(yè)就業(yè)的影響。一般而言,在勞動(dòng)力市場(chǎng)發(fā)育相對(duì)成熟的條件下,教育可以提高勞動(dòng)力非農(nóng)就業(yè)的可能性。勞動(dòng)力教育程度越高,非農(nóng)就業(yè)的機(jī)會(huì)越多,非農(nóng)就業(yè)的傾向也就越高。此外,還有其他許多因素影響農(nóng)村勞動(dòng)力的非農(nóng)就業(yè)。如(1)農(nóng)村居民家庭所在地區(qū)的區(qū)位條件。在其他條件保持不變的條件下,離中心城
15、市越近,非農(nóng)產(chǎn)業(yè)越發(fā)達(dá),提供的非農(nóng)就業(yè)機(jī)會(huì)就越多。同時(shí)農(nóng)戶進(jìn)入非農(nóng)產(chǎn)業(yè)就業(yè)的成本越低。這種家庭中的勞動(dòng)力進(jìn)入非農(nóng)業(yè)就業(yè)的可能性也越大。(2)被調(diào)查對(duì)象所在村鎮(zhèn)的鄉(xiāng)鎮(zhèn)企業(yè)的發(fā)達(dá)程度直接影響農(nóng)村居民的非農(nóng)就業(yè)。鄉(xiāng)鎮(zhèn)企業(yè)越發(fā)達(dá),農(nóng)村居民非農(nóng)業(yè)就業(yè)的概率越高;反之,鄉(xiāng)鎮(zhèn)企業(yè)越不發(fā)達(dá),非農(nóng)就業(yè)的概率越小。(3)農(nóng)戶擁有生產(chǎn)資料情況也是影響其勞動(dòng)力非農(nóng)就業(yè)的重要因素。其中,如果其他條件相同,則非農(nóng)業(yè)生產(chǎn)性固定資產(chǎn)越多,則農(nóng)戶中勞動(dòng)力的非農(nóng)業(yè)就業(yè)傾向越大。而農(nóng)業(yè)生產(chǎn)性固定資產(chǎn)對(duì)勞動(dòng)力非農(nóng)就業(yè)傾向影響比較復(fù)雜,如果農(nóng)戶所擁有農(nóng)業(yè)生產(chǎn)性固定資產(chǎn)屬于有勞動(dòng)力替代型的,則它與勞動(dòng)力非農(nóng)就業(yè)傾向之間的關(guān)系是正相關(guān)的,
16、反之如果屬于勞動(dòng)力互補(bǔ)型的,則它與非農(nóng)就業(yè)傾向之間存在著負(fù)相關(guān)關(guān)系。(4)農(nóng)戶所擁有的耕地的數(shù)量影響其非農(nóng)就業(yè)的傾向,在我國(guó)現(xiàn)有的農(nóng)業(yè)現(xiàn)代化程度比較低的條件下,耕地越多意味著農(nóng)戶必須將更多的勞動(dòng)力分配到農(nóng)業(yè)生產(chǎn)中,因此農(nóng)戶勞動(dòng)力的非農(nóng)就業(yè)傾向越小,反之,耕地越少則非農(nóng)就業(yè)的傾向越高。(5)家庭結(jié)構(gòu)也是影響農(nóng)戶勞動(dòng)力非農(nóng)就業(yè)的重要因素,家庭負(fù)擔(dān)越輕,勞動(dòng)力從事非農(nóng)就業(yè)的傾向越大。(6)勞動(dòng)力受教育程度。根據(jù)上述分析,我們構(gòu)建了如下的計(jì)量模型:Y=C+b1X+b2NYGDZC+b3FNYGDZC+b4XZQY+b5RJGD+b6FDXS+a1School1+a2School2+a3School3+
17、a4School4+a5School5+a6School6+ut其中:Y為農(nóng)戶中是否有非農(nóng)業(yè)就業(yè)的勞動(dòng)力,如果有取1,沒有則取0;X為地區(qū)代碼。如果被調(diào)查對(duì)象屬于濱海三區(qū)和四郊取1,否則取0;NYGDZC為農(nóng)戶所擁有的人均農(nóng)業(yè)生產(chǎn)性固定資產(chǎn)的價(jià)值;FNYGDZC為農(nóng)戶擁有的人均非農(nóng)業(yè)生產(chǎn)性固定資產(chǎn)的價(jià)值;XZQY為農(nóng)戶所在村鎮(zhèn)鄉(xiāng)鎮(zhèn)企業(yè)的個(gè)數(shù);RJGD為農(nóng)戶家庭人均擁有的耕地的數(shù)量;FDINDEX為家庭結(jié)構(gòu)的勞動(dòng)力負(fù)擔(dān)系數(shù);school1表示家庭中文盲或識(shí)字很少的勞動(dòng)力的人數(shù);school2表示農(nóng)戶家庭內(nèi)中小學(xué)文化程度的勞動(dòng)力人數(shù);school3表示農(nóng)戶家庭中具有初中文化程度的勞動(dòng)力的人數(shù);sc
18、hool4表示高中文化程度的勞動(dòng)力的人數(shù);school5表示中專文化程度的勞動(dòng)力的人數(shù);school6表示大專以上文化程度的勞動(dòng)力的人數(shù)。農(nóng)村居民家庭非農(nóng)業(yè)就業(yè)的Logit估計(jì)結(jié)果資料來(lái)源:天津市農(nóng)村社會(huì)經(jīng)濟(jì)調(diào)查隊(duì)。注:(1)*表示10%的水平下是顯著的;*表示5%的水平下是顯著的;*表示1%的水平下是顯著的。 (2)模型包含了全部樣本在內(nèi),模型只包含了五縣的樣本,模型只包含了四個(gè)近郊和濱海三區(qū)的樣本注:YF是上述logit模型的預(yù)測(cè)值;Yhat是用上述變量做的線性回歸的預(yù)測(cè)值。所以散點(diǎn)圖正好能看出生長(zhǎng)曲線的走勢(shì)。估計(jì)結(jié)果顯示,教育程度對(duì)勞動(dòng)力的非農(nóng)業(yè)就業(yè)傾向有著非常明顯的作用。除文盲外,隨著教育程度的提高,農(nóng)戶中勞動(dòng)力從事非農(nóng)就業(yè)的傾向越大。正如前面所分析的那樣,宏觀變量中,區(qū)位因素和當(dāng)?shù)剜l(xiāng)鎮(zhèn)企業(yè)的發(fā)達(dá)程度對(duì)農(nóng)戶的勞動(dòng)力從事非農(nóng)就業(yè)產(chǎn)生了明顯的促進(jìn)作用。微觀因素中,農(nóng)戶擁有農(nóng)業(yè)生產(chǎn)固定資產(chǎn)對(duì)其非農(nóng)就業(yè)的影響是負(fù)的,而非農(nóng)業(yè)生產(chǎn)性固定資產(chǎn)的影響則是正的。這表明農(nóng)戶的資產(chǎn)存量對(duì)其非農(nóng)就業(yè)的影響是雙向的,具體的情況主要取決于資產(chǎn)的種類。同時(shí),農(nóng)戶擁有的耕地?cái)?shù)量對(duì)其非農(nóng)業(yè)就
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 西安石油大學(xué)《檢驗(yàn)診斷學(xué)實(shí)驗(yàn)》2023-2024學(xué)年第二學(xué)期期末試卷
- 教科版必修二第三章萬(wàn)有引力定律同步測(cè)試題2024-2025學(xué)年高中畢業(yè)班綜合測(cè)試(二)歷史試題含解析
- 四川外國(guó)語(yǔ)大學(xué)《普通植物病理學(xué)》2023-2024學(xué)年第二學(xué)期期末試卷
- 重慶經(jīng)貿(mào)職業(yè)學(xué)院《建筑透視》2023-2024學(xué)年第二學(xué)期期末試卷
- 江蘇省南通市崇川區(qū)2025屆六年級(jí)下學(xué)期調(diào)研數(shù)學(xué)試卷含解析
- 某地產(chǎn)項(xiàng)目營(yíng)銷方案
- 房地產(chǎn)營(yíng)銷模擬訓(xùn)練
- 堅(jiān)果種植的有機(jī)認(rèn)證流程考核試卷
- 豬的飼養(yǎng)常見疾病識(shí)別考核試卷
- 汽車舊車銷售市場(chǎng)調(diào)研數(shù)據(jù)分析考核試卷
- 流浪動(dòng)物救助中心犬糧公開招投標(biāo)書范本
- 初中數(shù)學(xué)人教九年級(jí)上冊(cè)第二十一章 一元二次方程 解一元二次方程-配方法PPT
- 《氣象災(zāi)害預(yù)警信號(hào)》課件
- 無(wú)機(jī)保溫砂漿外墻外保溫系統(tǒng)施工工藝課件
- 高三二輪復(fù)習(xí):產(chǎn)業(yè)轉(zhuǎn)移以富士康的企業(yè)轉(zhuǎn)移為例課件
- 礦井維修電工技能鑒定考試題(高級(jí)工)
- 高中語(yǔ)文《祝福》“誰(shuí)是兇手”系列之祥林嫂死亡事件《祝福》探究式學(xué)習(xí)(教學(xué)課件) 課件
- 電子商務(wù)稅收法律問(wèn)題
- 水平泵房水泵聯(lián)合試運(yùn)轉(zhuǎn)方案及安全技術(shù)措施
- 中國(guó)政法大學(xué)社會(huì)主義市場(chǎng)經(jīng)濟(jì)概論重點(diǎn)歸納及復(fù)習(xí)試題(楊干忠版)
- 《螞蟻和西瓜》課件
評(píng)論
0/150
提交評(píng)論