




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、虛擬變量(dummy variable ) 在實際建模過程中, 被解釋變量不但受定量變量影響,同時還受定性變量影響。 例如需 要考慮性別、民族、不同歷史時期、季節差異、企業所有制性質不同等因素的影響。這些因 素也應該包括在模型中。 由于定性變量通常表示的是某種特征的有和無,所以量化方法可采用取值為1或0。這 種變量稱作虛擬變量,用 D表示。虛擬變量應用于模型中,對其回歸系數的估計與檢驗方 法與定量變量相同。 1. 截距移動 設有模型, yt = o + ixt + 2D + ut , o + ixt + ut , (0 +2)+ixt + ut , 其中yt, xt為定量變量;D為定性變量。當
2、 D = 0或1時,上述模型可表達為, (D = 0) (D = 1) D = 1 D =0 圖8.1測量截距不同 D = 1或0表示某種特征的有無。反映在數學上是截距不同的兩個函數。若2顯著不為零, 說明截距不同;若2為零,說明這種分類無顯著性差異。 例:中國成年人體重 y (kg)與身高x (cm)的回歸關系如下: -05 + xD = 1 (男) y = -100 + x-5D = -100 + xD = 0 (女) 若定性變量含有 m個類別,應引入m-1個虛擬變量,否則會導致多重共線性,稱作 虛擬變量陷阱(dummy variable trap )。 關于定性變量中的哪個類別取0,哪個
3、類別取1,是任意的,不影響檢驗結果。 定性變量中取值為 0所對應的類別稱作基礎類別(base category )。 對于多于兩個類別的定性變量可采用設一個虛擬變量而對不同類別采取賦值不同的 方法處理。如: f 1(大學) D = 0(中學) -1(小學)。 【案例1】 中國季節GDP數據的擬合(虛擬變量應用,file : easel及casel-solve) GDP序列圖 不用虛擬變量的情形 若不采用虛擬變量,得回歸結果如下, GDP = 1.5427 + 0.0405 T (11.0)(3.5) R2 = 0.3991, DW = 2.6 ,s.e. = 0.3 定義 1(1季度) 1(
4、2季度) 1(3季度) D1 = D2 = T D3 = -0( 2, 3,4 季度) -0 (1, 3, 4 季度) -0 (1,2, 4 季度) 第4季度為基礎類別。 GDP = 2.0922 + 0.0315 T 0.8013 D1 0.5137 D2 -0.5014 D3 (64.2)(15.9)(-24.9)(-16.1)(-15.8) R2 = 0.9863, DW = 1.96, s.e. = 0.05 Dep endent Variable: GDF Met had: Least Squares Date: 07/02/02 Time: 20:43 Sample: 1996:1
5、 2000:4 Included ebservations: 20 Variable Coefficient Std Ernor VStatistiic Prob. C 2 092221 0,032575 64.22740 .0000 T 0,031450 0 001975 15.92287 0.0000 D1 -0.301313 0.032153 -24 92164 0.0000 D2 -.513736 0.031B49 -16.13059 .0000 D3 -0.501386 .031664 -16.83444 .0000 Rquared 0 966321 Mean dependent v
6、ar 1.968340 Adjusted R-squared .982673 .D. dependent var 0 379G09 S. E. of regression 0.049960 Aloike info criterion -2 942546 Sum squared re$id 0,037452 Schwarz criterion -2 593613 Log likelihood 34.42546 F-statistic 270,3959 Durbin-Watson stat 1.962063 Prob(F- statistic) 0.000000 年 GDP t D1 D2 D3
7、1996:1 1.3156 1 1 0 0 1996:2 1.6600 2 0 1 0 1996:3 1.5919 3 0 0 1 1996:4 2.22096 4 0 0 0 1997:1 1.46856 5 1 0 0 1997:2 1.84948 6 0 1 0 1997:3 1.7972 7 0 0 1 1997:4 2.3620 8 0 0 0 1998:1 1.58994 9 1 0 0 1998:2 1.88316 10 0 1 0 1998:3 1.97044 11 0 0 1 1998:4 2.51176 12 0 0 0 1999:1 1.6784 13 1 0 0 199
8、9:2 1.9405 14 0 1 0 1999:3 2.0611 15 0 0 1 1999:4 2.5254 16 0 0 0 2000:1 1.8173 17 1 0 0 2000:2 2.1318 18 0 1 0 2000:3 2.2633 19 0 0 1 2000:4 2.7280 20 0 0 0 數據來源: 中國統計年鑒 1998-2001 附數據如下: 2. 斜率變化 以上只考慮定性變量影響截距,未考慮影響斜率,即回歸系數的變化。當需要考慮時, 可建立如下模型: yt = 0 + 1 xt +2 D +3 xt D + ut , 其中xt為定量變量;D為定性變量。當 D =
9、 0或1時,上述模型可表達為, 1 xt + Ut , 2 ) + ( 1 +3)Xt + Ut , (D = 1) (D = 0) 可判斷模型斜率是否發生變化。 通過檢驗 3是否為零, 圖8.5情形1 (不同類別數據的截距和斜率不同) 圖8.6情形2 (不同類別數據的截距和斜率不同) 例2 :用虛擬變量區別不同歷史時期( file: case2及case2-solve) 中國進出口貿易總額數據(1950-1984)見上表。試檢驗改革前后該時間序列的斜率是 否發生變化。定義虛擬變量D如下 -0( 1950 - 1977) D =- c 1( 1978 - 1984) 中國進出口貿易總額數據(1
10、950-1984)(單位:百億元人民幣) 年 trade T D T *D 年 trade T D T*D 1950 0.415 1 0 0 1968 1.085 19 0 0 1951 0.595 2 0 0 1969 1.069 20 0 0 1952 0.646 3 0 0 1970 1.129 21 0 0 1953 0.809 4 0 0 1971 1.209 22 0 0 1954 0.847 5 0 0 1972 1.469 23 0 0 1955 1.098 6 0 0 1973 2.205 24 0 0 1956 1.087 7 0 0 1974 2.923 25 0 0 1
11、957 1.045 8 0 0 1975 2.904 26 0 0 1958 1.287 9 0 0 1976 2.641 27 0 0 1959 1.493 10 0 0 1977 2.725 28 0 0 1960 1.284 11 0 0 1978 3.550 29 1 29 1961 0.908 12 0 0 1979 4.546 30 1 30 1962 0.809 13 0 0 1980 5.638 31 1 31 1963 0.857 14 0 0 1981 7.353 32 1 32 1964 0.975 15 0 0 1982 7.713 33 1 33 1965 1.184
12、 16 0 0 1983 8.601 34 1 34 1966 1.271 17 0 0 1984 12.010 35 1 35 1967 1.122 18 0 0 以時間T=time為解釋變量,進出口貿易總額用trade表示,估計結果如下: trade = 0.37 + 0.066 time - 33.96D + 1.20 time D (1.86)(5.53) (-10.98) (12.42) 0.37 + 0.066 time (D = 0, 1950 - 1977) -33.59 + 1.27 time (D = 1, 1978 - 1984) 上式說明,改革前后無論截距和斜率都發生了
13、變化 。進出口貿易總額的年平均增長量擴大了 18倍。 千億港元)的擬合( file: case3及case3-solve) 【案例3】香港季節GDP數據(單位: 19901997年香港季度 GDP呈線性增長。1997年由于遭受東南亞金融危機的影響,經 濟發展處于停滯狀態,19982002年底GDP總量幾乎沒有增長(見上圖)。對這樣一種先增 長后停滯,且含有季節性周期變化的過程簡單地用一條直線去擬合顯然是不恰當的。為區別 不同季節,和不同時期,定義季節虛擬變量D2、D3、D4和區別不同時期的虛擬變量DT 如下(數據見附錄): M (第2季度) D2 =弋 L 0(其他季度) 1 (第3季度) D
14、3 = 0(其他季度) M (第4季度) D4 = y L 0(其他季度) 1(1998:12002:4) DT =- 匚 0(1990:1 1997:4) 得估計結果如下: GDPt = 1.1573 + 0.0668t + 0.0775D2 + 0.2098D3 + 0.2349D4+ 1.8338 DT- 0.0654 DTt (50.8)(64.6)(3.7)(9.9)(11.0)(19.9)(-28.0) R2 = 0.99, DW = 0.9, s.e. = 0.05, F=1198.4, T=52, t0.05 (52-7) = 2.01 對于 1990:1 1997:4 GDP
15、t = 1.1573 + 0.0668 t + 0.0775 D2 + 0.2098 D3 + 0.2349 D4 對于 1998:12002:4 GDPt = 2.9911 + 0.0014 t + 0.0775 D2 + 0.2098 D3 + 0.2349 D4 Dependent Variable: GDP Method: Least Squares Date 0M4/04 Time- 15:54 Sample: 1990:1 2002:4 Included obserYations: 52 Variable Coefficient 3td Error t-Statisliic Pro
16、b C 1 157300 0 022779 50.80914 o.ooco T 0.066B43 0.001035 64.56035 O.OOCQ D2 .077522 0.021139 3.667325 O.OOCB D3 0.209323 0.021215 9090799 O.OOCO D4 0 234922 0 021341 11.00B27 0.0000 DT 1.833785 0.092079 19.91526 O.OOCO DPT -0,065419 002333 -28.03951 O.ODOO R-equared 0.993780 Mean dependent var 2.69
17、5174 Adjusted R-squaretl 0.992951 S.D. dependerit 冊 0.641144 S.E. of regression 0 063829 Akaike info criterion -2,031376 Sum squared resid 0.130383 Schtwarz criierion -2.B18708 Log likelihood 01.91575 Fatalistic 1198.362 Durbin-Watsor stat 0.910754 ProbfF-statistic) 0.000000 如果不采用虛擬變量擬合效果將很差: GDPt =
18、 1.6952 + 0.0377 t (20.6)(13.9) R2 = 0.80, DW = 0.3, T =52, to.05(52-2)= 2.01 【案例4】天津市糧食市場小麥批發價與面粉零售價的關系研究( file: xiezhiyong ) 首先看天津市糧食市場小麥批發價格的變化情況(圖1 )。1995年初,天津市糧食市場 的小麥批發價格首先放開。在經歷5個月的上揚之后,進入平穩波動期。從1996年8月份 開始小麥批發價格一路走低。至2002年12月份,小麥批發價格降至是1160元/噸。 其次看面粉零售價的變化情況。因為面粉零售價格直接關系到居民的日常生活,所以開 始時沒有與小麥批
19、發價格一起放開。當小麥批發價格一路看漲時,1995年1月至1996年6 月面粉零售價格一直處于2.14元/千克的水平上。1996年7月起,面粉零售價格也開始在市 場上放開。受小麥批發價格上漲的影響,一個月內面粉零售價格從2.14元/千克漲到2.74元 /千克。在這個價位上堅持了11個月之后,面粉零售價格開始下降。與小麥批發價格的下降 相一致,在經歷了 5年零7個月的變化之后,面粉零售價格又恢復到接近開放前2.14元/千 克的水平上(2.17元)。 散點圖如圖2。按時間分析這些觀測點的變化情況(見圖3,逆時針方向運動)。見圖4, 2.8 2.6 2.4 2.2 2.0 0.17 )。 retai
20、l price wholesale 2.8 2.6 2.4 2.2 2.0 1000 1200 14001600 1800 2000 圖3 1000 1200 1400 1600 1800 2000 圖2 利用虛擬變量技術,在模型中加入虛擬變量。定義 D = 0,( 1995: 11996:6,面粉零售價格放開之前), D = 1,( 1996:72002:12,面粉零售價格放開之后) 取對數關系建立模型。 Dependeint Variable: PRICE Method: Least Squares Date: 0M7/D4 Time 22:02 Sample 1995:01 2002:1
21、2 Included obseivations: 96 Variable Coefficient Sid Error t-Statistic Prob. C 2140000 2 2217340.963212 0.33SO LOG(SALE) -1.73E-12 0.295461-5.B7E-12 1.0000 D1 -7.745843 2.247429-3.446537 0.M09 LOG(SALE)*D1 1.121467 U.299W13749331 0.0003 R-squarad 0 905412 Mean dependent var 2401115 Adjusted R-sqjare
22、d 0,902326 S.D. dependent var 0.222056 S, E of regression 0.06939S Akaike info criterion -2.457132 Sum squared res id 0.443035 Schwarz criterion 2.350205 Log likelihood 121.9424 F-statistic 293.5463 DurbirrWa2on slat .300302 Prob(F-st artistic) 0.000000 Ln sale的系數沒有顯著性(對于面粉零售價格放開之前的散點來說回歸直線是一條水 平線)。
23、剔出Ln sale變量,得估計結果 D -7.7458 D PRICE = 2.140 + 1.1215 Ln sale (131.5)(23.9) PRICE = 2.140, (-23.0) D=0 R2 = 0.9054, D即endervt Variable: PRICE Method: Least Squares Date: 03W4 Time 22:51 Sample: 1995:01 2002:12 Included observations. 96 Variable Coefficient Std. Error t-Statistic Prob. C 2.140000 0Q1G
24、269131.5371 0.0000 D1 -7745848 0.337444-22.95445 Q.0000 LOG(SALEfDl 1.121467 0.046S4323.34109 0.0000 R-squared 0.905412 Mean dependent var 2.401115 ArijusteiJ Rsqjared 0.903378 S.D.(1即endenl var 0.22205B SJE. of regression 0,069024 Akaike info critericn *2,477566 Sum squared res id .443085 Schwarz criterion -2.397830 Log likelihood 121.9424 F-st artistic J45.1056 Durbin-Watson siat 0.300302 Prob(F-statistic) 0.000000 PRICE = -5.6058 + 1.1215 Ln sale , 一條回歸直線的斜率為零,一條回歸直線的斜率為 1.12。可決系數從不加虛擬變量模型的 0.046增加到0.905 (輸出結果見下) 本例也可以建立倒數
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 南陽市宛城區2025屆五年級數學第二學期期末復習檢測試題含答案
- 江蘇省南通市四校聯盟2025屆高考模擬金典卷數學試題(七)試題含解析
- 洛陽職業技術學院《高等數學AⅡ》2023-2024學年第二學期期末試卷
- 江蘇省田家炳中學2025年高三下學期第三次月考試題綜合試題含解析
- 松花粉培訓課件
- 湛江市大成中學高二上學期第一次月考物理試題
- 2025汽車租賃合同 標準版
- 顱內血管畸形護理查房
- 2025吉林油田物資采購合同
- 2025物業管理公司提供耗材服務的合同模板
- 《馬達保護器培訓》課件
- 2024年01月廣發銀行2024年境內直屬分行(大連分行)副行長職位選聘筆試歷年參考題庫附帶答案詳解
- 消防安全重點單位管理
- 2025年度花崗巖墓碑石材采購合同范本
- 《止血與包扎》課件
- 2025年水稻種植農戶互助合作合同3篇
- 第19課《資本主義國家的新變化》說課稿-2023-2024學年高一下學期統編版(2019)必修中外歷史綱要下
- 口腔頜面外科基礎知識與基本操作
- 2025年福建泉州交通發展集團招聘筆試參考題庫含答案解析
- 大數據背景下的高血壓診斷與治療效果研究
- 2024員工三級安全培訓考試題含答案(能力提升)
評論
0/150
提交評論