




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第八章虛擬變量回歸
引子:男女大學生消費真有差異嗎?
在對在校學生的消費行為進行的調查中,發現在校
生的消費行為呈現多元化的結構。人際交往消費、
手機類消費、衣著類消費、化妝品類消費、電腦類
消費、旅游類消費占有較大的比例;而食品類消費、
學習用品類消費不突顯。
顯然,男女生在消費上存在差異。為了了解男、女
生的消費支出結構差異,應當如何建立模型?
面臨的問題:如何把男女生這樣的非數量變量引
入方程?
2
問題的一般性描述
在實際建模中,一些定性變量具有不可忽視的重要
影響。例如,研究某個企業的銷售水平,產業屬性
(制造業、零售業)、所有制(私營、非私營)、
地理位置(東、中、西部)、管理者的素質、不同
的收入水平等是值得考慮的重要影響因素,但這些
因素共同的特征是定性描述的。二
如何對非定量因素進行回歸分析?
采用“虛擬變量”對定性變量進行量化一種思路。
產,第八章虛擬變量回歸
本章主要討論:
?虛擬變量
?虛擬解釋變量的回歸
?虛擬被解釋變量的回歸(選講,不包括)
令第一節虛擬變量
■■——J
本節基本內今:
?基本概念
?虛擬變量設置規則
5
一、基本概念
定量因素:可直接測度、數值性的因素。
定性因素:屬性因素,表征某種屬性存在與否的
非數值性的因素。
基本思想:
直接在回歸模型中加入定性因素存在諸多的困難
(那些困難?),是否可將這些定性因素進行量
化,以達到定性因素能與定量因素有著相同作用
之目的。
6
虛擬變量的定義
計量經濟學中,將取值為o和1的人工變量稱為虛
擬變量。虛擬變量也稱:啞元變量、定性變量等
等。通常用字母D或DUM加以表示(英文中虛擬
或者啞元Dummy的縮寫)。
對定性變量的量化可采用虛擬變量的方式實現。
二、虛擬變量設置規則
虛擬變量的設置規則涉及三個方面:
1.“0”和“1”選取原則
2.屬性(狀態、水平)因素與設置虛擬變量
數量的關系二
二3.虛擬變量在回歸分析中的角色以及作用等
方面的問題
8
“0”和“1”選取原則
?虛擬變量取“I”或“0”的原則,應從分析問
題的目的出發予以界定。
?從理論上講,虛擬變量取“0”值通常代表比較
的基礎類型;而虛擬變量取“1”值通常代表被
比較的類型。
“0”代表基期(比較的基礎,參照物);
“1”代表報告期(被比較的效應)。
例如,比較收入時考察性別的作用。當研究男性收入是否
高于女性時,是將女性作為比較的基礎(參照物),故有
男性為“1”,女性為“0”O
例111男1改革開放以后
⑴。二<(2)D=
1°女0改革開放以前
1天氣陰11天氣雨
(3)D/=()D2=<4
10其他0其他
問題:
為何只選0、1,選2、3、4行嗎?為什么?
10
屬性的狀態(水平)數與虛擬變量
數量的關系
定性因素的屬性既可能為兩種狀態,也可能為多種
狀態。例如,性別(男、女兩種)、季節(4種狀
態),地理位置(東、中、西部),行業歸屬,所
有制,收入的分組等。
-1,0)天氣陰
I
如:(。1,。2)=<(0,1)天氣雨
I(0,0)其他
11
虛擬變量數量的設置規則
1.若定性因素具有111個(加22)相互排斥屬性(或
幾個水平),當回歸模型有截距項時,只能引入
m-1個虛擬變量;
2.當回歸模型無截距項時,則可引入m個虛擬變
量;否則,就會陷入“虛擬變量陷阱”。(為什二
么?)
廣、個例子(虛擬變量陷阱)
研究居民住房消費支出匕和居民可支配收入X,之間的
數量關系。回歸模型的設定為:Yi=ao+^iXi+ui()
現在要考慮城鎮居民和4村居民之間的差異,如何辦?
為了對“城鎮居民”、“農村居民”進行區分,分析
各自在住房消費支出Y上的差異,設Dli=l為城鎮;
Dli=0為%村,則模型為
Yi=()+iXi+1D1+ui(2)
(模型有截距,“居民屬性”定性變量只有兩個相互排斥
的屬性狀態(加=2),故只設定一個虛擬變量。)
產飛
若對兩個相互排斥的屬性“居民屬性”,仍然
引入〃22個虛擬變量,則有
fl城鎮居民11農村居民
Du=\
lo農村居民10城鎮居民
則模型(1)為
Yi0\Xi1D12。2Ui(3)
則對任一家庭都有:D\+Di=ID1+D2-I=0,
即產生完全共線,陷入了“虛擬變量陷阱”。
“虛擬變量陷阱”的實質是:完全多重共線性。
虛擬變量在回歸模型中的角色
z虛擬變量既可作為被解釋變量,也可作為解釋二
變量,分別稱其為虛擬被解釋變量和虛擬解釋變量。
虛擬被解釋變量的研究是當前計量經濟學研究的
前沿領域,如MacFadden、Heckmen等人的微觀計
二量經濟學研究,大量涉及到虛擬被解釋變量的分析。
本課程只是討論虛擬解釋變量的問題
第二節虛擬解釋變量的回歸
本節基本內<:
?加法類型
?乘法類型
?虛擬解釋變量綜合應用
16
產飛
在計量經濟學中,通常引入虛擬變量的方式分為
加法方式和乘法方式兩種:即
Yt=ao+PXtut卜aiD
Yt=a+pi/+必+
原模型:匕=a+?Ei+ui
加法方式引入a=ao+ociD
乘法方式引入0=01+02。
實質:加法方式引入虛擬變量改變的是截距;
乘法方式引入虛擬變量改變的是斜率。
I、加法類型
以加法方式引入虛擬變量時,主要考慮的問二
題是定性因素的屬性和引入虛擬變量的個數。
分為四種情形討論:
(1)解釋變量只有一個定性變量而無定量變量,
而且定性變量為兩種相互排斥的屬性;二
(2)解釋變量分別為一個定性變量(兩種屬性)
和一個定量解釋變量;
18
產飛
(3)解釋變量分別為一個定性變量(兩種以上屬
性)和一個定量解釋變量;
(4)解釋變量分別為兩個定性變量(各自分別是
兩種屬性)和一個定量解釋變量;
思考:
四種加法方式引入虛擬變量會產生什么效應?
fqClJ一個兩種屬性定性斛羚變量而
無定量變量的情形
模型形式:Yi/(Di)i0
例如:19/0\1
11城市
其中:Di=農村(比較的基礎:農村)
Q那幻E(H|A=1)==ao+ai)
E(H|D=6)
1=ao
'匕=ao+ai)jii城市
VYi=^0+|Llz
農村
20
/飛(2)一個定性斛羚變量(兩種屬性)
和一個定量斛釋變量的情形
模型形式Yi=f(Di,Xi)+/Lti^>d=a0+aiDz
例如:Yi=a0+aiA+px,+僅
X
共同的特征:戰距發生改變C?J
22
一個定性解稼變量(兩種以上
屬性)和一個定量斛分變量的情形
模型形式Yi=f(X19I92,)+*,
(如:民族有§潦中特性;季度有4種特性)
例如:啤酒售量工人均收入X、季度。;
匕=a0+aiDi+a2。2+a3。3+0X,+囚
f1一季度「1二季度
其中:D\—<Z)2=<其它
lo其它10
(1三季度
。3=《
10其它
23
一季度:E(H|X1,O1=1,Di=D3=0)=ao+oci)
土壁ft:E(匕|X1,02=l,Z)(=Z)3=0)=(ao+a2)
WM?:E(Yi|Xl,D3=1,Di=D2=0)=(a0+a3)
£>2=03=0)=ao+pX
’(基準:四季度)
24
兩個定性解羚變量(均為兩種
屬性)和一個定量斛分變量的情形
例:分析啤酒銷售量丫受到人均收入X、季節Q
以及居民屬性。2的影響。
Yj—CXQ+ocyF)Y+a?力2+/3Xj+內
1夏季城市
其中:E\=
0冬季農村
(比較的基礎一冬季、農村)
25
夏季、城市居民
EYi\Xi,D\1,。2101
2)Xi
夏季、農村居民(
EYi\XifD\=l,Z)2=0=0+1)
卷季、城市居民,
(+
EYi\Xi,D\0,。21(0
冬毅)柴村唐'民
EYi\Xi,D\0,D200
Xi
26
Pix—1zDo—j
Di=1,\)2=0
Di=0,Z)2=1
eDi=0,D2=0
X
上述圖形的前提條件是什
27
運用OLS得到回歸結果,再用t檢驗討論因素
是否對模型有影響。
加法方式引入虛擬變量的一般表達式:
匕=CCO+0C1O1/+OC2D2t+...+akDkt+pXt+ut
基本分析方法:條件期望。二
E(Yt/Dit,Dzt,??.,Dkt)=oto+otiDit+ot2D2t+…+otkDkt
+pXt
28
加法方式引入虛擬變量的主要作用為:
1.在有定量解釋變量的情形下,主要改變方程
截距;
2.在沒有定量解釋變量的情形下,主要用于方
差分析。
29
二、乘法類型
基本思想
以乘法方式引入虛擬變量時,是在所設立的模型中,將虛擬
Xi
解釋變量與其它解釋變量的乘積,作為新的解釋變量出現在
模型中,以達到其調整設定模型斜率系數的目的。或者將模
型斜率系數表示為虛擬變量的函數,以達到相同的目的。
乘法引入方式:
(1)截距不變;
(2)截距和斜率均發生變化;
分析手段:仍然是條件期望。
30
C1J前距不變的情形
模型形式:
Yt=fXtfDtXtut,
例:球究消費娑出Y受收入X、年份狀況D的影響
Yi=a+^iXt+^2(DtXt)+\it
\1反常年份
其中:丫-消費支出;X—收入;Dt=\
[0正常年份
反常年份E(Yt\XtfDt=1)=a+(^i+^2)Xt
正常年份E(Yt\XtfDt=O)=a+^i
始正常年份的基礎上進行比較,(只有斜率系數發生改變)。
(2)就距和斜率均發生變化
模型形式:
YifXt.Dt.DtXto\D,
11D
例,同樣研究消費支出Y、收入X、年份狀況D間的影
響關系。
Yt=ao+01X/+aiD+p2(DtXt)+|i/
fl反常年份
其中:y-消費支出;x-收入;Dt=]
lo正常年份
反常年份E(川XjDt=1)=(ao+ai)+(伙+P2)Xz
正常年份E(H|X/,D=O)=a+PiX/
在正常年份基礎上比較,截距和斜率系數都改變,為什么?
32
廣?不同截距、斜率的組合刎
--------------------------?-------------------------------------------------------------------------------------------?
重合回歸:截距斜率均相同平行回歸:截距不同斜率相同
ib
一J1:
共點回歸:截距相同斜率不同交叉(不同)回歸:截距斜率均不同
33
三、虛擬斛釋變量綜合應用
所謂綜合應用是指將引入虛擬解釋變量的加法方
式、乘法方式進行綜合使用。
基本分析方式仍然是條件期望分析。
本課主要討論
-(1)結構變化分析;二
2(2)交互效應分析;2
(3)分段回歸分析
34
C1J結構變化分析
結構變化的實質是檢驗所設定的模型在樣本期內
是否為同一模型。顯然,平行回歸、共點回歸、
不同的回歸三個模型均不是同一模型。
平行回歸模型的假定是斜率保持不變(加法類型,
包括方差分析);
共點回歸模型的假定是截距保持不變(乘法類型,
又被稱為協方差分析);
不同的回歸的模型的假定是截距、斜率均為變動
的(加法、乘法類型的組合)。
35
例:比較改革開放前、后我國居民(平均)“儲
蓄一收入”總量關系是否發生了變化?
模型的設定形式為:
匕=al+a20/+P1X/+p2(DiXt)+以(1)
其中:Yt為儲蓄總額,Xt為收入總額。
fl改革開放后
D-\
lo改革開放前
36
回歸方程:
改革開放后E(7r|Xt,Z)=1)=al+a2)(01+02)X.(2)
(+
(3)
改革開放前E(Yt|Xt,0=0)=al+。1X,
顯然,只要。2、2不同時為零,上述模型就能刻畫
改革開放前后我國居民儲蓄收入模型結構是否發生
變化。
37
產飛
問題:
1,本例中,平行、共點回歸、不同的回歸三模型
的經濟學背景解釋是什么?
2.如何進行結構變化判斷?
3.是否可對(2)、(3)分別進行OLS估計?為什么?
4.若分別對(2)、(3)進行OLS估計應注意什么?
38
(2)交互效應分析
交互作用:
一個解釋變量的邊際效應有時可能要依賴于另一
個解釋變量。為此,Klein和Morgen(1951)提出了
有關收入和財產在決定消費模式上相互作用的假
設。他們認為消費的邊際傾向不僅依賴于收入,
而且也依賴于財產的多少一一較富有的人可能會
有不同的消費傾向。
39
為了捕獲該影響,設C=a+B"》。假設邊際
消費傾向p依賴于財產Zo一個簡單的表示方法
就是P=pl+p2Zo代入消費函數,有:
c=a+pir+p2yz+w
由于KZ捕獲了收入和財產之間的相互作用而被稱
為交互作用項。
顯然,刻畫交互作用的方法,在變量為數量(定量)
變量時,是以乘法方式引入虛擬變量的。
40
例:是否發展油菜籽生產與是否發展養蜂生產的
差異對農副產品總收益的影響研究。
模型設定為:
Yi=ai+a2DH+a3Z)3z+^Xi+m()i
其中:匕?(農副產品收益);X(農副產品投入)
二'fl發展養蜂生產「1發展油菜籽生產-
D1=〈;D3=〈
lo其他10其他
(1)式中,以加法形式引入虛擬變量暗含何假設?
41
(i)式以加法形式引入,暗含的假設為:
菜籽生產和養蜂生產是分別獨立地影響農副品生產
總收益。但是,在發展油菜籽生產時,同時也發展
養蜂生產,所取得的農副產品生產總收益,可能會
高于不發展養蜂生產的情況。即在是否發展油菜籽二
生產與養蜂生產的虛擬變量以和小間,很可能
存在著一定的交互作用,且這種交互影響對被解釋
變量農副產品生產收益會有影響。
42
c
問題:如何刻畫同時發展油菜籽生產和養蜂生產的
交互作用?
基本思想:在模型中引入相關的兩個變量的乘積。
二區別之處在于,上頁定義中的交互效應是針對數量
變量,而現在是定性變量,又應當如何處理?
43
為了反映交互效應,將(1)變為:
Yi2D2i3D3Z4D2iD3i
XiUi
同時發展油菜籽和
Yi—Otl+0t2+013+0t4)PXi+Ui
養蜂生產:
(+
發展油菜籽生產:Yi12)X
iUi
發展養蜂生產:匕?=@1+a3)^Xi+ui
(
基礎類型:匕=al+PFX/+ui
44
產飛
如何檢驗交互效應是否存在?
看(系數a4對應的%值:
「Ho:OC4=0
即檢驗:<
IHi:a4W0
若拒絕原假設,即交互效應對y產生了影響(應
該引入模型)。
45
(3)分段回歸分析
作用:提高模型的描述精度。二
虛擬變量也可以用來代表數量因素的不同階段。
分段線性回歸就是類似情形中常見的一種。
一個例子:研究不同時段我國居民的消費行為。
實際數據表明,1979年以前,我國居民的消費支
y
出呈緩慢上升的趨勢;從1979年開始,居民消
費支出為快速上升趨勢。
如何刻畫我國居民在不同時段的消費行為?
46
基本思路:采用乘法方式引入虛擬變量的手段。
顯然,1979年是一個轉折點,可考慮在這個轉折
點作為虛擬變量設定的依據。若設X*=1979,
當/〈X*時可引入虛擬變量。(為什么選擇1979
作為轉折點?)
47
產飛
依據上述思路,有如下描述我國居民在不同時段
消費行為模型:
Yt0U婁(tX)
D!ut
Xt(t=1955,1956,2004)
其中:D
Xt
0
居民消費趨勢方程:
1979年以前:Yt=po+pu+wz
*1979年以后:Yt=00—p2X+(pl
+02),+Ut
48
分析
1979年之前,回歸模型的斜率為p;
1
1979年之前,回歸模型的斜率為仇+色;
若統計檢驗表明,p2
顯著不為零,則我國居民的消
費行為在1979年前后發生了明顯改變。49
第三節案例分析
為了考察改革開放以來中國居民的儲蓄存款與收
入的關系是否已發生變化,以城鄉居民人民幣儲
蓄存款年底余額代表居民儲蓄(y),以國民總
收入GNI代表城鄉居民收入,分析居民收入對儲
蓄存款影響的數量關系,并建立相應的計量經濟
學模型。
50
表8.1國民總收入與居民儲蓄存款單位:億元
城鄉居城鄉居民城鄉居£汰城鄉居民
國民總收)民幣儲人民幣儲民幣儲年游人民幣儲
.4,.?、/..>~~i?/11-/—<U.JiAZ.
南仔就因氏思雙岳仔泡J胃
份
(GNI)底及額蓄存款增款年底w擷額
(Yy份R入(GNI)(VVy
、▲/VV\JLJL7
__in?z/rn(\,.yz、
mMXX、/■<I
19783624.1210.6NA199121662.59241.62121.8
1Q7Q7nA1QQ9a11TROA,二17Q
19804517.8399.5118.5199334560.515203.53444.1
19814860.3532.7―124.219944667021518.86315.3
■<coc
19825301.80/5.4151.7?1ecu57494.929662.38O1Y443,.5E
19835957.4892.5217.1199666850.538520.88858.5
數據來源:《中國統計年鑒2004》,中國統計出版社。表中“城鄉居民人民幣
儲蓄存款年增加額”為年鑒數值,與用年底余額計算的數值有差異。51
表8.1國民總收入與居民儲蓄存款(續)單位:億元
城鄉居城鄉居城鄉居民人城鄉居民人
民人民民人民民幣儲蓄存民幣儲蓄存
年國民總收幣諸蓄一幣儲蓄年國民總收入款年底余額款增加額
份入(GNT)7款年存款增份(GNI)(Y)(YY)
IE亡心
底余額加額
(/)(VY\
19847206.71214.7322.2199773142.746279.87759
19858989.11622.6407.9199876967.253407.57615.4
198610201.42237.6615199980579.459621.86253
198711954.53073.3835.720008825464332.44976.7
198814922.33801.5728.2200195727.973762.49457.6
198916917.85146.91374.22002103935.386910.613233.2
199018598.47119.81923.42003116603.2103617.716631.9
52
為了研究1978—2003年期間城鄉居民儲蓄存款隨收入的
變化規律是否有變化,考證城鄉居民儲蓄存款、國民總收
入隨時間的變化情況,如下圖所示:
53
從上圖中,尚無法得到居民的儲蓄行為發生明顯改變
的詳盡信息。若取居民儲蓄的增量(YY),并作時序
圖(見左下圖):
20000
15000
>10000
5000
0
20000400006000080000100000
GNI
54
產飛
從居民儲蓄增量圖(上頁左圖)可以看出,城鄉居
民的儲蓄行為表現出了明顯的階段特征:在
1996年和2000年有兩個明顯的轉折點。再從城
鄉居民儲蓄存款增量與國民總收入之間關系的散
布圖看(見上頁右圖),也呈現出了相同的階段
性特征。
55
為了分析居民儲蓄行為在1996年前后和2000年前后三個階段
的數量關系,引入虛擬變量D和D。
12
D/和D2的選擇,是以1996、2000年兩個轉折點作為依據,
并設定了如下以加法和乘法兩種方式同時引入虛擬變量的的
模型:
YY,=P1+P2GNL+p3(GNL-66850.50)Du+魚(GNL
苴徵54.00)Dit+ut
出丁.1t2000年以后
fl/=1996年以后
Dit
D\t=<
0/2000年及以前
[0,=1996年及以前
對上式進行回歸后,有:
EVie^s—[Equation:EQO1Vorkfile:CHAPTER8—CAS1
L-JFileEdit0bjeatViewProcQuickOgtionsWindowKelp
,lew|Pro匚|Object|Print|Name|Freeze|Estimate|Foreuast|Stats|Resids|
DependentVariable:YY
Method.LeastSquares
Date:08^2/05Time:21:64
Sample(adjusted):19792003
Includedobservations:25afteradjustments
VariableCoefficientStd.Errort-StatisticProb.
c-830.4045172.1626-4.8233740.0001
GNI0.1444860.00574025.170010.0000
(GNI-66850.50rDUM1-0.291371□027182-10.719200.0000
(GNI-88254.00rDUM20.5602190.04013613,958100.0000
R-squared0989498Meandependentvar41G8.G52
AdjustedR-squared□987998S.D.dependentvar4581.447
S.E.ofregression501,9182Akaikeinfocriterion15.42040
Sumsquaredresid5290359.Schw
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 旅游度假村與酒店用品采購協議
- 健身房夏季防暑降溫和防蟲措施
- 農業現代化智能種植園區智能化管理平臺研發項目
- 神經內科中醫護理實施體系
- 童話寓言作文雨過天晴300字13篇范文
- 靜脈治療護理管理
- 零售超市精細化運營與采購策略優化方案
- 電力行業隱患排查與雙重預防計劃
- 癌癥頭部護理方法
- 人教版六年級音樂與科技結合計劃
- 全息照相與信息光學實驗報告
- 2022年02月上海鐵路局下屬鐵路疾病預防控制所公開招聘畢業生筆試參考題庫含答案解析
- 激光設備買賣合同模板(2篇)
- GB/T 24815-2009起重用短環鏈吊鏈等用6級普通精度鏈
- 線描畫基本功教學課件
- 船上投訴程序(中英文)
- DB37-T 3781-2019 政務服務中心能源消耗定額標準-(高清版)
- 重癥胰腺炎(1)課件
- 科學素養全稿ppt課件(完整版)
- 克拉潑改進型電容三點式振蕩器
- 介入導管室耗材準備及管理
評論
0/150
提交評論