




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
學習內容與要求本章主要介紹因變量受定性因素影響時如何分析的問題。要求通過本章學習掌握虛擬變量的基本含義,以及在模型中的運用,熟悉同時含有虛擬變量和定性變量的模型。第五章虛擬變量
(DummyVariable)第五章虛擬變量
主要內容5.1虛擬變量(定性變量)的定義、作用和取值5.2虛擬變量的設置5.3兩分定性變量模型5.4多分定性變量模型5.5多個定性變量模型5.6同時含有虛擬變量和定量變量的模型5.7虛擬變量EViews應用舉例回歸分析中因變量影響因素定量因素定性因素虛擬變量具有數量特征,能夠賦予具體數值的變量不具有數量特征,只是表明事物的某種屬性第五章虛擬變量
5.1虛擬變量(定性變量)的定義、作用和取值1.虛擬變量(啞變量、屬性變量、雙值變量、類型變量)的定義指反映定性因素變化的變量。既可作因變量,也可作解釋變量。本章主要討論虛擬變量為自變量的情形。2.引入虛擬變量的作用引入虛擬變量的作用,在于將定性因素或屬性因素對因變量的影響數量化。(1)可以描述和測量定性(或屬性)因素的影響;(2)能夠正確反映經濟變量之間的相互關系,提高模型的精度;(3)便于處理異常數據。設置虛擬變量(即將異常數據作為一個特殊的定性因素)。例如:第五章虛擬變量
5.1虛擬變量(定性變量)的定義、作用和取值屬性狀態人工變量取值具有某種屬性1不具有某種屬性0解決思路:人工構造變量:將定性變量量化,取值僅為1和0的人工變量,通常用D表示,使其能與定量變量一樣可以在回歸模型中應用。解決辦法:第五章虛擬變量
5.1虛擬變量(定性變量)的定義、作用和取值例如:(1)表示性別的虛擬變量可取為D1=1男性0女性(2)表示文化程度的虛擬變量可取為D2=1本科及以上學歷0本科以下學歷(3)表示地區的虛擬變量可取為D3=1城市0農村(4)表示消費心理的虛擬變量可取為D4=1喜歡某種商品0不喜歡某種商品(5)表示天氣變化的虛擬變量可取為D5=0雨天1晴天第五章虛擬變量
5.1虛擬變量(定性變量)的定義、作用和取值第五章虛擬變量
5.2虛擬變量的設置5.2.1虛擬變量的陷阱虛擬變量之間產生多重共線性設置不當第五章虛擬變量
5.2虛擬變量的設置舉例:考查季節因素對美國制造業的銷售量的影響。由于季節有四個水平,因此需引入三個虛擬變量,設冬季為基礎類型變量,Yi為銷售量,模型為:1春季1夏季1秋季D1=,D2=,D3=0其他0其他0其他第五章虛擬變量
5.2虛擬變量的設置當D1=D2=D3=0時,就表示冬季。如果引入四個虛擬變量,即1春季1夏季D1=,D2=,0其他0其他1秋季1冬季D3=,D4=0其他0其他模型變為,此時,D1+D2+D3+D4=1,陷入虛擬變量陷阱。第五章虛擬變量
5.2虛擬變量的設置5.2.2虛擬變量的設置規則在模型中,有截距項,若每一定性因素有m個水平屬性(或類型),則模型中只能引入m-1個虛擬變量。無截距項,則引入m個虛擬變量。舉例1:公司職員的年薪與工齡(x)和受教育程度(D)有關。若將受教育程度簡單分為大學畢業于非大學畢業。根據規則,應引入一個虛擬變量D。1,大學畢業D=0,其他年薪模型為:第五章虛擬變量
5.2虛擬變量的設置舉例2公司職員的年薪與工齡(x)和學歷(D)有關。學歷分為大專以下、本科生、研究生三個水平。為了反映學歷對職工年薪的影響,可引入兩個虛擬變量:1本科1研究生D1=,D2=0其他0其他年薪模型為:第五章虛擬變量
5.2虛擬變量的設置8.2.3虛擬變量的取值方法“1”表示具有某種屬性或特征,為比較類型、肯定類型?!?”表示不具有某種屬性或特征,為基礎類型、否定類型。第五章虛擬變量
5.3兩分定性變量模型兩分定性變量模型指所研究的定性變量只有兩種性質。舉例:分析某公司員工的性別對薪水的影響:假設WAGE為薪水,DUMMY為性別,取1為男性,取0為女性。設立回歸方程:WAGE=α+βDUMMY+μ第五章虛擬變量
5.3兩分定性變量模型VariableCoefficientStd.Errort-StatisticProbDUMMY568.2274168.22083.3778680.0015C1518.696122.537312.393740.0000EViews的輸出結果為:經驗回歸方程為:WAGE=1518.696+568.2274DUMMY第五章虛擬變量
5.3兩分定性變量模型由于只有0.195343,故模型整體的擬合優度很差,但是對于只含有虛擬變量的模型,重要的是觀察自變量的性質是否影響到因變量。由于DUMMY的p值為0.0015,意味著在1%的顯著性水平下,可以接受DUMMY之前的系數不為0。第五章虛擬變量
5.3兩分定性變量模型觀察性別差異對薪酬的影響:對于男性員工,平均薪水E(Yi/Di=1)α+β=2086.9234對于女性員工,平均薪水E(Yi/Di=0)=α=1518.696兩者相差β,即568.2274。第五章虛擬變量
5.4多分定性變量模型多分定性變量的含義模型中定性變量含有兩個以上水平屬性或類型。在模型中只有一個虛擬變量是不夠的,需要兩個或兩個以上的虛擬變量添加到模型中去。第五章虛擬變量
5.4多分定性變量模型舉例:前面例子中,公司職員的年薪與工齡(x)和學歷(D)有關。學歷分為大專以下、本科生、研究生三個水平。為了反映學歷對職工年薪的影響,可引入兩個虛擬變量:1本科1研究生D1=,D2=0其他0其他年薪模型為:第五章虛擬變量
5.4多分定性變量模型如果一個員工是本科學歷,則D1=1,D2=0;如果一個員工是研究生學歷,則D1=0,D2=1;如果一個員工沒有接受大學教育,則D1=0,D2=0。此時:E(Yi/D1=0,D2=0)=α表示沒有大學學歷的員工的平均薪水E(Yi/D1=1,D2=0)=α+β1表示有本科學歷的員工的平均薪水E(Yi/D1=0,D2=1)=α+β2表示有研究生學歷的員工的平均薪水第五章虛擬變量
5.5多個定性變量模型一個模型中,可能不只需要一個定性變量,而是包括若干個定性變量,并且每個虛擬變量可能不止一個性質。舉例:考察教授的薪金決定因素,假定涉及的定性變量為性別和膚色,設教授的薪金為Yi,則模型為:
1男性1白人D1=,D2=0女性0黑人第五章虛擬變量
5.5多個定性變量模型此時,E(Yi/D1=0,D2=0)=α表示黑人女教授的平均薪金E(Yi/D1=1,D2=0)=α+β1表示黑人男教授的平均薪金E(Yi/D1=0,D2=1)=α+β2表示白人女教授的平均薪金E(Yi/D1=1,D2=1)=α+β2表示白人男教授的平均薪金通過β1與β2的顯著性檢驗,判斷性別和種族歧視是否影響工資薪酬。第五章虛擬變量
5.5多個定性變量模型舉例:考察某家公司49名員工的薪金和性別的數據。其中,WAGE為工資,RACE為人種,RACE值取1表示為白人,0表示其他人種;CLERICAL為工作性質,取1為公司職員,取0位其他;GENDER為性別,取1為男性,取0為女性。模型為:WAGE=α+β1RACE+β2CLERICAL+β3GENDER+uT第五章虛擬變量
5.5多個定性變量模型VariableCoefficientStd.Errort-StatisticProbRACE561.1595160.38153.4989030.0011GENDER117.6163191.32230.6147550.5418CLERICAL-796.5342210.4523-3.7848690.0005C1706.833177.51719.6150360.0000根據樣本數據的EViews回歸結果如下:數據顯示,RACE、CLERICAL的p值在1%的顯著性水平下,工作性質和膚色在這家公司員工的薪酬差異中能起到很好的解釋作用。但GENDER這一變量的參數的顯著性不強,可以認為該家企業薪酬上不存在性別歧視。第五章虛擬變量
5.6同時含有虛擬變量和定量變量的模型虛擬變量模型的定義同時含有一般解釋變量與虛擬變量的模型稱為虛擬變量模型或者方差分析(analysis-ofvariance:ANOVA)模型。兩種變量同時出現在模型中,需要謹慎對待每個變量對回歸總體作用的影響。一個以性別為虛擬變量來考察職工薪金的模型如下:其中例如:
——為職工的薪金;單擊此處添加備注為職工工齡;=1——代表男性=0——代表女性
構造虛擬變量模型的兩種基本方式:
加法方式所設定的計量經濟模型中加入適當的虛擬變量,此時虛擬變量與其他解釋變量在設定模型中是相加關系。其作用是改變了設定模型的截距水平。
乘法方式在所設定的計量經濟模型中,將虛擬解釋變量與其他解釋變量相乘作為新的解釋變量出現在模型中,以達到其調整設定模型斜率系數的目的。第五章虛擬變量
5.6同時含有虛擬變量和定量變量的模型1.加法方式上述職工薪金模型中性別虛擬變量的引入就采取了加法方式,女職工的平均薪金為:男職工的平均薪金為:在該模型中,如仍假定,則:第五章虛擬變量
5.6同時含有虛擬變量和定量變量的模型從幾何意義上看
男女職工平均薪金示意圖則兩個函數有相同的斜率,但有不同的截距。假定
,這意味著,男女職工平均薪金對工齡的變化率
是一樣的,但兩者的平均薪金水平相差。
可以通過傳統的回歸檢驗,對的統計顯著性進行檢驗,以判斷男女職工的平均薪金水平是否顯著差異。第五章虛擬變量
5.6同時含有虛擬變量和定量變量的模型2、乘法方式許多情況下:往往是斜率就有變化,或斜率、截距同時發生變化。斜率的變化可通過以乘法的方式引入虛擬變量來測度。例:根據消費理論,消費水平C主要取決于收入水平Y,但在一個較長的時期,人們的消費傾向會發生變化,尤其是在自然災害、戰爭等反常年份,消費傾向往往出現變化。這種消費傾向的變化可通過在收入的系數中引入虛擬變量來考察。在所設定的計量經濟模型中,將虛擬解釋變量與其他解釋變量相乘作為新的解釋變量出現在模型中,以達到其調整設定模型斜率系數的目的。乘法形式引入虛擬解釋變量的主要作用:①兩個回歸模型之間的比較;②提高模型對現實經濟現象的描述精度。
第五章虛擬變量
5.6同時含有虛擬變量和定量變量的模型例:隨著收入水平的提高,家庭教育費用支出的邊際消費傾向可能會發生變化。為了反映定性因素對斜率的影響,可以用乘法方式引入虛擬變量,將家庭教育費用支出函數取成:虛擬變量對斜率的影響
第五章虛擬變量
5.6同時含有虛擬變量和定量變量的模型斜率差異這里,虛擬變量D以與X相乘的方式引入了模型中,從而可用來考察消費傾向的變化。如,設消費模型可建立如下:第五章虛擬變量
5.6同時含有虛擬變量和定量
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 石材開采中的環境保護措施考核試卷
- 有色金屬壓延加工環境風險評估考核試卷
- 疫苗抗病毒感染機制考核試卷
- 股權投資中的Pre-IPO策略考核試卷
- 羧甲基纖維的市場前景分析考核試卷
- 稀土金屬加工企業發展戰略考核試卷
- 電視廣播多頻段接收器與轉換技術考核試卷
- 職業技能成長策略分享會議考核試卷
- 熱電聯產技術發展趨勢考核試卷
- 礦山污染物排放與環保標準考核試卷
- T-COFA 0021-2022 漁用油電混合多旋翼無人機安全檢查和維 護保養要求
- 2025貴州畢節市七星關區招聘城市社區工作者186人筆試備考題庫及答案解析
- 2025屆河北省“五個一”名校聯盟高三下學期4月聯考化學試題(含答案)
- 山東省泰安市2025屆高三二輪模擬檢測考試政治(泰安二模)(含答案)
- 2025-2030中國環境監測發展分析及發展趨勢與投資前景研究報告
- 2025年教師資格證面試結構化模擬題:教師心理健康維護試題集
- 大疆精靈4 RTK無人機操作與測繪培訓指南
- 2025屆江蘇省南京一中高三第二次模擬考試物理試卷含解析
- 初中語文第16課《有為有不為》課件-2024-2025學年統編版語文七年級下冊
- 2025年內蒙古化工職業學院單招職業技能考試題庫必考題
- 安徽省歷年中考數學試卷,2014-2021年安徽中考數學近八年真題匯總(含答案解析)
評論
0/150
提交評論