




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、分位數回歸方法及其應用第一頁,共49頁。第一部分:方法介紹 主要包括分位數回歸的概念,分位數回歸系數的估計方法及其性質、分位數回歸系數的檢驗方法、模型的擬合優度檢驗、分位數回歸的優良性(與最小二乘法做比較)。第二頁,共49頁。分位數回歸( QR)產生的根源nMosteller and Tukeys (1977) remark:What the regression curve does is give a grand summary for the averages of the distributions corresponding to the set of xs. We could go
2、 further and compute several different regression curves corresponding to the various percentage points of the distributions and thus get a more complete picture of the set. Ordinarily this is not done, and so regression often gives a rather incomplete picture. Just as the mean gives an incomplete p
3、icture of a single distribution, so the regression curve gives a correspondingly incomplete picture for a set of distribution .第三頁,共49頁。分位數回歸的思想nHow to “go further” ?n分位數回歸的思想最早是由Koenker and Bassett (1978)提出的。它是對古典條件均值模型為基礎的最小二乘的拓展。n普通最小二乘法是利用因變量的條件均值來建模,通過使殘差平方和達到最小來獲得回歸參數的估計。n分位數回歸則利用因變量的條件分位數來建模,
4、通過最小化加權的殘差絕對值之和來估計回歸參數。它可以稱之為“加權的最小一乘回歸法”。第四頁,共49頁。分位數的概念n定義:設隨機變量 Y 的分布函數為 則 Y 的第 分位數為 其中中位數可以表示為 。()()FyP Yy1( )inf :( )Fy F y1(1/ 2)F第五頁,共49頁。 分位數回歸思想的數學公式化n對于 Y 的一組隨機樣本 ,樣本均 值是 的最優解。n樣本中位數是最小化殘差絕對值和的解,即12 , ny yy21m in()niiy11(1/ 2)argminiRiFy第六頁,共49頁。n對于其他的第 分位數,我們可以求解下式:n等價的表示為:其中 , 為示性函數。pR :
5、 :min(1)iiiiii yii yyy1m in()iRiy0, )(,0)( )( )(1)( )zzIzzIz()I 第七頁,共49頁。n對于一般線性條件均值函數 ,通過求解 得到參數估計值。而一般線性條件分位數函數為 ,通過求解 得到參數估計值n對于任意的 ,估計 稱為第 分位數下的回歸系數估計。(Y|X=x)=xEp2R1argmin()niiiyx( |X=x)=x( )Q pR1( )argmin()niiiyx (0,1)( ) 第八頁,共49頁。分位數回歸參數的估計方法(點估計)分位數回歸參數的估計方法(點估計)n求解 等價于求解以下個線性規劃問題: 其中 e 為單位向量
6、。目前對上式的算法主要有如下幾種:pR1( )argmin()niiiyx n|X z=(1- )X e,z0,1 zMax y z第九頁,共49頁。n1.單純形算法(Simplex Method):該算法估計出來的參數具有很好的穩定性,但是在處理大型數據時運算的速度會顯著的降低(見Koenker and Orey,1993)。n2.內點算法(Interior Point Method):內點算法對于那些具有大量觀察值和少量變量的數據集運算效率很高(見Portnoy and Koenker, 1997)。n3.平滑算法 (Smoothing Method):平滑算法在理論上比較簡單,它適合處理
7、具有大量觀察值以及很多變量的數據集 (見Chen, 2004) 。 n其他方法: 如adaptive method 等。第十頁,共49頁。 依據目前的文獻,區間估計方法也可分為三種:1.直接估計法(Direct Estimation Method),見Koenker和Bassett (1982)以及Koenker和Machado (1999)。該方法依據估計出來的回歸分位系數的漸進正態性來計算置信區間。比較有代表性的是Sparsity算法,它是一種最直接且運算速度也最快的算法,但該算法得到的估計值對于隨機項為獨立同分布這一假設十分敏感。2. 秩得分法(Rank Score Method),見K
8、oenker(1994)。秩得分法算法比較簡單,但是對于大型數據處理效率較慢。3. 重復抽樣法(Resampling method),見He和Hu (2002)。該方法使用了MCMB(Markov Chain Marginal Bootstrap)算法,這種算法能夠進行高效率的運算,大大節省了運算時間。重復抽樣法能夠克服直接法和秩得分法的缺陷,但是對于小樣本時計算出的參數估計值不夠穩定。分位數回歸參數的估計方法(區間估計)分位數回歸參數的估計方法(區間估計)第十一頁,共49頁。分位數回歸參數的顯著性檢驗方法分位數回歸參數的顯著性檢驗方法n在分位數回歸模型中,設 Koenker與Machado(
9、1999)提出了檢驗假設n(其中 )的兩個統計量: 和 在原假設下都服從 從而,它們都可能用來檢驗回歸系數的顯著性。12( )( ),( ) 02:( )0H 2( )qR ( )wT( )LRT2q第十二頁,共49頁。分位數回歸模型的擬合優度分位數回歸模型的擬合優度nKoenker與Machado(1999)依據最小二乘回歸中擬合優度 的計算思想,提出了分位數回歸中擬合優度的計算方法,定義為 ,且 。n最小二乘回歸中的 依據殘 差平方和度量了回歸平方和占總離差平方和的比重,而 則按照殘差絕對值的加權和,度量了在某個分位數 下分位數回歸的擬合效果。因此不像 反映的是整個分布的擬合情況, 描述的
10、是在某個分位數下的局部擬合效果。2R1( )R10( ) 1R2R1()R第十三頁,共49頁。線性分位數回歸模型的估計第十四頁,共49頁。分位數回歸的基本性質第十五頁,共49頁。分位數回歸的漸近性質第十六頁,共49頁。 分位數回歸的漸近性質 第十七頁,共49頁。與普通線性最小二乘回歸方法的比較 1.在模型假設方面:OLS法要求滿足經典假設的幾個條件;QR法只要求擾動項 的條件下 。 2.在計算方面:OLS法求解簡單;QR法復雜,但由于計算機技術的發展,其不難完成。 3.在估計的優良性方面:兩者都有各自的優良性。由于QR法在模型的假設方面要求較少,較容易得到滿足。特別是其估計方法(加權最小一乘估
11、計方法)決定了其估計具有較強的穩鍵性。iieF1( ) 0iF第十八頁,共49頁。第二部分:應用實例分析n主要結合應用實例,介紹如何利用統計軟件實現分位數回歸,如何對研究結果進行解釋和分析。第十九頁,共49頁。分位數回歸模型的軟件計算n目前,計算分位數回歸的統計軟件主要有SAS以及R。nEstimation in SAS:第二十頁,共49頁。nEstimation in R ()第二十一頁,共49頁。Example Risk factors for low birthweightnLow birthweight is known to be ass
12、ociated with * Higher infant mortality (Abreveya, 2001). * Higher health-care cost (Lewit et al. 1995). * a Wide range of subsequent health problems (Hack et al., 1995). * long-term educational attainment and even labor market outcomes (Corman and Chaikind, 1998).nInvestigate the facotrs influencing
13、 birthweight, especially the ones that may help reduce the incidence of low birthweight infants.第二十二頁,共49頁。Example Risk factors for low birthweight The research question can be rephrased as exploring the covariate effects on the lower quantiles of birthweight. Potential covariates include Mothers ed
14、ucation Mothers prenatal care Mothers age Mothers weight gain . Covariate effects on lower quantiles may differ from those on the mean or median birthweight. Reference: Abreveya (2001) and Koenker and Hallock (2001).第二十三頁,共49頁。Example : Exploring the risk factors of low birthweight第二十四頁,共49頁。Example
15、 -Exploring the risk factors of low birthweight第二十五頁,共49頁。A quantile regression model for birthweight第二十六頁,共49頁。SAS codes for the birthweight model第二十七頁,共49頁。第二十八頁,共49頁。第二十九頁,共49頁。第三十頁,共49頁。第三十一頁,共49頁。Some conclusions for example 第三十二頁,共49頁。An Engel Curves for Food: This figure plots data taken from
16、 Ernst Engels (1857) study of the dependence of households food expenditure on household income 第三十三頁,共49頁。 n第三部分:分位數回歸的發展和應用第三十四頁,共49頁。分位數回歸的發展n最小二乘方法最早是由Adrien-Marie(1806)提出的。nQR法最早是由Koenker和Bassett(1978)提出的。 從1978-1994年, 從1994-1997年, 從1997-2004年,Less than 370 articles on QR published446 articles
17、on QR published506 articles on QR published第三十五頁,共49頁。nHeteroscedasticitynRobustnessnCensoringnSample selectionnBinary response modelsnPanel datanTime series 分位數回歸的發展第三十六頁,共49頁。分位數回歸的發展nNoparametric modelsnNon-linear modelsnExtremesnMultivariate quantile regressionn.第三十七頁,共49頁。分位數回歸的應用n在環境科學研究方面:Cho
18、ck,Winkler和Chen(2000)使用非參數分位數回歸法研究了匹茲堡這座城市中日死亡率和空氣污染集中度的相互關系;Hilary和Andrzej(2002)運用分位數回歸對天氣數據進行了分析。n在生態學研究方面:Koenker and Schorfheide(1994)分析了上世紀全球氣候改變的過程;Dunham,Cade和Terrell(2002)研究了不同的河流對鮭魚密度的影響。n在生存分析研究方面:Koenker和Hallock(2001)研究了諸多因數對于新生兒出體重的影響;Cole和Green(1992)以及Royston和Altman(1994)還討論了分位數回歸在醫學上的應
19、用。第三十八頁,共49頁。分位數回歸的應用n在勞動力市場研究方面:Buchinsky(1996)研究了美國的勞動力市場;Schultz和Mwabu(1998) 研究了南非的勞動力市場;Montenegro(1998)分析了智利的情況;Fithzenberger、Hujer、Macurdy 和 Schnabe(2001)討論了德國勞動力市場的情況;值得一提的是Machado與Mata (2001)擴展了Oaxaca的分解法,并提出了一種依據分位數回歸過程來模擬邊際分布的方法來研究葡萄牙的勞動力市場;Yu,Philippe和Zhang(2005)使用貝葉斯分位數回歸研究了英國1991-2001年間
20、的工資結構的分布情況;Angrist, Chernozhukov 和Fernandez-val (2006)使用分位數回歸方法研究了美國的工資結構的分布情況;Papapetrou (2006) 則研究了希臘公私企業中的工資差距情況。第三十九頁,共49頁。分位數回歸的應用n在需求分析研究方面:Deaton(1997)利用分位數回歸分析了巴基斯坦的Engel曲線;Hendricks與Koenker(1992)使用分位數回歸研究了電力消費需求情況;Manning,Blumberg and Moulton(1995) 討論了酒精使用的需求情況;Taylor (2007)運用指數加權分位數回歸來預測超級
21、市場的日銷售情況。第四十頁,共49頁。分位數回歸的應用n在收入不平等問題研究方面:Gosling,Machin and Meghir(1996)研究了英國家庭的收入和財富的分布狀況;Conley and Galenson(1998)探討了美國的幾個城市在19世紀中期財富的累積情況;Trede(1998)and Morillo(2000)比較了美國與德國的收入機動性。第四十一頁,共49頁。分位數回歸的應用n在金融資產組合研究方面:Bassett and Chen(2000,2001)運用分位數回歸來評估共同基金的投資類型;Barnes和Hughes(2002)研究了美國資本市場的CAMP模型;M
22、a和Pohlman(2005)運用分位數回歸討論了資產收益預測與最優資產組合的構造。第四十二頁,共49頁。分位數回歸的應用n在金融風險研究方面:在金融市場的風險管理中,VaR已經成為其標志性指標。VaR能夠將金融機構面臨的所有種類各異、形式多樣的風險加總成為一個簡單的數字。Engle and Manganell(2004)首次在VaR的基礎上提出了條件VaR模型(CAViaR),并使用分位數回歸的方法來估計參數,通過對數據的模擬得出了這一模型對于厚尾數據的表現為最優的結論;Taylor(1999)使用分位數回歸的方法來估計多期收益的風險值VaR;Chernozhukov and Umantse
23、v(2001)使用分位數回歸深入研究了CVaR的模型與估計方面的問題;Chen和Chen(2003)分別用分位數回歸方法和方差-協方差法計算日經225指數的VaR值,實證結果為前者很大程度上優于后者;Georgios and Leonidas(2005)使用CAViaR 模型估計了美國和希臘證券市場中的市場風險值。第四十三頁,共49頁。第四十四頁,共49頁。第四十五頁,共49頁。第四十六頁,共49頁。第四十七頁,共49頁。我們在分位數研究方面發表的論文1. 陳建寶、段景輝:中國性別工資差異的分位數回歸分析, 數量經濟技術經濟研究,2009.10, pp. 87-97.2. 段景輝、陳建寶:城鄉家庭收入差異影響因素的分位數回歸解析, 經濟學家,2009.9. No.129, pp. 46-53.3. 陳建寶、杜小敏:基于分位數回歸的我國居民收入和消費的實證分析,統計與信息論壇, 2009, Vol.24, No.7, pp.44-50.4.丁軍軍、陳建寶: 基于CAViaR模型的股票風險實證分析. 數據分析(臺灣), 2007, Vol. 2, No. 4: 65-78.5. 陳建寶
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 蘋果公司生產與運作管理
- 影視新聞采編服務企業制定與實施新質生產力戰略研究報告
- 郵政工程設計行業跨境出海戰略研究報告
- 貴金屬壓延加工材行業跨境出海戰略研究報告
- 預制混凝土護坡砌塊行業跨境出海戰略研究報告
- 鋼筋混凝土梁行業直播電商戰略研究報告
- 2025年中考生物復習課件 第3章 植物的主要類群
- Unit 2 Room Lesson 3(教學設計)-2023-2024學年人教新起點版英語一年級下冊
- 混膠管企業制定與實施新質生產力戰略研究報告
- 錄音制品出版服務行業跨境出海戰略研究報告
- 全國班主任比賽一等獎班主任經驗交流《春風化為雨潤物細無聲》精美課件
- 高一年級《沂蒙精神進校園》班會 《沂蒙精神進校園》 課件
- 物業應急演練計劃應急預案演練計劃
- 高一年級總結暨表彰大會校長講話希望同學們以本次考試為起點用行動來踐行自己對家長的承諾
- 知識產權合規管理體系解讀
- 專題12:賓語從句 -2023年中考英語考試研究(解析版)(上海專用)
- GB/T 2624.5-2024用安裝在圓形截面管道中的差壓裝置測量滿管流體流量第5部分:錐形裝置
- 消防施工方案范本完整版
- 2024年大學英語四級單詞表不含高中
- 四川省成都市武侯區北京第二外國語學院成都附屬中學2024-2025學年八年級上學期期中考試英語試題(含答案無聽力原文及音頻)
- 【MOOC】老子的人生智慧-東北大學 中國大學慕課MOOC答案
評論
0/150
提交評論