




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
計量經濟學第二章簡單線性回歸模型1從2004中國國際旅游交易會上獲悉,到2020年,中國旅游業總收入將超過3000億美元,相當于國內生產總值的8%至11%。(資料來源:國際金融報2004年11月25日第二版)◆是什么決定性的因素能使中國旅游業總收入到2020年達到3000億美元?◆旅游業的發展與這種決定性因素的數量關系究竟是什么?◆怎樣具體測定旅游業發展與這種決定性因素的數量關系?引子:
中國旅游業總收入將超過3000億美元嗎?2第二章簡單線性回歸模型
本章主要討論:
●回歸分析與回歸函數
●簡單線性回歸模型參數的估計●擬合優度的度量●回歸系數的區間估計和假設檢驗●簡單線性回歸模型檢驗●回歸模型預測3第一節回歸分析與回歸方程本節基本內容:
●回歸與相關●總體回歸函數●隨機擾動項●樣本回歸函數●非線性模型線性化
4
1.經濟變量間的相互關系
◆確定性的函數關系
◆不確定性的統計關系—相關關系
(ε為隨機變量)
◆沒有關系一、回歸與相關
(對統計學的回顧)5對變量間統計依賴關系的考察主要是通過相關分析(correlationanalysis)或回歸分析(regressionanalysis)來完成的:62.相關關系◆相關關系的描述
相關關系最直觀的描述方式——散點圖
7
◆相關關系的類型
●
從涉及的變量數量看
簡單相關多重相關(復相關)
●
從變量相關關系的表現形式看
線性相關——散布圖接近一條直線非線性相關——散布圖接近一條曲線
●
從變量相關關系變化的方向看
正相關——變量同方向變化,同增同減負相關——變量反方向變化,一增一減不相關89▲注意①不線性相關意味著不相關?②有相關關系意味著一定有因果關系?③相關分析對稱地對待任何(兩個)變量,兩個變量都被看作是隨機的。回歸分析對變量的處理方法存在不對稱性,即區分應變量(被解釋變量)和自變量(解釋變量):前者是隨機變量,后者不是。10相關系數的度量總體相關系數:樣本相關系數:11相關系數的取值范圍12
●X和Y都是相互對稱的隨機變量,x與y和y與x的相關系數相等。●
線性相關系數只反映變量間的線性相關程度,不能說明非線性相關關系。●
相關系數只能反映線性相關程度,不能確定因果關系,不能說明相關關系具體接近哪條直線●相關系數是總體相關系數的樣本估計值,由于抽樣波動,樣本相關系數是個隨機變量,其統計顯著性有待檢驗。
計量經濟學關心:變量間的因果關系及隱藏在隨機性后面的統計規律性,這有賴于回歸分析方法
使用相關系數時應注意13簡單相關系數的檢驗14線性相關系數的局限性154.回歸分析回歸的古典意義:高爾頓遺傳學的回歸概念
(父母身高與子女身高的關系)回歸的現代意義:一個被解釋變量對若干解釋變量依存關系的研究回歸的目的(實質):由固定的解釋變量去估計被解釋變量的平均值161.相關分析
變量性質:都是隨機變量且關系對等。
分析方法:圖表法和相關系數。
分析目的:判定變量之間相關的方向和關系的密切程度。相關分析和回歸分析區別172.回歸分析變量性質:解釋變量(因)與被解釋變量(果)的關系不對等。解釋變量是非隨機的被解釋變量是隨機的分析方法:建立回歸方程。分析目的:變量之間的數量依存關系,并根據自變量的數值變化去推測因變量數值變化。18相關分析和回歸分析聯系相關分析與回歸分析有密切的聯系,都是對變量之間相關關系的研究,二者可以互相補充。相關分析表明變量之間相關關系的性質和程度,只有變量之間存在一定程度的相關關系時,進行回歸分析尋求相關的具體數學形式才有實際意義。19●
的條件分布
當解釋變量
取某固定值時(條件),
的值不確定,
的不同取值形成一定的分布,即
的條件分布。●
的條件期望
對于
的每一個取值,
對
所形成的分布確定其期望或均值,稱為
的條件期望或條件均值
注意幾個概念20●回歸線:
對于每一個
的取值,都有
的條件期望與之對應,代表這些
的條件期望的點的軌跡所形成的直線或曲線,稱為回歸線。21
回歸函數:應變量的條件期望隨解釋變量的的變化而有規律的變化,如果把的條件期望表現為的某種函數這個函數稱為回歸函數。回歸函數分為:總體回歸函數和樣本回歸函數舉例:假如已知100個家庭構成的總體。22每月家庭可支配收入
X100015002000250030003500400045005000550082096211081329163218422037227524642824888102412011365172618742110238825893038932112112641410178619062225242627903150每960121013101432183510682319248828563201月125913401520188520662321258729003288家132414001615194321852365265030213399庭1448165020372210239827893064消1489171220782289248728533142費1538177821792313251329343274支160018412298239825383110出17021886231624232567
Y1900238724532610201224982487271025892586900115014001650190021502400265029003150例:100個家庭構成的總體(單位:元)2324二、總體回歸函數(PRF)1.總體回歸函數的概念
假如已知所研究的經濟現象的總體應變量
和解釋變量X的每個觀測值,可以計算出總體應變量Y的條件均值E[Y|X],并將其表現為解釋變量X的某種函數E[Y|X]=f(x)這個函數稱為總體回歸函數(PRF)25
(1)條件均值表現形式
假如
的條件均值是解釋變量
的線性函數,可表示為:
(2)個別值表現形式
對于一定的,
的各個別值分布在的周圍,若令各個與條件均值的偏差為,顯然是隨機變量,則有
或
2.總體回歸函數的表現形式26上式稱為總體回歸模型,真實反映被解釋變量與解釋變量和隨機因素的關系。該模型參數是未知的。上式稱為總體回歸函數(方程),真實反映被解釋變量均值與解釋變量的關系。該方程參數是未知的。27......
..由于總體回歸模型參數不知道,所以只能通過抽樣調查取得數據,并基于數據估計出參數的近似值。28●實際的經濟研究中總體回歸函數通常是未知的,只能根據經濟理論和實踐經驗去設定。“計量”的目的就是尋求PRF。●總體回歸函數中
與
的關系可是線性的,也可是非線性的。對線性回歸模型的“線性”有兩種解釋
就變量而言是線性的
——
的條件均值是
的線性函數
就參數而言是線性的
——
的條件均值是參數
的線性函數
3.如何理解總體回歸函數29
變量、參數均為“線性”
參數“線性”,變量”非線性”變量“線性”,參數”非線性”計量經濟學中:
線性回歸模型主要指就參數而言是“線性”,因為只要對參數而言是線性的,都可以用類似的方法估計其參數。“線性”的判斷30三、隨機擾動項◆概念:
各個值與條件均值的偏差代表排除在模型以外的所有因素對
的影響。◆性質:是期望為0有一定分布的隨機變量重要性:隨機擾動項的性質決定著計量經濟方法的選擇31
●
未知影響因素的代表●
無法取得數據的已知影響因素的代表●
眾多細小影響因素的綜合代表●
模型的設定誤差●
變量的觀測誤差●
變量內在隨機性引入隨機擾動項的原因32四、樣本回歸函數(SRF)
樣本回歸線:
對于的一定值,取得的樣本觀測值,可計算其條件均值,樣本觀測值條件均值的軌跡稱為樣本回歸線。
樣本回歸函數:如果把應變量的樣本條件均值表示為解釋變量X的某種函數,這個函數稱為樣本回歸函數(SRF)。
33SRF的特點●每次抽樣都能獲得一個樣本,就可以擬合一條樣本回歸線,所以樣本回歸線隨抽樣波動而變化,可以有許多條(SRF不唯一)。
SRF2SRF134●樣本回歸函數的函數形式應與設定的總體回歸函數的函數形式一致。●樣本回歸線還不是總體回歸線,至多只是未知總體回歸線的近似表現。35例一個假想社區是有一百戶家庭組成的總體,研究該社區每月家庭消費支出Y與每月家庭可支配收入X的關系,即根據家庭的每月的可支配收入,考察該社區家庭每月消費支出的平均水平。為方便研究,將該100戶家庭組成的總體按照可支配收入水平劃分為10組,并分析每一組的家庭消費支出。收入支出統計表見下頁。單位:元36X800110014001700200023002600290032003500每月家庭消費支出Y56163886910231254140816501969209022995947489131100130914521738199121342321627814924114413641551174920462178253063884797911551397159518042068226626299351012121014081650174821012354286096810451243147416721881218924862871107812541496168319252233255211221298149617161969224425851155133115621749201322992640118813641573177120352310121014081606180421011430165018702112171619472002合計24204950114951644519305238702502521450212851551037收入水平800110014001700200023002600290032003500條件均值60582510451265148517051925214523652585收入水平與消費支出的條件均值統計表單位:元38家庭消費支出與可支配收入的一個隨機樣本X800110014001700200023002600290032003500Y59463811221150140815951969207825852530單位(元)39
樣本回歸函數如果為線性函數,可表示為
其中:是與相對應的的樣本條件均值和分別是樣本回歸函數的參數應變量的實際觀測值不完全等于樣本條件均值,二者之差用表示,稱為剩余項或殘差項:
或者樣本回歸函數的表現形式40
對樣本回歸的理解
如果能夠獲得和的數值,顯然:●和是對總體回歸函數參數和的估計
●是對總體條件期望的估計
●
在概念上類似總體回歸函數中的,可視為對的估計。樣本線性回歸模型41
樣本回歸函數與總體回歸函數的關系
SRF
PRF
A
42樣本回歸函數通過樣本回歸模型推斷總體回歸模型抽取樣本運用回歸分析方法估計出樣本回歸模型——樣本回歸函數43估計量一個估計量又稱統計量,是指一個公式或方法,是用已知的樣本所提供的信息去估計總體參數。估計量的二重性:統計量是樣本的函數,因為抽樣是隨機的,統計量具有隨機性;對一次已經實現的抽樣,統計量又是確定的。在應用中,由估計量算出的數值稱為估計值。44
與抽樣有關
與抽樣無關關系可估計得到
關系未知
近似關系真實關系總體回歸方程與樣本回歸方程的區別45如果估計誤差較小,即估計值與真實值比較接近,則可以用樣本回歸方程近似地代替總體回歸方程,即利用樣本回歸方程近似地描述總體的平均變化規律。因此,回歸分析的主要內容可以概括成:根據樣本觀察值確定樣本回歸方程;檢驗樣本回歸方程對總體回歸方程的近似程度;利用樣本回歸方程分析總體的平均變化規律。46回歸分析的目的
用樣本回歸函數SRF去估計總體回歸函數PRF。
由于樣本對總體總是存在代表性誤差,SRF總會過高或過低估計PRF。要解決的問題:尋求一種規則和方法,使得到的SRF的參數和盡可能“接近”總體回歸函數中的參數和。這樣的“規則和方法”有多種,最常用的是最小二乘法47
五、非線性模型的處理1.可線性化直接置換法對數變換法2.不可線性化泰勒公式(級數)展開法高斯-牛頓迭代法牛頓-拉夫森迭代法481、直接置換法:
用變量代換使代換后的變量呈現線性關系。49
2、對數變換法:將回歸方程取對數,然后變量代換503、級數展開法:首先展開成冪級數,然后取線性項51非線性模型的線性化5253545556575859606162第二節
簡單線性回歸模型的最小二乘估計
本節基本內容:●簡單線性回歸的基本假定●普通最小二乘法●OLS回歸線的性質●參數估計式的統計性質63
一、簡單線性回歸的基本假定
1.為什么要作基本假定?
●模型中有隨機擾動,估計的參數是隨機變量,只有對隨機擾動的分布作出假定,才能確定所估計參數的分布性質,也才可能進行假設檢驗和區間估計●只有具備一定的假定條件,所作出的估計才具有較好的統計性質。64
(1)對模型和變量的假定如假定解釋變量是非隨機的,或者雖然是隨機的,但與擾動項
是不相關的。假定解釋變量
在重復抽樣中為固定值。假定模型對變量和函數的設定是正確的,無設定誤差。假定模型對參數是線性的,y與參數和x之間為線性關系。2、基本假定的內容65
又稱高斯假定、古典假定假定1:零均值假定
在給定的條件下,的條件期望為零假定2:同方差假定
在給定的條件下,的條件方差為某個常數(2)對隨機擾動項
的假定66
假定3:無自相關假定
隨機擾動項的逐次值互不相關
假定4:隨機擾動與解釋變量不相關
67
假定5:對隨機擾動項分布的正態性假定即假定服從均值為零、方差為的正態分布
(說明:正態性假定不影響對參數的點估計,但對確定所估計參數的分布性質是需要的。且根據中心極限定理,當樣本容量趨于無窮大時,的分布會趨近于正態分布。所以正態性假定是合理的)68的分布性質由于
的分布性質決定了的分布性質。對的一些假定可以等價地表示為對的假定:假定1:零均值假定
假定2:同方差假定假定3:無自相關假定假定5:正態性假定69(3)對模型參數估計時的假設樣本觀測次數必須大于待估計的參數的個數。X的數值要有變異性,不可以全是相同的值。70二、普通最小二乘法
(OrdinaryLeastSquares)對于一元線性回歸模型,假設從總體中獲取了n組觀察值(X1,Y1),(X2,Y2),…,(Xn,Yn)。對于平面中的這n個點,可以使用無數條曲線來擬合。要求樣本回歸函數盡可能好地擬合這組值.綜合起來看,這條直線處于樣本數據的中心位置最合理。
71選擇最佳擬合曲線的標準可以確定為:使總的擬合誤差(即總殘差)達到最小。有以下三個標準可以選擇:(1)用“殘差和最小”確定直線位置是一個途徑。但很快發現計算“殘差和”存在相互抵消的問題.72yx縱向距離A為實際點,B為擬合直線上與之對應的點....73....Y4Y1Y2Y3X1X2X3X4}}{{u1u2u3u4xyE(Y|X)=b1+b2X74(2)用“殘差絕對值和最小”確定直線位置也是一個途徑。但絕對值的計算比較麻煩。(3)最小二乘法的原則是以“殘差平方和最小”確定直線位置。用最小二乘法除了計算比較方便外,得到的估計量還具有優良特性。這種方法對異常值非常敏感
描述這一標準最常用的是普通最小二乘法(OrdinaryLeastSquare,OLS):所選擇的回歸模型應該使所有觀察值的殘差平方和達到最小75
◆OLS的基本思想●不同的估計方法可得到不同的樣本回歸參數和,所估計的也不同。●理想的估計方法應使與的差即剩余越小越好●因可正可負,所以可以取最小即76數學推證77
正規方程和估計式
用克萊姆法則求解得觀測值形式的OLS估計式:
取偏導數為0,得正規方程78
為表達得更簡潔,或者用離差形式OLS估計式:
注意其中:用離差表現的OLS估計式79而且樣本回歸函數可寫為
上式也稱為樣本回歸函數的離差形式。注意:在計量經濟學中,往往以小寫字母表示對均值的離差。
8081三、OLS回歸線的性質可以證明:書上P34●回歸線通過樣本均值●估計值的均值等于實際觀測值的均值
82●剩余項的均值為零●應變量估計值與剩余項不相關
●解釋變量與剩余項不相關
83
四、參數估計式的統計性質(一)參數估計式的評價標準
1.無偏性前提:重復抽樣中估計方法固定、樣本數不變、經重復抽樣的觀測值,可得一系列參數估計值參數估計值的分布稱為的抽樣分布,密度函數記為如果,稱是參數
的無偏估計式,否則稱是有偏的,其偏倚為(見圖1.2)84圖1.2估計值偏倚
概率密度85前提:樣本相同、用不同的方法估計參數,可以找到若干個不同的估計式
目標:努力尋求其抽樣分布具有最小方差的估計式——最小方差準則,或稱最佳性準則(見圖1.3)
既是無偏的同時又具有最小方差的估計式,稱為有效估計式。2.最小方差性86概率密度
圖1.3估計值87
4.漸近性質(大樣本性質)
思想:當樣本容量較小時,有時很難找到最佳無偏估計,需要考慮樣本擴大后的性質一致性:
當樣本容量
n
趨于無窮大時,如果估計式依概率收斂于總體參數的真實值,就稱這個估計式是
的一致估計式。即或
漸近有效性:當樣本容量n趨于無窮大時,在所有的一致估計式中,具有最小的漸近方差。
(見圖1.4)88概率密度
估計值
圖1.489(二)
OLS估計式的統計性質●
由OLS估計式可以看出
由可觀測的樣本值和唯一表示。●
因存在抽樣波動,OLS估計是隨機變量●
OLS估計式是點估計式90當模型參數估計出后,需考慮參數估計值的精度,即是否能代表總體參數的真值,或者說需考察參數估計量的統計性質。一個用于考察總體的估計量,可從如下幾個方面考察其優劣性:
(1)線性性,即它是否是另一隨機變量的線性函數;91(2)無偏性,即它的均值或期望值是否等于總體的真實值;(3)有效性,即它是否在所有線性無偏估計量中具有最小方差。
這三個準則也稱作估計量的小樣本性質。擁有這類性質的估計量稱為最佳線性無偏估計量(bestlinerunbiasedestimator,BLUE)。
92(4)漸近無偏性,即樣本容量趨于無窮大時,是否它的均值序列趨于總體真值;(5)一致性,即樣本容量趨于無窮大時,它是否依概率收斂于總體的真值;(6)漸近有效性,即樣本容量趨于無窮大時,是否它在所有的一致估計量中具有最小的漸近方差。
當不滿足小樣本性質時,需進一步考察估計量的大樣本或漸近性質:931.線性特征
是的線性函數
2.無偏特性
3.最小方差特性
在所有的線性無偏估計中,OLS估計具有最小方差結論:在古典假定條件下,OLS估計式是最佳線性無偏估計式(BLUE)OLS估計式的統計性質——高斯定理949596的估計證明見P6997結論:高斯-馬爾可夫定理:在古典假定條件下,用OLS法得到的估計量就具有最佳線性無偏性。估計量稱最佳線性無偏估計量。最佳線性無偏估計特性保證估計值最大限度的集中在真值周圍,估計值的置信區間最小。98所有的估計值線性估計值線性無偏估計值最小二乘估計值|方差最小高斯-馬爾科夫理論所考慮的各種估計值分類圖99第三節
擬合優度的度量本節基本內容:●什么是擬合優度●總變差的分解●可決系數
100說明回歸分析是要通過樣本所估計的參數來代替總體的真實參數,或者說是用樣本回歸線代替總體回歸線。盡管從統計性質上已知,如果有足夠多的重復抽樣,參數的估計值的期望(均值)就等于其總體的參數真值,但在一次抽樣中,估計值不一定就等于該真值。101那么,在一次抽樣中,參數的估計值與真值的差異有多大,是否顯著,這就需要進一步進行統計檢驗。主要包括擬合優度檢驗、變量的顯著性檢驗及參數的區間估計。102
一、什么是擬合優度?
概念:樣本回歸線是對樣本數據的一種擬合,不同估計方法可擬合出不同的回歸線,擬合的回歸線與樣本觀測值總有偏離。
樣本回歸線對樣本觀測數據擬合的優劣程度
——擬合優度擬合優度的度量建立在對總變差分解的基礎上103二、總變差的分解
分析Y的觀測值、估計值與平均值的關系將上式兩邊平方加總,可證得
(TSS)(ESS)(RSS)
104
總變差(TSS):應變量Y的觀測值與其平均值的離差平方和(總平方和)
解釋了的變差(ESS):應變量Y的估計值與其平均值的離差平方和(回歸平方和)
剩余平方和(RSS):應變量觀測值與估計值之差的平方和(未解釋的平方和)105
變差分解的圖示106
三、可決系數以TSS同除總變差等式兩邊:或
定義:回歸平方和(解釋了的變差ESS)在總變差(TSS)中所占的比重稱為可決系數,用表示:
或
107作用:可決系數越大,說明在總變差中由模型作出了解釋的部分占的比重越大,模型擬合優度越好。反之可決系數小,說明模型對樣本觀測值的擬合程度越差。特點:●可決系數取值范圍:●隨抽樣波動,樣本可決系數是隨抽樣而變動的隨機變量●可決系數是非負的統計量可決系數的作用和特點108可決系數與相關系數的關系(1)聯系
數值上,可決系數等于應變量與解釋變量之間簡單相關系數的平方:109可決系數與相關系數的關系可決系數相關系數就模型而言就兩個變量而言說明解釋變量對應變量的解釋程度度量兩個變量線性依存程度。度量不對稱的因果關系度量不含因果關系的對稱相關關系取值:[0,1]取值:[-1,1](2)區別110運用可決系數時應注意●可決系數只是說明列入模型的所有解釋變量對因變量的聯合的影響程度,不說明模型中每個解釋變量的影響程度(在多元中)●回歸的主要目的如果是經濟結構分析,不能只追求高的可決系數,而是要得到總體回歸系數可信的估計量,可決系數高并不表示每個回歸系數都可信任●如果建模的目的只是為了預測因變量值,不是為了正確估計回歸系數,一般可考慮有較高的可決系數111第四節
、回歸系數的區間估計本節基本內容:●OLS估計的分布性質●回歸系數的區間估計
112問題的提出
為什么要作區間估計?OLS估計只是通過樣本得到的點估計,不一定等于真實參數,還需要找到真實參數的可能范圍,并說明其可靠性為什么要作假設檢驗?OLS估計只是用樣本估計的結果,是否可靠?是否抽樣的偶然結果?還有待統計檢驗。區間估計和假設檢驗都是建立在確定參數估計值概率分布性質的基礎上。113
一、OLS估計的分布性質基本思想
是隨機變量,必須確定其分布性質才可能進行區間估計和假設檢驗是服從正態分布的隨機變量,決定了也是服從正態分布的隨機變量,
是的線性函數,決定了也是服從正態分布的隨機變量,只要確定的期望和方差,即可確定的分布性質114●的期望:(無偏估計)●的方差和標準誤差
(標準誤差是方差的算術平方根)
注意:以上各式中未知,其余均是樣本觀測值
參數估計值的期望和方差115
可以證明(見教材P70附錄2.2)
的無偏估計為
(n-2為自由度,即可自由變化的樣本觀測值個數)對隨機擾動項u方差的估計116
●在已知時將作標準化變換,可得參數估計量所服從的概率分布117
(1)當樣本為大樣本時,用估計的參數標準誤差對作標準化變換,所得Z統計量仍可視為標準正態變量(根據中心極限定理)(2)當樣本為小樣本時,可用代替,去估計參數的標準誤差,用估計的參數標準誤差對作標準化變換,所得的t統計量不再服從正態分布(這時分母也是隨機變量),而是服從t分布:
●當未知時
118二、回歸系數的區間估計概念:對參數作出的點估計是隨機變量,雖然是無偏估計,但還不能說明估計的可靠性和精確性,需要找到包含真實參數的一個范圍,并確定這個范圍包含參數真實值的可靠程度。在確定參數估計式概率分布性質的基礎上,可找到兩個正數δ和α(),使得區間包含真實的概率為,即
119這樣的區間稱為所估計參數的置信區間。(confidenceinterval);1-稱為置信系數(置信度)(confidencecoefficient),稱為顯著性水平(levelofsignificance);置信區間的端點稱為置信限(confidencelimit)或臨界值(criticalvalues)。120由于置信區間一定程度地給出了樣本參數估計值與總體參數真值的“接近”程度,因此置信區間越小越好。要縮小置信區間,需要(1)增大樣本容量n。因為在同樣的置信水平下,n越大,t分布表中的臨界值越小;同時,增大樣本容量,還可使樣本參數估計量的標準差減小;121(2)提高模型的擬合優度。因為樣本參數估計量的標準差與殘差平方和呈正比,模型擬合優度越高,殘差平方和應越小。由于置信區間一定程度地給出了樣本參數估計值與總體參數真值的“接近”程度,因此置信區間越小越好。122
一般情況下,總體方差未知,用無偏估計去代替,由于樣本容量較小,統計量
t不再服從正態分布,而服從
t分布。可用t分布去建立參數估計的置信區間。
回歸系數區間估計的方法123選定α,查t分布表得顯著性水平為
,自由度為
的臨界值,則有即124對回歸系數假設檢驗的方式1.假設檢驗的基本思想為什么要作假設檢驗?所估計的回歸系數、和方差都是通過樣本估計的,都是隨抽樣而變動的隨機變量,它們是否可靠?是否抽樣的偶然結果呢?還需要加以檢驗。125計量經濟學中,主要是針對變量的參數真值是否為零來進行顯著性檢驗的。目的:對簡單線性回歸,判斷解釋變量是否是被解釋變量
的顯著影響因素。在一元線性模型中,就是要判斷是否對具有顯著的線性影響。這就需要進行變量的顯著性檢驗。
126一般情況下,總體方差未知,只能用去
代替,可利用t分布作t檢驗給定,查
t分布表得▼如果或者則拒絕原假設,而接受備擇假設▼如果則接受原假設2.回歸系數的檢驗方法127
P用P值判斷參數的顯著性假設檢驗的p值:p值是基于既定的樣本數據所計算的統計量,是拒絕原假設的最低顯著性水平。統計分析軟件中通常都給出了檢驗的p值統計量t由樣本計算的統計量為:相對于顯著性水平的臨界值:或注意:t檢驗是比較和P值檢驗是比較和p與相對應與P相對應128
用P值判斷參數的顯著性假設檢驗的p
值:p
值是根據既定的樣本數據所計算的統計量,拒絕原假設的最小顯著性水平。統計分析軟件中通常都給出了檢驗的p
值。129方法:將給定的顯著性水平與
值比較:?若值,則在顯著性水平下拒絕原假設,即認為
對
有顯著影響?若值,則在顯著性水平下接受原假設,即認為
對
沒有顯著影響規則:當時,
值越小,越能拒絕原假設用P值判斷參數的顯著性的方法130第五節、一元線性回歸模型的檢驗模型估計式的檢驗就是利用一定的定性與定量的標準對模型的函數形式,變量的選擇及參數估計的正確性進行評價。1、模型估計式檢驗的必要性:模型解釋變量選擇的正確性需要證明(主觀隨意性,解釋變量的種類與多少由人為主觀決定)模型函數形式的正確性需要驗證。解釋變量與被解釋變量的關系選擇具有唯一性,很多情況下并非線性。模型估計的可靠性需要評價。估計式來源于樣本,對總體是否適合需要檢驗。(估計式的可靠性、穩定性)1312、模型估計式的理論檢驗:是對模型估計式在理論上能否成立進行判別,又稱符號檢驗。OLS估計值的符號及取值大小是否符合經濟理論或社會經濟實踐常規。3、統計準則檢驗(一級檢驗)(1)估計標準誤差。
反映各實際點在直線周圍的散布情況,越小越好。一般用標準差與均值之比。及變異系數132(2)相關系數相關系數的含義。相關系數的顯著性檢驗。(3)解釋變量回歸系數的顯著性檢驗H0:即假設Xi對Y沒有顯著影響,則133給定α,可由t分布表查得臨界值tα/2,
若|t|>tα/2
,拒絕H0,Xi對Y有顯著影響;若|t|≤tα/2
,接受H0,認為Xi
對Y影響不顯著,應考慮將Xi
從模型中剔除,重新建模。(4)擬合優度檢驗134(5)總體線性關系的檢驗1.F檢驗對于若原假設H0:成立,則給定顯著水平α,查表得臨界值Fα(單側檢驗)若F>Fα,拒絕H0,模型的線性關系是顯著的;若F<Fα,接受H0,模型的線性關系不顯著,回歸模型無效。
135檢驗通不過的原因可能在于:解釋變量選取不當或遺漏重要解釋變量;解釋變量與被解釋變量之間不存在線性相關關系;樣本容量n比較小;回歸模型存在序列相關(時間序列中,不同時期)。r2檢驗與F檢驗的關系136
(6)其他準則調整判定系數:判定系數受解釋變量X的個數k的影響,在k的個數不同的模型之間進行比較時,判定系數必須進行調整。4、正態性檢驗.Jarque-Bera(雅克貝拉檢驗).JB檢驗5、計量經濟學準則檢驗(二級檢驗)(1)異方差檢驗(2)自相關檢驗(3)多重共線性檢驗138
本節主要內容:
●回歸分析結果的報告
●被解釋變量平均值預測
●被解釋變量個別值預測第六節
回歸模型預測139一、回歸分析結果的報告
經過模型的估計、檢驗,得到一系列重要的數據,為了簡明、清晰、規范地表述這些數據,計量經濟學通常采用了以下規范化的方式:例如:回歸結果為
標準誤差SEt統計量可決系數和自由度140
二、被解釋變量平均值預測1.基本思想●運用計量經濟模型作預測:指利用所估計的樣本回歸函數,用解釋變量的已知值或預測值,對預測期或樣本以外的被解釋變量數值作出定量的估計。()●控制()●計量經濟預測是一種條件預測:
條件:◆模型設定的關系式不變
◆所估計的參數不變
◆
解釋變量在預測期的取值已經確定或已作出預測對應變量的預測分為平均值預測和個別值預測對應變量的預測又分為點預測和區間預測141預測值、平均值、個別值的相互關系
是真實平均值的點估計,也是對個別值的點估計個別值真實平均值點預測值1422.Y
平均值的點預測
將解釋變量預測值直接代入估計的方程這樣計算的是一個點估計值
143
3.Y平均值的區間預測基本思想:由于存在抽樣波動,預測的平均值不一定等于真實平均值,還需要對作區間估計。為對Y作區間預測,必須確定平均值預測值的抽樣分布,
必須找出與和都有關的統計量144具體作法(從的分布分析)
已知
可以證明
服從正態分布,將其標準化,當未知時,只得用代替,這時有145顯然這樣的t統計量與和都有關。給定顯著性水平α,查t分布表,得自由度n-2的臨界值則有Y平均值的置信度為的預測區間為構建平均值的預測區間146三、應變量個別值預測基本思想:◆既是對
平均值的點預測,也是對
個別值的點預測◆由于存在隨機擾動的影響,
的平均值并不等于
的個別值◆為了對
的個別值作區間預測,需要尋找與預測值和個別值有關的統計量,并要明確其概率分布147
具體作法:
已知剩余項是與預測值及個別值都有關的變量,并且已知服從正態分布,且可證明當用代替時,對標準化的變量t為
148構建個別值的預測區間給定顯著性水平,查
t分布表得自由度為的臨界值,則有
因此,一元回歸時
的個別值的置信度為的預測區間上下限為
149應變量Y區間預測的特點
1、
平均值的預測值與真實平均值有誤差,主要是受抽樣波動影響
個別值的預測值與真實個別值的差異,不僅受抽樣波動影響,而且還受隨機擾動項的影響
1502、平均值和個別值預測區間都不是常數,是隨的變化而變化的,都以為區間中心.3、預測區間上下限與樣本容量有關,當樣本容量時個別值的預測誤差只決定于隨機擾動的方差151SRF各種預測值的關系Y的個別值的置信區間Y均值的置信區間152第六節案例分析
提出問題:改革開放以來隨著中國經濟的快速發展,居民的消費水平也不斷增長。但全國各地區經濟發展速度不同,居民消費水平也有明顯差異。為了分析什么是影響各地區居民消費支出有明顯差異的最主要因素,并分析影響因素與消費水平的數量關系,可以建立相應的計量經濟模型去研究。
研究范圍:全國各省市2002年城市居民家庭平均每人每年消費截面數據模型。
153理論分析:影響各地區城市居民人均消費支出的因素有多種,但從理論和經驗分析,最主要的影響因素應是居民收入。從理論上說可支配收入越高,居民消費越多,但邊際消費傾向大于0,小于1。建立模型:
其中:Y—城市居民家庭平均每人每年消費支出(元)
X—城市居民人均年可支配收入(元)154數據:從2002年《中國統計年鑒》中得到地區城市居民家庭平均每人每年消費支出(元)Y城市居民人均年可支配收入(元)
X北京天津河北山西內蒙古遼寧吉林黑龍江上海江蘇浙江安徽福建江西山東河南湖北10284.607191.965069.284710.964859.885342.644973.884462.0810464.006042.608713.084736.526631.684549.325596.324504.685608.9212463.929337.566679.685234.356051.066524.526260.166100.5613249.808177.6411715.606032.409189.366334.647614.366245.406788.52155(接上頁數據表)地區城市居民家庭平均每人每年消費支出(元)
Y城市居民人均年可支配收入(元)X湖南廣東廣西海南重慶四川貴州云南西藏陜西甘肅青海寧夏新疆5574.728988.485413.445459.646360.245413.084598.285827.926952.445278.045064.245042.526104.925636.40695
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年安丘市職業中等專業學校專任教師招聘真題
- 2024年安徽天柱山旅游學校專任教師招聘真題
- 2024年安徽亳州機電信息工程學校專任教師招聘真題
- 人教初中地理八下河南省新鄉市期末地理試卷(解析版)
- 采耳店合同范本
- 機場消殺合同范本
- 二年級上冊數學教案-1.3星星合唱隊 |北師大版
- 遼寧省名校聯盟2025屆高三下學期一模地理試題 含解析
- 小區綠化設施合同范本
- 合伙開店合同范本模板
- 小學教師專業成長規劃
- GB 45248-2025車輛駕駛人員體內毒品含量閾值與檢驗
- (二模)哈三中2025年高三學年第二次模擬考試語文試卷(含答案)
- 甘肅省農墾集團有限責任公司招聘生產技術人員筆試真題2024
- 幼兒園總務工作管理
- 2025年上半年山東省濰坊臨朐招聘衛生教育系統部分事業編制及控制總量人員易考易錯模擬試題(共500題)試卷后附參考答案
- 2025年上半年下半年浙江省舟山市港航管理局招聘6人易考易錯模擬試題(共500題)試卷后附參考答案
- 2025年中醫針灸學主治醫師-中醫針灸學考試題(附答案)
- 老年人安全用藥與護理
- 黑色三分鐘生死一瞬間第9、10部
- 適老化住宅改造服務行業深度調研及發展戰略咨詢報告
評論
0/150
提交評論