




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
關(guān)于線性回歸模型第1頁,共87頁,星期日,2025年,2月5日2025/3/202
2.1模型的建立及其假定條件變量之間的關(guān)系回歸分析的概念一元線性回歸模型隨機(jī)誤差項(xiàng)的假定第2頁,共87頁,星期日,2025年,2月5日2025/3/2032.1模型的建立及其假定條件1變量之間的關(guān)系經(jīng)濟(jì)變量之間的關(guān)系,大體可分為兩類:確定性關(guān)系或函數(shù)關(guān)系:變量之間存在確定的函數(shù)關(guān)系例如:某企業(yè)的銷售收入Y與其產(chǎn)品價(jià)格P和銷售量X的關(guān)系為:Y=PX第3頁,共87頁,星期日,2025年,2月5日2025/3/2042.1模型的建立及其假定條件統(tǒng)計(jì)依賴或相關(guān)關(guān)系:變量之間存在非確定的依賴關(guān)系.研究的是非確定現(xiàn)象隨機(jī)變量間的關(guān)系。例如:某企業(yè)資金投入X與產(chǎn)出Y的關(guān)系。Y=f(X)+u
對變量間統(tǒng)計(jì)依賴關(guān)系的考察主要是通過相關(guān)分析(correlationanalysis)或回歸分析(regressionanalysis)來完成的第4頁,共87頁,星期日,2025年,2月5日2025/3/2052.1模型的建立及其假定條件2回歸分析的概念回歸分析研究一個(gè)變量關(guān)于另一個(gè)(些)變量的具體依賴關(guān)系的計(jì)算方法和理論。
其用意:在于通過后者的已知或設(shè)定值,去估計(jì)(或)預(yù)測前者的(總體)均值。第5頁,共87頁,星期日,2025年,2月5日2025/3/2062.1模型的建立及其假定條件
回歸分析的基本思想和方法以及“回歸”名稱的由來英國統(tǒng)計(jì)學(xué)家高爾頓(F.Galton,1822-1911)和他的學(xué)生皮爾遜(K.Pearson,1856-1936)在研究父母身高與其子女身高的遺傳問題時(shí),觀察了1078對夫婦,以每對夫婦的平均身高作為自變量,而取他們的一個(gè)成年兒子的身高作為因變量,將結(jié)果在平面直角坐標(biāo)系上繪成散點(diǎn)圖,發(fā)現(xiàn)趨勢近乎一條直線,計(jì)算出的回歸直線方程為:
y=33.73+0.516x這一方程表明:父母平均身高每增減一個(gè)單位時(shí),其年子女的身高僅平增減0.516個(gè)單位第6頁,共87頁,星期日,2025年,2月5日2025/3/207
這項(xiàng)研究結(jié)果表明,雖然高個(gè)子父輩有生高個(gè)子兒子的趨勢,矮個(gè)子的父輩有生矮個(gè)子兒子的趨勢,但父輩身高增減一個(gè)單位,兒子身高僅增減半個(gè)單位左右。通俗地說,一群特高個(gè)子父輩的兒子們在同齡人中平均僅為高個(gè)子,一群高個(gè)子父輩的兒子們在同齡人中平均僅為略高個(gè)子;一群特矮個(gè)子父輩的兒子們在同齡人中平均僅為矮個(gè)子,一群矮個(gè)子父輩的兒子們在同齡人中平均僅為略矮個(gè)子,即子代的平均身高向中間回歸了。所以高爾頓引用了“回歸”(regression)一詞來描述父輩身高與子代身高之間的關(guān)系。盡管“回歸”這個(gè)名稱的由來具有特定的含義,但是,人們在研究大量的經(jīng)濟(jì)變量間的統(tǒng)計(jì)關(guān)系時(shí)已遠(yuǎn)遠(yuǎn)超出了這一特定的含義了,我們現(xiàn)在使用回歸這一名稱僅僅是接受了高爾頓先生的回歸分析基本思想和方法
第7頁,共87頁,星期日,2025年,2月5日2025/3/2082.1模型的建立及其假定條件3一元線性回歸模型
一元線性回歸模型表示如下:
yi=β0+β1xi+ui
yi稱為
被解釋變量(因變量)
xi
稱為解釋變量(自變量)
β0、β1——回歸系數(shù)(待定系數(shù)或待定參數(shù))
0稱作常數(shù)項(xiàng)(截距項(xiàng)),
1稱作斜率系數(shù)。ui是計(jì)量經(jīng)濟(jì)模型區(qū)別于數(shù)學(xué)模型的最關(guān)鍵的標(biāo)志,稱之為隨機(jī)擾動(dòng)項(xiàng)或誤差項(xiàng)。正是u的隨機(jī)性使得我們可以采用統(tǒng)計(jì)推斷方法對模型的設(shè)定進(jìn)行嚴(yán)格的檢驗(yàn)。第8頁,共87頁,星期日,2025年,2月5日2025/3/2092.1模型的建立及其假定條件
線性回歸模型”中的“線性”一詞在這里的含義:是指被解釋變量y與解釋變量x之間為線性關(guān)系,即解釋變量x僅以一次方的形式出現(xiàn)在模型之中。第9頁,共87頁,星期日,2025年,2月5日2025/3/20102.1模型的建立及其假定條件一般來說,回歸模型的隨機(jī)誤差項(xiàng)中可能包括如下幾項(xiàng)內(nèi)容。(1)未在模型中列出的影響y變化的非重要解釋變量。如消費(fèi)模型中家庭人口數(shù)、消費(fèi)習(xí)慣、物價(jià)水平差異等因素的影響都包括在隨機(jī)誤差項(xiàng)中。(2)人的隨機(jī)行為。經(jīng)濟(jì)活動(dòng)都是人參與的。人的經(jīng)濟(jì)行為的變化也會(huì)對隨機(jī)誤差項(xiàng)產(chǎn)生影響。第10頁,共87頁,星期日,2025年,2月5日2.1模型的建立及其假定條件(3)數(shù)學(xué)模型形式欠妥。對于同一組觀測值,若擬合的數(shù)學(xué)模型形式不同,則相應(yīng)的隨機(jī)誤差項(xiàng)的值也不同。當(dāng)模型形式欠妥時(shí),會(huì)直接對隨機(jī)誤差項(xiàng)的值帶來影響。(4)歸并誤差。模型中被解釋變量的值常常是歸并而成的。當(dāng)歸并不合理時(shí),會(huì)產(chǎn)生誤差。如由不同種類糧食合并構(gòu)成的糧食產(chǎn)量的不合理歸并會(huì)帶來歸并誤差。(5)測量誤差。當(dāng)對被解釋變量的測量存在誤差時(shí),這種誤差將包括在隨機(jī)誤差項(xiàng)中第11頁,共87頁,星期日,2025年,2月5日2025/3/20122.1模型的建立及其假定條件4隨機(jī)誤差項(xiàng)的假定條件(1)零均值假定E(ui)=0i=1,2,……這表示對X的每個(gè)觀測值來說,u可以取不同的值,有些大于零,有些小于零,考慮u的所有可能取值,他們的總體平均值等于零.
第12頁,共87頁,星期日,2025年,2月5日2.1模型的建立及其假定條件(2)同方差性假定
Var(ui)=
u2
i=1,2,……這表明在各次觀測中u具有相同的方差,也就是各次觀測所受的隨機(jī)影響的程度相同.第13頁,共87頁,星期日,2025年,2月5日協(xié)方差的定義
E[(X-E(X))(Y-E(Y))]稱為隨機(jī)變量X和Y的協(xié)方差,記作COV(X,Y),即COV(X,Y)=E[(X-E(X))(Y-E(Y))].計(jì)算公式為:Cov(X,Y)=E(XY)-E(X)E(Y)
協(xié)方差可以度量兩個(gè)變量之間的相關(guān)關(guān)系,如果兩個(gè)變量的協(xié)方差為零,則表明這兩個(gè)變量之間不存在相關(guān)關(guān)系.第14頁,共87頁,星期日,2025年,2月5日2.1模型的建立及其假定條件(3)無序列相關(guān)假定Cov(ui,uj)=0i≠ji,j=1,2,…這表明,在任意兩次觀測時(shí),ui,uj是不相關(guān)的,即u在某次觀測中取的值與任何其它次觀測中取的值互不影響.第15頁,共87頁,星期日,2025年,2月5日2.1模型的建立及其假定條件(4)解釋變量與誤差項(xiàng)不相關(guān)假定
Cov(Xi,ui)=0i=1,2,……這一假定表明隨機(jī)項(xiàng)u與自變量x不相關(guān).提出這一假定是因?yàn)樵诮⒒貧w模型時(shí),我們用隨機(jī)項(xiàng)u綜合了未包含在模型中的那些自變量以及其它因素對因變量Y的影響.因此,應(yīng)該把X對Y的影響和u對Y的影響區(qū)分開來.如果兩者相關(guān),就不可能把各自對Y的影響區(qū)分開來第16頁,共87頁,星期日,2025年,2月5日2025/3/20172.1模型的建立及其假定條件(5)正態(tài)分布假定ui~N(0,u2)i=1,2,…第17頁,共87頁,星期日,2025年,2月5日2025/3/20182.2一元線性回歸模型的參數(shù)估計(jì)1幾個(gè)重要的概念對于一元線性回歸模型,隨機(jī)誤差項(xiàng)滿足古典假設(shè)條件,這個(gè)線性回歸模型稱為X,Y之間的總體回歸模型。兩邊取條件均值,得一元線性回歸方程:
簡稱總體回歸方程(總體回歸線)。其中總體回歸系數(shù)
和
是未知的,實(shí)際上總體回歸線是無法求得的,它只是理論上的存在,所以稱為理論回歸方程第18頁,共87頁,星期日,2025年,2月5日2025/3/20192.2一元線性回歸模型的參數(shù)估計(jì)如果變量x和y之間存在線性相關(guān)關(guān)系,對于任意抽取的若干個(gè)觀測(樣本)值(xi
,yi),有(2.2.1)
我們稱(2.2.1)為樣本回歸模型,、為、的估計(jì)值或估計(jì)量。樣本回歸模型由兩部分組成:稱為系統(tǒng)分量,是可以被x解釋的部分,也稱為可解釋分量;是不能被解釋的部分,稱為殘差(Residual),它是隨機(jī)項(xiàng)ui的代表值,也稱為不可解釋分量。將系統(tǒng)分量表示為(2.2.2)
第19頁,共87頁,星期日,2025年,2月5日2025/3/20202.2一元線性回歸模型的參數(shù)估計(jì)
式(2.2.2)稱為一元線性樣本回歸方程,簡稱樣本回歸方程。又因(2.2.2)式的建立依賴于樣本觀測值(xi,yi),所以我們又稱其為經(jīng)驗(yàn)回歸方程。、為樣本回歸系數(shù)。其中是估計(jì)的回歸直線在y軸截距,是直線的斜率。。的實(shí)際意義為x每變動(dòng)一個(gè)單位時(shí),y的平均變動(dòng)值,即x的變動(dòng)對y變動(dòng)的邊際貢獻(xiàn)率;是實(shí)際觀測值y的擬合值或估計(jì)值我們用一個(gè)圖來表示yi,,E(yi,)、、ui、ei第20頁,共87頁,星期日,2025年,2月5日2025/3/20212.2一元線性回歸模型的參數(shù)估計(jì)
Y
iY
ie
iY?
XiX
第21頁,共87頁,星期日,2025年,2月5日2025/3/20222.2一元線性回歸模型的參數(shù)估計(jì)2普通最小二乘法給定一組樣本觀測值(Xi,Yi)(i=1,2,…n)要求樣本回歸函數(shù)盡可能好地?cái)M合這組值.普通最小二乘法(Ordinaryleastsquares,OLS)給出的判斷標(biāo)準(zhǔn)是:二者之差的平方和最小即在給定樣本觀測值之下,選擇出、能使yi,之差的平方和最小(即為使殘差平方和最小)
第22頁,共87頁,星期日,2025年,2月5日2025/3/20232.2一元線性回歸模型的參數(shù)估計(jì)方程組(*)稱為正規(guī)方程組(normalequations)。
第23頁,共87頁,星期日,2025年,2月5日2025/3/20242.2一元線性回歸模型的參數(shù)估計(jì)記上述參數(shù)估計(jì)量可以寫成:
上式稱為OLS估計(jì)量的離差形式。由于參數(shù)的估計(jì)結(jié)果是通過最小二乘法得到的,故稱為普通最小二乘估計(jì)量(ordinaryleastsquaresestimators)。
第24頁,共87頁,星期日,2025年,2月5日2025/3/20252.2一元線性回歸模型的參數(shù)估計(jì)3最小二乘直線的性質(zhì)(1)殘差ei的均值等于0因?yàn)椋裕?)殘差ei與解釋變量xi不相關(guān)即(3)樣本回歸直線經(jīng)過點(diǎn)()(4)被解釋變量的樣本平均值等于其估計(jì)值的平均值第25頁,共87頁,星期日,2025年,2月5日2025/3/20262.2一元線性回歸模型的參數(shù)估計(jì)4截距為零的一元線性回歸模型的參數(shù)估計(jì)截距為零的一元線性回歸模型的一般形式為:這個(gè)模型只有一個(gè)參數(shù)需要估計(jì),其最小二乘估計(jì)量的表達(dá)式為
第26頁,共87頁,星期日,2025年,2月5日2025/3/20272.2一元線性回歸模型的參數(shù)估計(jì)例2.2.1題:一個(gè)假想的生活小區(qū)有100戶家庭組成,要研究該小區(qū)每月家庭消費(fèi)支出Y與每月家庭可支配收入X的關(guān)系。首先得到這100戶家庭的每月家庭消費(fèi)支出和每月家庭可支配收入的數(shù)據(jù),并把100戶家庭劃分為組內(nèi)收入差不多的10組,以分析每一收入組的家庭消費(fèi)支出,分組如下:第27頁,共87頁,星期日,2025年,2月5日2025/3/2028第28頁,共87頁,星期日,2025年,2月5日2025/3/2029建立變量X與Y之間的樣本回歸模型:利用分組數(shù)據(jù)估計(jì)模型參數(shù),參數(shù)估計(jì)的計(jì)算可通過下面的表進(jìn)行
iX
iY
ix
iy
iiyx
2ix
2iy
2iX
2iY
1
800
594
-1350
-973
1314090
1822500
947508
640000
352836
2
1100
638
-1050
-929
975870
1102500
863784
1210000
407044
3
1400
1122
-750
-445
334050
562500
198381
1960000
1258884
4
1700
1155
-450
-412
185580
202500
170074
2890000
1334025
5
2000
1408
-150
-159
23910
22500
25408
4000000
1982464
6
2300
1595
150
28
4140
22500
762
5290000
2544025
7
2600
1969
450
402
180720
202500
161283
6760000
3876961
8
2900
2078
750
511
382950
562500
260712
8410000
4318084
9
3200
2585
1050
1018
1068480
1102500
1035510
10240000
6682225
10
3500
2530
1350
963
1299510
1822500
926599
12250000
6400900
求和
21500
15674
5769300
7425000
4590020
53650000
29157448
平均
2150
1567
第29頁,共87頁,星期日,2025年,2月5日2025/3/20302.2一元線性回歸模型的參數(shù)估計(jì)因此,由該樣本估計(jì)的回歸方程為:
第30頁,共87頁,星期日,2025年,2月5日2025/3/20312.3最小二乘估計(jì)量的統(tǒng)計(jì)性質(zhì)
第31頁,共87頁,星期日,2025年,2月5日2025/3/20322、無偏性,即估計(jì)量0?b、1?b的均值(期望)等于總體回歸參數(shù)真值b0與b1
證明:易知故同樣地,容易得出
第32頁,共87頁,星期日,2025年,2月5日2025/3/20332.3最小二乘估計(jì)量的統(tǒng)計(jì)性質(zhì)
3、有效性(最小方差性),即在所有線性無偏估計(jì)量中,最小二乘估計(jì)量0?b、1?b具有最小方差。
(1)先求0?b與1?b的方差
第33頁,共87頁,星期日,2025年,2月5日2025/3/2034(2)證明最小方差性其中,ci=ki+di,di為不全為零的常數(shù)則容易證明假設(shè)*1?b是其他估計(jì)方法得到的關(guān)于b1的線性無偏估計(jì)量:
普通最小二乘估計(jì)量(ordinaryleastSquaresEstimators)稱為最佳線性無偏估計(jì)量(bestlinearunbiasedestimator,BLUE)
第34頁,共87頁,星期日,2025年,2月5日例:令kids表示一名婦女生育孩子的數(shù)目,educ表示該婦女接受過教育的年數(shù)。生育率對教育年數(shù)的簡單回歸模型為:(1)隨機(jī)擾動(dòng)項(xiàng)包含什么樣的因素?它們可能與教育水平相關(guān)嗎?(2)上述簡單回歸分析能夠揭示教育對生育率在其他條件不變下的影響嗎?請解釋。第35頁,共87頁,星期日,2025年,2月5日(1)收入、年齡、家庭狀況、政府的相關(guān)政策等也是影響生育率的重要的因素,在上述簡單回歸模型中,它們被包含在了隨機(jī)擾動(dòng)項(xiàng)之中。有些因素可能與增長率水平相關(guān),如收入水平與教育水平往往呈正相關(guān)、年齡大小與教育水平呈負(fù)相關(guān)等。(2)當(dāng)歸結(jié)在隨機(jī)擾動(dòng)項(xiàng)中的重要影響因素與模型中的教育水平educ相關(guān)時(shí),上述回歸模型不能夠揭示教育對生育率在其他條件不變下的影響,因?yàn)檫@時(shí)出現(xiàn)解釋變量與隨機(jī)擾動(dòng)項(xiàng)相關(guān)的情形,基本假設(shè)4不滿足。第36頁,共87頁,星期日,2025年,2月5日例.已知回歸模型,式中E為某類公司一名新員工的起始薪金(元),N為所受教育水平(年)。隨機(jī)擾動(dòng)項(xiàng)的分布未知,其他所有假設(shè)都滿足。(1)從直觀及經(jīng)濟(jì)角度解釋和。(2)OLS估計(jì)量和滿足線性性、無偏性及有效性嗎?簡單陳述理由。第37頁,共87頁,星期日,2025年,2月5日(1)為接受過N年教育的員工的總體平均起始薪金。當(dāng)N為零時(shí),平均薪金為才,因此表示沒有接受過教育員工的平均起始薪金。是每單位N變化所引起的E的變化,即表示每多接受一年學(xué)校教育所對應(yīng)的薪金增加值。(2)OLS估計(jì)量和仍滿足線性性、無偏性及有效性,因?yàn)檫@些性質(zhì)的的成立無需隨機(jī)擾動(dòng)項(xiàng)的正態(tài)分布假設(shè)。第38頁,共87頁,星期日,2025年,2月5日2025/3/20392.4用樣本可決系數(shù)檢驗(yàn)回歸方程的擬合優(yōu)度回歸分析是要通過樣本所估計(jì)的參數(shù)來代替總體的真實(shí)參數(shù),或者說是用樣本回歸線代替總體回歸線。盡管從統(tǒng)計(jì)性質(zhì)上已知,如果有足夠多的重復(fù)抽樣,參數(shù)的估計(jì)值的期望(均值)就等于其總體的參數(shù)真值,但在一次抽樣中,估計(jì)值不一定就等于該真值。那么,在一次抽樣中,參數(shù)的估計(jì)值與真值的差異有多大,是否顯著,這就需要進(jìn)一步進(jìn)行統(tǒng)計(jì)檢驗(yàn)。
主要包括擬合優(yōu)度檢驗(yàn)、變量的顯著性檢驗(yàn)及參數(shù)的區(qū)間估計(jì)。第39頁,共87頁,星期日,2025年,2月5日2025/3/20402.4用樣本可決系數(shù)檢驗(yàn)回歸方程的擬合優(yōu)度擬合優(yōu)度檢驗(yàn):對樣本回歸直線與樣本觀測值之間擬合程度的檢驗(yàn)。基本思路:因變量Y的變異,能夠被X的變異解釋的比例越大,則OLS回歸線對總體的解釋程度就越好。也即是樣本觀測值距回歸線越近,擬合優(yōu)度越好,X對Y的解釋程度就越強(qiáng)
度量擬合優(yōu)度的指標(biāo):樣本決定系數(shù)r2第40頁,共87頁,星期日,2025年,2月5日2025/3/20412.4用樣本可決系數(shù)檢驗(yàn)回歸方程的擬合優(yōu)度1總離差平方和的分解
已知由一組樣本觀測值(Xi,Yi),i=1,2…,n得到如下樣本回歸直線:而Y的第i個(gè)觀測值與樣本均值的離差可分解為兩部分之和:
第41頁,共87頁,星期日,2025年,2月5日2025/3/2042
如果Yi=?i即實(shí)際觀測值落在樣本回歸“線”上,則擬合最好。可認(rèn)為,“離差”全部來自回歸線,而與“殘差”無關(guān)。第42頁,共87頁,星期日,2025年,2月5日2025/3/2043對于所有樣本點(diǎn),則需考慮這些點(diǎn)與樣本均值離差的平方和,可以證明:記:總離差平方和(TotalSumofSquares)回歸平方和(ExplainedSumofSquares)殘差平方和(ResidualSumofSquares
)第43頁,共87頁,星期日,2025年,2月5日2025/3/20442.4用樣本可決系數(shù)檢驗(yàn)回歸方程的擬合優(yōu)度
即:TSS=ESS+RSS
Y的觀測值圍繞其均值的總離差可分解為兩部分:一部分來自回歸線(ESS),另一部分則來自隨機(jī)勢力(RSS)。在給定樣本中,TSS不變,如果實(shí)際觀測點(diǎn)離樣本回歸線越近,則ESS在TSS中占的比重越大,因此定義擬合優(yōu)度:回歸平方和ESS/總離差TSS第44頁,共87頁,星期日,2025年,2月5日2025/3/20452.4用樣本可決系數(shù)檢驗(yàn)回歸方程的擬合優(yōu)度2樣本可決系數(shù)也可表示為稱r2為(樣本)決定系數(shù)/判定系數(shù),可決系數(shù)可決系數(shù)的取值范圍:[0,1]
r2越接近1,說明實(shí)際觀測點(diǎn)離樣本線越近,擬合優(yōu)度越高。第45頁,共87頁,星期日,2025年,2月5日2025/3/20462.4用樣本可決系數(shù)檢驗(yàn)回歸方程的擬合優(yōu)度在例2.1.1的收入-消費(fèi)支出例中第46頁,共87頁,星期日,2025年,2月5日這表示在消費(fèi)支出的變異中,有97.66%的變異是由收入的變異所解釋。即家庭每月的消費(fèi)支出的97.66%取決于收入。第47頁,共87頁,星期日,2025年,2月5日2025/3/20482.4用樣本可決系數(shù)檢驗(yàn)回歸方程的擬合優(yōu)度3樣本相關(guān)系數(shù)
樣本相關(guān)系數(shù)是變量X與Y之間線性相關(guān)程度的度量指標(biāo),其定義為:
樣本相關(guān)系數(shù)表示x和y的線性相關(guān)關(guān)系的密切程度。其取值范圍為|r|1,即-1r1。當(dāng)r=-1時(shí),表示x與y之間完全負(fù)相關(guān);當(dāng)r=1時(shí),表示x與y之間完全正相關(guān);當(dāng)r=0時(shí),表示x與y之間無線性相關(guān)關(guān)系,即說明x與y可能無相關(guān)關(guān)系或x與y之間存在非線性相關(guān)
關(guān)系第48頁,共87頁,星期日,2025年,2月5日下表列出若干對自變量與因變量。對每一對變量,你認(rèn)為它們之間的關(guān)系如何?是正的、負(fù)的、還是無法確定?并說明理由。
因變量自變量個(gè)人儲(chǔ)蓄利率小麥產(chǎn)出降雨量美國國防開支前蘇聯(lián)國防開支老師的計(jì)量經(jīng)濟(jì)學(xué)教學(xué)學(xué)生的計(jì)量經(jīng)濟(jì)學(xué)成績總統(tǒng)聲譽(yù)任職時(shí)間學(xué)生計(jì)量經(jīng)濟(jì)學(xué)成績其統(tǒng)計(jì)學(xué)成績?nèi)毡酒嚨倪M(jìn)口量美國人均國民收入第49頁,共87頁,星期日,2025年,2月5日2025/3/20502.4用樣本可決系數(shù)檢驗(yàn)回歸方程的擬合優(yōu)度樣本相關(guān)系數(shù)的檢驗(yàn)由于一元線性回歸方程研究的是變量x與變量y之間的線性相關(guān)關(guān)系,所以我們可以用反映變量x與變量y之間的相關(guān)關(guān)系密切程度的相關(guān)系數(shù)來檢驗(yàn)回歸方程的顯著性。
檢驗(yàn)的步驟為:
(1)提出原假設(shè)H0:=0
備擇假設(shè)H1:
(2)構(gòu)造t統(tǒng)計(jì)量~
第50頁,共87頁,星期日,2025年,2月5日2025/3/20512.4用樣本可決系數(shù)檢驗(yàn)回歸方程的擬合優(yōu)度(3)給出顯著性水平,查自由度v=n-2的t分布表,得臨界值
(4)當(dāng)時(shí),接受原假設(shè),認(rèn)為總體相關(guān)系數(shù)等于零,X與Y之間沒有顯著的線性相關(guān)關(guān)系
當(dāng)時(shí),拒絕原假設(shè),接受備擇假設(shè),認(rèn)為X與Y之間具有顯著的線性相關(guān)關(guān)系。第51頁,共87頁,星期日,2025年,2月5日2025/3/20522.5回歸系數(shù)估計(jì)值的顯著性檢驗(yàn)與置信區(qū)間1隨機(jī)變量u的方差
我們在證明最小二乘估計(jì)量的有效性的時(shí)候已經(jīng)得出參數(shù)和的概率分布為:
~~
在估計(jì)的參數(shù)和的方差表達(dá)式中,都還有隨機(jī)擾動(dòng)項(xiàng)ui的方差,由于實(shí)際上是未知的,因此和
的方差實(shí)際上是無法計(jì)算的,這就需要對其進(jìn)行估計(jì)。
第52頁,共87頁,星期日,2025年,2月5日2025/3/20532.5回歸系數(shù)估計(jì)值的顯著性檢驗(yàn)與置信區(qū)間
由于隨機(jī)項(xiàng)ui不可觀測,只能從ui的估計(jì)—?dú)埐頴i出發(fā),對總體方差進(jìn)行估計(jì)。可以證明的最小二乘估計(jì)量為
它是關(guān)于的無偏估計(jì)量
第53頁,共87頁,星期日,2025年,2月5日在隨機(jī)誤差項(xiàng)ui的方差估計(jì)出后,參數(shù)0?b和1?b的方差和標(biāo)準(zhǔn)差的估計(jì)量分別是:
1?b的樣本方差:
?=22?1ixSb
1?b的樣本標(biāo)準(zhǔn)差:
?=2?1ixSb
0?b的樣本方差:
??=222?0iixnXSb
0?b的樣本標(biāo)準(zhǔn)差:
??=22?0iixnXSb
第54頁,共87頁,星期日,2025年,2月5日2025/3/20552.5回歸系數(shù)估計(jì)值的顯著性檢驗(yàn)與置信區(qū)間2回歸系數(shù)估計(jì)值的顯著性檢驗(yàn)——t檢驗(yàn)回歸分析是要判斷解釋變量X是否是被解釋變量Y的一個(gè)顯著性的影響因素。在一元線性模型中,就是要判斷X是否對Y具有顯著的線性性影響。這就需要進(jìn)行變量的顯著性檢驗(yàn)。即是檢驗(yàn)系數(shù)是否顯著地不等于零,也就是檢驗(yàn)樣本是否取自其真實(shí)參數(shù)為零的總體.第55頁,共87頁,星期日,2025年,2月5日第56頁,共87頁,星期日,2025年,2月5日
檢驗(yàn)步驟:
(1)對總體參數(shù)提出假設(shè)
H0:
1=0,H1:10(2)以原假設(shè)H0構(gòu)造t統(tǒng)計(jì)量,并由樣本計(jì)算其值(3)給定顯著性水平,查t分布表,得臨界值t/2(n-2)(4)比較,判斷若|t|>t/2(n-2),則拒絕H0
,接受H1
;若|t|
t/2(n-2),則拒絕H1
,接受H0
;t=第57頁,共87頁,星期日,2025年,2月5日
對于一元線性回歸方程中的
0,可構(gòu)造如下t統(tǒng)計(jì)量進(jìn)行顯著性檢驗(yàn):
在上述收入-消費(fèi)支出例中,首先計(jì)算的估計(jì)值
第58頁,共87頁,星期日,2025年,2月5日t統(tǒng)計(jì)量的計(jì)算結(jié)果分別為:
給定顯著性水平
=0.05,查t分布表得臨界值
t0.05/2(8)=2.306|t1|>2.306,說明家庭可支配收入在95%的置信度下顯著,即是消費(fèi)支出的主要解釋變量;
|t0|<2.306,表明在95%的置信度下,無法拒絕截距項(xiàng)為零的假設(shè)。
第59頁,共87頁,星期日,2025年,2月5日3回歸系數(shù)的置信區(qū)間
為了反映回歸系數(shù)的估計(jì)精度,需給出其區(qū)間估計(jì),即在置信水平為下的置信區(qū)間。置信區(qū)間長度越短,說明估計(jì)值和與參數(shù)和就越接近,估計(jì)值就越精確;反之,就越不精確第60頁,共87頁,星期日,2025年,2月5日區(qū)間估計(jì)的步驟:1)找一個(gè)含有該參數(shù)的統(tǒng)計(jì)量;
2)構(gòu)造一個(gè)概率為的事件;
3)通過該事件解出該參數(shù)的區(qū)間估計(jì).第61頁,共87頁,星期日,2025年,2月5日
1.對于參數(shù),我們知道統(tǒng)計(jì)量中含有參數(shù)2.構(gòu)造關(guān)于統(tǒng)計(jì)量t的概率為的事件事件為:把代入上面的式子整理得到:3.得到的的置信區(qū)間
第62頁,共87頁,星期日,2025年,2月5日根據(jù)同樣的方法我們可以求出的置信區(qū)間第63頁,共87頁,星期日,2025年,2月5日2.6一元線性回歸方程的預(yù)測1點(diǎn)預(yù)測所謂點(diǎn)預(yù)測,是將x的一個(gè)特定值代入樣本回歸方程,計(jì)算得出的就是y0的點(diǎn)預(yù)測值。
對于一元線性回歸方程對于給定的樣本以外的解釋變量的觀測值x0,可以得到被解釋變量的預(yù)測值我們還是以家庭收入與消費(fèi)的例子的資料為例第64頁,共87頁,星期日,2025年,2月5日2.6一元線性回歸方程的預(yù)測我們已經(jīng)估計(jì)出其一元線性回歸方程:預(yù)測收入為4000元的家庭的消費(fèi)支出:第65頁,共87頁,星期日,2025年,2月5日2.6一元線性回歸方程的預(yù)測2區(qū)間預(yù)測(1)個(gè)值的預(yù)測區(qū)間
由Yi=
0+1Xi+u
知:定義預(yù)測誤差:
于是
第66頁,共87頁,星期日,2025年,2月5日式中
:從而在1-
的置信度下,Y0的置信區(qū)間為第67頁,共87頁,星期日,2025年,2月5日2.6一元線性回歸方程的預(yù)測(2)總體均值的預(yù)測區(qū)間于是第68頁,共87頁,星期日,2025年,2月5日可以證明
因此故其中第69頁,共87頁,星期日,2025年,2月5日于是,在1-
的置信度下,總體均值E(Y|X0)的置信區(qū)間為第70頁,共87頁,星期日,2025年,2月5日在上述收入-消費(fèi)支出例中,得到的樣本回歸函數(shù)為則在X0=1000處,?0=–103.172+0.777×1000=673.84
而因此,總體均值E(Y|X=1000)的95%的置信區(qū)間為:
673.84-2.306
61.05<E(Y|X=1000)<673.84+2.306
61.05或
(533.05,814.62)
第71頁,共87頁,星期日,2025年,2月5日同樣地,對于Y在X=1000的個(gè)體值,其95%的置信區(qū)間為:
(372.03,975.65)總體回歸函數(shù)的置信帶(域)個(gè)體的置信帶(域)
第72頁,共87頁,星期日,2025年,2月5日對于Y的總體均值E(Y|X)與個(gè)體值的預(yù)測區(qū)間(置信區(qū)間):(1)樣本容量n越大,預(yù)測精度越高,反之預(yù)測精度越低(2)樣本容量一定時(shí),置信帶的寬度當(dāng)在X均值處最小,其附近進(jìn)行預(yù)測(插值預(yù)測)精度越大;X越遠(yuǎn)離其均值,置信帶越寬,預(yù)測可信度下降。第73頁,共87頁,星期日,2025年,2月5日小結(jié):簡單線性回歸分析的主要步驟1、建立回歸模型研究某一經(jīng)濟(jì)現(xiàn)象,先根據(jù)經(jīng)濟(jì)理論,選擇具有因果關(guān)系的兩個(gè)變量(X,Y),建立線性回歸模型,確定解釋變量和被解釋變量。如果不明確兩個(gè)變量是否為線性關(guān)系,也可以根據(jù)散點(diǎn)圖來分析。建立回歸模型可以是根據(jù)經(jīng)濟(jì)理論,也可以根據(jù)相同或相似經(jīng)濟(jì)現(xiàn)象的歷史分析經(jīng)驗(yàn)來建立回歸模型。建立模型時(shí),不僅要考慮理論或經(jīng)驗(yàn)的依據(jù),同時(shí)也要考慮數(shù)據(jù)的可利用程度。2、收集數(shù)據(jù),并經(jīng)過適當(dāng)?shù)募庸ふ恚玫竭m于回歸分析的樣本數(shù)據(jù)集。第74頁,共87頁,星期日,2025年,2月5日3、估計(jì)模型參數(shù)。利用樣本數(shù)據(jù),以O(shè)LS得到模型參數(shù)的估計(jì)值。4、對回歸模型和參數(shù)估計(jì)值進(jìn)行檢驗(yàn)。檢驗(yàn)回歸結(jié)果是否正確反映經(jīng)濟(jì)現(xiàn)象,是否與理論相符。包括理論檢驗(yàn)和統(tǒng)計(jì)檢驗(yàn)。經(jīng)濟(jì)理論檢驗(yàn):參數(shù)的符號,大小是否與理論和實(shí)際相符。若不符,尋找原因統(tǒng)計(jì)檢驗(yàn):擬和優(yōu)度檢驗(yàn),回歸參數(shù)的顯著性檢驗(yàn)和區(qū)間估計(jì)。第75頁,共87頁,星期日,2025年,2月5日5、預(yù)測對于解釋變量的特定值,代入回歸方程得到因變量的預(yù)測值;在給定的置信水平上,得到因變量預(yù)測值的置信區(qū)間。6、回歸結(jié)果的表述:
并說明參數(shù)的顯著水平()。第76頁,共87頁,星期日,2025年,2月5日提供回歸分析結(jié)果一般有兩種方式:(1)=6.70+0.58XR2=0.49
(1.38)(2.76)
這里6.70和0.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 網(wǎng)絡(luò)攻擊類型與防御試題及答案
- 學(xué)習(xí)如何處理數(shù)據(jù)庫的訪問沖突試題及答案
- 敏捷團(tuán)隊(duì)中的測試溝通技巧試題及答案
- 探索數(shù)字化教育在醫(yī)療領(lǐng)域的廣闊前景
- 計(jì)算機(jī)四級網(wǎng)軟件測試技術(shù)的進(jìn)階試題及答案
- 計(jì)算機(jī)三級嵌入式項(xiàng)目實(shí)踐要點(diǎn)試題及答案
- 環(huán)保筆記本生產(chǎn)線行業(yè)跨境出海項(xiàng)目商業(yè)計(jì)劃書
- 氣象博物館企業(yè)制定與實(shí)施新質(zhì)生產(chǎn)力項(xiàng)目商業(yè)計(jì)劃書
- 娛樂營銷策劃機(jī)構(gòu)企業(yè)制定與實(shí)施新質(zhì)生產(chǎn)力項(xiàng)目商業(yè)計(jì)劃書
- 珠寶鑒定與設(shè)計(jì)培訓(xùn)學(xué)院企業(yè)制定與實(shí)施新質(zhì)生產(chǎn)力項(xiàng)目商業(yè)計(jì)劃書
- 安全信息管理程序
- 電工基礎(chǔ)(中職)完整版教學(xué)課件
- (中職)《電子商務(wù)基礎(chǔ)》第1套試卷試題及答案
- 中共中央辦公廳、國務(wù)院辦公廳關(guān)于進(jìn)一步穩(wěn)定和完善農(nóng)村土地承包關(guān)系的通知中辦發(fā)〔1997〕16號,1997年6
- 計(jì)算機(jī)應(yīng)用基礎(chǔ)-終結(jié)性考試試題國開要求標(biāo)準(zhǔn)
- 橈骨遠(yuǎn)端骨折臨床路徑PPT課件
- 預(yù)制梁場驗(yàn)收及質(zhì)量管理實(shí)施細(xì)則
- 鞋業(yè)訂貨單模版
- 愛蓮說對比閱讀(1)
- 大理石打磨工程裝飾協(xié)議合同
- 鏈輪齒數(shù)尺寸對照表二
評論
0/150
提交評論