應用回歸分析(第5版)第2章 一元線性回歸_第1頁
應用回歸分析(第5版)第2章 一元線性回歸_第2頁
應用回歸分析(第5版)第2章 一元線性回歸_第3頁
應用回歸分析(第5版)第2章 一元線性回歸_第4頁
應用回歸分析(第5版)第2章 一元線性回歸_第5頁
已閱讀5頁,還剩55頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

2024/12/281第2章一元線性回歸2.1一元線性回歸模型2.2參數β0、β1的估計2.3最小二乘估計的性質2.4回歸方程的顯著性檢驗2.5殘差分析2.6回歸系數的區間估計2.7預測和控制2.8本章小結與評注2024/12/2822.1一元線性回歸模型例2.1

表2.1列出了15起火災事故的損失及火災發生地與最近的消防站的距離。表2.1 火災損失表2024/12/2832.1一元線性回歸模型例2.2

全國人均消費金額記作y(元);

人均國民收入記為x(元)表2.2 人均國民收入表2024/12/2842.1一元線性回歸模型一元線性回歸模型

y=β0+β1x+ε回歸方程E(y|x)=β0+β1x2024/12/2852.1一元線性回歸模型樣本模型

yi=β0+β1xi+εi, i=1,2,…,n回歸方程E(yi)=β0+β1xi,var(yi)=σ2,樣本觀測值(x1,y1),(x2,y2),…,(xn,yn)經驗回歸方程

回歸方程平均意義的解釋2024/12/2862.2參數β0、β1的估計一、普通最小二乘估計

(OrdinaryLeastSquareEstimation,簡記為OLSE)最小二乘法就是尋找參數β0、β1的估計值使離差平方和達極小稱為yi的回歸擬合值,簡稱回歸值或擬合值

稱為yi的殘差有人用絕對值2024/12/2872.2參數β0、β1的估計2024/12/2882.2參數β0、β1的估計經整理后,得正規方程組2024/12/2892.2參數β0、β1的估計得OLSE為記2024/12/28102.2參數β0、β1的估計續例2.1回歸方程2024/12/28112.2參數β0、β1的估計二、最大似然估計

連續型:是樣本的聯合密度函數:離散型:是樣本的聯合概率函數。似然函數并不局限于獨立同分布的樣本。似然函數在假設εi~N(0,σ2)時,由(2.10)式知yi服從如下正態分布:2024/12/28122.2參數β0、β1的估計二、最大似然估計

y1,y2,…,yn

的似然函數為:對數似然函數為:與最小二乘原理完全相同

2024/12/28132.3最小二乘估計的性質一、線性

是y1,y2,…,yn的線性函數

:2024/12/2814其中用到

2.3最小二乘估計的性質二、無偏性

無偏性的意義2024/12/28152.3最小二乘估計的性質三、的方差

回歸系數的相關情況2024/12/28162.3最小二乘估計的性質三、的方差

在正態假設下Gauss

Markov條件

2024/12/28172.4回歸方程的顯著性檢驗

一、t

檢驗

原假設:H0:β1=0 對立假設:H1

:β1≠0

由當原假設H0:β1=0成立時有:

2024/12/28182.4回歸方程的顯著性檢驗

一、t

檢驗

構造t統計量

其中2024/12/28192.4回歸方程的顯著性檢驗

二、用統計軟件計算

1.例2.1用Excel軟件計算2024/12/2820什么是P值?

(P-value)P值即顯著性概率值

SignificenceProbabilityValue是當原假設為真時得到比目前的樣本更極端的樣本的概率,所謂極端就是與原假設相背離它是用此樣本拒絕原假設所犯棄真錯誤的真實概率,被稱為觀察到的(或實測的)顯著性水平2024/12/2821雙側檢驗的P值

/

2

/

2

t拒絕拒絕H0值臨界值計算出的樣本統計量計算出的樣本統計量臨界值1/2P值1/2P值2024/12/2822左側檢驗的P值H0值臨界值a樣本統計量拒絕域抽樣分布1-

置信水平計算出的樣本統計量P值2024/12/2823右側檢驗的P值H0值臨界值a拒絕域抽樣分布1-

置信水平計算出的樣本統計量P值2024/12/2824利用P值進行檢驗的決策準則若p-值≥

,不能拒絕H0若p-值<

,拒絕H0雙側檢驗p-值=2×單側檢驗p-值2024/12/28252.4回歸方程的顯著性檢驗

二、用統計軟件計算2.例2.1用SPSS軟件計算2024/12/28262.4回歸方程的顯著性檢驗

二、用統計軟件計算2.用SPSS軟件計算2024/12/28272.4回歸方程的顯著性檢驗

三、F檢驗平方和分解式

SST=SSR+SSE構造F檢驗統計量

可以證明SSR和SSE均服從卡方分布2024/12/28282.4回歸方程的顯著性檢驗

三、F檢驗一元線性回歸方差分析表方差來源自由度平方和均方F值P值回歸殘差總和1n-2n-1SSRSSESSTSSR/1SSE/(n-2)P(F>F值)=P值2024/12/28292.4回歸方程的顯著性檢驗

四、相關系數的顯著性檢驗

2024/12/28302.4回歸方程的顯著性檢驗

四、相關系數的顯著性檢驗

2024/12/28312.4回歸方程的顯著性檢驗

四、相關系數的顯著性檢驗

附表1相關系數ρ=0的臨界值表n-25%1%n-25%1%n-25%1%10.9971.000160.4680.590350.3250.41820.9500.990170.4560.575400.3040.39330.8780.959180.4440.561450.2880.37240.8110.947190.4330.549500.2730.35450.7540.874200.4230.537600.2500.32560.7070.834210.4130.526700.2320.30270.6660.798220.4040.515800.2170.28380.6320.765230.3960.505900.2050.26790.6020.735240.3880.4961000.1950.254100.5760.708250.3810.4871250.1740.228110.5530.684260.3740.4781500.1590.208120.5320.661270.3670.4702000.1380.181130.5140.641280.3610.4633000.1130.148140.4970.623290.3550.4564000.0980.128150.4820.606300.3490.44910000.0620.0812024/12/28322.4回歸方程的顯著性檢驗

四、相關系數的顯著性檢驗

用SPSS軟件做相關系數的顯著性檢驗

2024/12/28332.4回歸方程的顯著性檢驗

四、相關系數的顯著性檢驗

兩變量間相關程度的強弱分為以下幾個等級:當|r|≥0.8時,視為高度相關;當0.5≤|r|<0.8時,視為中度相關;當0.3≤|r|<0.5時,視為低度相關;當|r|<0.3時,表明兩個變量之間的相關程度極弱,在實際應用中可視為不相關。2024/12/28342.4回歸方程的顯著性檢驗

五、三種檢驗的關系H0:b=0H0:r=0H0:回歸無效2024/12/28352.4回歸方程的顯著性檢驗

六、樣本決定系數

可以證明2024/12/28362.5殘差分析

一、殘差概念與殘差圖

殘差

誤差項

殘差ei是誤差項ei的估計值。

2024/12/28372.5殘差分析

一、殘差概念與殘差圖

2024/12/28382.5殘差分析

一、殘差概念與殘差圖

圖2.6火災損失數據殘差圖2024/12/28392.5殘差分析

二、殘差的性質

性質1E(ei)=0

證明:2024/12/28402.5殘差分析

二、殘差的性質

性質2其中稱為杠桿值

2024/12/28412.5殘差分析

二、殘差的性質

2024/12/28422.5殘差分析

二、殘差的性質

性質3.

殘差滿足約束條件:

這表明殘差是相關的,不是獨立的.2024/12/28432.5殘差分析

三、改進的殘差

標準化殘差學生化殘差2024/12/28442.6回歸系數的區間估計

等價于β1的1-α置信區間2024/12/28452.7預測和控制

一、單值預測

2024/12/28462.7預測和控制

二、區間預測找一個區間(T1,T2),使得

需要首先求出其估計值的分布

1.因變量新值的區間預測2024/12/2847二、區間預測1因變量新值的區間預測以下計算的方差從而得2024/12/2848二、區間預測1因變量新值的區間預測記于是有

則2024/12/2849二、區間預測1因變量新值的區間預測y0的置信概率為1-α的置信區間為

y0的置信度為95%的置信區間近似為

能不能兩全其美2024/12/2850二、區間預測2因變量平均值的區間估計得E(y0)的1-α的置信區間為

E(y0)=β0+β1x0是常數2024/12/2851二、區間預測計算

對例2.1的火災損失數據,假設保險公司希望預測一個距最近的消防隊x0=3.5公里的居民住宅失火的損失

點估計值95%區間估計單個新值:(22.32,32.67)平均值E(y0):(26.19,28.80)

的95%的近似置信區間為

=(27.50-2×2.316,27.50+2×2.316)=(22.87,32.13)2024/12/2852三、控制問題

給定y的預期范圍(T1,T2),如何控制自變量x的值才能以1-α的概率保證

用近似的預測區間來確定x。如果α=0.05,則要求

把帶入2024/12/28532.8本章小結與評注

一、一元線性回歸模型從建模到應用的全過程例2.2

全國人均消費金額記作y(元);人均國民收入記為x(元)表2.2 人均國民收入表2024/12/2854回歸模型的一個真實應用2024/12/28552024/12/28562024/12/2857

黃石公園(Yellowstone)的間歇噴泉預測(回歸分析)

凡是到過美國黃石國家公園的人,都會被那里神奇而美麗的間歇噴泉深深迷住(OldFaithful)。這一噴泉每次噴發大約持續1分半鐘至5分鐘,兩次噴發間的間隔時間不等,短則40分鐘,長則126分鐘。就是說,噴發時間和

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論