第八章 相關與回歸分析課件_第1頁
第八章 相關與回歸分析課件_第2頁
第八章 相關與回歸分析課件_第3頁
第八章 相關與回歸分析課件_第4頁
第八章 相關與回歸分析課件_第5頁
已閱讀5頁,還剩49頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

統計學原理

復習統計學原理第八章相關與回歸分析第八章相關與回歸分析1第一節相關分析概述一、函數關系與相關關系正方形面積與邊長;腳長與智商;銷售收入和消費情況;廣告投入與銷售收入;GDP與精神病患者;頭發長與見識短1.函數關系:變量之間存在嚴格的數量關系。2.相關關系:變量之間存在不確定的依存關系。3.區別與聯系:第八章相關與回歸分析11.按相關關系涉及的變量多少劃分分為單相關、復相關、偏相關。2.按相關形式劃分可以分為線性相關和曲線相關。3.按相關的方向劃分可分為正相關和負相關。4.按相關關系的程度劃分可分為完全相關,不完全相關和不相關。5.按相關性質分為真實相關和虛假相關。二、相關關系的種類第八章相關與回歸分析1(1)確定現象之間有無相關關系,以及相關關系的表現形態(2)確定相關關系的密切程度(3)建立合適的數學模型(4)測定估計值的標準誤差三、相關分析的內容第八章相關與回歸分析1定性分析依據研究者的理論知識和實踐經驗,對客觀現象之間是否存在相關關系,以及何種關系作出判斷。定量分析在定性分析的基礎上,通過編制相關表、繪制相關圖、計算相關系數等方法,來判斷現象之間相關的方向、形態及密切程度。第二節、相關關系的測定第八章相關與回歸分析1相關圖:又稱散點圖。將x置于橫軸上,y置于縱軸上,將(x,y)繪于坐標圖上。用來反映兩變量之間相關關系的圖形。第八章相關與回歸分析1二、相關系數(一)相關系數的定義

1、相關系數:在線性條件下說明兩個變量之間相關關系密切程度的統計分析指標。第八章相關與回歸分析12、相關系數r的取值范圍:-1≤r≤10<|r|<1表示存在不同程度線性相關:

|r|

<

0.3為微弱相關;

0.3≤|r|<0.5為低度線性相關;

0.5≤|r|<0.8為顯著性線性相關。

0.8≤|r|為高度相關r>0為正相關,r<0為負相關;|r|=0表示不存在線性關系;|r|=1表示完全線性相關;第八章相關與回歸分析1例:下表是有關15個地區某種食物需求量和地區人口增加量的資料。第八章相關與回歸分析1第八章相關與回歸分析1(1)相關關系不等于因果關系;(2)相關系數只度量變量間的線性關系,因此,弱相關不一定表明變量間沒有關系;(3)極端值可能影響相關系數。(4)警惕虛假相關3、使用相關系數時應注意的問題第八章相關與回歸分析1回歸:regression1889年弗朗西斯?高爾頓爵士遺傳學研究回歸線平均身高回歸分析法產生的歷史第八章相關與回歸分析1160165170175180185140150160170180190200YX兒子們身高向著平均身高“回歸”,以保持種族的穩定第八章相關與回歸分析1第三節一元線性回歸分析回歸分析通過一個變量x或一些變量(x1,x2,x3…)的變化解釋另一變量y的變化。即根據相關關系的數量表達式(回歸方程式)與給定的自變量x,揭示因變量y在數量上的平均變化和求得因變量的預測值的統計分析方法回歸方程回歸模型反映自變量和因變量之間數學聯系的表達式。某一類回歸方程的總稱。第八章相關與回歸分析11、根據理論和對問題的分析判斷,區分自變量和因變量;2、設法找出適合的數學方程式(即回歸模型)描述變量間的關系3、對回歸模型進行統計檢驗;4、統計檢驗通過后,利用回歸模型,根據解釋變量去估計,預測因變量。一、回歸分析的內容第八章相關與回歸分析1一個自變量兩個及兩個以上自變量回歸模型多元回歸一元回歸線性回歸非線性回歸線性回歸非線性回歸第八章相關與回歸分析1二、一元線性回歸方程樣本一元線性回歸方程:以樣本統計量估計總體參數斜率(回歸系數)截距截距a

表示在沒有自變量x的影響時,其它各種因素對因變量y的平均影響;回歸系數b

表明自變量x每變動一個單位,因變量y平均變動b個單位。(估計的回歸方程)第八章相關與回歸分析1隨機干擾:各種偶然因素、觀察誤差和其他被忽視因素的影響X對y的線性影響而形成的系統部分,反映兩變量的平均變動關系,即本質特征。第八章相關與回歸分析1三、直線回歸方程的求解原理

——最小二乘法使因變量的觀察值與估計值之間的離差平方和達到最小來求得a和b的方法。即用最小二乘法擬合的直線來代表x與y之間的關系與實際數據的誤差比其他任何直線都小。第八章相關與回歸分析13.回歸系數的估計的最小二乘法公式

設將Q對求偏導數,并令其等于零,可得:

加以整理后有:

第八章相關與回歸分析1例:配合回歸直線?第八章相關與回歸分析1第八章相關與回歸分析1估計方程的求法

(Excel的輸出結果)第八章相關與回歸分析1四、一元線性回歸方程的檢驗(一)回歸模型檢驗的種類回歸模型的檢驗包括理論意義檢驗、回歸方程的檢驗和回歸系數的檢驗。第八章相關與回歸分析1(二)擬合程度的評價

1、擬合程度,是指樣本觀測值聚集在樣本回歸線周圍的緊密程度。2、判斷回歸模型擬合程度優劣最常用的數量尺度是決定系數。它是建立在對總離差平方和進行分解的基礎之上的。第八章相關與回歸分析13、離差平方和的分解因變量y的取值是不同的,y取值的這種波動稱為變差。變差來源于兩個方面:由于自變量x的取值不同造成的;除x以外的其他因素(如x對y的非線性影響、測量誤差等)的影響。xyy{}}

離差分解圖第八章相關與回歸分析13、離差平方和的分解

(三個平方和的關系)

2)兩端平方后求和有1)從圖上看有SST=SSR+SSE總離差平方和(SST){回歸平方和(SSR){殘差平方和(SSE){第八章相關與回歸分析14、決定系數(r2

)1)回歸平方和占總離差平方和的比例2)反映回歸直線的擬合程度3)取值范圍在[0,1]之間4)r21,說明回歸方程擬合的越好;r20,說明回歸方程擬合的越差5)判定系數等于相關系數的平方,即r2=(r)2第八章相關與回歸分析1(三)回歸方程的顯著性檢驗

1、檢驗自變量和因變量之間的線性關系是否顯著具體方法是將回歸離差平方和(SSR)同剩余離差平方和(SSE)加以比較,應用F檢驗來分析二者之間的差別是否顯著如果是顯著的,兩個變量之間存在線性關系如果不顯著,兩個變量之間不存在線性關系第八章相關與回歸分析12、檢驗的步驟1)提出假設H0:線性關系不顯著

2)計算檢驗統計量F3)確定顯著性水平,并根據分子自由度1和分母自由度n-2找出臨界值F

4)作出決策:若F

F

,拒絕H0;若F<F

,接受H0第八章相關與回歸分析1Excel輸出的方差分析表平方和均方第八章相關與回歸分析1四、回歸系數的顯著性檢驗3、在一元線性回歸中,等價于回歸方程的顯著性檢驗1、檢驗x與y之間是否具有線性關系,或者說,檢驗自變量x對因變量y的影響是否顯著2、理論基礎是回歸系數

的抽樣分布第八章相關與回歸分析11)是根據最小二乘法求出的樣本統計量,它有自己的分布2)的分布具有如下性質4、依據的抽樣分布第八章相關與回歸分析1

5、步驟1)提出假設H0:b1=0(沒有線性關系)H1:b1

0(有線性關系)2)計算檢驗的統計量3)確定顯著性水平,并進行決策

t>t

,拒絕H0;t<t

,接受H0第八章相關與回歸分析16、實例提出假設H0:b1=0人均收入與人均消費之間無線性關系H1:b1

0人均收入與人均消費之間有線性關系計算檢驗的統計量

t=65.0758>t

=2.201,拒絕H0,表明人均收入與人均消費之間有線性關系

對前例的回歸系數進行顯著性檢驗(

=0.05)第八章相關與回歸分析1

7、Excel輸出的結果第八章相關與回歸分析1五、一元線性回歸方程的預測1、根據自變量x

的取值估計或預測因變量y的取值2、估計或預測的類型點估計y的平均值的點估計y的個別值的點估計區間估計y的平均值的置信區間估計第八章相關與回歸分析1

3、置信區間估計(1)

y的平均值的置信區間估計利用估計的回歸方程,對于自變量x的一個給定值x0

,求出因變量y

的平均值E(y0)的估計區間,這一估計區間稱為置信區間(2)E(y0)

在1-

置信水平下的置信區間為式中:Sy為估計標準誤差第八章相關與回歸分析1(3)影響區間寬度的因素1) 置信水平(1-

)區間寬度隨置信水平的增大而增大2) 數據的離散程度(s)區間寬度隨離散程度的增大而增大3) 樣本容量區間寬度隨樣本容量的增大而減小4) 用于預測的xp與

x的差異程度區間寬度隨xp與

x的差異程度的增大而增大第八章相關與回歸分析1置信區間、回歸方程xpyx

x置信上限置信下限第八章相關與回歸分析1第四節多元線性相關與回歸分析一、多元線性回歸模型1、定義:一個因變量與兩個及兩個以上自變量之間的回歸描述因變量y如何依賴于自變量x1

,x2

,…,xp

和誤差項

的方程稱為多元線性回歸模型

b0

,b1,b2

,,bp是參數

是被稱為誤差項的隨機變量

y是x1,,x2

,xp

的線性函數加上誤差項

說明了包含在y里面但不能被p個自變量的線性關系所解釋的變異性第八章相關與回歸分析1多元線性回歸模型

對于n組實際觀察數據(yi;xi1,,xi2

,xip),(i=1,2,…,n),多元線性回歸模型可表示為y1

=b0+b1x11+b2x12

++

bpx1p

+e1y2=b0+b1x21

+b2x22

++

bpx2p

+e2

yn=b0+b1xn1

+b2xn2

++

bpxnp

+en{……第八章相關與回歸分析1二、參數的最小二乘法根據最小二乘法的要求,可得求解各回歸參數的標準方程如下使因變量的觀察值與估計值之間的離差平方和達到最小來求得

。即第八章相關與回歸分析1三、顯著性檢驗

(線性關系的檢驗

)1、回歸方程的檢驗:將回歸離差平方和(SSR)同剩余離差平方和(SSE)加以比較,應用F檢驗來分析二者之間的差別是否顯著如果是顯著的,因變量與自變量之間存在線性關系如果不顯著,因變量與自變量之間不存在線性關系2、回歸系數的檢驗:對每一個自變量都要單獨進行檢驗,應用t

檢驗在多元線性回歸中,回歸方程的顯著性檢驗不再等價于回歸系數的顯著性檢驗。第八章相關與回歸分析1第五節非線性相關與回歸分析一、非線性函數形式的確定1、選擇回歸方程的具體形式應遵循以下原則:首先,方程形式應與有關實質性科學的基本理論相一致。其次,方程有較高的擬合程度。最后,方程的數學形式要盡可能簡單。第八章相關與回歸分析1二、幾種常見的非線性模型(一)指數函數線性化方法兩端取對數得:lny=ln

+

x令:y'=lny,則有y'

=ln

+

x基本形式:圖像

第八章相關與回歸分析1二、幾種常見的非線性模型(二)冪函數線性化方法兩端取對數得:lgy=lg+lgx令:y'=lgy,x'=lgx,則y'=lg+x'基本形式:圖像0<<1

1

=1-1<

<0

<-1

=-1第八章相關與回歸分析1二、幾種常見的非線性模型(三)雙曲線函數線性化方法令:y'=1/y,x'=1/x,則有y'=+x'基本形式:圖像

<0

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論