直線相關(guān)回歸課件_第1頁(yè)
直線相關(guān)回歸課件_第2頁(yè)
直線相關(guān)回歸課件_第3頁(yè)
直線相關(guān)回歸課件_第4頁(yè)
直線相關(guān)回歸課件_第5頁(yè)
已閱讀5頁(yè),還剩35頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

直線相關(guān)與回歸分析第一節(jié)直線相關(guān)(linearcorrelation)什么是相關(guān)?

當(dāng)所研究的兩個(gè)事物或現(xiàn)象之間,既存在著密切的數(shù)量關(guān)系,又不象函數(shù)關(guān)系那樣,能以一個(gè)變量的數(shù)值精確地求出另一個(gè)變量的數(shù)值,我們稱(chēng)這類(lèi)變量之間的關(guān)系為相關(guān)關(guān)系,簡(jiǎn)稱(chēng)相關(guān)。

目的:研究事物或現(xiàn)象之間有無(wú)關(guān)系、關(guān)系的方向和密切程度。直線相關(guān)的概念直線相關(guān)(linearcorrelation)又稱(chēng)簡(jiǎn)單相關(guān),用于雙變量正態(tài)分布資料。相關(guān)關(guān)系并不一定是因果關(guān)系,相關(guān)分析的任務(wù)就是對(duì)相關(guān)關(guān)系給以定量的描述。第一節(jié)直線相關(guān)(linearcorrelation)直線相關(guān)系數(shù)(一)相關(guān)系數(shù)的意義

相關(guān)系數(shù)(coefficientofcorrelation)又稱(chēng)積差相關(guān)系數(shù)(coefficientofproduct-momentcorrelation),以符號(hào)r表示。它是說(shuō)明具有直線關(guān)系的兩個(gè)變量間相關(guān)密切程度和相關(guān)方向的統(tǒng)計(jì)指標(biāo)。直線相關(guān)系數(shù)(一)相關(guān)系數(shù)的意義

r>0:正相關(guān),r<0:負(fù)相關(guān),r=0:零相關(guān)。|r|=l:完全相關(guān)相關(guān)系數(shù)沒(méi)有單位,其值為-1≤r≤l

直線相關(guān)系數(shù)(一)相關(guān)系數(shù)的意義

Pearson相關(guān)系數(shù)的計(jì)算公式相關(guān)系數(shù)的計(jì)算

例:某地一年級(jí)12名女大學(xué)生的體重與肺活量數(shù)據(jù)如下,試問(wèn)肺活量(L)Y與體重(kg)X有無(wú)相關(guān)關(guān)系?

體重X:42,42,46,46,46,50,50,50,52,52,58,58。肺活量Y:2.55,2.20,2.75,2.40,2.80,2.81,3.41,3.10,3.46,2.85,3.50,3.00相關(guān)系數(shù)的假設(shè)檢驗(yàn)r是樣本相關(guān)系數(shù),它是總體相關(guān)系數(shù)ρ的估計(jì)值。要判斷X、Y間是否有相關(guān)關(guān)系,就要檢驗(yàn)r是否來(lái)自總體相關(guān)系數(shù)ρ為零的總體。常用t檢驗(yàn):Sr為相關(guān)系數(shù)r的標(biāo)準(zhǔn)誤自由度ν=n-2例:就上例檢驗(yàn)女大學(xué)生體重與肺活量間是否有直線相關(guān)關(guān)系α=0.05

本例,n=12,r=0.7495

ν=n–2=12–2=10,t0.01(10)=3.169t=3.58>3.169,P<0.01,按α=0.05水準(zhǔn),拒絕H0,接受H1,故可認(rèn)為一年級(jí)女大學(xué)生體重與肺活量間呈正的直線相關(guān)關(guān)系。進(jìn)行直線相關(guān)分析時(shí)的注意事項(xiàng)直線相關(guān)表示兩個(gè)變量之間的關(guān)系是雙向的,當(dāng)散點(diǎn)圖出現(xiàn)直線趨勢(shì)時(shí),再作分析。相關(guān)系數(shù)的計(jì)算只適用于兩個(gè)變量都服從正態(tài)分布的資料。樣本相關(guān)系數(shù)是總體相關(guān)系數(shù)的一個(gè)估計(jì)值,與總體相關(guān)系數(shù)之間存在著抽樣誤差,必須作假設(shè)檢驗(yàn)。相關(guān)分析是用相關(guān)系數(shù)來(lái)描述兩個(gè)變量間相互關(guān)系的密切程度和方向,相關(guān)關(guān)系不一定是因果關(guān)系。出現(xiàn)異常值時(shí)慎用相關(guān)。進(jìn)行直線相關(guān)分析時(shí)的注意事項(xiàng)第二節(jié)直線回歸(linearregression)直線回歸的概念

假設(shè)兩個(gè)變量X,Y中,當(dāng)一個(gè)變量X改變時(shí),另一個(gè)變量Y也相應(yīng)地改變,此時(shí)稱(chēng)X為自變量(independentvariable),Y為應(yīng)變量(dependentvariable)。當(dāng)這兩個(gè)變量之間存在著直線關(guān)系時(shí),不僅可以用相關(guān)系數(shù)r表示變量Y與X直線關(guān)系的密切程度,也可以用表示Y與X的直線關(guān)系,稱(chēng)為直線回歸(1inear

regression)。為了區(qū)別于一般函數(shù)方程,我們將它稱(chēng)為直線回歸方程。直線回歸方程的求法

一般表達(dá)式

:a為回歸直線在Y軸上的截距(intercept)。a>0:直線與縱軸的交點(diǎn)在原點(diǎn)的上方a<0:則交點(diǎn)在原點(diǎn)的下方a=0:則回歸線通過(guò)原點(diǎn)b為回歸系數(shù)(regressioncoefficient),即直線的斜率(slope)b>0:表示直線從左下方走向右上方,即Y隨X增大而增大b<0:表示直線從左上方走向右下方,即y隨X增大而減少b=0:表示直線與X軸平行,即X與Y無(wú)直線關(guān)系b的統(tǒng)計(jì)學(xué)意義是X每增(減)一個(gè)單位,Y平均改變b個(gè)單位就上例試求女大學(xué)生肺活量Y對(duì)體重X的直線回歸方程:回歸方程:

注意:所繪直線必然通過(guò)點(diǎn)(),若縱坐標(biāo)、橫坐標(biāo)無(wú)折斷號(hào)時(shí),將此線左端延長(zhǎng)與縱軸相交,交點(diǎn)的縱坐標(biāo)必等于截距a。直線回歸方程的應(yīng)用

1.

描述兩變量間的依存關(guān)系2.利用回歸方程進(jìn)行預(yù)測(cè)(forecast)3.利用回歸方程進(jìn)行統(tǒng)計(jì)控制(statisticalcontrol)回歸系數(shù)的假設(shè)檢驗(yàn)

回歸方程是否成立,即x、y是否有直線關(guān)系,是回歸分析要考慮的首要問(wèn)題。即使x、y的總體回歸系數(shù)β為零,由于抽樣誤差,其樣本回歸系數(shù)b也不一定為零,因此需作β是否為零的假設(shè)檢驗(yàn),可用方差分析或t檢驗(yàn)。2.計(jì)算統(tǒng)計(jì)量(一)方差分析ν總=n-1ν回歸=1ν殘差=n-2

SS殘差=SS總-SS回歸式中Sb為樣本回歸系數(shù)的標(biāo)準(zhǔn)誤,Sy.x為剩余標(biāo)準(zhǔn)差,是當(dāng)X的影響被扣除后,應(yīng)變量Y值對(duì)于回歸直線的離散程度。(二)t檢驗(yàn)2.計(jì)算統(tǒng)計(jì)量回歸系數(shù)與相關(guān)系數(shù)的假設(shè)檢驗(yàn)是等值的,即tr=tb

應(yīng)用直線回歸應(yīng)注意的問(wèn)題(1)作回歸分析要有實(shí)際意義,不能把毫無(wú)關(guān)聯(lián)的兩種現(xiàn)象作回歸分析,必須對(duì)兩種觀象間的內(nèi)在聯(lián)系有所認(rèn)識(shí)。(2)作回歸分析時(shí),一般以“因”的變量為X,以“果”的變量為Y。若變量之間無(wú)因果關(guān)系,則以容易測(cè)定、較穩(wěn)定或變異較小者為X。應(yīng)用直線回歸應(yīng)注意的問(wèn)題(3)應(yīng)變量是隨機(jī)變量。自變量也是隨機(jī)變量時(shí),兩者均應(yīng)服從正態(tài)分布;自變量為給定的量時(shí),與每個(gè)X取值相對(duì)應(yīng)的變量Y必須服從正態(tài)分布。(4)回歸方程只有經(jīng)過(guò)檢驗(yàn)拒絕了無(wú)效假設(shè)后才有意義。(5)回歸方程的適用范圍有其限度,一般僅適用于自變量X的原數(shù)據(jù)范圍內(nèi),而不能任意外推。1.在資料要求上,直線回歸要求因變量Y服從正態(tài)分布;X是可以精確測(cè)量和嚴(yán)格控制的變量,一般稱(chēng)為I型回歸。第三節(jié)直線相關(guān)與回歸的區(qū)別和聯(lián)系區(qū)別直線相關(guān)要求兩個(gè)變量X、Y服從雙變量正態(tài)分布。這種資料若進(jìn)行回歸分析稱(chēng)為Ⅱ型回歸??梢杂?jì)算兩個(gè)回歸方程。由X推Y的回歸方程:由Y推X的回歸方程:2.在應(yīng)用上,說(shuō)明兩變量間依存變化的數(shù)量關(guān)系用回歸,說(shuō)明變量間雙向的相互關(guān)系時(shí)用相關(guān)。區(qū)別聯(lián)系

1.對(duì)一組數(shù)據(jù)若同時(shí)計(jì)算r與b,它們的正負(fù)號(hào)是一致的。r為正號(hào)說(shuō)明兩變量間的相互關(guān)系是同向變化的。b為正,說(shuō)明X增(減)一個(gè)單位,Y平均增(或減)b個(gè)單位。

2.同一資料中r和b的假設(shè)檢驗(yàn)是等價(jià)的,即對(duì)同一樣本,二者的t值相等。

3.回歸與相關(guān)可互相解釋。r2稱(chēng)為決定系數(shù)(Coefficientof

determination)。1、區(qū)別:(1)直線相關(guān)的兩個(gè)變量都需服從正態(tài)分布

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論