直線相關與回歸_第1頁
直線相關與回歸_第2頁
直線相關與回歸_第3頁
直線相關與回歸_第4頁
直線相關與回歸_第5頁
已閱讀5頁,還剩34頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1直線相關與回歸2主要內容直線相關直線回歸直線相關與回歸的區別與聯系等級相關3一、直線相關的概念二、相關系數的計算三、相關系數的假設檢驗第一節直線相關一、直線相關的概念直線相關(linearcorrelation):又稱簡單相關,是探討服從正態分布的兩個隨機變量X和Y有無線性相關關系的一種統計分析方法。4如,研究血糖和胰島素之間的線性關系5線性相關系數(linearcorrelationcoefficient):又稱積差相關系數,簡稱相關系數,是描述兩個變量間線性相關關系的密切程度與方向的統計指標。樣本相關系數用r表示,總體相關系數用

表示。

相關系數沒有單位,其取值在-1和1之間波動。r值為正表示正相關,r值為負表示負相關,r值為零為零相關。r值等于1為完全正相關。r值等于-1表示完全負相關。相關系數67其中二、相關系數的計算8例12-1某醫生隨機抽查了12名糖尿病患者的空腹血糖及胰島素值,數據見下表,試做相關分析。910本例,代入公式,得11三、相關系數的假設檢驗

t檢驗121.建立檢驗假設H0:

=0H1:0

=0.052.計算統計量3.確定P值和判斷結果

=12-2=10,查t值表,t0.01(10)=3.169,本例的tr=3.092t0.01(10),P0.01,按

=0.05的水準,拒絕H0,接受H1,認為糖尿病患者血糖和胰島素之間存在相關關系,是負相關。例12-1:t檢驗法13因為

=12-2=10,查r界值表,r0.05(10)=0.576,r0.01(10)=0.708,本例r=|-0.8115|>r0.01(10),P<0.01,按

=0.05的水準,拒絕H0,接受H1,結論同t檢驗。例12-1:*查表法第二節直線回歸14一、直線回歸的概念二、直線回歸方程的求法三、回歸系數的假設檢驗四、回歸方程的應用五、注意事項15直線回歸(linearregression),又稱簡單回歸,是探討兩個連續性變量X和Y間依存關系的一種統計分析方法。一、直線回歸的概念直線回歸方程的一般表達式:16:為X取某固定值時應變量Y總體均數的估計值。a:截距b:回歸系數,即斜率。注意:直線回歸方程與函數方程的不同Y=a+bX17例12-2

就例12-1的資料,現已計算得糖尿病患者的血糖與胰島素之間存在負相關關系,試繼續進行直線回歸分析。18二、直線回歸方程的求法步驟1:繪制散點圖步驟2:計算回歸系數b和截距a步驟3:建立直線回歸方程19繪制散點圖20直線回歸方程的求解:最小二乘原理yx保證各實測點距回歸直線的縱向距離平方和最小。計算回歸系數b和截距a21根據最小二乘估計原理:得:b=-0.3256,a=16.090722根據:b=-0.3256a=16.0907寫出直線回歸方程:有意義嗎?-->假設檢驗建立直線回歸方程23回歸系數也有抽樣誤差!總體β=0總體β≠0樣本b≠0兩變量有直線關系兩變量無直線關系??24

t檢驗回歸系數的假設檢驗與相關系數的假設檢驗等價三、回歸系數的假設檢驗25稱剩余標準差(residualstandarddeviation),為各實際值Y與估計值之間的誤差,反映了扣除X的影響后,Y對回歸直線的離散程度。261.檢驗假設H0:

=0H1:0

=0.052.計算統計量273.確定P值,判斷結果查t值表,t0.01(10)=3.169,tb>t0.01(10)

,P<0.01,按α=0.05水準,拒絕H0,接受H1,認為糖尿病患者血糖和胰島素之間存在直線回歸關系。281.描述兩個變量之間的數量依存關系2.利用回歸方程進行預測3.利用回歸方程進行統計控制四、回歸方程的應用291.要求應變量Y服從正態分布,通常自變量X為可以精確測量或嚴格控制的因素。2.作回歸分析時要有實際意義,不能把毫無關聯的兩事物或現象進行回歸分析。3.分析前,應繪制散點圖。4.回歸方程在實際回歸范圍內應用。五、注意事項30

某地有風俗,每當小孩出生,均在自家庭院中種上一棵樹,隨著樹的生長,小孩也在長高。你認為兩者是什么關系?伴隨關系第三節直線相關與回歸分析的關系(一)區別(二)聯系3132

1.在應用上不同

分析變量間關系的密切程度和方向時用相關,描述變量間在數量上依存關系時用回歸。

2.在資料要求上不同

相關分析要求X、Y均要服從正態分布,即雙變量正態分布資料。回歸分析時,要求應變量Y服從正態分布,X是可以精確測量或嚴格控制的變量。(一)區別33(二)聯系1.相關系數與回歸系數的正負號相同。2.回歸系數與相關系數的假設檢驗等價。3.可以用回歸解釋相關。34r的平方稱為決定系數(coefficientofdetermination)

回歸平方和是由于引入了相關變量而使總平方和減少的部分。回歸平方和越接近總平方和,則r2越接近1,剩余平方和越小,相關和回歸分析的效果越好。第四節Spearman等級相關不服從雙變量正態分布而不宜作積差相關分析;總體分布類型未知;等級資料。35適用情況:36Spearman等級相關:是用等級相關系數rs來描述兩變量間相關關系的密切程度與相關方向的一種統計分析方法。37計算方法:

將成對的兩組變量的觀察值分別由小到大編秩次,當觀察值相同時,取平均秩次,然后對秩次進行積差相關分析。式中X’、Y’分別為每對觀察值X、Y的秩次。

38例12-3某醫師測得一組患者血小板數及出血程度的資料如下表12-2,試分析二者之間的關系。

表12-210名某病患者血小板數及出血程度數據

39等級相關系數的假設檢驗

H0:ρS=0

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論