




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
直線相關與回歸分析第一節直線相關(linearcorrelation)什么是相關?
當所研究的兩個事物或現象之間,既存在著密切的數量關系,又不象函數關系那樣,能以一個變量的數值精確地求出另一個變量的數值,我們稱這類變量之間的關系為相關關系,簡稱相關。
目的:研究事物或現象之間有無關系、關系的方向和密切程度。直線相關的概念直線相關(linearcorrelation)又稱簡單相關,用于雙變量正態分布資料。相關關系并不一定是因果關系,相關分析的任務就是對相關關系給以定量的描述。第一節直線相關(linearcorrelation)直線相關系數(一)相關系數的意義
相關系數(coefficientofcorrelation)又稱積差相關系數(coefficientofproduct-momentcorrelation),以符號r表示。它是說明具有直線關系的兩個變量間相關密切程度和相關方向的統計指標。直線相關系數(一)相關系數的意義
r>0:正相關,r<0:負相關,r=0:零相關。|r|=l:完全相關相關系數沒有單位,其值為-1≤r≤l
直線相關系數(一)相關系數的意義
Pearson相關系數的計算公式相關系數的計算
例:某地一年級12名女大學生的體重與肺活量數據如下,試問肺活量(L)Y與體重(kg)X有無相關關系?
體重X:42,42,46,46,46,50,50,50,52,52,58,58。肺活量Y:2.55,2.20,2.75,2.40,2.80,2.81,3.41,3.10,3.46,2.85,3.50,3.00相關系數的假設檢驗r是樣本相關系數,它是總體相關系數ρ的估計值。要判斷X、Y間是否有相關關系,就要檢驗r是否來自總體相關系數ρ為零的總體。常用t檢驗:Sr為相關系數r的標準誤自由度ν=n-2例:就上例檢驗女大學生體重與肺活量間是否有直線相關關系α=0.05
本例,n=12,r=0.7495
ν=n–2=12–2=10,t0.01(10)=3.169t=3.58>3.169,P<0.01,按α=0.05水準,拒絕H0,接受H1,故可認為一年級女大學生體重與肺活量間呈正的直線相關關系。進行直線相關分析時的注意事項直線相關表示兩個變量之間的關系是雙向的,當散點圖出現直線趨勢時,再作分析。相關系數的計算只適用于兩個變量都服從正態分布的資料。樣本相關系數是總體相關系數的一個估計值,與總體相關系數之間存在著抽樣誤差,必須作假設檢驗。相關分析是用相關系數來描述兩個變量間相互關系的密切程度和方向,相關關系不一定是因果關系。出現異常值時慎用相關。進行直線相關分析時的注意事項第二節直線回歸(linearregression)直線回歸的概念
假設兩個變量X,Y中,當一個變量X改變時,另一個變量Y也相應地改變,此時稱X為自變量(independentvariable),Y為應變量(dependentvariable)。當這兩個變量之間存在著直線關系時,不僅可以用相關系數r表示變量Y與X直線關系的密切程度,也可以用表示Y與X的直線關系,稱為直線回歸(1inear
regression)。為了區別于一般函數方程,我們將它稱為直線回歸方程。直線回歸方程的求法
一般表達式
:a為回歸直線在Y軸上的截距(intercept)。a>0:直線與縱軸的交點在原點的上方a<0:則交點在原點的下方a=0:則回歸線通過原點b為回歸系數(regressioncoefficient),即直線的斜率(slope)b>0:表示直線從左下方走向右上方,即Y隨X增大而增大b<0:表示直線從左上方走向右下方,即y隨X增大而減少b=0:表示直線與X軸平行,即X與Y無直線關系b的統計學意義是X每增(減)一個單位,Y平均改變b個單位就上例試求女大學生肺活量Y對體重X的直線回歸方程:回歸方程:
注意:所繪直線必然通過點(),若縱坐標、橫坐標無折斷號時,將此線左端延長與縱軸相交,交點的縱坐標必等于截距a。直線回歸方程的應用
1.
描述兩變量間的依存關系2.利用回歸方程進行預測(forecast)3.利用回歸方程進行統計控制(statisticalcontrol)回歸系數的假設檢驗
回歸方程是否成立,即x、y是否有直線關系,是回歸分析要考慮的首要問題。即使x、y的總體回歸系數β為零,由于抽樣誤差,其樣本回歸系數b也不一定為零,因此需作β是否為零的假設檢驗,可用方差分析或t檢驗。2.計算統計量(一)方差分析ν總=n-1ν回歸=1ν殘差=n-2
SS殘差=SS總-SS回歸式中Sb為樣本回歸系數的標準誤,Sy.x為剩余標準差,是當X的影響被扣除后,應變量Y值對于回歸直線的離散程度。(二)t檢驗2.計算統計量回歸系數與相關系數的假設檢驗是等值的,即tr=tb
應用直線回歸應注意的問題(1)作回歸分析要有實際意義,不能把毫無關聯的兩種現象作回歸分析,必須對兩種觀象間的內在聯系有所認識。(2)作回歸分析時,一般以“因”的變量為X,以“果”的變量為Y。若變量之間無因果關系,則以容易測定、較穩定或變異較小者為X。應用直線回歸應注意的問題(3)應變量是隨機變量。自變量也是隨機變量時,兩者均應服從正態分布;自變量為給定的量時,與每個X取值相對應的變量Y必須服從正態分布。(4)回歸方程只有經過檢驗拒絕了無效假設后才有意義。(5)回歸方程的適用范圍有其限度,一般僅適用于自變量X的原數據范圍內,而不能任意外推。1.在資料要求上,直線回歸要求因變量Y服從正態分布;X是可以精確測量和嚴格控制的變量,一般稱為I型回歸。第三節直線相關與回歸的區別和聯系區別直線相關要求兩個變量X、Y服從雙變量正態分布。這種資料若進行回歸分析稱為Ⅱ型回歸。可以計算兩個回歸方程。由X推Y的回歸方程:由Y推X的回歸方程:2.在應用上,說明兩變量間依存變化的數量關系用回歸,說明變量間雙向的相互關系時用相關。區別聯系
1.對一組數據若同時計算r與b,它們的正負號是一致的。r為正號說明兩變量間的相互關系是同向變化的。b為正,說明X增(減)一個單位,Y平均增(或減)b個單位。
2.同一資料中r和b的假設檢驗是等價的,即對同一樣本,二者的t值相等。
3.回歸與相關可互相解釋。r2稱為決定系數(Coefficientof
determination)。1、區別:(1)直線相關的兩個變量都需服從正態分布
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 食品廢渣外售協議書
- Brand KPIs for sauces condiments Wingreens Farms in India-外文版培訓課件(2025.2)
- 飲水糾紛調解協議書
- 酒店燙傷免責協議書
- 俱樂部單方解約協議書
- 鋼筋施工合同協議書
- 車輛保險代辦協議書
- 食堂維修安全協議書
- 營口沿海存款協議書
- 項目工人勞務協議書
- 夜場水煙合作協議書
- 河南省青桐鳴大聯考普通高中2024-2025學年高三考前適應性考試地理試題及答案
- 管道勞務分包協議書
- 2025-2030中國鋰電子電池行業市場深度調研及前景趨勢與投資研究報告
- 江蘇省南京市建鄴區2023-2024學年八年級下學期期末考試物理試題【含答案解析】
- 公立醫院與民營醫院醫聯體合作協議書(2篇)
- 律師會見筆錄范本
- 浙教版科學電學基礎知識總結
- T/CEC 164-2018 火力發電廠智能化技術導則_(高清-最新版)
- 抹機水MSDS 安全資料表
- 醫院感染管理組織框架
評論
0/150
提交評論