




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
中醫科研設計與統計湖北中醫學院基礎部衛生生物教研室(J-C204)Tel-Mail:annworld@163.com《醫學統計學》馬斌榮主編人民衛生出版社2006年第四版中醫科研設計與統計1衛生統計學10線性相關與回歸2在上一節中我們通過直線相關分析知道了待產婦尿中雌三醇含量和新生兒體重之間成正相關關系。那么,如果我們知道了一位待產婦的尿雌三醇含量,能推斷出這個新生兒的體重嗎?或者這個新生兒的體重可能在什么范圍內呢?對此相關分析不能給我們答案,這些問題需要使用直線回歸的方法來解決。中醫科研設計與統計2衛生統計學10線性相關與回歸2第二節線性回歸當我們知道了兩個變量之間有直線相關關系,并且一個變量的變化會引起另一個變量的變化,這時,如果它們之間存在準確、嚴格的關系,那么它們的變化可用函數方程來表示。在實際生活當中,由于其它因素的干擾,許多雙變量之間的關系并不是嚴格的函數關系,不能用函數方程來反映。但是,我們需要利用數學函數的理論去研究兩變量之間的數量依存關系,為了區別于數學上確定的函數方程,我們稱這種關系式為直線回歸方程,這種關系為直線回歸。中醫科研設計與統計3衛生統計學10線性相關與回歸2直線回歸的統計模型1.yi是xi的線性函數部分加上誤差項εi;2.α:截距(intercept),是x=0時y的本底水平;3.回歸部分βx:y的變化中隨x變化而變化的部分;β稱為回歸系數(regressioncoefficient):自變量x每改變一個度量單位,應變量y改變量的平均估計值;4.隨機誤差εi
:又稱殘差(residual);是不能由變量x所解釋的變異部分;反映了除變量x之外的隨機因素對y的影響。中醫科研設計與統計4衛生統計學10線性相關與回歸2建立直線回歸方程利用樣本數據計算參數α和β的估計值a和b,建立模型的估計方程,即尋找一條與所有散點都最為接近(實測點到直線的縱向距離)的直線,使得總的預測誤差最小。中醫科研設計與統計5衛生統計學10線性相關與回歸2尋找總的預測誤差最小的直線X觀測值預測值預測誤差(殘差)Y中醫科研設計與統計6衛生統計學10線性相關與回歸2最小二乘法(leastsquaremethod)怎樣的最好的代表了所有的y,需要有個標準。經典的標準是最小二乘(leastsquares)原則:每個觀察點距離回歸線的縱向距離的平方和最小,即殘差平方和最小:因為直線一定經過“樣本均數”點中醫科研設計與統計7衛生統計學10線性相關與回歸2計算例1資料的估計值a和b中醫科研設計與統計8衛生統計學10線性相關與回歸2將估計值a和b代入方程回歸參數a、b的解釋1.斜率(b):當x每增加1個單位時,y平均改變b個單位;本例b=0.0608,表明待產婦尿中雌三醇含量每增加1mg/24h,新生兒體重平均增加0.0608kg。2.截距(a):當x=0時y本底水平的平均估計值;本例a=2.1523,表示待產婦尿中雌三醇含量為0時,新生兒體重的本底值為2.1523kg(注意這種解釋有時候并無實際意義,如x是否可取0)。中醫科研設計與統計9衛生統計學10線性相關與回歸2問題:直線回歸方程的建立是否一定能說明雌三醇含量與新生兒體重之間存在回歸關系?與直線相關一樣,直線回歸方程也是從樣本資料計算而得的,同樣也存在著抽樣誤差問題。所以,需要對樣本的回歸系數b進行假設檢驗,以判斷b是否從回歸系數為零的總體中抽得(即檢驗總體回歸系數β是否為0)。中醫科研設計與統計10衛生統計學10線性相關與回歸2(一)回歸系數的假設檢驗(t檢驗):1.建立檢驗假設:H0:β=0H1:β≠0α=0.052.計算統計量t:回歸方程的假設檢驗中醫科研設計與統計11衛生統計學10線性相關與回歸2Sb:回歸系數的標準誤;Sy.x
:殘差標準差(又稱剩余標準差),即去除x對y的影響后y的變異。中醫科研設計與統計12衛生統計學10線性相關與回歸2例1資料回歸系數的t檢驗查t界值表t0.05(29)=2.045<t,在α=0.05水準拒絕H0,認為總體回歸系數不為零,雌三醇含量與新生兒出生體重之間存在線性回歸關系。中醫科研設計與統計13衛生統計學10線性相關與回歸2(二)回歸模型的假設檢驗(方差分析,ANOVA):1.建立檢驗假設:H0:回歸模型不成立H1:回歸模型成立α=0.052.計算統計量F:方差分析的基本思想:將應變量y的總變異分解成兩個部分,一個是處理因素(自變量x)帶來的回歸變異,另一個是隨機誤差帶來的殘差變異。回歸變異:又稱回歸均方(方差),即y的變異中因為x對y的線性回歸關系而帶來的變異;殘差變異:又稱殘差均方(方差),是除了自變量x之外的其他隨機因素對y帶來的變異;中醫科研設計與統計14衛生統計學10線性相關與回歸2F檢驗就是將兩部分的變異進行比較:如果F值接近1,說明回歸變異和殘差變異沒有多大差別,兩者都是隨機誤差,處理因素(自變量x)對應變量y沒有線性回歸關系,回歸模型不成立;如果F值遠大于1,說明回歸變異遠大于殘差變異,處理因素(自變量x)帶來的變異不能簡單的解釋為隨機誤差,即處理因素(自變量x)對應變量y存在回歸關系,回歸模型成立。中醫科研設計與統計15衛生統計學10線性相關與回歸2中醫科研設計與統計16衛生統計學10線性相關與回歸2從上圖可以看出:上式兩端平方,數學上可以證明:y的總離均差平方和等于回歸離均差平方和加上殘差離均差平方和,y的自由度等于回歸自由度加上殘差自由度。即:SS總=SS回+SS殘,v總=v回+v殘中醫科研設計與統計17衛生統計學10線性相關與回歸2例1資料的方差分析表變異來源離均差平方和(SS)自由度(v)均方(MS)F值回歸2.5057412.5057417.16殘差4.23426290.14601總變異6.7400030查F界值表F0.05(1,29)=4.18<F,在α=0.05水準拒絕H0,認為處理因素(自變量x)對應變量y存在回歸關系,回歸模型成立。中醫科研設計與統計18衛生統計學10線性相關與回歸2相關系數與回歸系數假設檢驗的關系從上述計算結果可以看到:相關系數和回歸系數的t檢驗結果完全等價,并且與各自的方差分析結果完全等價(分子的自由度為1,即兩變量分析)中醫科研設計與統計19衛生統計學10線性相關與回歸2直線回歸分析的應用
1.建立統計模型解釋應變量對自變量的數量依存關系2.自變量預測應變量:利用已知、容易測量或可以測量的變量去預測未知、不易測量或不可測量的變量由父親的身高預測兒子成人后的身高;3.應變量控制自變量:利用應變量反向控制自變量已知鉛作業的時間(x)與血鉛濃度(y)的回歸關系,當制定人體血鉛正常值上限標準后,控制工人鉛作業的時間;已知汽車流量(x)與空氣氮氧化物污染濃度(y)的回歸關系,當制定空氣氮氧化物的限制標準后,控制汽車流量。中醫科研設計與統計20衛生統計學10線性相關與回歸21.β的置信區間:
意義:估計總體回歸系數取值范圍的大小例1資料:回歸系數為0.0608,計算置信區間是(0.0308,0.0908)區間范圍不包括0,即總體回歸系數不為0,說明尿雌三醇含量對新生兒的體重存在回歸關系。利用回歸方程進行估計和預測
中醫科研設計與統計21衛生統計學10線性相關與回歸22.總體的置信區間:意義:當自變量x取值為某一定值xi時,回歸方程對應的估計值yi的總體條件均數的取值范圍。例1資料:如果某位待產婦尿中雌三醇含量為16mg/24h,估計其新生兒體重的均數是3.1251kg,總體均數的95%置信區間是2.98~3.27kg。中醫科研設計與統計22衛生統計學10線性相關與回歸2總體的95%置信區間中醫科研設計與統計23衛生統計學10線性相關與回歸23.個體y值的預測區間:意義:當自變量x取值為某一定值xi時,預測應變量估計值yi取值的參考值范圍。例1資料:如果某位待產婦尿中雌三醇含量為16mg/24h,估計其新生兒體重的均數是3.1251kg,95%參考值范圍是2.33~3.92kg。中醫科研設計與統計24衛生統計學10線性相關與回歸2個體y值的95%預測區間中醫科研設計與統計25衛生統計學10線性相關與回歸295%置信區間和參考值范圍中醫科研設計與統計26衛生統計學10線性相關與回歸2線性回歸的類型與條件
(一)線性回歸的類型:Ⅰ型回歸:y是來自正態分布總體的隨機變量,x是精確測量或可控制的變量。(溶液濃度與光密度)Ⅱ型回歸:y是來自正態分布總體的隨機變量,x也是來自正態分布總體的隨機變量。(父高與子高)(二)線性回歸的條件:1.線性(linearity):y與x之間存在直線關系;2.獨立性(independence):各觀察值間彼此獨立;3.正態性(normality):對于任何給定的自變量x,應變量y都有一個服從正態分布的取值范圍對應;4.等方差(equalvariance):對于任何給定的自變量x,應變量y每一個取值范圍的方差相等。中醫科研設計與統計27衛生統計學10線性相關與回歸2給定x,y是正態分布、方差相等示意圖中醫科研設計與統計28衛生統計學10線性相關與回歸2給定x,y是正態分布、方差不等示意圖中醫科研設計與統計29衛生統計學10線性相關與回歸2相關與回歸的區別(一)資料要求不同:1.相關分析:對稱地對待兩個變量,對自變量和應變量不加以區別。要求:x與y均為隨機變量(有概率分布),且x和y都來自正態分布總體(雙變量正態分布)。2.回歸分析:應變量和自變量的處理不對稱。自變量x:被看做是(在重復抽樣中)可精確測量或嚴格控制的變量。應變量y:是隨機變量,并且對于任何一個選定的x,應變量y都有一個正態分布的總體與之對應,且這些總體的方差都相等。中醫科研設計與統計30衛生統計學10線性相關與回歸2(二)應用方向不同:1.相關分析:研究兩個變量之間的相互關系,即在兩個變量中,任何一個的變化都會引起另一個的變化,是一種雙向變化的關系。通過相關分析可以知道兩個變量是否有關系,關系是否密切,性質是屬于正相關還是負相關。2.回歸分析:研究兩個變量在數量比例上的依存關系,一個變量的改變會引起另一個變量的變化,是一種單向的關系。回歸是對兩個變量做定量描述,研究變量間的數量依存關系,已知一個變量值可以預測或控制另一個變量值,并且得到定量的結果。中醫科研設計與統計31衛生統計學10線性相關與回歸2(三)參數性質不同:1.相關系數r:說明具有直線關系的兩個變量間相關方向和密切程度的統計指標。沒有單位,取值范圍【-1,1】;絕對值意義:絕對值越大,散點越趨向于一條直線,表明兩變量的關系越密切,相關程度越高。2.回歸系數b:表示x每增大(或減小)一個單位,y平均增大(或減小)b個單位。有單位(y的單位/x的單位),取值范圍無限;絕對值意義:絕對值越大,回歸直線越陡,說明當x變化一個單位時,y的平均變化就越大。中醫科研設計與統計32衛生統計學10線性相關與回歸2相關與回歸的聯系(一)相關系數和回歸系數的聯系:對于同一組樣本資料,如果知道變量x和y的標準差sx、sy,相關系數和回歸系數可以互相推算。中醫科研設計與統計33衛生統計學10線性相關與回歸2(二)方向一致且假設檢驗等價1.對于同一組樣本資料,r與b符號一致。r為正時,b也為正,表示兩變量是正相關,是同向變化(x變大y也變大)。r為負時,b也為負,表示兩變量是負相關,是反向變化(x變大y會變小)。2.對于同一組樣本資料,r與b的假設檢驗結果等價,可用r的顯著檢驗代替b的顯著性檢驗。中醫科研設計與統計34衛生統計學10線性相關與回歸2(三)相關回歸可以互相解釋確定系數(coefficientofdetermination):相關系數的平方,反映x對y的回歸貢獻的程度大小。計算公式:在應變量y的總離均差平方和中自變量x的回歸離均差平方和所占的比例,即自變量x的回歸貢獻對應變量y的總變異能解釋的百分比。取值范圍:【0,1】,越接近1,說明實際觀測點離回歸直線越近,回歸模型的擬合度越高。
例1:r=0.6097,R2=0.3717,即待產婦尿中雌三醇含量大約可解釋新生兒體重變異性的37.17%。中醫科研設計與統計35衛生統計學10線性相關與回歸2相關回歸分析的注意事項1.實際意義:進行相關回歸分析要有實際意義,不可把毫無關系的兩個事物或現象用來作相關回歸分析。例如:有人說,孩子長,公園里的小樹也在長。但是求孩子身高和小樹高度之間的相關關
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 壓軸題03 填空題-力學中的摩擦力、平衡力、功能關系 (學生版)-2025年中考科學壓軸題專項訓練
- 鐵礦石采選項目安全風險評價報告
- 潔磁劑項目風險分析和評估報告
- 內蒙古呼和浩特市重點中學2024-2025學年高三月考試卷(六)生物試題試卷含解析
- 丙烯酸樹脂項目風險分析和評估報告
- 蘭州城市學院《學位英語基礎課程》2023-2024學年第一學期期末試卷
- 毛皮制品加工行業市場營銷渠道考核試卷
- 2025年中考歷史一輪復習之經典好題單元練(十一)-新民主主義革命的開始(學生版)
- 2025基礎設施貸款合同范本
- 中秋節快樂情滿中秋弘揚傳統!課件-高中上學期主題班會
- 人道主義補償協議書
- 2025年世界地球日知識答題活動考試題庫300題(含答案)
- 2025屆浙江省溫州市高三下學期二模物理試題(含答案)
- 麻醉睡眠治療科普
- 2025-2031年中國花卉行業競爭格局分析及投資戰略咨詢報告
- 2025年職業院校技能大賽(高職組)體育活動設計與實施賽項參考試題(附答案)
- 2025年長春醫學高等專科學校單招職業技能考試題庫附答案
- 《職業健康與環境保護》課件
- 《鄉村治理理論與實踐》課件 第六章 鄉村自治體系概述
- 幼兒園游戲回顧研討
- DB42╱T 620-2010 柑橘果園改造技術規程
評論
0/150
提交評論