




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
三種簡單相關分析與SAS實現醫學統計學教研室柳偉偉三種簡單相關分析與SAS實現相關在生物醫學科研與實踐中,經常涉及兩個變量之間的關系研究,以說明事物發生、發展及變化的原因或變量間依存變化的數量關系。例如:醫學上人的身高與體重的關系、年齡與血壓的關系等;藥物劑量與反應的關系等;病程與療效的關系。相關與回歸分析是研究這種關系的統計方法,屬雙變量分析(bivariateanalysis)范疇。三種簡單相關分析與SAS實現相關分析的任務
說明客觀事物或現象相互間數量關系的密切程度和方向,并用適當的統計指標表示出來。
而把客觀事物或現象間的數量依存關系表示出來,則是回歸分析所要解決的問題。三種簡單相關分析與SAS實現三種簡單相關1.Pearson直線相關2.Spearman秩相關3.Kendall等級相關三種簡單相關分析與SAS實現Pearson直線相關了解兩個隨機變量X與Y之間相關關系及其密切程度,可用直線相關分析方法。直線相關(linearregression)又稱簡單相關,此方法適用于X和Y都服從正態分布的資料。三種簡單相關分析與SAS實現Pearson直線相關直線相關的概念直線相關的定量描述相關系數的假設檢驗相關系數的區間估計直線相關分析的一般步驟直線相關分析的注意事項三種簡單相關分析與SAS實現Pearson直線相關1.
定義
如果兩個隨機變量中,當其中一個變量由小到大變化時,另一個變量也相應地由小到大(或由大到小)變化,并且其相應變化的散點圖在直角坐標系中呈現直線趨勢,則稱這兩個隨機變量存在直線相關。
推斷兩個隨機變量是否存在直線相關關系以及描述這種相關關系大小的分析方法就是直線相關分析(linearcorrelationanalysis),也稱簡單相關分析(simplecorrelationanalysis)。三種簡單相關分析與SAS實現Pearson直線相關直線相關圖示完全正相關完全負相關正相關負相關零相關零相關零相關零相關三種簡單相關分析與SAS實現Pearson直線相關直線相關分析的適用條件(1)兩個變量均為服從正態分布的隨機變量,即要求他們服從雙變量正態分布;(2)每對數據對應的點在直角坐標系中呈現直線趨勢。三種簡單相關分析與SAS實現Pearson直線相關2.直線相關的定量描述
相關系數的意義在分析兩個事物間的關系時,常常要了解兩者間的數量關系是否密切。說明兩個變量間關系密切程度和方向的統計指標稱相關系數,又稱pearson相關系數,或積差相關系數。
樣本相關系數用r表示,總體相關系數用ρ表示。三種簡單相關分析與SAS實現Pearson直線相關計算相關系數的基本公式是:式中,lXX、lYY分別表示X、Y
的離均差平方和,lXY表示X與Y的離均差乘積和。三種簡單相關分析與SAS實現Pearson直線相關相關系數的意義相關系數的符號反映兩變量間的相關方向:r>0為正相關,r<0為負相關相關系數的絕對值反映兩變量相關的密切程度:|r|越大,相關越密切。
r=1
完全正相關
r=-1
完全負相關
r=0
零相關三種簡單相關分析與SAS實現應該注意的是,r所表示的只是X與Y間的直線關系,若兩變量間為曲線關系時,即使所有的點都在曲線上,其r值也并不等于1。例如下圖所示Y=x2的曲線,將各X值代入,得:X01234Y124516兩變量的相關系數為0.933
三種簡單相關分析與SAS實現三種簡單相關分析與SAS實現Pearson直線相關例隨機測量了13名8歲健康男童的體重與心臟橫徑,結果見下表。試進行直線相關分析。三種簡單相關分析與SAS實現Pearson直線相關三種簡單相關分析與SAS實現相關系數的計算
X=301.5X2=7072.75
Y=116.3Y2=1044.63XY=2713.65lXX=X2–(X)2/n=7.72.75-301.52/13=80.2692lYY=Y2–(Y)2/n=1044.63-116.32/13=4.1923lXY=XY–(X)(Y)/n=2713.65-301.5116.3/13=16.3846Pearson直線相關三種簡單相關分析與SAS實現相關系數的統計學意義檢驗檢驗假設如下:H0:總體相關系數
=0H1:
0
=0.051.直接查表法:求得r后,按=n-2查r界值表。本例,r=0.8932,P<0.01,說明總體相關系數與0之間的差別有統計學意義Pearson直線相關三種簡單相關分析與SAS實現2.t檢驗
若H0成立,從
=0的總體中抽樣,所得到的樣本相關系數r呈對稱分布(近似正態分布),此時可用t檢驗。本例,
=n-2=11
按
=11查t界值表,得P<0.01,說明總體相關系數與0之間的差別有統計學意義1Pearson直線相關三種簡單相關分析與SAS實現Pearson直線相關相關系數的區間估計
從相關系數
不等于0的總體中抽樣,樣本相關系數的分布是偏態的。三種簡單相關分析與SAS實現Pearson直線相關
z
近似服從均數為,標準誤為
的正態分布。
Z變換三種簡單相關分析與SAS實現Pearson直線相關將
r變換為z
;根據z
服從正態分布,估計z
的可信區間;再將z
變換回r
。三種簡單相關分析與SAS實現Pearson直線相關直線相關分析的一般步驟1.繪制散點圖,觀察兩變量的變化趨勢;2.若散點圖呈直線趨勢,計算相關系數;3.對相關系數進行假設檢驗;4.必要時對總體相關系數進行區間估計。三種簡單相關分析與SAS實現Pearson直線相關直線相關分析的注意事項1.直線相關分析要求兩個變量均為服從正態分布的隨機變量,實際數據要滿足這一前提。2.分析前必須先作散點圖,變化不呈直線趨勢時不宜作直線相關。3.要注意相關的有效范圍。相關系數的意義僅限于原資料中兩個變量值的實測范圍,超出這一范圍就不一定保持現有的直線關系了。三種簡單相關分析與SAS實現Pearson直線相關4.作相關分析時,必須考慮異常點的影響。5.相關分析要有實際意義,兩變量相關并不代表兩變量間一定存在內在聯系,相關關系不一定是因果關系。有時兩個變量雖然存在直線關系,但可能是同時受另外一個因素的影響,二者均隨另一個因素的變化而變化,它們本身卻不一定存在因果關系。
年齡
工齡越長
血壓越高?三種簡單相關分析與SAS實現Pearson直線相關6.分層資料不宜盲目合并進行相關分析。只有確定各層研究對象具有同質基礎才能合并。7.不要把假設檢驗中相關顯著性大小理解為相關程度的大小。若經假設檢驗推斷
0,說明兩變量間存在一定的直線關系。相關的密切程度可參照下面標準判斷:|r|<0.4為低度相關,0.4≤|r|≤0.7為中度相關,|r|>0.7為高度相關。三種簡單相關分析與SAS實現等級相關1.定義:用雙變量等級數據作直線相關分析2.適用范圍:
(1)不服從雙變量正態分布(2)總體分布類型未知(3)原始數據用等級表示三種簡單相關分析與SAS實現等級相關Spearman秩相關Kendall等級相關三種簡單相關分析與SAS實現Spearman秩相關Spearman秩相關
對于不符合正態分布的資料,不用原始數據計算相關系數,而是將原始觀察值由小到大編秩,然后根據秩次來計算秩相關系數。通過秩相關系數rs來說明兩個變量間相關關系的密切程度三種簡單相關分析與SAS實現Spearman秩相關
設有n例觀察對象同時取得兩個測定值(Xi,Yi),分別按Xi、Yi(i=1,2,3…,n)的值由小到大編秩為1,2,3…,n。用RXi表示Xi的秩次,
RYi表示Yi的秩次。因為n是固定的,所以總秩相等即平均秩但Xi的秩順序不一定與Yi的秩順序相同,故所對應的RXi與RYi不一定相等。三種簡單相關分析與SAS實現Spearman秩相關只要求出
就可按以下公式計算秩相關系數rs令同一觀察對象的兩個秩次差為:得到秩相關系數的簡化公式為:式中n為
觀察例數。rs的取值為|rs
|≤1。三種簡單相關分析與SAS實現Spearman秩相關相同秩次較多時TX(或TY)=
(t3-t)/12,t為X(或Y)中相同秩次的個數。
三種簡單相關分析與SAS實現例某地方病防治所隨機抽樣調查了某縣10個村飲水中氟含量與氟骨癥患病率間的關系飲用水中氟含量(X
)與氟骨癥患病率(Y
)三種簡單相關分析與SAS實現Spearman秩相關Spearman秩相關分析步驟:1.編秩將各Xi由小到大編秩得RXi,列于表中第(3)列。采用相同的排秩規則將Yi的記分列于表中第(5)列RYi。當遇到相等的測定值時則用平均秩。如Y2=Y4=22.64,按編秩為3和4,這兩個測定值的平均秩為(3+4)/2=3.5,故有RY2=RY4=3.5。2.秩次差求每例觀察對象的秩次差列于表中第(6)列,應有。本例的合計為表示排秩無誤,可作核對之用。三種簡單相關分析與SAS實現Spearman秩相關3.計算秩次之差的平方并求和計算出的列于表中第(7)列。本例有4.計算秩相關系數rs
本例代入簡化公式中得到:
簡化公式適用于資料中取相同秩次的例數不多的情況,但如果取相同秩次的例數較多時,就使得計算的結果偏差較大,這時應用原始公式計算秩相關系數。三種簡單相關分析與SAS實現Spearman秩相關
Spearman秩相關系數的假設檢驗對總體相關系數的假設檢驗的方法有兩種:1.查表法當n≤50時,查“rs界值表”進行假設檢驗。2.計算法當n>50時,按下式計算檢驗統計量u:查標準正態分布表,確定P值。三種簡單相關分析與SAS實現Spearman秩相關對前面例子得到的秩相關系數進行假設檢驗檢驗步驟:1.建立無效假設和確定檢驗水準
H0:ρs=0,即飲用水中氟含量與氟骨癥患病率間無相關關系
H1:ρs≠0,即飲用水中氟含量與氟骨癥患病率間有相關關系α=0.05
2.計算秩相關系數rs=0.918
三種簡單相關分析與SAS實現Spearman秩相關3.確定P值并下結論:
查表得到rs,0.05/2(10)=0.648,小于樣本統計量rs=0.918,故按α=0.05水準拒絕H0,判斷rs系來自ρs≠0的總體,從專業上分析,可以認為飲水中氟含量與氟骨癥患病率之間存在著正相關關系。三種簡單相關分析與SAS實現Kendall等級相關Kendall等級相關當兩個變量都用等級來表示時,用一個統計量來衡量它們的等級不一致的情況。Kendall等級相關系數τ也在±1之間變動。完全不相關時,τ=0。它不僅可對兩個變量作等級相關分析,而且可對多個變量作等級相關分析三種簡單相關分析與SAS實現Kendall等級相關Kendall等級相關的分析步驟:
1.先將第一個變量(x)和第二個變量(y)由小到大列出等級,數值相同時取平均等級。
2.把兩變量的等級列出,以x的等級為順序排列。
3.計算Kendall等級相關系數τ三種簡單相關分析與SAS實現例下表是一些環狀化合物的相對分子質量與用藥后大鼠24h膽汁排泄量資料,要研究相對分子質量與膽汁排泄量有無關系。環狀化合物的相對分子質量與大鼠24h膽汁排泄量關系三種簡單相關分析與SAS實現Kendall等級相關1.將第一個變量即相對分子質量(x)和第二個變量即膽汁排泄量(y)由大到小列出等級,數值相同時取平均等級見上表等級列。2.把兩變量的等級列成下表形式,即以x的等級為順序排列。Kendall等級相關計算表三種簡單相關分析與SAS實現Kendall等級相關表中第1,2行是從第一張表中轉抄過來的,但順序是按x的等級從小到大排列的。第3行是對應于每一個排泄量(y)等級的右邊的更小(包括相等)的等級個數。例如,對于y的等級2,在它右邊只有一個等級(即1)比它小,所以在等級2的下面寫1,也就是第3行第一個數字是1.而對應于第2行的等級1,在它右邊沒有更小的等級,所以在它下面即第3行第2個數字為0,其余以此類推。三種簡單相關分析與SAS實現Kendall等級相關第4行則是應對于該列的y的等級Ry右邊更大的等級個數。第3行的合計為11,記為負的;第4行的合計為34,記為正的。兩者的代數和稱為S,即S=34-11=23.三種簡單相關分析與SAS實現Kendall等級相關3.計算Kendall等級相關系數τ實際上分母就是等級對子數例中共有10個數,則對子數為:三種簡單相關分析與SAS實現Kendall等級相關從S的計算過程可知,S值最小是,最大是,因此τ值一定在-1和+1之間。
完全負相關是-1,完全正相關是+1,不相關則為0。三種簡單相關分析與SAS實現Kendall等級相關當兩變量等級呈完全正相關時,計算S值過程如下表所示假設的完全正相關資料計算S值從表中可以看出S=45-0=45三種簡單相關分析與SAS實現Kendall等級相關當兩變量等級呈完全負相關時,計算S值過程如下表所示假設的完全正相關資料計算S值從表中可以得出S=0-45=-45三種簡單相關分析與SAS實現Kendall等級相關4.τ的假設檢驗。
Kendall等級相關的無效假設是兩變量的等級不相關,即在無效假設成立時S期望值為0或者說τ的期望值為0,如果沒有相同等級,S的方差為:三種簡單相關分析與SAS實現Kendall等級相關如果有相同等級,那么S的方差為:
式中:t為x的相同等級個體數;u為y的相同等級個體數。三種簡單相關分析與SAS實現Kendall等級相關假設檢驗可用含有連續性校正的正態近似檢驗:例中含有相同等級,故其方差為:三種簡單相關分析與SAS實現Kendall等級相關故得因u>1.96,P<0.05,結論:分子量等級和排泄量等級是相關的。三種簡
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 印度軍力教學課件
- 乍浦小學口試題目及答案
- 廣告設計師證書考試用戶反饋分析試題及答案
- 助理廣告師活動策劃能力試題及答案
- 愚人節起源和發展-英文版
- 比熊犬智商測試題及答案
- 簡易氣壓計試題及答案
- 甲狀腺考試題目及答案
- 2024年設計師考試專業知識試題及答案
- 廣西高考一模試題及答案
- 2023年護理考試-護理學(副高)歷年考試真題試卷摘選答案
- 項目管理工具Project詳細講解課件
- NCCN成人癌痛指南解讀
- GB/T 3478.4-1995圓柱直齒漸開線花鍵45°壓力角尺寸表
- GB/T 1041-2008塑料壓縮性能的測定
- 職業衛生監督課件
- 油橄欖基地建設項目可行性研究報告
- 印章保管交接表
- 鹽霧測試作業指導書
- HSK4級-語序部分練習題
- 道路開口施工方案正規版
評論
0/150
提交評論