




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第十章
兩變量關(guān)聯(lián)性分析
本章內(nèi)容
第一節(jié)線性相關(guān)
第二節(jié)秩相關(guān)第三節(jié)分類變量的關(guān)聯(lián)性分析
第一節(jié)線性相關(guān)
一線性相關(guān)的概念線性相關(guān)(linearcorrelation)又稱簡(jiǎn)單相關(guān)(simplecorrelation),用于雙變量正態(tài)分布(bivariatenormaldistribution)資料。其性質(zhì)可由圖11-2散點(diǎn)圖直觀的說(shuō)明。目的:研究?jī)蓚€(gè)變量X,Y數(shù)量上的依存(或相關(guān))關(guān)系。特點(diǎn):統(tǒng)計(jì)關(guān)系圖10-1兩變量散點(diǎn)圖二、相關(guān)系數(shù)的意義與計(jì)算意義:相關(guān)(correlationcoefficient)又稱Pearson積差相關(guān)系數(shù),用來(lái)說(shuō)明具有直線關(guān)系的兩變量間相關(guān)的密切程度與相關(guān)方向。2.計(jì)算:樣本相關(guān)系數(shù)的計(jì)算公式為例1例10-1在某地一項(xiàng)膳食調(diào)查中,隨機(jī)抽取了14名40~60歲的健康婦女,測(cè)得每人40~60歲的健康婦女,測(cè)得每人的基礎(chǔ)代謝(kj/d)與體重(kg)數(shù)據(jù),見(jiàn)表10-1。據(jù)此數(shù)據(jù)如何判斷這兩項(xiàng)指標(biāo)間有無(wú)關(guān)聯(lián)?表10-1
14名健康婦女的基礎(chǔ)代謝率與體重編號(hào)基礎(chǔ)代謝(kJ/d)體重(kg)編號(hào)基礎(chǔ)代謝(kJ/d)體重(kg)14175.650.783970.648.624435.053.793983.244.633460.237.1105050.158.644020.851.7115355.571.053987.447.8124560.659.764970.662.8134874.462.175359.767.3145029.261.5圖10-214例中年健康婦女基礎(chǔ)代謝與體重的散點(diǎn)圖相關(guān)系數(shù)的特點(diǎn)1.相關(guān)系數(shù)r是一個(gè)無(wú)量綱的數(shù)值,且-1<r<1;2.r>0為正相關(guān),r<0為負(fù)相關(guān);3./r/越接近于1,說(shuō)明相關(guān)性越好./r/越接近于0,說(shuō)明相關(guān)性越差.相關(guān)系數(shù)的統(tǒng)計(jì)推斷(一)相關(guān)系數(shù)的假設(shè)檢驗(yàn)
例10-2繼例10-2中算得r=0.964后,試檢驗(yàn)相關(guān)是否具有統(tǒng)計(jì)學(xué)意義檢驗(yàn)步驟
本例
n=14,r=0.964,計(jì)算t值10215(二)總體相關(guān)系數(shù)的可信區(qū)間
10216具體步驟如下10217
例10-3對(duì)例10-1所得r值,估計(jì)總體相關(guān)系數(shù)的95%可信區(qū)間。
再按公式(10-22)將z作反變換,得到基礎(chǔ)代謝與體重的總體相關(guān)系數(shù)95%可信區(qū)間為(0.8872,0.9888)。
線性相關(guān)中應(yīng)注意的問(wèn)題1.樣本的相關(guān)系數(shù)接近零并不意味著兩變量間一定無(wú)相關(guān)性.2.一個(gè)變量的數(shù)值人為選定時(shí)莫作相關(guān).3.出現(xiàn)異常值時(shí)甚用相關(guān).4.相關(guān)未必真有內(nèi)在聯(lián)系.5.分層資料盲目合并易出假象.6.線性相關(guān)分析雙變量是隨機(jī)且服從正態(tài)分布第二節(jié)秩相關(guān)適用條件:①資料不服從雙變量正態(tài)分布而不宜作積差相關(guān)分析;②總體分布型未知,一端或兩端是不確定數(shù)值(如<10歲,≥65歲)的資料;③原始數(shù)據(jù)用等級(jí)表示的資料。一、Spearman秩相關(guān)1.意義:等級(jí)相關(guān)系數(shù)rs用來(lái)說(shuō)明兩個(gè)變量間直線相關(guān)關(guān)系的密切程度與相關(guān)方向。2.計(jì)算公式例10-5某地研究2~7歲貧血病患兒的血紅蛋白含量與出血癥狀程度之間的相關(guān)性,結(jié)果見(jiàn)表10-2,試用秩相關(guān)進(jìn)行分析表10-2貧血患兒的血紅蛋白含量(g/l)和出血癥狀病人編號(hào)血小板數(shù)秩次p2出血癥狀秩次q2pqXpYq(1)(2)(3)(4)(5)(6)(7)(8)=(3).(6)5.011+++10100105.824++864366.139+636187.3416-39128.8525++864409.1636++8644811.1749-392112.3864-392413.5981-392713.810100-3930合計(jì)—55385-55373266利用表10-2中的數(shù)據(jù)容易算得
秩相關(guān)系數(shù)為負(fù),說(shuō)明兩變量間有負(fù)相關(guān)關(guān)系,同樣由樣本算得的秩相關(guān)系數(shù)是否有統(tǒng)計(jì)學(xué)意義,也應(yīng)做檢驗(yàn)秩相關(guān)系數(shù)的統(tǒng)計(jì)推斷
檢驗(yàn)步驟假設(shè)檢驗(yàn)統(tǒng)計(jì)推斷當(dāng)時(shí),可查書(shū)后的臨界值表,
若秩相關(guān)系數(shù)超過(guò)臨界值,則拒絕;當(dāng)時(shí),也可采用公式(10-5)或(10-6)式做檢驗(yàn)例10-5對(duì)例1-4的秩相關(guān)系數(shù)作假設(shè)檢驗(yàn)例10-4中算得查臨界值表,,按的水準(zhǔn),拒絕,可以認(rèn)為貧血病患兒的出血癥狀與血紅蛋
白量之間呈負(fù)相關(guān)關(guān)系五、簡(jiǎn)單線性相關(guān)的樣本量估算簡(jiǎn)單線性相關(guān)的樣本量估算公式為:例10-4根據(jù)以往調(diào)查,某地某年大學(xué)生女大學(xué)生的體重(kg)與肺活量(L)的線性相關(guān)系數(shù)0.7165,若想在α=0.05,β=0.90水平下得到相關(guān)系數(shù)有統(tǒng)計(jì)學(xué)意義的結(jié)論,至少應(yīng)調(diào)查多少人?據(jù)已知條件代入公式:第三節(jié)分類變量的關(guān)聯(lián)性分析交叉分類2×2表的關(guān)聯(lián)分析例10-7
為觀察大學(xué)生專業(yè)與艾滋病知曉程度之間是否有關(guān),某研究者調(diào)查了某一年級(jí)不同專業(yè)的500名學(xué)生,對(duì)每個(gè)個(gè)體分別觀察專業(yè)與艾滋病知曉程度兩種屬性,2×2種結(jié)果分類記述如表10-3所示,試分析兩種屬性的關(guān)聯(lián)性。適用條件對(duì)定性變量之間的聯(lián)系通用的方法是根據(jù)兩個(gè)定性變量交叉分類基數(shù)所得的頻數(shù)資料(列聯(lián)表)作關(guān)聯(lián)性分析,即關(guān)于兩種屬性獨(dú)立性的卡方檢驗(yàn)計(jì)算公式表10-3專業(yè)與艾滋病知曉程度之間的關(guān)系大學(xué)生專業(yè)
艾滋病知曉程度合計(jì)
高低醫(yī)學(xué)預(yù)科3191121其它19359合計(jì)50
450
500假設(shè)檢驗(yàn)
:大學(xué)生專業(yè)與與艾滋病知曉程度之間相互獨(dú)立
:大學(xué)生專業(yè)與與艾滋病知曉程度之間關(guān)聯(lián)將表中各數(shù)據(jù)代入公式得拒絕原假設(shè),說(shuō)明大學(xué)生專業(yè)與與艾滋病知曉程度之間存在關(guān)聯(lián)性.關(guān)于兩分類變量之間的關(guān)聯(lián)程度,可采用(phicoefficient)、GramerV系數(shù)、Gramer‘sVcoefficient)和Pearson列聯(lián)系數(shù)(contingencycoefficient),三個(gè)系數(shù)愈近1說(shuō)明關(guān)系愈密切,三個(gè)愈近0,說(shuō)明兩分類變量幾乎沒(méi)有關(guān)系。只適用于四格表資料,對(duì)于多行多列只能采用后兩種.本列二2×2配對(duì)資料的關(guān)聯(lián)性分析例10-8
有132食品標(biāo)本,把每份標(biāo)本一分為二,分別用兩種檢測(cè)方法作沙門菌檢驗(yàn),觀察結(jié)果如表10-5,問(wèn)兩種檢測(cè)方法的結(jié)果有無(wú)關(guān)聯(lián)?表10-5兩種檢測(cè)方法結(jié)果甲法
乙法合計(jì)+-+8010
90-31
11
42合計(jì)111
21
132假設(shè)檢驗(yàn)
:兩種檢測(cè)方法的結(jié)果之間互相獨(dú)立
:兩種檢測(cè)方法的結(jié)果之間有關(guān)聯(lián)將本例數(shù)據(jù)代入公式得有理由拒絕零假設(shè),可以認(rèn)為甲、乙兩種方法檢測(cè)方法之間存在關(guān)聯(lián)性,進(jìn)一步計(jì)算三R×C表分類資料的關(guān)聯(lián)性分析例10-9
欲探討職業(yè)類型與胃癌,得表10-6的資料。問(wèn)職業(yè)類型與胃癌是否關(guān)聯(lián)?表10-6310胃病患者按胃病類型與職業(yè)兩種屬性的交叉分類表職業(yè)
胃病合計(jì)淺表型慢性胃炎胃潰瘍機(jī)關(guān)干部80
484
132工人52
62
12
126公交車司機(jī)20221052合設(shè)檢驗(yàn)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025企業(yè)外包合同
- 2025企業(yè)間借貸合同應(yīng)包含的要素
- 管理學(xué)中的知識(shí)管理試題及答案
- 2025年行政管理考試重點(diǎn)概念試題及答案
- 2025年個(gè)體土地贈(zèng)與合同樣本
- 行政管理與社會(huì)輿論試題及答案
- 2025電子書(shū)贈(zèng)與的合同范本
- 嘗試2025年公文寫作與處理試題及答案
- 現(xiàn)代管理技能應(yīng)用試題及答案
- 管理心理學(xué)對(duì)情商培養(yǎng)的作用試題及答案
- 2023高中學(xué)業(yè)水平合格性考試歷史重點(diǎn)知識(shí)點(diǎn)歸納總結(jié)(復(fù)習(xí)必背)
- 鄰補(bǔ)角、對(duì)頂角、同位角、內(nèi)錯(cuò)角、同旁內(nèi)角經(jīng)典習(xí)題-一對(duì)一專用
- HP系列培訓(xùn)手冊(cè)
- 常見(jiàn)病媒生物分類鑒定
- 畢業(yè)論文-原油電脫水方法與機(jī)理的研究
- 陜西省2022年普通高中學(xué)業(yè)水平考試(真題)
- 事故池管理的有關(guān)規(guī)定
- 2021-2022學(xué)年甘肅省天水市第一中學(xué)高一下學(xué)期第二階段考物理試題(原卷版)
- 重慶市參加企業(yè)職工基本養(yǎng)老保險(xiǎn)人員退休審批表
- 混凝土結(jié)構(gòu)課程設(shè)計(jì)244
- GE全球供應(yīng)鏈的管理與實(shí)踐
評(píng)論
0/150
提交評(píng)論