列聯表的獨立性檢驗課件_第1頁
列聯表的獨立性檢驗課件_第2頁
列聯表的獨立性檢驗課件_第3頁
列聯表的獨立性檢驗課件_第4頁
列聯表的獨立性檢驗課件_第5頁
已閱讀5頁,還剩31頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、2.5 列聯表的獨立性檢驗一、二維 列聯表列表如下:令: 吸煙與肺癌列聯表患肺癌不患肺癌總計吸煙603292不吸煙31114總計6343106為了調查吸煙是否對肺癌有影響,對63位肺癌患者及43位非患者(對照組)調查了其中的吸煙人數.22列聯表二、二維 列聯表的獨立性檢驗列表如下: 稱為Pearson 統計量 檢驗統計量例1 隨機抽取某校男生35名,女生31,進行體育達標考核,結果如下表 問體育達標水平是否與性別有關?體育達標考核情況表達 標未 達 標合 計 男 15 20 35 女 13 18 31合 計 28 38 66體育達標水平與性別無關體育達標水平與性別有關(1)建立假設其結論為:體

2、育達標水平與性別無關.因此在0.05顯著性水平下,接受原假設.R函數chisq.test ( ) xchisq.test(x, correct=F)R程序如下輸出結果為 Pearsons Chi-squared testdata: x X-squared = 0.0057, df = 1, p-value = 0.9397因此在0.05顯著性水平下,接受原假設.92頁例2.14自己看2.5.2 Fisher精確檢驗不滿足時, 用Pearson近似效果很差, 一般采用Fisher精確檢驗.在使用Pearson 獨立性檢驗時, 要注意格子的期望頻數小于5的格子數不超過總格子數的20%,且沒有一個格

3、子的期望頻數小于1Fisher精確檢驗對于單元頻數小的表格特別適用四表格的Fisher精確檢驗頻數四表格合計對應的概率四表格1合計假設邊緣頻數固定分別服從二項分布表示有屬性A的個體中有屬性B的條件概率表示沒有屬性A的個體中有屬性B的條件概率則屬性A和屬性B相互獨立即有屬性A的個體中有屬性B的個體的頻率與沒有屬性A的個體中有屬性B的個體的頻率應該沒有顯著的差異.即有表示有屬性A的個體中有屬性B的比例高表示有屬性A的個體中有屬性B的比例低即即四表格的檢驗問題, 即屬性A和B的獨立性檢驗問題有Fisher精確檢驗的統計量假設邊緣頻數都固定事實上, 確定了, 其它三個值也就確定了則 有下面四種取值2

4、3 3 2 4 1 5 03 0 2 1 1 2 0 3利用公式可以計算出 取2, 3, 4, 5的概率在獨立的原假設下, 取這些值的概率是不同的, 但各種取值都不會是小概率事件,過大或過小都可能拒絕原假設拒絕域形式為Fisher精確檢驗的計算比較復雜, 所以一般用于n比較小的四表格.例:為了解某種新藥的療效是否提高, 將42位病人隨機分組注射兩種藥物, 試驗結果如下表所示藥物有效無效合計新8210舊141832合計222042R程序如下新藥療效沒有提高新藥療效有提高 xfisher.test(x, alternative = greater)輸出結果為Fishers Exact Test f

5、or Count Data data: x p-value = 0.04849 alternative hypothesis: true odds ratio is greater than 1 95 percent confidence interval: 1.010589 Inf sample estimates: odds ratio 4.950963拒絕原假設,認為備則假設成立.優勢比優勢比:屬性A時,有屬性B與沒有屬性B的優勢.稱條件概率與之比為當個體有為當個體沒有屬性A時, 有屬性B與沒有屬性B的優勢,稱這兩個優勢的比為優勢比下列結論成立:如果在有屬性A的個體中有B的比例高, 則優

6、比OR1;如果在有屬性A的個體中有B的比例低,則優比OR1如果屬性A和屬性B相互獨立, 則優比OR=1.優勢比大于1與新藥較舊藥療效有提高等價.三、三維 列聯表關于某項政策調查所得結果觀點:贊成觀點:不贊成低收入中等收入高收入低收入中等收入高收入男201055810女25157279大致可以看出女性贊成的多,低收入贊成的多三維 列聯表觀點贊成低收入中等收入高收入男202015女25157觀點不贊成低收入中等收入高收入男5810女279性別男低收入中等收入高收入贊成201015不贊成5810性別女低收入中等收入高收入贊成25157不贊成279低收入中等收入高收入男252825女272216 低收入中等收入高收入贊成201015不贊成5810是是否否收入的“低”、“中”、“高”用代碼1、2、3代表;性別的“女”、“男”用代碼0、1代表;觀點“贊成”和“不贊成”用1、0代表。有些計算機數據對于這些代碼的形式不限(可以是數字,也可以是字符串)。 七.在SPSS數據表中的形式表是二維的,用變量和樣本值表示先將定性變量數量化: 小 結 1. 非參數檢驗在假設檢驗中不對參數作明確的推斷,也不涉及樣本取自何種分布的總體。它的適用范圍較廣。常用的非參方法較為簡便。易于理解掌

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論