




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第一節 率的抽樣誤差與可信區間第二節 率的統計學推斷 一、樣本率與總體率比較的u檢驗 二、兩個樣本率比較的u檢驗第三節 卡方檢驗 一、卡方檢驗的基本思想 二、四格表專用公式 三、連續性校正公式 四、配對四格表資料的2檢驗 五、行列(RC)表資料的2檢驗 一、率的抽樣誤差與標準誤 二、總體率的可信區間 樣本率(p)和總體率()的差異稱為率的抽樣誤差(sampling error of rate) ,用率的標準誤(standard error of rate)度量。np)1 ( 如果總體率未知,用樣本率p估計nppsp)1( 例 例5 5- -1 1 觀 觀察 察某 某醫 醫院 院產 產婦 婦10
2、6 人 人, ,其 其中 中行 行剖 剖腹 腹產 產者 者62 人 人, , 剖 剖腹 腹產 產率 率為 為58.5%, ,試 試估 估計 計剖 剖腹 腹產 產率 率的 的標 標準 準誤 誤。 。 解 解: :已 已知 知n=106, ,p=0.585, ,其 其標 標準 準誤 誤為 為: : %8 . 4048. 0106)585. 01 (585. 0)1 (nppSp 總體率的可信區間 (confidence interval of rate):根據樣本率推算總體率可能所在的范圍 一、樣本率與總體率比較u檢驗 二、兩個樣本率的比較u檢驗u檢驗的條件:n p 和n(1- p)均大于5時例例
3、55,-地中海貧血基因攜帶率:山區地中海貧血基因攜帶率:山區p=12/125=0.096, n=125;本省一般成人;本省一般成人0 0=0.076, H0:= =0 0=0.076 =0.076 H1:0 0 =0.05=0.05。 按按=0.05=0.05 水準,不拒絕水準,不拒絕H0,即不能認為,即不能認為該山區與本省一般該山區與本省一般 成人的成人的-地中海貧血基因攜帶率有差異。地中海貧血基因攜帶率有差異。 )1 (0000nppup844.0125)076.01(076.0076.0096.096. 11949. 2)6412041)(1045. 01 (1045. 00313. 0
4、1275. 0u表5-1 兩種療法的心血管病病死率比較療法死亡生存 合計病死率(%)鹽酸苯乙雙胍26 (X1)178 204(n1) 12.75 (p1)安慰劑 2 (X2) 62 64(n2) 3.13 (p2)合 計 28240 268 10.45 (pc)2122112121nnpnpnnnXXpc)11)(1 (21212121nnppppSppuccppu檢驗的條件:n1p1 和n1(1- p1)與n2p2 和n2(1- p2)均 5 1樣本率也有抽樣誤差,率的抽樣誤差的大小用p或Sp來衡量。 2率的分布服從二項分布。當n足夠大,和1-均不太小,有n5和n(1-)5時,近似正態分布。
5、 3總體率的可信區間是用樣本率估計總體率的可能范圍。當p分布近似正態分布時,可用正態近似法估計率的可信區間。 4根據正態近似原理,可進行樣本率與總體率以及兩樣本率比較的u檢驗。 率的反應為生與死、陽性與陰性、發生與不發生等二分類變量,如果二分類變量為非正反關系(如治療A、治療B);反應為多分類,如何進行假設檢驗? 率的u檢驗要求:n足夠大,且n5和 n(1-)5。如果條件不滿足,如何進行假設檢驗? 2檢驗(Chi-square test)是現代統計學的創始人之一,英國人K . Pearson(1857-1936)于1900年提出的一種具有廣泛用途的統計方法,可用于兩個或多個率間的比較,計數資料
6、的關聯度分析,擬合優度檢驗等等。 本章僅限于介紹兩個和多個率或構成比比較的2檢驗。療法療法死亡死亡生存生存 合計合計病死率病死率(%)鹽酸苯乙雙胍鹽酸苯乙雙胍26 (a)178 (b) 204(a+b) 12.75 (p1)安慰劑安慰劑 2 (c) 62 (d) 64(c+d) 3.13 (p2)合合 計計 28 (a+c.)240(b+d.) 268(a+b+c+d=n) 10.45 (pc)表5-1 兩種療法的心血管病病死率的比較(a+b)pc= (a+b)(a+c.)/ n=nRnC(a+b)(1-pc)= (a+b)(b+d.)/ n =nRnC(c+d)pc= (c+d)(a+c)/
7、 n =nRnC(c+d)(1-pc)= (c+d)(b+d.)/ n =nRnCnnncolumnrowTCR總例數合計列合計行)()( 各種情形下,理論與實際偏離的總和即為卡方值(chi-square value),它服從自由度為的卡方分布。) 1)(1(,1)()(222CRTTATTA1) 12)(12(82. 4)3 .5717 . 617 .18213 .211(7 . 423 .57) 3 .5762(27 . 6)7 . 62(27 .182)7 .182178(23 .21) 3 .2126(22v2/) 12/(2222)2/(21)(efP的臨界值) 1)(1(1)()(
8、222CRTTATTA 上述基本公式由Pearson提出,因此軟件上常稱這種檢驗為Peareson卡方檢驗,下面將要介紹的其他卡方檢驗公式都是在此基礎上發展起來的。它不僅適用于四格表資料,也適用于其它的“行列表”。 為了不計算理論頻數T, 可由基本公式推導出,直接由各格子的實際頻數(a、b、c、d)計算卡方值的公式:(四格表專用公式)基本公式:;1)()()()()()()()()()()(222222dbcadcbanbcaddcbadbdcdcbadbdcddcbadbbadcbadbbabdcbacabadcbacabaaTTA021 ,05. 0221021 ,05. 0221 ,05
9、. 0205. 0;84. 3,05. 0;84. 305. 0;84. 31 , 82. 46424028204268)21786226(22HPHPP,即不拒絕則如果即拒絕如果下結論:2(1) u2 2(n40,所有T5時) 2分布是一連續型分布,而行列表資料屬離散型分布,對其進行校正稱為連續性校正(correction for continuity),又稱Yates校正(Yates correction)。當n40,而1T5時,用連續性校正公式當n40或T1時,用Fisher精確檢驗(Fisher exact test )校正公式:列表資料),(也適合其它行TTAc22)5 . 0()(
10、)()()2/(22dbcadcbannbcadc表 5-2 兩零售點豬肉表層沙門氏菌帶菌情況檢查結果 沙門氏菌 零售點 陽性 陰性 合計 帶菌率(%) 甲 2(4.17) 26(23.33) 28 7.14 乙 5(2.33) 9(11.67) 14 35.71 合計 7 35 42 16.67 1 , 62. 3357142842)24262592(22c1 , 49. 5357142842)26592(22因為1T5,且n40時,所以應用連續性校正2檢驗 1,) 1(2402cbcbcb時,需作連續性校正, 1,27. 4312) 1312(22,4015采用連續性校正本例cb 1,)(
11、2240ccbcbb時,當05. 0;84. 321 ,05. 02PH0:b,c來自同一個實驗總體(兩種劑量的毒性無差異);H1:b,c來自不同的實驗總體(兩種劑量的毒性有差別);。(+,)和(,+)兩個格子中的理論頻數均為 2cb 40 cb時 2)2(2)2()(2222cbcbccbcbbTTA cbcb2)( 2分布 同理可得40cb時 校正公式: cbcbTTA222) 1|(|) 5 . 0|(| nnnTCR總例數列合計行合計理論頻數代入基本公式 可推導出: 基本公式 通用公式 ) 1()(2222CRnnAnTTA 自由度=(行數1) (列數1) 1. 多多個個樣樣本本率率的
12、的比比較較 H H0 0:1 1= =2 2= =3 3= =4 4(四四種種療療法法三三年年總總體體生生存存率率相相等等) H H1 1:i ij j,4 ji(四四種種療療法法三三年年總總體體生生存存率率不不全全相相等等) 2. 2. 兩兩組組構構成成比比的的比比較較 H H0 0:兩兩處處理理組組的的總總體體構構成成相相同同 H H1 1:兩兩處處理理組組的的總總體體構構成成不不同同 3. 多多組組構構成成比比的的比比較較 H H0 0:各各年年齡齡組組病病變變類類型型的的總總體體構構成成相相同同(年年齡齡與與病病變變類類型型無無關關) H H1 1:各各年年齡齡組組病病變變類類型型的的
13、總總體體構構成成不不全全相相同同(年年齡齡與與病病變變類類型型有有關關) 例例 5 5- -12 12 對對 1135 例絕經后出血的婦女進行臨床與病理分析,例絕經后出血的婦女進行臨床與病理分析, 結果見表結果見表 5-6,試分析病變類型是否與年齡有關。,試分析病變類型是否與年齡有關。 表表 5 5- -6 6 不同年齡婦女絕經后出血的病變類型不同年齡婦女絕經后出血的病變類型 病變類型,例數(病變類型,例數(% %) 年齡組(歲)年齡組(歲) 功能性功能性 惡性惡性 良性良性 合計合計 5050 6060(44.444.4) 1616(11.911.9) 5959(43.743.7) 1351
14、35 5151 208208(33.333.3) 111111(17.817.8) 306306(49.049.0) 625625 6161 6666(25.025.0) 7979(29.929.9) 119119(45.145.1) 264264 7171 2121(18.918.9) 4747(42.342.3) 4343(38.738.7) 111111 合計合計 355355(31.331.3) 253253(22.322.3) 527527(46.446.4) 11351135 2222601643211135(1)58.91135 355135 253111 527(4 1)(3 1)6RCAnn n 2=58.91=58.9120.05,6=12.59=12.59,所以,所以,P P0.050.05,以,以=0.05=0.05 水準拒絕水準拒絕H H0 0 1. 對RC表,若較多格子(1/5)的理論頻數小于5或有一個格子的理論頻數小于1,則易犯第一類錯誤。出現某些格子中理論頻數過小時怎么辦? (1)增大樣本含量(最好!) (2)刪去該格所在的行或列(丟失信息!) (3)根據專業知識將該格所在行或列與別的行或列合并。(丟失信息!甚至出假象) 2.多組比較時,若效應有強弱的等級,如+,+,+,最
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論