




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、分類變量資料的統計推斷(計數資料)DR.2007.11.25 目的要求1、掌握率的抽樣誤差、標準誤及其可信區間 估計方法。2、掌握卡方檢驗的用途、各種設計資料的適 用條件及統計結論的推斷。3、熟悉卡方檢驗的基本思想、步驟及注意事項。4、了解率的檢驗用途及適用條件。2007.11.25提要 : 率的抽樣誤差與率的標準誤; 總體率的估計和率的u檢驗; 卡方檢驗。2007.11.25一、率的抽樣誤差和總體率的估計 1. 率的抽樣誤差與標準誤 (sampling error & standard error of rate ) 率的抽樣誤差:由抽樣造成的樣本率與總體率的差別,或樣本率之間的差別。 率的
2、標準誤:表示率的抽樣誤差大小的統計指標。 ( Sp 為p的估計值, p為 的估計值 )*公式計算 : ( 1 - ) p ( 1 - p ) p = ; Sp = n n 2007.11.25(1)正態近似法:當總體率 未知時,若 n p 5 和 n (1p) 5 則總體率 (1- ) 可信區間為: 總體率95%可信區間為 p 1.96 sp 總體率99%可信區間為 p 2.58 sp p u sp = p - u sp p + u sp2. 總體率的區間估計2007.11.25例: 某地中學生就餐方式與乙肝病毒感染情況調查 就餐方式 調查人數 感染人數 感染率(%) 常在外就餐(A) 89
3、6 6.74 不在外就餐(B) 111 5 4.50合計 200 11 5.50 p(1 p)Sp = n抽樣誤差:0.0266 = 2.66% 0.0674(1 - 0.0674 )Sp = 89(A):(B): 0.0450 (1 - 0.0450 )Sp = 1110.0197 = 1.97%2007.11.25 例: 某地中學生就餐方式與乙肝病毒感染情況調查 就餐方式 調查人數 感染人數 感染率(%) 標準誤 常在外就餐(A) 89 6 6.74 2.66% 不在外就餐(B) 111 5 4.50 1.97%總體率95%可信區間為 p 1.96 sp總體率99%可信區間為 p 2.58
4、 sp 總體感染率95%可信區間:(A): 6.74% 1.962.66% = 1.53% 11.95%(B): 4.50% 1.961.97% = 0.64% 8.36%2007.11.25(2)查表法 當樣本含量n較小,如n50(特別是p接近0或1時),則按二項分布原理確定總體率的可信區間。 可根據樣本含量 n 和陽性數 X 參照專用統計學介紹的二項分布中95%可信限表。P254 附表62. 總體率的區間估計2007.11.25二、率的u檢驗 1. 樣本率與總體率比較目的:推斷樣本率所代表的總體率 與某總體率 0 是否相等。 | p-0 |u = p | p - 0 | u = 0 (1-
5、 0) /n條件:n0 5 和 n (1 - 0 ) 5公式:2007.11.25例:某地城鎮25歲以上居民高血壓患病率為 11,隨機抽查該地礦區25歲以上居民598 人,確診高血壓者有82人。礦區居民與城鎮 居民高血壓患病率有何不同? 城鎮居民高血壓患病率:0 =11= 0.11 礦區居民高血壓患病率:p = 82/598 = 0.14 分析目的: 推斷 與 0 是否不同?2007.11.25假設:H0: = 0= 0.11, H1: 0 0.11, 0.05 p - 0u = 0 (1- 0) /n 0.14 - 0.11 0.11(1-0.11)/598= 2.340.01 P 0.05
6、 結論:礦區居民高血壓患病率高于城鎮居民。2007.11.25 2. 兩個樣本率比較目的:推斷兩樣本率分別代表的總體率 1與 2是否相等。 | p1 - p2 |u = S p1-p2 _ 1 1 S p1-p2 = pc (1-pc) ( + ) n1 n2(pc為兩個樣本率的合并率。)公式:u 檢驗的條件:兩樣本率近似正態分布,n1p1 和n1(1- p1)與n2p2 和n2(1- p2)均 52007.11.25例: 某地5570歲居民體重指數與糖尿病關系體重指數 檢查人數 糖尿病人數 患病率25 988 52 5.26 25 682 69 10.11合計 1670 121 7.25是否
7、體重指數(BMI)不同糖尿病的患病率不同?BMI 25 : p1= 5.26% 1 BMI 25 : p2=10.11% 2分析目的: 推斷 1與 2 是否不同2007.11.25假設:H0: = , H1: , = 0.05 _ 1 1 S p1-p2 = pc (1-pc) ( + ) n1 n2 | p1 - p2 |u = S p1-p2 0.0725(1-0.0725)(1/988+1/682)=| 0.0526 - 0.1011 |= 3.76P 0.01結論:BMI 25者糖尿病患病率高于BMI 25者 BMI與糖尿病有關。2007.11.25小 結 1樣本率也有抽樣誤差,率的抽
8、樣誤差的大小用p或Sp來衡量。 2率的分布服從二項分布。當n足夠大,和1-均不太小,有n5和n(1-)5時,近似正態分布。 3總體率的可信區間是用樣本率估計總體率的可能范圍。當p分布近似正態分布時,可用正態近似法估計率的可信區間。 4根據正態近似原理,可進行樣本率與總體率以及兩樣本率比較的u檢驗。率的u檢驗能解決以下問題嗎? 率的反應為生與死、陽性與陰性、發生與不發生等二項分類變量,如果二分類變量為非正反關系(如治療A、治療B);反應為多分類,如何進行假設檢驗? 率的u檢驗要求:n足夠大,且n5和 n(1-)5。如果條件不滿足,如何進行假設檢驗? 2(卡方 )檢驗可用于兩個或多個率間的比較;計
9、數資料的關聯度分析;擬合優度檢驗等。 本章僅限于介紹兩個和多個率或構成比比較的2檢驗。1. 2 檢驗的用途:2. 2 檢驗的基本思想:例8.5: 某抗生素的人群耐藥性情況 用藥史 不敏感 敏感 合計 耐藥率 曾服該藥 180 215 395 45.57 未服該藥 73 106 179 40.78 合 計 253 321 574 44.08試問兩種人群的耐藥率是否一樣?實際數 A2007.11.25某抗生素的人群耐藥性情況 用藥史 不敏感 敏感 合計 耐藥率曾服該藥 180 215 395 45.57未服該藥 73 106 179 40.78 合 計 253 321 574 44.08假設:兩種
10、人群耐藥率一致為 253/574 44.08 曾服該藥的耐藥人數 T1.1=395253/574=174.1 未服該藥的耐藥人數 T2.1=179253/574=78.9假設:兩種人群敏感率一致為 321/574 55.92 曾服該藥的敏感人數 T1.2=395321/574=220.9 未服該藥的敏感人數 T2.2=179321/574=100.1 T 理論值(nR)(nC)(n) nR nC TRC = n 2007.11.25 T 理論值是根據無效假設(H0)而推論出的理論數據 nR nC TRC = n 各種設計方式的卡方檢驗均據此試計算2007.11.25 某抗生素的人群耐藥性情況用
11、藥史 不敏感 敏 感 合計 耐藥率 A T A T 未服該藥 180(174.1) 215(220.9) 395 45.57曾服該藥 73( 78.9) 106(100.1) 179 40.78合計nR 253 47 104 n 44.08基本公式: (A - T) 2 2 = T nR nC TRC = n A 實際值 T 理論值 = (行-1)(列-1) =(R-1)(C-1)(nC)2007.11.25 2 值、P 值與統計結論 2值 P值 統 計 結 論 0.05 接受H0 差異無統計學意義 20.05( ) 0.05 拒絕H0 差異有統計學意義 20.01( ) 0.01 拒絕H0
12、差異有高度統計學意義2007.11.25 3. 2檢驗的種類 ( 1) 四格表資料的 2檢驗 ( 2 test for fourfold table) 目的:用于兩個樣本率或構成比的比較,推斷兩個樣本所代表的總體率(或總體構成比)是否相等。 專用公式: ( ad - bc) 2 n 2 = (a + b)(c + d)(a + c)(b + d)基本公式: (A - T) 2 2 = T = 12007.11.25檢驗假設:H0:12 , H1:12 ,0.05 (A - T) 2 2 = , T 2 (180174.1)2 / 174.1 + (215 220.9)2 / 220.9 + (
13、73 78.0.9)2 / 78.9 + (106 100.1)2 / 100.1 =1.15 = 1 2 0.05 P 結論:兩種人群的耐藥率無差別 某抗生素的人群耐藥性情況用藥史 不敏感 敏 感 合計 耐藥率 A T A T 未服該藥 180(174.1) 215(220.9) 395 45.57曾服該藥 73( 78.9) 106(100.1) 179 40.78合計nR 253 47 104 n 44.082007.11.25某抗生素的人群耐藥性情況用藥史 不敏感 敏 感 合計 生存率未服該藥 180 215 395 45.57曾服該藥 73 106 179 40.78合計 253 3
14、21 574 44.08(a)(b)(c)(d)(a+b)(c+d)(a+c)(b+d)(n) ( ad - bc) 2 n 2 = (a + b)(c + d)(a + c)(b + d) 2 = (180106 - 215 73)2 574253 321 395179= 1.15P 0.052007.11.25 四格表 2值的校正當:1 T 5,而 n 40 時,需計算校正 2值 ( | A - T | - 0.5 ) 2 2 = , T ( | ad - bc | - n/2 ) 2 n或 2 = (a + b)(c + d)(a + c)(b + d)當:T 1,或 n 0.05結論:
15、無差別2007.11.25穿新舊兩種防護服工人皮炎患病率比較的四格表種類 患皮炎 未患皮炎 合計 患病率 新 1 14 15 6.7 舊 10 18 28 35.7合計 11 32 43 25.6(3.84)(11.16)(7.16)(20.84) ( | ad - bc | - n/2 ) 2 n 2 = (a + b)(c + d)(a + c)(b + d)= 2.940.10 P 0.05 ( ad - bc) 2 n 2 = (a + b)(c + d)(a + c)(b + d)= 4.33 0.01 P 2 0.025(1) , P 0.025 = 1 按 =0.05水準,拒絕H
16、0,接受H1。認為兩組流感發病率有差別,服藥組流感發病率低于對照組。2007.11.25 本例: 第1行1列的T: T11 =23090/410=50.49 第1行2列的T: T12 =230320/410=179.51 第2行1列的T: T21 =18090/410 = 39.51 第2行2列的T: T22 =180320/410=140.49 以推算結果,可與原四項實際數并列成表11-1: 2007.11.25例11.5 表11-1 兩組人群流感發病率的比較 組別 發病 未發病 合計 發病率 人數 人數 (%)服藥組 40(50.49)190(179.51) 230 17.30對照組 50
17、(39.51)130(140.49) 180 27.78合計 90 320 410 21.95(nR)(nC)(N)2007.11.25 因為上表每行和每列合計數都是固定的,所以只要用TRC 式求得其中一項理論數,則其余三項理論數都可用同行或同列合計數相減,直接求出。 T1.1= 50.49 T1.2= 230 50.49 =179.51 T2.1= 90 50.49 =39.51 T2.2= 180 39.51=140.492007.11.25 2 值、P 值與統計結論 2值 P值 統 計 結 論 0.05 接受H0 差異無統計學意義 20.05( ) 0.05 拒絕H0 差異有統計學意義
18、20.01( ) 0.01 拒絕H0 差異有高度統計學意義2007.11.25 四格表 2值的校正:只要有一格當:1 T 5,而 n 40 時,需計算校正 2值 ( | A - T | - 0.5 ) 2 2 = , T ( | ad - bc | - n/2 ) 2 n或 2 = (a + b)(c + d)(a + c)(b + d)當:T 1,或 n 0.05結論:無差別 如果不采用校正公式,算得的結果 2 =4.197, 則結論就相反了。2.812 3.84,2007.11.25基本公式: (A - T) 2 2 = , T = (行-1)(列-1) = (R-1)(C-1) A 2
19、2 = n ( - 1) nR nC(2)行 列表資料的 2 檢驗 ( 2 test for RC table ) 目的:用于多個樣本率(或構成比)的比較, 推斷樣本所代表的幾個總體率(或總 體構成比)之間有無差別。專用公式:2007.11.25例11.8 問不同季節呼吸道感染率有無差別。 該資料歸納如表11-4作行列檢驗。 表11-4 不同季節呼吸道感染率的比較 季節 感染人數 未感染人數 合計 感染率% 春 12 699 711 1.69 夏 12 666 678 1.77 秋 29 665 694 4.18 冬 35 717 752 4.65 合計 88 2747 2835 3.10 該
20、表資料由4行2列組成,稱24表,可用公式(11.15)檢驗。2007.11.25 1建立檢驗假設及確定檢驗水準 : H0:四個季節呼吸道感染率相同 H1:四個季節呼吸道感染率不同或不全 相同。 =0.052.計算2值: A 2 2 = n ( - 1) nR nC2007.11.252.計算2值: A2RC 2 = n ( 1) nRnC 122 6992 = 2835( + + 88711 2747 711 7172 + 1) 2747 75 = 17.29352007.11.253確定P值和推斷結論 v =(4- 1)(2 - 1)= 3 據此查2值表: 2 0.005(3)= 12.84
21、; 2 = 17.2935 2 0.005(3) P0.005 按=0.05水準,拒絕H0,接受H1。認為 四個季節呼吸道感染率差別有高度統計學意 義。2007.11.25例. 三種方案治療肝炎的療效 組別 有效 無效 合計 有效率%西 藥 51 49 100 51.00中藥藥 35 45 80 43.75中西藥 59 15 74 79.73 合計 145 109 254 57.09假設:H0: 三種藥物的有效率相同 H1: 三種藥物的有效率不同或不全相同 = 0.05 A 2 2 = n ( - 1) nR nC2 =(512/100145+492/100109+152/74109 1) 254= 22.81 =(R1)(C1) =(R-1)(C-1)=(31) (21)= 22007.11.25 當推斷結論為拒絕 H0 時,是認為各總體率(或總體構成比)不等或不全相等,即只能認 為其中至少有兩個總體率(或總體構成比)不 等,而不能確定任意兩個總體率(或總體構成比)不等。應作RC表的 2分割檢驗 行
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年中級銀行從業資格之中級風險管理練習題(一)及答案
- 2025長期租賃房屋合同
- 推動綠色教育理念的具體實踐計劃
- 2025弱電工程合同交底記錄合同交底記錄表
- 2025房屋租賃合同書正對承租方
- 代簽融資合同標準文本
- 內江商場保安合同樣本
- 代理進口貿易合同標準文本
- 云梯酒店合同標準文本
- 碼頭欄桿維護方案范本
- 偏頭痛病因及防控方法宣教
- 《足球-腳內側傳接球》課件
- DB11T 945.1-2023建設工程施工現場安全防護、場容衛生及消防保衛標準 第1部分:通則
- 教育學原理-第五章-人的全面發展教育-適用于項賢明主編《教育學原理》(馬工程)
- 腦梗死教學查房-課件
- 高一年級月考考試質量分析匯報課件
- 煤氣發生爐安全評價報告
- C-TPAT反恐程序文件(完整版)
- 小升初語文:必考古詩詞專項練習
- 教師工作壓力及其積極應對課件
- 南通大學附屬醫院新增PET-CT及CT診斷項目環評報告
評論
0/150
提交評論