




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
2/6/20231第五講卡方檢驗周虹公共衛生學院婦女與兒童青少年衛生學系2/6/20232基本內容
統計描述統計推斷(1)統計推斷(2)數值變量頻數分布集中趨勢離散趨勢統計圖表抽樣誤差標準誤均數可信區間tZF檢驗秩和檢驗直線相關與回歸偏相關多元線性回歸因子分析分類變量相對數(率、比)率的可信區間2檢驗Logistic回歸主要內容一、分類變量概述二、分類變量的統計描述相對數應用相對數的注意事項動態數列率的標準化三、分類變量的統計推斷率的標準誤和可信區間2檢驗2/6/20234
x2檢驗(Chi-squaretest)是一種假設檢驗方法與其他假設檢驗的原理相同統計量服從x2分布
(一)成組設計四格表資料的x2
檢驗
(二)配對設計四格表資料的x2
檢驗
(三)行x列表x2
檢驗
(四)趨勢x2
檢驗2/6/20235什么是成組設計四格表資料?
兩個獨立樣本的率或構成比資料例1:某醫生想觀察一種新藥對流感的預防效果,進行了如下的研究,問此藥是否有效?(一)成組設計四格表資料的χ2檢驗2/6/20236四格表的一般形式理論頻數E計算公式為:
NR:所在的行合計,NC:所在的列合計SPSS練習加權數據庫的建立:分類變量進行樣本率的比較時,如果沒有原始數據庫,只有每種分類變量的樣本數和某現象的陽性數,可在SPSS軟件中建立數據庫;用加權變量的方法建立數據庫甲組乙組陽性aba+b陰性cdc+da+cb+dN+/-組cases+甲a+乙b-甲c-乙d+/-組Weight11a12b21c22dSPSS程序:DataWeightCasesWeightcasesby選入
FrequencyvariableOK8四格表卡方檢驗與配對卡方檢驗數據庫格式組+/-Weight11a12b21c22d甲法乙法Weight11a12b21c22d9數據處理:Data---WeightCases并進行樣本率的比較。練習:實習六中練習6.1和6.2數據建立數據庫。102/6/202311實際頻數(O,observed)和理論頻數(E,expected)
實際頻數是指調查或實驗得來的數值,在例1中,四格表中的四個基本數據都是實際頻數。
理論頻數是根據假設檢驗來確定的。也就是H0成立時,計算出的格子中的數。本題中假設實驗組和對照組發病率相同,這樣可以算出總的患病率:
那么:實驗組的理論發病人數為對照組的理論發病人數為…因此,四個格子的理論頻數為:208024961.
x2
檢驗的基本思想148630902/6/202312x2檢驗的基本公式:▲O:表示實際頻數,即實際觀察到的例數。▲
E:理論頻數,即如果假設檢驗成立,應該觀察到的例數。▲
:求和符號,所有格子的值之和▲自由度:=(R-1)x(C-1)
R行數,C列數
注意:反映的格子數,而不是例數。2/6/202313χ2檢驗假設兩組率相同,(O-E)2/E應該很小。如果實際頻數和理論頻數相差的很大,χ2值也越大。當χ2值比規定的界值還大時,被認為是小概率事件,就拒絕H0,認為兩組率不相同。因為χ2值是對每個格子的(O-E)2/E求和,所以格子數越多,χ2值也越大。即使O和E相差很小,如果格子數多的話,總和也會很大。這就引出了自由度的概念,用以消除不同格子數的影響。
x2檢驗的原理:2/6/202314χ2分布規律:χ2分布的圖形是不對稱的,而且只有正值。其形狀和自由度有關,自由度越大,則圖形右移。隨著自由度的增加,分布的偏斜程度趨于緩解,逐漸顯露出對稱性。隨著自由度的繼續增大,χ2分布將趨近于對稱的正態分布。2/6/2023152/6/202316自由度一定時,P值越小,x2值越大,反比關系。=1時,P=0.05,x2=3.84P=0.01,x2=6.63當P值一定時,自由度越大,x2越大。
P=0.05時,=1,x2=3.84
=2,x2=5.99
2/6/2023172.成組四格表的專用公式
該公式從x2基本公式推導而來,計算較為簡單,結果相同。abcd2/6/2023183.成組四格表χ2檢驗計算公式的適用條件(1)當實驗對象總個數n>40,且所有格子的理論頻數E≥5時,可用χ2檢驗基本公式或專用公式計算χ2值。
(2)當n>40,但有任一格子的理論頻數E僅滿足1<E<5時,需用校正公式:
或:
(3)當n≤40,或有任一格子E≤1時,不能計算χ2值,而需用Fisher確切概率計算法。2/6/202319成組四格表x2
檢驗的SPSS計算程序AnalyzeDescriptivestatisticscrosstabs2/6/2023202/6/2023212/6/2023224.檢驗步驟例1:①建立檢驗假設
H0:兩組發病率相同,都等于合計率,即π1=π2H1:兩組發病率不同,即π1≠π2②確定顯著性水平α=0.05。③計算統計量
n=220>40,所有格子E>5,所以不用校正:χ2=4.125④確定p值
p=0.042<0.05。⑤判斷結果:
因為p<0.05,所以在α=0.05的水平上拒絕檢驗假設H0,接受H1,可以認為兩組發病率不同,該新藥對預防流感有效。2/6/202323例2.某醫師用甲、乙兩療法治療小兒單純性消化不良,結果如下。試比較兩種療法效果有無差異。
甲乙兩種方法治療小兒單純性消化不良效果療法痊愈數未愈數合計甲26(28.82)7(4.18)33乙36(33.18)2(4.82)38合計629712/6/202324作業1某縣為了解農村兒童低出生體重的發生率。在婦幼保健院測量了263名農村戶籍兒童出生體重,其中低出生體重為22名,試估計該縣農村兒童低出生體重發生率的95%可信區間?25分類變量的統計推斷作業2我國城市兒童巨大兒(出生體重大于等于4000克)的發生率為6.5%。某醫院測量了336名兒童出生體重數據(出生體重-率.sav),請問該醫院調查的兒童巨大兒發生率是否高于我國城市兒童?男孩和女孩巨大兒發生率有無差別?26分類變量的統計推斷2/6/202327(二)配對設計四格表資料的2檢驗例3.有93份咽喉涂抹標本,每份標本分別接種在甲乙兩種培養基上,觀察其生長情況,結果如下表,請問兩種培養基的效果是否不同?甲乙兩種培養基的生長情況乙培養法甲培養法合計陽性陰性陽性371047陰性192746合計5637932/6/202328
配對資料:是同一研究對象用不同的方法進行實驗或調查,也就是說,這28份標本既進行了甲種方法的培養,又進行了乙種方法的培養。
我們要研究的是兩種培養基有什么不同?
所以a和d格子里的數對研究沒有多大意義,只要b和c的標本份數相差不大,就可以認為兩種培養基效果相同。2/6/202329配對四格表資料χ2檢驗的公式:當b+c>40時,或
當b+c≤40時,用校正公式:
或2/6/202330配對四格表2檢驗的SPSS計算程序ANALYZEnonparametrictest2relatedsamplestestpairsMcnemar2/6/202331例3:檢驗步驟第一步:建立假設H0:B=C=b+c/2
H1:
B?C
第二步:確定顯著性水平=0.05第三步:計算統計量:b+c40時,校正公式:
x2
=(|O-E|-0.5)2/E或x2=(lb-cl-1)2/b+c自由度:=(2-1)x(2-1)=1第四步:確定P值第五步:判斷結果2/6/202332(三)行x列表x2
檢驗
四格表是指只有2行2列,當行數或列數超過2時,統稱為行x列表。行x列表x2
檢驗是對多個樣本率(或構成比)的檢驗。
基本公式:x2
=(O-E)2/E專用公式:自由度:=(R-1)x(C-1)適用條件:表中不宜有1/5以上格子的理論頻數小于5,或有一個格子的理論頻數小于1。2/6/202333例4.為了解花生黃曲霉素污染,隨機觀察了三個地區,結果見下表。試問這三個地區花生的黃曲霉素污染率是否不同?
三個地區花生的黃曲霉素污染情況調查地區受檢樣品合計污染率(%)未污染污染甲6232979.3乙30144431.8丙831127.3合計44408447.62/6/2023342/6/202335初次分娩時的年齡疾病狀態<2020~2425~2930~34≥35總計乳腺癌320120610114632203220對照組142244322893109340610246總計174256383904155662613466乳腺癌%0.1840.2140.2590.2980.3510.239例5.初次分娩年齡與乳腺癌的關聯性2/6/2023362/6/202337H0:乳腺癌患者與非患者的初次分娩年齡構成相同
(初次分娩時的年齡與乳腺癌無關)H1:乳腺癌患者與非患者的初次分娩年齡構成不同
(初次分娩時的年齡與乳腺癌有關)α=0.05自由度ν=(R-1)×(C-1)=(2-1)(5-1)=4χ2
0.01,4=13.28,χ2=130.2>13.28,p<0.01
所以拒絕檢驗假設H0,接受H1,認為初次分娩時的年齡與乳腺癌的發生有關聯。2/6/202338行×列表χ2檢驗下結論時應注意:1.三組(或三組以上)樣本率經χ2檢驗,差異有顯著性,只說明三組比例數不同或不全相同,不能確定是哪兩個比例數不同。2/6/2023392.行×列表χ2檢驗時,如果有一個格子的理論數小于1,或者有1/5以上的格子的理論數小于5,可以將理論數小于5的組別與相鄰的組合并,再進行χ2檢驗,否則會得到錯誤結果
解決辦法χ2分割法2/6/202340例4.為了解花生黃曲霉素污染,隨機觀察了三個地區,結果見下表。試問這三個地區花生的黃曲霉素污染率是否不同?
三個地區花生的黃曲霉素污染情況調查地區受檢樣品合計污染率(%)未污染污染甲6232979.3乙30144431.8丙831127.3合計44408447.62/6/2023412/6/202342比較地區未污染數污染數合計污染率(%)χ2值P1乙30144431.80.09>0.05丙831127.3合計3817552乙+丙38175530.917.83<0.05甲6232979.3χ2分割計算表2/6/202343初次分娩時的年齡疾病狀態<2020~2425~2930~34≥35總計乳腺癌320120610114632203220對照組142244322893109340610246總計174256383904155662613466乳腺癌%0.1840.2140.2590.2980.3510.239例5.初次分娩年齡與乳腺癌的關聯性(四)趨勢x2檢驗2/6/2023442/6/202345
例5:行x列表x2檢驗結論是,5個年齡組中至少有2個年齡組的乳腺癌的構成不同。
進一步——關聯的性質?(趨勢χ2檢驗)當某因素是按自然順序的等級分層或者在連續性資料等級化后再分層的情況下,可采用趨勢χ2檢驗以分析比例是否隨分層等級而變化的趨勢
。
2/6/202346步驟:
假設共有k組,當組號i增加時,對應的Pi是否有增加(或減少)的傾向性。對應于第i組構建一個記分變量Si:k個組的記分常選1,2,3,……k2/6/202347H0:P1,P2,……Pk之間沒有傾向性H1:P1,P2,……Pk隨記分變量S1,S2,……Sk
的增加而增加(或減少),即Pi=α+βSi成立。
檢驗的統計量為:υ=12/6/202348χ2=128.8,p<0.001
所以拒絕檢驗假設H0,認為隨著初次分娩的年齡增加,乳腺癌的比例上升。表11.8避孕措施與避孕措施來源之間的關系避孕措施避孕措施來源合計醫務人員推薦自己選擇他人推薦避孕環口服藥安全套其它424108145911762032111023458117345945392529238合計7686926442104H0:采用何種避孕措施與其來源無關聯H1:采用何種避孕措施與其來源有關聯
查附表18(2界值表),本例2=189.8>12.59
P<0.05,按α=0.05水準,拒絕H0,接受H1,兩變量的關聯性有統計學意義,
認為育齡婦女采用的避孕措施與其來源有關聯
除關聯性檢驗外,用于說明兩個變量之間關系的密切程度,需計算關聯系數(contingencycoefficient,符號C),
計算公式為結合2檢驗結果可知,雖然該地育齡婦女采用的避孕措施與其來源有關聯,但關聯系數顯示兩變量關聯的密切程度并不大。用SPSS統計軟件的crosstabs程序可以作兩個無序分類變量的關聯檢驗,并通過點擊statistics----nominal----contingencycoefficient得到關聯系數。附:四格表資料的確切概率法
四格表資料當有理論數小于1或者總樣本例數不足40時,不能用卡方檢驗,而要用Fisher確切概率法(Fisherexactprobability)。確切概率法的基本思想
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 8的乘法口訣(教學設計)-2024-2025學年數學二年級上冊冀教版
- 乘數末尾有0的乘法(教學設計)-2024-2025學年數學三年級上冊冀教版
- 15 白鵝教學設計-2023-2024學年四年級下冊語文統編版
- 2024年高中化學 第三章 重要的有機化合物 第二節 石油和煤重要的烴 第2課時 煤的干餾 苯教學設計 魯科版必修2
- 《清理廚房》教學設計-2023-2024學年勞動四年級下冊人教版
- 《年月日》(教學設計)-2024-2025學年三年級下冊數學人教版
- 《8 搞好個人衛生》(教學設計)-2023-2024學年三年級上冊綜合實踐活動皖教版
- 2023-2024學年高中化學 1.2.2 科學家怎樣研究有機物教學設計 蘇教版選擇性必修3
- 三年級上冊道德與法治教學設計-3.2我們的學校我介紹 第二課時 桂師星球版
- Unit 2 My class (教學設計)-2024-2025學年人教精通版英語三年級下冊
- 正確使用文丘里面罩
- 破碎錘施工方案
- 2023年10月自考00161財務報表分析(一)試題及答案含評分標準
- 讀書分享讀書交流會《朝聞道》劉慈欣科幻小說讀書分享
- 大學物理第8章-機械振動
- 《線面平行的判定》課件
- 《電力工程電纜設計規范》
- 2022-2023學年北京市懷柔區八年級下學期期末語文試題及答案
- 2022中國大學慕課批判性思維南林大答案
- 衛生檢驗習題庫含參考答案
- 護理人文關懷培訓課件PPT
評論
0/150
提交評論