




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
卡方檢驗2的學習課件第1頁/共89頁χ2分布的特點⑴χ2分布的形狀依賴于ν的大小:當ν≤2時,曲線呈L型;隨著ν的增加,曲線逐漸趨于對稱;當ν→∞時,分布趨近于正態分布。⑵χ2分布具有可加性:如果兩個獨立的隨機變量X1和X2分別服從ν1和ν2的χ2分布,那么它們的和(X1+X2)也服從(ν1+ν2)的χ2分布。第2頁/共89頁χ2界值ν確定后,如果分布曲線下右側尾部的面積為α時,則橫軸上相應的χ2值就記作χ2
α,ν
,即χ2界值。其右側部分的面積α表示:自由度為ν時,χ2值大于界值的概率大小。χ2值與P值的對應關系見χ2界值表(附表6)。χ2值愈大,P值愈小;反之,χ2值愈小,P值愈大。第3頁/共89頁不同自由度的χ2分布曲線圖
第4頁/共89頁二、χ2檢驗的基本思想例8-1某中醫院將112例急性腎炎病人隨機分為兩組,分別用西藥和中西藥結合方法治療,結果見表8-1,問兩種方法的療效有無差別?第5頁/共89頁表8-1兩種方法治療急性腎炎的結果組別治愈例數未愈例數合計治愈率(%)西藥43(47.5)13(8.5)5676.79中西結合合計52(47.5)954(8.5)5692.861711284.82第6頁/共89頁χ2檢驗的計算公式
TRC=(nR·nC)/n式中A為實際頻數;T為理論頻數,是按無效假設兩總體率相等,均等于兩樣本的合計率時算出的;TRC表示R行C列格子的理論頻數;nR為第R行的合計數;nC為第C
列的合計數;n為總例數;R為行數;C為列數。
第7頁/共89頁PC=a+c/n=43+52/112=0.8482T11=(a+b)×PC=(a+b)×(a+c)/n=56×95/112=47.5T12=(a+b)×(1-PC)=(a+b)×(b+d)/n=56×17/112=8.5T21=(c+d)×PC=(c+d)×(a+c)/n=56×95/112=47.5T22=(c+d)×(1-PC)=(c+d)×(b+d)/n=56×17/112=8.5第8頁/共89頁χ2檢驗的基本思想χ2檢驗實質上是檢驗A的分布與T的分布是否吻合及吻合的程度,χ2越小,表明實際觀察次數與理論次數越接近。若檢驗假設成立,則A與T之差不會很大,出現大的χ2值的概率P是很小的,若P≤α,就懷疑假設成立,因而拒絕它;若P>α,則沒有理由拒絕它。第9頁/共89頁χ2檢驗的自由度χ2值的大小,除決定于A-T的差值外,還與格子數(嚴格地說是自由度)的多少有關,故在查χ2界值表時要考慮自由度的大小。χ2檢驗的自由度:
ν=(R-1)(C-1)
第10頁/共89頁第二節四格表資料的χ2檢驗一、四格表資料的模式對于完全隨機設計的兩組資料,如果其結果是兩分類變量,通常可列成表8-2的形式。由于a、b、c、d4個數據是表格中的基本數據,其余數據都可從這4個數據推算出來,這種資料稱為四格表資料。第11頁/共89頁表8-2四格表資料的模式分組+-合計甲組
a
ba+b乙組合計
ca+c
dc+db+dn第12頁/共89頁二、用基本公式求χ2值
應用條件:n>40,且四個格子的T>5。1.建立假設、確定檢驗水準H0:π1=π2;H1:π1≠π2;
α=0.05第13頁/共89頁2.選擇檢驗方法、計算統計量第14頁/共89頁3.確定P值、做出推論ν=(2-1)(2-1)=1,χ20.05,1=3.84。本例χ2>χ20.05,1
,則P<0.05。按α=0.05水準,拒絕H0,接受H可認為兩種方法的總治愈率不等。第15頁/共89頁三、用四格表專用公式求χ2值
式中a、b、c、d分別為四格表的4個實際頻數,總例數n=a+b+c+d,(a+b)、(c+d)、(a+c)和(b+d)為各行和各列的合計數。第16頁/共89頁四、四格表資料χ2值的校正
應用條件:n>40,但有1<T<5。第17頁/共89頁例8-2某醫師將門診的偏頭痛病人隨機分為兩組,分別采用針灸和藥物兩種方法治療,結果見表8-3,問兩種療法的有效率有無差別?第18頁/共89頁兩種療法對偏頭痛的治療結果療法有效例數無效例數合計有效率(%)針灸33(30.15)2(4.85)3594.29藥物23(25.85)7(4.15)3076.67合計5696586.15
第19頁/共89頁1.建立假設、確定檢驗水準
H0:π1=π2,H1:π1≠π2;α=0.05第20頁/共89頁2.選擇檢驗方法、計算統計量
T11=35×56/65=30.15,T12=35-30.15=4.85,T21=56-30.15=25.85,
T22=9-4.85=4.15。
第21頁/共89頁3.確定P值、做出推論ν=(2-1)(2-1)=1,χ20.05,1=3.84,本例χ2<χ20.05,1
,則P>0.05。按α=0.05水準不拒絕H0
,故尚不能認為兩種療法治療偏頭痛的有效率有差異。若不對本例χ2值進行校正,則χ2=4.204,會得出兩種療法治療偏頭痛的有效率有差異的結論。第22頁/共89頁五、四格表的確切概率法
四格表的確切概率法(exactprobabilitiesfor2×2table)即Fisher確切概率法(Fisher′sexactprobabilitiestest),也稱四格表直接計算法。是對兩個小樣本或樣本率偏小(或偏大)的資料進行比較的統計分析方法。第23頁/共89頁(一)適用條件在四格表資料中,當出現下列情況之一時,應選用四格表的確切概率法。1.n<402.有A=03.有T≤14.用其它檢驗方法所得P接近α。第24頁/共89頁(二)基本思想無需計算檢驗統計量,直接計算原表及比原表更極端情況(│A-T│≥原表的│A-T│)的累計概率,與檢驗水準比較作出推斷。第25頁/共89頁具體方法在四格表周邊合計數不變的條件下,變動四格表中的各格數值,得到四個數據各種組合之變動四格表;計算各表的│A-T│值;用公式直接計算│A-T│≥原表│A-T│的各四格表之概率;按檢驗假設取單側或雙側求累計概率,與檢驗水準比較作出推斷。第26頁/共89頁計算公式式中a、b、c、d和n的意義同前,!為階乘符號。0!=1,1!=1,3!=3×2×1=6。
第27頁/共89頁(三)求P值的步驟
1.列四格表。使四格表周邊合計數不變,依次增減四格表中任一格子的數據,列出所有可能的四格表。列四表格的數量=最小合計數+1。如例8-3,增減a格的數據,得9個四格表。第28頁/共89頁2.計算各表格的│A-T│在四格表資料中,各格子的│A-T│相等,故計算某一四格表資料的│A-T│時,只需計算表中任一格子的│A-T│即可。第29頁/共89頁3.計算P值⑴雙側檢驗時,需分別計算兩側所有│A-T│等于及大于原表│A-T│的各四格表的P值,然后相加,即雙側檢驗的P值。若兩樣本含量相等,兩側表格對稱,則只計算一側的累積P值,再乘以2即可。⑵單側檢驗時,只計算一側的所有│A-T│等于及大于原表│A-T│的各四表格的P值,然后相加,即單側檢驗的P值。第30頁/共89頁例8-3某醫院將24例乙型腦炎重癥病人隨機分為兩組,用同樣的中藥方治療,但其中一組加一定量的人工牛黃,另一組不加,結果如表8-4,問人工牛黃能否增強乙腦方劑的療效?第31頁/共89頁兩法治療乙型腦炎重癥患者的療效治療方法治愈未愈合計乙腦方5712乙腦方+牛黃11112合計16824第32頁/共89頁[1]建立假設、確定檢驗水準H0:π1=π2
;H1:π1<π2;α=0.05第33頁/共89頁[2]選擇檢驗方法、計算統計量本例n<40,宜用四格表的確切概率法。按公式8-2求T,結果見表8-4括號內數字。列出周邊合計數不變的各種組合之四格表,共9個,并計算│A-T│。
第34頁/共89頁⑴
⑵⑶⑷⑸
41280121251171121261062121279531212884412121682416824168241682416824│A-T│=4
│A-T│=3
│A-T│=2
│A-T│=1│A-T│=0
⑹
⑺
⑻
⑼
9735121210626121211517121212408121216824168241682416824│A-T│=1
│A-T│=2
│A-T│=3
│A-T│=4
第35頁/共89頁[3]確定P值、做出推論本例是推測加入人工牛黃的療效是否高于不加人工牛黃組,屬于單側檢驗。P=P(1)+P(2)
=0.0007+0.0129=0.0136按α=0.05水準拒絕H0
,接受H1
。認為加入人工牛黃能增強乙腦方劑的療效。第36頁/共89頁第三節配對四格表資料的χ2檢驗一、配對四格表資料的模式
若配對設計的兩分類變量,每對受試對象分別接受甲、乙兩種處理,或同一樣品經甲、乙兩法檢測,每一對子的計數情況有4種可能:即甲+乙+、甲+乙-、甲-乙+、甲-乙-。可將其排成表8-5的形式。第37頁/共89頁表8-5配對四格表資料的模式甲法乙法
合計+-+
aba+b
-
cdc+d
合計a+cb+dn第38頁/共89頁例8-4用兩種方法檢查已確診的乳腺癌病人120例,檢查結果如下表,問兩種檢查方法何者為優?第39頁/共89頁兩種方法檢查乳腺癌的結果
甲法乙法
合計+-+
421860-
303060合計7248120第40頁/共89頁基本思想P甲=a+b/n,P乙=a+c/nπ甲=A+B/N,π乙=A+C/N優勢性χ2檢驗,假設是甲法優于乙法的例數與乙法優于甲法的例數相等。不考慮兩法均為陽性和均為陰性的例數(a與d),只比較兩法相異的例數(b與c),通過檢驗其差別有無顯著性來推斷優勢性。第41頁/共89頁計算公式(1)當b+c>40時,χ2=(b-c)2/(b+c)(2)當b+c≤40時,χ2=(︱b-c︱-1)2/(b+c)第42頁/共89頁1.建立假設、確定檢驗水準H0:B=CH1:B≠Cα=0.05第43頁/共89頁2.選擇檢驗方法、計算統計量本例b+c=18+30=48>40:χ2=(b-c)2/(b+c)=(18-30)2/(18+30)=3.00第44頁/共89頁3.確定P值、做出推論ν=1,查χ2界值表,得
χ20.05,1=3.84,本例χ2<χ20.05,1,P>0.05;按α=0.05水準,不拒絕H0
,尚不能認為兩種方法檢出率有差別。第45頁/共89頁注意:該法適用于樣本含量不是很大的資料。因為本法僅考慮了兩種處理結果不一致的情況(b,c),而未考慮樣本含量n和兩種處理結果一致的情況(a,d)。當n很大且a和d的數值也很大(即兩種處理方法的一致率較高),b和c的數值相對較小時,即使是檢驗結果有統計學意義,其實際意義往往也不大。第46頁/共89頁第四節行×列表資料的χ2檢驗一、行×列表資料及其χ2值的計算公式若行數和(或)列數>2的表格稱行×列表,簡記為R×C表。R×C表資料的χ2檢驗用于多個率或構成比的比較。第47頁/共89頁行×列表資料的三種情況①多個樣本率比較時,有R行2列,稱為R×2表;②兩個樣本的多個構成比的比較,有2行C列,稱為2×C表;③多個樣本的構成比比較,以及雙向無序分類資料關聯性檢驗時,有R行C列,稱為R×C表。第48頁/共89頁計算公式R×C表資料χ2檢驗的基本思想和步驟與四格表資料χ2檢驗相同,χ2值可按公式8-1計算,但因計算各格子的理論頻數TRC,較為繁瑣,用其專用公式計算更為簡便。
第49頁/共89頁二、多個樣本率比較的χ2檢驗用于R≥3、C=2,描述多個率的R×2表資料。例8-5某中醫師用甲、乙、丙3種中藥方治療膽結石,結果如表8-7,試比較3種中藥方的療效。第50頁/共89頁表8-7三種中藥方治療膽結石的結果
藥方有效例數無效例數合計率(%)甲5666290.32乙41165771.93丙37185567.27合計1344017477.01第51頁/共89頁1.建立假設、確定檢驗水準H0:π1=π2=π3;H1:π1、π2、π3不等或不全相等;α=0.05第52頁/共89頁2.選擇檢驗方法、計算統計量第53頁/共89頁3.確定P值、做出推論ν=(3-1)(2-1)=2,χ20.05,2
=5.99,本例χ2>χ20.05,2
,P<0.05;按α=0.05水準,拒絕H0,接受H1。可認為3種中藥方治療膽結石的效果不同或不全相同。第54頁/共89頁三、多個樣本構成比比較的χ2檢驗例8-6某醫師將199例消化性潰瘍病人隨機分為3組,比較3種治療方案的效果。為避免中醫不同證型對結果的影響,試分析3組病人按中醫辯證分型的構成比有無差別?第55頁/共89頁3組消化性潰瘍病人四種證型的構成組別肝胃不和胃陰不足脾胃虛寒寒熱夾雜合計生胃寧素片7
15
29
37
88
中藥4
12
16
19
51
西藥3
5
15
37
60
合計14
32
60
93
199
第56頁/共89頁1.建立假設、確定檢驗水準H0:3組病人中醫各證型的構成比相同;H1:3組病人中醫各證型的構成比不同或不全相同;α=0.05第57頁/共89頁2.選擇檢驗方法、計算統計量
第58頁/共89頁3.確定P值、做出推論ν=(3-1)(4-1)=6,χ20.05,6
=12.59,本例χ2<χ20.05,6
,P>0.05。按α=0.05水準,不拒絕H0
,可認為3組消化性潰瘍病人中醫各證型的構成比相同。第59頁/共89頁四、雙向無序分類資料關聯性的
R×C表χ2檢驗兩個分類變量均為無序分類變量的行×列表資料稱為雙向無序R×C表資料,χ2檢驗可用于分析這類資料的相關關系。第60頁/共89頁例8-7某研究者測得某地1987人的ABO血型和MN血型分布,結果見表8-7,問兩種血型系統之間是否有關聯?第61頁/共89頁表8-7某地1987人的不同血型分布
第62頁/共89頁1.建立檢驗假設、確定檢驗水準H0:兩種血型系統間無關聯;H1:兩種血型系統間有關聯;α=0.05第63頁/共89頁2.選擇檢驗方法、計算統計量
第64頁/共89頁3.確定P值,做出推論ν=(R-1)(C-1)=(4-1)×(3-1)=6,查χ2界值表,得χ20.05,6
=12.59,本例χ2>χ20.05,6
,P<0.05。按α=0.05水準,拒絕H0,接受H1,差異有統計學意義,提示兩種血型系統間有關聯。第65頁/共89頁五、行×列表資料χ2檢驗的注意事項1.要求T不宜太小。R×C表資料中各格的T不應小于1,并且1≤T<5的格子數不宜超過總格子數的20%。否則,可以:①增大樣本含量,以增大T后再計算χ2值;②根據專業知識,刪去T太小的行或列,或者與相鄰行(或列)合并,但這樣會損失信息,損害樣本的隨機性;③改用雙向無序R×C表資料的Fisher確切概率法。第66頁/共89頁2.多個樣本率(構成比)比較,P<0.05時:若所得的結論為拒絕檢驗假設,只能認為各總體率(或構成比)之間總的來說有差別(即不等或不全相等),但不能說明它們彼此之間都有差別,或某兩者之間有差別。要進一步推斷哪些總體率(構成比)之間有差別,需進一步做多個樣本率(構成比)的多重比較。第67頁/共89頁3.對于單向有序R×C表資料的統計分析R×C表資料,當效應按強弱(或優劣)分為若干等級,如分為-、+、++、+++、++++或治愈、顯效、有效、無效、惡化、死亡時,因為效應等級是按照順序排列的,屬于單向有序行×列表。若比較各處理組的效應有無差異,宜選用秩和檢驗。第68頁/共89頁例題:某醫院采用“母痔基底硬化療法”治療198例三、四期內痔的結果如下表,請分析對三、四期內痔的療效有無差別。第69頁/共89頁表8-10母痔基底硬化療法治療內痔的結果分期
痊愈
基本痊愈好轉合計
三期內痔104104118四期內痔5319880合計
1572912198第70頁/共89頁4.對于雙向有序且屬性不同的R×C表資料的統計分析如推斷“年齡與療效”、“病程與療效”、“療程與療效”是否有關系及相關的密切程度等。由于兩個變量均有序,但屬性不同,可用等級相關分析或線性趨勢性檢驗。第71頁/共89頁例題:某廠在冠心病普查中研究冠心病與眼底動脈硬化的關系,資料整理如下。問兩者之間是否存在一定的關系?第72頁/共89頁某廠職工冠心病與眼底動脈硬化普查結果
第73頁/共89頁5.對于雙向有序且屬性相同的
R×C表資料的統計分析如用兩種方法檢測同一批糖尿病患者的尿糖,結果均用-、+、++、+++和++++表示。要了解兩種方法的檢測結果是否一致,由于兩種方法的檢驗結果均有序,且屬性相同,分析時要用Kappa檢驗。第74頁/共89頁例題:某醫院化驗室用新舊兩種方法檢測327例糖尿病患者的尿糖,檢驗結果均用-、+、++、+++和++++表示,數據見下表。請分析兩種方法的檢測結果是否一致?第75頁/共89頁兩種方法檢測糖尿病患者的尿糖結果
第76頁/共89頁第五節多個率或構成比的多重比較對R×C表資料作χ2檢驗,得P<α
時,需進一步作多個率(或構成比)的多重比較。如果用多次四格表資料的檢驗將會加大犯I型錯誤的概率。若要解決此問題,需進一步作多個率(或構成比)的多重比較。第77頁/共89頁一、χ2分割法利用χ2值的可加性原理,把原行×列表分為若干個表。這些分割表的ν之和等于原行×列表的ν;其χ2值之和十分接近原行×列表的χ2值。
分割的方法是將率(或構成比)最接近的兩組數據分割出來,計算其χ2值。若得P<0.05,認為多個率(或構成比)不相等;若得P>0.05則將其兩組數據合并成一個樣本,再把它與另一個較接近的樣本比較,如此進行下去直至結束。
第78頁/共89頁例8-7對例8-53種藥方治療膽結石的效果作χ2分割。第79頁/共89頁χ2分割計算表
比較
藥方
有效例數
無效例數
合計有效率(%)
Χ2值
P值
1乙方丙方41371618575571.9367.270.287
>0.05
合計7834
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 榆林市榆陽區2025年五年級數學第二學期期末考試模擬試題含答案
- 江蘇省啟東市長江中學2025屆高考沖刺七歷史試題含解析
- 內蒙古鄂爾多斯市鄂托克旗2024-2025學年初三期末熱身聯考英語試題含答案
- 玉柴職業技術學院《搜索引擎系統應用實踐》2023-2024學年第二學期期末試卷
- 四川華新現代職業學院《大學英語III》2023-2024學年第二學期期末試卷
- 上海海事大學《科技檔案管理》2023-2024學年第一學期期末試卷
- 天津美術學院《診斷學(二)》2023-2024學年第二學期期末試卷
- 寧夏工業職業學院《生物醫藥與新材料化工科研創新訓練》2023-2024學年第二學期期末試卷
- 山西省晉中學市榆社縣2024-2025學年初三中考考前輔導生物試題含解析
- 南通職業大學《臨床檢驗設備與技術實驗》2023-2024學年第二學期期末試卷
- 可燃氣體報警儀檢驗記錄
- 自動控制原理全套ppt課件(完整版)
- 手衛生相關知識考核試題與答案
- 《同分母分數加減法》教學課件人教新課標
- 產業經濟學第三版(蘇東水)課后習題及答案完整版
- 初中綜合實踐課程標準
- 首件檢驗記錄表(標準樣版)
- 中建六局建設發展公司責任目標管理考核辦法
- 太陽能光伏發電系統PVsyst運用
- 壓實瀝青混合料密度(表干法)自動計算
- 博碩BSL2236OAC全自動說明書(觸摸屏)
評論
0/150
提交評論