




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
卡方檢驗正式第1頁/共86頁2概念回顧在總體率為π的二項分布總體中做n1和n2抽樣,樣本率p1和p2與π的差別,稱為率抽樣誤差。在總體率為π1和π2的不同總體中抽樣,得p1和p2,在nπ>5,可通過率的u檢驗推斷是否π1=π2。二項分布的兩個樣本率的檢驗同樣可用χ2檢驗。第2頁/共86頁3
目的:推斷兩個總體率或構成比之間有無差別多個總體率或構成比之間有無差別多個樣本率的多重比較兩個分類變量之間有無關聯性頻數分布擬合優度的檢驗。
檢驗統計量:χ2
應用:計數資料第3頁/共86頁4基本概念例1某院比較異梨醇(試驗組)和氫氯塞嗪(對照組)降低顱內壓的療效,將200名患者隨機分為兩組,試驗組104例中有效的99例,對照組96例中有效的78例,問兩種藥物對降低顱內壓療效有無差別?第4頁/共86頁5表200名顱內高壓患者治療情況編號年齡性別治療組舒張壓體溫療效137男A11.2737.5有效245女B12.5337.0有效343男A10.9336.5有效459女B14.6737.8無效…………………20054男B16.8037.6無效如何整理此類資料?如何分析此類資料?第5頁/共86頁6四格表(fourfoldtable)資料的基本形式實際頻數(actualfrequency)是指各分類實際發生或未發生計數值,記為A。a=99b=5104c=75d=219617426200單元格第6頁/共86頁7理論頻數(theoreticalfrequency)是指按某H0假設計算各分類理論上的發生或未發生計數值,記為T。式中,TRC為第R行C列的理論頻數
nR為相應的行合計
nC為相應的列合計療法有效人數無效人數合計有效率試驗組99(90.48)5(13.52)10495.2對照組75(83.52)21(12.48)9678.1合計1742620087.0第7頁/共86頁8殘差設A代表某個類別的觀察頻數,T代表基于H0計算出的期望頻數,A與T之差(A-T)被稱為殘差殘差可以表示某一個類別觀察值和理論值的偏離程度,但殘差有正有負,相加后會彼此抵消,總和仍然為0。為此可以將殘差平方后求和,以表示樣本總的偏離無效假設的程度第8頁/共86頁9Pearsonχ2檢驗的基本公式殘差大小是一個相對的概念,相對于期望頻數為10時,20的殘差非常大;可相對于期望頻數為1000時20就很小了。因此又將殘差平方除以期望頻數再求和,以標準化觀察頻數與期望頻數的差別??ǚ浇y計量,1900年由英國統計學家K.Pearson首次提出。KarlPearson(1857–1936)第9頁/共86頁10從卡方的計算公式可見,當觀察頻數與期望頻數完全一致時,卡方值為0;觀察頻數與期望頻數越接近,兩者之間的差異越小,卡方值越小;反之,觀察頻數與期望頻數差別越大,兩者之間的差異越大,卡方值越大。當然,卡方值的大小也和自由度有關檢驗的自由度取決于可以自由取值的格子數目,而不是樣本含量n。理論上,在n≥40時下式值與χ2分布近似,在理論數>5,近似程度較好。第10頁/共86頁11連續型分布:正態分布(Normaldistribution),學生氏t分布(Student’st-distribution),F分布(Fdistribution)另一個同樣重要的分布—χ2卡方分布(Chi-squareddistribution)。此分布在1875年,首先由F.Helmet所提出,而且是由正態分布演變而來的,即標準正態分布Z值之平方而得χ2分布第11頁/共86頁12設Xi為來自正態總體的連續性變量。稱為自由度df=n的卡方值。顯然,卡方分布具有可加性。第12頁/共86頁133.847.8112.59P=0.05的臨界值χ2分布的概率密度函數曲線第13頁/共86頁14當υ=1時,第14頁/共86頁15第二節2×2表卡方檢驗第15頁/共86頁16兩組樣本率比較的設計分類:1.兩組(獨立)樣本率的比較組間數據是相互獨立,非配對設計。2×2表卡方檢驗2.配對設計兩組樣本率的比較組間數據是相關的,配對設計。配對四格表卡方檢驗第16頁/共86頁17兩組(不配對)樣本率的比較1)四格表形式2)四格表不配對資料檢驗的專用公式二者結果等價各組樣本例數是固定的組別陽性數陰性數合計率%甲組aba+b=n1a/n1乙組cdc+d=n2c/n2合計a+cb+dN(a+c)/N第17頁/共86頁18例1(續)第18頁/共86頁19H0:π1=π2即試驗組與對照組降低顱內壓的總體有效率相等H1:π1≠π2α=0.05。以ν=1查附表8的χ2界值表得P<0.005。按α=0.05檢驗水準拒絕H0,接受H1,可以認為兩組降低顱內壓總體有效率不等,即可認為異梨醇口服液降低顱內壓的有效率高于氫氯噻嗪+地塞米松的有效率。第19頁/共86頁20值得指出,成組設計四格表資料的2檢驗與前面學習過的兩樣本率比較的雙側u檢驗是等價的。若對同一資料作兩種檢驗,兩個統計量的關系為2=u2。其對應的界值也為平方關系。兩者的應用條件也是基本一致的,連續性校正也基本互相對應。第20頁/共86頁21卡方檢驗假設的等價性兩組顱內壓治療有效率相同兩組有效率的比較實際數據的頻數分布和理論假設相同理論分布與實際分布的檢驗使用不同的藥物并不會影響顱內壓的治療(兩個分類變量間無關聯)兩變量的相關分析第21頁/共86頁22四格表2值的校正英國統計學家Yates認為,2分布是一種連續型分布,而四格表資料是分類資料,屬離散型分布,由此計算的2值的抽樣分布也應當是不連續的,當樣本量較小時,兩者間的差異不可忽略,應進行連續性校正(在每個單元格的殘差中都減去0.5)若n>40,此時有1<T5時,需計算Yates連續性校正2值T<1,或n<40時,應改用Fisher確切概率法直接計算概率第22頁/共86頁23(1)校正公式的條件:
1<T<5,同時N≥40,用校正公式計算(2)連續校正(continuitycorrection)公式:(3)當T<1,或N<40,用Fisher確切概率法四格表χ2檢驗的校正公式
(兩組不配對資料)第23頁/共86頁24例2某醫師欲比較胞磷膽堿與神經節苷酯治療腦血管疾病的療效,將78例腦血管疾病患者隨機分為兩組,結果見表7-2。問兩種藥物治療腦血管疾病的有效率是否相等?H0:π1=π2即兩種藥物治療腦血管疾病的總體有效率相等H1:π1≠π2α=0.05。第24頁/共86頁25表
兩種藥物治療腦血管疾病有效率的比較第25頁/共86頁26本例n=78,但T22=4.67,故用四格表資料χ2檢驗的校正公式不校正χ2=4.35,p<0.05以ν=1查附表8的χ2界值表得P>0.05。按α=0.05檢驗水準,不拒絕H0,無統計學意義,尚不能認為兩種藥物治療腦血管疾病的有效率不等。第26頁/共86頁27卡方檢驗的連續性校正問題正方觀點:卡方統計量抽樣分布的連續性和平滑性得到改善,可以降低I類錯誤的概率;校正結果更接近于Fisher確切概率法;校正是有條件的。反方觀點:經連續性校正后,P值有過分保守之嫌;連續性校正卡方檢驗的P值與Fisher確切概率法的P值沒有可比性,這是因為Fisher確切概率法建立在四格表雙邊固定的假定下,而實際資料則是單邊固定的四格表。第27頁/共86頁28就應用而言,無論是否經過連續性校正,若兩種檢驗的結果一致,無須在此問題上糾纏。但是,當兩種檢驗結果相互矛盾時,如例2,就需要謹慎解釋結果了。為客觀起見,建議將兩種結論同時報告出來,以便他人判斷。當然,如果兩種結論一致,如均為有或無統計學意義,則只報道非連續性檢驗的結果即可。第28頁/共86頁29第二節配對設計兩個樣本率的χ2檢驗(McNemer檢驗)配對設計:通常為同源配對。對同一觀察對象分別用兩種方法處理,觀察其陽性與陰性結果。基本用途:常用于比較兩種檢驗方法或兩種培養基的陽性率是否有差別。數據形式:配對四格表形式。第29頁/共86頁30例3某實驗室采用兩種方法對58名可疑紅斑狼瘡患者的血清抗體進行測定,問:兩方法測定結果陽性檢出率是否有差別?測定結果為:陽性、陰性(共116標本,58對)方法(X)乳膠凝集法免疫熒光法對子例數
+
+
11
-
-
33
+
-
2
-
+
12結果第30頁/共86頁31上述配對設計實驗中,就每個對子而言,兩種處理的結果不外乎有四種可能:①兩種檢測方法皆為陽性數(a);②兩種檢測方法皆為陰性數(d);③免疫熒光法為陽性,乳膠凝集法為陰性數(b);④乳膠凝集法為陽性,免疫熒光法為陰性數(c)。其中,a,d為兩法觀察結果一致的兩種情況,
b,c為兩法觀察結果不一致的兩種情況。第31頁/共86頁32
表
兩種方法的檢測結果第32頁/共86頁33方法原理按照配對設計的思路進行分析,則首先應當求出各對的差值,然后考察樣本中差值的分布是否按照H0假設的情況對稱分布。按此分析思路,最終可整理出如前所列的配對四格表。主對角線上兩種檢驗方法的結論相同,對問題的解答不會有任何貢獻斜對角線上兩種檢驗方法的結論不相同,顯示了檢驗方法間的差異第33頁/共86頁34配對χ2檢驗統計量為第34頁/共86頁35H0:b=c=(12+2)/2=7(兩法總體陽性率相等)H1:bc
(兩方法總體陽性率不等)=0.05本例b+c=12+2=14<40,用校正公式本例χ2=5.79>3.84,P<0.05。在α=0.05水準,拒絕H0,接受H1,有統計學意義。認為兩方法的檢測率不同,乳膠凝集法的陽性檢測率22.41%低于免疫檢測率39.66%。第35頁/共86頁36注意事項McNemar檢驗只會利用非主對角線單元格上的信息,即它只關心兩者不一致的評價情況,用于比較兩個評價者間存在怎樣的傾向。因此,對于一致性較好的大樣本數據,McNemar檢驗可能會失去實用價值。例如對1萬個案例進行一致性評價,9995個都是完全一致的,在主對角線上,另有5個分布在左下的三角區,顯然,此時一致性相當的好。但如果使用McNemar檢驗,此時反而會得出兩種評價有差異的結論來。第36頁/共86頁37第三節四格表資料的Fisher確切概率法第37頁/共86頁38條件:理論依據:超幾何分布
(非2檢驗的范疇)第38頁/共86頁39例4
某醫師為研究乙肝免疫球蛋白預防胎兒宮內感染HBV的效果,將33例HBsAg陽性孕婦隨機分為預防注射組和非預防組,結果見表7-4。問兩組新生兒的HBV總體感染率有無差別?第39頁/共86頁40表7-4兩組新生兒HBV感染率的比較第40頁/共86頁41基本思想在四格表周邊合計數固定不變的條件下,計算表內4個實際頻數變動時的各種組合之概率Pi;再按檢驗假設用單側或雙側的累計概率P,依據所取的檢驗水準α做出推斷。第41頁/共86頁42
1.各組合概率Pi的計算
在四格表周邊合計數不變的條件下,表內4個實際頻數a,b,c,d
變動的組合數共有“周邊合計中最小數+1”個。如例7-4,表內4個實際頻數變動的組合數共有9+1=10個,依次為:第42頁/共86頁43各組合的概率Pi服從超幾何分布,其和為1。計算公式為第43頁/共86頁44
2.累計概率的計算(單、雙側檢驗不同)第44頁/共86頁45第45頁/共86頁46第46頁/共86頁47檢驗步驟第47頁/共86頁48第48頁/共86頁49表5例4的Fisher確切概率法計算表第49頁/共86頁50例5
某單位研究膽囊腺癌、腺瘤的P53基因表達,對同期手術切除的膽囊腺癌、腺瘤標本各10份,用免疫組化法檢測P53基因,資料見表7-6。問膽囊腺癌和膽囊腺瘤的P53基因表達陽性率有無差別?第50頁/共86頁51表6膽囊腺癌與膽囊腺瘤P53基因表達陽性率的比較第51頁/共86頁52
本例a+b+c+d=10,由表7-7可看出,四格表內各種組合以i=4和i=5的組合為中心呈對稱分布。表7例5的Fisher確切概率法計算表
*為現有樣本第52頁/共86頁53(1)計算現有樣本的D*和P*及各組合下四格表的Di。本例D*=50,P*=0.02708978。(2)計算滿足Di≥50條件的各組合下四格表的概率Pi。(3)計算同時滿足Di≥50和Pi≤P*條件的四格表的累計概率。本例為P7和P8,(4)計算雙側累計概率P。
P>0.05,按α=0.05檢驗水準不拒絕H0,尚不能認為膽囊腺癌與膽囊腺瘤的P53基因表達陽性率不等。第53頁/共86頁54第54頁/共86頁55一點補充確切概率法的原理具有通用性,對于四格表以外的情況也適用,如行乘列表、配對、配伍表格均可對于較大的行乘列表,確切概率法的計算量將很大,有可能超出硬件系統可以支持的范圍此時可以采用計算統計學中的其他統計計算技術加以解決,如Bootstrap方法等第55頁/共86頁56第四節行×列表的χ2檢驗當比較組行或列分類數>2,稱為行×列表,即R×C表。研究者感興趣的問題有:(χ2檢驗的目的)1.多組(獨立樣本)樣本率差別有無統計意義?2.兩組(獨立樣本)構成比(分布)有無統計意義?3.兩個分類變量分布是否獨立(有關聯)?第56頁/共86頁57自由度=(行數-1)×(列數-1)等價檢驗統計量第57頁/共86頁58療法有效無效合計有效率%物理組199(186.2)720696.6藥物組1641818290.1外用組1182614481.9合計4815153290.4
例6
某醫師研究物理療法、藥物治療和外用膏藥三種療法治療周圍性面神經麻痹的療效,資料見下表。問三種療法的有效率有無差別?
表7-8三種療法有效率的比較第58頁/共86頁59H0:1=2=3=90.4(三組總體有效率相等)H1:三組總體率不等或不全等α=0.05結論:在α=0.05水準,拒絕H0,P<0.01,認為三組療法有效率不等或不全等。注意:此結果不能得到各兩兩組比較的結論。第59頁/共86頁60二、兩組和多組構成比的比較
例7
某醫師在研究血管緊張素I轉化酶(ACE)基因I/D多態(分3型)與2型糖尿病腎病(DN)的關系時,將249例2型糖尿病患者按有無糖尿病腎病分為兩組,資料見表7-9。問兩組2型糖尿病患者的ACE基因型總體分布有無差別?糖尿病ACE基因型合計DDIDII有腎病42(37.8)48(43.3)21(18.9)111無腎病30(21.7)75(52.2)36(26.1)138合計72(28.9)120(48.2)57(22.9)249表9兩組Ⅱ型糖尿病患者ACE基因分布比較第60頁/共86頁61第61頁/共86頁62三、雙向無序分類資料的關聯性檢驗R×C表中兩個分類變量皆為無序分類變量的行×列表資料,又稱為雙向無序R×C表資料。目的:檢驗兩事物分類(行分類和列分類)是否獨立,從而說明兩事物分類是否有關系。需要注意的是:雙向無序分類資料為兩個或多個樣本,做差別檢驗(例7);若為單樣本,做關聯性檢驗。第62頁/共86頁63統計分析:1.回答兩事物的分類是否獨立(有關系)
Pearsonχ2檢驗2.如有關,關系密切程度如何,度量指標:列聯系數(Contingencycoefficient)列聯系數C取值范圍在0~1之間。愈接近于0,關系愈不密切;愈接近于1,關系愈密切。第63頁/共86頁64兩分類變量獨立與有關兩事物獨立的假定:行或列各分類的構成比相同,或在A事物不同水平下,B事物不同分類的作用(構成)相等.高血壓(B)RH血型(A)RH血型(A)+-+-有50(50)50(50)0(50)100(50)無50(50)50(50)100(50)0(50)合計100100100100第64頁/共86頁65例8
測得某地5801人的ABO血型和MN血型結果如表7-10,問兩種血型系統之間是否有關聯?
表10某地5801人的血型
第65頁/共86頁66H0:兩種血型系統分類無關聯(即行或列構成比相等)H1:兩種血型系統分類有關聯(即行或列構成比不等)=0.05結論:兩種血型系統分類有關聯。列聯系數為0.1883。兩種血型系統間雖然有關聯性,但關系不太密切。第66頁/共86頁67第五節多組樣本率的兩兩比較的χ2分割當比較組k≥3時,χ2值有統計意義,可分解多個四格表了解各樣本率兩兩間的差別。要進一步推斷哪兩兩總體率有差別,若直接用四格表資料的檢驗進行多重比較,將會加大犯Ⅰ類錯誤的概率。多重比較的方法:χ2分割法;Scheffe’可信區間法;SNK法。第67頁/共86頁68χ2分割法基本思想檢驗水準α`年齡組治愈好轉無效組1………組2…………………組k………年齡組治愈好轉無效組1………組2………年齡組治愈好轉無效組1………組3………年齡組治愈好轉無效組1………組k…………………其目的是保證檢驗假設中I型錯誤α的概率不變。因分析目的不同,主要有兩類多重比較形式:多個實驗組間的兩兩比較實驗組與同一個對照組的比較檢驗水準α第68頁/共86頁69多個實驗組間的兩兩比較分析目的為k個實驗組間,任意兩個率均進行比較時,須進行k(k-1)/2次獨立的四格表檢驗,再加上總的行×列表資料的檢驗,共k(k-1)/2+1次檢驗假設。故檢驗水準α`用下式估計第69頁/共86頁70實驗組與同一個對照組的比較分析目的為各實驗組與同一個對照組的比較,而各實驗組間不須比較。檢驗水準α`用下式估計第70頁/共86頁71χ2Pχ2Pχ2P6.240.012507.480.006258.210.004176.960.008337.880.005008.490.003587.240.007148.050.004558.730.00313表7-11ν=1時的χ2界值表(供多個樣本率間的多重比用)第71頁/共86頁72例9對例6的資料進行兩兩比較,以推斷是否任兩種療法治療周圍性面神經麻痹的有效率均有差別?π1=π2,即任意兩對比組的總體有效率相等π1≠π2,即任意兩對比組的總體有效率不等α=0.05本例為3個實驗組間的兩兩比較第72頁/共86頁73表
三種療法有效率的兩兩比較拒絕H0,接收H1拒絕H0,接收H1不拒絕H0第73頁/共86頁74例10對例6資料的藥物治療組為對照組,物理療法組與外用膏藥組為試驗組,試分析兩試驗組與對照組的總體有效率有無差別?πT=πC,即各試驗組與對照組的總體有效率相等πT≠πC,即各試驗組與對照組的總體有效率不等α=0.05本例為各實驗組與同一對照組的比較第74頁/共86頁75物理療法組與藥物治療組比較:χ2=6.76,P<0.0125,外用膏藥組與藥物治療組比較:χ2=4.59,P>0.0125,按α=0.0125檢驗水準,物理療法組與藥物治療組拒絕H0,接受H1,可認為物理療法組與藥物治療組的總體有效率有差別;外用膏藥組與藥物治療組不拒絕H0,尚不能認為兩總體有效率有差別。
結合例7資料,物理療法的有效率高于藥物治療。第75頁/共86頁76小結基本公式不配對四格表和校正公式配對四格表公式一.公式第76頁/共86頁77二.χ2常解決的問題目的:比較組間率和構成比的差別
設計:抽自2個或多個獨立樣本目的:兩個變量間有無關系或關聯
設計
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025如何設計合同終止的條款
- 2025室內裝修施工勞務分包合同樣本
- 2025食品原料采購合同書
- 2025蘇州商品房買賣合同范本【打印】
- 2025工程設計合同模板
- 2025供暖系統管道改造合同
- 2025購銷合同(電子產品)范文
- 2025建筑項目工程總承包合同模板
- 2025合作協議與合同條款
- 2025租房消防安全責任合同書
- 基于全生命周期的綠色建筑成本影響因素研究
- 2025年普法知識競賽題庫及答案(共80題)
- 碎石外包合同協議
- 心力衰竭護理查房 課件
- 2025年國家糧食和物資儲備局垂直管理系事業單位招聘筆試參考題庫附帶答案詳解
- DB32-T 4281-2022 江蘇省建筑工程施工現場專業人員配備標準
- 自卸車整車裝配檢驗規范-ok
- 吸入裝置正確使用方法調查表
- 《異位骨化》PPT課件.ppt
- AS9100D2016產品設計和開發控制程序
- FX挑戰題梯形圖實例
評論
0/150
提交評論