卡方檢驗1課件學習資料_第1頁
卡方檢驗1課件學習資料_第2頁
卡方檢驗1課件學習資料_第3頁
卡方檢驗1課件學習資料_第4頁
卡方檢驗1課件學習資料_第5頁
已閱讀5頁,還剩33頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第九章χ2

檢驗(1)

chi-squaretest1學習目標1.掌握χ2檢驗的主要用途;2.熟悉χ2檢驗的基本思想;3.熟悉χ2檢驗分布和擬合優度檢驗;4.掌握獨立樣本2х2資料χ2檢驗專用公式、校正公式條件2χ2檢驗的主要用途x2檢驗(chi-squaretest)是以x2分布為理論依據,用途頗廣的假設檢驗方法。可用于:兩個或多個樣本率的比較;兩個或多個樣本構成比的比較;兩個分類變量間關聯性的檢驗;有序分組資料的線性趨勢檢驗;頻數分布的擬合優度檢驗。3一、檢驗的基本思想分布的概念檢驗的基本思想

P

值的確定檢驗的基本檢驗步驟4

分布的拓展與應用

1875年,F.Helmet得出:來自正態總體的樣本方差的分布服從分布;1900年K.Pearson又從檢驗分布的擬合優度(goodnessoffit)中也發現了這一相同的分布,可用于檢驗資料的實際頻數和理論頻數是否相符等問題。卡方檢驗基本思想分布的概念6

分布的密度函數7卡方檢驗基本思想分布的概念

分布曲線8卡方檢驗基本思想分布的概念分布曲線9

分布的形狀依賴于自由度ν的大小:①當自由度ν≤2時,曲線呈“L”型;②隨著ν的增加,曲線逐漸趨于對稱;③當自由度ν→∞時,曲線逼近于正態曲線。

④當ν=1時,分布與標準正態分布(Z分布)一致。卡方檢驗基本思想分布的概念分布特點102.檢驗的基本思想(以兩個樣本率的比較為例)例9-2將病情相似的169名消化道潰瘍患者隨機分成兩組,分別用洛賽克和雷尼替丁治療,4周后療效見下表。問兩種藥物治療消化道潰瘍的愈合率有無差別?卡方檢驗基本思想11四格表(Fourfoldtable)在上例中,的數據是基本的,其余數據都是由以上四個數據計算出來的。這四個數叫實際頻數,簡稱實際數(actualfreqency,A)6421513312

對于洛賽克組的64人,按照合并愈合率Pc=68.05%治療的話,理論上:64×68.05%=57.84人愈合,用T11表示,未愈合:T12=85-57.84=27.16對于雷尼替丁組:愈合:T21=115-57.84=57.16未愈合:T22=54-27.16=26.84理論頻數(theoreticalfreqency,T)Tij表示第i行第j列的理論數。計算公式為:

ni表示i行的合計數mj表示j列的合計數13經推導:

★實際數與理論數的差別等價于兩樣本率的差別,因此,★對實際數與理論數差值的假設檢驗等價于對兩樣本率差值的假設檢驗1415由χ2的計算可見,χ2檢驗的基本思想是:Χ2值反映了實際數與理論數相吻合的程度。如果檢驗假設H0成立,則A=T,現A≠T可能原因(1)抽樣誤差造成(2)來自不同總體若為(1),則A與T差別不會很大,出現大的Χ2值的可能性很小,當p≤α,就懷疑假設H0,因而拒絕;反之,當

p>α,則無理由拒絕。16分類資料χ2檢驗的自由度問題:對于χ2值,不可能出現負值,χ2值的大小會隨著格子數的增加而增大,因此應當消除格子數不同對χ2值的影響。

在周邊合計固定不變的情況下,可以自由取值的格子數。υ=(行數-1)(列數-1)本例中四格表的自由度為υ=(2-1)(2-1)=1

17

分布的分位數(Percentile)當ν確定后,分布曲線下右側尾部的面積為

時,橫軸上相應的值,記為,如下圖。實際應用時,可根據ν由界值表(percentagepointsofthedistribution)查得。卡方檢驗基本思想分布的概念183、查χ2界值表,確定P值,作出結論

查P482附表8

根據自由度和事先確定的檢驗水準,查得對應的χ2界值。作出判斷結論,

χ2值越大,概率P越小,P越小越有理由拒絕H0,越有理由認為有統計學意義。19(1)建立檢驗假設H0:π1=π2兩藥的愈合率相同H1:π1≠π2兩藥愈合率不同檢驗水準

=0.05(2)計算檢驗統計量20自由度

=(2-1)(2-1)=1(3)確定p值,結論:查附表8,

=1對應的臨界值,P<0.025。按

=0.05拒絕H0,兩樣本頻率的差別具有統計學意義。可以認為,洛賽克的愈合率高于雷尼替丁的愈合率。21對于四格表資料,四格表專用公式

22

當n≥40時,如果有某個格子出現1≤T<5,一般需用校正公式23(1)建立檢驗假設H0:π1=π2,兩法總體緩解概率相同H1:π1≠π2兩法總體緩解概率不同檢驗水準

=0.05例9-3將病情相似的淋巴系腫瘤患者隨機分成兩組,分別做單純化療與復合化療,兩組的緩解率見表9-4,問兩療法的總體緩解率是否不同?24組別屬性合計緩解率(%)緩解未緩解單純化療2(4.8)10(7.2)12(固定值)16.7復合化療14(11.2)14(16.8)28(固定值)50.0合計16244040.0表9-4兩組療法的緩解率比較252)計算檢驗統計量

=(2-1)(2-1)=13)確定P值:

P>0.1,高于檢驗水準

,不能拒絕H0,差別無統計學意義,尚不能認為兩種治療方案的總體緩解概率不同。

26特別注意:

當四格表出現T<1或n<40時,校正

2值也不恰當,這時必須用四格表的確切概率計算法。

27

四格表χ2檢驗的條件

(1)當n≥40且每格T≥5時,用基本公式或四格表專用公式;(2)當n≥40但有1≤T<5時,用校正公式;(3)當n<40或有T<1時,不能應用χ2檢驗,改用確切概率法。28五、頻數分布擬合優度的檢驗由于Pearson值能反映實際頻數和理論頻數的吻合程度,所以檢驗可用于推斷頻數分布的擬合優度(goodnessoffit),即推斷某現象頻數分布是否符合某理論分布,且應用廣泛。如正態分布,二項分布,Poisson分布,負二項分布等均可應用檢驗進行推斷。

(Testaboutgoodnessoffitforthefrequencydistribution)

29H0:本資料服從×××分布;H1:本資料不服從×××分布;(1)先假設H0成立,按特定分布的規律(概率函數)計算理論頻數,進而計算值。(2)若值小,可認為現有資料服從某一分布;若值大,尚不能認為現有資料服從某一分布。自由度=K-參數個數-1K:組段數參數個數:正態分布和二項分布有2個參數,poisson分布有1個30例9-1對數據作正態分布擬合優度檢驗。120名男孩身高的測量值,均數=139.48cm;標準差=7.30cm檢驗的假設:H0:總體分布等于均數為139.48cm,標準差為7.30cm的正態分布H1:總體分布不等于該正態分布

=0.0531表9-1120例男孩身高測量值頻數分布表及擬合優度檢驗統計量的計算組段(1)實際頻數A(2)Φ(X1)(3)Φ(X2)(4)P(X)(5)T=n×P(X)(6)(A—T)2/T(7)122.0―50.008320.032040.024082.89001.54053126.0―80.032400.097040.064637.75570.00769130.0―100.097040.226420.1293915.52631.96698134.0―220.226420.419670.1932523.18980.06104138.0―330.419670.635030.2153625.84331.98188142.0―200.635030.814110.1790821.48980.10328146.0―110.814110.925220.1111113.33310.40827150.0―60.925220.976650.051436,17170.00477154.0―50.976650.994410.017762.13093.86289合計120————9.9373332

表9-1中第3列、第4列正態分布函數值可通過對作標準正態變換后查正態分布表或利用相應的SAS程序得到,第5列為第4列與第3列的差值,第6列理論頻數T等于總例數120與各組段概率的乘積,第7列各數之和即檢驗統計量

2值。

33計算統計量:推斷結論:自由度=10-1-2=7,查附表8,得到P>0.50,可以認為該樣本服從正態分布。

計算TI時的參數有2個(均數和標準差)34例調查者欲觀察某克山病區克山病患者的空間分布,將該區劃分為279個取樣單位,統計各取樣單位歷年累計病例數,資料見下表第(1)、(2)欄,問此資料是否服從Poisson分布?本例,,均數與方差相近,可試擬合Poisson分布。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論