第8章卡方檢驗_第1頁
第8章卡方檢驗_第2頁
第8章卡方檢驗_第3頁
第8章卡方檢驗_第4頁
第8章卡方檢驗_第5頁
已閱讀5頁,還剩52頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

(卡方)檢驗第八章問題一:一對因子遺傳實驗,白豬和黑豬雜交F2代260頭,181頭白豬,請問毛色分離是否受一對等位基因控制?問題二:某村近5年來出生112名男孩,88名女孩,請問該村近5年出生的男女比例是否失調?問題三:豬場為檢驗某種疫苗是否有預防效果,注射疫苗的豬44頭,有12頭發病;未注射疫苗豬有36頭其中發病的有22頭,請問該疫苗是否有預防效果?第一節χ2檢驗的原理χ2檢驗是通過提出某種假定的理論值與實際值進行比較,從而確定兩者的符合程度。適合性檢驗(testforgoodness-of-it)通常用于實際次數與理論次數之間的比較。獨立性檢驗(testforindependence)是研究兩類實驗因子之間相互獨立還是相互影響。

ui~N(0,1)n連續性數據的χ2定義一、χ2檢驗的原理不同自由度的概率密度的曲線次數資料的χ2定義其中:O-觀測次數E-理論次數

例青豆、黃豆(僅顏色不同)各1000粒混于小罐中,每次抽取100粒。第一次抽樣得青豆53粒,黃豆47粒;第二次抽樣得青豆42粒,黃豆58粒,分別求χ2值并比較兩次實驗值與理論值的符合程度。抽樣1所得次數值與理論值更相符合。卡方測驗為單尾測驗,對于一定的自由度,df=3若

則推斷為顯著;若則推斷為不顯著χ2的顯著性是相對于某一統計假設來說----獨立性測驗和適合性測驗近似服從χ2分布

χ2分布是連續性隨機變量的概率分布,而次數資料是間斷型的。χ2檢驗是右側檢驗觀察頻數與理論頻數相差越大,χ2值越大,只有大的χ2值才可能否定原假設,所以卡方檢驗始終是右側檢驗。

連續性矯正當資料的df=1和小樣本尤其是理論次數小于5的情況下,由連續型的x2分布推得的概率與真正概率差異較大,必須進行矯正。矯正后的x2值:二、χ2檢驗的一般步驟a.提出無效假設b.計算理論次數Ec.計算統計量

χ2值d.統計推斷例1一對因子遺傳實驗,觀察白豬和黑豬雜交仔二代260頭;其中有白豬181頭,黑豬79頭。問毛色分離是否受一對等位基因控制?1、H0:豬毛色F2分離符合3:1比率HA:不符合2、計算理論次數:白豬理論頭數:260×3/4=195

黑豬理論頭數:260×1/4=65一、實際資料與先驗理論的適合性檢驗第二節適合性檢驗3、列計算表:性狀實際次數(O)理論次數(E)白色181195黑色7965總和2602604、求值:5、查表:df=n-1=2-1=1(計算理論次數時受一個總數的限制)查表得,差異不顯著,表明實際次數與理論次數是符合的。本例如果不矯正,其結果:求得差異顯著,可推斷實際次數與理論次數是不符合的。可見當時矯正是很有必要的。性狀黑色無角黑色有角紅色無角紅色有角總數觀察次數(O論次數(E)140.62546.87546.87515.625250O-E11.375-7.8756.125-9.625例2兩對因子遺傳實驗,用黑色無角牛和紅色有角牛雜交仔二代出現黑色無角牛152頭,黑色有角牛39頭,紅色無角53頭,紅色有角6頭,共250頭。問兩對性狀分離是否符合9:3:3:1的遺傳比例?性狀黑色無角黑色有角紅色無角總數觀察次數(O)1523953244理論次數(E)146.448.848.8244O-E5.6-9.84.2P>0.05說明實際觀測次數與理論次數差異不顯著,3種表現型的分離符合獨立遺傳的分離比例9:3:3說明實際觀測次數與理論次數差異顯著,3種表現型組合與紅色有角比率不符合15:1的分離。性狀合并組紅色有角總數觀察次數(O)2446250理論次數(E)234.37515.625250O-E9.625-9.625例343窩小白鼠(N=43),每窩4只,經某劑量射線照射后14天內各窩死亡情況:全部成活的有13窩;死一只的有20窩;死2只的有7窩;死3只的有3窩;全部死亡的一窩沒有.檢驗射線照射后小白鼠死亡數是否服從二項分布。二、實際資料與理論分布相符合程度的適合性檢驗H0:小白鼠死亡數服從二項分布;HA:小白鼠死亡數不服從二項分布。每窩死亡只數x~B(4,p)平均死亡率為p=0.25n=4,每窩死亡的概率為:小白鼠死亡n+1種類型的概率:死亡數觀察窩數理論概率觀察窩數0130.316413.6051200.421918.141270.21099.068330.04692.016400.00390.167總4343df=3-2=1(5組合并成3組,計算理論次數時受一個總數和平均數的限制)校正公式計算:=0.05,2<20.05(1)=3.84,P>0.05,接受H0,射線照射后小白鼠的死亡數服從二項分布當實際次數分布以二項分布或波松分布配合時,由于每一理論次數受總次數和平均數np的限制,所以df=k-1-1注意將每一理論次數<5的組合并到>5的組,上述計算的df的k指合并后的組數根據處理及考察指標的多少分為不同的兩向列聯表獨立性測驗又叫次數資料的相依性檢驗。它是檢驗兩個方向上的數據資料的表現是相互獨立的還是相互影響的一種統計分析方法。第三節獨立性檢驗列聯表處理類別合計12…k1O11O12…O1KR12O21O22…O2KR2………………rOr1Or2…OrKRr合計C1C2…CKGk是變量的類別數,r是處理的個數自由度總自由度(rk-1)減去行自由度(r-1)減去列自由度(k-1)df=(rk-1)-(r-1)-(k-1)=(r-1)(k-1)一、2×2列聯表的檢驗【例1】某豬場用80頭豬檢驗某種疫苗是否有預防效果。結果是注射疫苗的44頭中有12頭發病,32頭未發病;未注射的36頭中有22頭發病,14頭未發病,問該疫苗是否有預防效果?

1、提出無效假設與備擇假設H0:發病與否和注射疫苗無關,即二因子相互獨立。HA:發病與否和注射疫苗有關,即二因子彼此相關。

2、計算理論次數根據二因子相互獨立的假設,注射疫苗與否不影響發病率。也就是說注射組與未注射組的理論發病率應當相同,均應等于總發病率34/80=0.425=42.5%。注射組的理論發病數:

T11=44×34/80=18.7注射組的理論未發病數:

T12=44×46/80=25.3,

或T12=44-18.7=25.3;未注射組的理論發病數:T21=36×34/80=15.3,或T21=34-18.7=15.3;未注射組的理論未發病數:

T22=36×46/80=20.7,或T22=36-15.3=20.7。從上述各理論次數Tij的計算可以看到,理論次數的計算利用了行、列總和,總總和,4個理論次數僅有一個是獨立的。自由度為1,應選擇矯正的統計量。3、計算統計量:4、查自由度df=1的2臨界值,作出統計推斷

因為20.01(1)=6.63,=7.944>20.01(1),P<0.01,否定H0,接受HA,表明發病率與是否注射疫苗極顯著相關,這里表現為注射組發病率極顯著低于未注射組,說明該疫苗是有預防效果的。

2*2列聯表計算卡方值的簡化形式(N≥40):治療方法發病未發病行總和發病率注射12(a)(18.7)32(b)(25.3)44(TR1)27.3%未注射22(c)(15.3)14(d)(20.7)36(TR2)61.1%列總和34(Tc1)46(Tc2)80(T)

治療方法發病未發病行總和發病率注射12324427.3%未注射22143661.1%列總和344680例2:在甲、乙兩地區進行水牛體型調查,將牛的體型按優、良、中、劣四個等級分類,其結果見下表,試問兩地區間水牛體型有無差異?優良中劣總和甲10(13.3)10(10.0)60(53.3)10(13.4)90乙10(6.7)5(5.0)20(26.7)10(6.6)45總和20158020135地區體型2*c表獨立性檢驗1.提出無效假設與備擇假設H0:水牛體型構成比與地區無關,即兩地水牛體型構成比相同。HA:水牛體型構成比與地區有關,即兩地水牛體型構成比不同。

3.計算2值2.計算各個理論次數

4.查自由度df=3的2臨界值,作出統計推斷

因為20.05(3)=7.812=7.582<20.05(3),p>0.05,不能否定H0,可以認為甲、乙兩地水牛體型構成比相同。

或在進行2×c列聯表獨立性檢驗時,可利用下述簡化公式:利用第2個簡化式計算2值:

優良中劣總和甲1010601090乙105201045總和20158020135【例】分別統計了A、B兩個品種各67頭經產母豬的產仔情況,結果見下表,問A、B兩品種的產仔構成比是否相同?A、B兩個品種產仔數的分類統計

H0:A、B兩個品種產仔數分級構成比相同。HA:A、B兩個品種產仔數分級構成比不同。2、計算2值

用簡化公式計算得:

1、提出無效假設與備擇假設3、自由度df=(2-1)(3-1)=2,查臨界2值,作出統計推斷

因為20.05(2)=9.21,2>

20.01,P<0.01,所以否定H0,接受HA。表明A、B兩品種產仔數構成比差異極顯著。需要應用2檢驗的再分割法來具體確定分級構成比差異在那樣的等級。表7—1521計算表4、2檢驗的再分割法(1)先對兩個品種產仔數在9頭以下和10—12頭進行2檢驗,分割后的情況如下:利用簡化公式計算21值為:由df1=2-1=1,查2值表得:20.05(1)=3.841,因為21<

20.05(1),P>0.05,表明這兩個品種的產仔數在9頭以下和10—12頭這兩個級別內的比率差異不顯著。利用簡化公式計算22值為:(2)對產仔數在13頭以上組與其他合并組(即9頭以下和10—12頭兩個組的合并)進行2檢驗,分割后見下表。由df2=2-1=1,查2值表得:

20.05(1)=3.84,20.01(1)=6.63,21<20.05,表明A、B兩品種在9頭以下和10-12頭組之間沒有顯著差異。22>20.01(1),P<0.01,表明這兩個品種的產仔數在合并組與13頭以上組的比率差異極顯著。B品種產仔數在13頭以上的比率(29/67=42.38%)極顯著高于A品種產仔數在13

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論