生物統計附實驗設計2_第1頁
生物統計附實驗設計2_第2頁
生物統計附實驗設計2_第3頁
生物統計附實驗設計2_第4頁
生物統計附實驗設計2_第5頁
已閱讀5頁,還剩65頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第七章 次數資料分析 2檢驗 本章將分別介紹對次數資料、等級資料進行統計分析的方法。下一張 主 頁 退 出 上一張 第一節 2統計量與2分布 一、 2統計量的意義 為了便于理解,現結合一實例說明2 (讀作卡方) 統計量的意義。根據遺傳學理論,動物的性別比例是1:1。統計某羊場一年所產的876只羔羊中,有公羔428只,母羔448只。按1:1的性別比例計算,公、母羔均應為438只。以A表示實際觀察次數,T 表 示 理 論次數,可將上述情況列成表7-1。下一張 主 頁 退 出 上一張 表7-1 羔羊性別實際觀察次數與理論次數 下一張 主 頁 退 出 上一張 從表7-1看到 , 實際觀察次數與理論次數

2、存在一定的差異,這里公、母各相差10只。 這個差異是屬于抽樣誤差(把對該羊場一年所生羔羊的性別統計當作是一次抽樣調查)、還是羔羊性別比例發生了實質性的變化? 要回答這個問題, 首先需要確定一個統計量 用以表示實際觀察次數與理論次數偏離的程度; 然 后 判 斷這一偏離程度是否屬于抽樣誤差,即進行顯著性檢驗。 為了度量實際觀察次數與理論次數偏離的程度,最簡單的辦法是求出實際觀察次數與理論次數的差數。從表7-1看出:A1-T1 =-10,A2-T2=10,由于這兩個差數之和為0, 顯然不能用這兩個差數之和來表示實際觀察次數與理論次數的偏離程度。為了避免正、負抵消,可將兩個差數A1-T1、A2-T2

3、平 方 后 再 相 加 ,即計算(A-T)2,其值越大 ,實際觀察次數與理論次數相差亦越大 , 反之則越小 。 但 利 用 (A-T)2表示實際觀察次數與理論次數的偏離程度尚有 不 足 。例 如 某 一 組 實 際 觀 察 次 數為下一張 主 頁 退 出 上一張 505、理論次數為500,相差5;而另一組實際觀察次數為26、 理論次數為21,相差亦為5。顯然這兩組實際觀察次數與理論次數的偏離程度是不同的。因為前者是相對于理論次數500相差5,后者是相對于理論次數21相差5。為了彌補這一不足,可先將各差數平方除以相應的理論次數后再相加,并記之為2 ,即下一張 主 頁 退 出 上一張 (7-1)

4、也就是說2是度量實際觀察次數與理論次數偏離程度的一個統計量, 2越小,表明實際觀察次數與理論次數越接近; 2 =0,表示兩者完全吻合; 2越大,表示兩者相差越大。 對于表7-1的資料,可計算得 表明實際觀察次數與理論次數是比較接近的。 下一張 主 頁 退 出 上一張 二、2分布 上面在屬于離散型隨機變量的次數資料的基礎上引入了統計量2, 它近似地服從統計學中一種連續型隨機變量的概率分布2分布。下面對統計學中的2分布作一簡略介紹。 設有一平均數為、方差為 的正態總體。現從此總體中獨立隨機抽取n個隨機變量:x1、x2、xn,并求出其標準正態離差: , , , 下一張 主 頁 退 出 上一張 記這n

5、個相互獨立的標準正態離差的平方和為2 : (7-2) 它服從自由度為n的2分布,記為 2 (n); 下一張 主 頁 退 出 上一張 若用樣本平均數 代替總體平均數,則隨機變量 (7-3) 服從自由度為n-1的2分布,記為 下一張 主 頁 退 出 上一張 顯 然 ,20 , 即 2 的 取 值 范 圍 是0,+;2分布密度曲線是隨自由度不同而改變的一組曲線。隨自由度的增大, 曲線由偏斜漸趨于對稱;df30時, 接 近 平均數為 的正態分布。圖7-1 給出了幾個不同自由度的2概率分布密度曲線。 下一張 主 頁 退 出 上一張 三、的連續性矯正 由(7-1)式計算的2只是近似地服從連續型隨機變量2分

6、布。在對次數資料進行2檢驗利用連續型隨機變量2分布計算概率時,常常偏低,特別是當自由度為1時偏差較大。 Yates(1934)提出了一個矯正公式,矯正后的2值記為 : = (7-4) 下一張 主 頁 退 出 上一張 當自由度大于1時,(7-1)式的2分布與連續型隨機變量2分布相近似 ,這時,可不作連續性矯正 , 但 要 求各組內的理論次數不小于5。若某組的理論次數小于5,則應把它與其相鄰的一組或幾組合并,直到理論次數大 于5 為止。 下一張 主 頁 退 出 上一張 第二節 適合性檢驗 一、適合性檢驗的意義 判斷實際觀察的屬性類別分配是否符合已知屬性類別分配理論或學說的假設檢驗稱為適合性檢驗。下

7、一張 主 頁 退 出 上一張 在適合性檢驗中,無效假設為H0:實際觀察的屬性類別 分配符合已知屬性類別分配的理論或學說;備擇假設為HA:實際觀察的屬性類別 分 配 不符合已知屬性類別 分配的理論或學說。并在無效假設成立的條件下 ,按已知屬性類別分配的理論或學說計算 各屬性類別的理論次數。 因所計算得的各個屬性類別理論次數的總和應等于各個 屬性類別 實際 觀 察次數的總和, 即獨立的理論次數的個數等于屬性類別分下一張 主 頁 退 出 上一張 類數減1。 也就是說 ,適合性檢驗的自由度等于屬性類別分類數減 1 。若屬性類別分類數為k ,則適合性檢驗的自由度為 k-1 。然后根據(7-1)或(7-4

8、)式計算出2或2c。將所計算得的2或2c值與根據自由度k-1查2值表(附表8)所得的臨界2值:20.05、20.01比較:下一張 主 頁 退 出 上一張 若2 (或2c)20.05,P0.05,表明實際觀察次數與理論次數差異不顯著,可以認為實際觀察的屬性類別分配符合已知屬性類別分配的理論或學說; 若20.052 (或2c)20.01,0.01P0.05,表明實際觀察次數與理論次數差異顯著,實際觀察的屬性類別分配顯著不符合已知屬性類別分配的理論或學說; 若2 ( 或2c)20.01,P0.01,表明實際觀察次數與理論次數差異極顯著 ,實際觀察的屬性類別分配極顯著不符合已知 屬性類別分配的理論或學

9、說。 二、適合性檢驗的方法 下面結合實例說明適合性檢驗方法。 【例7.1】 在進行山羊群體遺傳檢測時,觀察了 260只白色羊與黑色羊雜交的子二代毛色,其中181只為白色,79只為黑色,問此毛色的比率是否符合孟德爾遺傳分離定律的31比例? 下一張 主 頁 退 出 上一張 檢驗步驟如下: (一)提出無效假設與備擇假設 H0:子二代分離現象符合31的理論比例。 HA:子二代分離現象不符合31的理論比例。 (二)選擇計算公式 由于本例是涉及到兩組毛色(白色與黑色),屬性類別分類數k=2,自由度df=k-1=2-1=1,須使用(74)式來計算 。下一張 主 頁 退 出 上一張 (三)計算理論次數 根據理

10、論比率31求理論次數: 白色理論次數:T1=2603/4=195 黑色理論次數:T2=2601/4=65 或 T2=260-T1=260-195=65 (四)計算 表72 2c計算表 下一張 主 頁 退 出 上一張 (五)查臨界2值,作出統計推斷 當自由度 df=1 時, 查 得 20.05(1) =3.84,計算的2c0.05,不能否定H0,表明實際觀察次數與理論次數差異不顯著,可以認為白色羊與黑色羊的比率符合孟德爾遺傳分離定律31的理論比例。 【例7.2】 在研究牛的毛色和角的有無兩對相對性狀分離現象時 ,用黑色無角牛和紅色有角牛雜交 ,子二代出現黑色無角牛192頭,黑色有角牛78頭,紅色

11、無角牛72頭,紅色有角牛18頭,共360頭。試 問這兩對性狀是否符合孟德爾遺傳規律中9331的遺傳比例?下一張 主 頁 退 出 上一張 檢驗步驟: (一)提出無效假設與備擇假設 H0:實際觀察次數之比符合9331的理論比例。 HA:實際觀察次數之比不符合9331的理論比例。 (二)選擇計算公式 由于本例的屬性類別分類數 k=4:自由 度df=k-1=4-1=31,故利用(71)式計算2。 (三)計算理論次數 依據各理論比例9:3:3:1計算理論次數: 黑色無角牛的理論次數T1:3609/16=202.5; 黑色有角牛的理論次數T2:3603/16=67.5; 紅色無角牛的理論次數T3:3603

12、/16=67.5; 紅色有角牛的理論次數T4:3601/16=22.5。 或 T4=360-202.5-67.5-67.5=22.5 (四)列表計算2 下一張 主 頁 退 出 上一張 表73 2計算表 =0.5444+1.6333+1.6333+0.9 =4.711 (五)查臨界2值,作出統計推斷 當df=3時,20.05(3)=7.81,因 20.05,不能否定H0 ,表明實際觀察次數與理論次數差異不顯著, 可以認為毛色與角的有無兩對性狀雜 交 二 代 的 分 離 現 象 符 合 孟 德 爾遺傳規律中9331的遺傳比例。 下一張 主 頁 退 出 上一張 第三節 獨立性檢驗 一、獨立性檢驗的意

13、義 對次數資料,除進行適合性檢驗外,有時需要分析兩類因子是相互獨立還是彼此相關。如研究兩類藥物對家畜某種疾病治療效果的好壞,先將病畜分為兩組,一組用第一種藥物治療,另一組用第二種藥物治療,然后統計每種藥物的治愈頭數和未治愈頭數。 這時需要分析藥物種類與療效是否相關,若兩者彼此相關,表明療效因藥物不同而異,即兩種藥物療效不相同;若兩者相互獨立,表明兩種藥物療效相同。這種根據次數資料判斷兩類因子彼此相關或相互獨立的假設檢驗就是獨立性檢驗。獨立性檢驗實際上是基于次數資料對子因子間相關性的研究。 下一張 主 頁 退 出 上一張 獨立性檢驗與適合性檢驗是兩種不同的檢驗方法,除了研究目的不同外,還有以下區

14、別: (一) 獨立性檢驗的次數資料是按兩因子屬性類別進行歸組。根據兩因子屬性類別數的不同而構成22、2c、rc列聯表(r 為行因子的屬性類別數, c 為 列 因子的屬性類別數)。而適合性檢驗只按某一因子的屬性類別將如性別、表現型等次數資料歸組。 (二)適合性檢驗按已知的屬性分類理論或學說計算理論次數。獨立性檢驗在計算理論次數時沒有現成的理論或學說可資利用,理論次數是在兩因子相互獨立的假設下進行計算。 (三)在適合性檢驗中確定自由度時,只有一個約束條件:各理論次數之和等于各實際次數之和,自由度為屬性類別數減1。而在rc列聯表的獨立性檢驗中,共有rc個理論次數,但受到以下條件的約束:下一張 主 頁

15、 退 出 上一張 1、rc個理論次數的總和等于rc個實際次數的總和; 2、r個橫行中的每一個橫行理論次數總和等于該行實際次數的總和 。 但由于r個橫行實際次數之和的總和應等于 rc 個實際次數之和 ,因而獨立的行約束條件只有r-1個; 3、類似地,獨立的列約束條件有c-1個。 因而在進行獨立性檢驗時,自由度為rc-1-(r-1)-(c-1)=(r-1)(c-1),即等于(橫行屬性類別數-1)(直列屬性類別數-1)。 二、獨立性檢驗的方法 (一)22列聯表的獨立性檢驗 22列聯表的一般形式如表710所示,其自由度 df=( c -1) (r-1)=(2-1) (2-1)=1,在進行2檢驗時,需作

16、連續性矯正,應計算 值。 下一張 主 頁 退 出 上一張 表710 22列聯表的一般形式下一張 主 頁 退 出 上一張 其中Aij為實際觀察次數,Tij為理論次數。 【例7.7】 某豬場用80頭豬檢驗某種疫苗是否有預防效果。結果是注射疫苗的44頭中有 12 頭發病,32頭未發病;未注射的36頭中有22頭發病,14頭未發病,問該疫苗是否有預防效果? 1、 先將資料整理成列聯表 表711 22列聯表 下一張 主 頁 退 出 上一張 2、 提出無效假設與備擇假設 H0:發病與否和注射疫苗無關,即二因子相互獨立。 HA:發病與否和注射疫苗有關,即二因子彼此相關。 3、 計算理論次數 根據二因子相互獨立

17、的假設,由樣本數據計算出各個理論次數。二因子相互獨立,就是說注射疫苗與否不影響發病率。也就是說注射組與未注射組的理論發病率應當相同,均應等于總發病率34/80=0.425=42.5%。依 此計算出各個理論次數如下: 注射組的理論發病數: T11=4434/80=18.7 注射組的理論未發病數: T12=4446/80=25.3, 或 T12=44-18.7=25.3; 未注射組的理論發病數: T21=3634/80=15.3, 或 T21=34-18.7=15.3; 未注射組的理論未發病數: T22=3646/80=20.7, 或 T22=36-15.3=20.7。下一張 主 頁 退 出 上一

18、張 從上述各理論次數Tij的計算可以看到,理論次數的計算利用了行、列總和, 總總和,4個理論次數僅有一個是獨立的。表7-11括號內的數據為相應的理論次數。 4、 計算 值 將表7-11中的實際次數、理論次數代入(74)式得: 5、 由自由度df=1查臨界2值,作出統計推斷 因 為 20.01(1) = 6 . 6 3 , 而 =7.94420.01(1),P0.01,否定H0,接受HA,表明發病率與是否注射疫苗極顯著相關,這里表現為注射組發病率極顯著低于未注射組,說明該疫苗是有預防效果的。 在進行22列聯表獨立性檢驗時,還可利用下述簡化公式(7-6)計算 :下一張 主 頁 退 出 上一張 (7

19、6) 在(7-6)式中, 不需要先計算理論次數,直接利用實際觀察次數Aij,行、列總和Ti.、T.j和總總和T.進行計算 ,比利用公式(7-4)計算簡便,且舍入誤差小。 對于【例7.7】,利用(7-6)式可得: 所得結果與前面計算計算的相同。 (二)2c列聯表的獨立性檢驗 2c列聯表是行因子的屬性類別數為2,列因子的屬性類別數為c(c3)的列聯表。其自由度d f = (2-1) (c -1) = (c-1),因為c3,所以自由度大于2,在進行2檢驗時,不需作連續性矯正。2c表的一般形式見表712。 下一張 主 頁 退 出 上一張 表712 2c聯列表一般形式下一張 主 頁 退 出 上一張 其中

20、(i=1,2;j=1,2,c)為實際觀察次數。 【例7.8】 在甲、乙兩地進行水牛體型調查,將體型按優、良、中、劣 四個等級分類,其結果見表713,問兩地水牛體型構成比是否相同。 下一張 主 頁 退 出 上一張 表713 兩地水牛體型分類統計下一張 主 頁 退 出 上一張 這是一個24列聯表獨立性檢驗的問題。 檢驗步驟如下: 1. 提出無效假設與備擇假設 H0:水牛體型構成比與地區無關,即兩地水牛體型構成比相同。 HA:水牛體型構成比與地區有關,即兩地水牛體型構成比不同。 2. 計算各個理論次數,并填在各觀察次數后的括號中 計算方法與22表類似,即根據兩地水牛體型構成比相同的假設計算。 如優等

21、組中,甲地、乙地的理論次數按理論比率20/135計算;良等組中,甲地、乙地的理論次數按理論比率15/135計算;中等、劣等組中,甲地、乙地的理論次數分別按理論比率80/135和20/135計算。下一張 主 頁 退 出 上一張 甲地優等組理論次數: T11=9020/135=13.3, 乙地優等組理論次數: T21=4520/135=6.7, 或T21=20-13.3=6.7; 其余各個理論次數的計算類似。 3.計算計算2值 4. 由自由度df=3查臨界2值,作出統計推斷 因 為 20.05(3) = 7 . 8 1 , 而2=7.5820.05,不能否定H0,可以認為甲、乙兩地水牛體型構成比相

22、同。 在進行2c列聯表獨立性檢驗時,還可利用下述簡化公式(7-7)或(7-8)計算 2: (77) 下一張 主 頁 退 出 上一張 或 (78) (7-7)與(7-8)式的區別在于: (7-7)式利用第一行中的實際觀察次數A1j和行總和T1.;(7-8)式利用第二行中的實際觀察次數A2j和行總和T2.,計算結果相同。對于例7.7利用(7-8)式計算2值得: 計算結果與利用(71)式計算的結果因舍入誤差略有不同。 此外,在畜牧、水產科學研究中,有時需將數量性狀資料以等級分類,如剪毛量分為特等、 一等、二等,產奶量分為高產與低產等,這些由數量性狀資料轉化為質量性狀的次數資料檢驗,也可用2檢驗。 【

23、例7.9】 分別統計了A、B兩個品種各67頭經產母豬的產仔情況,結果見表714,問A、B兩品種的產仔構成比是否相同? 下一張 主 頁 退 出 上一張 表714 A、B兩個品種產仔數的分類統計 1、提出無效假設與備擇假設 H0:A、B兩個品種產仔數分級構成比相同。 HA:A、B兩個品種產仔數分級構成比不同。 2、計算2值 用簡化公式(77)計算為:下一張 主 頁 退 出 上一張 3、由自由度df=(2-1)(3-1)=2查臨界2值,作出統計推斷 因為20.05(2)=9.21,2 20.01, P0.01,所以否定H0,接受HA , 表明A、B 兩品種產仔數構成比差異極顯著。需要應用2檢驗的再分割法來具體確定分級構成比差異在那樣的等級。 表715 21計算表 下一張 主 頁 退 出 上一張 4、 2檢驗的再分割法 (1) 先 對兩個品種產仔數在9頭以下和1012頭進行2檢驗,分割后的情況見表715。 利用簡化公式(7-7)計算21值為: 由df1=2-1=1,查2值表得:20.05(1)=3.841,因為210.05,表明這兩個品種的產仔數在9頭以

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論