第四章 假設檢驗_第1頁
第四章 假設檢驗_第2頁
第四章 假設檢驗_第3頁
第四章 假設檢驗_第4頁
第四章 假設檢驗_第5頁
已閱讀5頁,還剩100頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第四章第四章 統計假設測驗統計假設測驗 統計假設測驗的基本原理統計假設測驗的基本原理 平均數的假設測驗平均數的假設測驗 二項資料的百分數假設測驗二項資料的百分數假設測驗 參數的區間估計參數的區間估計第一節第一節 統計假設測驗的基本原理統計假設測驗的基本原理 統計推斷的概念統計推斷的概念 假設測驗假設測驗 參數估計參數估計 如某地進行了兩個水稻品種對比試驗,在相同條件下,如某地進行了兩個水稻品種對比試驗,在相同條件下,兩個水稻品種分別種植兩個水稻品種分別種植1010個小區,獲得兩個水稻品種個小區,獲得兩個水稻品種的平均產量為的平均產量為: : 我們能否根據我們能否根據 就判定這兩就判定這兩個水稻

2、品種平均產量不同?結論是,不一定。個水稻品種平均產量不同?結論是,不一定。5101y5002y1021yy因為兩個水稻品種平均產量因為兩個水稻品種平均產量 、都、都是從試驗種植的是從試驗種植的1010個小區獲得,僅是兩個品種個小區獲得,僅是兩個品種有關總體平均數有關總體平均數 的估計值。由于存在的估計值。由于存在試驗誤差試驗誤差 ,樣本平均數并不等于總體平均數,樣本平均數并不等于總體平均數 ,樣本平均數包含總體平均數與試驗誤差二部分,樣本平均數包含總體平均數與試驗誤差二部分,即即12, 1y2y111y222y 于是,于是, 其中,其中, 為為試驗的表面差異試驗的表面差異, 為為試驗的真實差異

3、試驗的真實差異, 為為試驗誤差試驗誤差。12()()(212121yy)(21yy )(21表明,試驗的表面差異表明,試驗的表面差異 是由兩部分組成:是由兩部分組成: 一部分是試驗的真實差異一部分是試驗的真實差異 ; 另一部分是試驗誤差另一部分是試驗誤差 。 雖然真實差異雖然真實差異 未知,但試驗的表面差異未知,但試驗的表面差異 是可以計算的,借助數理統計方法可以對試驗是可以計算的,借助數理統計方法可以對試驗誤差作出估計。所以,可將試驗的表面差異誤差作出估計。所以,可將試驗的表面差異 與與試驗誤差相比較間接推斷真實差異試驗誤差相比較間接推斷真實差異 是否存在,是否存在,即進行差異顯著性檢驗。即

4、進行差異顯著性檢驗。12()12()12()12()(21yy )(21yy )(21yy 顯著性檢驗的目的在于判明,試驗的表面顯著性檢驗的目的在于判明,試驗的表面差異差異 主要是由試驗的真實差異主要是由試驗的真實差異 造成的,還是由試驗誤差造成的,還是由試驗誤差 造成的,從而得造成的,從而得到可靠的結論。到可靠的結論。12()12()(21yy 二、顯著性檢驗的步驟二、顯著性檢驗的步驟【例【例4 41 1】已知某品種玉米單穗重】已知某品種玉米單穗重N N(300300,9.59.52 2)即單穗重總體平均數)即單穗重總體平均數 300g300g,標準差,標準差9.5g9.5g。在種植過程中噴

5、灑了某種藥劑的植株中隨機抽。在種植過程中噴灑了某種藥劑的植株中隨機抽取取9 9個果穗個果穗 ,測得平均單穗重,測得平均單穗重 308g308g,試問這,試問這種藥劑對該品種玉米的平均單穗重有無真實影響?種藥劑對該品種玉米的平均單穗重有無真實影響?0yy (一)提出假設(一)提出假設 首先對樣本所在的總體作一個假設。假設噴灑了首先對樣本所在的總體作一個假設。假設噴灑了藥劑的玉米單穗重總體平均數與原來的玉米藥劑的玉米單穗重總體平均數與原來的玉米單穗重總體平均數之間沒有真實差異即單穗重總體平均數之間沒有真實差異即或或 。也就是假設表面差異。也就是假設表面差異 是由抽樣誤差造成的。是由抽樣誤差造成的。

6、000 0)(0y這種假設通常稱為這種假設通常稱為無效假設或零假設無效假設或零假設, ,記為記為 。 無效假設是待檢驗的假設,它有可能被接受,也有可能被否定。無效假設是待檢驗的假設,它有可能被接受,也有可能被否定。 相應地還要有一個對應假設,相應地還要有一個對應假設, 稱為備擇假設。備擇假設是稱為備擇假設。備擇假設是在無效假設被否定時在無效假設被否定時 ,準備接受的假設,記為,準備接受的假設,記為 通過檢驗,若否定無效假設,我們就接受備擇假設。通過檢驗,若否定無效假設,我們就接受備擇假設。00:H000:AH (二)計算概率(二)計算概率 在假定無效假設成立的前提下,根據所檢驗的統在假定無效假

7、設成立的前提下,根據所檢驗的統計數的抽樣分布計數的抽樣分布 ,計算表面差異,計算表面差異 是由抽樣誤差造成的概率。是由抽樣誤差造成的概率。 本例是在假定無效假設本例是在假定無效假設 成立的前提成立的前提下下,研究在研究在 y N(300,9.52)這一已知正態總)這一已知正態總體中抽樣所獲得的樣本平均數的分布。體中抽樣所獲得的樣本平均數的分布。00:H)(0y 第三章已述及,若第三章已述及,若 ,則樣本,則樣本數數 , , ,將其標準化,將其標準化,得得 本例,本例, 得得9.5g),(2Ny),(2yyNyynynyyyuyyy0ggyn300,308,90526. 295 . 930030

8、80nyu下面估計下面估計|u|2.526的兩尾概率,即估計的兩尾概率,即估計P(|u|2.526)是多少?)是多少? 我們知道,兩尾概率為我們知道,兩尾概率為0.05的臨界值為的臨界值為 =1.96兩尾概率為兩尾概率為0.01的臨界值為的臨界值為 =2.58,即:,即:0.01uP(| |1.96)= P( 1.96)+ P( -1.96)=0.05 0.05uuuu P P(| | |2.582.58)= = P P( 2.582.58)+ + P P( -2.58-2.58)=0.01=0.01uuu根據樣本數據計算所得的值為根據樣本數據計算所得的值為2.5262.526,介于兩個臨界,

9、介于兩個臨界 值之間,即:值之間,即: 2.5262.526u0 .0 5u0.01u所以,所以,| |2.526| |2.526的概率的概率P P介于介于0.010.01和和0.050.05之間,即之間,即 0.01 0.01 p p 0.050.05 說明假定表面差異說明假定表面差異 是由抽樣誤差造成是由抽樣誤差造成的概率在的概率在0.010.01 0.05 0.05之間。之間。u)(0y ( (三三) )統計推斷統計推斷 統計推斷:統計推斷:是指用一個或一系列樣本的結果去估計總體可能的是指用一個或一系列樣本的結果去估計總體可能的結果的過程。統計推斷基本上包括兩大部分的內容,一是假設結果的

10、過程。統計推斷基本上包括兩大部分的內容,一是假設測驗,二是參數估計。測驗,二是參數估計。假設測驗假設測驗:判斷統計假設是否正確的過程稱為假設測驗。即判斷統計假設是否正確的過程稱為假設測驗。即 :先先作無效假設再依據該假設概率大小來判斷接受或否定該假設的作無效假設再依據該假設概率大小來判斷接受或否定該假設的過程。過程。 根據小概率事件實際不可能性原理作出否定或根據小概率事件實際不可能性原理作出否定或接受無效假設的推斷。接受無效假設的推斷。 根據這一原理根據這一原理 ,當表面差異是抽樣誤差的,當表面差異是抽樣誤差的概率小于概率小于0.050.05時時 ,可以認為在一次抽樣中表面差異,可以認為在一次

11、抽樣中表面差異是抽樣誤差實際上是不可能的,因而否定原先所作是抽樣誤差實際上是不可能的,因而否定原先所作的無效假設的無效假設H H0 0: ,接受備擇假設,接受備擇假設H HA A: , 即認為存在真實差異。即認為存在真實差異。 當表面差異是抽樣誤差的概率大于當表面差異是抽樣誤差的概率大于0.050.05時,時,說明無效假設說明無效假設H H0 0: 成立的可能性大,成立的可能性大,不能被否定,因而也就不能接受備擇假設不能被否定,因而也就不能接受備擇假設H HA A: 0000顯著性檢驗的結果表明:顯著性檢驗的結果表明: 本例的樣本平均數與原總體平均數之間的表本例的樣本平均數與原總體平均數之間的

12、表面差異面差異 除包含抽樣誤差外,還包含真實差除包含抽樣誤差外,還包含真實差異(異( ) , 即噴灑了藥劑的玉米單穗重即噴灑了藥劑的玉米單穗重總體平均數總體平均數 與原來的玉米單穗重總體平均數與原來的玉米單穗重總體平均數 不同。不同。00)(0y 綜上所述,顯著性檢驗,從提出無效假設與備擇假綜上所述,顯著性檢驗,從提出無效假設與備擇假設,到根據小概率事件實際不可能性原理來否設,到根據小概率事件實際不可能性原理來否定或接受無效假設,這一過程實際上是應用所定或接受無效假設,這一過程實際上是應用所謂謂“概率性質的反證法概率性質的反證法”對樣本所屬總體所作對樣本所屬總體所作的無效假設的統計推斷。的無效

13、假設的統計推斷。 上述顯著性檢驗利用了上述顯著性檢驗利用了 分布來估計出分布來估計出u2.526u2.526的兩尾概率,所以稱為的兩尾概率,所以稱為 檢驗檢驗. . uu三、顯著水平與兩種類型的錯誤三、顯著水平與兩種類型的錯誤 ( (一一) )顯著水平顯著水平 用來否定或接受無效假設的概率標準叫顯著水用來否定或接受無效假設的概率標準叫顯著水平,記作。平,記作。 在生物學研究中常取在生物學研究中常取=0.05=0.05,稱為,稱為 5% 5% 顯著水平;顯著水平; 或或=0.01=0.01,稱為,稱為1% 1% 顯著水平或極顯著水平。顯著水平或極顯著水平。 對于上述例子的檢驗來說,若對于上述例子

14、的檢驗來說,若uu1.96 1.96 ,則說明試驗的表面差異屬于試驗誤差的概率則說明試驗的表面差異屬于試驗誤差的概率p p0.050.05,即表面差異屬于試驗誤差的可能性大,不能否定即表面差異屬于試驗誤差的可能性大,不能否定。統計學上把這一檢驗結果表述為:。統計學上把這一檢驗結果表述為: “ “總體平均總體平均數數 與差異不顯著與差異不顯著”,在計算所得的,在計算所得的 u u 值的右值的右上方標記上方標記“”或不標記符號;或不標記符號;u00:H0ns若若|,則說明試驗的表面差異,則說明試驗的表面差異屬于試驗誤差的概率屬于試驗誤差的概率p在在0.010.05之間,即之間,即0.01p0.05

15、,表面差異屬于試驗誤差的可能性,表面差異屬于試驗誤差的可能性較小,應否定較小,應否定H0:,接受:,接受HA:。統:。統計學上把這一檢驗結果表述為:計學上把這一檢驗結果表述為:“總體平均總體平均與與 差異顯著差異顯著 ”1.96u2.58000u若若|2.58,則說明試驗的表面差異屬于試驗,則說明試驗的表面差異屬于試驗誤差的概率誤差的概率 p 不超過不超過 0.01 ,即,即 p 0.01 ,表面差異,表面差異屬于試驗誤差的可能性更小,應否定屬于試驗誤差的可能性更小,應否定H0:,接,接受受HA:。統計學上把這一檢驗結果表述為:。統計學上把這一檢驗結果表述為: “總體平均數總體平均數與與差異極

16、顯著差異極顯著 ” , 在計算所得在計算所得的的 值的右上方標記值的右上方標記“* *”。u000u可以看到,是否否定無效可以看到,是否否定無效假設假設 ,是用實際計算出的檢驗統計數的是用實際計算出的檢驗統計數的 絕對值與顯著水平絕對值與顯著水平對應的臨界值比較:對應的臨界值比較: 若若| |,則在,則在 水平上否定水平上否定 若若| | | ,則不能在,則不能在 水平上否水平上否定定 。00:Huu uuuu00:H00:H 區間區間 和和 稱為水平稱為水平 上的上的否定域否定域,而區間而區間 則稱為則稱為 水平上的水平上的接受接受域域。 , u ,u(,)uu因為在顯著性檢驗中,否定或接受

17、無效假因為在顯著性檢驗中,否定或接受無效假設的依據是設的依據是“小概率事件實際不可能性原理小概率事件實際不可能性原理”,所以我們下的結論不可能有百分之百的把握。所以我們下的結論不可能有百分之百的把握。 顯著性檢驗可能出現兩種類型的錯誤:顯著性檢驗可能出現兩種類型的錯誤:型錯誤型錯誤 與與型錯誤。型錯誤。 型錯誤又稱為錯誤,就是把非真實的差異型錯誤又稱為錯誤,就是把非真實的差異錯判為是真實的差異,即實際上錯判為是真實的差異,即實際上H0正確,檢驗結果正確,檢驗結果為否定為否定H0。犯犯類型錯誤的可能性一般不會超過所類型錯誤的可能性一般不會超過所選用的顯著水平;選用的顯著水平;型錯誤又稱為錯誤型錯

18、誤又稱為錯誤 ,就是把真實的差異,就是把真實的差異錯判為是非真實的差異錯判為是非真實的差異 ,即實際上,即實際上H HA A正確,檢驗正確,檢驗結果卻未能否定結果卻未能否定H H0 0 。 犯犯類型錯誤的可能性記為類型錯誤的可能性記為, ,一般是隨著一般是隨著 的減小或試驗誤差的增的減小或試驗誤差的增大而增大,所以大而增大,所以 越小或試驗誤差越大,越小或試驗誤差越大,就越容易將試驗的真實差異錯判為試驗誤差。就越容易將試驗的真實差異錯判為試驗誤差。00 顯著性檢驗的兩類錯誤歸納如下:顯著性檢驗的兩類錯誤歸納如下:表表4-1 4-1 顯著性檢驗的兩類錯誤顯著性檢驗的兩類錯誤 因此,如果經因此,如

19、果經 檢驗獲得檢驗獲得“差異顯著差異顯著”或或“差差異極顯著異極顯著”,我們有,我們有95%或或99%的把握認為,的把握認為, 與與 不相同,不相同, 判斷錯誤的可能性不超過判斷錯誤的可能性不超過5%或或1% ; 若經若經 檢驗獲得檢驗獲得 “差異不顯著差異不顯著”, 我們只能認為在本次試我們只能認為在本次試驗條件下,驗條件下, 與與 沒有差異的假設沒有差異的假設 H0: 未被否定,這有兩種可未被否定,這有兩種可能存在:能存在: 或者是或者是 與與 確實沒有差異,確實沒有差異, 或者是或者是 與與 有差異而因為試驗誤差大被掩蓋了。有差異而因為試驗誤差大被掩蓋了。uu00000 為了降低犯兩類錯

20、誤的概率,一般從為了降低犯兩類錯誤的概率,一般從選取適當的選取適當的顯著水平顯著水平和和增加試驗重復次數增加試驗重復次數來考慮。因為選取來考慮。因為選取數值小的顯著水平數值小的顯著水平 值可以降低犯值可以降低犯類型錯誤的概率,類型錯誤的概率,但與此同時也增大了犯但與此同時也增大了犯型錯誤的概率,所以顯著水型錯誤的概率,所以顯著水平平 值的選用要同時考慮到犯兩類錯誤的概率的大小。值的選用要同時考慮到犯兩類錯誤的概率的大小。n 對于田間試驗,由于試驗條件不容易控制對于田間試驗,由于試驗條件不容易控制完全一致,試驗誤差較大,完全一致,試驗誤差較大, 為了降低犯為了降低犯型錯型錯誤的概率,也有選取顯著

21、水平為誤的概率,也有選取顯著水平為0.100.10或或0.200.20的的(注意,在選用這些顯著水平值時,一定要予(注意,在選用這些顯著水平值時,一定要予以注明)。以注明)。 通常采用適當增加試驗處理的重復通常采用適當增加試驗處理的重復次數(即樣本容量),次數(即樣本容量), 以降低試驗誤差,提高以降低試驗誤差,提高試驗的精確度,試驗的精確度, 降低犯降低犯型錯誤的概率。型錯誤的概率。在【例在【例41】中,對應于無效假設】中,對應于無效假設 H0:備擇假設為備擇假設為HA: HA實際上包含了實際上包含了 或或 這兩種情況。此時,在這兩種情況。此時,在 水平上否定域為水平上否定域為和,對稱地分配

22、在分布曲線的兩側和,對稱地分配在分布曲線的兩側 尾部,每側尾部的概率為尾部,每側尾部的概率為 ,這種,這種利用兩尾概率利用兩尾概率進行的檢驗叫兩尾檢驗進行的檢驗叫兩尾檢驗. 為為 水平兩尾檢驗的臨水平兩尾檢驗的臨界值。界值。四、兩尾檢驗與一尾檢驗四、兩尾檢驗與一尾檢驗000, u ,uu/ 2u0u兩尾測驗示意圖兩尾測驗示意圖0.000.010.02285300270255y0.03315330345fN (y)接受區域95%否定區域否定區域2.5%2.5%否定區域否定區域2.5%2.5%270.6329.4兩尾檢驗的目的在于判斷兩尾檢驗的目的在于判斷 與與 有無差異,有無差異,而不考慮而不考

23、慮 與與 誰大誰小。誰大誰小。00在有些情況下兩尾檢驗不一定符合實際情況。在有些情況下兩尾檢驗不一定符合實際情況。例如,目前我國大豆育種工作者認為,大豆籽粒例如,目前我國大豆育種工作者認為,大豆籽粒蛋白質含量超過蛋白質含量超過45%( )的品種為高蛋白品種。如)的品種為高蛋白品種。如果進行樣品含量檢測果進行樣品含量檢測 ,我們關心的是,我們關心的是 所在的總體平所在的總體平均數均數 大于大于 。 此時的無效假設仍為此時的無效假設仍為H0: ,但備擇假設則為,但備擇假設則為HA: 。 這時否定域位于這時否定域位于 分布曲線的右分布曲線的右尾,即尾,即 。 例如當例如當 =0.05時,否定域為時,

24、否定域為 。0 x000u,)u1.64,)又如,國家規定稻米中某種農藥成分的殘留物又如,國家規定稻米中某種農藥成分的殘留物含量應低于含量應低于0.1%( )。在抽檢中,我們關心的是)。在抽檢中,我們關心的是 所在的總體平均數所在的總體平均數 小于小于 (即該品種屬于合格產(即該品種屬于合格產品)。此時的無效假設仍為品)。此時的無效假設仍為H0: ,但備擇假設,但備擇假設則為則為HA: 。這。這 時時 否否 定定 域域 位位 于于 分分 布布 曲曲 線線 的左尾即的左尾即 例如當例如當 =0.05時,時, 分布的否定分布的否定域為域為0000 u(,u u(, 1.64 y 這種利用一尾概率進

25、行的檢驗叫一尾檢驗這種利用一尾概率進行的檢驗叫一尾檢驗 。此。此時時 為一尾檢驗的臨界為一尾檢驗的臨界 值。值。 一尾檢驗的一尾檢驗的 = =兩尾檢驗的兩尾檢驗的 uuu2u例如,例如,一尾檢驗的一尾檢驗的= =兩尾檢驗的兩尾檢驗的 =1.64=1.64, 0.05u0.10u0.01u0.02u_y接受區否定區_y左尾測驗左尾測驗否定區接受區右尾測驗右尾測驗0.950.95實際應用中,如何選用兩尾檢驗或一尾檢驗,應根據專業的要求在試驗設計時就確定。 一般情況下,若事先不知道 與 誰大誰小,只是為了檢驗 與 是否存在差異,則選用兩尾檢驗; 如果憑借一定的專業知識和經驗推測 應小于(或大于) 時

26、,則選用一尾檢驗。 000一、一、 t 分布分布n 當樣本容量不太大當樣本容量不太大( (n n30) 1.96結論是與原來品種不相同。結論是與原來品種不相同。000:H0:AHxunyuyy已知,0210360380yyu101640ny方法方法2 總體方差未知(一)總體方差未知(一)提出無效假設與備擇假提出無效假設與備擇假設設 , , 其中其中 為樣本所在總體為樣本所在總體平均數,平均數, 為已知總體平均數;為已知總體平均數; (二)(二)計算計算 t 值值 計算公式為:計算公式為: 式中,式中,n為樣本含量,為樣本含量, 為樣本平均數的標準誤。為樣本平均數的標準誤。 (三)(三)查臨界查

27、臨界t值,作出統計推斷值,作出統計推斷 查附表查附表4得臨界值得臨界值t0.05,t0.01。將計算所得的。將計算所得的t值的絕對值與其比較:值的絕對值與其比較: 00:H0:AH1 ndf0ysyt0nssyys 若若 |t| 0.05 , 不不 能能 否否定定 ,表明樣本平均數,表明樣本平均數 與總體平均數與總體平均數 差差異不顯著,可以認為樣本是取自該總體;若異不顯著,可以認為樣本是取自該總體;若 t0.05 |t| t0.01,則,則 0.01P0.05,否定,否定 , 接接受受 ,表明樣本平均數,表明樣本平均數 與總體平均與總體平均數數 差異顯著,有差異顯著,有95%的把握認為樣本不

28、是取自該總的把握認為樣本不是取自該總體;體; x00:H00:H0:AH00y 若若| |t t|t t0.010.01,則,則P0.01P0.01表明樣本平均數表明樣本平均數 與與總體平均數總體平均數 差異極顯著,有差異極顯著,有99%99%的把握認為樣本不的把握認為樣本不是取自該總體。是取自該總體。 若在若在0.050.05水平上進行一尾檢驗,只要將計算所水平上進行一尾檢驗,只要將計算所得得t t值的絕對值值的絕對值| |t t| |與由附表與由附表4 4查得查得a=0.10a=0.10的臨界的臨界t t值值t t0.100.10比較,即可作出統計推斷。比較,即可作出統計推斷。 0y 【例

29、】【例】 某品種的生育期為某品種的生育期為114114天,今抽測天,今抽測1010個點生育期個點生育期分別為分別為 116116、 115115、113113、 112112、 114114、 117117、 115115、 116116、 114114、 113113(天),試檢驗所得樣本的平(天),試檢驗所得樣本的平均數與總體平均數均數與總體平均數114114天有無顯著差異?天有無顯著差異? 根據題意,本例應進行雙側根據題意,本例應進行雙側t t檢驗。檢驗。 1 1、提出無效假設與備擇假設、提出無效假設與備擇假設 , 210:H21:AH10581. 11145 .1145 . 05 .

30、091101 ndfyysyt0 3 3、查臨界、查臨界t t值,作出統計推斷值,作出統計推斷 由由 =9=9,查,查t t值表(附表值表(附表4 4)得)得t t0.050.05(9 9)=2.262=2.262,因為因為| |t t|0.05,0.05,故不能否定故不能否定H H0 0: = 114= 114, 表表明樣本平均數與總體平均數差異不顯著,可以認為該樣明樣本平均數與總體平均數差異不顯著,可以認為該樣本取自品種生育期為本取自品種生育期為114114天的總體。天的總體。 df三、三、 兩個樣本平均數的假設測驗兩個樣本平均數的假設測驗n 這是由兩個樣本平均數的相差,以測驗這是由兩個樣

31、本平均數的相差,以測驗這兩個樣本所屬的總體平均數有無顯著差異。這兩個樣本所屬的總體平均數有無顯著差異。測驗的方法因試驗設計的不同而分為成組數測驗的方法因試驗設計的不同而分為成組數據的平均數比較和成對數據的比較兩種。據的平均數比較和成對數據的比較兩種。n(一)、成組數據的平均數比較(一)、成組數據的平均數比較 n 如果兩個處理為完全隨機設計,各供如果兩個處理為完全隨機設計,各供試單位彼此獨立,不論兩個處理的樣本容試單位彼此獨立,不論兩個處理的樣本容量是否相同,所得數據皆稱為成組數據,量是否相同,所得數據皆稱為成組數據,以組平均數作為相互比較的標準。以組平均數作為相互比較的標準。 1 1、在兩個樣

32、本的總體方差已知時,用、在兩個樣本的總體方差已知時,用u u 測測驗。驗。222121_2_1nnyy_2_1)()(21_2_1yyyyu 例例5.2 5.2 據以往資料,已知某小麥品種每平方據以往資料,已知某小麥品種每平方米產量的米產量的2 2=0.4(kg)=0.4(kg)2 2。今在該品種的一塊地上。今在該品種的一塊地上用用A A、B B兩法取樣,兩法取樣,A A法取了法取了1212個樣點,得每平方個樣點,得每平方米米 =1.2(kg)=1.2(kg);B B法取得法取得8 8個樣點,得個樣點,得 =1.4(kg)=1.4(kg)。試比較。試比較A A、B B兩法的每平方米產量是兩法的

33、每平方米產量是否有顯著差異?否有顯著差異?_1y_2y2 . 0_2_1 yy系隨機誤差系隨機誤差;021假設假設H H0 0:A A、B B兩法的產量相同,即兩法的產量相同,即H H0 0:n對對H HA A:1 12 2,=0.05=0.05)(2887. 084 . 0124 . 0, 8,12, 4 . 0_2_12122212kgnnyy69. 02887. 04 . 12 . 1u推斷:接受推斷:接受H H0 0: 測驗計算:測驗計算: 因為實得因為實得|u|u|u u0.050.05=1.96=1.96,故,故P P0.050.05。n的加權平均值,即的加權平均值,即:) 1()

34、 1()()(21_2222_1121212nnyyyySSSSse22= =的估計,而兩個樣本又為小樣本時,用的估計,而兩個樣本又為小樣本時,用t t 測驗。測驗。2es首先,從樣本變異算出平均數差數的均方首先,從樣本變異算出平均數差數的均方,作為對作為對2 2222es21由于可假定由于可假定= = = 2 2,故,故應為兩樣本均方應為兩樣本均方222122212為未知,但可假定和差、在兩個樣本的總體方n當當n n1 1= =n n2 2= =n n 時,則上式變為:時,則上式變為:2212_2_1nsnsseeyynsseyy22_2_1_2_1)()(21_2_1yysyyt由于假設H

35、0: _2_1)(_2_1yysyyt例5.4研究矮壯素使玉米矮化的效果,在抽穗期測定噴矮壯素小區8株、對照區玉米9株,其觀察值如下表:y y1 1( (噴施矮壯素噴施矮壯素) ) 160160160160200200160160200200170170150150210210y y2 2( (對照對照) )170170270270180180250250270270290290270270230230170170 從理論上判斷,噴施矮壯素只可能矮化無從理論上判斷,噴施矮壯素只可能矮化無效而不可能促進植物長高,因此假設效而不可能促進植物長高,因此假設H H0 0:噴施:噴施矮壯素的株高與未噴的

36、相同或更高,即矮壯素的株高與未噴的相同或更高,即H H0 0: H HA A: 184005 .37873 .233,3 .17621_2_1SSSScmycmy)(688.18)9181(17.147917.1479875 .378718400_2_12cmssyye05. 3688.183 .2333 .176t 按按=7+8=15=7+8=15,查,查t t 表得一尾表得一尾t t0.050.05=1.753(=1.753(一尾測驗一尾測驗t t0.050.05等于兩尾測驗的等于兩尾測驗的t t0.100.10) ),現實得,現實得t t=-3.05=-3.05- - t t0.050.

37、05=-1.753=-1.753,故故P P0.050.05。推斷:否定推斷:否定H H0 0: 1 12 2,接受,接受H HA A: 1 12 2,即認為玉米噴施矮壯素后,其株,即認為玉米噴施矮壯素后,其株高顯著地矮于對照。高顯著地矮于對照。甲品種(甲品種(y y1 1)747471715656545471717878626257576262696973736363616172726262707078787474777765655454585863636262595962627878535367677070乙品種(乙品種(y y2 2)656553535454606056566969585

38、849495151535366666262585858586666717153535656606070706565585856566969686870705252555555555757 . .提出假設提出假設: ,即兩個品種產量無顯著差,即兩個品種產量無顯著差異對異對: ,即兩個產量有顯著差異,即兩個產量有顯著差異 確定顯著水平確定顯著水平 0.010.01 檢驗計算檢驗計算 統計推斷由于統計推斷由于=3.28=3.28 0.01=2.580.01=2.58,故推斷接受,故推斷接受否定否定,即兩個品種產量達極顯著差異,即兩個品種產量達極顯著差異83.651y7299.5921S77.592y

39、8747.4222S8494. 1308747.42307299.5922212121nSnSSyy28. 38494. 177.5983.65)()(212121yySyyn二、成對數據的比較二、成對數據的比較 n若試驗設計是將性質相同的兩個供試單位配成若試驗設計是將性質相同的兩個供試單位配成對,并設有多個配對,然后對每一配對的兩個供對,并設有多個配對,然后對每一配對的兩個供試單位分別隨機地給予不同處理,則所得觀察值試單位分別隨機地給予不同處理,則所得觀察值為成對數據。為成對數據。 n成對數據,由于同一配對內兩個供試單位的試成對數據,由于同一配對內兩個供試單位的試驗條件很是接近,而不同配對間

40、的條件差異又驗條件很是接近,而不同配對間的條件差異又可通過同一配對的差數予以消除,因而可以控可通過同一配對的差數予以消除,因而可以控制試驗誤差,具有較高的精確度。制試驗誤差,具有較高的精確度。n 設兩個樣本的觀察值分別為設兩個樣本的觀察值分別為y y1 1和和y y2 2,共配,共配成成n n對,各個對的差數為對,各個對的差數為d d= =y y1 1- -y y2 2,差數的平均,差數的平均數為數為n它具有它具有= =n n-1-1。若假設。若假設H H0 0:d d=0,=0,則上式改成:則上式改成:_2_1_yyd,則差數平均數的標準誤為則差數平均數的標準誤為:) 1()(2_nndds

41、d_ddsdt_dsdt 即可測驗即可測驗n 例例5.6 5.6 選生長期、發選生長期、發育進度、植株大小和其它育進度、植株大小和其它方面皆比較一致的兩株番方面皆比較一致的兩株番茄構成一組,共得茄構成一組,共得7 7組,組,每組中一株接種每組中一株接種A A處理病處理病毒,另一株接種毒,另一株接種B B處理病處理病毒,以研究不同處理方法毒,以研究不同處理方法的純化的病毒效果,表中的純化的病毒效果,表中結果為結果為組別組別y y1 1(A(A法法) )y y2 2(B(B法法) )d d1 110102525-15-152 2131312121 13 38 81414-6-64 43 31515

42、-12-125 520202727-7-76 620202020-7-77 76 61818-12-12病毒在番茄上產生的病痕數目,試測驗兩種病毒在番茄上產生的病痕數目,試測驗兩種處理方法的差異顯著性。處理方法的差異顯著性。假設:兩種處理對純化病毒無不同效果,即:假設:兩種處理對純化病毒無不同效果,即: ;對;對測驗計算:測驗計算: 3 . 87/587/)12(.1)15(_d43.1677/)58()12(.1)15(2222dSS16. 4997. 13 . 8997. 16743.167_tsd查附表查附表4 4, n在設計配對實驗時,配對的雙方一定要有在設計配對實驗時,配對的雙方一定

43、要有內在聯系內在聯系,否則不能配成對子。如,從社會學角度看,一對夫妻否則不能配成對子。如,從社會學角度看,一對夫妻是配成的一對,但從生物學角度看,他們是姻親,不是配成的一對,但從生物學角度看,他們是姻親,不是血親,沒有任何血緣關系,因此不能配對。是血親,沒有任何血緣關系,因此不能配對。成對數據平均數比較依據條件:成對數據平均數比較依據條件:假定各個配對的差數來假定各個配對的差數來自差數的分布為正態總體,具有自差數的分布為正態總體,具有 而每一配對的而每一配對的兩個供試單位是彼此相關的兩個供試單位是彼此相關的成組數據平均數比較依據條件:成組數據平均數比較依據條件:假定兩個樣本皆來自具假定兩個樣本

44、皆來自具有共同(或不同)方差的正態總體,而兩個樣本的各有共同(或不同)方差的正態總體,而兩個樣本的各個共試單位都是彼此獨立的。個共試單位都是彼此獨立的。如將成對數據按成組數據的方法比較,容易發生第二類如將成對數據按成組數據的方法比較,容易發生第二類錯誤。錯誤。), 0 (2dNn 許多生物學試驗的結果是用百分數或成數表示許多生物學試驗的結果是用百分數或成數表示的,如結實率、發芽率、殺蟲率等等。在理論上,這的,如結實率、發芽率、殺蟲率等等。在理論上,這類百分數的假設測驗就應按二項分布進行,即從二項類百分數的假設測驗就應按二項分布進行,即從二項式式( (p p+ +q q) )n n的展開式求出某

45、項屬性個體百分數的展開式求出某項屬性個體百分數 的概的概率。但是,率。但是,如果樣本容量如果樣本容量n n 較大,較大,p p不過小,而不過小,而npnp 和和nqnq 均不小于均不小于5 5時時,( (p p+ +q q) )n n的分布趨于正態分布。因而的分布趨于正態分布。因而可以將百分數資料作正態分布處理,從而作出近似的可以將百分數資料作正態分布處理,從而作出近似的測驗,以簡化測驗工作。測驗,以簡化測驗工作。p一、一、 單個樣本百分數的假設測驗單個樣本百分數的假設測驗n 這是測驗某一樣本百分數這是測驗某一樣本百分數 所屬總體的百分數與所屬總體的百分數與某一理論值或期望值某一理論值或期望值

46、p p0 0的差異顯著性的差異顯著性 pnppp)1 (00pppu0即可測驗即可測驗H H0 0:p p= =p p0 0。n 例例5.85.8以紫花和白花的大豆品種雜交,在以紫花和白花的大豆品種雜交,在F F2 2代共得代共得289289株,株,其中紫花其中紫花208208株,白花株,白花8181株。如果花色受一對基因控制,根據株。如果花色受一對基因控制,根據遺傳學原理,遺傳學原理,F F2 2代紫花株與白花株的分離比例應為代紫花株與白花株的分離比例應為3 3:1 1,即紫,即紫花理論百分數花理論百分數p p=0.75=0.75,白花理論百分數,白花理論百分數q q=0.25=0.25。問

47、該試驗結。問該試驗結果是否符合一對基因的遺傳規律?果是否符合一對基因的遺傳規律?n 假設大豆花色遺傳符合一對基因的遺傳規律,紫花植株假設大豆花色遺傳符合一對基因的遺傳規律,紫花植株的百分數是的百分數是75%75%,即,即H H0 0:p p=0.75=0.75;對;對H HA A: :p p0.750.75。顯著水平。顯著水平=0.05 =0.05 。n測驗計算:測驗計算:n因為實得因為實得| |u u| |u u0.050.05,故,故P P0.050.05。n推斷:接受推斷:接受H H0 0。0255. 028925. 075. 0,7197. 0289208pp19. 10255. 07

48、5. 07197. 0u二、二、 兩個樣本百分數相比較的假設測驗兩個樣本百分數相比較的假設測驗n(一)、兩個總體該種屬性的百分數已知為(一)、兩個總體該種屬性的百分數已知為p p1 1和和p p2 2n則兩樣本的差數標準誤為:則兩樣本的差數標準誤為:22211121nqpnqppp2 p1 p這是測驗兩個樣本百分數這是測驗兩個樣本百分數和和所屬總體百分數所屬總體百分數p p1 1和和p p2 2的差異顯著性。一般假定兩個樣本的總體方差是相等的,的差異顯著性。一般假定兩個樣本的總體方差是相等的,2221pp即即,設兩個樣本某種屬性個體的觀察百分數分別,設兩個樣本某種屬性個體的觀察百分數分別222

49、/nyp 111/nyp 為為和和n(二)、在兩總體的百分數(二)、在兩總體的百分數p p1 1和和p p2 2未知時,則在兩總體方差未知時,則在兩總體方差 n pqnnyyp12121)11(2121nnqppp故由故由2121ppppu即可對即可對H H0 0:p p1 1= =p p2 2作出假設測驗。作出假設測驗。作為作為p p1 1和和p p2 2的估計。的估計。2221ppp的假定下,可用兩樣本百分數的加權平均值的假定下,可用兩樣本百分數的加權平均值n 例例5.95.9調查低洼地小麥調查低洼地小麥378378株株( (n n1 1) ),其中有銹病株,其中有銹病株355355株株(

50、 (y y1 1) ),銹病率為,銹病率為93.92%( )93.92%( );調查高坡地小麥;調查高坡地小麥396396株株( (n n2 2) ),其中銹病,其中銹病346346株株( (y y2 2) ),銹病率,銹病率87.31%( )87.31%( )。試測。試測驗兩塊麥田的銹病率有無顯著差異?驗兩塊麥田的銹病率有無顯著差異?1 p2 p094. 0906. 011,906. 0396378346355pqp假設假設H H0 0:p p1 1= =p p2 2,對,對H HA A:p p1 1p p2 2。顯著水平。顯著水平=0.05 =0.05 。測驗計算:測驗計算:n實得實得|

51、|u|u|u u0.050.05,故,故P P0.050.05。n推斷:接受推斷:接受H HA A:p p1 1p p2 2,即兩塊麥田的銹病發生率有顯,即兩塊麥田的銹病發生率有顯著差異。著差異。0210. 0)39613781(094. 0906. 0221pp16. 30210. 08731. 09394. 0u三、三、 二項樣本假設測驗的連續性矯正二項樣本假設測驗的連續性矯正n 二項總體的百分數在性質上屬于間斷性變異,其二項總體的百分數在性質上屬于間斷性變異,其分布是間斷的二項分布。把它當作連續性的正態分布或分布是間斷的二項分布。把它當作連續性的正態分布或t t分布處理,結果會有些出入,

52、一般容易犯分布處理,結果會有些出入,一般容易犯I I類錯誤。補類錯誤。補救的辦法是在假設測驗時進行連續性矯正。這種矯正在救的辦法是在假設測驗時進行連續性矯正。這種矯正在n n3030,而,而n n55時是必須進行的。時是必須進行的。n(一)、單個樣本百分數假設測驗的連續性矯正(一)、單個樣本百分數假設測驗的連續性矯正pncsnppnt5 . 0|它具有它具有= =n n-1-1。式中。式中qpnspn 例例5.115.11用基因型純合的糯玉米和非糯玉米雜交,按遺傳用基因型純合的糯玉米和非糯玉米雜交,按遺傳學原理,預期學原理,預期F F1 1植株上糯性花粉粒的植株上糯性花粉粒的p p0 0=0.

53、5=0.5,現在一視野中,現在一視野中檢視檢視2020?;ǚ?,得糯性花粉粒花粉,得糯性花粉8 8粒,試問此結果和理論百分數粒,試問此結果和理論百分數p p0 0=0.5=0.5是否相符?是否相符?的估計值。的估計值。npqnp它是它是n假設假設 =8/20=0.4=8/20=0.4系系 p p= =p p0 0=0.5=0.5的一個隨機樣本,即的一個隨機樣本,即H H0 0:p p=0.5=0.5對對H HA A:p p0.50.5,顯著水平,顯著水平=0.05 =0.05 。p 105 . 020, 6 . 04 . 011nqnppq12820, 84 . 020qnpn19. 26 .

54、04 . 020pns68. 019. 25 . 0|108|ct查附表查附表4 4,=20-1=19=20-1=19,t t0.050.05=2.093=2.093,現實得,現實得| |t t| | t t0.050.05,故故P P0.050.05,推斷認為實得百分數,推斷認為實得百分數0.40.4與理論百分數與理論百分數0.50.5沒沒有顯著差異。有顯著差異。測驗計算:測驗計算:(二)、兩個樣本百分數相比較的假設測驗的連續性矯正(二)、兩個樣本百分數相比較的假設測驗的連續性矯正n設兩個樣本百分數中,取較大值的設兩個樣本百分數中,取較大值的 具有具有y y1 1和和n n1 1,取,取較小

55、值的較小值的 具有具有y y2 2和和n n2 2,則經矯正的,則經矯正的t tc c公式為:公式為:1 p2 p212215 . 015 . 0ppcsnynyt的估計值為,其中它具有2121221ppppSnnn 例例5.12 5.12 用配方農藥處理用配方農藥處理2525頭棉鈴蟲,結果死亡頭棉鈴蟲,結果死亡1515頭,頭,存活存活1010頭;用樂果處理頭;用樂果處理2424頭,結果死亡頭,結果死亡9 9頭,存活頭,存活1515頭。頭。問兩種處理的殺蟲效果是否有顯著差異?問兩種處理的殺蟲效果是否有顯著差異?n假設假設H H0 0:p p1 1= =p p2 2;對;對H HA A: :p

56、p1 1p p2 2。顯著水平。顯著水平=0.05 =0.05 n測驗計算:測驗計算:29.1143.0245.09255.015143.0)251241(51.049.051.049.01,49.0242591521cpptsqpn查附表查附表, =24+25-2=47=24+25-2=47時,時,t t0.050.05=2.014=2.014?,F實得?,F實得| |t tc c| | t t0.050.05,故,故P P0.050.05。n推斷:接受推斷:接受H H0 0:p p1 1= =p p2 2。即承認兩種殺蟲劑的殺蟲效果沒有。即承認兩種殺蟲劑的殺蟲效果沒有顯著差異。顯著差異。n本例若不作連續性矯正,本例若不作連續性矯正,t=(0.60-0.375)/0.143=1.573t=(0.60-0.375)/0.143=1.573n大于大于1.291.29,增加了否定,增加了否定H H0 0發生第一類錯誤的可能性。發生第一類錯誤的可能性。 在一定概率保證下,估計出一個區間以能夠覆蓋參在一定概率保證下,估計出一個區間以

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論