試驗統計方法 第五章假設檢驗學習資料_第1頁
試驗統計方法 第五章假設檢驗學習資料_第2頁
試驗統計方法 第五章假設檢驗學習資料_第3頁
試驗統計方法 第五章假設檢驗學習資料_第4頁
試驗統計方法 第五章假設檢驗學習資料_第5頁
已閱讀5頁,還剩58頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第三節二項資料的百分數假設測驗二項分布的次數資料,可以換算成百分數資料。這種現象生物學試驗中經常遇到。它們是服從二項分布的。理論上這類百分數的假設測驗應按二項分布進行(概率計算公式4-1,P51)。但當樣本較大時,計算十分繁瑣。

例題:有一批蔬菜種子的平均發芽率p0=0.85。現隨機抽取500粒,用種衣劑進行浸種處理,結果有445粒發芽,問種衣劑對發芽有沒有影響?若按二項分布,其中500粒種子中有445粒發芽的概率為:另外還需進行更多類似的計算!但當樣本含量n較大、不過大過小時,二項分布接近于正態分布。所以,對于服從二項分布的百分數資料,當n足夠大時,可以近似地用u測驗法。

一個樣本百分數的假設測驗是檢驗一個樣本百分數所在二項總體百分數p是否與已知二項總體百分數p0相同,換句話說,檢驗該樣本百分數是否來自總體百分數為p0的二項總體。一、一個樣本百分數(成數)的假設測驗復習二項資料次數分布

μx=np

二項資料百分數(p)分布。

μp=p

二項分布百分數資料適用于近似u測驗所需要的樣本含量n(書中表5-6,P83)(樣本百分數)n(較小組次數)n(樣本容量)0.500.400.300.200.100.051520244060703050802006001400

樣本百分數的標準誤為樣本百分數的標準離差(因樣本容量較大,用u測驗)

例題:有一批蔬菜種子的平均發芽率p0=0.85。現隨機抽取500粒,用種衣劑進行浸種處理,結果有445粒發芽,問種衣劑對發芽有沒有影響?分析:已知條件p0=0.85,q0=0.15,

可求出樣本種子發芽率:

n=500,,可直接采用u測驗。

解:

(1)假設:HO:p=p0=0.85;HA:p≠p0

(2)確定顯著水平為α=0.05。兩尾測驗。(3)計算:樣本平均數標準誤

(4)推斷:u>u0.05=1.96,p<0.05,拒絕H0,認為種衣劑浸種能顯著提高種子的發芽率。

二、兩個百分數的假設測驗通過兩個樣本百分數,測驗它們所屬總體p1和p2的差異顯著性。若從兩個總體中各抽取容量為n1,n2的樣本,其中有指定特性的個數為x1,x2

則有:

假設H0:p1=p2成立,兩個樣本來自同一個總體。可用兩百分數的加權平均值

對p1=p2做出估計樣本平均數差數的標準誤為例題:調查春大豆A的120個豆莢,其中癟莢38個,癟莢率31.7%;調查春大豆B的135個豆莢,其中有癟莢52個,癟莢率38.5%。試檢驗兩個品種的癟莢率是否相同?解:已知n1=120,x1=38,=0.317n2=135,x2=52,=0.385

假設H0:p1=p2,HA:p1≠p2

兩尾測驗,顯著水平取0.05,因為均大于30,可用u測驗,不需矯正。推斷:因為|u|<u0.05,故P>0.05。接受H0,即:兩個品種的癟莢率差異不顯著,可以認為兩個品種的癟莢率相同。三、二項樣本假設測驗的連續性矯正

當樣本容量不大(np和nq≤30)時,需做連續性矯正。用矯正tc測驗自由度df=n-1一個樣本百分數兩個樣本百分數相比較

式中x1和n1為具有較大p?1值的樣本式中x2和n2為具有較小p?2值的樣本自由度為df=n1+n2-2例題:用基因型純合的糯玉米和非糯玉米雜交,按遺傳學原理,預期F1植株上糯性花粉粒的P0=0.5,現在一視野中檢視20粒花粉,得糯性花粉8粒,試問此結果和理論結果是否相符?解:求出p?=8/20=0.4,q?=0.6,

因為n=20,,需進行矯正。

(1)HO:p=p0=0.5;HA:p≠p0

(2)確定顯著水平為α=0.05。兩尾測驗。(3)計算:

df=n-1=20-1=19,查附表4,t0.05=2.093(4)推斷:因tc<t0.05

,故接受H0,即實得百分數與理論百分數沒有顯著差異。原則上,一個樣本二項分布百分數的假設檢驗,均可按二項分布直接求出某種抽樣結果的概率。但在樣本較大時,計算工作量浩大。1、在當樣本容量較大,時,可直接采用u測驗。2、當時,需進行矯正,用近似的tc

測驗。3、當時,直接用二項分布求概率。第四節參數的區間估計參數的區間估計區間估計與假設測驗樣本容量與精確度

例題:已知某品種玉米單穗重(g)服從N(300,11.52)。在種植過程中噴灑了某種藥劑。欲了解該藥劑對玉米穗重是否產生影響,從噴過藥的植株上隨機選取9個果穗,測得樣本單穗重的平均數為307克,標準差為12.3。問題1:測驗藥劑對玉米穗重是否有影響?即噴灑了某種藥劑總體的平均數是否為11.5g。問題2:噴灑了某種藥劑總體的平均數為多少?為什么參數估計?參數估計:是用樣本統計量來估計總體參數。無偏估計量:如果一個統計量的理論平均數(數學期望)等于總體參數,這個統計量就稱為該參數的無偏估計量。點估計(pointestimation):樣本統計量直接作為總體相應參數的估計值

點估計只給出了未知參數估計值的大小,沒有考慮抽樣誤差的影響,也沒有指出估計的可靠程度。區間估計(intervalestimation)是在一定概率保證下指出總體參數的可能范圍。置信區間在一定概率保證下,估計出參數的可能范圍。置信度:區間估計的概率保證。置信限:置信區間的上下限。置信限有置信上限L1和置信下限L2。舉例說明抽樣調查知某學校在校本科生的月平均消費為1000元(點估計)。95%(置信度)的在校本科生的月平均消費在800-1200元之間(置信區間)。因此,區間估計可以提供更多的信息。一、總體平均數的置信區間(一)在總體方差已知時

在總體方差已知,或為大樣本時,樣本平均數的標準離差呈正態分布。在(1-α)的概率(置信度)下這就是正態分布,置信度為(1-α)下,總體平均數μ的置信區間。解:P=1-α=0.95查附知u0.05=1.96

則纖維長度95%的置信區間為(30–1.96×0.56)

<μ

≤(30+

1.96×0.56)即:28.90mm<μ

≤31.10mm例題:已知某棉花品種纖維長度的標準差為2.5mm。該品種良種繁育田中20個株行的棉花纖維平均長度是30mm,求95%置信度下的置信區間。(二)在總體方差未知時當總體方差未知,且樣本較小時,包含n個觀測值X1、X2、…、Xn。樣本平均數為

樣本標準誤為

當總體平均數為μ時,服從自由度為n-1的t分布。當兩尾概率為α時,有:

也就是說t在區間內取值的概率為1-α,即:

即上式稱為總體平均數μ置信度為1-α的置信區間。其中置信半徑是:置信下限是置信上限是常用的置信度為95%和99%,故由上式可得總體平均數μ的95%和99%的置信區間如下:

解:當df=7時,t0.05=2.365,代入

例題:某春小麥良種在8個小區的千粒重平均數,s=1.64g。試估計該小麥品種在置信度為95%時的千粒重區間。35.2-2.365×0.58≤μ≤35.2+2.365×0.5833.8≤μ≤36.6

即:該品種千粒重在95%置信度時的區間是

33.8~36.6g二、兩總體平均數差數的置信限(一)在兩總體方差已知或為大樣本時:兩樣本平均數差數的標準離差雙尾概率α=0.05,即置信概率為(1-α)時,

μ1-μ2在1-α置信度下的置信區間為

L1L2式中為平均差數的標準誤為uα置信度為1-α時的u臨界值例題:測得農選1號甘薯332株的單株產量,x1=750g,s1=265g。白皮白心甘薯282株,x2=600g,s2=185g,試估計兩個品種單株產量相差在95%置信度下的置信區間。解:u0.05=1.96因此95%置信限為:L1=(750-600)-1.96×18=114.7(g)L2=(750-600)+1.96×18=185.3(g)即:農選1號品種單株產量比白皮白心品種多114.7~185.7g,這個把握有95%。(二)在兩總體方差未知且為小樣本時

1、可以假設兩總體方差相等時

2、兩總體方差不等時。

(三)成對數據總體差數的置信區間估計(略)三、二項總體百分數p的置信區間樣本百分數只是總體百分數p

的點估計值。百分數的置信區間則是在一定置信度下對總體百分數作出區間估計。求總體百分數的置信區間有兩種方法:正態近似法。查表法正態近似法在資料np和nq>30時,二項分布近似正態分布。所以當樣本百分數為p?,在置信度為(1-α)下,對總體百分數的p的置信區間估計為(p?-uαSp?)≤p≤(p?+uαSp?)式中常用的95%、99%置信區間為:查表法(附表7,p348)根據表中列的容量和某一性狀出現的次數(f),可直接查得對應總體p的置信區間。表中列出的是常用的95%和99%的置信區間。例題:調查250株玉米,得到玉米螟危害的為50株,即p?

=50/250=0.2。試計算95%置信度的玉米螟危害率置信區間。查表法:在樣本容量n=250,觀察百分數p?

=0.2,可直接查得95%置信度的置信區間為15%~

26%正態近似法:

置信下限:L1=p?-uαSp?

=0.2-1.96×0.028=14.5置信上限:L2=p?+uαSp?=0.2+1.96×0.028=25.5四、兩個二項總體百分數差數的置信限

在大樣本時,置信度為1-α時的置信限(p?1-p?2)-uα

Sp?1-p?2≤p1-p2≤(p?1-p?2)+uα

Sp?1-p?2例:調查低洼地小麥銹病率p?1=93.92%(n1=378);高坡地小麥銹病率p?2=87.37%(n2=396),它們有顯著差異,試按95%置信度估計兩種環境麥田銹病率相差的置信區間。解:u0.05=1.96

L1=(0.9392-0.8731)-(1.96×0.0208)=0.0254L2=(0.9392-0.8731)+(1.96×0.0208)=0.1068

即低洼地銹病發生率比高坡地高2.54%~10.68%,此估計的置信度為95%。五、區間估計與假設測驗置信區間是在一定置信度下(1-α)對總體參數所在范圍的估計。若總體參數的假設值落在這個范圍內,則這個總體的參數與假設值(往往是已知總體的參數)沒有真實不同,因而接受無效假設H0),若落在該區間以外,這個總體的參數與假設值不同,所以否定無效假設H0。區間估計,也可用于假設測驗。例題:某地生產上種植的春小麥良種的千粒重μ0=34g。現自外地引入一新品種,在8個小區種植,測得其千粒重(g)分別為:35.6、37.6、33.4、35.1、32.7、36.8、35.9、34.6,問新引入品種的千粒重與當地良種有無顯著差別?df=n-1=7時,

t0.05

=2.365。

t<t0.05,p>0.05,不顯著。35.2-2.365×0.58≤μ≤35.2+2.365×0.5833.8≤μ≤36.6新品種千粒重95%置信區間為:某地生產上種植的春小麥良種的千粒重μ0=34g,位于該區間內,故不顯著。例題:測得農選1號甘薯332株的單株產量,x1=750g,s1=265g。白皮白心甘薯282株,x2=600g,s2=185g,試估計兩個品種單株產量相差在95%置信度下的置信區間。農選1號品種單株產量比白皮白心品種多114.7~185.7g,這個把握有95%。其區間不包含0,故差異顯著。六、樣本容量與精確度假設測驗不顯著,客觀上存在兩種可能性,一個是兩個總體間確無差異存在,另一種可能是兩總體間存在差異,但是未能測驗出來(β錯誤)。區間估計可用來做顯著性測驗,置信區間的大小,表示估計的精確度程度。置信區間越大,精確度越差(β錯誤的可能性越大)。置信區間越小,精確度越好(β錯誤的可能性越小)。置信區間的大小,取決于置信半徑。增大樣本容量,可以降低樣本的抽樣誤差,提高試驗的精確度。反過來,也可以根據試驗要求的精確度,計算所需的樣本容量。當進行一個平均數比較時(設α=0.05):置信半徑樣本容量

上式是在假設樣本容量n>30時估算的,若計算出的n值較小,可再按求出的n值,計算出自由度,查出該自由度下的t0.05,代入公式,直至得出一個穩定的n值,即是所需樣本容量。

例題:某地春小麥良種的千粒重μ0=34g,現自外地引入一新品種,在8個小區種植,測得其千粒重(g)為:35.6、37.6、33.4、35.1、32.7、36.8、35.9、34.6,問新引入品種的千粒重與當地良種有無顯著差別?(樣本平均數為35.2g,標準差s=1.64)

前面已經假設測驗,新品種(樣本)千粒重平均數為x=35.2g,二者表面相差1.2g,但差異不顯著。比較例題:某地春小麥良種的千粒重μ0=34g,標準差為δ=1.64g,現要求與其它品種比較試驗時能鑒定出±0.8g的差異,問樣本容量應該有多大?解:

n較小,在n=16時,df=16-1=15,查表

t0.05=2.131將t0.05=2.131代入公式,得當df=19-1=18時,t0.05=2.101將t0.05=2.101代入公式,得n穩定在19。即當樣本容量為19時,可鑒別出±0.8g的差異。當兩個平均數比較時,求所需樣本容量。若兩個方差相同時,可假定兩個樣本容量相等,即n1=n2=n,則

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論