第三章統計推斷_第1頁
第三章統計推斷_第2頁
第三章統計推斷_第3頁
第三章統計推斷_第4頁
第三章統計推斷_第5頁
已閱讀5頁,還剩115頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、無公害蔬菜無公害蔬菜番茄:允許殘留量 樂果 1.0mg/kgn=25 抽樣測得 樂果殘留量 0.99mg/kg出售?銷毀?統計推斷的過程統計推斷的過程樣本統計量例如:樣本均值、方差總體均值、方差總體樣本統計推斷統計推斷假設測驗假設測驗區間估計區間估計統計推斷的內容統計推斷的內容點估計點估計參數估計參數估計第一節第一節 統計假設測驗的基本原理統計假設測驗的基本原理第二節第二節 單個平均數的假設測驗和單個平均數的假設測驗和區間估計區間估計第四節第四節 百分數的假設測驗和百分數的假設測驗和區間估計區間估計第三節第三節 兩個平均數的假設測驗和兩個平均數的假設測驗和區間估計區間估計學習目標學習目標n理解

2、統計假設測驗的基本原理n掌握假設測驗步驟n能對實際問題進行假設測驗n掌握參數的區間估計方法第一節第一節 統計假設測驗的基本原理統計假設測驗的基本原理 統計假設測驗的實例統計假設測驗的實例 假設測驗的基本步驟假設測驗的基本步驟 一尾測驗和兩尾測驗一尾測驗和兩尾測驗 假設測驗的兩類錯誤假設測驗的兩類錯誤 統計假設測驗的實例統計假設測驗的實例有一個小麥品種畝產量總體是正態分布,總體平均畝產360kg,標準差40kg。此品種經過多年種植后出現退化,必須對其進行改良,改良后的品種種植了16個小區,獲得其平均畝產為380kg,試問改良后品種在產量性狀上是否和原品種有顯著差異? 0 =360kg , 40

3、= 0 ?在研究中,往往首先要提出一個有關某一總體參數的假設,在研究中,往往首先要提出一個有關某一總體參數的假設,這種假設稱為這種假設稱為統計假設統計假設。原品種原品種x=380kg, n=16改良后改良后二、統計假設測驗的基本步驟二、統計假設測驗的基本步驟(一)提出假設(一)提出假設 v 無效假設無效假設(null hypothesis) (null hypothesis) H0v 備擇假設備擇假設(alternate hypothesis) (alternate hypothesis) HA無效假設和備擇假設是兩種彼此對立的假設,接無效假設和備擇假設是兩種彼此對立的假設,接受了其中的一種,

4、那么就要否定另一種。受了其中的一種,那么就要否定另一種。假設改良后產量的總體平均數假設改良后產量的總體平均數,與原品種總體平均數,與原品種總體平均數 0 0相相等,等, , , 即表面差異即表面差異( -( -0 0=20=20) )全為試驗全為試驗誤差,改良后的產量與原產量沒有差異。這個假設就叫誤差,改良后的產量與原產量沒有差異。這個假設就叫無效無效假設假設,記為,記為H H0 0: = = 0 0。x( - 0)=(- 0 )+i= i x與無效假設對立的統計假設稱與無效假設對立的統計假設稱備擇假設備擇假設, 記為記為H HA A: 0 0。無效假設的形式是多種多樣的,隨研究的內容不同而不

5、同:無效假設的形式是多種多樣的,隨研究的內容不同而不同:A. A. 對單個平均數的假設對單個平均數的假設無效假設無效假設H H0 0: = = 0 0備擇假設備擇假設H HA A: 0 0B. B. 兩個平均數相比較的假設兩個平均數相比較的假設無效假設無效假設H H0 0: 1 1 = = 2 2備擇假設備擇假設H HA A: 1 1 2 2C. C. 對單個樣本百分數的假設對單個樣本百分數的假設無效假設無效假設H H0 0:p=p= p p0 0備擇假設備擇假設H HA A: p pp p0 0D. D. 兩個樣本百分數相比較的假設兩個樣本百分數相比較的假設無效假設無效假設H H0 0: p

6、 p1 1 = p= p2 2備擇假設備擇假設H HA A: p p1 1 p p2 2無效假設是有意義的無效假設是有意義的據之可計算出因抽樣誤差而獲得樣本結果的概率據之可計算出因抽樣誤差而獲得樣本結果的概率但必須遵循兩個原則但必須遵循兩個原則: H0是直接測驗的假設是直接測驗的假設 HA不是直接測驗的假設,是在無效假設被不是直接測驗的假設,是在無效假設被否定的情況下而必須接受的假設。否定的情況下而必須接受的假設。(二)計算概率(二)計算概率u=標準正態離差標準正態離差 0_x-x-=38036040/16=2(x-=n ) 0 =360kg , 40 x=380kg, n=16原品種原品種改

7、良后改良后無效假設無效假設H H0 0: = = 0 0 , ,備擇假設備擇假設H HA A: 0 0查附表查附表2,P(|u|2)=20.0227=0.0454,表明,表明20Kg差異屬于試驗誤差的概率為差異屬于試驗誤差的概率為0.0454。(三)確定顯著水平(三)確定顯著水平否定否定H H0 0的概率標準叫的概率標準叫顯著水平顯著水平(significant level)(significant level),一般以一般以表示表示。農業試驗研究中常取農業試驗研究中常取 =0.05 =0.05和和 = 0.01 = 0.01。顯著水平的選擇應根據試驗要求和試驗結論的重顯著水平的選擇應根據試驗

8、要求和試驗結論的重要性而定。要性而定。(四)推斷(四)推斷H0的正誤的正誤否定無效假設否定無效假設H0,接受備擇假設,接受備擇假設HA,即表面差異不全為即表面差異不全為試驗誤差,改良后的品種與原品種之間存在真實差異。試驗誤差,改良后的品種與原品種之間存在真實差異。根據根據小概率原理小概率原理來作出接受或否定來作出接受或否定H H0 0的結論。的結論。一個事件發生的概率很小時(一個事件發生的概率很小時(PP2|u|2)=0.0454=0.04540.050.05,表明,表明20Kg20Kg差異屬于試驗差異屬于試驗誤差的概率小于誤差的概率小于5%5%。統計假設測驗的基本步驟為:統計假設測驗的基本步

9、驟為:1. 1. 對樣本所屬總體提出假設(包括對樣本所屬總體提出假設(包括H H0 0和和H HA A)。)。2. 2. 確定顯著水平確定顯著水平 。3. 3. 在在 H H0 0正確的前提下,依統計數的抽樣分布,計算正確的前提下,依統計數的抽樣分布,計算實際差異由誤差造成的概率。實際差異由誤差造成的概率。4. 4. 將算得的概率與將算得的概率與相比較,根據小概率事件實際相比較,根據小概率事件實際不可能性原理作出是接受還是否定不可能性原理作出是接受還是否定H H0 0的推斷。的推斷。 先假設真實差異不存在,表面差異全為試驗誤差。然后先假設真實差異不存在,表面差異全為試驗誤差。然后計算這一假設出

10、現的概率,根據小概率事件實際不可能性計算這一假設出現的概率,根據小概率事件實際不可能性原理,判斷假設是否正確。這是對樣本所屬總體所做假設原理,判斷假設是否正確。這是對樣本所屬總體所做假設是否正確的統計證明,稱為是否正確的統計證明,稱為統計假設測驗統計假設測驗。三、一尾測驗和兩尾測驗三、一尾測驗和兩尾測驗(一)接受區和否定區(一)接受區和否定區接受區接受區否定區否定區否定區否定區x 00.0250.0250.95=0.05時時, 否定區域(否定區域(negation region)x-( 01.96x- )x-x-( 0+1.96)和和H0: = 0接受區域接受區域(acceptance reg

11、ion)x-0-1.96 x-()0+1.96x-()x96. 10 x96. 10同理,同理,=0.01時,則時,則 H0: = 0的接受區域為的接受區域為x-02.58x-()02.58x-()否定區域為否定區域為-x( 02.58x- )x-x ( 02.58)或或-接受區接受區否定區否定區否定區否定區x 00.0050.0050.99x58. 20 x58. 20(二)一尾測驗和兩尾測驗(二)一尾測驗和兩尾測驗統計假設測驗中統計假設測驗中H0: =0具有兩個否定區,具有兩個否定區,HA: 0,這類測驗稱這類測驗稱兩尾測驗兩尾測驗(two-tailed test),在假,在假設測驗中所考

12、慮的概率為左右兩尾概率之和。設測驗中所考慮的概率為左右兩尾概率之和。否定區否定區否定區否定區x 0 x96. 10 x96. 10H0: 0, HA: 0,則否定區在則否定區在 分布的右尾。分布的右尾。x-例如:研究農藥的殘留問題,噴有例如:研究農藥的殘留問題,噴有機砷的蔬菜上有機砷的含量機砷的蔬菜上有機砷的含量為為,未,未噴的蔬菜上有機砷噴的蔬菜上有機砷的含量為的含量為0。測驗蔬菜上有測驗蔬菜上有機砷的含量是否顯著提高。機砷的含量是否顯著提高。0.05x 0否定區否定區0.05x 0否定區否定區x64. 10 x-H0: 0, HA: 0,則否定區在則否定區在 分布的左尾。分布的左尾。象這種

13、在假設測驗中所考慮的概率只用一尾概率的測驗稱象這種在假設測驗中所考慮的概率只用一尾概率的測驗稱為一尾測驗為一尾測驗(one-tailed test)選用一尾測驗還是兩尾測驗,應根據專業知識而定。選用一尾測驗還是兩尾測驗,應根據專業知識而定。例如:研究矮壯素使玉米矮化的結果,例如:研究矮壯素使玉米矮化的結果,噴矮壯素的玉米平均株高是噴矮壯素的玉米平均株高是,未未噴矮壯素的平均株高是噴矮壯素的平均株高是0。對矮壯素對矮壯素是否能使玉米株高降是否能使玉米株高降低做假設測驗。低做假設測驗。否定區否定區 00.05x64. 10 x四、假設測驗的兩類錯誤四、假設測驗的兩類錯誤第一類錯誤第一類錯誤正確正確

14、正確正確第二類錯誤第二類錯誤檢驗結果有四種情況:檢驗結果有四種情況: 檢驗結果檢驗結果真實情況真實情況否定否定H0接受接受H0H0正確正確H0錯誤錯誤f( )2201xx2xx(一)第一類錯誤(一)第一類錯誤如果無效假設是正確的,通過假設測驗卻否定了它,如果無效假設是正確的,通過假設測驗卻否定了它,所犯的錯誤稱所犯的錯誤稱第一類或第一類或型錯誤,型錯誤,也稱棄真錯誤。也稱棄真錯誤。接受區間接受區間否定區間否定區間由于犯由于犯型錯誤的型錯誤的概率不會超過顯著概率不會超過顯著水平水平 ,故又稱為,故又稱為 錯誤錯誤。如果無效假設是錯誤的,通過假設測驗卻接受了它,如果無效假設是錯誤的,通過假設測驗卻

15、接受了它,所犯的錯誤稱所犯的錯誤稱第二類或第二類或型錯誤,也稱納偽錯誤型錯誤,也稱納偽錯誤。(二)第二類錯誤(二)第二類錯誤由于犯由于犯型錯誤的概率常記為型錯誤的概率常記為 ,故又稱為,故又稱為 錯誤錯誤。1x2xx接受區間接受區間否定區間否定區間0 0由圖可見,由圖可見,的大小與的大小與 有反比關系。有反比關系。1x2xx接受區間接受區間否定區間否定區間0 01x2xx接受區間接受區間0 0 在樣本容量在樣本容量n n一定時,提高顯著水平,可以減少犯第一一定時,提高顯著水平,可以減少犯第一類錯誤的概率,但同時增大了犯第二類錯誤的概率。類錯誤的概率,但同時增大了犯第二類錯誤的概率。0 01x2

16、xx接受區間接受區間否定區間否定區間由圖可見,由圖可見,的大小與的大小與0 0有反比關系。有反比關系。1x2xx接受區間接受區間否定區間否定區間0 0在在n n和顯著水平相同的條件下,真正的總體平均數和顯著水平相同的條件下,真正的總體平均數 和假和假設的平均數設的平均數 0 0的相差越大,則犯第二類錯誤的概率越小。的相差越大,則犯第二類錯誤的概率越小。由圖可見,由圖可見,的大小與標準誤的大小與標準誤 有正比關系。有正比關系。nx = =x10 0b2x1x2xx接受區間接受區間0 0為了降低犯為了降低犯錯誤的概率,應適當增加樣本容量。錯誤的概率,應適當增加樣本容量。 b b 與與 b b 間的

17、關系間的關系減少(增加)減少(增加)I型錯型錯誤誤,將會增加(減,將會增加(減少)少)II型錯誤型錯誤(三)降低兩類錯誤的措施(三)降低兩類錯誤的措施1 1、為了降低犯兩類錯誤的概率,需采用一個較低的顯、為了降低犯兩類錯誤的概率,需采用一個較低的顯著水平,如著水平,如=0.05=0.05。2 2、顯著水平一定,則改進試驗技術和增加樣本容量可以、顯著水平一定,則改進試驗技術和增加樣本容量可以有效的降低犯兩類錯誤的概率。有效的降低犯兩類錯誤的概率。第三章第三章 統計推斷統計推斷第一節第一節 統計假設測驗的基本原理統計假設測驗的基本原理第二節第二節 單個平均數的假設測驗和單個平均數的假設測驗和區間估

18、計區間估計第四節第四節 百分數的假設測驗和百分數的假設測驗和區間估計區間估計第三節第三節 兩個平均數的假設測驗和兩個平均數的假設測驗和區間估計區間估計第二節第二節 單個平均數的假設測驗和單個平均數的假設測驗和區間估計區間估計v 單個樣本平均數的假設測驗單個樣本平均數的假設測驗v 總體平均數的區間估計總體平均數的區間估計v 影響估計誤差范圍的因素影響估計誤差范圍的因素一、單個樣本平均數的假設測驗一、單個樣本平均數的假設測驗x由 0 推斷 00? 0 =360kg , 40kgx=380kg, n=16 = 0 ?原品種原品種新品系新品系v從從 2 2已知的已知的總體抽樣,無論樣本容量的大小,其樣

19、本平均數總體抽樣,無論樣本容量的大小,其樣本平均數 的抽樣的抽樣 分布必做正態分布,具有平均數分布必做正態分布,具有平均數 和方差和方差 。x=x n22 = = xv從從 2 2未知的未知的總體抽樣,當樣本容量足夠大時(總體抽樣,當樣本容量足夠大時(n30) n30) ,其樣本平均數,其樣本平均數 的的抽樣分布趨于近正態分布,具有平均數抽樣分布趨于近正態分布,具有平均數 和方差和方差 。n22S = =Sx=x x由抽樣分布可知:由抽樣分布可知: xxt s /0)( =x0=uxx0=uxSv當當 2 2未知的未知的總體抽樣,樣本容量總體抽樣,樣本容量n30n30時時 ,其樣本平均數,其樣

20、本平均數 的抽樣分布的抽樣分布服從服從t t分布分布, , S S2 2代替代替2 2所得到的統計量記為所得到的統計量記為t t 。xU U測驗:測驗: 2 2已知(無論已知(無論n30 n30 ,還是,還是 n n30 30 );); 2 2未知,但未知,但n30n30(大樣本)(大樣本) 。t t 測驗測驗:從:從 2 2未知的未知的總體抽樣,樣本容量總體抽樣,樣本容量n30n30時。時。 由抽樣分布知識可得:由抽樣分布知識可得:(一)(一) 測驗方法測驗方法(二)(二) 測驗步驟測驗步驟第一步第一步 建立假設建立假設H0:0HA:0第二步第二步 確定顯著水平確定顯著水平0.05、0.01

21、第三步第三步 計算統計量計算統計量 u (t)值值x0=uxx0=uxSx0=txS第四步第四步 查表求臨界值查表求臨界值u( t ),并作統計推斷,并作統計推斷例例3.1 3.1 有一玉米雜交種畝產量總體為正態分布,其總體平均產量有一玉米雜交種畝產量總體為正態分布,其總體平均產量0 0= = 430 430, 30 30 ,為提高制種產量進行反交制種,對反交雜交種進行了,為提高制種產量進行反交制種,對反交雜交種進行了9 9個小區試驗,個小區試驗,平均產量為平均產量為415(415(/ /畝畝) )。問反交種在產量上是否與正交種有顯著差異?。問反交種在產量上是否與正交種有顯著差異?H0: =0

22、=430 , 即反交種與正交種在產量上沒有差異。即反交種與正交種在產量上沒有差異。HA: 0,=0.05=1.5930415-430=0=nx0=xux=0.05時,時, u=1.96=1.96,而實得,而實得 u =1.5=1.5,即,即 u t0.05,16,故否定,故否定H0,接受,接受HA 。認為滴灌對大豆的百粒重有顯著影響。認為滴灌對大豆的百粒重有顯著影響。)g(99. 0117175 .3074 .16.3 .17191n)xx(s22222=)g(24. 01799. 0nssx= 參數的區間估計概念參數的區間估計概念n根據一個樣本的觀察值給出總體參數的根據一個樣本的觀察值給出總

23、體參數的估計范圍估計范圍n給出總體未知參數落在這一區間的給出總體未知參數落在這一區間的概率概率置信區間樣本統計量(點估計)置信上限置信下限二、總體平均數的區間估計二、總體平均數的區間估計 參數的區間估計原理參數的區間估計原理1.96x0.025-1.960.025P(-1.96x) x (+1.96x ) =0.95P(-ux) x (+ux )= 1-P(-ux) x (+ux )= 1-P(- ux) x - (ux )= 1-P(-ux -x) - (ux -x) = 1-P(x -ux) (x+ux )= 1-置信下限置信上限L2L1置信區間置信系數或置信度置信限:置信限:L1和和L2

24、置信區間置信區間 L1、L2置信度:概率水平置信度:概率水平PP=1- 否定區否定區否定區否定區x接受區接受區xauxxauxL1L2L1xux =L2xux= , Lxux =點估計:點估計:接受區域接受區域 1- 否定區域否定區域 /2否定區域否定區域 /2L1L2x置信限:置信限: 0的置信區間為的置信區間為xux、xuxL1xux =L2xux=(一)(一) 符合符合u分布的區間估計分布的區間估計1. 1. 2 2已知已知實實 例例例:在某棉花試驗田例:在某棉花試驗田中,隨機抽取中,隨機抽取3636個小個小區,測得小區的皮棉區,測得小區的皮棉平均產量為平均產量為4.1kg4.1kg,已

25、,已知總體方差知總體方差2 2=0.09=0.09。求求99%99%的置信度下該試的置信度下該試驗田中小區皮棉產量驗田中小區皮棉產量的置信區間。的置信區間。該試驗田中小區皮棉產量該試驗田中小區皮棉產量在在3.9714.229kg 之間,此估計的可靠度為之間,此估計的可靠度為99%.(x -u x) (x+u x )4.1 2.580.09 36,3.971,4.2294.1+ 2.580.09 36接受區域接受區域 1- 否定區域否定區域 /2否定區域否定區域 /2L1L2x2. 2. 2 2未知,但未知,但n30n30(大樣本)(大樣本)置信限:置信限:L1xux S =L2xux S= 0

26、的置信區間為的置信區間為xux s、xux s例例3.4 3.4 為估計某塊麥田里的小麥平均株高,隨機抽取為估計某塊麥田里的小麥平均株高,隨機抽取5050株作為一個樣本,株作為一個樣本,得到樣本平均株高得到樣本平均株高x=90cmx=90cm,s=3.8cms=3.8cm,試用,試用95%95%的可靠度估計小的可靠度估計小麥的總體平均株高。麥的總體平均株高。50,8 . 3,90=ncmscmx96. 105. 095. 0105. 0=unssx=54. 0=508 . 3=cm94.8854. 096. 190=cmsxLx06.9154. 096. 19096. 12=xsxL96. 1

27、1=(二)(二) 符合符合 t 分布的區間估計分布的區間估計xxStxLStxL=21置信限:置信限: 0的置信區間為的置信區間為xtxs、xtxs例例3.5 3.5 某一引進的小麥品種,在某一引進的小麥品種,在8 8個小區種植的千粒重克數為:個小區種植的千粒重克數為:35.635.6、37.637.6、33.433.4、35.135.1、32.732.7、36.836.8、35.935.9和和34.634.6,試用,試用95%95%的置信度估的置信度估計該品種的總體平均千粒重。計該品種的總體平均千粒重。nxxi=86 .34.6 .376 .35=g2 .3587 .281=122=nnxx

28、s18872.218)6 .34.6 .376 .35(222=g64. 1783.18=nssx=g58. 0864. 1=查附表4得,當df=7時,t0.05=2.365xstxL=157.3658. 0365. 22 .352=xstxL83.3358. 0365. 22 .35=所以,該小麥品種總體千粒重在所以,該小麥品種總體千粒重在33.8336.57之間,之間,估計的可靠度為估計的可靠度為95%。三三. 影響估計誤差范圍的因素影響估計誤差范圍的因素1. 樣本容量樣本容量 n,n越大,誤差范圍越小。越大,誤差范圍越小。2. 顯著水平顯著水平 , 越小,越小,ua(ta) 越大,越大,

29、誤差范圍越大。誤差范圍越大。3. 樣本標準差樣本標準差S,S越大,誤差范圍越大。越大,誤差范圍越大。第一節第一節 統計假設測驗的基本原理統計假設測驗的基本原理第二節第二節 單個平均數的假設測驗和區間估計單個平均數的假設測驗和區間估計第四節第四節 百分數的假設測驗和百分數的假設測驗和區間估計區間估計第三節第三節 兩個平均數的假設測驗和兩個平均數的假設測驗和區間估計區間估計品種甲品種甲品種乙品種乙 甲甲 乙乙=?X甲甲=500kgX乙乙=525kg第三節第三節 兩個樣本平均數的假設測驗和兩個樣本平均數的假設測驗和區間估計區間估計由兩個樣本平均數之差來測驗這兩個樣本所屬總體平均數是由兩個樣本平均數之

30、差來測驗這兩個樣本所屬總體平均數是否存在顯著差異,即測驗兩個處理的效果是否一樣。否存在顯著差異,即測驗兩個處理的效果是否一樣。品種甲品種甲品種乙品種乙x甲甲=500kgX乙乙=525kg推斷推斷120?21xx 由由 甲甲 乙乙=?x甲甲-x乙乙推斷推斷通過通過 成組數據的假設測驗和區間估計成組數據的假設測驗和區間估計 成對數據的假設測驗和區間估計成對數據的假設測驗和區間估計按數據資料的來源按數據資料的來源一、一、成組數據的假設測驗和區間估計成組數據的假設測驗和區間估計將試驗單位完全隨機分為兩組,再隨機各實施將試驗單位完全隨機分為兩組,再隨機各實施一處理,這樣得到的數據稱為成組數據,以組的平一

31、處理,這樣得到的數據稱為成組數據,以組的平均數作為比較的標準。均數作為比較的標準。(一)成組數據的假設測驗(一)成組數據的假設測驗用用 t 測驗測驗用用u 測驗測驗用近似用近似 t 測驗測驗1. 兩個樣本所屬的總體方差兩個樣本所屬的總體方差 12 和和 22 已知,已知,或總體方差未知,但兩個樣本都是大樣本時。或總體方差未知,但兩個樣本都是大樣本時。 12 22= 且兩個樣本為小樣本,但可假定且兩個樣本為小樣本,但可假定2. 兩個樣本所屬的總體方差兩個樣本所屬的總體方差 12 和和 22 未知,未知,兩樣本為小樣本,且兩樣本為小樣本,且 12 22 3. 兩個樣本所屬的總體方差兩個樣本所屬的總

32、體方差 12 和和 22 未知,未知, 12 22已知,已知,和和1. 兩個樣本的總體方差兩個樣本的總體方差或或總體方差未知,但兩個樣本都是大樣本總體方差未知,但兩個樣本都是大樣本時。時。樣本樣本1:平均數:平均數x1,方差,方差s12,容量,容量n1樣本樣本2:平均數:平均數x2,方差,方差s22,容量,容量n2H0: 1=2 , HA: 12 =0.05-x2)(x1 _u=sx1-x2-u = (x1- x2)-( 1- 2) x1-x2u = (x1- x2)-( 1- 2)sx1-x2-x2)(x1 _u= x1-x2-sx1-x2-=s12n1s22n2+ 第三步第三步: 推斷推斷

33、 當當2.58 | |1.96時,推斷時,推斷u1和和u2的差異顯著;的差異顯著;當當| |2.58時,推斷時,推斷u1和和u2的差異極顯著;的差異極顯著;當當| |u0.01 ,所以否定,所以否定H0,接受,接受HA。認為兩個插秧期對水稻每穗結實數有極顯著影響。認為兩個插秧期對水稻每穗結實數有極顯著影響。062. 3)5031.174505 .294(=54. 3062. 326.4310.54=212121xxsxxt=由于假定由于假定 ,所以,所以 和和 都可用來作為都可用來作為 的估計值。的估計值。22221=21s22s2用用 t 測驗測驗21s22s用兩個方差用兩個方差 和和 的加

34、權平均數來估計。的加權平均數來估計。 12 22= 且兩個樣本為小樣本,但可假定且兩個樣本為小樣本,但可假定2. 兩個樣本所屬的總體方差兩個樣本所屬的總體方差 12 和和 22 未知,未知,2es 111121222121=nnnsns 112121=nnSSSS 1121222211=nnxxxxii)11(21221nnssexx=nssexx2221=當n1=n2=n時,212121xxsxxt=1121=nndf2121xxsxx=221=nn例例 3.8 為比較水稻田兩種氮肥淺施的效果,用完全隨機為比較水稻田兩種氮肥淺施的效果,用完全隨機排列進行試驗,產量結果列于下表,試測驗兩種排列

35、進行試驗,產量結果列于下表,試測驗兩種氮肥淺施對水稻產量的差異顯著性氮肥淺施對水稻產量的差異顯著性 。x1(淺施硝酸銨淺施硝酸銨)X2(淺施氯化銨淺施氯化銨)239.50248.15240.60255.85247.50261.20232.50257.40237.50255.40第一步:設立無效假設第一步:設立無效假設H0,備擇假設,備擇假設HA, 確定顯著水平。確定顯著水平。)(6 .2554 .255.85.25515.248512kgx= H0: 1= 2即兩種氮肥淺施水稻的產量無差異。即兩種氮肥淺施水稻的產量無差異。 HA: 1 2 =0.05 兩尾測驗。兩尾測驗。第二步:計算各個樣本平

36、均數,平方和,兩個樣本的第二步:計算各個樣本平均數,平方和,兩個樣本的合并均方,差數標準差和合并均方,差數標準差和t值。值。)(5 .2395 .237.6 .2405 .239511kgx=2222=xxSSi21.118=2225 .237.6 .2405 .239=55 .237.6 .2405 .239254 .255.85.25515.2482205.90=) 1() 1(21212=nnSSSSse052.26=) 15() 15(205.902 .118=2111=xxSSi2224 .255.85.25515.248=2121xxxxst=查附表查附表4,當,當df=5+5-2

37、=8時,時,t0.05=2.306,實得,實得|t|=4.98 |t|t0.05 ,所以否定,所以否定H0,接受,接受HA 。認為水田淺施氯化銨與淺施硝酸銨產量有顯著差異。認為水田淺施氯化銨與淺施硝酸銨產量有顯著差異。=21xxs)(23. 35052.262kg=nse2298. 423. 36 .2555 .239=第三步:推斷第三步:推斷例例 3.10 從前茬作物噴灑過有機砷殺蟲劑的麥田隨機采取從前茬作物噴灑過有機砷殺蟲劑的麥田隨機采取4樣株,測樣株,測定砷在植株體內的殘留量分別為定砷在植株體內的殘留量分別為7.5、9.7、6.8和和6.4mg,又,又從前作未噴灑過有機砷殺蟲劑的對照田隨

38、機從前作未噴灑過有機砷殺蟲劑的對照田隨機3株,測得砷株,測得砷含量為含量為 4.2、7.0和和4. 6 mg 。試測定噴灑有機砷殺蟲劑是否。試測定噴灑有機砷殺蟲劑是否使后作植株體內砷含量顯著地提高?使后作植株體內砷含量顯著地提高?噴灑有機砷殺蟲劑只能使后作植株體內砷含量提高,沒有降低噴灑有機砷殺蟲劑只能使后作植株體內砷含量提高,沒有降低的可能,所以用一尾測驗。的可能,所以用一尾測驗。 H0: 1 2 即噴灑有機砷殺蟲劑不會使后作植株體內砷含量提高即噴灑有機砷殺蟲劑不會使后作植株體內砷含量提高 HA: 1 2 =0.05 mgx6 . 744 . 68 . 67 . 95 . 71=mgx3 .

39、 536 . 40 . 72 . 42=50. 62111=xxSS59. 42222=xxSS) 1() 1(212222112=nnxxxxse218. 2=) 13() 14(59. 450. 6=2121121nnssexxmg14. 1)3141(218. 2=018. 214. 13 . 56 . 7=2121xxxxst=查附表查附表4,當,當df=4+3-2=5, 一尾概率一尾概率=0.05時,時,0.95=0.05當當df=5, 一尾概率一尾概率=0.05時時t0.05=2.015,實得,實得|t|=2.018,|t|t0.05 ,所以否定,所以否定H0,接受,接受HA,即前

40、作噴灑過有機砷農,即前作噴灑過有機砷農藥會顯著提高后作植株體內藥會顯著提高后作植株體內有機砷含量。有機砷含量。2.015=0.0250.95=0.025-2.5712.571當當df=5, 兩尾概率兩尾概率=0.05時時查附表查附表4,當,當df=4+3-2=5, 兩尾概率兩尾概率=0.05時,時,t0.05=2.571,實得實得|t|=2.018, |t|t0.05 ,所以否定所以否定H0,接受,接受HA,推斷玉米去雄與不去雄產量差,推斷玉米去雄與不去雄產量差異顯著。異顯著。) 1(22=nnnddsiid42. 0) 110(10102.112.112222=07. 3423. 03 .

41、1=dsdt (二)、(二)、成對數據的區間估計成對數據的區間估計dstdL=1dstdL=2在1-a概率保證下d置信區間的下限和上限為:名稱名稱成組數據成組數據成對數據成對數據依據條件依據條件樣本容量樣本容量 12和和 22標準差標準差測驗方法測驗方法ds21xxs21xx 兩個處理為完全隨機兩個處理為完全隨機設計,處理間供試的設計,處理間供試的單位相互獨立單位相互獨立兩個樣本觀察值因某種兩個樣本觀察值因某種聯系而一一對立,彼此聯系而一一對立,彼此相關相關可以相等,也可以不等可以相等,也可以不等必須相等必須相等已知或未知(假設已知或未知(假設 12= 22、 12 22)不受不受 12和和

42、22的影響的影響用用u測驗、測驗、t測驗測驗 或近似或近似t測驗測驗用用t測驗測驗第一節第一節 統計假設測驗的基本原理統計假設測驗的基本原理第二節第二節 單個平均數的假設測驗和單個平均數的假設測驗和區間估計區間估計第四節第四節 百分數的假設測驗和百分數的假設測驗和區間估計區間估計第三節第三節 兩個平均數的假設測驗和兩個平均數的假設測驗和區間估計區間估計第三章第三章 統計推斷統計推斷由非此即彼事件所構成的總體叫由非此即彼事件所構成的總體叫二項總體二項總體,也叫,也叫0,1總體。總體。 當每次獨立的從二項總體抽取當每次獨立的從二項總體抽取n個個體,這個個體,這n個個體:個個體:“此此”事件出現的次

43、數事件出現的次數X可能有可能有0、1、2、.n,共有共有n+1種種,這這n+1種可能性有它各自的概率,組成一個分布種可能性有它各自的概率,組成一個分布,這個這個分布叫分布叫二項概率分布二項概率分布或簡稱或簡稱二項分布二項分布。 )()(xnxxnqpCxp=A. n相同時相同時二項分布的形狀二項分布的形狀二項分布的形狀決定于二項分布的形狀決定于n和和p的大小的大小00.050.10.150.20.250.30.350123456p=q= 0.5 n=600.050.10.150.20.250.30.35012345600.050.10.150.20.250.30.350123456p=0.7

44、q=0.3 n=6p=0.3 q=0.7 n=6B. 當當n增大時增大時.00.050.10.150.20.250.30.350.40.45123456700.020.040.060.080.10.120.140.160.180.212345678910 11 12 13 1400.020.040.060.080.10.120.140.16123456789 10 11 12 13 14 15 16 17 18 19 20p=0.1 n=10p=0.1 n=50p=0.1 n=100由圖可見,由圖可見, p一定,圖形隨一定,圖形隨n而變化,而變化,n大,圖形頂點向中間移;大,圖形頂點向中間移;

45、n小,圖形偏度大。小,圖形偏度大。n,不論,不論p為何值,圖形都對稱。為何值,圖形都對稱。數統可證數統可證,當,當n,p不過小,二項分布不過小,二項分布正態分布正態分布 當當n,而,而p又相當小時,二項分布又相當小時,二項分布泊松分布泊松分布二項成數總體標準差二項成數總體標準差以以成數成數(百分數)百分數)表示表示:二項成數總體平均數二項成數總體平均數p=ppnpq=二項總體平均數二項總體平均數=npx以以次數次數表示表示:二項總體標準差二項總體標準差npqx= 二項分布屬間斷性變數資料,但是,當二項分布屬間斷性變數資料,但是,當n 較大,較大,p不過小,不過小,而而np和和nq又不小于又不小

46、于5 時時,二項分布接近正態,二項分布接近正態分布,因而可將百分數資料作正態分布處理,從而作分布,因而可將百分數資料作正態分布處理,從而作出近似的測驗。出近似的測驗。第四節第四節 樣本百分數的假設測驗和區間估計樣本百分數的假設測驗和區間估計單個樣本百分數的假設測驗和區間估計單個樣本百分數的假設測驗和區間估計兩個樣本百分數的假設測驗和區間估計兩個樣本百分數的假設測驗和區間估計一一. .單個樣本百分數的假設測驗和區間估計單個樣本百分數的假設測驗和區間估計(一)單個樣本百分數的假設測驗(一)單個樣本百分數的假設測驗 np,nq小于小于5時,通過二項展開式計算概率;時,通過二項展開式計算概率; np,

47、nq大于大于5,小于,小于30時,可以進行時,可以進行 u測驗,但要測驗,但要作連續性矯正;作連續性矯正; np,nq大于大于30時,進行時,進行u測驗,無需作連續矯正。測驗,無需作連續矯正。測驗某一樣本百分數測驗某一樣本百分數 p所在總體的百分數所在總體的百分數P是否與是否與某一理論值某一理論值P0相同。相同。若滿足正態接近法的條件若滿足正態接近法的條件, 則可對則可對H0:P=P0作作u測驗測驗無需連續矯正無需連續矯正需要連續矯正需要連續矯正pppu0 =pcnppu5 . 0)(0=pnpp5 . 00=百分數的標準誤百分數的標準誤npqp=例例3.16 某種子站引進一批小麥種子,平均發

48、芽率是某種子站引進一批小麥種子,平均發芽率是90%,為,為了防止種子帶菌,對這批種子進行藥物處理,并從處了防止種子帶菌,對這批種子進行藥物處理,并從處理后的種子中,隨機抽出理后的種子中,隨機抽出400粒進行發芽試驗,結果發粒進行發芽試驗,結果發芽種子數芽種子數356粒,不發芽粒,不發芽44粒,問藥物處理對種子發芽粒,問藥物處理對種子發芽率是否有影響。率是否有影響。這里這里n=400,p0=0.90, np,nq大于大于30時,可進行時,可進行u測驗,測驗,無需作連續矯正無需作連續矯正.H0: p=p0=0.90 即處理后的小麥種子平均發芽率仍為即處理后的小麥種子平均發芽率仍為90%;對對HA:

49、 p p0,顯著水平,顯著水平=0.05第二步:計算樣本百分數,標準誤,正態標準離差第二步:計算樣本百分數,標準誤,正態標準離差 89. 0400356=p已知已知 p=0.90 q=1-p=1-0.90=0.10ppp0 =015. 040010. 090. 0=u0.05=1.96,實得,實得|u| =0.667 , |u| u0.05 故否定故否定H0,接受,接受HA,推斷新農藥的殺蟲效果與原農藥有顯著不同。推斷新農藥的殺蟲效果與原農藥有顯著不同。069.0504 .06 .0=估計新農藥總體平均殺蟲率的估計新農藥總體平均殺蟲率的95%的置信區間。的置信區間。pupL=1pupL=2由于

50、由于H0被否定,被否定,新農藥的殺蟲效果顯著不同于原農藥。新農藥的殺蟲效果顯著不同于原農藥。ppspp0,psupL=1psupL=20604. 050)76. 01 (76. 0=nqpsppsupL=16420. 00604. 096. 176. 0=psupL=2878. 00604. 096. 176. 0=nsupLp5 . 01=nsupLp5 . 02=632. 0505 . 00604. 096. 176. 01=L888. 0505 . 00604. 096. 176. 02=L當當np,nq小于小于30時,對總體百分數的區間估計也要作連續性矯正。時,對總體百分數的區間估計也

51、要作連續性矯正。二二. . 兩個樣本百分數的假設測驗和區間估計兩個樣本百分數的假設測驗和區間估計(一)兩個樣本百分數的假設測驗(一)兩個樣本百分數的假設測驗 np,nq小于小于5時,按二項分布直接進行檢驗;時,按二項分布直接進行檢驗; np,nq大于大于5,小于,小于30時,可以進行時,可以進行 u測驗測驗 (t測驗測驗) ,但要作連續性矯正;但要作連續性矯正; np,nq大于大于30時,進行時,進行u測驗,無需作連續矯正。測驗,無需作連續矯正。測驗兩個樣本百分數測驗兩個樣本百分數p1和和p2的差異顯著性,即由兩樣本的差異顯著性,即由兩樣本百分數百分數p1和和p2之差推斷兩樣本所屬總體之差推斷

52、兩樣本所屬總體P1和和P2是否相同。是否相同。2121ppppu= np,nq大于大于30,進行,進行 u測驗,無需作連續矯正。測驗,無需作連續矯正。在在H0:P1=P2下下,21pp 分別從兩個總體抽出的兩個樣本百分數的差數為分別從兩個總體抽出的兩個樣本百分數的差數為 ,它服從平均數為它服從平均數為0,標準差為,標準差為 的正態分布。的正態分布。21pp 設設p1= x1/n1, p2= x2/n2,兩樣本百分數的差數標準誤為兩樣本百分數的差數標準誤為22211121nqpnqppp=)11()1 ()11(212121nnppnnqpspp=在兩總體的百分數為未知時,在在兩總體的百分數為未

53、知時,在 的假設下,的假設下,可用樣本百分數的加權平均值作為估計值可用樣本百分數的加權平均值作為估計值2221pp=兩總體百分兩總體百分數已知數已知p_x1+x2n1+n2=例例3.20 現研究一種新型殺蟲劑,試驗現研究一種新型殺蟲劑,試驗1000頭蟲子中殺死頭蟲子中殺死728頭,頭,原類似殺蟲劑,在原類似殺蟲劑,在1000頭蟲子中殺死頭蟲子中殺死657頭,問新型殺蟲劑的殺蟲頭,問新型殺蟲劑的殺蟲率是否高于原殺蟲劑?率是否高于原殺蟲劑?對對HA: p1 p23075. 06925. 011=pqH0: p1p2 即新型殺蟲劑的殺蟲率并不高于原殺蟲劑即新型殺蟲劑的殺蟲率并不高于原殺蟲劑顯著水平顯

54、著水平=0.056925. 0100010006577282121=nnxxp728. 010007281=p657. 010006572=p02063. 0)1000110001(3075. 06259. 021=pps44. 302063. 0657. 0728. 02121=ppsppuu0.05,所以否定,所以否定H0,接受,接受HA,一尾測驗一尾測驗=0.05時,時, u0.05=1.64,實得實得u=3.44,認為新型殺蟲劑的殺蟲效果顯著高于原殺蟲劑。認為新型殺蟲劑的殺蟲效果顯著高于原殺蟲劑。例例3.19 調查高肥水地某小麥品種調查高肥水地某小麥品種251株(株(n1),發現感白粉病的,發現感白粉病的238株(株(x1),感病率,感病率 為為0.948,同時調查中肥地該品種,同時調查

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論