試驗統(tǒng)計方法 3.第四章理論分布和抽樣分布學習資料_第1頁
試驗統(tǒng)計方法 3.第四章理論分布和抽樣分布學習資料_第2頁
試驗統(tǒng)計方法 3.第四章理論分布和抽樣分布學習資料_第3頁
試驗統(tǒng)計方法 3.第四章理論分布和抽樣分布學習資料_第4頁
試驗統(tǒng)計方法 3.第四章理論分布和抽樣分布學習資料_第5頁
已閱讀5頁,還剩58頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

【例題1】有一小麥品比試驗,共有8個品種,用A、B、C、D、E、F、G、H作為品種代號,其中A為對照品種。采用隨機區(qū)組設(shè)計,設(shè)置三次重復(fù),小區(qū)面積25m2。試作分析。小麥品比試驗(隨機區(qū)組)的產(chǎn)量結(jié)果(kg)區(qū)組ⅠⅡⅢTt平均品種A(CK)10.99.112.232.210.7B10.812.314.037.112.4C11.112.510.534.111.4D9.110.710.129.910.0E11.813.916.842.514.2F10.110.611.832.510.8G10.011.514.135.611.9H9.310.414.434.111.4Tr83.191.0103.9278【例題2】為了了解我國小麥品種的產(chǎn)量變異情況,今從品種資源庫中隨機抽取8個品種,用A、B、C、D、E、F、G、H作為品種代號,進行品比試驗。采用隨機區(qū)組設(shè)計,設(shè)置三次重復(fù),小區(qū)面積25m2。試作分析。堅強是什么?是長夜漫漫淚水流盡,依然早起擁抱新的太陽樂觀是什么?是暴雨傾盆沒有帶傘,就笑著跑著來一場淋浴游戲第四章理論分布和抽樣分布概率基礎(chǔ)知識幾種常見的理論分布離散型隨機變量的理論分布

二項分布泊松分布

連續(xù)性隨機變量的理論分布

正態(tài)分布抽樣分布

第一節(jié)事件、概率和隨機變量一、事件和事件發(fā)生的概率

在科學試驗和生產(chǎn)實踐中,人們會觀察到各種各樣的現(xiàn)象,每種現(xiàn)象出現(xiàn)的可能結(jié)果稱為事件。必然事件:在一定條件下必然出現(xiàn)的現(xiàn)象。用U表示。不可能事件:在一定條件下必然不出現(xiàn)的事件,用V表示。隨機事件:相同條件下重復(fù)進行試驗,而事前無法預(yù)言其隨后結(jié)果(可出現(xiàn)也可不出現(xiàn))的現(xiàn)象。

隨機事件的特點:

(1)試驗可以在相同條件下多次重復(fù)進行;(2)每次試驗的可能結(jié)果不止一個,并且

事先知道會有哪些可能的結(jié)果;(3)每次試驗總是恰好出現(xiàn)這些可能結(jié)果

中的一個,但在一次試驗之前卻不能

肯定這次試驗會出現(xiàn)哪一個結(jié)果。一次或少數(shù)試驗,結(jié)果呈現(xiàn)偶然性。大量重復(fù)試驗,試驗結(jié)果呈現(xiàn)某種規(guī)律性——頻率的穩(wěn)定性。例如:拋擲一枚硬幣發(fā)生正面朝上的頻率試驗結(jié)果試驗的次數(shù)頻率1.000.000.250.500.750255075100125

概率(probability)

一個事件發(fā)生的可能性,稱為概率。

事件A的概率表示方法為P(A)。

1、對于任何事件A,有0≤P(A)≤1;2、必然事件的概率為1,即P(U)=1;3、不可能事件的概率為0,即P(V)=0。

小概率原理若隨機事件的概率很小,稱之為小概率事件。

例如:統(tǒng)計學一般將概率小于0.05、0.01、0.001,稱為小概率?!鲈谝淮卧囼炛胁豢赡馨l(fā)生;■大量試驗中,一定發(fā)生。

小概率事件在一次試驗中看成是實際不可能發(fā)生的事件,稱為小概率事件實際不可能性原理,亦稱為小概率原理。小概率原理是統(tǒng)計學上進行假設(shè)檢驗(顯著性檢驗)的基本依據(jù)。

二、事件間的關(guān)系(P48)

三、計算事件概率的法則(P49)

四、隨機變量(randomvariable)

作一次試驗,其結(jié)果有多種可能。每一種可能結(jié)果的出現(xiàn)都具有一定的隨機性和偶然性,這些變量叫隨機變量。

隨機變量常用X、Y和Z等表示.離散型隨機變量(discreterandomvariable);

如果隨機變量X的結(jié)果是明確的,并可一一列出,當X取某一值時,其概率是確定的,則稱X為離散型隨機變量。離散型隨機變量的概率分布

要了解離散型隨機變量的統(tǒng)計規(guī)律,就必須知道它的一切可能值xi及取每種可能值的概率pi。

常用分布列來表示:x1x2…xi…p1p2…pi…

pi≥0,Σpi=1連續(xù)型隨機變量(continuousrandomvariable)。

如果表示試驗結(jié)果的變量X,其可能取值為某范圍內(nèi)的任何數(shù)值,且X在其取值范圍內(nèi)的任一區(qū)間中取值時,其概率是確定的,則稱X為

連續(xù)型隨機變量。連續(xù)型隨機變量的概率分布

連續(xù)型隨機變量(如產(chǎn)量、株高)的概率分布不能用分布列來表示,因為其可能取值是不可數(shù)的。我們改用隨機變量X在某個區(qū)間內(nèi)取值的概率P(a≤x<b)來表示。P(a≤x<b)=

連續(xù)型隨機變量概率分布的性質(zhì):

1、f(x)≥0;2、

(c為任意實數(shù))因而,對于連續(xù)型隨機變量,僅研究其在某一個區(qū)間內(nèi)取值的概率,而不去討論取某一個值的概率。3、

第二節(jié)二項分布一、二項總體和二項分布生物學研究中經(jīng)常碰到離散型的隨機變量,常??梢园涯硞€性狀分成兩種類型,例如,種子的發(fā)芽與不發(fā)芽、穗子有芒與無芒、哺乳動物的雄性與雌性等。由對立事件構(gòu)成的總體,稱為二項總體。貝努里試驗:試驗的對象只有兩種結(jié)果,事件A和A。事件A的概率是p,事件A的概率是q。而且p+q=1事件A和A是可以計數(shù)的。從二項總體中連續(xù)抽取n個個體,將結(jié)果是A的次數(shù)記為X。以x表示事件A在n個個體中出現(xiàn)的次數(shù),則x是一個離散型隨機變量。它的所有可能取值為0,1,2,…,n,其概率分布函數(shù)為:稱P(x)為隨機變量x的二項分布,記作B(n,p),也叫貝努里分布。如果連續(xù)進行N次同樣的抽樣,得到某一觀察值xi的理論次數(shù)則為:理論次數(shù)=

N·P(xi)二項分布的概率累積函數(shù):F(x)=∑P(x=i)

i=0x二項分布的特征:

(1)每個試驗只有兩個對立結(jié)果。(2)若其中一個結(jié)果的概率為p,則其對立結(jié)果的概率為q=1-p(3)n次試驗是互相獨立的,即每個試驗結(jié)果不會影響到其它試驗結(jié)果。二、二項分布的概率計算

【例題1】豌豆紅花與白花雜交,根據(jù)孟德爾遺傳理論,F(xiàn)2代中紅花與白花的比率為3:1。若一次隨機觀察12株,有7株紅花的概率是多少?若連續(xù)觀察50次,理論上有幾次出現(xiàn)7株紅花?解:n=12,p=3/4=0.75,

q=1/4=0.25。設(shè)12株豌豆中紅花的株數(shù)以x表示,則x為服從二項分布B(12,0.75)的隨機變量。于是12株豌豆中有7株是紅花的概率為:P(7)=C127.p7.q5=792×0.757×0.255=0.1032若觀察50次(N),出現(xiàn)7株紅花的理論次數(shù)為理論次數(shù)=N×P(7)=50X0.1032=5.16(次)例題2某小麥品種在田間出現(xiàn)自然變異植株的概率為0.0045,試計算:(1)觀察100株,獲得兩株或兩株以上變異植株的概率是多少?(2)期望有0.99的概率獲得1株或1株以上的變異植株,至少應(yīng)觀察多少株?解:已知變異株概率p=0.0045非變異株的概率q=1-p=0.9955

n=100

(1)獲得0個變異株概率,

x=0,P(0)=0.6370 獲得1個變異株概率,

x=1,P(1)=0.2879

獲得2株或以上變異株概率為:

x≥2,P(x≥2)=1-P(0)-P(1)=0.0751(2)如果期望調(diào)查n株中至少有1株是變異株的概率是0.99,則獲得非變異株的概率:P(0)=1-0.99=0.01即:x=0,P(0)=因為q=0.9955,所以,因此,至少應(yīng)觀察1021株才能滿足要求。三、二項分布的形狀和參數(shù)1.二項分布的形狀

由n和p兩個參數(shù)決定(1)當p值較小且n值不大時圖形是偏畸的。隨著n值的增大,分布逐漸趨于對稱。(2)當p值趨于0.5時,分布趨于對稱。

2、二項分布的參數(shù)

二項總體次數(shù)分布的參數(shù)

若隨機變量(次數(shù)X)服從二項分布B(n,p)平均數(shù)μx=np

標準差(例題):豌豆花色遺傳,F(xiàn)2代紅花P=0.75。每次觀察10株,觀察100次,由此形成一個二項分布。求出現(xiàn)紅花的平均次數(shù)及標準差。

以p=0.75,n=10代入上式得:μx=np=10×0.75=7.5(株)

=1.37(株)四、泊松分布---二項分布的一種極限分布

1、泊松分布的意義在生物學研究中,當許多事件出現(xiàn)的概率很小,而樣本的容量或試驗次數(shù)卻往往很大,即有很小的p值和很大的n值時,二項分布就變成了一種特殊的分布——泊松分布(Poissondistribution)。泊松分布也是一種離散型隨機變量的分布,其分布的概率函數(shù)為:式中,λ為參數(shù),λ=np,x=0,1,2,…,∞。稱x服從參數(shù)為λ的波松分布,記為x~P(λ)。泊松分布的平均數(shù)和方差、標準差為:

μ=λ σ2=λ

μ=σ2=λ

是泊松分布的重要特征二項分布中,一般當P<0.1和np<5時,可用泊松分布來近似計算。

2、波松分布的概率計算

由上式可知,波松分布的概率計算,依賴于參數(shù)λ的確定。但是在大多數(shù)服從波松分布的實例中,分布參數(shù)λ往往是未知的,只能從所觀察的隨機樣本中計算出相應(yīng)的樣本平均數(shù)作為λ的估計值。進而計算出x=0,1,2,…時的各事件概率。

泊松分布是描述在一定空間或時間內(nèi),稀少點子散布狀況的一種理論分布。在農(nóng)業(yè)生物學上有著較廣泛應(yīng)用。μ=σ2=λ

是泊松分布的重要特征解:100m2麥田中,平均雜草株數(shù)μμ=1×100/10=10(株)因此根據(jù)進而可求出100m2麥田中有x株雜草的概率.例題1:麥田內(nèi),平均每10m2有1株雜草,現(xiàn)在要問每100m2麥田中,有0株、1株、2株…的概率是多少?雜草數(shù)(x)≤5678910概率P(x)0.06700.06310.09010.11260.12510.1137雜草數(shù)(x)11121314≥15概率P(x)0.11370.09480.07290.05210.0835每100m2麥田中雜草株數(shù)的概率第三節(jié)正態(tài)分布一種很重要的連續(xù)型隨機變量的概率分布:(1)生物現(xiàn)象中有許多變量是服從或近似服從正態(tài)分布的。因此許多統(tǒng)計分析方法都是以正態(tài)分布為基礎(chǔ)的。(2)還有不少隨機變量的概率分布在一定條件下以正態(tài)分布為其極限分布。因此在統(tǒng)計學中,正態(tài)分布無論在理論研究上還是實際應(yīng)用中,均占有重要的地位。一、正態(tài)分布的定義

若連續(xù)型隨機變量x的概率分布密度函數(shù)為:

其中μ為平均數(shù),σ2為方差,則稱隨機變量x服從正態(tài)分布(normaldistribution),記為x~N(μ,σ2)。

μ是位置參數(shù)。當σ恒定時,μ愈大,則曲線沿x軸愈向右移動;反之,μ愈小,曲線沿x軸愈向左移動。σ是變異度參數(shù)。σ愈大,表示x的取值愈分散,曲線愈“胖”;σ愈小,x的取值愈集中在μ附近,曲線愈“瘦”。

二、正態(tài)分布的特征

1、正態(tài)分布密度曲線是單峰、對稱的懸鐘形曲線,對稱軸為x=μ;2、f(x)在x=μ處達到極大,極大值為;

3、f(x)是非負函數(shù),以x軸為漸近線,分布從-∞至+∞;

5、正態(tài)分布有兩個參數(shù),即平均數(shù)μ和標準差σ。6、分布密度曲線與橫軸所夾的面積為1,即:4、曲線在x=μ±σ處各有一個拐點,即曲線在(-∞,μ-σ)和(μ+σ,+∞)區(qū)間是下凸的,在[μ-σ,μ+σ]區(qū)間是上凸的;

二、標準正態(tài)分布

正態(tài)分布是依賴于參數(shù)μ和σ2(或σ)的一簇曲線。這就給研究具體的正態(tài)總體帶來困難,需將一般的N(μ,σ2)轉(zhuǎn)換為μ=0,σ2=1的正態(tài)分布。

我們稱μ=0,σ2=1的正態(tài)分布為標準正態(tài)分布(standardnormaldistribution)。

標準正態(tài)分布的概率密度函數(shù)記作f(u):

隨機變量u服從標準正態(tài)分布,記作u~N(0,1),分布密度曲線如下頁圖。

對于任何一個服從正態(tài)分布N(μ,σ2)的隨機變量x,都可以通過標準化變換:u=(x-μ)/σ將其變換為服從標準正態(tài)分布N(0,1)的隨機變量u。

u稱為標準正態(tài)變量或標準正態(tài)離差(standardnormaldeviate)。

三、正態(tài)分布的概率計算(一)標準正態(tài)分布的概率計算在連續(xù)性隨機變數(shù)中,不能計算某一定值的概率,只能計求某一區(qū)間或范圍的概率。在標準正態(tài)分布曲線下,變量u在[a,b]區(qū)間的概率可用曲線下區(qū)間的面積來表示。區(qū)間的概率可用下式表示P(a≤u<b)

正態(tài)分布曲線下一∝到u的面積,可以通過定積分得出,即:

F(ui)稱為標準正態(tài)分布的累積函數(shù)。它是變量u小于某一定值ui的概率。因此,正態(tài)分布任一區(qū)間的概率可以如下式計算:

P(u1≤u<u2)=F(u2)-F(u1)

由于標準正態(tài)分布的概率累積函數(shù)具有廣泛的應(yīng)用,所以,統(tǒng)計學家已計算好實際需要的各個F(ui)值,列于附表1(P336)。學習查表例如,u=1.75,累計概率F(1.75)是多少?從第一列中找到1.7,在第一行中找到0.05。行與列相交處的數(shù)值為0.95994,所以

F(1.75)=0.95994有時會遇到給定F(u)值,反過來查u值。

例如:

F(u)=0.284,u值是多少?

這只要在附表2中找到與0.284最接近的值0.2843,對應(yīng)行的第一列數(shù)-0.5,對應(yīng)列的第一行數(shù)值0.07

即相應(yīng)的u值為u=-0.57。

由正態(tài)分布的對稱性可推出下列關(guān)系式,再借助附表2,便能很方便地計算有關(guān)概率:

P(0≤u<u1)=

P(u≥u1)=

P(|u|≥u1)=

P(|u|<u1)=

F(u1)-0.5F(-u1)2F(-u1)1-2F(-u1)

關(guān)于標準正態(tài)分布,以下幾種概率經(jīng)常用到:

P(-1≤u<1)=0.6826P(-2≤u<2)=0.9545

P(-3≤u<3)=0.9973

P(-1.96≤u<1.96)=0.95P(-2.58≤u<2.58)=0.99

u變量在上述區(qū)間以外取值的概率分別為:

P(|u|≥1)=2F(-1)=1-P(-1≤u<1)=1-0.6826=0.3174P(|u|≥2)=2F(-2)=1-P(-2≤u<2)=1-0.9545=0.0455P(|u|≥3)=1-0.9973=0.0027

P(|u|≥1.96)=1-0.95=0.05P(|u|≥2.58)=1-0.99=0.01

從上述計算可知,雖然正態(tài)分布u的取值區(qū)間為(一∝,十∝),但實際上|u|>2.58的概率只有0.0l,|u|>1.96的概率也只有0.05,即:在u±1.96和u±2.58范圍內(nèi)已分別包含了95%和99%的變量值。(二)標準正態(tài)分布的兩尾概率和單尾概率以上在計算P(|u|≥1)和P(|u|≥2.58)等概率時,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論