




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第三章理論分布與抽樣分布為了便于理解統計分析的基本原理,正確掌握和應用統計分析方法,本章在介紹概率論中最基本的兩個概念-事件、概率的基礎上,重點介紹科學研究中常用的幾種隨機變量的概率分布-正態分布、二項分布、波松分布以及樣本平均數的抽樣分布和t分布。下一張
主頁
退出
上一張
1事事件與與概率1.1事事件件1.1..1必必然現象象與隨機機現象在自然界界與生產產實踐和和科學試試驗中,,人們會會觀察到到各種各各樣的現現象,把把它們歸歸納起來來,大體體上分為為兩大類類:下一張主頁頁退出出上一張必然現象象:可預言其其結果的的,即在在保持條條件不變變的情況況下,重重復進行行試驗,,其結果果總是確確定的,,必然發發生的((或必然然不發生生)。這這類現象象稱為必然現象象(inevitablephenomena)或確定性現現象(definitephenomena)。。隨機現象象:另一類是是事前不不可預言言其結果果的,即即在保持持條件不不變的情情況下,,重復進進行試驗驗,其結結果未必必相同。。這類在在個別試試驗中其其結果呈呈現偶然然性、不不確定性性現象,,稱為隨機現象象(randomphenomena))或不確定性性現象象(indefinitephenomena))。下一張主頁頁退出出上一張隨機現象象或不確確定性現現象,有有如下特特點:在一定的的條件實實現時,,有多種種可能的的結果發發生,事事前人們們不能預預言將出出現哪種種結果;;對一次次或少數數幾次觀觀察或試試驗而言言,其結結果呈現現偶然性性、不確確定性;;但在相同同條件下下進行大大量重復復試驗時時,其試試驗結果果卻呈現現出某種種固有的的、特定定的規律律性———頻率的穩穩定性,通常稱稱之為隨隨機現象象的統計計規律性性。下一張主頁頁退出出上一張1.1..2隨隨機試驗驗與隨機機事件1隨隨機試驗驗通常我們們把根據據某一研研究目的的,在在一定定條件下下對自然然現象所所進行的的觀察或或試驗統統稱為試驗(trial))。當當一個試試驗如果果滿足下下述三個個特性,,則則稱稱其為為一一個隨機試驗驗(randomtrial),簡簡稱試驗。下一張主頁頁退出出上一張(1)試試驗可以以在相同同條件下下多次重重復進行行;(2)每每次試驗驗的可能能結果不不止一個個,并并且事先先知道會會有哪些些可能的的結果;;(3)每每次試驗驗總是恰恰好出現現這些可可能結果果中的一一個,,但在一一次試驗驗之前卻卻不能肯肯定這次次試驗會會出現哪哪一個結結果。下一張主頁頁退出出上一張2隨隨機事件件隨機試驗驗的每一一種可能能結果,,在一定定條件下下可能發發生,也也可能不不發生,,稱為隨機事件件(randomevent),簡簡稱事事件((event)),通常常用A、B、、C等來表示示。(1)基基本事件件我們把把不不能再再分分的事件件稱為基本事件件(elementaryevent),,也也稱為為樣本點(samplepoint)。下一張主頁頁退出出上一張例如,從從編號為為1、2、3、、…、10的的十個籃籃球中隨隨機抽取取1個籃籃球,有有10種種不同的的可能結結果:“取得得一一個編編號號是1”、、““取取得一一個編號號是2””、…、、“取得得一個編編號是10”,,這10個事件件都是不不可能再再分的事事件,它它們都是是基本事事件。由若干個個基本事事件組合合而成的的事件稱稱為復合事件件(compoundevent))。如““取取得一個個編號是是2的的倍數””是一個個復合事事件,它它由““取取得一個個編號是是2””、““是4”、““是6、、“是8”、““是10”5個基本事事件組合合而成。。下一張主頁頁退出出上一張(2)必必然事件件把在一定定條件下下必然會會發生的的事件稱稱為必然事件件(certainevent),,用Ω表表示。例例如,,一個大大氣壓下下,水加加熱到100C,水會會沸騰;;種瓜得得瓜、種種豆得豆豆下一張主頁頁退出出上一張(3)不不可能事事件在一定條條件下不不可能發發生的事事件稱為為不可能事事件(impossibleevent),,用ф表表示。例例如,在在滿足一一定孵化化條件下下,從石石頭孵化化出小雞雞,就是是一個不不可能事事件。必然事件件與不可可能事件件實際上上是確定定性現象象,它們們不是隨隨機事件件,但但是為為了方方便起見見,我們們把它們們看作為為兩個特特殊的隨隨機事件件。1.2概概率率1.2..1概概率統統計定義義研究隨機機試驗,,僅知道道可能發發生哪些些隨機事事件是不不夠的,,還需了了解各種種隨機事事件發生生的可能能性大小小,以揭揭示這些些事件的的內在的的統計規規律性,,從而指指導實踐踐。這就就要求有有一個能能夠刻劃事件件發生可可能性大大小的數數量指標標,這個指指標應該該是事件件本身所所固有的的,且不不隨人的的主觀意意志而改改變,人人們稱之為概概率(probability))。事件件A的概率記記為P(A)。下一張主頁頁退出出上一張概率:刻刻劃事件件發生可可能性大大小的數數量指標標概率統計計定義::在相同條條件下進進行n次重復試試驗,如如果隨機機事件A發生的次次數為m,那么m/n稱為隨機機事件A的頻率(frequency));當試試驗重復復數n逐漸增大大時,隨隨機事件件A的頻率越越來越穩穩定地接接近某一一數值p,那么么就把p稱為隨機機事件A的概率。下一張主頁頁退出出上一張如此定義義的概率率稱為統統計概率率(statisticsprobability),或者者稱后驗驗概率((posteriorprobability)。表3-1拋擲擲一枚硬硬幣發生生正面朝朝上的試試驗記錄錄下一張主頁頁退出出上一張例如為為了確定定拋擲一一枚硬幣幣出現正正面朝上上這個事事件的概概率,,歷史上上有人作作過成千千上萬次次拋擲硬硬幣的試試驗。在在表3——1中列列出了他他們的試試驗記錄錄。從表3--1可看看出,隨隨著實驗驗次數的的增多,,正面朝朝上這個個事件發發生的頻頻率越來來越穩定定地接近近0.5,我們們就把0.5作作為這個個事件的的概率。。在一般情情況下,,隨機事事件的概概率p是不可能能準確得得到的。。通常以以試驗次次數n充分大時時隨機事事件A的頻率作作為該隨隨機事件件概率的的近似值值。即P(A))=p≈m//n(n充分大))(3-1)下一張主頁頁退出出上一張1.2..2概概率的性性質(1)對對于任何何事件A,有0≤≤P(A))≤1;(2)必必然事件件的概率率為1,,即P(Ω)=1;;(3)不不可能事事件的概概率為0,即P(ф)==0。2概概率分布布事件的概概率表示示了一次次試驗某某一個結結果發生生的可能能性大小小。若要要全面了了解試驗驗,則必必須知道道試驗的的全部可可能結果果及各種種可能結結果發生生的概率率,即必必須知道道隨機試試驗的概概率分布布(probabilitydistribution)。。為了深深入研究究隨機試試驗,,我們們先引引入隨機機變量((randomvariable)的概概念。下一張主頁頁退出出上一張2.1隨隨機變變量下一張主頁頁退出出上一張2004年奶粉事事件“大大頭娃””描述隨機機事件的的變量稱稱為隨機機變量。。隨機變變量的取取值在一一次試驗驗前不能能確定,,具有隨隨機性。。作一次次試驗,,其結果果有多種種可能。。每一種種可能結結果都可可用一個個數來表表示,把把這些數數作為變量x的取值,則試驗驗結果可可用變量量x來表示。。【例】對10種品牌袋袋裝奶粉粉進行質質量檢測測,其可可能結果果是“0種合格””、““1種合格””、“2種合格””、“…”、“10種袋裝奶奶粉都合合格”。。若用x表示袋裝裝奶粉合合格品牌牌數,則則x的取值為為0、1、2、…、10。【例】食食品品加工中中高溫殺殺菌可能能結果只只有兩種種,即““全部殺殺死細菌菌”與““未能全全部殺死死細菌””。若若用變量量x表示試驗驗的兩種種結果,,則可令令x=0表示示“未能能全部殺殺死細菌菌”,x=1表示示“全部部殺死細細菌”。。【例】測測定定關中地地區不同同小麥品品種的蛋蛋白質含含量,其其蛋白質質含量在在9.3-13.5%%之間,,如用x表示測測定結果果,那么么x值可以是是這個范范圍內的的任何實實數。下一張主頁頁退出出上一張離散型型隨隨機變變量量:如果表示示試驗結結果的變變量x,其可能能取值為為可列個個,且且以各各種確定定的概率率取這些些不同的的值,,則稱稱x為離散型型隨隨機變變量量(discreterandomvariable);;連續型型隨機機變變量::如果表示示試驗結結果的變變量x,其可能能取值為為某范圍圍內的任任何數值值,且且x在其取值值范圍內內的任一一區間中中取值時時,其概概率是確確定的,,則稱x為連續型型隨機機變變量(continuousrandomvariable))。下一張主頁頁退出出上一張試驗結果果和取此此結果的的概率可可以一一一列出。。不能列出出試驗結結果和取取此結果果的概率率,只能能給出一一定范圍圍和在此此范圍內內取值的的概率。。2.2離離散型型隨機變變量的概概率分布布要了解離離散型隨隨機變量量x的統計規規律,就就必須知知道道它的一一切可能能值xi及取每種種可能值值的概率率pi。如果我們們將離散散型隨機機變量x的一切可可能取值值xi(i=1,2,,…)),及其對對應的概概率pi,記作P(x=xi)=pii=1,2,…(3—3)則稱((3—3)式為為離散型隨隨機變量量x的概率分分布或分分布。常用分布列列(distributionseries)來來表示::下一張主頁頁退出出上一張x1x2…xn….p1p2…pn…從分布列列可以一一目了然然看出隨隨機變量量X的可可能取值值及取這這些值的的概率。。離散型隨隨機變量量的概率率分布具具有pi≥0和ΣΣpi=1這兩兩個基本本性質。。2.3連連續型型隨機變變量的概概率分布布連續型隨隨機變量量(如如身高、、體重等等)的概概率分布布不能用用分布列來表示,,因為為其可能能取值是是不可數數的,不不能一一一列出。。改用隨隨機變量量x在某某個區間間內取值值的概率率P(a≤x<<b)來表示示。下下面通過過頻率分分布密度度曲線予予以說明明。下一張主頁頁退出出上一張圖4—1為數據據資料的的頻率分分布直方方圖,,圖中縱縱座標取取頻率與與組距的的比值。。可以以設想,,如果果樣本取取得越來來越大((n→+∞)),組分分得越來來越細((i→0),,某一范范圍內的的頻率將將趨近于于一個穩穩定值--概率。這時,,頻頻率分布布直方圖圖各個直直方上端端中點的的連線--頻率分布布折線將逐漸趨趨向于一一條曲線線。下一張主頁頁退出出上一張當n→+∞、、i→0時,,頻率分布布折線的的極限是是一條穩穩定的函函數曲線線。對于于樣本是是取自連連續型隨隨機變量量的情況況,這這條函數數曲線將將是光滑滑的。這這條曲曲線排除除了抽樣樣和測量量的誤差差,完完全全反映映了數據據資料料的變動動規律。。這條條曲線叫叫概率分布布密度曲曲線,相應的的函數叫叫概率分布布密度函函數,,簡稱分分布密度度。下一張主頁頁退出出上一張(3—4)式式為連連續續型隨隨機變變量x在區間間[a,b)上取值值概率的的表達式式。可見見,連續續型隨機機變量的的概率由由概率分布布密度函函數確定。若變量X概率分布布密度函函數記為f(x),則x取值于區區間[a,b)的概率率為圖中中陰影部部分的面面積,即即P(a≤≤x<b)=((3-4))連續型隨隨機變量量概率分分布的性性質:1、分布布密度函函數總是是大于或或等于0,即f(x))≥0;2、當隨隨機變量量x取某一特特定值時時,其概概率等于于0;即即(c為任意實實數)所以,對對于連續續型隨機機變量,,僅研究究其在某某一個區區間內取取值的概概率,而而不去討討論取某某一個值值(點))的概率率。下一張主頁頁退出出上一張連續型隨隨機變量量某一點點的概率率為0。3、隨隨機變量量x取值在在-∞<x<+∞∞范圍內,,所以下一張主頁頁退出出上一張(3-5)(3—5)式表示分分布密度度曲線與與橫軸所所圍成的的區間全全部面面積為1。P(a≤x<b)=4、隨機變變量X取〔a,b)區間值值的概率率為:3理理論分布布3.1二二項分分布3.1..1貝貝努利試試驗及其其概率公公式貝努利試試驗:對于n次獨立的的試驗,,如如果每次次試驗結結果出現現且只出出現對立立事件A與之之一一,在在每次試試驗中出出現A的概率是是常數p(0<p<1),,因因而出現現對立事事件的的概率是是1-p==q,則稱稱這一一串重復復的獨立立試驗為為n重貝努利利試驗,,簡稱貝貝努利試試驗(Bernoullitrials)。。下一張主頁頁退出出上一張重要的離離散型分分布只有兩種種可能結結果的隨隨機試驗驗稱為貝貝努利試試驗食品抽樣樣中,產產品合格格或不合合格,種子發芽芽或不發發芽,施施藥后害害蟲死或或活等等等。貝努利試試驗的概概率公式式在貝努利利試驗中中,事件件A可能發生生,也可可能不發發生,用用隨機變變量x表示貝努努利試驗驗的兩種種結果,,記A發生時取取1,A不發生時時取0。那么,,貝努利利試驗的的概率公公式可以以表示為為:P(x=1)=pP(x=0)=q其中x=1,A事件發生,成功0,A事件未發生,失敗也稱為兩兩點分布布(3-6)在n重貝努利利試驗中中,事件件A可能發生生0,1,2,,…,n次,現在在我們來來求事件件A恰好發生生k(0≤k≤n)次的概概率Pn(k)。事件A在n次次試驗中中正好發發生k次次共有種種情情況。由由貝努利利試驗的的獨立性性可知,,A在k次實驗驗中發生生,而在在其余n-k次次試驗中中不發生生的概率率為下一張主頁頁退出出上一張3.1..2二項分布布的定義義及其特特點一般,在在n重貝努利利試驗中中,事件件A恰好發生生k(0≤k≤n)次次的概率率為下一張主頁頁退出出上一張k=0,1,2……,n(3-7)若把(3-7)式與二項項展開式式相比較就就可以發發現,在在n重貝努利利試驗中中,事件件A發生k次的概率率恰好等等于展開開式中的的第k+1項,所以以也把(3-7)式稱作二項概率率公式。1.二二項分布布定義設隨機變變量x所有可能能取的值值為零和和正整數數:0,,1,2,…,,n,且有=k=0,1,2……,n其中p>0,,q>0,p++q=1,則稱隨機變量量x服從從參數為為n和p的二項分分布(binomialdistribution),記為x~B((n,p)。下一張主頁頁退出出上一張二項分分布是是一種離離散型隨隨機變量量的概率率分布。。參數n稱為離散散參數,,只只能取正正整數;;p是連續參參數,它它能取0與1之間的任任何數值值(q由p確定,故故不是另另一個獨獨立參數數)。下一張主頁頁退出出上一張(3-10)(5)(3)(4)(3-8)(3-9)(m1<m2)2.二項分布布的特點點具有概率率分布的的一切性性質,即即:(1)P(x=k)=Pn(k)≥0(k=0,,1,…,n)(2)二項分分布的概概率之和和等于1,即圖3-1n值不同的的二項分分布比較較(2))當p值趨于于0.5時時,,分布布趨于于對稱,,如圖所示;(3)對對于固定定的n及p,當k增加時,,Pn(k)先隨之之增加并并達到其其極大值值,以后后又下降降。(4)在在n較大,np、nq較接近時時,二二項分布布接近于于正態分分布;當當n→∞時,,二項分分布的極極限分布布是正態態分布。。下一張主頁頁退出出上一張二項分布布由n和p兩個參數數決定,,其特點點是:(1)當當p值較小且且n不大時,,分布布是是偏倚的的。但隨隨著n的增大,,分布布逐漸趨趨于對稱稱,如圖所示;圖3-2p值不同的的二項分分布比較較3.1..3二二項分分布的概概率計算算及應用用條件(1)已已知隨機機變量x~B(n,,p),,求x正正好有k次發生生的概率率。【例p43】有有一批食食品,其其合格率率為0..85,,今在該該批食品品中隨機機抽取6份該食食品,求求正好有有5份食食品合格格的概率率?由題意可可知,食食品抽檢檢結果有有兩種可可能,合合格與不不合格,,合格率率為0..85,,即P((A)==0.85,相相應不合合格率為為P())=1--0.85=0.15,由概概率公式式得,正正好有5個合格格產品的的概率為為:下一張主頁頁退出出上一張(2)已知隨機機變量x~B(n,,p),,求x最最多發生生k次的的概率。。例:同上上例,問問最多有有4個合合格的概概率是多多少?當產品最最多有k個合格格時,即即可能的的合格數數為0,,1,2,…,,k,那那么為最多有有k個合合格產品品的概率率。在本例中中,下一張主頁頁退出出上一張二項分布布的應用用條件::(1)各各觀察單單位只只具有相相互對立立的一一種結果果,如合合格或不不合格,,生存存或死亡亡等等,,非此即即彼;(2)已已知發生生某一結結果((如死亡亡)的的概率為為p,其對立立結果的的概率則則為1-P=q,實際中中要求p是從大量量觀察中中獲得的的比較穩穩定的數數值;(3)n次觀察結結果互相相獨立,,即每個個觀察單單位的觀觀察結果果不會影影響到其其它觀察察單位的的觀察結結果。下一張主頁頁退出出上一張3.1..4二二項分布布的平均均數與標標準差統計學證證明,服服從二項項分布B(n,p)的隨機機變量x的平均均數μ、、標準差差σ與參參數n、p有如下關關系。設x~B(n,,p),,那么,二二項分布布的總體體特征數數為:下一張主頁頁退出出上一張均值μ=np標準差σ=方差σ2=npq當試驗結結果以事事件A發生的頻頻率k/n表示時也稱為總總體百分分數的標標準誤,,當p未知時時,常以以樣本百百分數來來估計計。此時時式式改寫寫為:=稱為樣本本百分數數標準誤誤。下一張主頁頁退出出上一張3.2波波松分分布(Poisson)波松分布布是一種種可以以用來描描述和分分析隨機機地發生生在單位位空間或或時間間里的稀有事件件的概率分分布。要要觀察到到這類事事件,樣樣本含量量n必須很大大。所謂稀有有事件即即是小概概率事件件。在生物、、醫學等等研究中中,服從從波松分分布的隨隨機變量量也是常常見的。。例如,,正常生生產線中中單位事事件生產產出不合合格產品品個數,,單位事事件內機機器出現現故障的的次數,,每升飲飲水中大大腸桿菌菌數,計計數器小小方格中中血球數數,一一批香腸腸中含有有毛發的的香腸數數,1000袋袋面粉中中含有金金屬物的的袋數等等等,都都是服從從或近似似服從波波松分布布的。下一張主頁頁退出出上一張3.2..1波波松分布布的定義義若隨機變變量x(x==k)所有可能能取值是是非負整整數,且且其概率率分布為為其中λ>>0;e=2..7182…,,則稱稱x服從參參數數為λλ的的波松松分布布(Poisson‘sdistribution)),記為為x~P(λ)。。下一張主頁頁退出出上一張k=0,1,……λ是波松松分布所所依賴的的唯一參參數。λλ值值愈小分分布愈偏偏倚,隨隨著λ的的增大,,分布布趨于于對稱((如圖所示)。。當λ==20時分布布接近于于正態分分布;當當λ=50時,,可以以認為為波松分分布呈正正態分布布。所所以在實實際工作作中,當當λ≥≥20時時就可以以用正態態分布來來近似地地處理波波松分布布的問題題。3.2..2波松分布布重要的的特征波松分布布為離散散型隨機機變量的的概率分分布,其其平均數和和方差相相等,都都等于常常數λ,即μ=σ2=λ圖3-3不同λ的泊松分分布3.2..3波波松分布布的概率率計算由波松分分布的概概率計算算公式可可以看出出,依賴賴于參數數λ的的確定,,只要參參數λ確確定了,,把k=0,1,2,,…代代入即可可求得各各項的概概率。但但是在在大多數數服從波波松分布布的實例例中,分分布參數數λ往往往是未知知的,只只能從所所觀察的的隨機樣樣本中計計算出相相應的樣樣本平均均數作為為λ的的估估計值,,將其代代替計算算公式中中的λ,,計算出出k=0,,1,2,…時時的各各項概率率。下一張主頁頁退出出上一張【例3--6】為為監監測飲用用水的污污染情況況,現現檢驗某某社區每每毫升飲飲用水中中細菌數數,共共得400個個記錄如如下:試分析飲飲用水中中細菌數數的分布布是否服服從波松松分布。。若服從從,按波波松分布布計算每每毫升水水中細菌菌數的概概率及理理論次數數并將頻頻率分布布與波松松分布作作直觀比比較。下一張主頁頁退出出上一張經計算得得每毫升升水中平平均細菌菌數==0..500,方差差S2=0.496。。兩者很很接近,,故可可認為每每毫升水水中細菌菌數服從從波松分分布。以以=0..500代替λλ,得(k=0,1,2……)計算結果果如表所所示。下一張主頁頁退出出上一張細菌數的的波松分分布可見細菌菌數的頻頻率分布布與λ==0.5的波松松分布是是相當吻吻合的,,進進一步說說明用波波松分布布描述單單位容積積(或面面積)中中細菌數數的分布布是適宜宜的。下一張主頁頁退出出上一張注意,二二項分布布的應用用條件也也是波松松分布的應用條條件。比比如二項項分布要要求n次試驗是是相互獨獨立的,,這也是是波松分分布的要要求。然而一些些具有傳傳染性的的罕見疾疾病的發發病數,,因為首首例發生生之后可可成為傳傳染源,,會影響響到后續續病例的的發生,,所以不不符合波波松分布布的應用用條件。。對于在單單位時間間、單位位面積或或單位容容積內,,所觀察察的稀有有事件由由于某些些原因分分布不隨隨機時,,如細菌菌在牛奶奶中成集集落存在在時,不不呈波松松分布,,不能用用波松分分布來描描述其發發生規律律。下一張主頁頁退出出上一張3.3正正態分分布(normaldistribution)正態分布布是一種種很重要要的連續續型隨機機變量的的概率分分布。自自然現象象中有許許多變量量是服從從或近似似服從正正態分布布的。如如食品中中各種成成分的含含量、有有害物質質殘留量量、瓶裝裝食品的的重量、、分析測測定過程程中的隨隨機誤差差等等。。許多統統計分析析方法都都是以正正態分布布為基礎礎的。此此外,還還有不少少隨機變變量的概概率分布布在一定定條件下下以正態態分布為為其極限限分布。。因此在在統計學學中,正正態分布布無論在在理論研研究上還還是實際際應用中中,均占占有十分分重要的的地位。。下一張主頁頁退出出上一張3.3..1正正態分分布的定定義及其其特征1.正正態分分布的定定義若連續型型隨機變變量x的概率分布布密度函函數為其中μ為為平均數數,σ2為方差,,則稱隨隨機變量量x服從正態態分布,,記為x~N(μ,σσ2)。相應應的概率分布布函數為下一張主頁頁退出出上一張(3-12)(3-11)分布密度度曲線如如圖3-4所示。圖3-4正態分布布密度((函數))曲線2.正正態分分布的特特征(1)正正態分布布密度曲曲線是單單峰、對對稱的懸懸鐘形曲曲線,對對稱軸為為x=μ;(2)f(x))在x=μ處處達到極極大,,極大值值(3)f(x))是非負函函數,以以x軸為漸近近線,分分布從--∞至++∞;下一張主頁頁退出出上一張;(4)曲曲線在x=μ±σσ處各有有一個拐拐點,即即曲線在在(-∞∞,μ--σ)和和(μ++σ,++∞)區區間上上是下凸凸的,在在[μ--σ,μμ+σ]]區間內內是上凸凸的;(5)正正態分布布有兩個個參數,,即平均均數μ和和標準差差σ。μ是位置置參數,,如圖3—5所所示。當當σ恒恒定時,,μ愈大大,則曲曲線沿x軸愈向右右移動;;反之,,μ愈小小,曲線線沿x軸愈向左左移動。。σ是形狀狀參數,,如圖圖3—6所示。。當當μ恒定定時,σσ愈大大,表示示x的取值愈愈分散,,曲線線愈“胖胖”;σσ愈小,,x的取值愈愈集中在在μ附近近,曲線線愈“瘦瘦”。下一張主頁頁退出出上一張圖3-5σ相同而μ不同的3個正態分分布比較較圖3-6μ相同而σ不同的3個正態分分布比較較大(6)分分布密度度曲線與與橫軸所所圍成的的區間面面積為1,即::下一張主頁頁退出出上一張(7)正態態分布的的次數多多數集中中在平均均數μ的附近,,離均數數越遠,,其相應應次數越越少,在在3σ以外的極極少,這這就是食食品工業業控制中中的3σ原理的基基礎。正態分布布是依賴賴于參數數μ和σσ2(或σ))的一一簇分分布,正正態曲線線的位置置及形態態隨μ和和σ2的不同而而不同。。這就就給研究究具體的的正態總總體帶來來困難,,通通常將一一般的N(μ,σσ2)轉換換為μμ=0,σσ2=1的正正態分布布。3.3..2標準正態態分布μ=0,,σ2=1的正態分布布為標準正態態分布(standardnormaldistribution)。標準正態態分布的的概率密密度函數數及分布布函數分分別記作作ψ(u))和Φ(u)),下一張主頁頁退出出上一張(3-14)μ=0σ=1(3-13)隨機變量量u服從標準準正態分分布,記記作u~N(0,1),分布密密度曲線線如圖3—7所示。圖3-7標準正態態分布曲曲線對于任何何一個服服從正態態分布N(μ,σσ2)的隨機機變量x,都可以以通過標標準化變變換,u=(x-μ)/σ((3-15)將其變換換為服從從標準正正態分布布的隨機機變量u。u稱為標準準正態變變量或標標準正態態離差。。下一張主頁頁退出出上一張x~N(μ,σ2)x~N(0,1)u=(x-μ)/σ3.3..3正正態分布布的概率率計算1.標標準正態態分布的的概率計計算設u服從標準準正態分分布,則則u在[u1,u2)內取值值的概率率為:=Φ(u2)-Φ((u1)((3-16)Φ(u1)與Φ((u2)可由附附表1查查得。下一張主頁頁退出出上一張例如,u=1.75時,,由附表表1可以以查出Φ(1..75))=0..95994有時會遇遇到給定定Φ(u)值,,例如ΦΦ(u)=0..284,反過過來查u值。這時時只需在在附表1中找到到與0.284最最接近的的值0..2843,對對應查出出相應的的u值為為u=-0.57,即即Φ(-0.57)=0.284下一張主頁頁退出出上一張由標準正正態分布布概率計計算式及及正態分分布的對對稱性可可推出下下列關系系式:P(0≤u<u1)=P(u≥u1)=P(|u|≥u1)=P(|u|<u1)=P(u1≤u<u2)=下一張主頁頁退出出上一張Φ(u1)-0..5Φ(-u1)2Φ(-u1)(3-17)1-2Φ(-u1)Φ(u2)-Φ((u1)【例3..7】已已知知u~N(0,1)),試求求:(1)P(u<-1..64))=?(2)P(u≥2.58)==?(3)P(|u|≥2..56))=?(4)P(0.34≤u<1.53)==?下一張主頁頁退出出上一張(1)P(u<-1..64))=0.05050(2)P(u≥2.58)==Φ(--2.58)==0.024940(3)P(|u|≥2..56))=2Φ((-2..56))=2××0.005234=0.010468(4)P(0.34≤u<1.53)=Φ(1.53)-ΦΦ(0..34))=0.93669-0..6331=0.30389下一張主頁頁退出出上一張對于標準準正態分分布,特特殊區間間的概率率為:P(-1≤≤u<1)==0.6826P(-2≤≤u<2)=0.9545P(-3≤≤u<3)==0.9973P(-1..96≤≤u<1.96)==0.95P(-2..58≤≤u<2.58)==0.99標準正態態分布的的三個常常用概率率如圖示示下一張主頁頁退出出上一張u變量在上上述區間間以外取取值的概概率分別別為:P(|u|≥1))=2ΦΦ(-1)=1-P(-1≤≤u<1)=1-0.6826==0.3174P(|u|≥2))=2ΦΦ(-2)=1-P(-2≤≤u<2)=1-0.9545==0.0455P(|u|≥3))=1--0.9973=0..0027P(|u|≥1.96)=1--0.95=0.05P(|u|≥2.58)=1--0.99=0.01下一張主頁頁退出出上一張統計檢驗中常用2.一一般正正態分布布的概率率計算若隨機變變量x服從正態態分布N(μ,σσ2),則x的取值落落在任意意區間[[x1,x2)的概概率,,記作P(x1≤x<<x2),等于于圖3——8中中陰影部部分的面面積。即即:下一張主頁頁退出出上一張圖3-8正態分布布的概率率
對(3-18)式作作變換u=(x-μ)//σ,得得dx=σdu,故有下一張主頁頁退出出上一張(3-18)其中,表明服從從正態分分布N(μ,σσ2)的隨機機變量x在[x1,x2)內取值值的概率率,等等于服從從標準正正態分分布的隨隨機變量量u在[(x1-μ)//σ,((x2-μ)//σ)內內取值的的概率。。因此,計計算一般般正態分分布的概概率時,,只要要將原區區間的上上下限作作適當變變換(標準化),就就可用查查標準正正態分布布的概率率表的方方法求取取某一區區間的概概率。下一張主頁頁退出出上一張【例3-8】】P53已知x~N(100,22),試求求P(100≤x<102))=?。=P(0≤u<1)=Φ(1)-ΦΦ(0))=0.8413--0.5000=0.3413【例】設設x服從μ==30..26,,σ2=5.102的正態分分布,試試求P(21..64≤≤x<32..98))。令則u服從標準準正態分分布,故故=P(-1..69≤≤u<0.53)=Φ(0.53)-ΦΦ(-1.69)=0.7019-0..04551=0.6564下一張主頁頁退出出上一張關于一般般正態分分布,以以下幾個個概率(即隨機變變量x落在μ加減不同同倍數σ區間的概概率)是經常用用到的。。P(μ-σσ≤x<μ+σ)=P(μ-2σ≤x<μ+2σσ)==P(μ-3σ≤x<μ+3σσ)==P(μ-1.96σ≤x<μ+1..96σσ)==P(μ-2.58σ≤x<μ+2..58σσ)=0.68260.95450.99730.950.99在數理統統計分析析中,不不僅注意意隨機變變量x落在平均均數加減減不同倍倍數標準準差區間間(μ--kσ,μ++kσ)之內內的概率率,更關心的的是x落在此區區間之外外的概率率。把隨機變變量x落在平均均數μ加加減不同同倍數標標準差σσ區間之之外的概概率稱為為雙側概率率(兩尾尾概率)),記作α。。下一張主頁頁退出出上一張對應于雙雙側概率率,也可可以求得得隨機變變量x小于μ-kσ或大于μ+kσ的概率,,稱為單側概率率(一尾尾概率)),記作α/2。圖3—9兩尾概率率附表2給給出了滿滿足P(|u|>))==α的雙雙側分位位的的數值值。因此此,只只要已知知雙側概概率α的的值,由由附表2就可直直接查出出對應的的雙側分分位數。。例如,已已知u~N(0,1)試求求:(1)P(u<-))+P(u≥))=0..10的的(2)P(-≤≤u<﹚﹚=0..86的的由于附表表2中的的α值是是:下一張主頁頁退出出上一張(1)P(u<-))++P(u≥))=0.10=αα由附表2查得::==1.644854(2)P(-≤≤u<))==0.86,α=1--P(-≤≤u<))=1--0.86=0.14由附表2查得::==1.475791對于x~N(μ,σσ2),只要要將其轉轉換為u~N(0,1),即即可求得得相應的的雙側分分位數。。下一張主頁頁退出出上一張【例3--9】已已知知飲料灌灌裝量x(ml)服從正態態分布N((250,1.582),若若P(x<))==0.05,P(x≥))==0.05,求求,,。。P54由題意可可知,αα/2==0.05,αα=0..10因因為為P(x≥))=故P(x<))+P(x≥))=P(u<-))++P(u≥))下一張主頁頁退出出上一張=1-P(-≤≤u<<))=0..10==α由附表2查得::==1.644854,,所所以以(--250))/1..58==-1.644854(--250)/1.58=1.644854即==247..40,,==252.60。下一張主頁頁退出出上一張和分分別別為a=0.10(雙側))時的下下側分位位數和上上側分位位數前面討論論的三個個重要的的概率分分布中,,前兩個個屬離散散型隨機機變量的的概率分分布,后后一個屬屬連續型型隨機變變量的概概率分布布。三三者間的的關系如如下:對于二項項分布,,在n→∞,p→0,且np=λ(較小常數數)情況下,,二項項分布趨趨于波松松分布。在這種種場合,,波松分分布中的的參數λ用二項分分布的np代之;在n→∞,p→0.5時,二項項分布趨趨于正態態分布。。在這種場場合,,正態分分布中的的μ、σ2用二項分分布的np、npq代之。在實際計計算中,,當p<0.1且n很大時,,二項分分布可由由波松分分布近似似;當p>0.1且n很大時,,二項分分布可由由正態分分布近似似。下一張主頁頁退出出上一張對于波松松分布,,當λ→→∞時,,波松松分布以以正態分分布為極極限。在實際計計算中,,當當λ≥≥20((也有人人認為λλ≥6))時,用用波松分分布中的的λ代替替正態分分布中的的μ及σσ2,即可由由后者對對前者進進行近似似計算。。下一張主頁頁退出出上一張研究總體體與所抽抽取的樣樣本之間間的關系系是統計計學的中中心內容容。對這種關關系的研研究從兩兩方面著著手:一是從總總體到樣樣本,,這就是是研究抽樣分布布(samplingdistribution)的問問題;二是從樣樣本到總總體,這這就是統計推斷斷(statisticalinference)問題題。下一張主頁頁退出出上一張4抽樣分布布統計推斷斷是以總總體分布布和樣本本抽樣分分布的理理論關系系為基礎礎的。為為了能正正確地利利用樣本本去推斷斷總體,,并能正正確地理理解統計計推斷的的結論,,必須對對樣本的的抽樣分分布有所所了解。。由總體中中隨機地地抽取若若干個體體組成樣樣本,即即使每次次抽取的的樣本含含量相等等,其統統計量((如,,S)也將將隨著樣樣本的不不同而有有所不同同,因而而樣本統統計量也也是隨機機變量,,也有其其概率分分布。我我們把統計量的的概率分分布稱為為抽樣分分布。下一張主頁頁退出出上一張由總體隨隨機抽樣樣(randomsampling)的的方法可可分為有返置抽抽樣和不不返置抽抽樣兩種。前前者指指每次抽抽出一個個個體后后,這個個個體應應返置回回原總體體;后者者指每次次抽出的的個體不不返置回回原總體體。對于于無限總總體,返返置與否否都可保保證各個個體被抽抽到的機機會相等等。對于于有限總總體,就就應該采采取返置置抽樣,,否則各各個體被被抽到的的機會就就不相等等。下一張主頁頁退出出上一張4.1樣樣本平平均數的的抽樣分分布設有一個個總體,,總體體平均數數為μμ,方差差為σ2,總體中中各變數數為x,將此此總體體稱為原原總體。。現從這這個總體體中隨機機抽取含含量為n的樣本,,樣本平平均數記記為。。可以設想想,從原原總體中中可抽出出很多甚甚至無窮窮多個含含量為n的樣本。。由這些些樣本算算得的平平均數有有大有小小,不盡盡相同,,與原總總體平均均數μ相相比往往往表現出出不同程程度的差差異。這這種差異異是由隨隨機抽樣樣造成的的,稱稱為抽樣誤差差(samplingerror))。下一張主頁頁退出出上一張總體樣本觀測前樣本值1樣本值2…樣本值n隨抽機樣…(x1,x2,…xn)(x1,x2,…xn)(x1,x2,…xn)樣本值1樣本值2樣本值nX1,X2,…,Xn隨抽機樣樣本總體X觀測以后……………顯然,樣樣本平均均數也是是一個隨隨機變量量,其概概率分布布叫做樣本平均均數的抽抽樣分布布。由樣本本平均數數構成的的總體稱稱為樣本平均均數的抽抽樣總體體。其平均均數和標標準差分分別記為為和和。。是樣本平均均數抽樣樣總體的的標準差差,簡稱標準誤(standarderror),,它表示平均均數抽樣樣誤差的的大小。統計學學上已證證明總總體體的兩個個參數與與x總體的兩兩個參數數有如下下關系::下一張主頁頁退出出上一張(3-19)=μ,(1)若若隨機變變量x服從正態態分布N(μσσ2),、、、……、是是由由x總體得來來的隨機機樣本,,則統計計量==Σx/n的概率分分布也是是正態分分布,且且有==μ,,,,即即~N(μ,σσ2/n)。(2)若若隨機變變量x服從平均均數是μμ,方方差是σσ2的分布((不是正態態分布);,,,,…,是是由此此總體得得來的隨隨機樣本本,則統統計計量==Σx/n的概率分分布,當當n相當大時時逼近正正態分布布N(μ,σσ2/n)。這就就是中心心極限定定理。下一張主頁頁退出出上一張X變量與變變量概率率分布間間的關系系可由下下列兩個個定理說說明:由中心極極限定理理可知,,不論x變量是連連續型的的還是離離散型的的,也無無論x服從何種種分布,,一般只只要n>30,,就可認認為的的分布布是正態態的。若若x的分布不不很偏倚倚,在n>20時時,的的分分布就近近似于正正態分布布。下一張主頁頁退出出上一張均數標準準誤標準誤((平均數抽抽樣總體體的標準準差)的的大大小,反反映樣本本平均數數的的抽樣誤差差的大小,,即精確確性的高高低。。標準準誤大,,說明各各樣本平平均數間間差異異程度大大,樣本本平均數數的精確確性低。。反之,,小小,說說明間的的差異程程度小,,樣樣本平均均數的精精確性高高。的的大小與與原總體體的標準準差σ成成正比,,與樣本本含量n的平方根根成反比比。從特定總總體抽樣樣時,,因為σσ是一常常數,,所以只只有增大大樣本含含量才能能降低樣樣本平均均數的的抽樣樣誤差。。下一張主頁頁退出出上一張但在實際際工作中中,總體體標準差差σ往往往是未知知的,因因而無法法求得。。此時時,可用用樣本標標準差S估計σ。。于是,,以估估計。。記為為,,稱作作樣本標準準誤或均均數標準準誤。樣樣本標準準誤是是平均均數抽樣樣誤差的的估計值值。若樣本本中各觀觀測值為為,,,,…,,,,則則下一張主頁頁退出出上一張(3-20)注意,樣樣本標準準差與樣樣本標準準誤是既既有聯系系又有區區別的兩兩個統計計量,((3-20)式式已表表明了二二者的聯聯系。二二者的區區別在于于:樣本標標準準差S是反映映樣樣本中中各觀測測值,,,,……,變變異異程度度大小小的一個個指標,,它的大大小說明明了對對該該樣本本代表性性的強弱弱。樣本標準準誤是樣樣本平均均數的的標準準差,它它是抽樣樣誤差的的估計值值,其其大小說說明了樣樣本間變變異程度度的大小小及精精確確性的高高低。下一張主頁頁退出出上一張對于大樣樣本資料料,常將將樣本標標準差S與樣本平平均數配配合使使用,記為±±S,用以說說明所考考察性狀狀或指標標的優良良性與穩穩定性。。對于小樣樣本資料料,常將將樣本標標準誤與與樣樣本平均均數配配合使用用,記為±±,,用用以表表示所所考察性性狀或指指標的優優良性與與抽樣樣誤差的的大小。。下一張主頁頁退出出上一張4.2兩樣本均均數差數數的抽樣樣分布設x1~,x2~,,且x1與x2相互獨立立,由這這兩個總總體中抽抽樣(無無論樣本本容量n1、n2多大),,則樣本本平均數數之差(())服從正正態分布布,即且總體參參數有如如下關系系:(3-21)~若所有樣樣本均來來自同一一個正態態總體x~,,則則其平均均數差數數的抽樣樣分布((不論樣樣本容量量n1、n2大小)服服從正態態分布,,且(3-22)若所有樣樣本均來
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 老年教育需求增長與老年教育師資培訓體系研究報告
- 物質變化與能量轉移關系試題及答案
- 環保設備制造業市場多元化競爭與創新策略分析報告
- 教育教學反思的功能與策略試題及答案
- 新能源汽車電池安全與可靠性研究試題及答案
- 文化創意產業園區建筑2025年初步設計可行性評估報告
- 潮安教師面試題及答案
- 深圳進廠面試題及答案
- 社交電商裂變營銷在食品行業中的創新技術應用報告
- 西藏職業技術學院《漫畫設計》2023-2024學年第二學期期末試卷
- 2025年廣東省深圳高級中學高中園高考數學三模試卷(含答案)
- 近五年遼寧中考英語真題及答案2024
- 2023年江蘇省環保集團有限公司長期招聘筆試參考題庫附帶答案詳解
- GB/T 45369-2025吸收性衛生用紙制品及原材料消臭效果評價方法
- 第一章+動量守恒定律+章末復習高二上學期物理人教版(2019)選擇性必修第一冊
- 信創產業面試題及答案
- 水利水電工程質量保證體系
- 《思想道德與法治》(23版):第五章 遵守道德規范 錘煉道德品格
- 小學教育學(第5版)課件 第5章 小學教育目標
- 警衛安檢任務流程
- 展覽會議展前展中展后服務方案(技術方案)
評論
0/150
提交評論