第三章抽樣分布_第1頁
第三章抽樣分布_第2頁
第三章抽樣分布_第3頁
第三章抽樣分布_第4頁
第三章抽樣分布_第5頁
已閱讀5頁,還剩52頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、12組成元素組成元素具體對象具體對象組成元素組成元素變量的具體變量的具體取值取值研究的標志研究的標志例:例:1000個零件的直徑個零件的直徑1000個零件的集合個零件的集合組成元素:每個零件組成元素:每個零件零件直徑的集合零件直徑的集合組成元素:直徑觀測值組成元素:直徑觀測值統計統計推斷推斷中的中的總體總體及總及總體分體分布布第一節第一節 隨機樣本隨機樣本3對一個總體而言,個體的取值是按一定規律分布的。任取一個零件,其直徑取值是按一定概率分布的。 對某個總體而言,總對應著一個隨機變量X X,總體分布就是指隨機變量的概率分布。 數理統計學中“總體”這個基本概念從本質上講:總體就是一個隨機變量X

2、X。對總體的研究, ,就是對相應的隨機變量X X的研究。4例:質量檢查,例:質量檢查,0 0表示正品,表示正品,1 1表示次品,出現次表示次品,出現次品的概率為品的概率為p p,則總體由,則總體由0 0,1 1構成,這一總體對應構成,這一總體對應一個參數為一個參數為p p的(的(0-10-1)分布的隨機變量,即)分布的隨機變量,即1()(1)xxP Xxpp0,1x 5總體:總體:研究對象的某項數量指標值的全體。研究對象的某項數量指標值的全體。個體:個體:組成總體的每一個基本元素。組成總體的每一個基本元素。例如例如: 某工廠生產的燈泡的使用壽命的全體是一個總體某工廠生產的燈泡的使用壽命的全體是

3、一個總體。每一個燈泡的使用壽命是一個個體。每一個燈泡的使用壽命是一個個體。每個男生的身高是一個個體。每個男生的身高是一個個體。 我校男生的身高的全體是一個總體。我校男生的身高的全體是一個總體。總體所含個體的數目稱為總體容量總體所含個體的數目稱為總體容量.總體總體6 樣本:樣本:通過隨機觀測或試驗的方法,獲得的總體中一部分通過隨機觀測或試驗的方法,獲得的總體中一部分個體,稱為樣本,每個個體稱為樣本單位。個體,稱為樣本,每個個體稱為樣本單位。就是從總體中抽取有限個個體對總體進行觀測的過就是從總體中抽取有限個個體對總體進行觀測的過程。程。隨機變量確定的數值樣本樣本7在相同的條件下對總體在相同的條件下

4、對總體X進行進行n次重復獨立的觀察。將次重復獨立的觀察。將n次觀次觀察結果按試驗的次序記為察結果按試驗的次序記為X1, X2, Xn 。 由于由于X1, X2, Xn 是對隨機變量是對隨機變量X觀察的結果,且各次觀觀察的結果,且各次觀察是在相同的條件下獨立進行的,所以有理由認為察是在相同的條件下獨立進行的,所以有理由認為X1, X2, Xn是是相互獨立的相互獨立的,且都是與總體,且都是與總體X具有具有相同分布的相同分布的隨機變量。隨機變量。 這樣得到的這樣得到的X1, X2, Xn 稱為來自總體稱為來自總體X的一個簡單隨機的一個簡單隨機樣本,樣本,n為這個樣本的容量。為這個樣本的容量。8第一、

5、樣本點與總體同分布(第一、樣本點與總體同分布(“樣本與總體同分布樣本與總體同分布”) 第二、樣本點之間相互獨立(簡稱第二、樣本點之間相互獨立(簡稱“樣本獨立樣本獨立”) 兩個性質常常合稱為兩個性質常常合稱為 “ “樣本獨立同分布”。滿。滿足上述性質的樣本為簡單隨機樣本。足上述性質的樣本為簡單隨機樣本。樣本的兩個重要性質樣本的兩個重要性質9 n次觀察一經完成,我們就得到一組實數次觀察一經完成,我們就得到一組實數x1, x2, xn ,它們依次是隨機變量,它們依次是隨機變量X1, X2, Xn的觀察值,稱為樣本觀測值。的觀察值,稱為樣本觀測值。10簡單隨機抽樣和簡單隨機樣本的性質簡單隨機抽樣和簡單

6、隨機樣本的性質不放回不放回放放 回回放回放回不放不放 回回獨立性和同一性獨立性和同一性不獨立不獨立當當n/N5%時,有限總時,有限總體不放回抽體不放回抽樣等同于放樣等同于放回抽樣回抽樣抽樣方式抽樣方式11 樣本包含了總體的各種特征信息樣本包含了總體的各種特征信息, ,是進行統計推是進行統計推斷的依據。這些信息是斷的依據。這些信息是“散布散布”在樣本之中的。在在樣本之中的。在實際應用時實際應用時, ,要從中得到所需要的統計信息要從中得到所需要的統計信息, ,往往不往往不是直接使用樣本本身是直接使用樣本本身, ,而是對樣本進行而是對樣本進行“處理處理”, ,將將所需信息濃縮集中起來針對不同的問題,

7、構造樣本所需信息濃縮集中起來針對不同的問題,構造樣本的適當函數的適當函數統計量進行統計推斷。進行統計推斷。12 如果樣本如果樣本X1, ,Xn的函數的函數g=g(X1, ,Xn)不含未不含未知參數,則稱知參數,則稱g(X1, ,Xn)是一個是一個統計量統計量。 是是g(X1, ,Xn)的的觀測值觀測值12( ,.,)ng x xx 如果如果x1, ,xn是對應于樣本是對應于樣本X1, ,Xn的樣本值,的樣本值,則稱:則稱: 一、一、 統計量統計量13總體參數總體參數未知未知總體其他信息總體其他信息未知未知總體分布總體分布未知未知抽樣得到隨機樣本抽樣得到隨機樣本利用統計量推斷總體信息利用統計量推

8、斷總體信息樣本統計量樣本統計量g=g(X1,X2,Xn)兩個要點:兩個要點:1、是樣本的函數、是樣本的函數 2、不含未知的參數、不含未知的參數.樣本樣本X1,X2,Xn 在統計推斷中,一項重要的工作就是尋找統在統計推斷中,一項重要的工作就是尋找統計量和導出統計量的分布。計量和導出統計量的分布。14nikinikiXXnXn11)(11中心矩原點矩3.樣本k階矩niiXnX11. 1 樣本均值常用統計量常用統計量2122)()(11. 2SSXXnSnii標準差樣本均方差樣本方差15總體X的K階原點矩和K階中心矩分別為 E(Xk)(k=1,2,) 和 E(X- E(Xk) )k) (k=2,3,

9、) 總體的一階原點矩即為總體的均值,總體的二階中心矩總體的一階原點矩即為總體的均值,總體的二階中心矩即為總體的方差。即為總體的方差。16 例設一個總體含有4個個體,即總體單位數N=4,其 取 值 分 別 為 X1= 2 2 、X2=24、X3=26 、X4=28 。25X 總體的均值、方差:總體的均值、方差:52二、幾種常用的抽樣分布二、幾種常用的抽樣分布 樣本統計量的分布稱為抽樣分布,即由樣本統計量的分布稱為抽樣分布,即由樣本統計量的全部可能取值和與之相應的概樣本統計量的全部可能取值和與之相應的概率(頻率)組成的分配數列。率(頻率)組成的分配數列。17 現從總體中抽取現從總體中抽取n2的簡單

10、隨機樣本,重復抽樣條件的簡單隨機樣本,重復抽樣條件下,共有下,共有42=16個可能樣本。所有可能樣本的結果列表如個可能樣本。所有可能樣本的結果列表如下,試分析樣本均值的分布。下,試分析樣本均值的分布。DD(28)DC(27)DB(26)DA(25)D(28)CD(27)CC(26)CB(25)CA(24)C(26)BD(26)BC(25)BB(24)BA(23)B(24)AD(25)AC(24)AB(23)AA(22)A(22)D(28)C(26)B(24)A(22)第二個第二個樣本單位樣本單位第一個第一個樣本單位樣本單位所有可能樣本及其樣本均值(所有可能樣本及其樣本均值( n = 2)18

11、將表中樣本的均值的各種可能取將表中樣本的均值的各種可能取值及其可能性(概率)加以整理,值及其可能性(概率)加以整理,繪制成分布表和分布圖如下:繪制成分布表和分布圖如下:1合計1/16282/16273/16264/16253/16242/16231/1622概率均值 樣本均值的抽樣分布圖樣本均值的抽樣分布圖19 樣本均值的均值(數學期望)等于總體均值;樣本均值的均值(數學期望)等于總體均值;樣本均值的方差等于總體方差的樣本均值的方差等于總體方差的1/n。251612816223161221MiiipxxXfxxiiix25)2528(2)2523(1252216116122271220事實上,

12、對于來自均值和方差分別為事實上,對于來自均值和方差分別為 和和 的總體的一個簡單隨機樣本的總體的一個簡單隨機樣本X1, X2, Xn ,其樣本均值的數字期望和,其樣本均值的數字期望和 方差分別為方差分別為 和和 。一般稱一般稱 為樣本均值的抽樣誤差。為樣本均值的抽樣誤差。2xnx22nx21 的抽樣分布與總體分布和樣本量的抽樣分布與總體分布和樣本量n有關:有關: 總體是正態分布,樣本均值總是正態分布總體是正態分布,樣本均值總是正態分布 總體非正態分布,隨著總體非正態分布,隨著n的增大,樣本均值趨于正態分布的增大,樣本均值趨于正態分布x22 xn 中心極限定理(central limit the

13、orem) x 23中心極限定理 (central limit theorem)x24 式中式中 為實數為實數, 0 .則稱則稱X服從參數為服從參數為 , 2的的正態分正態分布布,亦稱高斯分布亦稱高斯分布.記為記為N( , 2).可表為可表為XN( , 2). 圖象見右上角圖象見右上角若隨機變量若隨機變量X的密度函數為的密度函數為一般正態分布一般正態分布 xexfx其中222)(21)(1. 1. 定義定義x)(xf025 (1) 單峰對稱單峰對稱 密度曲線關于直線密度曲線關于直線x= 對稱對稱f()maxf(x)21正態分布有兩個特性正態分布有兩個特性:(2) 的大小直接影響概率的大小直接影

14、響概率的分布的分布 越大越大,曲線越平坦曲線越平坦; 越小越小,曲線越陡峻曲線越陡峻.21x)(xf0 x)(xf02246)5/3 , 4(N) 1 , 4(N)5/7 , 4(N26標準正態分布標準正態分布 參數參數 0, 21的正態分布稱為的正態分布稱為標準正態標準正態分布,記作分布,記作ZN(0, 1)。其其密度函數密度函數為為)(21)(22xexxx)(x02424分布函數為密度函數的積分分布函數為密度函數的積分27分布函數為分布函數為xdtexXPxxt,)(2212(1) (0)=0.5(2) (+)1;(3) (x)1 (x).x一般的概率統計教科書均附有一般的概率統計教科書

15、均附有標準正態分布表供讀者查閱標準正態分布表供讀者查閱 (x)的值的值.(附表附表1)如如,若若XN(0,1), (0.5)=0.6915,P1.32X2.43= (2.43)- (1.32)=0.99250.9066例題:課本例題:課本74頁頁2221)(xexf0)(xf28 2分布 t 分布F分布 在在參數估計和假設檢驗等統計推斷問題中這參數估計和假設檢驗等統計推斷問題中這三個分布有廣泛的應用。三個分布有廣泛的應用。 29定義定義 設設X為一個連續型隨機變量為一個連續型隨機變量, f(x)為其密度函數為其密度函數, 對于對于給定的正數給定的正數 稱滿足條件(01),的點 為X的 分位數分

16、位數 (簡稱為分位點).()( )xP Xxf x dx ( )f xx黃色陰影部黃色陰影部分概率為分概率為()( )1xP Xxf x dx 上側分上側分位數位數 隨機變量隨機變量X的分位數也叫分位點的分位數也叫分位點, 是表示隨機變量是表示隨機變量X的位置的位置特征特征302221nXX22( )n21. 2分布的定義和密度函數分布的定義和密度函數 設設X1, ,Xn是相互獨立,服從標準正態分布是相互獨立,服從標準正態分布N(0,1)的隨機變量,則稱隨機變量:的隨機變量,則稱隨機變量: 所服從的分布為自由度是所服從的分布為自由度是n的的 分布,即分布,即2221( )niiXn記為記為31

17、獨立同分布的隨機變量序列獨立同分布的隨機變量序列隨機變量服從標準正態分布隨機變量服從標準正態分布新構造的隨機變量為原隨機變量平方和新構造的隨機變量為原隨機變量平方和分布的三個要點:分布的三個要點:232/211222( /2),0( )0,0nnxnxexf xx 2 2(n)分布是參數為分布是參數為n/2,1/2的的分布,即分布,即 2 2(n)的密度函數為的密度函數為33 2分布分布隨著自由度隨著自由度增加,分布漸近于正態。增加,分布漸近于正態。圖圖 2的概率密度曲線的概率密度曲線342(0,1), 0,1, 1iiiiXNEXDXEXniEXEXDXiii, 2 , 1, 213)(22

18、4222211().nniiiiEEXEXn.2)(12122nDXXDDniinii證:所以:(1)nE)(2nD2)(22.2. 2 2分布的性質分布的性質3522221122(),(),nn)(2122221nn (2)分布可加性)分布可加性 且且2212,獨立,則:獨立,則:36 (3)(3)上側分位數上側分位數 所謂一個分布的所謂一個分布的 上側分位數就是指這樣一個數,上側分位數就是指這樣一個數,它使相應分布的隨機變量不小于它使相應分布的隨機變量不小于( (大于等于)大于等于)該數的該數的概率為概率為 , ,比如,若記比如,若記 2 2變量的變量的 上側分位數為上側分位數為 ,則,則

19、滿足滿足查表查表313313頁附表頁附表3 3 2 20.9950.995(1111)=2.603=2.603 2 20.010.01(1313)=27.688=27.688222()pd37附表3中給出了自由度n45的2分布的上 分位數值.如對于0.1,25n 查附表3得20.1(25)34.382 方便通過EXCEL查分位點,函數為CHIINV。fx 常用函數 CHIINV381. t t分布的定義和密度函數分布的定義和密度函數).(/ntnYXT t(n)稱為自由度為稱為自由度為n的的t分布,記為分布,記為Tt(n)。(二)(二) t 分布分布t(n) 分布的概率密度為分布的概率密度為

20、t,)nt1()2n(n)21n() t ( f21n2定義定義:若若X XN(0, 1), N(0, 1), Y Y 2 2(n), (n), X X與與Y Y獨立,則獨立,則39 t t分布和標準正態分布類似,他們都是對稱分布。分布和標準正態分布類似,他們都是對稱分布。區別:區別:t t分布尾部厚,即服從分布的隨機變量取到尾部值的概分布尾部厚,即服從分布的隨機變量取到尾部值的概率比標準正態分布略大。而對于接近原點的坐標點,率比標準正態分布略大。而對于接近原點的坐標點,t t分布分布的值比標準正態分布的值小。的值比標準正態分布的值小。因而因而t t分布曲線尾部厚于標準分布曲線尾部厚于標準正態

21、分布,而峰低于標準正態分布。正態分布,而峰低于標準正態分布。40 (1) (1) f(t)關于關于t=0(t=0(縱軸縱軸) )對稱。對稱。 (2) (2) f(t)的極限為的極限為N(0N(0,1)1)的密度函數,即的密度函數,即 x,e21) t () t ( flim2tn2,41分子是標準正態隨機變量分子是標準正態隨機變量分母是自由度為分母是自由度為n的卡方隨機變量的卡方隨機變量分子分母相互獨立,且滿足構造公式分子分母相互獨立,且滿足構造公式t分布的三個要點:分布的三個要點:分子:標準正態分布變量分子:標準正態分布變量分母:卡方變量除以自由分母:卡方變量除以自由度再開方度再開方42)(

22、) 10(nttP,稱滿足條件:對于給定的( )tnt的點為 分的上布分位點 。)()(1ntnt:由概率密度的對稱性知.)(45zntn時,當)(nt)(1nt2.43附表2中給出了自由度n45時,當的 t 分布的上 分位數值; 如對于0.05,n20查附表2得可以通過可以通過EXCEL查分位點,函數為查分位點,函數為TINV。(注意:(注意:雙側,雙側,20.050.1)T0.05(20)1.724744定義定義:若若U 2(n1), V 2(n2),U和和 V獨立,則獨立,則).,(/2121nnFnVnUF 稱為第一自由度為稱為第一自由度為n1 ,第二自由度為,第二自由度為n2的的F分

23、布分布,其概其概率密度函數為率密度函數為 0y, 00y,)ynn1)(2n()(y)n/n)(2nn()y(h2/ )nn(2122n12n2/n2121211111. F分布的定義和密度函數分布的定義和密度函數45分子是自由度為分子是自由度為n1的卡方隨機變量的卡方隨機變量分母是自由度為分母是自由度為n2的卡方隨機變量的卡方隨機變量分子分母相互獨立,且滿足構造公式分子分母相互獨立,且滿足構造公式F分布的三個要點:分布的三個要點:兩個卡分變量兩個卡分變量除以自由度之比除以自由度之比4647).,(/1),( F1221nnFFnnF則若),(/1),(12211nnFnnF性質:),() 1

24、0(21nnFFP,稱滿足條件:對于給定的12( ,)Fn nF的點為 分的上布分位點),(21nnF2.F2.F分布的分布的上側臨界值上側臨界值48 對某些較小的附表4中給出了自由度為( n1, n2 )的F 分布的上 分位數值。如對于查附表5得0.1(5,15)2.27F 方便通過方便通過EXCEL查分位點,函數為查分位點,函數為FINV。1551 . 021nn49 由于由于F分布表的局限性,我們不能用直接查表得到此題的分布表的局限性,我們不能用直接查表得到此題的下側分位點。怎么辦呢?下側分位點。怎么辦呢?11( , )( , )FnmF m n( ,)( ,)( ) 上側:Fn mP

25、FF n mf x dx 1( ,)10( ,)( ) 下側:Fn mP FFn mf x dx 給定顯著水平給定顯著水平 0.05,查,查F(15,20)的的 上下側分位點。上下側分位點。50多么方便啊!多么方便??!EXCEL處理處理51例例715. 4)6 , 8(05. 0F28. 058. 31)8 , 6(1)6 , 8(05. 095. 0FF96. 2)7 , 4(1 . 0F25. 098. 31)4 , 7(1)7 , 4(1 . 09 . 0FF例例8?)6 , 8(95. 0F?)7 , 4(9 . 0F52 (1 1)設設X X1 1, X, X2 2,X,Xn n是來自正態總體是來自正態總體的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論