抽樣方法與參數估計剖析_第1頁
抽樣方法與參數估計剖析_第2頁
抽樣方法與參數估計剖析_第3頁
抽樣方法與參數估計剖析_第4頁
抽樣方法與參數估計剖析_第5頁
已閱讀5頁,還剩98頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第九章第九章抽樣與參數估計抽樣與參數估計 統(tǒng)計推斷是統(tǒng)計學研究的重要內容。統(tǒng)計推斷是統(tǒng)計學研究的重要內容。 抽樣是進行統(tǒng)計推斷的基礎性工作。抽樣是進行統(tǒng)計推斷的基礎性工作。 參數估計是統(tǒng)計推斷的重要內容之一。參數估計是統(tǒng)計推斷的重要內容之一。樣本容量的確定樣本容量的確定第一節(jié)第一節(jié) 抽樣與抽樣分布抽樣與抽樣分布一、幾個基本概念一、幾個基本概念二、概率抽樣方式二、概率抽樣方式三、總體分布、樣本分布、抽樣分布三、總體分布、樣本分布、抽樣分布四、四、一個總體的抽樣分布一個總體的抽樣分布五、兩個總體的抽樣分布五、兩個總體的抽樣分布統(tǒng)計推斷的過程統(tǒng)計推斷的過程統(tǒng)計推斷統(tǒng)計推斷是在對樣本數據進行描述的基礎

2、上,對總是在對樣本數據進行描述的基礎上,對總體的未知數量特征作出以概率形式表述的推斷體的未知數量特征作出以概率形式表述的推斷。一、幾個基本概念一、幾個基本概念總體、個體、樣本總體、個體、樣本 總體總體是所要研究的事物或現象的全體,也稱全及總是所要研究的事物或現象的全體,也稱全及總體、母體體、母體。 個體個體是組成總體的各個基本單位或元素。是組成總體的各個基本單位或元素。 樣本樣本是從總體中按一定抽樣技術抽取的若干是從總體中按一定抽樣技術抽取的若干個體組個體組成的集合體成的集合體,也,也稱抽樣總體、子樣。稱抽樣總體、子樣。總體容量和樣本容量總體容量和樣本容量 總體容量總體容量是總體全部單位總數,

3、用是總體全部單位總數,用N表示。表示。 樣本容量樣本容量是一個樣本所包含的單位數,通常用是一個樣本所包含的單位數,通常用n表表示。根據容量大小樣本有大樣本和小樣本之分,一示。根據容量大小樣本有大樣本和小樣本之分,一般當般當n5,n(1-p)5,則二項分布則二項分布可用可用正態(tài)正態(tài)分布近似求解。因而有分布近似求解。因而有 樣本比例分布為:樣本比例分布為: 可用可用Z統(tǒng)計量構造總體統(tǒng)計量構造總體 比例比例的置信區(qū)間,即:的置信區(qū)間,即: 查標準正態(tài)分布表查標準正態(tài)分布表 可得置信區(qū)間:可得置信區(qū)間: 總體比例總體比例未知,可用樣本比例未知,可用樣本比例p代替。在代替。在1置信水平下,總置信水平下,

4、總體比例體比例的置信區(qū)間為:的置信區(qū)間為:)1(1(nNp,)1 ,0()1(NnpZnzppp)1(2nppZpnppZp)1 ()1 (22,總體比例的區(qū)間估計總體比例的區(qū)間估計(例題分析例題分析)例:例:一項廣告活動的跟蹤調查,在隨機調查的一項廣告活動的跟蹤調查,在隨機調查的400人中,人中,有有240人能記起廣告語。試以人能記起廣告語。試以95的置信水平估計能的置信水平估計能記起廣告語的人所占比例的置信區(qū)間。記起廣告語的人所占比例的置信區(qū)間。解:解:已知已知 n=400 , p=240/400=0.6,np=2405, n(1-p)=1605,1-=0.95,查表得,查表得Z=1.96

5、, 則則 即以即以95的概率保證,估計能記起廣告語的人數所的概率保證,估計能記起廣告語的人數所占比例在占比例在55.2%64.8%之間。之間。nppZpnppZp)1()1(22,0.648) , (0.5520.048)0.6 , 0.048-(0.6400)6.01(6.096.16.0,400)6.01(6.096.16.0總體比例的區(qū)間估計總體比例的區(qū)間估計(例題分析例題分析)%35.74%,65.55%35. 9%65100%)651%(6596. 1%65)1 (2nppzp該城市下崗職工中女性比例的該城市下崗職工中女性比例的置信區(qū)間為置信區(qū)間為55.65%74.35% 5351,

6、 565pnnp課堂練習三:課堂練習三: 某電池廠生產的某種型號電池,其使用壽命的質量某電池廠生產的某種型號電池,其使用壽命的質量標準為標準為25小時。為提高產品競爭能力,該廠家對生小時。為提高產品競爭能力,該廠家對生產線進行了改造,現隨機抽取產線進行了改造,現隨機抽取100只電池進行測試,只電池進行測試,得其使用壽命為:得其使用壽命為:23小時以下小時以下 1只只2324小時小時 4只只2425小時小時10只只2526小時小時79只只26小時以上小時以上 6只只 要求以要求以95%的置信水平建立該種電池合格率的置信的置信水平建立該種電池合格率的置信區(qū)間。區(qū)間。課堂練習三參考答案:課堂練習三參

7、考答案:解:解:已知已知 n=100,1- = 95%, 查表得查表得z /2=1.96 由資料可知使用壽命在由資料可知使用壽命在25小時以上的電池共小時以上的電池共85只,只,因此:因此:p=85/100=85% 則總體比例則總體比例 在在1- 置信水平下置信水平下的置信區(qū)間為的置信區(qū)間為 %.%,.%.%)%(.%n)p(pzp5087508250285100851859618512 在在95%95%的置信水平下,該種電池合格率的置信區(qū)的置信水平下,該種電池合格率的置信區(qū)間為:間為:82.50%82.50%87.50%87.50%。課堂練習四:課堂練習四: 某彩電生產廠對某地區(qū)居民家庭購買

8、其產某彩電生產廠對某地區(qū)居民家庭購買其產品的情況進行調查,調查戶數為品的情況進行調查,調查戶數為400戶,戶,其中有其中有40戶購買了該廠生產的彩電。要求戶購買了該廠生產的彩電。要求以以95.45的置信水平估計該地區(qū)居民家的置信水平估計該地區(qū)居民家庭購買該廠產品的比例的置信區(qū)間。庭購買該廠產品的比例的置信區(qū)間。區(qū)間估計應注意:區(qū)間估計應注意: 在進行區(qū)間估計時,必須同時考慮置信概在進行區(qū)間估計時,必須同時考慮置信概率和置信區(qū)間兩個方面,二者都與概率度率和置信區(qū)間兩個方面,二者都與概率度(z或或t)有關。在樣本容量一定的情況下,)有關。在樣本容量一定的情況下,置信概率定得越大,估計的可靠程度就越

9、置信概率定得越大,估計的可靠程度就越大,概率度(大,概率度(z或或t)就越大,則置信區(qū)間)就越大,則置信區(qū)間相應也越大,估計的準確性就越小。因此相應也越大,估計的準確性就越小。因此對于可靠性和準確性,要結合具體問題、對于可靠性和準確性,要結合具體問題、具體要求來綜合考慮。具體要求來綜合考慮。一、兩個總體均值之差的區(qū)間估計一、兩個總體均值之差的區(qū)間估計二、兩個總體比例之差的區(qū)間估計二、兩個總體比例之差的區(qū)間估計三、兩個總體方差比的區(qū)間估計(略)三、兩個總體方差比的區(qū)間估計(略)一、兩個總體均值之差的估計一、兩個總體均值之差的估計大樣本大樣本 假定條件假定條件兩個兩個總體都服從正態(tài)分布,總體都服從

10、正態(tài)分布, 1、 2已知已知若不是正態(tài)分布若不是正態(tài)分布, 可以用正態(tài)分布來近似可以用正態(tài)分布來近似(n1 30和和n2 30)兩個樣本是獨立的簡單隨機樣本兩個樣本是獨立的簡單隨機樣本 建立置信區(qū)間建立置信區(qū)間使用正態(tài)分布統(tǒng)計量使用正態(tài)分布統(tǒng)計量Z)1 ,0()()(2221212121NnnxxZ兩個總體均值之差的估計兩個總體均值之差的估計 (大樣本大樣本)3. 1、 2已知已知時,時,兩個總體均值之差兩個總體均值之差 1- 2在在1- 置置信水平下的置信區(qū)間為信水平下的置信區(qū)間為222121221)(nnzxx222121221)(nSnSzxx4.4. 1 1、 2 2未知未知時,時,兩

11、個總體均值之差兩個總體均值之差 1 1- - 2 2在在1-1- 置信水平下的置信區(qū)間為置信水平下的置信區(qū)間為兩個總體均值之差的估計兩個總體均值之差的估計(例題分析例題分析) 兩個樣本的有關數據兩個樣本的有關數據 中學中學1中學中學2n1=46n1=33S1=5.8 S2=7.2861x782x兩個總體均值之差的估計兩個總體均值之差的估計(例題分析例題分析)97.10,03. 5(97. 28332 . 7468 . 596. 1)7886()(22222121221nsnszxx兩個總體均值之差的估計兩個總體均值之差的估計小樣本小樣本: 1 12 2 2 22 2 假定條件假定條件 兩個兩個

12、總體都服從正態(tài)分布總體都服從正態(tài)分布 兩個總體方差未知但相等:兩個總體方差未知但相等: 1= 2 兩個獨立的小樣本兩個獨立的小樣本(n130和和n230) 總體方差的合并估計量總體方差的合并估計量211212222112nnS)n(S)n(Sp 估計量估計量 x x1 1- -x x2 2的抽樣標準差的抽樣標準差21221211nnSnSnSppp兩個總體均值之差的估計兩個總體均值之差的估計(小樣本小樣本: 1 12 2 2 22 2 )4.建立兩個樣本均值之差的置信區(qū)間用建立兩個樣本均值之差的置信區(qū)間用t統(tǒng)計量統(tǒng)計量) 2(11)()(21212121nntnnSxxtp5.5.兩個總體均值

13、之差兩個總體均值之差 1 1- - 2 2在在1-1- 置信水平下置信水平下的置信區(qū)間為的置信區(qū)間為21221221112nnSnntxxp兩個總體均值之差的估計兩個總體均值之差的估計小樣本小樣本: 1 12 2 2 22 2 假定條件假定條件 兩個兩個總體都服從正態(tài)分布總體都服從正態(tài)分布 兩個總體方差未知且不相等:兩個總體方差未知且不相等: 12 兩個獨立的小樣本兩個獨立的小樣本(n130和和n230) 建立置信區(qū)間建立置信區(qū)間使用統(tǒng)計量使用統(tǒng)計量t)()()(2221212121vtnSnSxxt兩個總體均值之差的估計兩個總體均值之差的估計(小樣本小樣本: 1 12 2 2 2223.兩個

14、總體均值之差兩個總體均值之差 1- 2在在1- 置信水平下的置信水平下的置信區(qū)間為置信區(qū)間為222121221)(nSnSvtxx 1122222121212222121nnSnnSnSnSv自由度兩個總體均值之差的估計兩個總體均值之差的估計匹配大樣本匹配大樣本 假定條件假定條件 兩個匹配的大樣本兩個匹配的大樣本(n1 30和和n2 30) 兩個總體均值之差兩個總體均值之差 d= 1- 2在在1- 置信水平置信水平下的置信區(qū)間為下的置信區(qū)間為nzdd 2對應差值的均值對應差值的均值對應差值的標準差對應差值的標準差兩個總體均值之差的估計兩個總體均值之差的估計匹配小樣本匹配小樣本 假定條件假定條件

15、 兩個匹配的小樣本兩個匹配的小樣本(n1 30和和n2 30) 兩個總體各觀察值的配對差服從正態(tài)分布兩個總體各觀察值的配對差服從正態(tài)分布 兩個總體均值之差兩個總體均值之差 d= 1- 2在在1- 置信水平置信水平下的置信區(qū)間為下的置信區(qū)間為nS)n(tdd121.假定條件假定條件 兩個兩個總體服從二項分布總體服從二項分布 可以用正態(tài)分布來近似可以用正態(tài)分布來近似 兩個樣本是獨立的兩個樣本是獨立的2.兩個總體比例之差兩個總體比例之差 1- 2在在1- 置信水平下置信水平下的置信區(qū)間為的置信區(qū)間為二、兩個總體比例之差的區(qū)間估計二、兩個總體比例之差的區(qū)間估計22211122111n)P(Pn)P(P

16、zPP兩個總體比例之差的估計兩個總體比例之差的估計(例題分析例題分析)兩個總體比例之差的估計兩個總體比例之差的估計(例題分析例題分析)%32.19,%68. 6%32. 6%13400%)321 (%32500%)451 (%4596. 1%32%45第五節(jié)第五節(jié) 樣本容量的確定樣本容量的確定 前面討論中都假定樣本容量前面討論中都假定樣本容量n已知,但在實踐中需已知,但在實踐中需要自己設計調查方案,確定樣本容量。樣本容量要自己設計調查方案,確定樣本容量。樣本容量n越大,抽樣誤差越小,但越大,抽樣誤差越小,但n越大,所需人、財、物越大,所需人、財、物及時間也越多;及時間也越多;n太小,估計誤差會

17、很大。因此確太小,估計誤差會很大。因此確定樣本容量的大小要從允許誤差范圍、概率保證程定樣本容量的大小要從允許誤差范圍、概率保證程度及經費、時間等多方面統(tǒng)籌考慮。度及經費、時間等多方面統(tǒng)籌考慮。一、估計總體均值時樣本容量的確定一、估計總體均值時樣本容量的確定二、估計總體比例時樣本容量的確定二、估計總體比例時樣本容量的確定一、估計總體均值時樣本容量的確定一、估計總體均值時樣本容量的確定 重復抽樣下估計總體均值時樣本容量:重復抽樣下估計總體均值時樣本容量: 可以看出樣本容量可以看出樣本容量n與總體方差與總體方差 2、允許誤、允許誤差差 、概率度、概率度Z或或t之間的關系為之間的關系為樣本容量樣本容量

18、n 與總體方差與總體方差 2成正比成正比樣本容量樣本容量n與允許誤差與允許誤差 成反比成反比樣本容量樣本容量n與概率度與概率度Z或或t成正比成正比22222ZnnZ估計總體均值時樣本容量的確定估計總體均值時樣本容量的確定(例題分析例題分析) 例例:一家廣告公司想估計某類商店去年平均:一家廣告公司想估計某類商店去年平均每店廣告費支出額。經驗表明,總體方差為每店廣告費支出額。經驗表明,總體方差為1800000。若置信水平取。若置信水平取95,允許誤差為,允許誤差為500元,問應抽取多少家商店作樣本?元,問應抽取多少家商店作樣本? 解:已知解:已知21800000,0.05, 查表得查表得z /2

19、1.96,500, 則則 應抽選應抽選28家商店作樣本。家商店作樣本。 n應取整數。應取整數。個)(2865.27500180000096. 1222222Zn估計總體均值時樣本容量的確定估計總體均值時樣本容量的確定 (例題分析例題分析)估計總體均值時樣本容量的確定估計總體均值時樣本容量的確定 (例題分析例題分析)則則9704.964002000)96. 1 ()(2222222zn二、估計總體比例時樣本容量的確定二、估計總體比例時樣本容量的確定 重復抽樣下估計總體比例時樣本容量:重復抽樣下估計總體比例時樣本容量:p的取值一般小于的取值一般小于0.1。 未知時,可取最大值未知時,可取最大值0.

20、5。因為因為對于服從二項分布對于服從二項分布的隨機變量,當的隨機變量,當 =0.5時,方差達到最大值。用時,方差達到最大值。用0.5計算得出的樣本容量可以保證有足夠高的置信水平計算得出的樣本容量可以保證有足夠高的置信水平和盡可能小的置信區(qū)間。和盡可能小的置信區(qū)間。2222)1()1(ppZnnZ估計總體比例時樣本容量的確定估計總體比例時樣本容量的確定 (例題分析例題分析)例例:某市場調研公司想估計某地區(qū)有家用計算:某市場調研公司想估計某地區(qū)有家用計算機的家庭所占比例。希望允許誤差不超過機的家庭所占比例。希望允許誤差不超過0.05,可靠程度為可靠程度為95,問應取多大容量的樣本?,問應取多大容量的樣本?沒有可利用的比例沒有可利用的比例 。解解:已知:已知:p0.05 , =0.05 , z /2 =1.96 , 用用 =0.5計算計算 ,則則 應抽取應抽取385戶家庭進行調查。戶家庭進行調查。戶)(38505. 0)5 . 01 (5 . 096. 1122222pZn估計總體比例時樣本容量的確定估計總體比例時樣本容量的確定 (例題分析例題分析)【例例】根據以根據以往的生產統(tǒng)計往的生產統(tǒng)計,某種產品的,某種產品的合 格 率 約 為合 格 率

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論