第三章簡單隨機抽樣_第1頁
第三章簡單隨機抽樣_第2頁
第三章簡單隨機抽樣_第3頁
第三章簡單隨機抽樣_第4頁
第三章簡單隨機抽樣_第5頁
已閱讀5頁,還剩62頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、1第三章第三章 簡單隨機抽樣簡單隨機抽樣 2本章要點本章要點 簡單隨機抽樣是抽樣中最基本、最成熟、也簡單隨機抽樣是抽樣中最基本、最成熟、也是最簡單的抽樣設計方式,是所有概率抽樣方法是最簡單的抽樣設計方式,是所有概率抽樣方法發展、比較的基礎。發展、比較的基礎。 要求通過學習熟練掌握簡單隨機抽樣的抽要求通過學習熟練掌握簡單隨機抽樣的抽樣方式和樣本抽選方法;樣方式和樣本抽選方法; 熟知總體均值、總體總值和總體比例的簡熟知總體均值、總體總值和總體比例的簡單估計;單估計; 掌握樣本量的確定;了解子總體的估計。掌握樣本量的確定;了解子總體的估計。3第一節第一節 抽樣方式抽樣方式4 簡單隨機抽樣也稱純隨機抽

2、樣。對于大小為的總簡單隨機抽樣也稱純隨機抽樣。對于大小為的總體,抽取樣本量為的樣本,若全部可能的樣本被抽中體,抽取樣本量為的樣本,若全部可能的樣本被抽中的概率都相等,則稱這樣的抽樣為簡單隨機抽樣。根的概率都相等,則稱這樣的抽樣為簡單隨機抽樣。根據抽樣單位是否放回可分為放回簡單隨機抽樣和不放據抽樣單位是否放回可分為放回簡單隨機抽樣和不放回簡單隨機抽樣。回簡單隨機抽樣。 (一)放回簡單隨機抽樣(一)放回簡單隨機抽樣 (二)不放回簡單隨機抽樣(二)不放回簡單隨機抽樣 (三)不放回與放回簡單隨機抽樣的比較(三)不放回與放回簡單隨機抽樣的比較 一、什么是簡單隨機抽樣一、什么是簡單隨機抽樣5(一)放回簡單

3、隨機抽樣(一)放回簡單隨機抽樣 如果抽樣是有放回的,那么每次抽取都都是從如果抽樣是有放回的,那么每次抽取都都是從 個個總體單位中抽取,這時可能的樣本為總體單位中抽取,這時可能的樣本為 個(考慮樣本個(考慮樣本單位的順序)或單位的順序)或 個(不考慮樣本單位的順序),個(不考慮樣本單位的順序),每個樣本被抽中的概率為每個樣本被抽中的概率為 或或 ,這種抽樣方式,這種抽樣方式就是放回簡單隨機抽樣,所得的樣本稱為放回的簡單就是放回簡單隨機抽樣,所得的樣本稱為放回的簡單隨機樣本。考慮與不考慮樣本單位順序的放回簡單隨隨機樣本。考慮與不考慮樣本單位順序的放回簡單隨機抽樣,有一個共同的特點,即同一個單位有可

4、能在機抽樣,有一個共同的特點,即同一個單位有可能在同一個樣本中重復出現。但是他們也有明顯的區別:同一個樣本中重復出現。但是他們也有明顯的區別:一是可能的樣本數不同;二是樣本的概率分布不同,一是可能的樣本數不同;二是樣本的概率分布不同,由此會導致估計量的概率分布不同。由此會導致估計量的概率分布不同。 NnNnnNC1nN1nnNC11 6 可以證明,不考慮順序的放回簡單隨機抽可以證明,不考慮順序的放回簡單隨機抽樣的估計量的方差大于等于考慮順序的放回簡樣的估計量的方差大于等于考慮順序的放回簡單隨機抽樣的估計量的方差,因此在抽樣實踐單隨機抽樣的估計量的方差,因此在抽樣實踐中,若用到放回簡單隨機抽樣這

5、種方式,也只中,若用到放回簡單隨機抽樣這種方式,也只討論和使用考慮順序的情形。討論和使用考慮順序的情形。 7(二)不放回簡單隨機抽樣(二)不放回簡單隨機抽樣 如果抽樣是無放回的,即同一個單位不能如果抽樣是無放回的,即同一個單位不能在樣本中重復出現,那么,若考慮樣本單位的在樣本中重復出現,那么,若考慮樣本單位的順序,則可能的樣本為順序,則可能的樣本為 個,每個樣本被抽個,每個樣本被抽中的概率為中的概率為 ;若不考慮樣本單位的順序,;若不考慮樣本單位的順序,則可能的樣本為則可能的樣本為 個,每個樣本被抽中的概率個,每個樣本被抽中的概率為為 。這樣的抽樣方式就是不放回簡單隨機。這樣的抽樣方式就是不放

6、回簡單隨機抽樣,所得的樣本稱為不放回簡單隨機樣本。抽樣,所得的樣本稱為不放回簡單隨機樣本。 )!(!nNN !)!(NnN nNCnNC18 考慮樣本單位順序與不考慮樣本單位順序的不放回考慮樣本單位順序與不考慮樣本單位順序的不放回簡單隨機抽樣,除了單位不可能在同一個樣本中重復簡單隨機抽樣,除了單位不可能在同一個樣本中重復出現這一共同特點外,還有一個共同點,即雖然他們出現這一共同特點外,還有一個共同點,即雖然他們的可能樣本數不同,考慮順序是不考慮順序的的可能樣本數不同,考慮順序是不考慮順序的 倍,倍,但是它們的樣本卻有相同的概率分布。由此會導致依但是它們的樣本卻有相同的概率分布。由此會導致依據樣

7、本構造的估計量的概率分布也是相同的。據樣本構造的估計量的概率分布也是相同的。 由于這一共同點的存在,加之不考慮順序的放回簡由于這一共同點的存在,加之不考慮順序的放回簡單隨機抽樣的工作量更小,所以抽樣實踐中對于不放單隨機抽樣的工作量更小,所以抽樣實踐中對于不放回簡單隨機抽樣,只討論和使用不考慮順序不放回簡回簡單隨機抽樣,只討論和使用不考慮順序不放回簡單隨機抽樣這種方式。單隨機抽樣這種方式。 ! n9(三三)不放回與放回簡單隨機抽樣的比較不放回與放回簡單隨機抽樣的比較 1、每次抽取樣本單位面對的總體結構不同。這是二者、每次抽取樣本單位面對的總體結構不同。這是二者的主要不同之處。這一點使得前者的數學

8、處理相對的主要不同之處。這一點使得前者的數學處理相對簡單。簡單。 2、樣本提供的信息量不同。顯然,在樣本量一定的條、樣本提供的信息量不同。顯然,在樣本量一定的條件下,由于后者提供的信息量大于前者,其抽樣效件下,由于后者提供的信息量大于前者,其抽樣效率更高。率更高。 在實踐中,一般多采用不考慮順序的不放回簡單在實踐中,一般多采用不考慮順序的不放回簡單隨機抽樣,所以以下討論如無特別說明,都指這一隨機抽樣,所以以下討論如無特別說明,都指這一類簡單隨機抽樣。類簡單隨機抽樣。 10二、簡單隨機樣本的抽選方法二、簡單隨機樣本的抽選方法 簡單隨機樣本的抽選,首先要將總體簡單隨機樣本的抽選,首先要將總體 個單

9、位從個單位從1到到 編號,每個單位對應一個號;編號,每個單位對應一個號;然后從所編的號中抽號,如果抽到某個號,然后從所編的號中抽號,如果抽到某個號,則對應的那個單位入樣,直到抽夠則對應的那個單位入樣,直到抽夠 個單位個單位為止。為止。 (一)抽簽法(一)抽簽法 (二)隨機數法(二)隨機數法 nNN11(一)抽簽法(一)抽簽法 當總體不大時,可分別采用兩種方法抽當總體不大時,可分別采用兩種方法抽取。一種是全樣本抽選法,另一種是逐個抽取。一種是全樣本抽選法,另一種是逐個抽選法,按這兩種方法抽到的選法,按這兩種方法抽到的 個單位的樣本個單位的樣本是等價的,每個被抽到的樣本的概率都等于是等價的,每個被

10、抽到的樣本的概率都等于 。nNC1n12(二)隨機數法(二)隨機數法 當總體較大時,抽簽法實施起來比較困當總體較大時,抽簽法實施起來比較困難,這時可以利用隨機數表、隨機數骰子、難,這時可以利用隨機數表、隨機數骰子、搖獎機、計算機產生的偽隨機數進行抽樣。搖獎機、計算機產生的偽隨機數進行抽樣。1、利用隨機數表進行抽選。、利用隨機數表進行抽選。隨機數表是一張由隨機數表是一張由0,1,2,9這十這十個數字組成的,一般常用的是五位數的隨機個數字組成的,一般常用的是五位數的隨機數字表,數字表,10個數字在表中出現的順序是隨機個數字在表中出現的順序是隨機的,每個數字都有同樣的機會被抽中。的,每個數字都有同樣

11、的機會被抽中。13 用隨機數表抽選簡單隨機樣本時,一般可用隨機數表抽選簡單隨機樣本時,一般可根據總體大小根據總體大小 的位數決定在隨機數表中隨的位數決定在隨機數表中隨機抽取幾列,比如機抽取幾列,比如 =768,要從中抽取要從中抽取 =10的簡單隨機樣本,則在隨機數表中隨機抽取的簡單隨機樣本,則在隨機數表中隨機抽取相鄰的相鄰的3列,順序往下(或往上),選出前列,順序往下(或往上),選出前10個個001到到768之間的互不相同的數,如果這之間的互不相同的數,如果這3列列隨機數字不夠,可另選其他隨機數字不夠,可另選其他3列繼續,直到抽列繼續,直到抽夠個夠個 單位為止。單位為止。nNNn14 用此種方

12、法,當用此種方法,當 的最高位數較小,比如的最高位數較小,比如小于小于5,且不小,且不小 時,由于讀到的隨機數被舍時,由于讀到的隨機數被舍棄不用的比例較大,抽選效率較差。此時采棄不用的比例較大,抽選效率較差。此時采用下面的方法。在隨機數表中隨機抽取用下面的方法。在隨機數表中隨機抽取3列,列,順序往下,如果得到的隨機數大于順序往下,如果得到的隨機數大于247,小于,小于989(因為(因為247的的4倍為倍為988,因此,因此000及及989到到999的數字應舍棄),則用這個數除以的數字應舍棄),則用這個數除以247,得到的余數入樣,顯然這種方法效率要高得得到的余數入樣,顯然這種方法效率要高得多。

13、隨機數表的起始頁和起始點都應用隨機多。隨機數表的起始頁和起始點都應用隨機數產生。數產生。Nn153、利用搖獎機進行抽選。、利用搖獎機進行抽選。 4、利用計算機產生的偽隨機數進行抽選。通常、利用計算機產生的偽隨機數進行抽選。通常產生的偽隨機數有循環周期。因此在有條件產生的偽隨機數有循環周期。因此在有條件的情況下,一般不建議使用此種方法。的情況下,一般不建議使用此種方法。 2、利用隨機數骰子進行抽選。、利用隨機數骰子進行抽選。16(一)簡單隨機抽樣在抽樣理論中的地位(一)簡單隨機抽樣在抽樣理論中的地位它是抽樣中最容易掌握的技術、也是發展它是抽樣中最容易掌握的技術、也是發展最成熟的技術,建立了最完備

14、的理論。簡單最成熟的技術,建立了最完備的理論。簡單隨機抽樣也是比較其他抽樣設計方法優劣的隨機抽樣也是比較其他抽樣設計方法優劣的基礎。其他抽樣方法技術都是在它的理論技基礎。其他抽樣方法技術都是在它的理論技術基礎上,針對它的局限發展起來的。術基礎上,針對它的局限發展起來的。 三、簡單隨機抽樣在抽樣理論中的地位三、簡單隨機抽樣在抽樣理論中的地位 與局限性與局限性17 若總體單位數若總體單位數 很大時,編制抽樣框困很大時,編制抽樣框困難;抽樣框中即使有輔助信息也不加利用,難;抽樣框中即使有輔助信息也不加利用,使得估計的統計效率較其他利用輔助信息的使得估計的統計效率較其他利用輔助信息的抽樣設計方法低;由

15、于樣本在總體中的地理抽樣設計方法低;由于樣本在總體中的地理分布范圍較廣,如果采取面訪,則費時、費分布范圍較廣,如果采取面訪,則費時、費錢、費力,困難較大;可能得到一個錢、費力,困難較大;可能得到一個“差差”的簡單隨機樣本;若不用計算機,而用隨機的簡單隨機樣本;若不用計算機,而用隨機數表或隨機數骰子抽取一個大樣本,比較勞數表或隨機數骰子抽取一個大樣本,比較勞神單調。神單調。 N(二)簡單隨機抽樣的局限性(二)簡單隨機抽樣的局限性18四、有關指標與符號四、有關指標與符號指指 標標 總總 體體 樣樣 本本 總值總值均值均值比例比例比率比率有限總體方差有限總體方差無限總體方差無限總體方差 NiiYY1

16、 NiiYNY11)或或(0 1,111 iNiiYYNNNPXYXYXYRNiiNii 1121221)(11 NNYYNSNi NjYYN122)(1 niiyy1 niiyny11)或或 0 1( ,111 iniiyynnnpxyxyxyRniinii 11212)(11yynsnii 19第二節第二節 總體均值與總體總值總體均值與總體總值的簡單的簡單估計估計20(一)簡單估計量的定義 y(三)簡單估計量 的方差(四)簡單估計量 的方差的無偏估計 y(二)簡單估計量 的無偏性(五)放回簡單隨機抽樣的簡單估計 (六)設計效應(七)影響估計量精度的因素y一、總體均值的簡單估計一、總體均值的

17、簡單估計 21(一)簡單估計量的定義(一)簡單估計量的定義 對于簡單隨機抽樣,最簡單的估計是利用樣本均值對于簡單隨機抽樣,最簡單的估計是利用樣本均值作為總體均值的估計,即總體均值的簡單估計量為:作為總體均值的估計,即總體均值的簡單估計量為: niiyny11也就是說,樣本均值是總體均值的簡單估計量。也就是說,樣本均值是總體均值的簡單估計量。22(二)簡單估計量(二)簡單估計量 的無偏性的無偏性對于簡單隨機抽樣,對于簡單隨機抽樣, 是是 的無偏估計,即有的無偏估計,即有 yyYYyE)(證明:證明: nNCjjCyyEnN 1)()(12111jnjCjjCjjyyynynNnN NiinNYC

18、n1111YYNnnYCCnyENiiNiinNnN 111111)(YYNnnyEnyENiinii 111)(1)(這就是對稱性論證法。由于總體中每一個單位的入樣概率這就是對稱性論證法。由于總體中每一個單位的入樣概率都相等,所以不放回簡單隨機抽樣是一種等概率抽樣。都相等,所以不放回簡單隨機抽樣是一種等概率抽樣。23(三三)簡單估計量簡單估計量 的方差的方差 式中,式中, 抽樣比;抽樣比; 為有限總體校正系數。為有限總體校正系數。 y21)(SnfyV Nnf f 1證明:證明: 212)1()()(YynEYyEyVnii 21)(1YyEnnii )(1)(12212 jijiniiYy

19、YyEnYyEn21)(YYNnNii )(21YyEnii 24 jijiYyYyE)()()1()1(YYYYNNnnjjii )()1()1(1)(1)(2212YYYYNNnnnYYNnnyVjijiNii )(11)(121YYYYNnYYnNjjiiNii (11)()111(12121YYNnYYNnnNNiiNii 2211)(11SnfYYNnNnNNii 25 (四四)簡單估計量簡單估計量 的方差的無偏估計的方差的無偏估計 的無偏估計是:的無偏估計是: y)(yV21)(snfyv 式中式中 為樣本方差。為樣本方差。 2s證明:證明: 212)(11yynsnii 21)(

20、)(11YyYynnii )()(11221YynYynnii 26根據對稱性論證法及根據對稱性論證法及 的表達式,有的表達式,有 )(yV)(21YyEnii 21)(YYNnNii 2)1(SNNn )(2YynE2)(YynE )(ynV 2SNnN 由此可得:由此可得: 222)() 1() 1()(SnNNnNnSsE 27(五)放回簡單隨機抽樣的簡單估計(五)放回簡單隨機抽樣的簡單估計 現實中有許多情況下,抽樣必須是放回的,現實中有許多情況下,抽樣必須是放回的,即從總體中抽中的單位每次都要放回總體中去。即從總體中抽中的單位每次都要放回總體中去。例如在城市中對行人、車輛的調查,對超市

21、顧例如在城市中對行人、車輛的調查,對超市顧客、影劇院觀眾的調查等抽樣都是有放回的,客、影劇院觀眾的調查等抽樣都是有放回的,從而,有可能重復抽中某些單位。從而,有可能重復抽中某些單位。 對于每次抽到的結果對于每次抽到的結果(視為隨機變量視為隨機變量) 都有都有 iyYYNyEiNii 11)(221)(1)( YYNyViNii28由此可以證明:由此可以證明: YyEnyEnii )(1)(1nyVnyVnii212)(1)( 注意到注意到 )(21yyEnii )(212ynyEnii niiiyEyVnyEyV122)()()()()()(2222YnnYn 2)1( n29因此樣本方差因此

22、樣本方差 212)(11yynsnii 是無限總體方差是無限總體方差 的無偏估計量。的無偏估計量。 2 方差方差 的一個無偏估計是:的一個無偏估計是: )(yVnsyv2)( 考慮樣本單位順序的放回簡單隨機抽樣也是考慮樣本單位順序的放回簡單隨機抽樣也是等概率抽樣。等概率抽樣。 30)()(yVyVdeffsrsdeff11)() 1(22nNNSnNnNSnNNdeffn這說明除非 =1,否則在相同的樣本量下,放回簡單隨機抽樣的方差總是大于不放回的方差,即它的抽樣效率一般比不放回簡單隨機抽樣的低。根據抽樣設計效應定義: 放回簡單隨機抽樣的 為:31n【例【例3-3】為調查某大學學生的電信消費水

23、平,在全校】為調查某大學學生的電信消費水平,在全校=15230名學生中,用簡單隨機抽樣的方法抽得一個名學生中,用簡單隨機抽樣的方法抽得一個=36的樣本。對的樣本。對每個抽中的學生調查其上個月的電信支出金額(如表每個抽中的學生調查其上個月的電信支出金額(如表3-6所所示)。試以示)。試以95%的置信度估計該校大學生該月電信消費的平的置信度估計該校大學生該月電信消費的平均支出額。均支出額。 樣本序號消費額(元)樣本序號消費額(元)樣本序號消費額(元)123456789101112453671317089337522567951314151617181920212223244853243941931

24、959111643576252627282930313233343536835133252890175743146194732 , , , , , 。因此,對該校大學生某月的電信消費的人均支出額的估計為53.64(元),由于置信度95%對應的 =1.96,所以,可以以95%的把握 說該校大學生該月的電信消費的人均支出額大約在53.641.966.1355,即41.6165.67元之間。 若采取放回簡單隨機抽樣,則: , , ,以95%的把握估計該校大學生該月的電信消費的人均支出額大約在53.641.966.1428,即41.6065.68元之間。 計算結果說明,不放回比放回簡單隨機抽樣估計的置

25、信區間略小一些。由于總體較大而抽樣比較小,所以兩者之間相差很小。1931iy )(64.53元y02771212. 0/ )1 (nf41.13582s6444.37/)1 ()(2nsfyv1355. 6)(yset64.53y7336.37)(2nsyv1428. 6)(yse解:依據題意和表中數據,可計算得:33 總體總值為總體均值的總體總值為總體均值的 倍,即倍,即 NiiYYNY1 niiynNyNY1N(一)簡單估計量的定義(一)簡單估計量的定義 N倍的樣本均值是總體總值的簡單估計量,倍的樣本均值是總體總值的簡單估計量,即即 二、總體總值的簡單估計二、總體總值的簡單估計 只要我們有

26、了總體均值的估計結果,就只要我們有了總體均值的估計結果,就可以很容易地推出總體總值的估計結果。可以很容易地推出總體總值的估計結果。34由于總體總值是總體均值的由于總體總值是總體均值的N倍,其簡單倍,其簡單估計量也是總體均值估計量的估計量也是總體均值估計量的N倍,而倍,而N是固是固定常數,所以總體總值的簡單估計量的性質定常數,所以總體總值的簡單估計量的性質由總體均值的簡單估計量的性質來決定。由總體均值的簡單估計量的性質來決定。 容易證明容易證明YYNyNEyNEYE )()()(222)1()()(SnfNyVNYV 222)1 ()()(snfNyvNYv 的無偏估計為的無偏估計為 )(YV(

27、二)簡單估計量的性質(二)簡單估計量的性質35【例例3.4】試以】試以95%的置信度估計例3.3中該校大學生該月電信消費的總支出額。解:依題意,N=15230,根據例3.3計算的結果,可估計該校大學生該月電信消費的總支出額為 (元)。在不放回簡單隨機抽樣下, =1523037.6444 =1523037.6444=8731 727 749(元), (元), 以95%的把握估計該校大學生該月電信消費的總支出額為: 816 937.21.9693 443.71元即在633 787.531 000 086.87元之間。 若為放回簡單隨機抽樣,則可得: 1523037.7336 =8752417947

28、(元), (元),以95%的把握估計該校大學生該月電信消費的總支出額為816 937.21.9693 554.36元,即在633 570.651 000 303.75元之間。2 .81693764.5315230yNY)()(2yvNYv271.93443)()(YvYse)()(2yvNYv236.93554)()(YvYse36第三節第三節 總體比例的簡單估計總體比例的簡單估計37規定規定 屬屬性性。,總總體體單單元元不不具具有有某某種種;總總體體單單元元具具有有某某種種屬屬性性0, 1Y 設總體中有設總體中有 個單位,具有某種屬性的單位數個單位,具有某種屬性的單位數為為 ;不具有該種屬性

29、的單位數為;不具有該種屬性的單位數為 。N1N1NN 具有某種屬性的單位比例為:具有某種屬性的單位比例為:YYNNNPNii 111不具有該種屬性的單位的比例為:不具有該種屬性的單位的比例為:PNNNQ 11 因此對總體比例的估計就是對總體均值的估計,因此對總體比例的估計就是對總體均值的估計,對總體中具有某種屬性單位的總個數對總體中具有某種屬性單位的總個數 的估計是的估計是對總體總值估計的一個特例。對總體總值估計的一個特例。 1N一、問題的提法一、問題的提法 38(一)簡單估計量的定義(一)簡單估計量的定義 二、總體比例的簡單估計量及其性質二、總體比例的簡單估計量及其性質 根據調查要求,利用簡

30、單隨機抽樣的方式隨機抽取個單位組成樣本,其中 個具有某種屬性,則樣本比例(樣本均值) 就是總體比例 的簡單估計量; 就是總體中具有某種屬性單位的總個數 的簡單估計量。 n1nynynnpnii11NNP/1NpN 11N39(二)估計量的性質(二)估計量的性質pPPYyEpE)()(1、 是 的無偏估計。即有:p1)(NnNnpQpV2、 的方差為:3、 的無偏估計量是 ,即)(pV)(pvpqnfpqNnnNpv11) 1()(40當 都比較大時,我們以正態分布給出 及 的近似置信區間(置信度為 )為:nNnN,P1N11)1 (,1)1 (npqftpnpqftp1)(,1)(npqnNN

31、tNpnpqnNNtNpP1N)211)1 (),211)1 (nnpqftpnnpqftp)21)(),21)(nNnpqnNNtNpnNnpqnNNtNp修正后的 與 的置信區間分別為:41 【例例3.5】試以】試以95%的置信度估計例3.3中該校大學生該月電信消費支出超出80元的人數及其比例。解:根據例3.3所給的資料可知, =15230, =36, 7, =1.96。由此可計算得: 于是 的95%的置信區間為 的95%的置信區間為(0.0496 ,0.3392 )=(755,5166)。 Nn1nt1944. 01nnp1566. 0)1 (,0285. 011pppqnf0668.

32、01566. 00285. 01)1 (npqf0139. 021nP)0139. 00668. 096. 1 (1944. 0)211)1 (nnpqftp1NNN=(0.0496,0.3392)42第四節第四節 樣本量的確定樣本量的確定43 在抽樣調查的理論方法研究中,樣本量的確定在抽樣調查的理論方法研究中,樣本量的確定既有重要的理論意義,又有現實的實用價值。樣本既有重要的理論意義,又有現實的實用價值。樣本量過大,不符合抽樣調查的宗旨;過小,則抽樣誤量過大,不符合抽樣調查的宗旨;過小,則抽樣誤差偏大,無法保證估計精度的要求。樣本量的確定差偏大,無法保證估計精度的要求。樣本量的確定主要受兩個

33、方面因素的影響和制約:主要受兩個方面因素的影響和制約: 一是對抽樣估計量精度的要求。對于一個確定一是對抽樣估計量精度的要求。對于一個確定的抽樣設計,估計量的精度要求高意味著要求的抽的抽樣設計,估計量的精度要求高意味著要求的抽樣誤差小,而要想抽樣誤差小,就必須樣本量大。樣誤差小,而要想抽樣誤差小,就必須樣本量大。而總體單位調查標志的變異程度、總體的大小、樣而總體單位調查標志的變異程度、總體的大小、樣本設計和所使用的估計量、回答率等都是影響估計本設計和所使用的估計量、回答率等都是影響估計精度的因素,從而也是影響樣本量的因素。精度的因素,從而也是影響樣本量的因素。一、確定樣本量主要考慮的因素一、確定

34、樣本量主要考慮的因素44 二是實際調查運作的限制。調查的經費能支持二是實際調查運作的限制。調查的經費能支持多大的樣本?允許調查持續的時間有多長?需要多多大的樣本?允許調查持續的時間有多長?需要多少調查人員?雖然有些限制因素在樣本量的計算公少調查人員?雖然有些限制因素在樣本量的計算公式中還無法體現,但是在確定最終所需的樣本量時式中還無法體現,但是在確定最終所需的樣本量時必須加以考慮。實踐中樣本量的確定是在多種約束必須加以考慮。實踐中樣本量的確定是在多種約束條件下進行的折衷過程。條件下進行的折衷過程。 由于大部分限制約束條件不便于量化,確定樣由于大部分限制約束條件不便于量化,確定樣本量的計算公式時

35、往往只在抽樣精度與調查費用兩本量的計算公式時往往只在抽樣精度與調查費用兩者之間權衡。采用兩種不同的方式來確定:一種是者之間權衡。采用兩種不同的方式來確定:一種是在總費用一定的條件下使精度最高;另一種是在滿在總費用一定的條件下使精度最高;另一種是在滿足一定精度要求的條件下使費用最小。足一定精度要求的條件下使費用最小。 45給定絕對誤差限給定絕對誤差限 、相對誤差限、相對誤差限 和變異和變異系數系數 的允許上限的樣本量確定公式,即的允許上限的樣本量確定公式,即分別有:分別有: dr)(yCv2202tSnd22022t Snr Y2220)(YyCvSn 二、估計總體均值(總值)的樣本確定二、估計

36、總體均值(總值)的樣本確定46 由于總體方差由于總體方差 和總體均值和總體均值 未知,因此在利未知,因此在利用上述公式時,必須事先對它們做出估計。實際工用上述公式時,必須事先對它們做出估計。實際工作中,可以通過以往對同類問題調查積累的經驗來作中,可以通過以往對同類問題調查積累的經驗來估計,也可以通過預調查來估計,或通過其他調查估計,也可以通過預調查來估計,或通過其他調查方法和定性分析方法獲得。方法和定性分析方法獲得。 對于復雜抽樣設計方法,由于確定樣本量的公式對于復雜抽樣設計方法,由于確定樣本量的公式比較復雜,常常難于計算。在同樣精度要求的條件比較復雜,常常難于計算。在同樣精度要求的條件下,簡

37、單隨機抽樣的樣本量下,簡單隨機抽樣的樣本量 相對容易獲得,這時相對容易獲得,這時可以利用(可以利用(3.21)式先計算復雜抽樣設計的設計效)式先計算復雜抽樣設計的設計效應應 ,然后再間接推算復雜抽樣設計方法所需要,然后再間接推算復雜抽樣設計方法所需要的樣本量的樣本量 ,即有:,即有: 2SYndeffndeffnn 47【例例3.6】在例】在例3.3中,如果要求以95%的置信度估計該校大學生該月人均電信消費支出的絕對允許誤差不超過5元,樣本量應確定為多少? 解:依據所給條件: =15230, =5,置信度95%對應的標準正態分布表的上側分位數為 1.96,且 =1358.41,據此可計算得:

38、=Nt2s2220Stn74.208541.135896. 1222061523074.208174.208100Nnnn 也就是說,至少應抽取一個樣本量為206的簡單隨機樣本,才能滿足95%置信度條件下絕對誤差不超過5元的精度要求。48根據樣本比例根據樣本比例 的方差公式的方差公式 可以推得:可以推得: p1)( NnNnpQpVNnnn1100 )(0pVPQn 其中其中 同樣可求得給定絕對誤差限同樣可求得給定絕對誤差限 、相對誤差限、相對誤差限 和變異系數和變異系數 的允許上限的樣本量確定公式,的允許上限的樣本量確定公式,即分別有:即分別有:dr)(yCv2202tSnd22022t S

39、nr Y2220)(YyCvSn 在無限總體或放回抽樣情形下,在無限總體或放回抽樣情形下, 即為所確即為所確定的樣本量。定的樣本量。 0n三、估計總體比例的樣本量確定三、估計總體比例的樣本量確定49【例例3.7】 在例3.5中,如果要求以95%的置信度估計該校大學生該月電信消費支出超出80元的人數比例的相對允許誤差不超過10%,樣本量至少應為多少?解:根據例3.5所給的資料和計算的結果可知: =15230, =36, 7, =1.96。 ,由此可計算得:Nn1nt,1944. 0p8056. 01944. 01q97.15911944. 001. 08056. 096. 12220pqtn14

40、4215230197.1591197.15911100Nnnn 計算結果說明,至少應抽取一個樣本量為1442的簡單隨機樣本,才能滿足95%置信度條件下相對允許誤差不超過10%的精度要求。50四、逆抽樣法四、逆抽樣法 現實中有這樣一種情況,即總體中具有現實中有這樣一種情況,即總體中具有所考慮屬性的單位數很少,也就是說所考慮屬性的單位數很少,也就是說 值很值很小。對于此類稀有事件的比例估計問題,利小。對于此類稀有事件的比例估計問題,利用前面給出的公式確定樣本量有困難。用前面給出的公式確定樣本量有困難。P 霍丹(霍丹(HaldaneHaldane)19451945年提出一種稱為年提出一種稱為逆抽樣的

41、方法,專門用于此類小比例的抽樣。逆抽樣的方法,專門用于此類小比例的抽樣。51第五節第五節 子總體估計子總體估計52一、問題的提出一、問題的提出 我們把總體中具有某種共同屬性特征的單位的我們把總體中具有某種共同屬性特征的單位的集合稱為子總體。集合稱為子總體。 對子總體的處理有多種方法:若每個子總體在編對子總體的處理有多種方法:若每個子總體在編制抽樣框時就可以區分開,可以采用分層抽樣方法進制抽樣框時就可以區分開,可以采用分層抽樣方法進行估計;若事先不能將各個子總體區分開來,但是事行估計;若事先不能將各個子總體區分開來,但是事先可以知道各個子總體的單位數先可以知道各個子總體的單位數 ,則可采用事后,

42、則可采用事后分層的方法進行估計;還有一種情況是,既不能事先分層的方法進行估計;還有一種情況是,既不能事先將各個子總體區分開來,又無法事先知道各個子總體將各個子總體區分開來,又無法事先知道各個子總體的單位數的單位數 。本節的討論僅限于后一類子總體的估。本節的討論僅限于后一類子總體的估計計 。jNjN53 jnijijjyny1)()(1 jNijijjYNY1)()(1二、子總體均值的估計二、子總體均值的估計樣本均值樣本均值是子總體均值是子總體均值的無偏估計量的無偏估計量542)(1)(jjjjSnfyV 式中式中 為第為第 個子總體的抽樣比,子總體的個子總體的抽樣比,子總體的方差未知,可用其樣

43、本方差方差未知,可用其樣本方差 2)(1)(2)(11jnijijjyynsj jjjNnf j其方差為其方差為 來估計。至此我們的問題并沒有解決,因為來估計。至此我們的問題并沒有解決,因為 未未知,所以知,所以 也是未知的。也是未知的。 jNjf55 我們可以將單位是否屬于第我們可以將單位是否屬于第 個子總體看作是總體個子總體看作是總體單位的一個屬性特征,那么單位的一個屬性特征,那么 就是總體的比例就是總體的比例 ,而而 就是其樣本的比例就是其樣本的比例 , 是是 的無偏估計,因的無偏估計,因此有此有jNNj/Pnnj/ppPNNnnEjj )(因為因為 和和 都是固定的,所以都是固定的,所

44、以 fNnNnEjj )(因此可用因此可用 來估計來估計 fjjjNnf/據此我們可得到據此我們可得到 的無偏估計量為的無偏估計量為)()( jyV2)(1)()()(111)(jnijijjjyynnfyvj njN56 上一小節解決了子總體均值的估計問題,上一小節解決了子總體均值的估計問題,但是由于但是由于 未知,子總體總值的估計問題依未知,子總體總值的估計問題依然沒有得到解決。然沒有得到解決。 jN定義定義 ,否否則則個個子子總總體體;個個單單元元屬屬于于第第若若第第0,jiYUii記記NNPjj jjPQ 1它們可以分別用它們可以分別用 , 進行估計。進行估計。nnpjj jjpq 1

45、三、子總體總值的估計三、子總體總值的估計57于是有于是有 )(1)(1)(1111jjNijijjNijiNiiYPYNNNYNUNUjj )(112122UNUNSNiiu )()(112)(221)(jjNijiYNPYNj )()()(112)(22)(2)(1)(jjjjjNijiYNPYNYYNj )()()1(1122)(2jjjjjPNNYNSNN 2)(2)(111jjjjjYQPNNSNN 58 總體總值總體總值 (也就是子總體總值(也就是子總體總值 )的)的一個簡單無偏估計為一個簡單無偏估計為 U)( jY jnijiniijynNunNuNY1)(1)(它的方差為它的方差

46、為 222)()1()()(ujSnfNuVNYV )(111)1(2)(22jjjjjYQPNNSNNnfN 59而樣本方差而樣本方差 212)(11uunsniiu )()1(112)(2jjjjjyqnpsnn )()(112)(2)(1)(jjjjnijiyqnpyynj 因此因此 的一個無偏估計為的一個無偏估計為 )()( jYV)()()1()1()(2)(2)(1)(2)(jjjjnijijyqnpyynnfNYvj 60編號為奇數的習題答案編號為奇數的習題答案3.1判斷以下抽取方式是否為等概率抽樣判斷以下抽取方式是否為等概率抽樣:(1)是是 (2)否否 (3)是是 (4)否否613.3為調查某中學學生的每月購書支出水平,在為調查某中學學生的每月購書支出水平,在

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論