抽樣調(diào)查多階段抽樣培訓(xùn)課件_第1頁
抽樣調(diào)查多階段抽樣培訓(xùn)課件_第2頁
抽樣調(diào)查多階段抽樣培訓(xùn)課件_第3頁
抽樣調(diào)查多階段抽樣培訓(xùn)課件_第4頁
抽樣調(diào)查多階段抽樣培訓(xùn)課件_第5頁
已閱讀5頁,還剩42頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

§8.1引言

前面提到的整群抽樣雖然有很多優(yōu)點(diǎn),但是由于群內(nèi)單元通常具有相似性(表現(xiàn)為群內(nèi)相關(guān)系數(shù)大于零)。尤其是當(dāng)群比較大時(shí),人們自然會(huì)想到?jīng)]有必要對(duì)群內(nèi)所有單元都進(jìn)行調(diào)查,而只要對(duì)群內(nèi)單元進(jìn)行再抽樣,對(duì)被抽中的單元進(jìn)行調(diào)查,這就是常用的多階段抽樣。第一頁,共四十七頁。一、多階段抽樣的定義

先在總體單元(初級(jí)單元)中抽出樣本單元,并不對(duì)這個(gè)樣本單元中的所有下一級(jí)單元(二級(jí)單元)都進(jìn)行調(diào)查,而是在其中再抽出若干個(gè)二級(jí)單元并進(jìn)行調(diào)查。這種抽樣方法稱為二階段抽樣。同樣的道理,還可以有三階段抽樣、四階段抽樣等。對(duì)于二階段以上的抽樣,統(tǒng)稱為多階段抽樣。第二頁,共四十七頁。二、多階段抽樣的優(yōu)點(diǎn)(1)多階段抽樣保持了整群抽樣的樣本比較集中、便于調(diào)查、節(jié)約費(fèi)用等優(yōu)點(diǎn)。(2)多階段抽樣不需要編制所有小單元的樣本框。三、抽選方法與推斷原理

多階段抽樣時(shí),每一個(gè)階段的抽樣可以相同,也可以不同。它通常與分層抽樣、整群抽樣、系統(tǒng)抽樣結(jié)合使用。多階段抽樣時(shí),抽樣是分步進(jìn)行的,因此,討論估計(jì)量的均值及其方差時(shí),需要分階段進(jìn)行這要用到下面的性質(zhì)。第三頁,共四十七頁。性質(zhì)1

對(duì)于兩階段抽樣,有式中,為在固定初級(jí)單元時(shí)對(duì)第二階抽樣求均值和方差;為對(duì)第一階抽樣求均值和方差。

性質(zhì)1可以推廣到多階段抽樣的情形,例如對(duì)于三階段抽樣,有第四頁,共四十七頁。§8.2初級(jí)單元大小相等的二階抽樣第一階段在總體N個(gè)初級(jí)單元中,以簡(jiǎn)單隨機(jī)抽樣抽取n個(gè)初級(jí)單元,第二階段在被抽中的初級(jí)單元包含的M個(gè)二級(jí)單元中,以簡(jiǎn)單隨機(jī)抽樣抽取m個(gè)二級(jí)單元,即最終接受調(diào)查的單元。例如:某個(gè)新開發(fā)的小區(qū)擁有相同戶型的15個(gè)單元的樓盤,居民已經(jīng)陸續(xù)搬入新居,每個(gè)單元住有12戶居民,為調(diào)查居民家庭裝修情況,準(zhǔn)備從180戶居民戶中抽取20戶進(jìn)行調(diào)查。如下表:第五頁,共四十七頁。編號(hào)單元房號(hào)123456789101112131415一棟A座一棟B座一棟C座二棟A座二棟B座二棟C座三棟A座三棟B座三棟C座四棟A座四棟B座四棟C座五棟A座五棟B座五棟C座12

3456789101112123456789101112123456789101112123456789101112123456789101112

123456789101112123456789101112123456789101112123456789101112123456789101112123456789101112123456789101112123456789101112123456789101112123456789101112第六頁,共四十七頁。表中紅字為抽中的房號(hào)。這時(shí),初級(jí)單元有15個(gè),每個(gè)初級(jí)單元擁有二級(jí)單元12個(gè)。首先將單元從1到15編號(hào),在15單元中隨機(jī)抽取5個(gè)單元,分別是1,6,9,12,13號(hào);然后在被抽中的單元中,進(jìn)行第二次抽樣,即分別在12戶居民戶中隨機(jī)抽取4戶。一、符號(hào)說明初級(jí)單元和初級(jí)單元擁有的二級(jí)單元個(gè)數(shù):N,M第一階段和第二階段抽樣的樣本量:n,m第i個(gè)初級(jí)單元中的第j個(gè)二級(jí)單元的觀測(cè)值:樣本中第i個(gè)初級(jí)單元中的第j個(gè)二級(jí)單元的觀測(cè)值:第七頁,共四十七頁。第一階段和第二階段的抽樣比:第i個(gè)初級(jí)單元按二級(jí)單元的平均值:按二級(jí)單元的平均值:初級(jí)單元間的方差:第八頁,共四十七頁。初級(jí)單元內(nèi)的方差:由的表達(dá)式可知,若記則有即是的平均值。同理有第九頁,共四十七頁。二、估計(jì)量及其性質(zhì)(一)總體均值的估計(jì)性質(zhì)2對(duì)于初級(jí)單元大小相等的二階抽樣,如果兩個(gè)階段都是簡(jiǎn)單隨機(jī)抽樣,且對(duì)每個(gè)初級(jí)單元,第二階抽樣是相互獨(dú)立進(jìn)行的,則對(duì)總體均值的無偏估計(jì)為:其方差為:的無偏估計(jì)為:第十頁,共四十七頁。【例8.1】欲調(diào)查4月份100家企業(yè)的某項(xiàng)指標(biāo),首先從100家企業(yè)中抽取了一個(gè)有板有5家樣本企業(yè)的簡(jiǎn)單隨機(jī)樣本,調(diào)查人員對(duì)5家企業(yè)分別在調(diào)查月內(nèi)隨機(jī)抽取3天作為調(diào)查日,要求樣本企業(yè)只填寫這3天的流水帳。調(diào)查的結(jié)果如下。樣本企業(yè)第一日第二日第三日12345573851486259416053556450634954要求根據(jù)這些數(shù)據(jù)推算不100家企業(yè)該指標(biāo)的總量,并給出估計(jì)的95%置信區(qū)間。第十一頁,共四十七頁。解將企業(yè)作為初級(jí)單元,將每一天看著二級(jí)單元。調(diào)查月內(nèi)擁有30天(即擁有30個(gè)二級(jí)單元)。首先在初級(jí)單元中抽取一個(gè)n=5的簡(jiǎn)單隨機(jī)樣本再對(duì)每個(gè)樣本的二級(jí)單元分別獨(dú)立抽取一個(gè)m=3的簡(jiǎn)單隨機(jī)樣本由題意,N=100,M=30,n=5,m=3首先計(jì)算樣本初級(jí)單元的均值、方差:第十二頁,共四十七頁。樣本企業(yè)123456043585057133939719于是得到:第十三頁,共四十七頁。置信度為95%的置信區(qū)間為:160800±1.96×9216在上面的方差估計(jì)式中,第一項(xiàng)是主要的,第二項(xiàng)要小得多!第十四頁,共四十七頁。(二)對(duì)總體比例的估計(jì)如果要估計(jì)總體中具有所研究特征的二級(jí)單元數(shù)占全體全體二級(jí)單元數(shù)的比例,則式中,為第i個(gè)初級(jí)單元中具有所研究特征的二級(jí)單元數(shù),則對(duì)P的估計(jì)為:式中,為第i個(gè)初級(jí)單元中具有所研究特征的二級(jí)單元數(shù)。第十五頁,共四十七頁。性質(zhì)3

對(duì)于二階抽樣,如果兩個(gè)階段都是簡(jiǎn)單隨機(jī)抽樣,則有估計(jì)量的方差為:的無偏估計(jì)為:式中,第十六頁,共四十七頁。【例8.2】欲調(diào)查某個(gè)新小區(qū)居民家庭裝潢聘請(qǐng)裝潢公司的比例。我們?cè)?5個(gè)單元中隨機(jī)抽取了5個(gè)單元,在這5個(gè)單元分別隨機(jī)抽取了4戶居民進(jìn)行調(diào)查,對(duì)這20戶的調(diào)查結(jié)果如下表:樣本單元第一戶第二戶第三戶第四戶一棟A座二棟C座三棟C座四棟C座五棟B座是否否否是是是否否否否否否否否否否是否否要求根據(jù)這些數(shù)據(jù)推算居民家庭裝潢聘請(qǐng)裝潢公司的比例。第十七頁,共四十七頁。解:記聘請(qǐng)裝潢公司的居民戶為“1”,否則記為“0”。這里,N=15,M=12,n=5,m=4,因此,其方差的估計(jì)為:P的置信區(qū)間為:第十八頁,共四十七頁。§8.3初級(jí)單元大小不等的二階抽樣一般而言,初級(jí)單元的大小是不相等的,如果按初級(jí)單元的大小分層后,層內(nèi)初級(jí)單元的大小差別仍很大,則需用本節(jié)介紹的方法來處理二階抽樣的問題。當(dāng)初級(jí)單元大小不等時(shí),一般采用不等概抽樣。一、符號(hào)說明總體中初級(jí)單元個(gè)數(shù)及第一階抽取的樣本量:N,n第i個(gè)初級(jí)單元中二級(jí)單元數(shù):第i個(gè)初級(jí)單元中第二階抽樣的樣本量:第i個(gè)初級(jí)單元中第j個(gè)二級(jí)單元的觀測(cè)值:樣本中第i個(gè)初級(jí)單元中第j個(gè)二級(jí)單元的觀測(cè)值:第十九頁,共四十七頁。第一階和第二階的抽樣比:二級(jí)單元個(gè)數(shù):指標(biāo)總和:第i個(gè)初級(jí)單元指標(biāo)總和:第i個(gè)初級(jí)單元按二級(jí)單元的平均值:第二十頁,共四十七頁。按二級(jí)單元的平均值:初級(jí)單元間的方差:第i個(gè)初級(jí)單元二級(jí)單元間的方差:第二十一頁,共四十七頁。二、估計(jì)量及其性質(zhì)(一)對(duì)初級(jí)單元進(jìn)行簡(jiǎn)單隨機(jī)抽樣如果二階抽樣中每個(gè)階段都采用簡(jiǎn)單隨機(jī)抽樣,并且每個(gè)初級(jí)單元中二級(jí)單元的抽樣是相互獨(dú)立的,則對(duì)總體總和的估計(jì)可以采用簡(jiǎn)單估計(jì),也可以考慮采用比率估計(jì)。1.簡(jiǎn)單估計(jì)量

對(duì)總體總和的簡(jiǎn)單估計(jì)為:根據(jù)性質(zhì)1,不僅可以證明這個(gè)估計(jì)量是無偏的,并且它的方差為:第二十二頁,共四十七頁。的一個(gè)無偏估計(jì)為:式中,第二十三頁,共四十七頁。2.比率估計(jì)量由于初級(jí)單元的大小不同,往往造成初級(jí)單元的觀測(cè)值差異很大,使得估計(jì)量方差的第一項(xiàng)很大,從而估計(jì)量的方差也就變得很大。這時(shí),可以考慮將初級(jí)單元的大小作為輔助變量,采用比率估計(jì)量對(duì)總體總和進(jìn)行估計(jì)。對(duì)總體總和的估計(jì)量為:第二十四頁,共四十七頁。這是一個(gè)有偏估計(jì)量,但隨著樣本量的增加,其偏倚將趨于零。其近似均方誤差為:第二十五頁,共四十七頁。的樣本估計(jì)為:式中,第二十六頁,共四十七頁。(二)對(duì)初級(jí)單元進(jìn)行放回不等概抽樣利用第五章的方法,事先規(guī)定每個(gè)初級(jí)單元被抽中的概率對(duì)被抽中的初級(jí)單元,再抽取個(gè)二級(jí)單元。對(duì)總體總和的估計(jì)通常是構(gòu)造初級(jí)單元指標(biāo)總量的無偏估計(jì),然后利用第五章介紹的Hansen-HuRwitz估計(jì)量對(duì)總體總量Y進(jìn)行估計(jì)。由于是的無偏估計(jì),由性質(zhì)1,可以證明是Y的無偏估計(jì)。且的方差為:第二十七頁,共四十七頁。的一個(gè)無偏估計(jì)為:注意上述對(duì)第二階抽樣并沒有做出特別的規(guī)定,而且估計(jì)量的方差估計(jì)式與第二階抽樣的方式無關(guān)。在實(shí)際工作中,如果初級(jí)單元大小不相等,通常人們喜歡在第一階抽樣時(shí)按放回的與二級(jí)單元數(shù)成比例的不等概抽樣;第二階抽樣則采用簡(jiǎn)單隨機(jī)抽樣,且每個(gè)樣本初級(jí)單元的樣本量都相等,此時(shí),估計(jì)量的形式非常簡(jiǎn)單。第二十八頁,共四十七頁。【例8.3】某小區(qū)擁有10座高層建筑,每座高層建筑擁有的樓層數(shù)如下表:高層建筑ABCDEFGHIJ樓層12121615101610181620用二階抽樣方法抽出10個(gè)樓層進(jìn)行調(diào)查,第一階抽樣為放回的、按與每座建筑擁有的樓層數(shù)成比例的不等概抽樣抽取5座建筑,第二階按簡(jiǎn)單隨機(jī)抽樣對(duì)每座建筑抽取兩層。對(duì)10個(gè)樓層居民人數(shù)的調(diào)查結(jié)果如下表:一階樣本序號(hào)12345居民數(shù)18,1215,1819,1316,1016,11第二十九頁,共四十七頁。解:已知n=5,m=2,注意到這個(gè)樣本是自加權(quán)的,根據(jù)P181公式(8.29),得估計(jì)量的方差為:=9776.625估計(jì)量的標(biāo)準(zhǔn)差為:第三十頁,共四十七頁。(三)對(duì)初級(jí)單元進(jìn)行不放回不等概抽樣不放回不等概抽樣的效率比放回的效率高,因此,有時(shí)人們也會(huì)傾向于用不放回不等概抽樣來抽取初級(jí)單元。這時(shí)可利用第五章介紹的不放回不等概抽樣的結(jié)果對(duì)總體總量進(jìn)行推算。當(dāng)然估計(jì)量的推算比較復(fù)雜。對(duì)總體總量Y的估計(jì)可以采用Horvitz-Thompson(赫魏茲-湯普森)估計(jì)。第三十一頁,共四十七頁。§8.4其他問題一、總樣本量及最優(yōu)樣本量的配置對(duì)于二階抽樣,應(yīng)該抽多少二級(jí)單元,即確定nm為多少,一般可采用兩種方法:1.根據(jù)調(diào)查費(fèi)用,確定可以調(diào)查的樣本量。2.根據(jù)簡(jiǎn)單隨機(jī)抽樣時(shí)應(yīng)抽樣本量,再乘以設(shè)計(jì)效應(yīng)deff獲得。由于影響精度的主要原因是初級(jí)單元之間的差異,所以多抽一些初級(jí)單元,少抽一些二級(jí)單元較好。但往往初級(jí)單元的調(diào)查費(fèi)用比二級(jí)單元要高。第三十二頁,共四十七頁。考慮費(fèi)用函數(shù)為最簡(jiǎn)單的一種形式:式中,為與樣本量無關(guān)的固定費(fèi)用,如公司的辦公費(fèi)、場(chǎng)租費(fèi)等;為每調(diào)查一個(gè)初級(jí)單元的費(fèi)用;為每調(diào)查一個(gè)二級(jí)單元的費(fèi)用。則m的最優(yōu)值為:式中,實(shí)際使用時(shí),m應(yīng)為整數(shù),但計(jì)算出的往往不是整數(shù),令為的整數(shù)部分,則m的取值規(guī)則為:第三十三頁,共四十七頁。求出m之后,根據(jù)總費(fèi)用函數(shù),就可以確定n,從而確定最優(yōu)抽樣比和第三十四頁,共四十七頁。二、三階及多階抽樣(一)各級(jí)單元大小相等的多階段抽樣如果總體擁有N個(gè)初級(jí)單元,每個(gè)初級(jí)單元擁有M個(gè)二級(jí)單元,每個(gè)二級(jí)單元又擁有K個(gè)三級(jí)單元,各階的樣本量分別為n,m,k,每個(gè)階段都按簡(jiǎn)單隨機(jī)抽樣,則三級(jí)單元總體均值的估計(jì)為:其方差為:方差的無偏估計(jì)為:第三十五頁,共四十七頁。由于方差的主要項(xiàng)為第一項(xiàng),其次為第二項(xiàng),第三項(xiàng)幾乎可以忽略。所以對(duì)于更高階的抽樣,估計(jì)量的方差計(jì)算一般只計(jì)算到第二階至第三階就可以了。(二)各級(jí)單元大小不相等時(shí)的多階段抽樣(略)第三十六頁,共四十七頁。(三)多階抽樣的實(shí)例某調(diào)查公司接受了一項(xiàng)關(guān)于全國(guó)城市成年居民人均奶制品消費(fèi)支出及每天至少喝一杯鮮奶人數(shù)的比例情況的調(diào)查。確定抽樣范圍為全國(guó)地級(jí)及以上城市中的成年居民。成年居民指年滿18周歲以上的居民。第一步:確定抽樣方式。調(diào)查公司決定采用多階段抽樣方法進(jìn)行方案設(shè)計(jì),調(diào)查的最小單元為成年居民。確定調(diào)查的各個(gè)階段為城市、街道、居委會(huì)、居民戶,在居民中利用而維隨機(jī)表抽取成年居民。第二步:確定樣本量及各階段樣本量的分配。按簡(jiǎn)單隨機(jī)抽樣,在95%置信度下,絕對(duì)誤差為5%取使方差達(dá)到最大的比例P=0.5,則全國(guó)樣本量為:第三十七頁,共四十七頁。根據(jù)以往調(diào)查經(jīng)驗(yàn),估計(jì)回答率為b=80%,因此調(diào)整樣本量為:多階段抽樣的效率比簡(jiǎn)單隨機(jī)抽樣的效率低,這里取設(shè)計(jì)效率為deff=3.2,則在全國(guó)范圍內(nèi)應(yīng)調(diào)查的樣本量為:各階段的樣本量配置為:初級(jí)單元:20個(gè)城市;二級(jí)單元:80個(gè)街道,每個(gè)樣本市內(nèi)抽4個(gè)街道;第三十八頁,共四十七頁。三級(jí)單元:160個(gè)居委會(huì),每個(gè)樣本街道內(nèi)抽2個(gè)居委會(huì);四級(jí)單元:1600個(gè)居民戶,每個(gè)樣本居委會(huì)內(nèi)抽10個(gè)居民戶。在樣本居民戶內(nèi),隨機(jī)抽取一名成年居民。第三步:確定抽樣的操作方法。第一階段

在全國(guó)城市中按與人口數(shù)成比例的放回的不等概抽樣,即PPS抽樣。第二、三階段分別按人口數(shù)成比例的不等概等距抽樣。以第二階段為例,在某個(gè)被抽中的城市中,將其所屬的街道編號(hào),搜集各街道的人口數(shù),賦予每個(gè)街道與人口相同的代碼數(shù);根據(jù)該市總?cè)丝跀?shù)除以樣本量4,然后對(duì)代碼進(jìn)行隨機(jī)起點(diǎn)的第距抽樣,則被抽中代碼所在的街道為樣本街道。第三十九頁,共四十七頁。第四階段分別在每個(gè)居委會(huì)中,按等距抽樣抽出10個(gè)居民戶。即根據(jù)居委會(huì)擁有的居民戶數(shù)除以樣本量10得到抽樣間距,然后隨機(jī)起點(diǎn)等距抽樣。在每個(gè)樣本居民戶,調(diào)查員按二維隨機(jī)表抽取一名成年居民。二維隨機(jī)表的使用如下:1.隨機(jī)號(hào)的確定。2.選出被訪者。第四十頁,共四十七頁。序號(hào)姓名性別年齡1234567891011121肖明男531111111111112汪紅女522112121212213肖曉波男233211322131234肖曉玲女2141322314324155412341235426631524351462771436252574388457126375319951438276528101035941728694111161510498327612127294116183105第四十一頁,共四十七頁。第四步:總體估計(jì)記各樣本城市的80位樣本居民中,奶制品消費(fèi)總支出為,則各樣本城市人均奶制品消

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論