




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
等距抽樣第一節(jié)
等距抽樣概述
一、等距抽樣的概念二、排序標志三、等距抽樣的特點一、等距抽樣的概念等距抽樣也稱系統(tǒng)抽樣或機械抽樣。它是將總體各抽樣單元按一定的標志和順序排列以后,每隔一定的距離(間隔)抽取一個單元組成樣本進行調(diào)查。二、排序標志等距抽樣需要有作為排序依據(jù)的輔助標志。排序標志各式各樣,可自由選擇,但歸納起來,可分為兩類,即無關(guān)標志和有關(guān)標志,它們對等距抽樣的作用和相應(yīng)的估計精度各有不同的影響。1、按無關(guān)標志排序所謂無關(guān)標志排序,即用來對總體單元進行排序的標志,與所要調(diào)查研究的標志是不同性質(zhì)的,二者沒有任何必然的關(guān)系。如研究人口的收入狀況時,按身份證號碼、按門牌號碼排序非常方便,一般說來,這些號碼與調(diào)查項目沒有關(guān)系,因此可以認為總體單元的次序排列是隨機的,所以也有人直接稱無關(guān)標志排序的等距抽樣為無序等距抽樣。2、按有關(guān)標志排序所謂有關(guān)標志排序,即用來對總體單元規(guī)定排列次序的輔助標志,與調(diào)查標志具有共同性質(zhì)或密切關(guān)系。這種排序標志,在我國抽樣調(diào)查實踐中有廣泛應(yīng)用,如農(nóng)產(chǎn)量調(diào)查,以本年平均畝產(chǎn)為調(diào)查變量,以往年已知平均畝產(chǎn)作為排序標志。利用這些輔助標志排序,有利于提高等距抽樣的抽樣效果。三、等距抽樣的特點(1)將總體各單元按一定的順序排列后再抽樣,使得樣本單元的分布更加均勻,因而樣本也就更具代表性,比簡單隨機抽樣更精確,在某些場合下甚至可以不用抽樣框。并且如果能夠利用好樣本的相應(yīng)順序在總體中均勻分布這一特點,則容易形成一個按比例樣本。三、等距抽樣的特點(2)等距抽樣簡單明了,快速經(jīng)濟,操作靈活方便,使用面廣,是單階段抽樣中變化最多的一種抽樣技術(shù)。等距抽樣最初用于森林和土地使用情況的調(diào)查,后來經(jīng)過漢森、麥多、科克倫等學(xué)者的努力,使其成為當今家計調(diào)查、記錄抽樣、空間抽樣、工業(yè)抽樣和為普查取得附加信息及估計非抽樣誤差的一種常用方法。在我國,等距抽樣已成了最主要、最基本的抽樣方式,一些大規(guī)模的抽樣調(diào)查,如農(nóng)產(chǎn)量抽樣調(diào)查、城鄉(xiāng)住戶調(diào)查、人口抽樣調(diào)查、產(chǎn)品質(zhì)量抽樣檢查中都普遍采用了等距抽樣。三、等距抽樣的特點(3)當N=nK時,等距抽樣就等同于每層只抽一個單元的分層抽樣或群的大小相等時只抽一個群的整群抽樣。三、等距抽樣的特點因為,這時,總體各單元可排列成如下方式:y11
y21
…
yi1
yk1
y12
y22
…
yi2
yk2
┋
┋
┋┋┋
y1n
y2n
…
yin
ykn
三、等距抽樣的特點(4)等距抽樣的樣本常被視為一個集體單元,一般不計算樣本調(diào)查變量的方差,所以它只能抽象地進行理論分析,而不能對抽樣方差進行估計。三、等距抽樣的特點(5)若總體中的單元呈周期性的變化,等距抽樣的精度可能很高也可能很差。這時要慎重地選擇K。第二節(jié)等距抽樣的實施方法
一、隨機起點等距抽樣二、循環(huán)等距抽樣三、中點等距抽樣四、對稱等距抽樣法五、兩端修正法六、總體有周期性變化時的等距抽樣七、累計和等距抽樣一、隨機起點等距抽樣隨機起點等距抽樣就是前面概念所描述的方法。具體地說,它是在總體單元排序后的第1至K單元之間(第一個抽樣間隔之內(nèi))隨機抽取一個整數(shù)i,以它作為起始單元的編號,以后按固定的順序和間隔依次在每個間隔之內(nèi)各抽取一個單元組成等距樣本,則整個樣本是由以下編號的單元所組成的。i+(j-1)K
(j=1,2,…,n)由于N不一定恰好是K的整數(shù)倍,所以按上述方法得到的等距樣本的樣本量可能為為避免這種樣本量不能確定的情況,確保樣本量為n,1952年拉希里提出了循環(huán)等距抽樣的方法。二、循環(huán)等距抽樣在N≠nK時,把總體中的N個單元按一定順序排列成一個首尾相接的環(huán)(圓形圖),取最接近于N/n的整數(shù)為抽樣間隔K,然后在1到N的單元中,隨機抽取一個單元(設(shè)為第i單元)作為起點,再沿著圓圈按一定方向每間隔K抽取一個單元,直到抽夠n個單元為止。按此方法,可以保證樣本量n不變。不過此時首尾兩個樣本單元的間隔不一定恰好為K,它可能小于K,也可能大于K。循環(huán)等距抽樣從本質(zhì)上看仍然是隨機起點等距抽樣。我們注意到,當N=nK時,在上述兩種抽樣實施方法中,無論按哪一種方法,總體中每個單元的入樣概率都相等,從而是一種嚴格的等概率抽樣。但當N≠nK時,按第一種方法每一個單元的入樣概率依賴于初始值i,對不同的i,稍有不同。以下為了處理方便,我們假定N總是n的整數(shù)倍。在實際工作中,若n充分大,則由于N/n非整數(shù)而帶來的影響就充分小,可以忽略不計。三、中點等距抽樣1953年麥多為克服隨機起點等距抽樣容易產(chǎn)生系統(tǒng)性偏差的缺點,提出中點等距抽樣(即抽取中心位置的樣本)法:計算出抽樣間隔K后,以第一組的組中點為起點,等距抽取單元組成樣本。如果K為奇數(shù),以(K+1)/2為起點,K為偶數(shù),以K/2或(K+2)/2為起點。四、對稱等距抽樣法對稱等距抽樣也是針對有序等距抽樣所提出的,其基本思想是使低標志值的單元與高標志值的單元在樣本中對等出現(xiàn)。從而使樣本的偏差縮小,代表性增強。由于具體的方法不同,對稱等距抽樣又有幾種類型。1.塞蒂的方法——
兩兩對稱等距抽樣1965年塞蒂提出了一種新的等距抽樣方法——對稱等距抽樣法,以克服總體的線性趨勢對估計效率的影響。設(shè)N=nK,n為偶數(shù)。抽樣時,先把總體單元分成n/2個抽樣間隔,使每一抽樣間隔含有2K個單元。然后,在每一抽樣間隔內(nèi),抽取分別與兩端距離相等的兩個單元,這樣共抽取n個單元組成等距樣本。即:如果隨機起點為i,則在第一個抽樣間隔所抽兩個樣本單元的號碼分別為i及2K-i+1;在第二個抽樣間隔所抽兩個樣本單元號碼為i+2K及2(2K)-i+1;如此,最后在第n/2個抽樣間隔所抽兩個樣本單元號碼分別為i+(n-2)K及nK-i+1。一般,若隨機起為i,則抽中的n/2對樣本單元的號碼可以表示為i+2jK,2(j+1)K-i+1]
[j=0,1,…,(n/2)-1]]當n為奇數(shù)時,式中的j由0變到(n-1)/2-1為止,并且,要加上接近末端的第i+(n-1)K個單元。實際中,為便于對稱等距抽樣的實施,當N=nK時,可以將原來由小到大(或由大到小)順序排列的單元按照順逆交替的次序排列在一個表中,這樣,按隨機起點等距抽樣所抽取的樣本即為對稱等距樣本。所謂順逆交替是指在單元的排序中,若第一間隔由小到大排序,則第二間隔按由大到小排序,以此類推。2、辛的修正方法——
中心對稱等距抽樣1968年,辛等人提出另一種對稱等距抽樣法——中心對稱等距抽樣法。即在有序排列的總體單元中,從兩端劃分抽樣間隔。并從兩端的抽樣間隔開始,成對地抽取到兩端距離相等的單元組成等距樣本。這里,仍假定N=nK。當n為偶數(shù)時,若隨機起點為i,則與之對稱的樣本單元號為倒數(shù)第一個抽樣間隔中的N-i+1;與第二個抽樣間隔中i+K對稱的是倒數(shù)第二個抽樣間隔的(N-K)-i+1;如此,一直抽到中間兩個抽樣間隔為止。一般,以i(i=1,2,…,K)為隨機起點的n/2對對稱等距樣本單元的號碼可以表示為:[i+jK,(N-jK)-i+1],[j=0,1,…,(n/2)-1]當n為奇數(shù)時,式中的j由0變到[(n-1)/2]-1為止。然后,再加上中間一個抽樣間隔中的第i+(n-1)K/2個單元。(我國抽樣調(diào)查工作者提出在中間一個抽樣間隔抽取中點處的一個單元。)
五、兩端修正法抽樣方法同隨機起點等距抽樣時的情形。但在計算總體均值的估計量時,對第一個和最后一個樣本單元加權(quán),其余單元的權(quán)數(shù)仍為1(在除以n以前),以矯正由于起點不在中心位置而引起的系統(tǒng)偏差。1、耶茨的方法:設(shè)N=nK,i為1~K中的隨機數(shù),則兩端的樣本單元的權(quán)數(shù)分別為:
其中“+”號用于第一個樣本單元,“-”號用于第n個樣本單元(下同)。當總體單元具有嚴格的線性趨勢時,加權(quán)的樣本均值就是總體均值。2、具爾豪斯與拉奧的方法適用于N≠nK的情況,并采用循環(huán)等距抽樣法,設(shè)i為1~N中的隨機數(shù)。(1)若i+(n-1)K≤N,這時n個樣本單元不經(jīng)過yN,則第1個樣本單元和第n個樣本單元的權(quán)數(shù)分別為(2)若i+(n-1)K>N,設(shè)yN以后的樣本單元有n2個,則第1個樣本單元和第n個樣本單元的權(quán)數(shù)分別為:
六、總體有周期性變化時的等距抽樣有一些總體,其單元的標志值在隨時間的自然排列順序中,會呈現(xiàn)某種明顯或不明顯的周期變化趨勢。如季節(jié)性消費商品的銷售量,隨一年四季的變化而呈現(xiàn)出周期變化。還有些總體,反映出不明顯的周期影響。對有周期變化趨勢的總體進行等距抽樣時,抽樣間隔K的選擇,對估計效率的影響是極為重要的。為了說明問題,我們不妨假定總體單元標志值的變化為一正弦曲線。七、累計和等距抽樣以上所討論的等距抽樣都是以各單元大小相同為前提的,是等概率抽樣。如果抽樣單元的大小不同,且單元的大小又與調(diào)查變量相關(guān)時,用上述方法就不大合適了,此時,應(yīng)采用不等概率抽樣。其基本思路是:在總體各單元按某一標志排序后,累計各單元的大小M
i(當各抽樣單元的大小用所含下一階單元的數(shù)目表示時,也可直接累計其下一階單元數(shù))并進行編碼,以總的累計數(shù)除以n作為抽樣間隔,用K表示,然后在最初的1到K個數(shù)中隨機確定一個數(shù)j(1≤j≤K),j所對應(yīng)的單元即為第一個被抽中單元,以后每間隔K抽取一個隨機數(shù),并按同樣的方法確定出對應(yīng)的單元作為樣本單元,組成等距樣本。累計和等距抽樣的原理同上一章所討論的群大小不等時群的代碼法,此法在實際工作中經(jīng)常用到。第三節(jié)
總體參數(shù)的估計一、等概率抽樣的情形二、不等概率抽樣的情形一、等概率抽樣的情形為討論方便,仍假設(shè)N=nK,則在如下的排列形式中,有:
(i=1,2,…,K)(一)估計量設(shè)等距樣本為表中第i列單元,且i是隨機決定的,總體均值的估計量用表示,則
是的無偏估計。若N≠nK,則上述估計量是有偏的,但當n充分大時,其偏倚可以充分小。(二)估計量的方差如前所述,如果總體單元是按無關(guān)標志排列的,則其方差可按簡單隨機抽樣去做。若總體單元是按有關(guān)標志排列的,則此時的等距抽樣可以看作是整群抽樣或分層抽樣的特例,因此,等距抽樣估計量的方差可以比照整群抽樣或分層抽樣的方法構(gòu)造,有幾種表示方法1、用等距樣本內(nèi)(群內(nèi))方差表示設(shè)等距樣本為表中第i列單元,且i是隨機決定的,則:其中為等距樣本(群)內(nèi)方差;S2為總體方差。這表明,當?shù)染鄻颖緝?nèi)部的方差大于整個總體方差時,等距抽樣比簡單隨機抽樣有更高的精度。因此,為了提高等距抽樣的精度,只要有可能就在對總體單元排序時盡可能擴大各等距樣本內(nèi)的差異。當且僅當>S2時,等距抽樣比簡單隨機抽樣精度高。2、用等距樣本內(nèi)(群內(nèi))相關(guān)系數(shù)表示為同一等距樣本內(nèi)(群內(nèi))成對的單元之間的相關(guān)系數(shù)。當?shù)闹荡笥?時,方差的值就會變大。3、用同一等距樣本內(nèi)單元對關(guān)于層平均值的相關(guān)系數(shù)表示是第h層即第h間隔的平均值;
是等距樣本內(nèi)單位對關(guān)于層平均值的相關(guān)系數(shù)。可見,當=0時,等距樣本與每層取一個單元的分層隨機樣本精度相同;>0時,等距抽樣的精度低于分層隨機抽樣;
<0時,等距抽樣的精度高于分層隨機抽樣。(三)方差估計量前已指出,等距抽樣相當于群的大小相等時的整群抽樣,但抽中的是一個群,這就使這個受人歡迎的抽樣方法有了一些遺憾:等距抽樣沒有無偏的方差估計量。這里只介紹兩種方差估計方法。而在馮士雍、施錫銓著的《抽樣調(diào)查—理論、方法與實踐》一書中,列舉了八種不同的方差估計量,并進行了比較分析。1、總體單元無序排列(即按無關(guān)標志排列)時可把等距樣本看成是簡單隨機樣本,因此,其方差估計量可表示為:其中2、總體單元有序排列(按相關(guān)標志排列)時前已指出,等距抽樣可看成是從每層抽取1個單元的分層抽樣。但憑一個單元的標志值無法估計層內(nèi)方差,于是把相鄰兩行(層)的2K個單元組成一層,從中抽取2個單元作為樣本,這樣總體就被合成了n/2層(假設(shè)n為偶數(shù))。第h層的層內(nèi)方差
h=1,2,…,1/2
將諸代入比例分配的分層隨機抽樣的有關(guān)公式,則將上式中的下標h改為j就得到(1)式式中:是相鄰兩個標志值的一階差分,它們間互不重疊,中利用了n/2個這樣的一階差分,這就要求n必須是偶數(shù)。為擺脫這個限制,增加平方和的自由度,以每相鄰兩個標志值的一階差分(它們是重疊的,共n-1個)代替n/2個不相重疊的一階差分,得:(2)式(1)式和(2)式的對比研究表明:(1)式和(2)式對大多數(shù)模型的總體都具有一定的優(yōu)良性,即使對總體的性質(zhì)知道得很少,它們也是一個好的方差估計量。但(1)式受到n必為偶數(shù)的限制,因而(2)式更值得推薦。此外,也有人建議采用交叉子樣本法來估計等距抽樣的方差,但這種方法在實際操作中有諸多的不便,且當各子樣本不大時,效果也一般。對此感興趣的讀者可參閱有關(guān)文獻。二、不等概率抽樣的情形等距抽樣中每個單元的入樣概率也可以是不相等的。一般的不等概率等距抽樣定義如下:令{πi}是一組入樣概率,i=1,2,…,N,且時,總體中的第i1,i2,…,in個單元即為抽中的樣本單元。當每個πi≤1時,抽樣是嚴格不放回的。最常用的也是最簡單的不等概率等距抽樣是πPS等距抽樣,即令πi與單元大小Mi成比例不等概率等距抽樣的實施方法一般是累計和等距抽樣法,這在第二節(jié)中已作了介紹。與其他不放回的不等概率抽樣一樣,不等概率等距抽樣對總體總和Y的估計也是采用霍維茨—湯普森估計對于πPS等距抽樣,又有是無偏的,其方差可表示為(此時,n是固定的)
由于對一般的n,πij的形式極為復(fù)雜,且有可能為零,因此,關(guān)于的估計可按如下思路進行:一種考慮是將不放回的πPS等距樣本作為放回的PPS樣本處理可得到如下的方差估計形式
因為實際抽樣是不放回的,為此,應(yīng)考慮乘上有限總體修正系數(shù)(fpc)1-f,由于這里的單元實際上是不平等的,因此,f不是簡單的等于n/N。我們使用f的以下估計則可以得到方差
估計量的另一種形式對于隨機排列的總體,此公式的效果很好。若考慮用相鄰樣本觀測值(但這里需用nyi/πi代替等概率情形的yi)差值的平方和來表示方差,則得到或?qū)τ诰哂芯€性趨勢的總體,這兩個方差估計量特別適用。第四節(jié)
其它形式的等距抽樣一、分層等距抽樣二、二維等距抽樣二維等距抽樣二維等距抽樣,是對分布在平面上的總體單元直接進行的等距抽樣。如農(nóng)產(chǎn)量調(diào)查和森林木材積蓄量調(diào)查中,從抽中地塊抽取樣本點,即屬這種情況。實際上,我們所研究的總體單元絕大多數(shù)分布在平面上,以前是通過對總體單元的編號,排隊等方法,將它化為“一維等距抽樣”。但在一些情況下,還需直接在平面上抽取樣本。二維等距抽樣的方法很多,下面僅介紹幾種最簡單、實用的方法。1、方格法是將總體所在的平面區(qū)域G,按照需要抽取的樣本單元數(shù)劃分為若干大小相同的方格,然后以等距方式在每個方格抽取一個樣本單元組成樣本。即抽樣間隔之長等于方格的邊長,可按下述公式計算:其中,K=抽樣間隔;G=總體區(qū)域的面積;n=樣本單元數(shù)這里,為方便討論,假定地塊的圖形是長為a,寬為b的長方形,置于平面直角坐標系的第一象限。且a=Kp,b=Kq,p、q為整數(shù),pq=n。當然,實際中的地塊常常是不規(guī)則的,并不滿足上述條件,但可通過割補法化成比較規(guī)則的幾何圖形,近似按上述方法處理。從方格中抽取樣本點有多種方法。①若取隨機起點,并且它的坐標為(i,j)。所有樣本點的坐標可表示為:(i+Ks,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 聚焦2025:環(huán)保產(chǎn)業(yè)技術(shù)創(chuàng)新與產(chǎn)業(yè)升級環(huán)保產(chǎn)業(yè)技術(shù)創(chuàng)新政策評估報告
- 新能源汽車商業(yè)模式與技術(shù)融合研究試題及答案
- 新能源汽車高效利用可再生資源的技術(shù)研究試題及答案
- 市一模生物試題及答案
- 建筑施工意外事故案例題目
- 家具設(shè)計中的情感價值與品牌忠誠度的關(guān)系研究試題及答案
- 施工現(xiàn)場安全責(zé)任體系建設(shè)的探索試題及答案
- 五年級數(shù)學(xué)(小數(shù)四則混合運算)計算題專項練習(xí)及答案
- 小學(xué)教師對反思工具的使用與應(yīng)用研究試題及答案
- 學(xué)習(xí)2025年商務(wù)英語考試試題及答案
- 布魯氏菌病培訓(xùn)課件
- 2025年古董拍賣收藏品買賣協(xié)議書
- 【托比網(wǎng)】2024中國工業(yè)品數(shù)字化發(fā)展報告
- 砌石截水墻施工方案
- 海岸工程學(xué)設(shè)計計算書
- 大學(xué)美育知到智慧樹章節(jié)測試課后答案2024年秋長春工業(yè)大學(xué)
- 創(chuàng)新設(shè)計前沿知到智慧樹章節(jié)測試課后答案2024年秋浙江大學(xué)
- 《城市級實景三維數(shù)據(jù)規(guī)范》
- 厚積薄發(fā) 行穩(wěn)致遠-六年級期中家長會【課件】
- 《中西藥物的合理配伍與禁忌探究》6400字(論文)
- 2024年10月高等教育自學(xué)考試14169設(shè)計基礎(chǔ)試題及答案
評論
0/150
提交評論