




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、抽樣調查樣本量確定抽樣調查樣本量的確定在貿易統計中,對于限額以下批零餐飲企業普遍采用抽樣調查方法進行解決。然而,由于當前市場經濟情況的多樣性,經濟發展的不均衡性,以及地域寬廣性,導致情況多種多樣;實際 情況的復雜,決定了方案的復雜性,增加了具體抽樣的難度。經過多年的探討,區域二 相抽樣調查比較符合當前我國的實際情況,我們在這里根據試點所掌握的情況針對 采用區域二相抽樣調查的貿易抽樣方案中如何確定樣本量進行分析。一、樣本單位數量的確定原則一般情況下,確定樣本量需要考慮調查的目的、性質和精度要求。以及實際操 作的可行性、經費承受能力等。根據調查經驗,市場潛力和推斷等涉及量比較嚴格 的調查需要的樣本
2、量比較大,而一般廣告效果等人們差異不是很大或對樣本量要求 不是很嚴格的調查,樣本量相對可以少一些。實際上確定樣本量大小是比較復雜的 問題,即要有定性的考慮,也要有定量的考慮;從定性的方面考慮,決策的重要性、調 研的性質、數據分析的性質、資源、抽樣方法等都決定樣本量的大小。但是這只 能原則上確定樣本量大小。具體確定樣本量還需要從定量的角度考慮。從定量的方面考慮,有具體的統計學公式,不同的抽樣方法有不同的公式。歸納 起來,樣本量的大小主要取決于:(1研究對象的變化程度,即變異程度;(2要求和允許的誤差大小,即精度要求;(3要求推斷的置信度,一般情況下,置信度取為95%;(4總體的大??;(5抽樣的方
3、法。也就是說,研究的問題越復雜,差異越大時,樣本量要求越大;要求的精度越高,可 推斷性要求越高時,樣本量也越大;同時,總體越大,樣本量也相對要大,但是,增大呈現 出一定對數特征,而不是線形關系;而抽樣方法問題,決定設計效應的值,如果我們設 定簡單隨機抽樣設計效應的值是1;分層抽樣由于抽樣效率高于簡單隨機抽樣,其設 計效應的值小于1,合適恰當的分層,將使層內樣本差異變小,層內差異越小,設計效應 小于1的幅度越大;多階抽樣由于效率低于簡單隨機抽樣,設計效應的值大于1,所以抽 樣調查方法的復雜程度決定其樣本量大小。對于不同城市,如果總體不知道或很大, 需要進行推斷時,大城市多抽,小城市少抽,這種說法
4、原則上是不對的。實際上,在大 城市抽樣太大是浪費,在小城市抽樣太少沒有推斷價值。二、樣本量的確定方法如何確定樣本量,基本方法很多,但是公式檢驗表明,當誤差和置信區間一定時, 不同的樣本量計算公式計算出來的樣本量是十分相近的,所以,我們完全可以使用簡單隨 機抽樣計算樣本量的公式去近似估計其他抽樣方法的樣本量,這樣可以更加快捷方便,然后 將樣本量根據一定方法分配到各個子域中去。所以,區域二相抽樣不能計算樣本量的說法 是不科學的。1.簡單隨機抽樣確定樣本量主要有兩種類型:(1對于平均數類型的變量對于已知數據為絕對數,我們一般根據下列步驟來計算所需要的樣本量。已知 期望調查結果的精度(E,期望調查結果
5、的置信度(L,以及總體的標準差估計值力勺具體數據,總體單位數N。計算公式為:n=(r2/(e2/Z2+(t2/N特殊情況下,如果是很大總體,計算公式變為:n= Z2 °2/e2例如希望平均收入的誤差在正負人民幣 30元之間,調查結果在95%的置信范圍 以內,其95%的置信度要求Z的統計量為1.96。根據估計總體的標準差為150%,總體 單位數為 10000 樣本量:n=150*150/(30*30/(1.96*1.96+150*150/1000=88(2于百分比類型的變量對于已知數據為百分比,一般根據下列步驟計算樣本量。已知調查結果的精度 值百分比(E,以及置信度(L,比例估計(P的
6、精度,即樣本變異程度,總體數為No則計算公式為:n=P(1-P/(e2/Z2+ P(1-P/N同樣,特殊情況下如果不考慮總體,公式為:n= Z2P(1-P/e2一般情況下,我們不知道P的取值,取其樣本變異程度最大時的值為0.5。例如:希望平均收入的誤差在正負0.05之間,調查結果在95%的置信范圍以內,其 95%的置信度要求Z的統計量為1.96,估計P為0.5,總體單位數為1000。樣本量為:n=0.5*0.5/(0.05*0.05/(1.96*1.96+0.5*0.5/1000=2782 .樣本量分配方法以上分析我們獲得了采用簡單隨機抽樣公式計算得到的樣本量 ,總的樣本量需 要在此基礎上乘以
7、設計效應的值得到。由于樣本總量已經確定 ,我們采用總樣本量 固定方法分配樣本,這種方法包括按照比例分配和不按照比例分配兩類。實際工作中首先計算取得區縣總的樣本量,然后逐級將其分配到各階分層中,如果不清楚各階 分層的規模和方差等,一般采取比例分配或者比例平方根分配法。如果有一定輔助變量可以使用 ,可以采用按照規模 分配法分配樣本量。3 .樣本量和總體大小的關系:在其它條件一定的情況下,即誤差、置信度、抽樣比率一定,樣本量隨總體的大 小而變化。但是,總體越大,其變化越不明顯;總體較小時,變化明顯。其變化趨勢如 下:二者之間的變化并非是線性關系。所以,樣本量并不是越大越好,應該綜合考慮, 實際工作中
8、只要達到要求就可以了。三、貿易抽樣調查方案樣本量的確定根據以上的分析,我們可以確定具體的樣本量。當前使用的貿易抽樣新方案采 用多階分層區域二相抽樣方法、以零售額為核心指標抽取樣本。方案規定,縣區以下階分為鄉、鎮、街道層,鄉鎮街道一般根據繁華、非繁華分層,層內采用PP的由樣 完成對鄉鎮街道的抽??;鄉鎮街道以下階分為居委會、村委會、市場內層,居委會、 村委會根據繁華、非繁華分層,層內采用簡單隨機抽樣完成對居委會村委會的抽取 , 市場內層抽樣根據方案完成;最后一階首先根據規模、類別分層,層內采用簡單隨機 抽樣完成對居委會具體樣本的抽取。其中,確定居委會具體樣本的方法和數量比較 模糊,需要基層做很多工
9、作,給基層造成了一定的混亂,增加了很大的負擔。我們決定首先采取簡單隨機抽樣的方法計算區縣的樣本量,之所以首先對區縣 計算樣本量,主要是考慮,雖然我們方案中沒有要求對區縣的估計量,但是區縣一級是 我們做計劃和決策的基礎,具有承上啟下的作用,如果區縣級獲得的估計量精度比較 高,就可以保證上一級的估計量具有更高的精度,而且各個區縣的樣本量可以認為是 相同的,這主要是因為各個區縣的總體數都比較多,而且我們也不清楚;同時也不可能 事先進行區縣方差估計。沒有首先計算區縣以下各階分層的樣本量,主要是考慮:(1如果計算區縣以下某階分層的樣本量,然后再將計算的樣本量合并,將顯著增 加樣本量,增加基層的負擔。(2
10、事實上,對于計算階可以比較好的得到它的估計量,但我們現在不需要得到區 縣以下各階分層的估計量,我們僅僅需要區縣的估計量,沒有必要計算區縣以下階樣 本量。(3我們直接對整個區縣以簡單隨機抽樣進行抽取,然后將其樣本量合理分配到 各階分層中,這樣可以使用較少樣本量得到區縣較好的估計量。以下我們以試點地區批零業為對象進行研究。由于沒有誤差限以及置信度和 抽樣比率的值。我們可以采用常用參數:設定區縣總體為很大,置信度是95%,抽樣比 率保守估計是0.5,抽樣誤差不能大于15%,根據公式計算得到樣本量為43個。由于采 取多階分層抽樣,我們如何設定抽樣設計效應呢?區縣及以下是三階分層抽樣,只要 在各階進行合
11、適的分層,其設計效應應該在2-3之間,我們在這里取保守值3,那么得到 本區縣樣本量是1294、,這個樣本量就可以根據新方案得到區縣要求誤差內的估計值01 .確定辦事處、居委會、村委會樣本量根據方案,每個居委會抽取樣本5-10個,那么這個樣本量是否可行呢?這里涉及如 何將區縣樣本分配到街道和居委會中去,根據方案要求,街道抽取采取先分層,后對層 內進行PPStt樣;那么分配樣本是否也采取同樣方法呢?主要看輔助變量與樣本量之 間的關聯程度,方案中提供了兩個輔助變量:人口數和個體數,對于輔助變量是個體數 的完全可以使用規模分配方法分配樣本量,個體數多的分配較多的樣本量;對于輔助 變量是人口數的如果采取
12、規模分配方法,由于人口數與一個地區的個體單位數沒有 必然的聯系,可能導致某些居委會的個體數比較多,卻分配了較少的樣本量,使得居委 會分層變的困難,同時使居委會方差顯著增大。而獲得較多樣本量的居委會,分層的效果和方差提高幅度有限,故采用比例分配的方法可能更加合適一些。對于居委會 村委會的抽取,由于本階可能存在市場內的抽樣,分配復雜一些;如果本階有市場內抽 樣,可以適當減少居委會村委會的樣本量,但應該大于本階樣本量的80%,由于市場內 抽樣的特殊性,建議將本階樣本量全部分配給居委會村委會,我們所進行的試點就是 將樣本全部分配給居委會;至于市場內抽樣的具體實施,可以根據方案操作完成。對 居委會村委會
13、層內,由于使用簡單隨機抽樣完成,采用比例分配平均分配就可。在實際工作時,由于一個區縣包括全部鄉鎮街道或其中的一個;根據方案,區縣抽 取辦事處的數量應該介于12-4個之間,對應于抽中鄉、鎮、街道的全部或其中一個, 那么其每一個鄉鎮街道采取比例分配平均分配的樣本量應該是11-32個之間;所抽中的居委會、村委會數量應該介于16-48個之間,如果個別鄉鎮街道抽中的居委會是2 個,則其居委會總數相應減少一些;最后,每個居委會、村委會的樣本量應該介于 3-16 個之間,大部分介于5-10之間。以上的討論沒有考慮總體的大小,如果考慮到居委會 、村委會的總體有限,則每個居委會村委會的樣本量可以減少一些,具體可
14、以采用以 下公式得到具體樣本量的調整數:樣本量n=n1*N/(N+n1。N是本地區總體,n1 是給本地區分配樣本量居委會樣本量的調整數,應該作為本居委會樣本量的底限。確定辦事處、居委會村委會的樣本量,與以下幾點有關:a估計量的誤差、置信度,可以決定簡單隨機抽樣的樣本量b與采用的抽樣方法有關系,它決定了設計效應的大小。例如:分層抽樣的設計 效應值小于1,多階抽樣的設計效應值大于1??梢詻Q定整個抽樣的樣本量。Ct每一階的分層的數目有關系,所以,應該重點考慮分層的問題,分層太多,沒有 必要;分層太少,導致層內的方差增大,可能影響估計值的精度以及設計效應的值,所 以,在每階分層時,應該合理考慮,使得樣
15、本的變異程度在層內達到一個合理水平。根據以上原則,我們在包頭的抽樣試點共抽取4個辦事處,包括14個居委會;一個 鄉,包括4個村委會,經過清查共有批零業1042個,單位70個;餐飲業25g,單位3個。由 于我們使用人口數作為輔助變量,應該采用比例分配方法平均分配樣本量,這樣每個 街道辦事處得到26個樣本,對于抽取4個居委會白辦事處,每個居委會分配得到7個樣本;對于抽取2個居委會的辦事處,每個居委會分配到13個樣本。然后根據居委會總體對樣本量做出調整,得到 居委會實際樣本量。2 .確定居委會村委會內分層樣本量以上我們討論如何分配給鄉鎮居委會村委會樣本量,現在分析給居委會村委會 以下各層分配樣本量,
16、這一步,清查的工作就顯得非常重要了,重點應該清查規模、類 別,首先是規模,規模的大小不應該根據工商注冊為單位或個體決定 ,應該根據實際情 況,即使是個體,如果規模較大,也應該歸入大規模分層中,這樣就可以使得每層的樣 本變異程度顯著降低,從而提高精確度。根據實際情況可以包括兩種 :(1如果全部是規模比較小的單位個體戶,我們可以根據類別進行適當的分組,將 某一類單位比較多的單獨分層;將另外類別比較少的,可以幾類合并進行抽取具體樣 本,分層不要多于4層,并保證每層的樣本量不小于2個。由于居委會樣本量數目已經 確定,我們可以直接采取比例分配方法,確定各層樣本量。(2如果規模比較大的和規模小的并存,可以
17、將規模比較大的單獨分層,不用考慮 其中的類別;將規模較小的主要是個體戶可以根據類別進行分層;其中的難題是如何將樣本量在規模大的和規模小的之間分配,因為大規模層內樣本變異程度有可能很 大,應該抽取較多的樣本量,經過測試,如果大規模層總體小于等于5,應該對其進行全 面調查;如果大于5個,可以采用以下的公式計算得到:n=0.25/(e2/t2+ 0.25/N淇中:e=30%,t=2.1,N 為規模較大的數目。其他規模較小的,使用比例分配法分配其他的樣本,實際分層時,最好不要超過4 層,保證每層不少于2個,由于大規模層的存在,可能占去了較多的樣本量,導致其它層 不夠分配,這種情況下,可考慮增加層內一定
18、樣本量。經過以上的分析、計算可以得到居委會村委會的樣本數量。總結:由于情況的多樣性,各地在具體實施方案時可能有所不同,有的分層少一些,有 的多一些,但是計算的方法和原則是相同的,各地應該在保證抽樣精度的前提下,得到合適的樣本 量,同時加大對于樣本點的管理。下表是我們試點地區抽中居委會的清查數目,以及實際抽 中的樣本量,與調整數比較,在 18個居委會中,16個居委會認為適合要求,2個居委會 樣本量數目有一些偏少,主要是由于對居委會規模較大的層,沒有達到抽取要求; 表五、六、七列是大規模層的總體數和應該分配的樣本量,在試點中個別地區沒有達到要求。這提示我們,應該非常重視各階的清查工作,提前計算得到得到合適的樣本量。在認真清查以后,根 據清查結果,對辦事處、居委會進行合理的分層,以規定的方法抽取適當的辦事處和居委會;同時應該將重點放在對居委會內單位的清查上,將規模大的單位放在一層,其他個體可以根 據類別進行合適分層抽樣,及時計算得到各層的樣本量。我們以上的分析計算,均取比較保守的參數,實際上,樣本的變異程度即P的值沒有達到0.5;同時由于我們在各階采取了合理的分層,保證了設計效應的值應該小于3,所以對于縣區的估計值完全可以達到誤差要求。表:樣本量(個樣本量(個)其中:實際數 調整數 理論數 總體批零數 單位數一 8 9
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 電器具包裝與物流考核試卷
- 2024年項目管理專業人士資格認證考試專業知識試題及答案
- 2025年注會考試成功的秘訣試題及答案
- 2024年項目管理考試實操指導試題及答案
- 電氣設備光纖傳感技術考核試卷
- 環保志愿者培訓考核試卷
- 掌握技巧2024年項目管理專業人士資格考試試題及答案
- 江蘇河道杉木樁施工方案
- 中型海水淡化處理設備考核試卷
- 項目管理人員資格考試資格設置試題及答案
- 《醫療垃圾的分類》課件
- 江蘇師范大學成人繼續教育網絡課程《英語》單元測試及參考答案
- 雙堿法脫硫操作規程
- 中國骨質疏松診治指南(新)ppt
- 全國中學生物理競賽及實驗課件
- 病案信息技術基礎知識考試重點梳理(最新最全)
- 安全施工作業票(模版)
- 環保管理制度(適用于軟件企業)
- DB 33-T 1015-2021居住建筑節能設計標準(高清正版)
- 鋼結構門式剛架廠房設計土木工程畢業設計
- 中國供銷合作社標識使用手冊課件
評論
0/150
提交評論