




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、3.1 引 言一、定義先將總體 N 個單元劃分成 L 個互不反復的子總體,每個子總體稱為層,它們的大小分別為 然后,在每個層中獨立地進展抽樣,稱為分層抽樣.二、作用分層抽樣在實踐任務中運用的非常廣泛,主要是由于它具有其它抽樣方法所沒有的特點:1.分層抽樣的抽樣效率較高,也就是說,分層抽樣的估計精度較高。2.分層抽樣不僅能對總體目的進展推算,而且能對各層目的進展推算。3.層內抽樣方法可以不同,而且便于抽樣任務的組織。.三、運用場所在對分層進展詳細劃分時,通常思索如下原那么:1.層內單元具有一樣性質,通常按調查對象的不同類型進展劃分。2.盡能夠使層內單元的標志值相近,層間單元的差別盡能夠大。3.既
2、按類型又按層內單元標志值相近的原那么進展多重分層,同時到達實現估計類值以及提高估計精度的目的。4.抽樣組織實施的方便,通常按行政管理機構設置進展分層。.四、符號闡明我們用下標h表示層號h=1,2,,L)。關于第h層的記號如下:單元總數:樣本單元數:第 i個單元標志值察看值:.單元權數:總體均值:第L層總體方差:.抽樣比:樣本均值:第L層樣本方差:.3.2 簡單估計量及其性質一、總體均值的估計1.估計量的定義總體均值的估計:=假設得到的是分層隨機樣本,那么總體均值的簡單估計為:.2.估計量的性質性質一 對于普通的分層抽樣,假設是的無偏估計( h=1,2, ,L),那么是的無偏估計。的方差為:V=
3、值得留意的是:只需對各層估計是無偏的,那么對總體的估計也是無偏的。 因此,各層可以采用不同的抽樣方法,只需相應的估計量是無偏的,那么對整體的推算也是無偏的。.性質一的證明:由于對每一層有因此.性質二 對于分層簡單隨機抽樣,是的無偏估計,的方差為:.性質二的證明:假設各層獨立進展簡單隨機抽樣,對每一層有由第二章性質二得因此.性質三 對于分層隨機抽樣,的無偏估計為:.性質三的證明:對于分層隨機抽樣,各層獨立進展簡單隨機抽樣,由第二章性質三,得因此,的一個無偏估計為:.二、總體總量的估計1.估計量的定義 總體總量 Y 的估計為:假設得到的是分層隨機樣本,那么總體總量 Y 的簡單估計為:2.估計量的性
4、質由于與只差一個常數,因此,與具有一樣的性質。.性質一 對于普通的分層隨機抽樣,假設是的無偏估計,那么是的無偏估計,的方差為:性質二 對于分層隨機抽樣,的方差為:=.=性質三 對于分層隨機抽樣,的無偏估計為:【例3.1】 調查某地域的居民奶制品年消費支出,以居民戶為調查單元,根據經濟及收入程度將居民戶劃分為4層,每層按簡單隨機抽樣抽出10戶,調查獲得如下數據單位:元估計該地域居民奶制品年消費總支出及估計的規范差。數據見下表. 樣本戶奶制品年消費支出層居民戶總數樣本戶奶制品年消費支出(元)123456789101200104001101510408090024005013060801005516
5、0851601703750180260110014060200180300220415005035150203025103025.由上表,N=2850,各層的層權及抽樣比為:),4,3,2,1(,10=hnh.各層樣本均值及樣本方差為:同理有.因此,估計奶制品年消費總支出為:估計量方差及規范差的樣本估計.三、總體比例的估計1.估計量的定義總體比例 P 的估計為:2.估計量的性質 假設定義第 i個單元具有所思索的特征;其他。i=1,2, ,N那么對總體比例的估計類似對總體均值的估計,這時,與具有同樣的性質。.的無偏估計h=1,2, ,L),那么性質一 對于普通的分層隨機抽樣,假設是 P 的無偏估
6、計。的方差為:性質二 對于分層隨機抽樣,是 P 的無偏估計。證明:留意到及因此的方差為:.性質三 對于分層隨機抽樣,的無偏估計為V.【例3.2】 在例3.1的調查中,同時調查了居民擁有家庭電腦的情況,獲得如下數據單位:臺,如表3.2。估計該地域居民擁有家庭電腦的比例及估計的規范差。數據見下表. 樣本戶擁有家庭電腦情況層居民戶總數樣本戶擁有家庭電腦情況12345678910120000010001002400010000001037501100001010415001000000000表3.2.解:由上表可得該地域居民擁有家庭電腦比例的估計為:估計量的方差為:.3.3 比率估計量及其性質 將比率
7、估計的思想和技術用于分層隨機樣本時,對總體參數的估計有兩種途徑: 一種是對每層樣本分別思索比估計量,然后對各層的比估計量進展加權平均,此時所得的估計量稱為分別估計separate ratio estimator); 另一種是對比率的分子、分母分別加權計算出分層估計量,然后用對應的估計量來構造比估計,這樣所得的估計量稱為結合比估計combined ratioestimator).1.分別比率估計總體均值總體總量的分層比率估計為:總體均值:總體總量:層權L: 層數為的比率估計,為比率估計.比率估計量的方差:式中,分別為第 i層目的Y,X的方差及相關系數. 分別比率估計量要求每一層的樣本量都比較大,
8、否那么,偏倚能夠比較大.2.結合比率估計(combined ratio estimator)總體均值:總體總量:式中:表示的無偏估計;表示的無偏估計.均方誤差為:.3.分別比率估計量與結合比率估計量的比較普通而言,分別比率估計量的方差小于結合比率估計量的方差。但當每層的樣本量不太大時,還是采用結合比率估計量更可靠些,由于這時分別比率估計量的偏倚很大,從而使總的均方誤差增大。實踐運用時,假設各層的樣本量都較大,且有理由以為各層的比率Rh差別較大,那么分別比率估計優于結合比率估計。當各層的樣本量不大,或各層比率Rh差別很小,那么結合比率估計更好些。.【例4.4】 某市1996年對950家港口消費單
9、位完成的吞吐量進展了調查,1997年欲對全市港口消費單位完成的吞吐量進展調查。對港口消費單位按非國有(h=1)和國有h=2)分為兩層,單位數分別為800家和150家,分別在兩層中調查了10家和15家港口消費單位,調查數據如下表,試計算1997年全市港口消費單位完成的吞吐量。1997年國有和非國有企業調查數據如下頁.ixiyiixiyi195801495530222021022103203359384336049641201174230400517718056006516253258610008807302349770056083322868110012309272215972082310137
10、97103103901147846512817650139191160141160107015735698.(將上述數據計算的中間結果列于P77的表中)1.按分別比率估計量估計.2.按結合比率估計量估計 按結合比率估計量估計比按分別比率估計量估計要好一些!.三、分別比率估計與結合比率估計的比較詳細情況分析參看教材P87.3.4 回歸估計量及其性質 與比估計類似,將回歸估計的思想和技術用于分層隨機抽樣時,同樣有兩種方法: 一種是對每層樣本分別求取回歸估計量,然后對各層的回歸估計量進展加權平均,此時所得的估計量稱為分別回歸估計separate regression estimator); 另一種是
11、對兩個變量先分別計算出分層簡單估計量然后再對它們的分層簡單估計量來構造回歸估計,這時所得的估計量稱為結合回歸估計 combined regression estimator).1.分別回歸估計(separate regression estimator)總體均值的估計:總體總量的估計:. 當各層的回歸系數為事先給定的常數時,分別回歸估計量是無偏的。其方差為:其中 是第h層的回歸系數.并且當時,到達最小,即通常未知,可用回歸系數作為的估計:.注 意 1分別回歸估計量是有偏的,但當每一層的樣本量 都很大時,估計的偏倚可以忽略,其方差近似為:2這里 是子總體的回歸系數, 是子總體樣本的回歸系數,前者
12、是未知的,后者是可知的。.方差的樣本估計值為:式中, 分別回歸估計量要求每一層的樣本量都較大,如果這個條件得不到滿足,那么分別回歸估計量的偏倚能夠很大,這時,采用結合回歸估計量更好些。.2.結合回歸估計(combined regression estimator)總體均值的估計:總體總量的估計:式中,分別為的分層估計。是無偏的,其方差為:.并且,只需取時,到達最小。當回歸系數未知時,取為的樣本估計:這時,結合回歸估計量是有偏的,但當樣本量n較大時,估計的偏倚可以忽略,其方差近似為:.方差的樣本估計為:. 分別回歸估計與結合回歸估計的比較 當回歸系數設定時,分別回歸估計優于結合回歸估計; 當回歸
13、系數由樣本估計時,假設各層的樣本量不太小,采用分別回歸估計為宜. 否那么,采用結合回歸估計為好! .【例4.6】續例4.4利用回歸估計量估計該市港口消費單位1997年完成的吞吐量。解:樣本回歸系數:h=1,非國有h=2,國有1.070170.856402那么按分別回歸估計量估計:見P85.按結合回歸估計量估計:(見教材P86 從此題看,結合回歸估計量比分別回歸估計量要優一些!. 分別比率估計、結合比率估計、分別回歸估計和結合回歸估計的比較 參看教材P96. 【例3.3】.比率估計與回歸估計總結: 在分層隨機抽樣中,當有輔助變量信息可以利用時,我們可以采用分別比率估計、結合比率估計、分別回歸估計
14、以及結合回歸估計方法。在選用這些估計量時,要留意以下幾個問題: 1、比估計是有偏估計量,當各層樣本量都較大時兩種比估計都近似無偏;當某些層的樣本量不夠大,而總樣本量較大時,結合比率估計近似無偏。. 2、在回歸估計中,假設事先設定回歸系數,其估計量無偏;假設用樣本回歸系數作為回歸估計系數,其估計量有偏,但在大樣本情況下近似無偏。 3、當主要變量Y和輔助變量X高度相關時,比率估計和回歸估計都是有效的,且能大幅度地提高估計精度。.3.3 樣本量在各層的分配對于分層抽樣,當總的樣本量一定時,還需研討各層應該分配多少樣本量的問題,由于對總體推算時,估計量的方差與各層的方差有關,還與各層所分配的樣本量有關
15、。一、比例分配這里的比例分配指的是按各層單元數占總體單元數的比例,也就是按各層的層權進展分配,這時對于分層抽樣,這時總體均值的估計是:.總體比例 P 的估計是: 這是由于總體中的人一單元,不論它在哪一層,以同樣的概率入樣,因此按比例分配的分層隨機樣本,估計量的方式特別簡單。這種樣本也稱為自加權的樣本。.二、最優分配1.最優分配假設我們思索簡單線性費用函數,總費用那么最優分配是:.證明:作拉格朗日函數,求條件極值:.解得:由此得出下面的準那么: 假設某一層單元數較多,內部差別較大,費用比較省,那么對這一層的樣本量要多分配些,.2. Neyman(內曼)分配對于分層隨機樣本,作為特例,假設每一層的
16、費用一樣,即時,最優分配可簡化為:這種分配稱為Neyman分配.這時,到達最小。.【例3.3】續例3.1假設樣本量仍為 n=40 ,那么按比例分配和Neyman分配時,各層的樣本量應為多少?見17解:按比例分配時,各層的樣本量為:即各層的樣本量分別為 3,6,11,20.對于Neyman分配,根據前面計算所得的各層權數和方差,得到:.因此,按Neyman分配時,各層應分配的樣本量為:即各層的樣本量分別為 3,,.【例3.5】某市有甲、乙兩個地域,現進展家庭收入的調查。令n=500,知甲地域共有20000戶居民,乙地區共有50000戶居民;甲地域居民和乙地域居民年收入規范差估計分別為 ;同時對甲
17、地和乙地每戶的平均抽樣費用之比為2:3,請分別計算出甲地和乙地進展比例分配、普通最優分配思索費用要素以及內曼分配不思索費用要素的樣本量。【解】根據知的數據,經過計算整理可得下表:.h1200000.285725002713.2857505.07632500000.7143200031428.5714823.7861總計700001.0000-2141.85711328.8624關于樣本量分配的計算(1) 比例分配。.2普通最優分配.3內曼分配.結果比較 , 對比上面三組結果可以發現: 普通最優分配在乙地所抽取的樣本量是最小的。這是由于普通最優分配思索了費用問題,在乙地抽樣的單位平均費用較高,所
18、以最優的原那么應是適當添加甲地的樣本量,減少乙地的樣本量。 普通最優分配和內曼分配在甲地的樣本量都比比例分配大,這是由于甲地總體的方差較大。為了保證估計量方差小,子總體方差大的就要多抽些樣本,否那么就要少抽樣本。.3.某些層要求大于100%抽樣時的修正又比較大,那么能夠按最優分配計算的這個層的樣按最優分配時,能夠抽樣比較大,某個層的本量超越的情況.假設出現這種情況,那么對該層進展不100%的抽樣,即.3.4 樣本量確實定1普通公式令其中曾經選定,于是當方差 V給定時,有.得到確定樣本量的普通公式為:令那么.2假設按比例分配:將 代入上式可得.內曼分配:將代入上面兩式可得:.最優分配:將代入上式
19、可得:.即d: 絕對誤差; r:相對誤差;t: 規范正態分布的雙側分位數;這時,樣本量的普通方式可以表示為:假設估計精度是以誤差限的方式給出. 下面將分別給出比例分配、內曼分配和最優分配時的樣本量分配方式:.1假設按比例分配:將 代入上式可得.2當按Neyman分配時,.3最優分配時:將代入上式可得:.例3.4續例3.1假設要求在95%置信度下,相對誤差不超越10%,那么按比例分配和Neyman分配時,總樣本量分別為多少?解:當按比例分配時:由前面的計算結果,可以得到各層的Whs2h。.在95%置信度時,對應的 t =1.96,又因此得到由此可以得到對進展修正,得到修正后的 n .2.最優分配
20、需求思索費用時的情形在最優分配時,假設思索費用為簡單線性函數那么由式3.21有:當方差 V 給定時,代入式(3.24)得到樣本量為:.3.5 分層時的假設干問題1.抽樣效果分析對于固定樣本量的情況,假設相對于1可以忽略,那么式中,分別為分層隨機抽樣最優分配、分層隨機抽樣按比例分配以及簡單隨機抽樣簡單估計的方差。.二、層的劃分 既然分層抽樣比簡單隨機抽樣效率高,那么如何構造層,構造多少層,才干使分層抽樣發揚其效率高的特點呢? 這就涉及最優分層和確定層數的問題。.一最優分層為了提高抽樣效率,按調查目的量進展分層當然是最好的,但我們在調查前并不知道 的值,因此分層只能經過與高度相關的輔助目的 來進展
21、.(見P56).(二) 層確實定 當分層是按自然層或單元類型劃分時,層數是自然的,但當遇到上述運用累積平方根法進展分層時,就存在層數問題。 在實踐任務中,層數普通不超越六層。雖然添加層數可以提高估計精度,但在總費用一定的條件下添加層數必然導致降低樣本量,這時就要思索添加層數而降低樣本量在精度上能否合算。.三、事后分層 我們普通在抽樣之前將總體中的一切單元分好層,但在實踐任務中,有時沒有層的抽樣框,或總體特別大來不及事先分層等緣由.這時我們又想采用分層抽樣,就可以采用事后分層. 事后分層要留意的問題(1)要求我們可以經過某種途徑知道各層的層大小或層權;(2)層權與實踐情況不能相差太大,否那么不能夠提高精度;(3)事后分層的層數不宜太多. 事后分層的詳細實施方法 先采用簡單隨機抽樣的方法從總體中抽取一個樣本量為n的樣本,然后對樣本中的單元按某種特征進展分層。 假設在容量為n的樣本中,落入第h層的樣本單元數為 ,有 , 那么此時對總體均值的事后分層估計為:.這里, 下標“pst表示事后分層; 代表落入第h層的第i個 樣本單元的目的值。. 實際上,只需n充分大,事后分層估計量是無偏的。且它的方差有如下性質:. 由上式可以看出,第一項就是按比例分配分層抽樣估計量的方差,第二項表示因事后分層而非
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 電動機在手持電動工具中的應用考核試卷
- 批發商如何拓展家用視聽設備市場考核試卷
- 南通師范高等專科學校《英語小說閱讀》2023-2024學年第二學期期末試卷
- 梧州學院《現代食品高新技術進展》2023-2024學年第一學期期末試卷
- 天津城建大學《太陽能熱利用技術》2023-2024學年第二學期期末試卷
- 山西醫科大學《藥物統計學》2023-2024學年第二學期期末試卷
- 伊春市美溪區2024-2025學年四下數學期末聯考試題含解析
- 江蘇省泰州市2025屆三年級數學第二學期期末調研模擬試題含解析
- 天津市河東區天鐵一中學2024-2025學年初三下學期七調考試物理試題含解析
- 山東省青島六校聯考2025年初三下期第三次月考生物試題含解析
- 上海市四年級數學綠色指標測試卷
- 關于成立醫療技術臨床應用管理領導小組的通知【新版】
- 技師學院高層次人才引進和管理辦法
- 水輪機選型畢業設計及solidworks建立轉輪模型
- 無創正壓通氣急診臨床實踐專家共識
- 三國演義主要人物形象-劉備
- 【精選】人教版四年級下冊數學《脫式計算》(含簡便運算)專項練習題
- 常用檢驗項目的醫學決定水平
- 醫院隔離技術規范-WST311-2009
- 急診及重癥醫學-機械通氣
- 《企業資金管理內部控制研究7800字(論文)》
評論
0/150
提交評論