




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、 第七章 不等概抽樣放回不等概率抽樣不放回不等概率抽樣利用軟件進展抽樣和計算案例分析.第一節 不等概率抽樣概述一、不等概率抽樣的必要性 1、在簡單隨機抽樣中,總體(或層)中的每個單元入樣的概率都相等。等概率抽樣的特點是總體中的每個單元在該總體中的位置(或重要性)一樣,在抽樣時對每個單元采取的是“不偏不倚的態度 。等概率抽樣不僅實施簡單,而且相應的數據處置公式也簡單。但是在許多實踐問題中,我們還需求運用不等概率抽樣(sampling with unequal probabilities)。.2、抽樣單元在總體中所占的位置不一致:例如:要反映某小麥種類的優良情況,以村作為抽樣單位,但各村的種植面積
2、不同,一些種植面積大的村莊在抽樣中能否被抽中對推斷總體的結果有很大影響 ,所以讓“大單元被抽到的概率大,“小單元被抽到的概率小,這樣可以大大提高樣本的代表性,減少抽樣誤差。 不等概率抽樣概述. 不等概率抽樣的特點 2、不等概率抽樣的主要優點是由于運用了輔助信息,提高了抽樣戰略的統計效率, 能顯著地減少抽樣誤差。1、凡需運用不等概率抽樣的場所,必需提供總體單元的某種輔助信息。例如:每個單元的“大小度量Mi。留意:比估計和回歸估計是估計方法用到了輔助信息,本章是抽樣方法用到輔助信息.不等概率抽樣的特點3、抽樣框的創建比簡單隨機抽樣和系統抽樣本錢高,更復雜,由于需求存儲總體中每一個單元的度量大小;4
3、、并非在任何情況下都能運用,由于并不是每一個總體都有穩定且與主要調查變量相關的有關大小或規模的度量;5、抽樣及估計特別對不放回抽樣相當復雜; 6、 當單元大小度量不準確或不穩定時不適用。.6不等概率抽樣的分類放回不等概抽樣:按照總體單元的規模大小來確定在每次抽中的概率。抽取后放回總體,再進展下一次抽樣,每次抽樣都是獨立的。這種抽樣稱為放回不等概抽樣(sampling with probabilities proportional to sizes,簡稱PPS抽樣) 不放回的不等概抽樣:每次在總體中對每個單元按入樣概率進展抽樣,抽出的樣本不再放回總體,因此,在抽取了第一個單元后,余下的單元再以什
4、么概率被抽取就較復雜。 這種抽樣不是獨立的,無論是抽樣方法還是方差估計,都要比放回抽樣繁復得多。不放回抽樣通常稱為PS抽樣。.放回不等概抽樣 PPS抽樣:有放回的不等概抽樣.在PPS抽樣中,賦予每個單元與Mi相等的代碼數,將代碼數累加得到M0,每次抽樣都等概產生一個1,M0之間的隨機數,設為m,代碼m所對應的單元被抽中。放回不等概率抽樣實施方法1.代碼法.累計代碼10.66616214.5145151715131.515166152166413.730316730357.87838130438161515053138253171010063153263183.63666763266796607
5、27668727101.11173872873873.8738例5.1 設某個總體有10個單元,相應的單元大小及其代碼數如下表,在其中產生一個n=3的樣本。 假設在1,738 中等概產生第一個隨機數為354,再在1,738中產生第二個隨機數為553,最后在1,738中產生第三個隨機數為493,那么它們所對應的第5,7,6號單元被抽中。 Mi*10.例:假設有10個鄉,每個鄉的村莊數不同,按pps抽3個鄉鄉村莊數Mi累計代碼155152283363332659345941473607351083748363812184121771281221288501781291789218017918010
6、8188181188結合一下整群抽樣、多階段抽樣.2.拉希里法(二次抽取法)統計學家Lahiri最先提出:設 M1, M2,MN為單元的規模放回不等概率抽樣實施方法.拉希里法抽樣舉例:例5.1中,M=150,N=10.在1,10,1,150 中分別產生 i,m如下:第一次 (3,121) , M3=15121, 舍棄,重抽 ;第二次8,50,M8=3677, 第7號單元入樣;第四次5,127,M5=7877, 第4號單元入樣;第六次(9,60),M9=6060, 第9號單元入樣;因此第4,7,9號單元被抽中。.三、Hansen-Hurwitz漢森-郝維茨估計量及其性質: 由于是放回抽樣,所以是
7、獨立樣本,數理統計的結論可以在這里運用。放回不等概率抽樣對總體特征的估計.對上述結論加以闡明: 獨立同分布樣本y1y2yn抽中概率z1z2zn新變量 ty1/ z1y2 /z2yn/zn.漢森-赫維茨估計量估計給出總體總量的估計, 假設對總體均值估計可按下公式:.例:某縣農業局要調查全縣養豬專業戶今年生豬的出欄頭數,現有全縣365個養豬專業戶去年的生豬存欄數,各專業戶的規模相差較大,決議以放回方式按與各養豬專業戶上年末生豬存欄頭數成比例的PPS抽樣 從中抽取30戶進展調查,結果如下,知全縣養豬專業戶上年末生豬存欄頭數為9542頭,試估計該縣養豬專業戶生豬今年出欄總頭數和抽樣規范誤。摘自:“運用
8、抽樣技術李金昌.imiyiimiyiimiyi11575114025821191242231341232186222616039371317692337215429152142615624211045845151149257496311851636221264333672413317251452718968291731853328301779137419382881019872042304其中第2、19號被抽中兩次.解:根據題中所給資料,n=30,M0=9542,利用漢森-郝維茨估計量,那么有:.例5.2:某部門要了解所屬8500家消費企業當月完成的利潤,該部門手頭已有一份去年各企業完成產量的
9、報告,將其匯總得到所屬企業去年完成的產量為3676萬噸。思索到時間緊,預備采用抽樣調查來推算當月完成的利潤。根據閱歷,企業的產量和利潤相關性比較強,且企業的特點是規模和管理程度差別比較大,通常大企業的管理程度較高些,因此采用與去年產量成比例的PPS抽樣,從所屬企業中抽出一個樣本量為30的樣本。 .1*38.2310926105.501900191.5010213.7010241115.00864208.008030.7513127.00172128.427242.85301315.00104522*9.01384552.0011021412.30220230.7548065.00600153.
10、864600245.00311710.802901615.8023702528.43928482.00430179.00940269.9784298.8199218*21.00640275.20510.773861.05相對誤差到達20時所需樣本量:解:.有放回不等概整群抽樣 群規模不等的整群抽樣中,可采用等概和不等概抽樣;假設群規模差別不大,可采用等概抽樣;假設群規模差別較大,各個群對總體的影響不同,此時采用不等概抽樣。把群規模作為輔助信息,能提高估計精度,而且方差估計方式簡單。但在抽樣時要掌握輔助信息,比簡單隨機復雜。 假設群的抽取是按與 Mi成比例的pps抽樣,每次按 Zi=Mi/M0i
11、=1,2,N的概率抽取第i個群。由漢森-赫維茨估計量, pps整群抽樣總體總值估計量為.例 某企業欲估計上季度每位職工的平均病假天數。該企業共8個分廠,現用不等概整群抽樣擬抽取3個分廠,并以置信度95%計算其置信區間。分廠編號 職工人數 Mi 累積區間123456781200450210086028401910390320011200120116501651375037514610461174507451936093619750975112950.有放回不等概整群抽樣解:n3,采用PPS抽樣,隨機抽取的3個數為02021,07972,10281。調查結果如下:.有放回不等概整群抽樣注:1、對于
12、群規模不等的整群抽樣,采用不等概PPS抽樣,可以得到總體目的量的無偏估計, 2、估計量和估計量的方差都有比較簡明的方式,估計的效率也比較高,是值得優先思索采用的方法, 3、運用條件:在抽取樣本前,要掌握各群規模的信息。.多階段有放回不等概抽樣 當初級單元規模不等時,常采用不等概抽樣。對初級單元進展PPS抽樣時,事先規定每個初級單元被抽中的概率 Zi=Mi/M0 (i=1N),可利用代碼法,對抽中的初級單元再抽取mi個二級單元;假設對第二階段實行簡單隨機抽樣,且抽一樣的樣本數第一階段抽出來的普通是單元的規模較大,而且彼此差別不大,此時估計方式較簡單,且是自加權的。這是實踐中經常采用的多階段不等概
13、抽樣法。 .多階段有放回不等概抽樣實踐任務中,假設初級單元大小不等,人們喜歡:1、第一階段抽樣時按放回的與二級單元成比例的PPS抽樣;2、第二階抽樣進展簡單隨機抽樣,且抽的樣本量一樣,這樣得到的樣本是自加權的,估計量的方式也非常簡單。 .例:某縣鄉村共有14個鄉509個村,在實現小康的進程中欲計算該縣鄉村的恩格爾系數,即居民戶的食品支出占總支出的比例。首先要調查全縣的食品總支出,現采用了二階段抽樣,第一階段先在14個鄉中,按村的數目多少進展PPS抽樣,共抽了5個鄉,第二階段在抽中的鄉中隨機地抽選6個村,然后對抽中的村做全面調查,獲得的數據如下,估計全縣的食品支出總額及其規范誤。樣本鄉序號村數樣
14、本村數樣本村平均食品支出(萬元)119648241617537261084546905366100多階段有放回不等概抽樣例題分析.多階段有放回不等概抽樣例題分析 誤差有點偏大,要想提高估計精度,必需 添加第一階段的樣本量. 例;某小區有10座高層建筑,每座高層建筑 擁有的樓層數如下表, 高層建筑ABCDEFGHIJ樓層12121615101610181620 用二階段抽樣方法抽出10個摟層進展調查,第一階段PPS抽出5座建筑,第二階段按簡單隨機抽樣對每座建筑抽取兩個樓層,詳細數據如下表所示,對小區總居民進展估計,并給出估計的誤差。初級樣本序號12345居民數18,1215,1819,13 16
15、,1016,11多階段有放回不等概抽樣例題分析.解:知n=5,m=2,M0=145,.這時,多階抽樣的總樣本量可以這樣確定:1.根據簡單隨機抽樣時應抽樣本量2.再乘以設計效應deff獲得。 多階抽樣與簡單隨機抽樣相比其效率比較低,deff應該大于1。實踐任務中,可取deff的閱歷數據。不同項目的deff不同。 下面是一案例分析多階有放回不等概抽樣.例: 某調查公司接受了一項關于全國城市成年居民人均奶制品每天至少喝一杯奶的人數的比例情況的調查。確定抽樣范圍為全國地級及以上城市中的成年居民。成年居民指年滿18周歲以上的居民。第一步:確定抽樣方法。 調查公司決議采用多階抽樣方法進展方案設計,調查的最
16、小單元為成年居民。確定調查的各個階段為城市、街道、居委會、居民戶,在居民戶中利用 簡單隨機法抽取成年居民。第二步:確定樣本量及各階樣本量的配置。 按簡單隨機抽樣時,在95置信度下,絕對誤差為5,取使方差到達最大時的消費奶制品的居民比例為50,那么全國樣本量應為: .根據以往調查的閱歷,估計回答率b=80,因此調整樣本量為:多階抽樣的效率比簡單隨機抽樣的效率低,這里取設計效應deff=3.2,那么在全國范圍內應調查的樣本居民為:各階的樣本量配置為:初級單元:20個樣本城市;二級單元:每個樣本市內抽4個街道,共80個街道;三級單元:每個樣本街道內抽2個居委會,共160個居委會;四級單元:每個樣本居
17、委會內抽10個居民戶,1600個居民戶。 在樣本居民戶內,利用隨機表抽1名成年居民。.第三步:確定抽樣方法。 第1階,在全國城市中按與人口數成比例的放回的不等概抽樣,即PPS抽樣(probability propotional to size)。 第2階和第3階分別按與人口數成比例的不等概等距抽樣。 以第2階為例,在某個被抽中的樣本城市中,將其所屬的街道編號,搜集各街道的人口數,賦予每個街道與其人口一樣的代碼數;根據該市總人口數除以樣本量4,確定抽樣間距;然后對代碼進展隨機起點的等距抽樣,那么被抽中代碼所在的街道為樣本街道。 第4階,分別在每個樣本居委會中,按等距抽樣抽出10個民戶。 即根據居
18、委會擁有的居民戶數除以樣本量10得到抽樣距,然后隨機起點等距抽樣。 在每個樣本居民戶中,調查員按 隨機表抽取1名成年居民.第四步:推算方法。 記各樣本城市的80位樣本居民中,每天至少喝一杯奶的人數為ai,全國1600名居民組成的樣本中,每天至少喝一杯鮮奶的人數為樣本是自加權的,故成年居民每天至少喝一杯鮮奶所占比例為: 的方差的估計為: 其中pi是各樣本城市每天至少喝一杯鮮奶的人數所占比例:.2 不放回的不等概率抽樣 1、有放回不等概率抽樣,無論從實施上還是從估計計算以及精度估計都顯得非常方便。但是,一個單元被抽中兩次以上總會使樣本的代表性打折扣,從而引起抽樣誤差的添加。 2、不放回不等概率抽樣
19、,是指在抽樣的過程中被抽到的單元不能再被抽中,這種抽樣要求 總體中第i個單元的入樣概率為i ,這就是所謂的 抽樣。 3、由于在抽取了第一個單元后,余下的 ( N-1 ) 個單元以什么樣的概率參與第二次抽樣就很復雜;再在抽第三個樣本時又面臨新問題,如此下去,一是抽樣實施的復雜,二是估計量及其方差計算的復雜。因此,在本節僅討論 n固定,尤其是n=2時的情形。 . 不放回不等概率抽樣一、 PS抽樣與包含概率包含概率:在不放回抽樣中,每個單元被包含到樣本的概率也即入樣概率i及恣意兩個單元都被包含到樣本中的概率ij.特別的,假設每個單元入樣概率與單元大小成比例的概率抽樣稱這種情形為嚴厲的 抽樣實施起來復
20、雜, 也不易求得,方差的估算很困難,只需在n=2時有簡單的算法;當n2時可以經過分層,每層中進展嚴厲的n=2 抽樣. 不放回不等概率抽樣2、HorvitzThompson霍維茨湯普森估計量HT估計量與HH估計量是 極其類似的。由于 ,它們在方式上似乎完全一樣,但是HH估計量中的 yi 可以相互反復,而HT中的yi 卻是絕對地互不一樣。.當 n 固定時,HT估計量的方差為:例5.3 假設有5個居委會,每個居委會的住戶數X知但常住居民未知,我們從5個居委會抽出2個來估計常住居民的總人數。如下表: iX(住戶數)Y(常住居民人數) zi140011000.80.422506000.50.253200
21、5000.40.241002400.20.1550800.10.05總和1000252021.10種不同的樣本分別利用霍維茨湯普森估計量和簡單隨機抽樣簡單估計計算對總量的估計如下表:樣本1,2257542501,3262540001,4257533501,5217529502,3245027502,4240021002,520001700 3,4, 245018503,5205014504,52000800平均25202520.1、從均值上來看,它們都是無偏估計,均值都是2520.2、為比較估計量的優劣,需計算估計量的方差,這用到每個樣本被抽出的概率。 3、不放回不等概率樣本,每個樣本被抽出的
22、概率計算很復雜。 不過從直觀上來看,例子用霍維茨湯普森估計量比簡單隨機抽樣簡單估計要準確結果分析:.1Brewer布魯爾方法1963 假設對一切 ,均有 ,現抽取兩個單元,最通常的方法是逐個選取。幾種嚴厲的不放回不等概抽樣.其中第一次第i個單元被抽中的概率為:取出第一個不放回,假設第一次抽取了第i個單元,第二次單元j被抽中的概率為:.這種抽樣方法可以保證每個單元入樣概率為:而其中.對總值和方差的估計如下:采用霍維茨湯普森估計量.例5.4 對于例5.3,假設抽樣是按布魯爾法的,那么其一切能夠樣本的 如下表:樣本1,225750.348791,326250.265741,425750.124571
23、,521750.06092,324500.091352,424000.040482,520000.019383,424500.029073,520500.013844,520000.00588.Brewer 抽樣方法舉例:鄉種植面積(千畝)總產量(單位:千公斤) 110100220220330285440360合計100965例:某縣有四個鄉,糧食總產量和種植面積如下表:用布魯爾方法抽取兩個鄉作樣本估計本縣的總產量,驗證抽選結果符合PS的要求,并計算估計量方差。. Brewer法第一個單元的被抽中概率鄉種植面積規模比例第1次被抽中概率1100.10.11250.053462200.20.266
24、70.126753300.30.5250.249504400.41.20.57029合計2.10421此題計算過程:.Brewer法2個單元的抽選方法:.第二次抽中第j個單元第一次抽中第i個單元的概率為第一次抽中第i個單元,第二次抽中第j個單元的結合概率為假定第一次抽中第1個單元,第二次抽中第2個單元,其結合概率為:.第一次抽中第1個單元,第二次抽中第4個單元的結合概率為第一次抽中第1個單元,第二次抽中第3個單元的結合概率為第一次抽中第2個單元,第二次抽中第1個單元的結合概率為第一次抽中第2個單元,第二次抽中第3個單元的結合概率為.依次可得各種能夠被抽中的概率如下表單元第二次抽中 1 2 3
25、4合計1234第一次抽中00.011880.017820.023760.053640.0156400.047530.063380.126750.035640.0712900.142570.249500.095060.190090.2851500.57030合計0.146540.273260.35050.229711.10.053460.146540.22Z1同理可驗證20.126750.273260.42Z230.24950.35050.62Z340.57030.229710.82Z4所以抽選結果符合ps要求.樣本單元1,2100/0.2220/0.410500.027721,3100/0.2285/0.69750.053461,4100/0.2360/0.89500.118822,3220/0.4285/0.610250.118822,4220/0.4360/0.810000.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 初一軍訓心得體會4作文(20篇)
- 交通管理年終工作總結(5篇)
- 感人的勵志演講稿(15篇)
- 《舉辦我們的“3.15”晚會》(教案)-五年級勞動北師大版
- 工程部工作計劃模板集錦(17篇)
- 2025軍訓第一天心得體會(18篇)
- 全國河大版(三起)小學信息技術第四冊第4單元第14課《神奇的聲音模仿秀-語音合成技術》教學設計
- 河南現代宅間院落住宅景觀方案設計
- 新教師培訓的講話稿(5篇)
- 《營銷策略制定與實施》課件
- NB-T 47015-2011(JB-T 4709) 壓力容器焊接規程
- 建立世界貿易組織協定(中英)
- 《禾字旁》名師課件
- 智能桌椅商業計劃書
- 供應商年度評價內容及評分表
- 公務車輛定點加油服務投標方案(技術標)
- 強化學習與聯邦學習結合
- 泵檢驗標準及方法
- 水土保持學試卷 答案
- 變電站工程施工危險點辨識及預控措施(匯編)
- 關于新能源汽車的論文10000字
評論
0/150
提交評論