第四章抽樣分布與參數估計ppt課件_第1頁
第四章抽樣分布與參數估計ppt課件_第2頁
第四章抽樣分布與參數估計ppt課件_第3頁
第四章抽樣分布與參數估計ppt課件_第4頁
第四章抽樣分布與參數估計ppt課件_第5頁
已閱讀5頁,還剩93頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第四章 抽樣分布與參數估計第一節(jié) 頻率、概率與概率分布第二節(jié) 抽樣分布第三節(jié) 總體參數估計第四節(jié) 抽樣設計.第一節(jié) 頻率、概率與概率分布一、隨機事件與概率一隨機實驗與事件隨機景象的特點是:在條件不變的情況下,一系列的實驗或觀測會得到不同的結果,并且在實驗或觀測前不能預見何種結果將出現。對隨機景象的實驗或觀測稱為隨機實驗,它必需滿足以下的性質:1每次實驗的能夠結果不是獨一的;2每次實驗之前不能確定何種結果會出現;3實驗可在一樣條件下反復進展。.在隨機實驗中,能夠出現也能夠不出現的結果,稱之為隨機事件,簡稱事件。實驗的結果能夠是一個簡單事件,也能夠是一個復雜事件。簡單事件就是不可以再分解的事件,又

2、稱為根身手件。復雜事件是由簡單事件組合而成的事件。根身手件還可稱為樣本點,設實驗有n個根身手件,分別記為 (i=1,2,,n)。集合=1 ,2 , ,n稱為樣本空間,中的元素就是樣本點。.例:投擲一粒均勻的六面體骰子,出現的點數有能夠是1、2、3、4、5、6共六種。這六種結果是根本結果,不可以再分解成更簡單的結果了,所以=1,2,3,4,5,6為該實驗的樣本空間。“出現點數是奇數這一事件就不是簡單事件,它是由根身手件1,3和5組合而成的。我們通常用大寫字母A,B,C,來表示隨機事件,例如,設A表示“出現點數是奇數,那么A=1,3,5;設B表示“出現點數是偶數,那么B=2,4,6。.二概率1.

3、概率的定義概率就是指隨機事件發(fā)生的能夠性,或稱為機率,是對隨機事件發(fā)生能夠性的度量。 進展n次反復實驗,隨機事件A發(fā)生的次數是m次,發(fā)生的頻率是m/n,當實驗的次數n很大時,假設頻率在某一數值p附近擺動,而且隨著實驗次數n的不斷添加,頻率的擺動幅度越來越小,那么稱p為事件A發(fā)生的概率,記為:P(A)=p。在古典概型場所, 即根身手件發(fā)生的概率都一樣的場所:.例:設一個袋子中裝有白球2個,黑球3個。(1) 從中隨機摸出1只球,問剛好是白球的概率有多大? (2) 從中隨機摸出2只球,一問2只球都是白球的概率有多大? 二問2只球一白一黑的概率有多大? 三問2只球都是黑球的概率有多大? 解:(1) 由

4、于摸出的任何1只球都構成一個根身手件,所以樣本點總數為n=5。用A表示摸出的是白球事件,那么A由兩個根本點組成,即A=白球,白球,有利場所數m=2。因此,剛好摸出白球的概率為P(A)=m/n=2/5=0.4. (2) 由于摸出2只球才成一個根身手件,所以樣本點總數為 故P(A)=P(2只球都是白球)=1/ =1/10P(B)=P(2只球一白一黑)=23/10=6/10P(C)=P(2只球都是黑球)=3/10NOTE: P(A+B+C)=1.2. 概率的根本性質性質1 1P(A)0。性質2 P()=1。性質3 假設事件A與事件B互不相容,即AB=,那么P(AB)=P(A)+P(B)。 推論1 不

5、能夠事件的概率為0,即:P()=0。推論2 P( )=1-P(A), 表示A的對立事件,即它們二者必有一事件發(fā)生但又不能同時發(fā)生。.例:袋中裝有4只黑球和1只白球,每次從袋中隨機地摸出1只球,并換入1只黑球。延續(xù)進展,問第三次摸到黑球的概率是多少? 解: 記A為“第三次摸到黑球,那么 為“第三次摸到白球。先計算P( )。由于袋中只需1只白球,假設某一次摸到了白球,換入了黑球,那么袋中只需黑球了。所以相當于第一、第二次都是摸到黑球,第三次摸到白球。留意這是一種有放回的摸球,樣本點總數為53,有利場所數是421。故: P( )= , 所以 .3. 事件的獨立性定義 對事件A與B,假設p(AB)=p

6、(B)p(A),那么稱它們是統計獨立的,簡稱相互獨立。例:知袋中有6只紅球, 4只白球。從袋中有放回地取兩次球,每次都取1球。設 表示第i次取到紅球。那么,因此, ,也就是說,B1,B2相互獨立。從標題條件看,這一結論是顯然的。.二、隨機變量隨機變量X是定義在樣本空間 =1,2,n上的一個函數,這個函數的取值隨實驗的結果不同而變化。這個函數還要求滿足條件:對恣意的實數x,Xx是隨機事件。假設隨機變量一切能夠的取值是有限的,或可排成一列的,這種隨機變量稱為離散型隨機變量;另一種情況是隨機變量的取值范圍是一個區(qū)間或整個數軸,這種隨機變量稱為延續(xù)型隨機變量。1. 離散型隨機變量的概率分布 設離散型隨

7、機變量X的一切能夠取值為x1, x2,, xn, ,相應的概率為p(x1),p(x2),p(xn),。用表格一致表示出來是:.X x1 x2 xn P p(x1) p(x2) p(xn) 這稱為離散型隨機變量X的概率分布。性質:(1) 0p(xi)1 (i=1,2, );(2) 定義: 離散型隨機變量X的期望值為 性質:其中X1,X2都是隨機變量,是恣意常數。 .定義: 離散型隨機變量X的方差為方差的平方根稱為規(guī)范差。方差2或規(guī)范差反映隨機變量X相對其期望值的離散程度,2或越小, 闡明期望值的代表性越好;2或越大,闡明期望值的代表性越差。性質:對于恣意的,D(X)=2 D(X) 成立.貝努里實

8、驗 與二項分布有時我們只對實驗中某事件A能否出現感興趣,假設A發(fā)生,我們稱“勝利,否那么稱“失敗。像這樣只需兩種結果的實驗稱為貝努里實驗。設A出現的概率為p,我們獨立地反復進展n次貝努里實驗,稱為n重貝努里實驗.以Bk表示n重貝努里實驗中事件A正好出現k次這一事件,那么 (k=0,1,2,,n) 該分布稱為二項分布( q= 1- p ).NOTE: .2. 延續(xù)型隨機變量的概率分布 設X是R.V., x 是一實數. 記F(x)=P(Xx)。該函數就是隨機變量X的分布函數。分布函數的導數稱為密度函數,記作p(x )。 性質 (1) p(x)0(2) (3) a bxP(axb).定義: 延續(xù)型隨

9、機變量X的期望值為 方差為 性質: D(X)=2 D(X) .正態(tài)分布 假設延續(xù)型隨機變量X的密度函數為 那么稱隨機變量X服從均值為,方差為2的正態(tài)分布,記為XN(,2)。 假設一個正態(tài)分布的=0,=1,那么稱該正態(tài)布為規(guī)范正態(tài)分布,相應的隨機變量稱為規(guī)范正態(tài)隨機變量,用Z表示,即ZN(0,1),相應的分布密度函數為.普通正態(tài)分布 與規(guī)范正態(tài)分布 的關系:假設隨機變量X服從正態(tài)分布N (,2),那么隨機變量 Z = 服從規(guī)范正態(tài)分布,即ZN(0,1)。.例:某大學英語考試成果服從正態(tài)分布,知平均成果為70分,規(guī)范差為10分。求該大學英語成果在6075分的概率。.第二節(jié) 抽樣分布一、抽樣的根本概

10、念二、抽樣分布一反復抽樣分布二不反復抽樣分布三、大數定理與中心極限定理.一、抽樣的根本概念抽樣涉及的根本概念有:總體與樣本(見第一章)樣本容量與樣本個數總體參數與樣本統計量反復抽樣與不反復抽樣這些概念是統計學特有的,表達了統計學的根本思想與方法。.總體和樣本參見第1章1.總體:又稱全及總體、母體,指所要研討對象的全體,由許多客觀存在的具有某種共同性質的單位構成。總體單位數用 N 表示。2.樣本:又稱子樣,來自總體,是從總體中按隨機原那么抽選出來的部分,由抽選的單位構成。樣本單位數用 n 表示。3.總體是獨一的、確定的,而樣本是不確定的、可變的、隨機的。 .樣本容量與樣本個數樣本容量:一個樣本中

11、所包含的單位數,用n表示。樣本個數:又稱樣本能夠數目,指從一個總體中所能夠抽取的樣本的個數。對于有限總體,樣本個數可以計算出來。樣本個數的多少與抽樣方法有關。(這個概念只是對有限總體有意義,對無限總體沒有意義!).總體參數和樣本統計量總體參數:反映總體數量特征的目的。其數值是獨一的、確定的。樣本統計量:根據樣本分布計算的目的。是隨機變量。平均數規(guī)范差、方差成數參數、2p統計量S、 S2P總體樣本.反復(置)抽樣與不反復(置)抽樣重置抽樣與不重置抽樣各有3個特點P90反復抽樣:例如從A、B、C、D、E五個字母中隨機抽取兩個作為樣本。N=5,n=2思索順序時:樣本個數=Nn=52=25不思索順序時

12、:樣本個數=.反復(置)抽樣與不反復(置)抽樣不反復抽樣:例如從A、B、C、D、E五個字母中隨機抽取兩個作為樣本。N=5,n=2思索順序時:樣本個數不思索順序時:樣本個數.二、抽樣分布抽樣分布的概念:由樣本統計量的全部能夠取值和與之相應的概率頻率組成的分配數列。主要求出樣本平均數的期望與方差包括以下內容重置抽樣分布樣本平均數的分布樣本成數的分布不重置抽樣分布樣本平均數的分布樣本成數的分布.重置抽樣分布-樣本平均數的分布某班組5個工人的日工資為34、38、42、46、50元。 = 422 = 32現用重置抽樣的方法從5人中隨機抽2個構成樣本。共有52=25個樣本。如右圖。.驗證了以下兩個結論:抽

13、樣平均數的規(guī)范差反映一切的樣本平均數與總體平均數的平均誤差,稱為抽樣平均誤差,用 表示。重置抽樣分布-樣本平均數的分布.重置抽樣分布-樣本平均數的分布由概率論知,假設總體是正態(tài)分布的,那么樣本平均數的抽樣分布是如下正態(tài)分布這是一個非常重要的結論,有廣泛的運用。請參見中心極限定理。.重置抽樣分布-樣本成數的分布總體成數p是指具有某種特征的單位在總體中的比重。成數是一個特殊平均數,設總體單位總數目是N,總體中有該特征的單位數是N1。設x是0、1變量總體單位有該特征,那么x取1,否那么取0,那么有:現從總體中抽出n個單位,假設其中有相應特征的單位數是n1,那么樣本成數是: P也是一個隨機變量,利用樣

14、本平均數的分布性質結論,即有:.不重置抽樣分布樣本均值的分布性質:樣本成數的分布性質.抽樣分布總結樣本平均數的分布樣本成數的分布重復抽樣不重復抽樣.三、大數定理與中心極限定理大數定理當樣本容量n 充分大時,可以用樣本平均估計總體平均。當實驗次數n充分大時,可以用頻率替代概率。大數定理的意義:個別景象受偶爾要素影響,但是,對總體的大量察看后進展平均,就能使偶爾要素的影響相互抵消,從而使總體平均數穩(wěn)定下來,反映出事物變化的普通規(guī)律,這就是大數定理的意義。.中心極限定理 正態(tài)分布的再生定理 :相互獨立的兩個正態(tài)隨機變量相加之和仍服從正態(tài)分布。中心極限定理:大樣本的平均數近似服從正態(tài)分布。.例1:求樣

15、本平均數的概率分布設某公司1000名職工的人均年獎金為2000元,規(guī)范差500元,隨機抽取36人作為樣本進展調查,問樣本的人均年獎金在19002200元之間的概率有多大?.例2某地域職工家庭的人均年收入平均為12000元,規(guī)范差為2000元。假設知該地域家庭的人均年收入服從正態(tài)分布,現采用反復抽樣從總體中隨機抽取25戶進展調查,問出現樣本平均數等于或超越12500元的能夠性有多大?.例3某商場推銷一種洗發(fā)水。據統計,本年度購買此種洗發(fā)水的有10萬人,其中6萬是女性。假設按不反復隨機抽樣方法,從購買者中抽出100人進展調查,問樣本中女性比例超越50%的能夠性有多大?.第三節(jié) 總體參數估計本節(jié)主要

16、內容:總體參數估計概述總體參數的點估計參數區(qū)間估計樣本容量確實定.一、總體參數估計概述設待估計的總體參數是,用以估計該參數的統計量是 ,抽樣估計的極限誤差是,即:極限誤差是根據研討對象的變異程度和分析義務的性質來確定的在一定概率下的允許誤差范圍。參數估計的兩個要求:精度:估計誤差的最大范圍,經過極限誤差來反映。顯然,越小,估計的精度要求越高,越大,估計的精度要求越低。極限誤差確實定要以實踐需求為根本規(guī)范。可靠性:估計正確性的一個概率保證,通常稱為估計的置信度。.二、總體參數的點估計點估計的含義:直接以樣本統計量作為相應總體參數的估計量。.優(yōu)良估計量規(guī)范優(yōu)良估計規(guī)范:無偏性:要求樣本統計量的平均

17、數等于被估計的總體參數本身。一致性:當樣本容量充分大時,樣本統計量充分接近總體參數本身。有效性:總體方差的無偏估計量為樣本方差點估計完全正確的概率通常為0。因此,我們更多的是思索用樣本統計量去估計總體參數的范圍 區(qū)間估計。 .三、參數區(qū)間估計參數區(qū)間估計的含義:估計總體參數的區(qū)間范圍,并給出區(qū)間估計成立的概率值。其中: 1-(01)稱為置信度;是區(qū)間估計的顯著性程度,其取值大小由實踐問題確定,經常取1%、5%和10%。注間對上式的了解:例如抽取了1000個樣本,根據每一個樣本均構造了一個置信區(qū)間,這樣,由1000個樣本構造的總體參數的1000個置信區(qū)間中,有95%的區(qū)間包含了總體參數的真值,而

18、5%的置信區(qū)間那么沒有包含。這里,95%這個值被稱為置信程度或置信度。普通地,將構造置區(qū)間的步驟反復很多次,置信區(qū)間包含總體參數真值的次數所占的比例稱為置信程度。.樣本統計量 (點估計)置信區(qū)間置信下限置信上限我們用95%的置信程度得到某班學生考試成果的置信區(qū)間為60-80分,如何了解?錯誤的了解:60-80區(qū)間以95%的概率包含全班同窗平均成果的真值;或以95%的概率保證全班同窗平均成果的真值落在60-80分之間。正確的了解:假設做了多次抽樣如100次,大約有95次找到的區(qū)間包含真值,有5次找到的區(qū)間不包括真值。真值只需一個,一個特定的區(qū)間“總是包含或“絕對不包含該真值。但是,用概率可以知道

19、在多次抽樣得到的區(qū)間中大約有多少個區(qū)間包含了參數的真值。假設大家還是不能了解,那他們最好這樣回答有關區(qū)間估計的結果:該班同窗平均成果的置信區(qū)間是60-80分,置信度為95%。.區(qū)間估計的根本要素包括:樣本點估計值、抽樣極限誤差、估計的可靠程度樣本點估計值抽樣極限誤差:可允許的誤差范圍。抽樣估計的可靠程度置信度、概率保證程度及概率度留意:本教材所進展的區(qū)間估計僅指對總體平均數或成數的區(qū)間估計,并且在際計算過程中運用下面的式子。式中是極限誤差。.區(qū)間估計的內容2 知2 未知均 值方 差比 例置 信 區(qū) 間.平均數的區(qū)間估計 對總體平均數或成數的區(qū)間估計時,運用下面的式子 (式中是極限誤差)有兩種方

20、式:1、根據置信度1-,求出極限誤差,并指出總體平均數的估計區(qū)間。2、給定極限誤差,求置信度。.當知時,根據相關的抽樣分布定理, 服從規(guī)范正態(tài)分布N(0,1)。查正態(tài)分布概率表,可得 普通記為 ,那么 ,根據反復抽樣與不反復抽樣的 求法的不同,進一步可得總體平均數的估計區(qū)間:反復抽樣時,區(qū)間的上下限為:不反復抽樣時,區(qū)間的上下限為:平均數區(qū)間估計第1種方式(求置信區(qū)間).平均數區(qū)間估計第1種方式(求置信區(qū)間)假設總體方差未知,那么在計算 時,運用樣本方差替代總體方差,此時 服從自在度為n-1的t分布。查t分布表可得 ,并記為于是:反復抽樣時,區(qū)間的上下限為:不反復抽樣時,區(qū)間的上下限為:大樣本

21、時,t分布與規(guī)范正態(tài)分布非常接近,可直接從規(guī)范正態(tài)分布表查臨界值.例:總體平均數的區(qū)間估計1對某型號的電子元件進展耐用性能檢查,抽查資料分組如下表,要求估計該批電子元件的平均耐用時數的置信區(qū)間置信度95%。.68.27%的樣本表示樣本均值落在區(qū)間的概率是1-,例對總體均值區(qū)間估計的進一步了解.平均數區(qū)間估計第2種方式(求置信度)給定極限誤差,求置信度.例:總體平均數的區(qū)間估計2例:經抽樣調查計算樣本畝產糧食600公斤,并求得抽樣平均誤差為3公斤,現給定允許極限誤差為6公斤,求置信區(qū)間包含總體平均畝產的概率,即求置信程度。結果闡明,假設多次反復抽樣,每次都可以由樣本值確定一個估計區(qū)間,每個區(qū)間或

22、者包含總體參數的真值,或者不包含總體參數的真值,包含真值的區(qū)間占F(z),即每一萬次抽樣,就有9545個樣本區(qū)間包括總體畝產,其他455個樣本區(qū)間不包括總體平均數,即假設接受估計區(qū)間的判別要冒4.55%的時機犯錯誤的風險。.成數的區(qū)間估計由于總體的分布是0,1分布,只需在大樣本的情況下,才服從正態(tài)分布。總體成數可以看成是一種特殊的平均數,類似于總體平均數的區(qū)間估計,總體成數的區(qū)間估計的上下限是:留意:在實際中,由于總體成數經常未知,這時,抽樣平均誤差公式中的總體成數用樣本成數替代。 大樣本的條件:np5且n(1-p) 5,由于總體成數p通常未知,可以用樣本成數來近似判別。.例:總體平均數的區(qū)間

23、估計3對某型號的電子元件進展耐用性能檢查,抽查資料分組如下表, 設該廠的產質量量檢驗規(guī)范規(guī)定,元件耐用時數到達1000小時以上為合格品。要求估計該批電子元件的合格率,置信程度95%。.總體均值區(qū)間估計總結總體平均數估計區(qū)間的上下限總體方差已知N(0,1)重復抽樣不重復抽樣總體方差未知t(n-1)大樣本時近似服從N(0,1)重復抽樣不重復抽樣 假設是正態(tài)總體. 假設不是正態(tài)總體,或分布未知總體方差已知且是大樣本總體方差未知且是大樣本 此時不思索小樣本情況因此,大樣本情況下,直接用規(guī)范正態(tài)分布求置信區(qū)間即可。.總體成數估計區(qū)間估計總結總體成數估計區(qū)間的上下限只思索大樣本情況請記住大樣本條件.對總量

24、目的的區(qū)間估計在對總體平均數進展區(qū)間估計的根底上,可進一步推斷相應的總量目的,即用總體單位總數N分別乘以總體平均數的區(qū)間下限和區(qū)間上限,便得到相應總量N的區(qū)間范圍。.例1某廠對一批產品的質量進展抽樣檢驗,采用反復抽樣抽取樣品200只,樣本優(yōu)質率為85%,試計算當把握程度為90%時優(yōu)質品率的區(qū)間范圍。.例2某商場從一批食品共800袋中隨機抽取40袋假設用反復抽樣,測得每袋平均分量為791.1克,規(guī)范差為17.克,要求以95%的把握程度,估計這批食品的平均每袋分量以及這批食品總分量的區(qū)間范圍。800*778.84,800*803.36,即623072,642688 .三、樣本容量確定什么是樣本容量

25、確定問題?.確定樣本容量在設計抽樣時,先確定允許的誤差范圍和必要的概率保證程度,然后根據歷史資料或試點資料確定總體的規(guī)范差,最后來確定樣本容量。估計總體均值時樣本容量的確定重復抽樣 不重復抽樣 估計成數時樣本容量的確定重復抽樣 不重復抽樣 .確定樣本容量應留意的問題計算樣本容量時,普通總體的方差與成數都是未知的,可用有關資料替代:一是用歷史資料已有的方差與成數替代;二是在進展正式抽樣調查前進展幾次實驗性調查,用實驗中方差的最大值替代總體方差;三是成數方差在完全缺乏資料的情況下,就用成數方差的最大值0.25替代。假設進展一次抽樣調查,同時估計總體均值與成數,用上面的公式同時計算出兩個樣本容量,可

26、取一個最大的結果,同時滿足兩方面的需求。上面的公式計算結果假設帶小數,這時樣本容量不按四舍五入法那么取整數,取比這個數大的最小整數替代。例如計算得到:n=56.03,那么,樣本容量取57,而不是56。 .例:確定樣本容量1對某批木材進展檢驗,根據以往閱歷,木材長度的規(guī)范差為0.4米,而合格率為90%。現采用反復抽樣方式,要求在95.45%的概率保證程度下,木材平均長度的極限誤差不超越0.08米,抽樣合格率的極限誤差不超越5%,問必要的樣本單位數應該是多少?.例:確定樣本容量2對某批木材進展檢驗,根據以往閱歷,木材的合格率為90%、92%、95%。現采用反復抽樣方式,要求在95.45%的概率保證

27、程度下,抽樣合格率的極限誤差不超越5%,問必要的樣本單位數應該是多少?.第四節(jié) 抽樣的組織方式本節(jié)主要內容:抽樣估計效果的衡量與抽樣組織方式簡單隨機抽樣類型抽樣整群抽樣等距抽樣階段抽樣不同抽樣組織設計的比較.一、抽樣估計效果的衡量與抽樣組織方式抽樣估計效果好壞,關鍵是抽樣平均誤差的控制。抽樣平均誤差小,抽樣效果從整體上看就是好的;否那么,抽樣效果就不理想。抽樣平均誤差受以下幾方面的要素影響:一是總體的變異性,即與總體的規(guī)范差大小有關二是樣本容量三是抽樣方法。四是抽樣的組織方式抽樣的組織方式有如下幾種:簡單隨機抽樣、類型抽樣、等距抽樣、整群抽樣、階段抽樣 .二、簡單隨機抽樣.三、類型抽樣含義:又

28、稱分層抽樣。對總體各單位按一定標志加以分組,然后從每一組中按隨機原那么抽取一定單位構成樣本。得到樣本如下:.類型抽樣求樣本平均數.類型抽樣求抽樣平均誤差.類型抽樣求抽樣平均誤差.類型抽樣兩點結論從類型抽樣的抽樣平均誤差公式來看,類型抽樣的抽樣平均誤差與組間方差無關,它決議于組內方差的平均程度。而方差的加法定理: ,因此有如下結論:抽樣效果普通來說好于簡單隨機抽樣。因此在分組時應盡量擴展組間方差組間差別,減少組內方差組內差別,從而減少抽樣誤差,提高抽樣效果。.類型抽樣例假設某農場種植小麥1 200畝,根據其地理條件劃分為甲、乙、丙三類,按5%的比例總共抽取60畝進展調查,結果如下表所示。試以95

29、%的概率估計農場平均畝產量的區(qū)間范圍。 .四、整群抽樣定義:又稱集團抽樣。將總體各單位分為假設干群,然后從中抽取部分群,對中選群的一切單位進展全面調查。.整群抽樣抽樣平均誤差的計算在計算抽樣平均誤差時假定每群單位數是一樣的,但實踐任務中,通常是“自然群,其單位數普通是不等的。.整群抽樣抽樣效果評價益處是操作方便、省時、省力。確定一群便可以調查許多單位,但正是由于抽樣單位比較集中,限制了樣本單位在總體中分配的均勻性,所以有時代表性較代,抽樣誤差較大。可以添加樣本單位來減少誤差 。抽樣平均誤差只取決于群間方差與類型抽樣相反,因此分群時,應盡量擴展群內方差群內差別,減少群間方差群間差別來提高抽樣效果

30、。.整群抽樣例1從某縣的100個村莊中抽出10村,進展調查得平均每戶豢養(yǎng)家禽35頭,各村的平均數的方差為16頭,請計算平均抽樣誤差。.整群抽樣例2假設某水泥廠大量延續(xù)消費100公斤裝水泥,一晝夜產量為14 400袋,平均每分鐘產量10袋。現每隔144分鐘抽取一分鐘的產量(10袋為一群),一晝夜共抽取100袋水泥,察看結果如下表,試計算樣本平均數的抽樣平均誤差,并以95%的概率估計每包水泥分量的區(qū)間范圍。.五、等距抽樣含義:又稱機械抽樣或系統抽樣。先按某個標志對總體單位進展排序,然后依固定的間隔來抽取樣本單位。這樣可以保證樣本單位均勻地分布在總體的各個部分,有較高的代表性。總體的單位數N,需求抽

31、取的樣本單位數n,那么等距抽樣的間隔大小:k=N/n總體排序標志是由總體的有關輔助信息確定的,與調查標志兩者間可以有關也可以無關。1、無關標志排隊:如家計調查,按門牌號碼排序。2、有關標志排隊:如農產量調查按平均畝產量高低排序。普通來講,有關標志排序要比無關標志排序的機械抽樣更為優(yōu)越。在排隊時,要留意防止抽樣間隔與景象本身的周期性節(jié)拍相重合。以減少系統偏向的影響,提高樣本的代表性。.等距抽樣抽樣平均誤差的計算無關標志排隊時,為了方便起見,可以采用簡單隨機抽樣的平均誤差替代等距抽樣平均誤差 :.六、階段抽樣含義:所謂階段抽樣,就是先從總體中抽出較大的范圍的單位,再從中選的大單位中抽較小范圍的單位

32、,依次類推,最后從更小的范圍抽出樣本根本單位。階段抽樣普通運用于總體范圍很大的情況。如在我國的農產量調查、職工家計調查中都很適用:先從全國抽出各個省,再從抽中的省中抽出縣、市,最后抽出樣本的根本單位等等。 .階段抽樣兩階段抽樣兩階段抽樣較為簡單。本書主要分析兩階段抽樣平均誤差的控制問題。兩階段抽樣在組織技術上可以看成是整群抽樣和類型抽樣的結合。設總體分成R組,每組M個單位。兩階段抽樣就是:第一階段用整群抽樣方式從總體的全部R組群中,隨機抽取r組群;第二階段用類型抽樣方式從每個中選組中抽出m樣本單位。.兩階段抽樣樣本平均數.兩階段抽樣抽樣平均誤碼兩階段抽樣的平均誤差是由兩部分構成的,第一部分是第

33、一階段從總體全部組抽部分組所引起的組間誤差,第二部分是由第二階段在中選組中抽部分單位所引起的組內平均誤差。 .七、不同抽樣組織設計的比較進展抽樣設計時需求思索的兩個問題:提高樣本的代表性,添加抽樣的效果。抽樣要滿足隨機性要求。抽樣設計時,要充分思索如何降低抽樣的本錢費用。.簡單隨機抽樣是根本抽樣組織方式 抽樣推斷效果如何,依賴于所抽出樣本的質量;樣本的質量好壞,就看樣本對總體的代表性如何,而這又依賴于抽取樣本時的 “隨機性。 假設不滿足隨機性,那么樣本的代表性就值得疑心,抽樣推斷就無從進展。.類型抽樣與整群抽樣比較 1、抽樣平均誤差的決議要素不同。類型抽樣的平均誤差與組間方差無關,決議于組內方

34、差的平均程度整群抽樣的平均誤差與組內方差無關,決議于組間方差大小2、減小類型抽樣與整群抽樣平均誤差的方法不同。由于總體方差等于組間方差加上組內方差平均數。所以提高組間方差,降低組內方差可減小類型抽樣平均誤差 對于整群抽樣那么相反3、順應范圍不同。類型抽樣充分利用總體的已有信息,其前提就是對總體的構造事先有一定的認識,然后經過分類把總體中調查標志差別比較接近的單位歸為一組,減少組內差別,再從各組中抽出樣本,這樣的樣本就對總體有更大的代表性。整群抽樣適用于無原始資料可利用的總體單位。是一種較為方便有效的抽樣組織方式,有利于提高抽樣的效率。但要留意整群抽樣有時代表性不是很理想,抽樣誤差較大。在實踐抽樣中,通常要適當添加一些樣本單位,以利于減少抽樣誤差,提高抽樣推斷的準確度。 .階段抽樣平均誤差的控制 階段抽樣誤差的控制必需落實到抽樣的各個階段。兩階段抽樣誤差控制,要落實為第一階段的整群抽樣的誤差

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論