




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第4章 抽樣估計第一節 抽樣的基本概念第二節 抽樣分布與中心極限定理第三節 總體參數估計第四節 抽樣方案的設計與實施*統計推斷斷的過程程樣本總體總體均值值、比例例、方差差樣本統計計量,如如樣本均均值、樣樣本比例例、樣本本標準差差等檢驗一批批燈泡的的使用壽壽命節目的收收視率水庫中的的魚苗數數抽樣估計計包括抽抽樣調查查和抽樣樣推斷兩兩個部分分。抽樣調查查是一種種非全面面的調查查方法,是從總總體中按按照隨機機原則抽抽取樣本本單位進進行調查查抽樣推斷斷是利用用樣本信信息推斷斷總體的的數量特特征。抽樣估計計不論在在統計調調查還是是在統計計分析中中都有廣廣泛的應應用。抽樣調查的概念廣義:凡是抽取取一部分分
2、單位進進行觀察察,并根根據觀察察結果來來推斷全全體的都都是抽樣樣調查,其中又又可分為為非隨機機抽樣和和隨機抽抽樣兩種種。狹義:根據大數數定律的的要求,在抽取取調查單單位時應應保證總總體中的的各個單單位都有有同等的的中選可可能性。一般所講講的抽樣樣調查,大多數數是指這這種隨機機調查,即狹義義的抽樣樣調查。指樣本單單位的抽抽取不受受主觀因因素及其其他系統統性因素素的影響響,每個個總體單單位都有有均等的的被抽中中機會按照隨機抽樣樣原則抽取總體體中的部部分單位位進行調調查,用用部分單單位的指指標數值值作為代代表,對對總體的的指標數數值作出出具有一定定可靠程程度的估計與與推斷,從而認識總體體的一種統統計
3、方法法。什么是抽抽樣推斷斷?例1:一汽車輪輪胎制造造商生產產一種被被認為壽命更長長的新型型輪胎。120個樣本測試平均里程程:36,500公里推斷新輪胎平均壽命命400個樣本支持人數數:160推斷支持該候候選人的選民占占全部選民的比比例例2:某黨派想想支持某某一候選選人參選選美國某某州議員員,為了了決定是是否支持持該候選選人,該該黨派領領導需要要估計支持該候候選人的的民眾占占全部登登記投票票人總數數的比例例。由于時時間及財財力的限限制:抽樣調查查的基本本特點:非全面調調查目的是推推斷總體體的數量量特征,抽樣推推斷結果果具有一一定的可可靠程度度抽樣調查查中的抽抽樣誤差差是不可可避免的的,但在在事先
4、是是可以計計算并加加以控制制的節省調查查費調查速度度快調查結果果準確可可靠應用范圍圍廣不可能進進行全面面調查時時對于具有有破壞性性的產品品質量檢檢測只能能進行抽抽樣調查查對某些現現象進行行全面調調查,在在經濟上上不合算算,在資資料上未未必能保保證,也也只能采采用抽樣樣調查。對于時效效性要求求較高的的某些調調查對全面調調查資料料進行補補充修正正時抽樣調查查的作用用,書P112-113設計抽樣方案抽取樣本單位收集樣本數據計算樣本統計量推斷總體參數抽樣估計計的一般般步驟第六章抽抽樣與參參數估計計第一節抽抽樣調調查的含含義第二節抽抽樣樣調查的的基本概概念第三節抽抽樣樣調查的的數理基基礎第四節抽抽樣推推
5、斷的方方法第二節抽抽樣樣調查的的基本概概念一、全及及總體和和樣本總總體二、全及及指標和和樣本指指標三、抽樣樣方法和和樣本可可能數目目全及總體體研究對象象的全體體,即第第一章中中學過的的總體。樣本總體體按隨機原原則從全全及總體體中抽取取一部分分單位組組成的集集合體,又叫樣樣本總體體。樣本總體體中所包包括的單單位數叫叫樣本容容量,一一般用n表示1、大樣本本(n30)2、小樣本本(n30) ,樣本均值的抽樣分布逐漸趨于正態分布一個任意分布的總體X1.重復抽樣樣條件下下,記算算公式為為:2.不重復抽抽樣條件件下,計計算公式式為:3.小于總體體標準差差抽樣平均均誤差4.與樣本容容量的關關系某個樣本本容量
6、的的抽樣分分布更大樣本本容量的的抽樣分分布抽樣分布布P119例4-5某班組有有5個工人,他們的的單位工工時工資資分別是是4、6、8、10、12元,總體體服從于于正態分分布。現現用重復復抽樣方方式從5個工人中中抽出2人,計算算樣本的的平均工工時工資資的抽樣樣平均誤誤差。樣本成數數分布P120例4-6已知一批批產品的的合格率率為90%,現采用用重復抽抽樣方式式從中取取出400件,求樣樣本合格格率的抽抽樣平均均誤差。練習1、對某鄉鄉進行簡簡單重復復抽樣調調查,抽抽出100個農戶,戶均年年收入2000元,年收收入標準準差100元。(1)求抽樣樣平均誤誤差。(2)若抽取取的是200戶,則抽抽樣平均均誤差
7、是是多少?(3)若要使使抽樣平平均誤差差降低為為原來(1)的一半半,則應應抽多少少戶。2、對某縣縣人口用用不重復復抽樣方方法按1/10比例抽出出1萬人進行行調查,得知樣樣本平均均年齡40歲,年齡齡標準差差20歲,求抽抽樣平均均誤差。練習:計計算樣本本比例的的抽樣平平均誤差差1、某縣人人口10萬人,用用簡單隨隨機不重重復抽樣樣方法抽抽取1/10的人口進進行調查查,得知知男性人人口比重重為51%,求男性性人口比比重的抽抽樣平均均誤差。2、對某鄉鄉進行簡簡單隨機機重復抽抽樣調查查,抽出出100個農戶進進行調查查,得知知年收入入在1800元以上的的占95%,求農戶戶年收入入在1800元以上比比重的抽抽
8、樣平均均誤差。簡單回顧顧:抽樣樣平均誤誤差抽樣平均均誤差的的計算公公式:第4章抽抽樣估估計第一節抽抽樣的的基本概概念第二節抽抽樣分分布與中中心極限限定理第三節總總體參參數估計計第四節抽抽樣方方案的設設計與實實施*一、總體體參數估估計概述述點估計就就是根據據樣本資資料得出出的樣本本指標數數值,直接用以以代表相相應的總總體指標標,即:。 根據給定定的估計計可靠程度度的要求,利用實實際樣本本資料,指出包包含總體體被估計計值的區間范圍圍。點估估計計區間估計計二、參數數估計的的基本方方法點估計指直接以樣本指標來估計總體指標,也叫定值估計估計量的的優良性性準則:無偏性有效性一致性簡單,具體明確優點缺點無法
9、控制誤差僅適用于對推斷的準確程度與可靠程度要求不高的情況點估計的的特點:估計量的的優良性性準則(無偏性性)無偏性:估計量量的數學學期望等等于被估估計的總總體參數估計量的的優良性性準則(有效性性)有效性:一個方方差較小小的無偏偏估計量量稱為一一個更有效的估估計量。估計量的的優良性性準則(一致性性)一致性:隨著樣樣本容量量的增大大,估計計量越來來越接近近被估計計的總體體參數為的無無偏、有有效、一一致估計計量;為的無無偏、有有效、一一致估計計量;為的無無偏、有有效、一一致估計計量。數理統計計證明:案例3:A市農村自自來水居居民用戶戶共有70萬戶,采采用不重重復抽樣樣的方式式,隨機機抽取了了200戶進
10、行滿滿意度的的調查,獲得的的相關資資料如下下:樣本農村村居民用用戶對產產品的平平均滿意意度為3.52,標準差差為0.74。現在要求求以95%的概率保保證程度度來估計全全部農村村居民用用戶對產品的的滿意度度所在的的區間。區間估計計注意:區區間估計必須須同時考考察所得得結果的的“可能范圍圍” 與“可靠程度度”。68.27%95.45%99.73%回顧正態態分布回顧正態態分布Z與相應的的概率保保證程度度存在一一一對應應關系,常用z值及相應應的概率率保證程程度為:Z值概概率保證證程度1.000.68271.650.90001.960.95002.000.95452.580.99003.000.9973
11、在實際中中,一般般將這種種對應函函數關系系編成正態概率率表供直接查查用(大樣本本條件下下)回顧中心心極限定定理(圖示)中心極限限定理:設從均值值為,方差為為2的一個任意總體中抽抽取容量量為n的樣本,當n充分大時時,樣本本均值的的抽樣分分布近似似服從正正態分布布。當樣本容量足夠大時(n 30) ,樣本均值的抽樣分布逐漸趨于正態分布一個任意分布的總體X所有可能能的樣本本平均數數的分布布68.27%95.45%99.73%區間估計計(以總體體均值的的區間估估計為例例)區間估計計的相關關概念(一)置信水平平與概率度度查表得到置信信水平和和概率度度的關系系Z值置置信水平平1.000.68271.650.
12、90001.960.95002.000.95452.580.99003.000.9973區間估計計的相關關概念(二)P126:置信區間間:置信下限限、置信上限限所謂區間間估計,就是估估計總體體參數的的區間范范圍,并并要求給給出區間間估計的的置信水水平抽樣極限限誤差抽樣平均均誤差是是說明抽抽樣方案案總的誤誤差情況況但在實際際抽樣推推斷時,往往只只抽取一一個樣本本,因此此實際的的抽樣誤誤差可能能大于或或者小于于抽樣的的平均誤誤差。在現實中中,置信區間間可以通通過統計計量的值值加減一一個允許許的誤差差項來計算,這個可可以接受受的誤差差項也叫叫作極限限誤差,也稱為允許誤差差或容許誤差差。區間估計計的相
13、關關概念(三)抽樣極限限誤差在一定的的全及總總體中,當抽樣樣方式和和樣本容容量確定定以后,抽樣的的平均誤誤差就是是一個定值。而抽樣的的極限誤誤差則可可以根據據研究目目的的不不同,由人們加加以規定定。抽樣極限限誤差和和抽樣平平均誤差差的關系系:這里的“z”稱為“概率度”概率度“z”和置信水平平的關系(查表)抽樣極限限誤差的的估計總總是和一一定的概率保證證程度聯系在一一起關于概率率度的進進一步解解釋區間估計計的相關關概念(四)區間估計計最關心心的兩個問題題:抽樣誤差差的可能能范圍有有多大?置信區間間估計的精精度落在這個個范圍內內的概率率有多大大?置信水平平估計的可可靠性回到關鍵鍵問題案例7:A市農
14、村自自來水居居民用戶戶共有70萬戶,采采用不重重復抽樣樣的方式式,隨機機抽取了了200戶進行滿滿意度的的調查,獲得的的相關資資料如下下:樣本農村村居民用用戶對產產品的平平均滿意意度為3.52,標準差差為0.74。現在要求求以95%的概率保保證程度度來估計計全部農農村居民民用戶對對產品的的滿意度度所在的的區間。本章中最最重要的的問題之之一:區間估計計的三類類主要問問題一.總體平均均數的區區間估計計二.總體成數數的區間間估計三樣本本容量的的確定步驟 計算樣本平均數 ; 搜集總體方差的經驗數據 ;或計算樣本方差 ;總體平均均數的區區間估計計計算抽樣樣平均誤誤差:計算抽樣樣極限誤誤差:確定總體體平均數
15、數的置信信區間:案例7:A市農村自自來水居居民用戶戶共有70萬戶,采采用不重重復抽樣樣的方式式,隨機機抽取了了200戶進行滿滿意度的的調查,獲得的的相關資資料如下下:樣本本農村居居民用戶戶對產品品的平均均滿意度度為3.52,標準差差為0.74。現在要要求以95%的概率保保證程度度來估計計全部農農村居民民用戶對對產品的的滿意度度所在的的區間。(1)計算樣本平均數的平均誤差,因為n/N比值很小,所以,應用重復抽樣的公式進行計算:(2)根據概率保證程度: , , 查表得概率度:(3)計算抽樣極限誤差 (4)計算A市所有農村自來水用戶滿意度的區間: 下限上限 計算結果表明,A市農村自來水用戶的平均滿意
16、度為3.423.62,其置信水平為95%。練習解:已知x26,=6,n=100,F(z) =0.95,z=1.96結論:平平均每天天參加鍛鍛煉的時時間在24.82427.176分鐘之間間,置信水平平為95%。【例】某大學從從該校學學生中隨隨機抽取取100人,調查查到他們們平均每每天參加加體育鍛鍛煉的時時間為26分鐘。試試以95的置信信水平估估計該大大學全體體學生平平均每天天參加體體育鍛煉煉的時間間(已知知總體標標準差為為6分鐘)。區間估計計的原理理1.樣本中平平均參加加體育鍛鍛煉的時時間為26分鐘,即即用樣本本平均數數作為對對總體平平均數的的點估計2.估計范圍圍為261.176(1.176的誤
17、差),即區間(24.824,27.176)。3.如用類似似的方式式,重復復抽取大大量(樣樣本容量量相同的的)樣本本時,產產生的大大量類似似區間中中有些會會覆蓋真真正的總總體平均均數,而而有些不不會;但但其中大大約有95%會覆蓋真真正的總總體比例例。區間估計計原理0.6827落在范圍內的概率為68.27%樣本抽樣分布曲線原總體分布曲線區間估計計原理0.9545落在范圍內的概率為95.45%樣本抽樣樣分布曲曲線原總體分分布曲線線區間估計計原理0.9973落在范圍內的概率為99.73%樣本抽樣樣分布曲曲線總體分布布曲線區間估計計的三類類主要問問題一.總體平均均數的區區間估計計二.總體成數數的區間間估
18、計三樣本本容量的的確定產品的合合格率民眾對某某項政策策的支持持率某企業產產品的市市場占有有率某電視節節目的收收視率一、應用用環境步驟 計算樣本成數 ; 搜集總體方差的經驗數據 ;計算抽樣樣平均誤誤差:總體成數數的區間間估計計算抽樣樣極限誤誤差:確定總體體成數的的置信區區間:總體比例例的置信信區間(實例)【例】某企業在在一項關關于職工工流動原原因的研研究中,從該企企業前職職工的總總體中隨隨機選取取了200人組成一一個樣本本。在對對其進行行訪問時時,有140人說他們們離開該該企業是是由于同同管理人人員不能能融洽相相處。試試對由于于這種原原因而離離開該企企業的人人員的真真正比例例構造95%的置信區區
19、間。影響抽樣樣誤差(區間寬寬度)的的因素總體數據據的離散散程度樣本容量量n大小的影影響置信水平平 的大大小4.抽樣方法法的影響響區間估計計的三類類主要問問題一.總體均值值的區間間估計二.總體比例例的區間間估計樣本容量量的確定定樣本容量量調查誤差差調查費用用小樣本容容量節省省費用但但調查誤誤差大大樣本容容量調查查精度高高但費用用較大找出在規規定誤差差范圍內內的最小小樣本容容量確定樣本本容量的的意義找出在限限定費用用范圍內內的最大大樣本容容量必要樣本本單位數數案例8:A市自來水水城鎮居居民用戶戶共有114萬戶,2009年其滿意意度的標標準差為為1。現對A市城鎮自自來水居居民用戶戶2010年的滿意意
20、度進行行抽樣估估計,要要求平均均滿意度度的允許許誤差最最大不超超過0.1,概率保保證程度度為95%。那么我們們用重復復抽樣方方法需要要抽查多多少城鎮鎮自來水水居民用用戶?允許的極限誤差的大小 抽樣推斷的可靠程度 抽樣方法與抽樣的組織形式 總體各單位標志值變異程度的大小 (1)在重復復抽樣條條件下:(2)在不重重復抽樣樣條件下下:1推斷總總體平均均數所需需的樣本本單位數數2推斷總總體成數數所需的的樣本單單位數(1)在重復復抽樣條條件下:(2)在不重重復抽樣樣條件下下:案例:A市自來水水城鎮居居民用戶戶共有114萬戶,2009年其滿意意度的標標準差為為1。現對A市城鎮自自來水居居民用戶戶2010年
21、的滿意意度進行行抽樣估估計,要要求平均均滿意度度的允許許誤差最最大不超超過0.1,概率保保證程度度為95%,那么我我們用重重復抽樣樣方法需需要抽查查多少城城鎮自來來水居民民用戶?查正態分分布概率率表當概概率保證證程度為95%時,z=1.96,允許誤誤差=0.1,根據平均滿意意度推算算樣本容容量時,采用重重復抽樣樣公式:也就是為為了滿足足A市城鎮自自來水用用戶對產產品的平平均滿意意度的推推斷,我我們至少少應抽取取384戶A市城鎮自自來水用用戶來進進行調查查。樣本容量量的確定定(實例)解:已知=1341.641,F(z)=0.95,z=1.96,=500應抽取的的樣本容容量為【例】一家廣告告公想估
22、估計某類類商店去去年所花花的平均均廣告費費用有多多少。重復抽樣樣的經驗驗表明,總體標標準差約約為1341.641元。如置置信度取取95%,并要使使估計處處在總體體平均值值附近500元的范圍圍內,這這家廣告告公司應應抽多大大的樣本本?估計總體體比例時時樣本容容量的確確定在簡單隨隨機重復復抽樣條條件下:樣本均值值的抽樣樣平均誤誤差:樣本比例例的抽樣樣平均誤誤差:?總體標準準差總體比例例1.用過去全全面調查查或抽樣樣調查的的資料,若同時時有幾個個的資料,應選用用數值較較大的那那個。2.用樣本標標準差Sn-1代替全及及標準差差3.在大規模模調查前前,先做做個小規規模的試試驗性的的調查來來確定S,代替如
23、何確定定?1.可以取經經驗數據據2.如果可以以有幾個個經驗數數據,取使得P(1-P)最大的那那一個.3.可以用樣樣本比例例代替4.使用P= 0.5,此時P(1-P)最大.如何確定定P?樣本容量量的確定定(實例)【例】一家市場場調研公公司想估估計某地地區有彩彩色電視視機的家家庭所占占的比例例。該公公司希望望對比例例P的估計誤誤差不超超過0.05,要求的的可靠程程度為95%,應抽多多大容量量的樣本本(沒有有可利用用的P估計值,抽樣方方法為重重復抽樣樣)。Themargin of error forestimating apopulationproportion is almost0.10 or l
24、ess. In national publicopinion polls conductedbyorganizations,a 0.03or0.04marginoferrorisgenerally reported.Theuse of these marginsoferrorwillgenerallyprovidedasamplesizethat is large enoughtosatisfy thecentral limit theoremrequirements of np5and n(1-p)5.練習1:某大學隨隨機抽取取了50名男生,測得他他們的平平均身高高為174.5厘米,標標準差
25、為為6.9厘米。試試求置信信度為95%的置信區區間。結論:可以以95%的置信度推斷該學校全部男生的平均身高在172.59厘米176.41厘米之間。練習2:某企業業生產彩彩色電視視機,按按不重復復抽樣的的方法,從一批批出廠產產品中抽抽取1%的產品(共144臺)進行行質量檢檢驗,經經測試得得知:樣樣本彩色色電視機機正常工工作的平平均時間間為10.97千小時,標準差差為2.15千小時,試計算算:(1)以95%的概率保保證程度度對該廠廠生產的的這批彩彩色電視視機的正正常工作作時間做做出區間間估計。(2)若樣本本中彩色色電視機機的一級級品率為為34%,試以95%的概率保保證程度度對該廠廠這批出出廠產品品
26、的一級級品率做做出區間間估計。已知:,則抽樣平平均數的的平均誤誤差的計計算如下下:0.178(千小時時)千小時S= 2.15千小時(1)根據95%的概率保保證程度度查表得得t=1.96不重復抽抽樣允許許誤差不重復抽抽樣下限限(千小時時)不重復抽抽樣上限限(千小時時)計算結果果表明,該企業業彩色電電視機平平均正常常工作時時間在10.62111.319千小時之之間,其其概率保保證程度度為95%。(2)計算樣樣本一級品率和平均均誤差,p=34%根據概率率保證度度95%查表,得概率度度z=1.96計算抽樣樣極限誤誤差計算總體體指標的的區間:不重復抽抽樣下限限不重復抽抽樣上限限計算結果果表明,該批彩彩色電視視機一級級品率在在26.356%41.644%之間,其其置信水平平為95%。練習3:某企業業生產彩彩色電視視機,按按不重復復抽樣的的方法,從一批批出廠產產品中抽抽取1%的產品進進行質量量檢驗,取得如如下表所所示的抽抽樣檢驗驗資料,試計算算:(1)以95%的概率保保證程度度對該廠廠生產的的這批彩彩色電視視機的正正常工作作時間做做出區間間估計。(2)如果規規定彩色色電視機機的正常常工作時時間在12000小時以上上為一級級品,試試對該廠廠這批出出廠產品品的一級級品率做做
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 江蘇省無錫市梁溪區2025屆三年級數學第二學期期末監測模擬試題含解析
- 新疆烏魯木齊市十中2024-2025學年下學期高三期末英語試題含解析
- 浙江省金華市義烏市2025年數學四年級第二學期期末學業水平測試模擬試題含解析
- 全州縣2025年三下數學期末聯考試題含解析
- 項目總監聘請合同簡化范本
- 三輪車銷售協議書
- 豐臺區長辛店第一幼兒園合同續簽順利進行
- 湖北省十堰市2024-2025學年七年級下學期期中歷史試題(含答案)
- 2025年廣東省湛江市寸金培才學校中考歷史四模試卷 (含答案)
- 果園托管合同范本
- 閱讀提取信息課件
- 2025年河南省中考數學二輪復習壓軸題:動態幾何問題專練
- 《知識產權保護》課件
- 2025-2030中國制造運營管理(MOM)軟件行業市場現狀供需分析及投資評估規劃分析研究報告
- 江蘇省2024年中職職教高考文化統考烹飪專業綜合理論真題試卷
- 市政工程施工部署與資源配置計劃
- 2025年理化檢驗面試試題及答案
- 2025年電力人工智能多模態大模型創新技術及應用報告-西安交通大學
- 離婚協議書電子版下載
- 警棍盾牌術基本動作
- 撰寫課題申請書的五個關鍵(課堂PPT)
評論
0/150
提交評論