統(tǒng)計(jì)學(xué)抽樣推斷_第1頁(yè)
統(tǒng)計(jì)學(xué)抽樣推斷_第2頁(yè)
統(tǒng)計(jì)學(xué)抽樣推斷_第3頁(yè)
統(tǒng)計(jì)學(xué)抽樣推斷_第4頁(yè)
統(tǒng)計(jì)學(xué)抽樣推斷_第5頁(yè)
已閱讀5頁(yè),還剩87頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

統(tǒng)計(jì)學(xué)抽樣推斷第一頁(yè),共九十二頁(yè),2022年,8月28日第五章抽樣推斷假設(shè)檢驗(yàn)統(tǒng)計(jì)方法描述統(tǒng)計(jì)推斷統(tǒng)計(jì)參數(shù)估計(jì)第二頁(yè),共九十二頁(yè),2022年,8月28日學(xué)習(xí)目標(biāo)總體分布、樣本分布、抽樣分布單總體參數(shù)推斷時(shí)樣本統(tǒng)計(jì)量的分布雙總體參數(shù)推斷時(shí)樣本統(tǒng)計(jì)量的分布參數(shù)估計(jì)的一般問(wèn)題一個(gè)總體參數(shù)的區(qū)間估計(jì)兩個(gè)總體參數(shù)的區(qū)間估計(jì)樣本容量的確定第三頁(yè),共九十二頁(yè),2022年,8月28日5.1抽樣推斷的基本概念5.1.1總體與樣本5.1.2樣本容量與樣本個(gè)數(shù)5.1.3總體參數(shù)與樣本統(tǒng)計(jì)量5.1.4重復(fù)抽樣與不重復(fù)抽樣第四頁(yè),共九十二頁(yè),2022年,8月28日5.1抽樣推斷的基本概念5.1.1總體與樣本1.總體:又稱全及總體、母體,指所要研究對(duì)象的全體,由許多客觀存在的具有某種共同性質(zhì)的單位構(gòu)成。總體單位數(shù)用N表示。2.樣本:又稱子樣,來(lái)自總體,是從總體中按隨機(jī)原則抽選出來(lái)的部分,由抽選的單位構(gòu)成。樣本單位數(shù)用n表示。3.總體是唯一的、確定的,而樣本是不確定的、可變的、隨機(jī)的。

第五頁(yè),共九十二頁(yè),2022年,8月28日5.1抽樣推斷的基本概念5.1.2樣本容量與樣本個(gè)數(shù)樣本容量:一個(gè)樣本中所包含的單位數(shù),用n表示。樣本個(gè)數(shù):又稱樣本可能數(shù)目,指從一個(gè)總體中所可能抽取的樣本的個(gè)數(shù)。對(duì)于有限總體,樣本個(gè)數(shù)可以計(jì)算出來(lái)。樣本個(gè)數(shù)的多少與抽樣方法有關(guān)。(這個(gè)概念只是對(duì)有限總體有意義,對(duì)無(wú)限總體沒(méi)有意義!)第六頁(yè),共九十二頁(yè),2022年,8月28日5.1抽樣推斷的基本概念5.1.3總體參數(shù)與樣本統(tǒng)計(jì)量總體參數(shù):反映總體數(shù)量特征的指標(biāo)。其數(shù)值是唯一的、確定的。樣本統(tǒng)計(jì)量:根據(jù)樣本分布計(jì)算的指標(biāo)。是隨機(jī)變量。平均數(shù)標(biāo)準(zhǔn)差、方差成數(shù)參數(shù)、2p統(tǒng)計(jì)量S、S2P總體樣本第七頁(yè),共九十二頁(yè),2022年,8月28日5.1抽樣推斷的基本概念5.1.4重復(fù)抽樣與不充分抽樣重復(fù)抽樣:例如從A、B、C、D、E五個(gè)字母中隨機(jī)抽取兩個(gè)作為樣本。N=5,n=2考慮順序時(shí):樣本個(gè)數(shù)=Nn=52=25不考慮順序時(shí):樣本個(gè)數(shù)=15=第八頁(yè),共九十二頁(yè),2022年,8月28日5.1抽樣推斷的基本概念5.1.4重復(fù)抽樣與不充分抽樣不重復(fù)抽樣:例如從A、B、C、D、E五個(gè)字母中隨機(jī)抽取兩個(gè)作為樣本。N=5,n=2考慮順序時(shí):樣本個(gè)數(shù)=20不考慮順序時(shí):樣本個(gè)數(shù)=10第九頁(yè),共九十二頁(yè),2022年,8月28日5.2抽樣分布5.2.1三種不同性質(zhì)的分布5.2.2一個(gè)總體參數(shù)推斷時(shí)樣本統(tǒng)計(jì)量分布5.2.3抽樣分布與中心極限定理5.2.4兩個(gè)總體參數(shù)推斷時(shí)樣本統(tǒng)計(jì)量分布5.2.5點(diǎn)估計(jì)第十頁(yè),共九十二頁(yè),2022年,8月28日5.2抽樣分布5.2.1三種不同性質(zhì)的分布總體分布樣本分布抽樣分布第十一頁(yè),共九十二頁(yè),2022年,8月28日5.2抽樣分布5.2.1三種不同性質(zhì)的分布總體中各元素的觀察值所形成的分布分布通常是未知的可以假定它服從某種分布總體分布(populationdistribution)總體第十二頁(yè),共九十二頁(yè),2022年,8月28日5.2抽樣分布5.2.1三種不同性質(zhì)的分布樣本分布(sampledistribution)一個(gè)樣本中各觀察值的分布也稱經(jīng)驗(yàn)分布當(dāng)樣本容量n逐漸增大時(shí),樣本分布逐漸接近總體的分布樣本第十三頁(yè),共九十二頁(yè),2022年,8月28日5.2抽樣分布5.2.1三種不同性質(zhì)的分布樣本統(tǒng)計(jì)量的概率分布是一種理論概率分布隨機(jī)變量是樣本統(tǒng)計(jì)量樣本均值,樣本比例,樣本方差等結(jié)果來(lái)自容量相同的所有可能樣本提供了樣本統(tǒng)計(jì)量長(zhǎng)遠(yuǎn)我們穩(wěn)定的信息,是進(jìn)行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù) 包括以下內(nèi)容樣本平均數(shù)的分布重置抽樣分布不重置抽樣的分布樣本成數(shù)的分布重置抽樣分布不重置抽樣的分布抽樣分布(samplingdistribution)第十四頁(yè),共九十二頁(yè),2022年,8月28日5.2抽樣分布5.2.1三種不同性質(zhì)的分布總體計(jì)算樣本統(tǒng)計(jì)量例如:樣本均值、比例、方差樣本抽樣分布(samplingdistribution)第十五頁(yè),共九十二頁(yè),2022年,8月28日5.2抽樣分布5.2.2一個(gè)總體參數(shù)推斷時(shí)樣本統(tǒng)計(jì)量分布--樣本平均數(shù)的分布(重復(fù)抽樣)某班組5個(gè)工人的日工資為34、38、42、46、50元。=422=32現(xiàn)用重置抽樣的方法從5人中隨機(jī)抽2個(gè)構(gòu)成樣本。共有52=25個(gè)樣本。如右圖。(考慮順序)第十六頁(yè),共九十二頁(yè),2022年,8月28日5.2抽樣分布5.2.2一個(gè)總體參數(shù)推斷時(shí)樣本統(tǒng)計(jì)量分布--樣本平均數(shù)的分布(重復(fù)抽樣)驗(yàn)證了以下兩個(gè)結(jié)論:抽樣平均數(shù)的標(biāo)準(zhǔn)差反映所有的樣本平均數(shù)與總體平均數(shù)的平均誤差,稱為抽樣平均誤差,用表示。第十七頁(yè),共九十二頁(yè),2022年,8月28日5.2抽樣分布5.2.2一個(gè)總體參數(shù)推斷時(shí)樣本統(tǒng)計(jì)量分布--樣本平均數(shù)的分布(不重復(fù)抽樣)某班組5個(gè)工人的日工資為34、38、42、46、50元。=422=32現(xiàn)用不重置抽樣的方法從5人中隨機(jī)抽2個(gè)構(gòu)成樣本。共有=20個(gè)樣本。如右圖。(考慮順序)第十八頁(yè),共九十二頁(yè),2022年,8月28日5.2抽樣分布5.2.2一個(gè)總體參數(shù)推斷時(shí)樣本統(tǒng)計(jì)量分布--樣本平均數(shù)的分布(不重復(fù)抽樣)第十九頁(yè),共九十二頁(yè),2022年,8月28日5.2抽樣分布5.2.2一個(gè)總體參數(shù)推斷時(shí)樣本統(tǒng)計(jì)量分布--樣本平均數(shù)的分布樣本均值的數(shù)學(xué)期望樣本均值的方差重復(fù)抽樣不重復(fù)抽樣第二十頁(yè),共九十二頁(yè),2022年,8月28日5.2抽樣分布5.2.2一個(gè)總體參數(shù)推斷時(shí)樣本統(tǒng)計(jì)量分布--樣本平均數(shù)的分布總體成數(shù)p是指具有某種特征的單位在總體中的比重。成數(shù)是一個(gè)特殊平均數(shù),設(shè)總體單位總數(shù)目是N,總體中有該特征的單位數(shù)是N1。設(shè)x是0、1變量(總體單位有該特征,則x取1,否則取0),則有:現(xiàn)從總體中抽出n個(gè)單位,如果其中有相應(yīng)特征的單位數(shù)是n1,則樣本成數(shù)是:P也是一個(gè)隨機(jī)變量,利用樣本平均數(shù)的分布性質(zhì)結(jié)論,即有:第二十一頁(yè),共九十二頁(yè),2022年,8月28日5.2抽樣分布5.2.2一個(gè)總體參數(shù)推斷時(shí)樣本統(tǒng)計(jì)量分布--樣本平均數(shù)的分布樣本平均數(shù)的分布樣本成數(shù)的分布重復(fù)抽樣不重復(fù)抽樣第二十二頁(yè),共九十二頁(yè),2022年,8月28日5.2抽樣分布5.2.3抽樣分布與中心極限定理=50

=10X總體分布n=4抽樣分布Xn=16當(dāng)總體服從正態(tài)分布N~(μ,σ2)時(shí),來(lái)自該總體的所有容量為n的樣本的均值X也服從正態(tài)分布,X的數(shù)學(xué)期望為μ,方差為σ2/n。即X~N(μ,σ2/n)第二十三頁(yè),共九十二頁(yè),2022年,8月28日5.2抽樣分布5.2.3抽樣分布與中心極限定理當(dāng)樣本容量足夠大時(shí)(n

30),樣本均值的抽樣分布逐漸趨于正態(tài)分布中心極限定理:設(shè)從均值為,方差為

2的一個(gè)任意總體中抽取容量為n的樣本,當(dāng)n充分大時(shí),樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布一個(gè)任意分布的總體X第二十四頁(yè),共九十二頁(yè),2022年,8月28日5.2抽樣分布5.2.3抽樣分布與中心極限定理的分布趨于正態(tài)分布的過(guò)程第二十五頁(yè),共九十二頁(yè),2022年,8月28日5.2抽樣分布5.2.3抽樣分布與中心極限定理抽樣分布與總體分布的關(guān)系總體分布正態(tài)分布非正態(tài)分布大樣本小樣本正態(tài)分布正態(tài)分布非正態(tài)分布第二十六頁(yè),共九十二頁(yè),2022年,8月28日5.2抽樣分布5.2.4兩個(gè)總體參數(shù)的樣本統(tǒng)計(jì)量抽樣分布兩個(gè)總體都為正態(tài)分布,即,兩個(gè)樣本均值之差的抽樣分布服從正態(tài)分布,其分布的數(shù)學(xué)期望為兩個(gè)總體均值之差方差為各自的方差之和 兩個(gè)樣本均值之差的抽樣分布第二十七頁(yè),共九十二頁(yè),2022年,8月28日5.2抽樣分布5.2.4兩個(gè)總體參數(shù)的樣本統(tǒng)計(jì)量抽樣分布

m1s1總體1s2

m2總體2抽取簡(jiǎn)單隨機(jī)樣樣本容量n1計(jì)算X1抽取簡(jiǎn)單隨機(jī)樣樣本容量n2計(jì)算X2計(jì)算每一對(duì)樣本的X1-X2所有可能樣本的X1-X2m1-m2抽樣分布兩個(gè)樣本均值之差的抽樣分布第二十八頁(yè),共九十二頁(yè),2022年,8月28日5.2抽樣分布5.2.4兩個(gè)總體參數(shù)的樣本統(tǒng)計(jì)量抽樣分布兩個(gè)總體都服從二項(xiàng)分布分別從兩個(gè)總體中抽取容量為n1和n2的獨(dú)立樣本,當(dāng)兩個(gè)樣本都為大樣本時(shí),兩個(gè)樣本比例之差的抽樣分布可用正態(tài)分布來(lái)近似分布的數(shù)學(xué)期望為方差為各自的方差之和 兩個(gè)樣本比例之差的抽樣分布第二十九頁(yè),共九十二頁(yè),2022年,8月28日5.2抽樣分布5.2.4兩個(gè)總體參數(shù)的樣本統(tǒng)計(jì)量抽樣分布兩個(gè)樣本方差比的抽樣分布

兩個(gè)總體都為正態(tài)分布,即X1~N(μ1,σ12)的一個(gè)樣本,Y1,Y2,…,Yn2是來(lái)自正態(tài)總體X2~N(μ2,σ22)從兩個(gè)總體中分別抽取容量為n1和n2的獨(dú)立樣本兩個(gè)樣本方差比的抽樣分布,服從分子自由度為(n1-1),分母自由度為(n2-1)F分布,即第三十頁(yè),共九十二頁(yè),2022年,8月28日5.2抽樣分布5.2.5點(diǎn)估計(jì)

用樣本統(tǒng)計(jì)量(samplestatistics)可以作為其對(duì)應(yīng)的總體的點(diǎn)估計(jì)量(pointestimator)。但要估計(jì)總體的某一指標(biāo),并非只能用一個(gè)樣本指標(biāo),而可能有多個(gè)指標(biāo)可供選擇,即對(duì)同一總體參數(shù),可能會(huì)有不同的估計(jì)量。作為一個(gè)好的點(diǎn)估計(jì)量,統(tǒng)計(jì)量必須具有如下性質(zhì):

無(wú)偏性、有效性、一致性第三十一頁(yè),共九十二頁(yè),2022年,8月28日5.2抽樣分布5.2.5點(diǎn)估計(jì)

用樣本統(tǒng)計(jì)量(samplestatistics)可以作為其對(duì)應(yīng)的總體的點(diǎn)估計(jì)量(pointestimator)。但要估計(jì)總體的某一指標(biāo),并非只能用一個(gè)樣本指標(biāo),而可能有多個(gè)指標(biāo)可供選擇,即對(duì)同一總體參數(shù),可能會(huì)有不同的估計(jì)量。可以證明:

樣本均值、樣本比例、樣本標(biāo)準(zhǔn)差:

無(wú)偏、有效、一致

3、一致性(Consistency):當(dāng)樣本容量增大時(shí),估計(jì)量依概率收斂于總體參數(shù)的真值。

1、無(wú)偏性(Unbiasedness):樣本估計(jì)量的均值等于被估總體參數(shù)的真值;

2、有效性(Efficiency):好的點(diǎn)估計(jì)量應(yīng)具有較小的方差;第三十二頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.1區(qū)間估計(jì)概念5.3.2一個(gè)總體參數(shù)的區(qū)間估計(jì)5.3.3兩個(gè)總體參數(shù)的區(qū)間估計(jì)第三十三頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.1區(qū)間估計(jì)概念區(qū)間估計(jì)(intervalestimate)在點(diǎn)估計(jì)的基礎(chǔ)上,給出總體參數(shù)估計(jì)的一個(gè)區(qū)間范圍,該區(qū)間由樣本統(tǒng)計(jì)量加減抽樣誤差而得到的根據(jù)樣本統(tǒng)計(jì)量的抽樣分布能夠?qū)颖窘y(tǒng)計(jì)量與總體參數(shù)的接近程度給出一個(gè)概率度量比如,某班級(jí)平均分?jǐn)?shù)在75~85之間,置信水平是95%

樣本統(tǒng)計(jì)量

(點(diǎn)估計(jì))置信區(qū)間置信下限置信上限第三十四頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.1區(qū)間估計(jì)概念區(qū)間估計(jì)的圖示X95%的樣本-1.96x+1.96x99%的樣本-2.58x+2.58x90%的樣本-1.65x+1.65x第三十五頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.1區(qū)間估計(jì)概念將構(gòu)造置信區(qū)間的步驟重復(fù)很多次,置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比例稱為置信水平表示為(1-為是總體參數(shù)未在區(qū)間內(nèi)的比例常用的置信水平值有99%,95%,90%相應(yīng)的為0.01,0.05,0.10置信水平第三十六頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.1區(qū)間估計(jì)概念由樣本統(tǒng)計(jì)量所構(gòu)造的總體參數(shù)的估計(jì)區(qū)間稱為置信區(qū)間統(tǒng)計(jì)學(xué)家在某種程度上確信這個(gè)區(qū)間會(huì)包含真正的總體參數(shù),所以給它取名為置信區(qū)間用一個(gè)具體的樣本所構(gòu)造的區(qū)間是一個(gè)特定的區(qū)間,我們無(wú)法知道這個(gè)樣本所產(chǎn)生的區(qū)間是否包含總體參數(shù)的真值我們只能是希望這個(gè)區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個(gè),但它也可能是少數(shù)幾個(gè)不包含參數(shù)真值的區(qū)間中的一個(gè)置信區(qū)間(confidenceinterval)第三十七頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.1區(qū)間估計(jì)概念置信區(qū)間與置信水平均值的抽樣分布(1-)%區(qū)間包含了%的區(qū)間未包含1-aa/2a/2第三十八頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.2一個(gè)總體參數(shù)的區(qū)間估計(jì)總體參數(shù)符號(hào)表示樣本統(tǒng)計(jì)量均值比例方差第三十九頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.2一個(gè)總體參數(shù)的區(qū)間估計(jì)--總體均值的估計(jì)(大樣本)1. 假定條件總體服從正態(tài)分布,且方差(2)

已知如果不是正態(tài)分布,可由正態(tài)分布來(lái)近似(n

30)使用正態(tài)分布統(tǒng)計(jì)量Z總體均值在1-置信水平下的置信區(qū)間為第四十頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.2一個(gè)總體參數(shù)的區(qū)間估計(jì)--總體均值的估計(jì)(大樣本)【例】一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,為對(duì)產(chǎn)量質(zhì)量進(jìn)行監(jiān)測(cè),企業(yè)質(zhì)檢部門經(jīng)常要進(jìn)行抽檢,以分析每袋重量是否符合要求。現(xiàn)從某天生產(chǎn)的一批食品中隨機(jī)抽取了25袋,測(cè)得每袋重量如下表所示。已知產(chǎn)品重量的分布服從正態(tài)分布,且總體標(biāo)準(zhǔn)差為10克。試估計(jì)該批產(chǎn)品平均重量的置信區(qū)間,置信水平為95%25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3第四十一頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.2一個(gè)總體參數(shù)的區(qū)間估計(jì)--總體均值的估計(jì)(大樣本)解:已知X~N(,102),n=25,1-=95%,z/2=1.96。根據(jù)樣本數(shù)據(jù)計(jì)算得:

總體均值在1-置信水平下的置信區(qū)間為該食品平均重量的置信區(qū)間為101.44克~109.28克之第四十二頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.2一個(gè)總體參數(shù)的區(qū)間估計(jì)--總體均值的估計(jì)(大樣本)【例】一家保險(xiǎn)公司收集到由36投保個(gè)人組成的隨機(jī)樣本,得到每個(gè)投保人的年齡(周歲)數(shù)據(jù)如下表。試建立投保人年齡90%的置信區(qū)間36個(gè)投保人年齡的數(shù)據(jù)233539273644364246433133425345544724342839364440394938344850343945484532第四十三頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.2一個(gè)總體參數(shù)的區(qū)間估計(jì)--總體均值的估計(jì)(大樣本)解:已知n=36,1-=90%,z/2=1.645。根據(jù)樣本數(shù)據(jù)計(jì)算得:,

總體均值在1-置信水平下的置信區(qū)間為投保人平均年齡的置信區(qū)間為37.37歲~41.63歲第四十四頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.2一個(gè)總體參數(shù)的區(qū)間估計(jì)--總體均值的估計(jì)(小樣本)1. 假定條件總體服從正態(tài)分布,且方差(2)

未知小樣本(n<30)使用t分布統(tǒng)計(jì)量總體均值在1-置信水平下的置信區(qū)間為第四十五頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.2一個(gè)總體參數(shù)的區(qū)間估計(jì)--總體均值的估計(jì)(小樣本)t分布

分布是類似正態(tài)分布的一種對(duì)稱分布,它通常要比正態(tài)分布平坦和分散。一個(gè)特定的分布依賴于稱之為自由度的參數(shù)。隨著自由度的增大,分布也逐漸趨于正態(tài)分布Xt

分布與標(biāo)準(zhǔn)正態(tài)分布的比較t分布標(biāo)準(zhǔn)正態(tài)分布t不同自由度的t分布標(biāo)準(zhǔn)正態(tài)分布t(df=13)t(df=5)Z第四十六頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.2一個(gè)總體參數(shù)的區(qū)間估計(jì)--總體均值的估計(jì)(小樣本)【例】已知某種燈泡的壽命服從正態(tài)分布,現(xiàn)從一批燈泡中隨機(jī)抽取16只,測(cè)得其使用壽命(小時(shí))如下。建立該批燈泡平均使用壽命95%的置信區(qū)間16燈泡使用壽命的數(shù)據(jù)1510152014801500145014801510152014801490153015101460146014701470第四十七頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.2一個(gè)總體參數(shù)的區(qū)間估計(jì)--總體均值的估計(jì)(小樣本)解:已知X~N(,2),n=16,1-=95%,t/2=2.131。根據(jù)樣本數(shù)據(jù)計(jì)算得:,

總體均值在1-置信水平下的置信區(qū)間為該種燈泡平均使用壽命的置信區(qū)間為1476.8小時(shí)~1503.2小時(shí)第四十八頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.2一個(gè)總體參數(shù)的區(qū)間估計(jì)--總體比例的區(qū)間估計(jì)1. 假定條件總體服從二項(xiàng)分布可以由正態(tài)分布來(lái)近似使用正態(tài)分布統(tǒng)計(jì)量Z3.總體比例在1-置信水平下的置信區(qū)間為第四十九頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.2一個(gè)總體參數(shù)的區(qū)間估計(jì)--總體比例的區(qū)間估計(jì)【例】某城市想要估計(jì)下崗職工中女性所占的比例,隨機(jī)抽取了100個(gè)下崗職工,其中65人為女性職工。試以95%的置信水平估計(jì)該城市下崗職工中女性比例的置信區(qū)間解:已知n=100,p=65%,1-=95%,z/2=1.96該城市下崗職工中女性比例的置信區(qū)間為55.65%~74.35%

第五十頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.2一個(gè)總體參數(shù)的區(qū)間估計(jì)--總體方差的區(qū)間估計(jì)1. 估計(jì)一個(gè)總體的方差或標(biāo)準(zhǔn)差2. 假設(shè)總體服從正態(tài)分布總體方差2的點(diǎn)估計(jì)量為S2,且4.總體方差在1-置信水平下的置信區(qū)間為第五十一頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.2一個(gè)總體參數(shù)的區(qū)間估計(jì)--總體方差的區(qū)間估計(jì)221-2總體方差1-的置信區(qū)間自由度為n-1的2第五十二頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.2一個(gè)總體參數(shù)的區(qū)間估計(jì)--總體方差的區(qū)間估計(jì)【例】一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,現(xiàn)從某天生產(chǎn)的一批食品中隨機(jī)抽取了25袋,測(cè)得每袋重量如下表7所示。已知產(chǎn)品重量的分布服從正態(tài)分布。以95%的置信水平建立該種食品重量方差的置信區(qū)間25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3第五十三頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.2一個(gè)總體參數(shù)的區(qū)間估計(jì)--總體方差的區(qū)間估計(jì)解:已知n=25,1-=95%,根據(jù)樣本數(shù)據(jù)計(jì)算得s2=93.21

2置信度為95%的置信區(qū)間為該企業(yè)生產(chǎn)的食品總體重量標(biāo)準(zhǔn)差的的置信區(qū)間為7.54克~13.43克第五十四頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.2兩個(gè)總體參數(shù)的區(qū)間估計(jì)兩個(gè)總體參數(shù)的區(qū)間估計(jì)總體參數(shù)符號(hào)表示樣本統(tǒng)計(jì)量均值之差比例之差方差比第五十五頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.2兩個(gè)總體參數(shù)的區(qū)間估計(jì)兩個(gè)樣本均值之差的抽樣分布

m1s1總體1s2

m2總體2抽取簡(jiǎn)單隨機(jī)樣樣本容量n1計(jì)算X1抽取簡(jiǎn)單隨機(jī)樣樣本容量n2計(jì)算X2計(jì)算每一對(duì)樣本的X1-X2所有可能樣本的X1-X2m1-m2抽樣分布第五十六頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.2兩個(gè)總體參數(shù)的區(qū)間估計(jì)兩個(gè)總體均值之差的估計(jì)(大樣本)1. 假定條件兩個(gè)總體都服從正態(tài)分布,12、22已知若不是正態(tài)分布,可以用正態(tài)分布來(lái)近似(n130和n230)兩個(gè)樣本是獨(dú)立的隨機(jī)樣本使用正態(tài)分布統(tǒng)計(jì)量Z第五十七頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.2兩個(gè)總體參數(shù)的區(qū)間估計(jì)1. 12、22已知時(shí),兩個(gè)總體均值之差1-2在1-置信水平下的置信區(qū)間為12、22未知時(shí),兩個(gè)總體均值之差1-2在1-置信水平下的置信區(qū)間為兩個(gè)總體均值之差的估計(jì)(大樣本)第五十八頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.2兩個(gè)總體參數(shù)的區(qū)間估計(jì)【例】某地區(qū)教育委員會(huì)想估計(jì)兩所中學(xué)的學(xué)生高考時(shí)的英語(yǔ)平均分?jǐn)?shù)之差,為此在兩所中學(xué)獨(dú)立地抽取兩個(gè)隨機(jī)樣本,有關(guān)數(shù)據(jù)如下表。建立兩所中學(xué)高考英語(yǔ)平均分?jǐn)?shù)之差95%的置信區(qū)間

兩個(gè)樣本的有關(guān)數(shù)據(jù)

中學(xué)1中學(xué)2n1=46n1=33S1=5.8S2=7.2兩個(gè)總體均值之差的估計(jì)(大樣本)第五十九頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.2兩個(gè)總體參數(shù)的區(qū)間估計(jì)解:兩個(gè)總體均值之差在1-置信水平下的置信區(qū)間為兩所中學(xué)高考英語(yǔ)平均分?jǐn)?shù)之差的置信區(qū)間為5.03分~10.97分兩個(gè)總體均值之差的估計(jì)(大樣本)第六十頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.2兩個(gè)總體參數(shù)的區(qū)間估計(jì)兩個(gè)總體均值之差的估計(jì)

(小樣本12=22

)1. 假定條件兩個(gè)總體都服從正態(tài)分布兩個(gè)總體方差未知但相等:12=22兩個(gè)獨(dú)立的小樣本(n1<30和n2<30)總體方差的合并估計(jì)量第六十一頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.2兩個(gè)總體參數(shù)的區(qū)間估計(jì)兩個(gè)總體均值之差的估計(jì)(小樣本)兩個(gè)樣本均值之差的標(biāo)準(zhǔn)化兩個(gè)總體均值之差1-2在1-置信水平下的置信區(qū)間為第六十二頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.2兩個(gè)總體參數(shù)的區(qū)間估計(jì)兩個(gè)總體均值之差的估計(jì)(小樣本)【例】為估計(jì)兩種方法組裝產(chǎn)品所需時(shí)間的差異,分別對(duì)兩種不同的組裝方法各隨機(jī)安排12個(gè)工人,每個(gè)工人組裝一件產(chǎn)品所需的時(shí)間(分鐘)下如表。假定兩種方法組裝產(chǎn)品的時(shí)間服從正態(tài)分布,且方差相等。試以95%的置信水平建立兩種方法組裝產(chǎn)品所需平均時(shí)間差值的置信區(qū)間兩個(gè)方法組裝產(chǎn)品所需的時(shí)間方法1方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.521第六十三頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.2兩個(gè)總體參數(shù)的區(qū)間估計(jì)兩個(gè)總體均值之差的估計(jì)(小樣本)解:根據(jù)樣本數(shù)據(jù)計(jì)算得合并估計(jì)量為:兩種方法組裝產(chǎn)品所需平均時(shí)間之差的置信區(qū)間為0.14分鐘~7.26分鐘第六十四頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.2兩個(gè)總體參數(shù)的區(qū)間估計(jì)兩個(gè)總體均值之差的估計(jì)(小樣本12≠22

)1. 假定條件兩個(gè)總體都服從正態(tài)分布兩個(gè)總體方差未知且不相等:1222兩個(gè)獨(dú)立的小樣本(n1<30和n2<30)使用統(tǒng)計(jì)量第六十五頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.2兩個(gè)總體參數(shù)的區(qū)間估計(jì)兩個(gè)總體均值之差的估計(jì)(小樣本12≠22

)兩個(gè)總體均值之差1-2在1-置信水平下的置信區(qū)間為自由度第六十六頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.2兩個(gè)總體參數(shù)的區(qū)間估計(jì)兩個(gè)總體均值之差的估計(jì)(小樣本12≠22

)【例】沿用前例。假定第一種方法隨機(jī)安排12個(gè)工人,第二種方法隨機(jī)安排8個(gè)工人,即n1=12,n2=8,所得的有關(guān)數(shù)據(jù)如表。假定兩種方法組裝產(chǎn)品的時(shí)間服從正態(tài)分布,且方差不相等。以95%的置信水平建立兩種方法組裝產(chǎn)品所需平均時(shí)間差值的置信區(qū)間兩個(gè)方法組裝產(chǎn)品所需的時(shí)間方法1方法228.336.027.631.730.137.222.226.529.038.531.037.634.433.832.128.020.028.830.030.221第六十七頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.2兩個(gè)總體參數(shù)的區(qū)間估計(jì)兩個(gè)總體均值之差的估計(jì)(小樣本12≠22

)解:根據(jù)樣本數(shù)據(jù)計(jì)算得

自由度為:兩種方法組裝產(chǎn)品所需平均時(shí)間之差的置信區(qū)間為0.192分鐘~9.058分鐘第六十八頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.2兩個(gè)總體參數(shù)的區(qū)間估計(jì)兩個(gè)總體比例之差的估計(jì)1. 假定條件兩個(gè)總體服從二項(xiàng)分布可以用正態(tài)分布來(lái)近似兩個(gè)樣本是獨(dú)立的2. 兩個(gè)總體比例之差1-2在1-置信水平下的置信區(qū)間為第六十九頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.2兩個(gè)總體參數(shù)的區(qū)間估計(jì)兩個(gè)總體比例之差的估計(jì)【例】在某個(gè)電視節(jié)目的收視率調(diào)查中,農(nóng)村隨機(jī)調(diào)查了400人,有32%的人收看了該節(jié)目;城市隨機(jī)調(diào)查了500人,有45%的人收看了該節(jié)目。試以90%的置信水平估計(jì)城市與農(nóng)村收視率差別的置信區(qū)間12第七十頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.2兩個(gè)總體參數(shù)的區(qū)間估計(jì)兩個(gè)總體比例之差的估計(jì)解:已知n1=500,n2=400,p1=45%,p2=32%,1-=95%,z/2=1.96

1-2置信度為95%的置信區(qū)間為城市與農(nóng)村收視率差值的置信區(qū)間為6.68%~19.32%第七十一頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.2兩個(gè)總體參數(shù)的區(qū)間估計(jì)兩個(gè)總體方差之差的估計(jì)1. 比較兩個(gè)總體的方差比用兩個(gè)樣本的方差比來(lái)判斷如果S12/S22接近于1,說(shuō)明兩個(gè)總體方差很接近如果S12/S22遠(yuǎn)離1,說(shuō)明兩個(gè)總體方差之間存在差異總體方差比在1-置信水平下的置信區(qū)間為第七十二頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.2兩個(gè)總體參數(shù)的區(qū)間估計(jì)兩個(gè)總體方差之差的估計(jì)FF1-F總體方差比1-的置信區(qū)間方差比置信區(qū)間示意圖第七十三頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.2兩個(gè)總體參數(shù)的區(qū)間估計(jì)兩個(gè)總體方差之差的估計(jì)【例】為了研究男女學(xué)生在生活費(fèi)支出(元)上的差異,在某大學(xué)各隨機(jī)抽取25名男學(xué)生和25名女學(xué)生,得到下面的結(jié)果:男學(xué)生:女學(xué)生:試以90%置信水平估計(jì)男女學(xué)生生活費(fèi)支出方差比的置信區(qū)間第七十四頁(yè),共九十二頁(yè),2022年,8月28日5.3抽樣誤差與區(qū)間估計(jì)5.3.2兩個(gè)總體參數(shù)的區(qū)間估計(jì)兩個(gè)總體方差之差的估計(jì)解:根據(jù)自由度n1=25-1=24,n2=25-1=24,查得F/2(24)=1.98,F(xiàn)1-/2(24)=1/1.98=0.50512/22置信度為90%的置信區(qū)間為男女學(xué)生生活費(fèi)支出方差比的置信區(qū)間為0.47~1.84

第七十五頁(yè),共九十二頁(yè),2022年,8月28日5.4樣本容量的確定5.4.1估計(jì)總體均值時(shí)樣本容量的確定5.4.2估計(jì)總體比例時(shí)樣本容量的確定5.4.3估計(jì)兩個(gè)總體均值之差時(shí)樣本容量的確定5.4.4估計(jì)兩個(gè)總體比例之差時(shí)樣本容量的確定第七十六頁(yè),共九十二頁(yè),2022年,8月28日5.4樣本容量的確定5.4.1估計(jì)總體均值時(shí)樣本容量的確定估計(jì)總體均值時(shí)樣本容量n為樣本容量n與總體方差2、邊際誤差E、可靠性系數(shù)Z或t之間的關(guān)系為與總體方差成正比與邊際誤差成反比與可靠性系數(shù)成正比其中:第七十七頁(yè),共九十二頁(yè),2022年,8月28日5.4樣本容量的確定5.4.1估計(jì)總體均值時(shí)樣本容量的確定【例】擁有工商管理學(xué)士學(xué)位的大學(xué)畢業(yè)生年薪的標(biāo)準(zhǔn)差大約為2000元,假定想要估計(jì)年薪95%的置信區(qū)間,希望邊際誤差為400元,應(yīng)抽取多大的樣本容量?第七十八頁(yè),共九十二頁(yè),2022年,8月28日5.4樣本容量的確定5.4.1估計(jì)總體均值時(shí)樣本容量的確定解:已知=2000,E=400,1-=95%,z/2=1.9612/22置信度為90%的置信區(qū)間為即應(yīng)抽取97人作為樣本第七十九頁(yè),共九十二頁(yè),2022年,8月28日5.4樣本容量的確定5.4.2估計(jì)總體比例時(shí)樣本容量的確定根據(jù)比例區(qū)間估計(jì)公式可得樣本容量n為

E的取值一般小于0.1

未知時(shí),可取最大值0.5其中:第八十頁(yè),共九十二頁(yè),2022年,8月28日5.4樣本容量的確定5.4.2估計(jì)總體比例時(shí)樣本容量的確定【例】根據(jù)以往的生產(chǎn)統(tǒng)計(jì),某種產(chǎn)品的合格率約為90%,現(xiàn)要求邊際誤差為5%,在求95%的置信區(qū)間時(shí),應(yīng)抽取多少個(gè)產(chǎn)品作為樣本?解:已知=90%,=0.05,Z/2=1.96,E=5%

應(yīng)抽取139個(gè)產(chǎn)品作為樣本第八十一頁(yè),共九十二頁(yè),2022年,8月28日5.4樣本容量的確定5.4.3估計(jì)兩個(gè)總體均值之差時(shí)樣本容量的確定設(shè)n1和n2為來(lái)自兩個(gè)總體的樣本,并假定n1=n2根據(jù)均值之差的區(qū)間估計(jì)公式可得兩個(gè)樣本的容量n為其中:第八十二頁(yè),共九十二頁(yè),2022年,8月28日5.4樣本容量的確定5.4.3估計(jì)兩個(gè)總體均值之差時(shí)樣本容量的確定【例】一所中學(xué)的教務(wù)處想要估計(jì)試驗(yàn)班和普通班考試成績(jī)平均分?jǐn)?shù)差值的置信區(qū)間。要求置信水平為95%,預(yù)先估計(jì)兩個(gè)班考試分?jǐn)?shù)的方差分別為:試驗(yàn)班12=90,普通班22=120。如果要求估計(jì)的誤差范圍(邊際誤差)不超過(guò)5分,在兩個(gè)班應(yīng)分別抽取多少名學(xué)生進(jìn)行調(diào)查?English第八十三頁(yè),共九十二頁(yè),2022年,8月28日5.4樣本容量的確定5.4.3估計(jì)兩個(gè)總體均值之差時(shí)樣本容量的確定解:已知12=90,22=120,E=5,1-=95%,z/2=1.96即應(yīng)抽取33人作為樣本第八十四頁(yè),共九十二頁(yè),2022年,8月28日5.4樣本容量的確定5.4.4估計(jì)兩個(gè)總體比例之差時(shí)樣本容量的確定設(shè)n1和n2為來(lái)自兩個(gè)總體的樣本,并假定n1=n2根據(jù)比例之差的區(qū)間估計(jì)公式可得兩個(gè)樣本的容量n為其中:第八十五頁(yè),共九十二頁(yè),2022年,8月28日5.4樣本容量的確定5.4.4估計(jì)兩個(gè)總體比例之差時(shí)樣本容量的確定【例】一家瓶裝飲料制造商想要估計(jì)顧

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論