




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
第7章抽樣與抽樣分布統(tǒng)計圖表2統(tǒng)計圖表3統(tǒng)計圖表4統(tǒng)計圖表5統(tǒng)計圖表6統(tǒng)計圖表7統(tǒng)計圖表8劉濤個人百度指數(shù)近30天平均搜索指數(shù)達105098,同比上升240%,環(huán)比上升353%。王子文的人氣迅速躥升,百度指數(shù)近30天平均搜索指數(shù)為143401,同比增長大于1000%,環(huán)比增長大于1000%。喬欣詞條下近30天平均搜索指數(shù)為48263,環(huán)比增長大于1000%。因為角色關關的乖巧可人,就連“關關”都有其下詞條,近30天平均搜索指數(shù)為5590,環(huán)比上漲61%。歡樂頌統(tǒng)計圖表9統(tǒng)計圖表10抽樣調(diào)查研究了26個字母統(tǒng)計圖表11本章要點:第7章抽樣與抽樣分布簡單隨機抽樣方法點估計的基本方法樣本均值與樣本比例的抽樣分布*其他常見的抽樣方法簡介例:諾里斯電器公司的一項研究
諾里斯電器公司生產(chǎn)了一種能在各種電器上使用的高亮度燈泡,為了提高燈泡壽命,產(chǎn)品設計部門研發(fā)了一種新型燈絲,為了評估新燈絲的優(yōu)點,生產(chǎn)了200只利用新型燈絲制作的燈泡進行壽命試驗,得到樣本數(shù)據(jù)如右,試對所有用新型燈絲生產(chǎn)的燈泡使用壽命進行評估。
第7章抽樣與抽樣分布14引例:聯(lián)合電氣公司抽樣問題的案例
問題:
聯(lián)合電氣公司的人事部門經(jīng)理要擬訂一份公司2500名經(jīng)理的簡介。內(nèi)容包括經(jīng)理們的平均年薪和已完成公司培訓計劃的經(jīng)理所占比例。
15
16事件:人事部門經(jīng)理不想用全面調(diào)查而是抽樣的方法,從2500名經(jīng)理中抽取30名來估計總體信息。分析:
以下內(nèi)容將圍繞這一案例的分析、解決展開。統(tǒng)計推斷統(tǒng)計推斷過程1、總體是2500名管理人員信息的數(shù)據(jù)2、樣本是選中的30名管理人員的信息數(shù)據(jù)3、根據(jù)樣本數(shù)據(jù)計算出樣本平均年薪是51814(美元)4、根據(jù)樣本平均值對總體平均值進行估計.定義:根據(jù)樣本數(shù)據(jù)對總體進行估計并對總體參數(shù)的有關假定做出檢驗.推斷統(tǒng)計中有關概念總體(population):在一個特定研究中感興趣的對象全體所組成的集合,總體分:有限總體與無限總體樣本(sample):總體的一個子集抽樣(samplesurvey):收集一個樣本數(shù)據(jù)的過程被抽樣總體(statisticalinference):根據(jù)指理論上應抽樣的對象的全體抽樣框(frame):指事實上被抽樣的全體元素的集合統(tǒng)計圖表19幾個概念平均數(shù)標準差比例參數(shù)(唯一性)p統(tǒng)計量(隨機變量)x
sp
總體樣本統(tǒng)計應用:兩個例子
ThepurposeofStatisticsinferenceistoobtaininformationaboutapopulationfrominformationcontainedinsample.
例1:一汽車輪胎制造商生產(chǎn)一種被認為壽命更長新型輪胎。
例2:某黨派想支持某一候選人參選美國某州議員,為了決定是否支持該候選人,該黨派領導需要估計支持該候選人的民眾占全部登記投票人總數(shù)的比例。由于時間及財力的限制:120個樣本測試平均里程:36,500公里推斷新輪胎平均壽命:36,500公里400個樣本
支持人數(shù):160推斷支持該候選人的選民占全部選民的比例:160/400=40%21統(tǒng)計推斷對樣本要求
要利用樣本的信息對總體特征做合理的推斷,樣本必須具有代表性.
調(diào)查:新華學院學生的就餐情況統(tǒng)計圖表22統(tǒng)計圖表23統(tǒng)計圖表2425簡單隨機抽樣
簡單隨機抽樣(Simplerandomsampling)是最常用的一種抽樣方法。它的定義和樣本抽取程序取決于總體是有限總體還是無限總體。
26一、有限總體抽樣(一)有限總體的含義可以列出或計數(shù)總體中所有元素(單位)的總體稱為有限總體。(二)簡單隨機樣本定義從容量為N的有限總體中進行抽樣,如果容量為n的每個可能樣本被抽到的機會相同,我們稱容量為n的樣本為簡單隨機樣本。27事件:人事部門經(jīng)理不想用全面調(diào)查而是抽樣的方法,從2500名經(jīng)理中抽取30名來估計總體信息。分析:
以下內(nèi)容將圍繞這一案例的分析、解決展開。28(三)抽樣方法1.無放回抽樣(不重復抽樣)一個元素一旦選入樣本,就從總體中剔除,不能再次被選入。
[例]
在聯(lián)合電氣公司的問題中,用無放回抽樣方法抽取樣本。一、有限總體抽樣29分析:在此問題中,N=2500,n=30。用無放回抽樣方法抽取樣本的方法步驟如下:(1)抽樣的準備工作第一步:將2500名聯(lián)合電氣公司經(jīng)理編號1,2,3,…,2499,2500。第二步:將每個號碼寫在大小相等的紙片上,并揉成均勻的球狀。第三步:每個紙球放入圓形容器中搖勻。
30(2)具體抽樣第一步:從2500個紙球中隨機抽取1個,做好編號記錄,然后將其放在一邊。第二步:從剩下的2499個紙球中再抽取另1個,做好記錄后再放在一邊。第三步:以此類推,直至抽夠30個為止。
由此就構(gòu)成一個無放回抽樣的簡單隨機樣本。
312.放回抽樣(重復抽樣)一個元素一旦選入樣本,仍被放回總體中。先前被選入的元素可能再次被選,并且在樣本中可能出現(xiàn)多次(多于一次)。[例7.2]
在聯(lián)合電氣公司問題中,用放回抽樣方法抽取樣本。32分析:抽樣的準備工作同無放回抽樣。具體抽樣:第一步:從2500個紙球中隨機抽取第1個,做好編號記錄,然后將其放回總體參加下一次抽選。第二步:從2500個紙球中再隨機抽取第2個,做好編號記錄,然后將其放回總體參加下一次抽選。第三步:以此類推,直至抽夠30個為止。
33
最常用的抽樣方法是無放回抽樣(不重復抽樣)。以后,只要提到簡單隨機抽樣,就假定是無放回抽樣。
統(tǒng)計圖表34簡單隨機抽樣中的具體方法2.利用Excel函數(shù)抽取樣本利用函數(shù)randbetween(bottom,top)進行重復隨機抽樣3.利用Excel數(shù)據(jù)分析工具中的“抽樣”選項抽取樣本(重復)流程:工具----->數(shù)據(jù)分析---->抽樣---->抽樣選項,---->抽樣對話框---->輸入?yún)^(qū)域框中輸入總體單位編號或數(shù)字---->確定1.利用隨機數(shù)表抽取樣本4.利用SPSS可方便快捷地進行簡單隨機“抽樣”(不重復)37二、無限總體抽樣(一)無限總體的含義
在實際應用中,若總體單位數(shù)很多,要逐一編號是難以辦到的,特別是有些現(xiàn)象,事前也不可能編號(如一些連續(xù)大量正在生產(chǎn)的產(chǎn)品)因此我們定義:被研究的總體中所涉及某一正在進行的過程使得不可能列出總體中的所有元素,則可視為無限總體。38二、無限總體抽樣
(二)無限總體簡單隨機樣本定義
滿足下面條件的樣本稱為無限總體簡單隨機樣本:每個個體都來自同一個總體。每個個體被抽取是相互獨立的。
39
統(tǒng)計應用:兩個例子
ThepurposeofStatisticsinferenceistoobtaininformationaboutapopulationfrominformationcontainedinsample.
例1:一汽車輪胎制造商生產(chǎn)一種被認為壽命更長新型輪胎。
例2:某黨派想支持某一候選人參選美國某州議員,為了決定是否支持該候選人,該黨派領導需要估計支持該候選人的民眾占全部登記投票人總數(shù)的比例。由于時間及財力的限制:120個樣本測試平均里程:36,500公里推斷新輪胎平均壽命:36,500公里400個樣本
支持人數(shù):160推斷支持該候選人的選民占全部選民的比例:160/400=40%常用的估計量有:(1)樣本平均數(shù)為總體平均數(shù)的估計量;(2)樣本方差為總體方差的估計量(3)樣本成數(shù)為總體成數(shù)p的估計量。三、點估計點估計就是用樣本估計量的一個具體觀測值直接作為總體的未知參數(shù)的估計值的方法。42
點估計例現(xiàn)在再回到聯(lián)合電氣公司的問題上來。假定已經(jīng)抽取了一個由30名經(jīng)理所組成的簡單隨機樣本,他們相應的年薪以及參加管理培訓計劃情況的數(shù)據(jù)如下表:43
點估計例44
點估計例將樣本結(jié)果與總體參數(shù)的真值作對比:總體參數(shù)參數(shù)值點估計量點估計值5180040000.605181433480.6345
抽樣分布
46
例:在一箱(5×50×200=50000支)卷煙中隨機抽出40支測量煙絲重量X,然后對這箱卷煙的煙絲重量進行分析。樣本樣本指標N=50000n=40放回抽樣不放回抽樣X1、X2、…XN
X
的抽樣分布
如果將整理成分布數(shù)列,得到以下形式:樣本平均數(shù)概率(頻率)
p1p2pk形成了抽樣分布表,該表便為X的抽樣分布。x的抽樣分布49一、的期望值
(7-1)公式(7-1)說明,是的無偏估計。
無偏性(Unbiasedness)點估計量的一個性質(zhì)。點估計量的數(shù)學期望等于所估總體參數(shù)的值。
[例]總體A、B、C三人年齡為:1,2,3,N=3n=2。=2歲結(jié)論是:樣本均值的無偏性
51(一)無限總體的標準差(重復抽樣)(7-2)(二)有限總體的標準差(不重復抽樣)(7-3)二、的標準差
抽樣平均數(shù)的標準差A、重復抽樣
B、不重復抽樣54[例]在聯(lián)合電氣公司問題中,假定求:分析:由于抽樣比
所以可以直接用計算
考察一個N=6的總體(6點的骰子),其原始分布屬于均勻分布:X123456p1/61/61/61/61/61/6
從這個總體中有放回地抽取n=2的樣本(二個骰子同時拋點數(shù)),所有可能的樣本總數(shù)為Nn=36,假定要通過樣本估計總體的均值,則所有36個可能結(jié)果為:三、X的抽樣分布的形態(tài)
第一次第二次123456111.522.533.521.522.533.54322.533.544.542.533.544.55533.544.555.563.544.555.56所有36個可能結(jié)果:樣本均值的分布整理成:11.522.533.544.555.56p1/362/363/364/365/366/365/364/363/362/361/36用圖示反映其分布狀況如:
58
X的抽樣分布的形態(tài)中心極限定理對于三種不同總體的演示60這一命題要解決的問題就是,根據(jù)抽樣誤差確定在一次抽樣中,樣本均值落在以總體均值為中心,左右分別小于(等于)和大于(等于)一個數(shù)據(jù)范圍內(nèi)的概率有多大。
樣本均值與總體均值之差的絕對值稱作抽樣誤差(單個樣本的抽樣誤差):
61[例7.6]
在聯(lián)合電氣公司問題中,假定人事部經(jīng)理把樣本均值落在總體均值左右各500元以內(nèi)作為一個可接受的估計值。
那么,根據(jù)30名經(jīng)理組成的簡單隨機樣本得到的樣本均值在總體均值左右500元以內(nèi)的概率有多大呢?
即要計算:
62解:
圖7.7
樣本均值在總體均值左右500元范圍之間的概率63結(jié)論:
上述計算結(jié)果表明,
人事部經(jīng)理有50.36%的把握保證由30名公司經(jīng)理組成的樣本,他們平均年薪在51300~52300元之間。
64樣本容量與抽樣分布之間的關系
由公式可以看出,均值的標準誤差與樣本容量的平方根有關。即當樣本容量增加時,均值的標準誤差會減少。
例如,當n=30時,聯(lián)合電氣公司問題均值標準誤差為730.30,當樣本容量增加到100時,則新烽電子公司問題均值標準誤差減少到
65在的情況下,由100名新烽電子公司經(jīng)理組成的簡單隨機樣本所得到樣本均值落在總體均值左右500元之間的概率。
查標準正態(tài)分布表
66
由此,樣本均值在51300~52300元之間的概率為:0.3944+0.3944=0.7888圖7.8
簡單隨機樣本均值的抽樣分布比較(樣本由和名聯(lián)合電氣公司經(jīng)理年薪組成)
在許多商務和經(jīng)濟領域中,決策人員還經(jīng)常要用樣本比例對總體比例進行統(tǒng)計推斷。這一過程我們用下圖來描述:
67總體比例p=?從總體中抽取容量為n的樣本
推斷
68一、樣本比例的期望值
(7-4)
69
(一)無限總體(重復抽樣)
(7-5)
(二)有限總體(不重復抽樣)(7-6)
計算.70
例如,在聯(lián)合電氣公司問題中,已經(jīng)參加了公司管理培訓計劃的經(jīng)理所占比例是0.60,因為
71
大樣本容量的標準:
72例如,在聯(lián)合電氣公司問題中,由于
73
當抽取一個簡單隨機樣本并用樣本比例的值來估計總體比例p的值時,二者之間會有一定的抽樣誤差,即
74
例如,在聯(lián)合電氣公司問題中,人事部經(jīng)理想知道樣本比例在總體比例的范圍之內(nèi)的概率,即樣本比例在0.55和0.65之間的概率是多少?分析:補充:其他抽樣方法
抽樣組織方式是指在抽樣時對總體的加工整理形式。根據(jù)對總體的加工整理形式不同,在抽樣調(diào)查中抽樣的組織方式很多,除簡單隨機抽樣外,還有類型抽樣、等距抽樣、整群抽樣、多階段抽樣、方便抽樣和判斷抽樣等其他抽樣方法。一、類型抽樣類型抽樣又稱分層抽樣或分類抽樣。它是先將總體的全部單按照某個標志分成若干組,然后在各組中采用簡單隨機抽樣方式或其他方式抽取樣本單位的抽樣組織方式。[例]10人年齡資料如下。N=10n=3,推斷總體平均年齡。人:ABC
DEFG
HIJ年齡:5812
40424648
707276[簡單隨機抽樣](B
、H、I),(
C、D
、E
),(F
、G
、
I)結(jié)論:總體變異較大時類型抽樣。[類型抽樣](B
、E、I),(
C、D
、H
),(A
、G
、
J)類型抽樣是應用于總體內(nèi)各單位在被研究標志上有明顯差別的抽樣,如研究農(nóng)作物產(chǎn)量時,耕地有平原、丘陵和山地等;研究職工的工資水平時,各行業(yè)之間有明顯的差別。類型抽樣實質(zhì)上是把統(tǒng)計分組和抽樣原理有機結(jié)合的抽樣組織方式。通過分組,可以使組中具有同質(zhì)性,組間具有差異性,然后從各組中簡單隨機抽樣。這樣可以保證樣本對總體具有更高的代表性,所以計算出的抽樣誤差就比較小。類型抽樣應掌握的主要原則是:分組時應使組內(nèi)差異盡可能小,使組間差異盡可能大。
設全及總體有N個單位,現(xiàn)在需要抽取一個容量為n的樣本,可以將總體單位N按一定標志排隊,然后將N劃分為n個單位相等的部分,每一部分都包含K個單位,即N/n=K。
二、等距抽樣等距抽樣又稱為機械抽樣或系統(tǒng)抽樣。它是先將總體各單位按某一標志順序排列,然后按照固定的順序和相同的間隔來抽取樣本單位的抽樣組織方式。1、2、3、…、i、…、Ki+2Ki+(n-1)Kn在第一部分K個單位中(順序為1、2、3、…、i、…、K)隨機抽取一個單位i,而在第二部分中抽取第i+K單位。第三部分中抽取第i+2K單位……在第n部分抽取第i+(n-1)K單位,共n個單位組成一個樣本,而且每個樣本的間隔均為K,這種抽樣方法稱等距抽樣。等距抽樣的隨機性表現(xiàn)在抽取第一個樣本單位上,當?shù)谝粋€單位確定后,其余各個單位的位置也就確定了。等距抽樣可以分為無關標志排序抽樣和有關標志排序抽樣兩類。
無關標志排序抽樣是指排序的標志與被研究的標志無關,如:觀察學生考試成績用姓氏筆劃;觀察產(chǎn)品質(zhì)量按生產(chǎn)的先后順序等。無關標志排序可以保證抽樣的隨機性,它實質(zhì)上相當于簡單隨機抽樣。
有關標志排序抽樣是指排序的標志與被研究標志相關。
在對總體各單位的變異情況有所了解的情況下,也可以采用有關標志進行總體單位排列,使各單位的排列順序和它的變量數(shù)值大小保持密切的關系。如:農(nóng)產(chǎn)量抽樣調(diào)查,可利用各縣或各鄉(xiāng)當年估計畝產(chǎn)或最近三年平均畝產(chǎn)標志排隊,抽取調(diào)查單位;又如職工家計調(diào)查,可按職工平均工資排隊,抽取調(diào)查企業(yè)或調(diào)查戶。由此可見,按有關標志排序?qū)嵸|(zhì)上是運用類型抽樣的一些特點,有利于提高樣本的代表性。但也必須注意到,等距抽樣在排序時,第一個樣本單位的位置確定后,其余單位也隨之確定,因此要避免抽樣間隔和現(xiàn)象本身的周期性節(jié)奏相重合,引起系統(tǒng)性的影響。三、整群抽樣整群抽樣又稱為分群抽樣或集團抽樣。它是將總體劃分為若干群,然后以群為單位從中按簡單隨機抽樣方式或等距抽樣方式抽取部分群,對中選群中的所有單位一一進行調(diào)查的抽樣組織方式。
ABCDEFGHIJKLNOPLHPD1、按某種標志或要求將總體區(qū)分為若干群(R),群內(nèi)單位數(shù)(M)相等;2、采取不重復抽樣方式從R群隨機抽出r群,爾后對樣本群進行全面調(diào)查以推斷總體。總體群數(shù)R樣本群數(shù)r
在大規(guī)模的抽樣調(diào)查中,如果總體單位多且分布區(qū)域廣,缺少進行抽樣的抽樣框,或者在按經(jīng)濟效益原則不宜編制這種抽樣框的情況下,宜采用整群抽樣方式。整群抽樣中的群主要是自然形成的,如按行政區(qū)域、地理區(qū)域劃分群。整群抽樣和其他抽樣組織方式比較,在相同的條件下,抽樣誤差較大,代表性較低。在統(tǒng)計工作實踐中采用整群抽樣時,一般都要比其他抽樣方式抽樣更多的單位,借以降低抽樣誤差,提高抽樣結(jié)果的準確程度。四、多階段抽樣
多階段抽樣又稱多級抽樣。它是將抽取樣本單位的過程劃分為幾個階段,然后逐階段抽取樣本單位的抽樣組織方式。
如果先將總體進行分組,從中隨機抽出一些組,然后再從中選的組中隨機抽取總體單位,稱為二階段抽樣,如整群抽樣隨機抽出群,再從群中隨機抽出樣本單位就是二階段抽樣。
如果將總體進行多層次分組,然后依次在各層中隨機抽取,直到抽到總體單位,就稱為多階段抽樣,如我國農(nóng)產(chǎn)量調(diào)查就是采用多階段抽樣調(diào)查,即先從省中抽縣,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 水電結(jié)算協(xié)議書
- 房地產(chǎn)代理商合同
- 室內(nèi)裝修工程勞務承包協(xié)議書
- 轉(zhuǎn)讓店鋪及招牌合同協(xié)議
- 配偶出軌協(xié)議書范本
- 運營合作協(xié)議合同書
- 車輛合作經(jīng)營合同協(xié)議
- 無賞修路協(xié)議書
- 個人抵押車借款合同
- 超市退換貨合同協(xié)議
- 湖南工商大學學位英語考試歷年真題
- 英國電影概況
- 幕墻工程施工講解
- 雪球特別版:段永平投資問答錄
- 重癥醫(yī)學科醫(yī)療質(zhì)量控制指標上報表
- 大額貸款管理辦法
- JJF 1344-2023氣體標準物質(zhì)的研制
- 錘片式粉碎機設計解析
- 鏡頭蓋注塑模具
- 《公主嘗衣貼繡鋪翠襦入宮中》2020年江西省中考文言文閱讀真題(含答案與翻譯)
- 昆蟲標本制作展翅蝴蝶
評論
0/150
提交評論