6 管理統計南京工業大學張琳上課講義_第1頁
6 管理統計南京工業大學張琳上課講義_第2頁
6 管理統計南京工業大學張琳上課講義_第3頁
6 管理統計南京工業大學張琳上課講義_第4頁
6 管理統計南京工業大學張琳上課講義_第5頁
已閱讀5頁,還剩2頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、Chapter 6 Sampling and InferenceSampling and Inference (抽由樣推斷)Point Estimation and Interval Estimation (點估計與區間估計)Sampling Methods (抽樣調查方法)Determining the Sample size (確定樣本容量)6.1. Sampling and InferenceSampling and InferenceThe purpose of statistical inference is to develop estimates and test hypothe

2、ses about the characteristics of a population using information contained in a sample 統計推斷的目的是利用 樣本信息建立對總體性質的估計和檢驗對總體性質的假設。抽樣推斷概念:是在抽樣調查的基礎上,利用樣本的實際資料計算樣本指標,并據此推斷總 體相應數量特征的一種統計分析方法.重復抽樣 (sampling with replacement,放回抽樣)不重復抽樣(sampling without replacement,無放回抽樣)抽樣推斷特點:總體的各單位都有一個指定的概率被由取調查單位的選取必須按照隨機原則進

3、行 從數量上推斷總體,并可控制抽樣誤差的大小 米用概率估算的方法抽樣推斷作用:可以解決全面調查無法或難以處理的問題 可以檢查、修正和補充全面調查的結果 可以應用于生產過程中的質量控制 可以應用于假設檢驗Terminology population and sample 全及總體(N)、樣本總體(n)population mean and sample mean 總體平均數(X )、樣本平均數(x )population proportion and sample proportion 總體成數(P)、樣本成數(p)population variance and sample variance

4、總體方差( 2)、樣本方差(S2)A tire manufacturer developed a new tire designed to provide an increase in mileage over the firms current line of tires. To estimate the mean number of miles provided by the new tires, the manufacturer selected a sample of 120 new tires for testing. The test results provided a samp

5、le mean of 36,500 miles. Hence, an estimate of the mean tire mileage for the population of new tires was 36,500 miles,某輪胎制造商開發了一種新型輪胎,它的設計里程數超過了公司目前的輪 胎產品.為了估計新輪胎的平均里程數,制造商詵取了一個包括120條新輪胎的樣本進行檢 測。檢測結果顯示樣本均值為36500英里。于是,新輪胎總體平均里程數的估計值為36500 英里。Members of a political party were considering supporting a

6、particular candidate for election to the U.S. Senate, and party leaders wanted an estimate of the proportion of registered voters favoring the candidate. The time and cost associated with contacting every individual in the population of registered voters were prohibitive. Hence, a sample of 400 regi

7、stered voters was selected and 160 of the 400 voters indicated a preference for the candidate. An estimate of the proportion of the population of registered voters favoring the candidate was 160/400=0.40. 400 名登記選民組成 的樣本,其中有160人支持候選人,因此選民總體中支持比例的估計值 =0.4The examples illustrate some of the reasons fo

8、r using sample. However, it is important to realize that sample results provide only estimates of the values of the population characteristics. That is, we do not expect the sample mean of 36,500 miles to exactly equal the mean mileage for all tires in the population, nor do we expect exactly 40% of

9、 the population of registered voters to favor the candidate. The reason is simply that the sample contains only a portion of the population.這兩個例子說明了人們使用樣本的一些原因。但是應該注意,樣本結果提供的只是總體特征 值的估計值。也就是說,我們不能期望英里的樣本均值恰好等于總體所有輪胎的平均里程, 我們也不能期望確實有的登記選民支持這位候選人。我們之所以這樣說是因為樣本只包含了 一部分總體。Point Estimation and Interval E

10、stimationPoint EstimationSampling errorInterval EstimationPoint EstimationTo estimate the value of a population parameter, we compute a corresponding characteristic of the sample, referred to as a sample statist For example, to estimate the population mean and the population standard deviation ,we s

11、imply use the data to calculate sample statistics: the sample mean and the sample standard deviation.為了估計總體參數的值,需要計算對應的樣本特征, 即樣本統計量。如為了估計總體均值和總體標準差,使用數據計算樣本統計量:樣本均值和 樣本標準差。Point estimation: We use the data from the sample to compute a value of a sample statistic that serves as an estimate of a popul

12、ation paramet er點估計:使用樣本數據計算出來的樣本統計量 的值作為對總體參數的估計。None of the point estimate are exactly equal to the corresponding population parameters. This variation is to be expected because only a sample and not a census of the entire population is being used to develop the estimate.沒有一個點估計值準確地等于對應總體參數。因為在進行估

13、計 時,用樣本數據代替了整個總體的統計數據,所以能夠預期到這個偏差。Sampling errorSampling error: The absolute value of the difference between an unbiased point estimate and the corresponding population parameter is called the sampling error.總體參數與其對應的無偏點估計之差的絕對值被稱為抽樣誤差。抽樣誤差定義.:抽樣指標與總體指標的差異,x -:、P-p口抽樣誤差越小,說明樣本的代表性越高。口抽樣誤差的大小,取決于抽樣單位

14、的多少、被 研究標志的變異程度大小、抽樣方法及組織形式。抽樣平均誤差(sampling error mean)定 義:許多抽樣誤差的平均數。同一總體可以抽出不同的樣本,即可計算出相應抽樣指標與抽樣誤差,因此能夠計算 出抽樣平均誤差。Il 任幻2區(p - p)2抽樣平均數的平均誤差 x=、i ;抽樣成數的平均誤差u p=丫 4_ 口數理統計證明: 重復抽樣下:u =不重復抽樣下:u = -(1 n) x nx n N平均數抽樣平均誤差與總體均方差成正比,與樣本單位數的平方根成反比(2)重復抽樣下:u = :p(1P)不重復抽樣下:u =p(1p)(1n)p np n N成數抽樣平均誤差與總體均

15、方差成正比,與樣本單位數的平方根成反比(3)通常在n/N很小時,用重復抽樣平均誤差公式代替不重復抽樣平均誤差公式。 實際計算時,全及總體方差很難獲得,一般用樣本總體方差代替。極限抽樣誤差(margin of。巾01)定義.:用一定的概率保證抽樣誤差不超過某一給定的范圍,即極限抽樣誤差數理統計證明:二甲P=F(t),當t=1時,概率P=0.6827P=F(t),當 t=2 時,概率 P=0.9545 P=F(t),當 t=3 時,概率 P=0.9973對一定的u,當t數值越大,用抽樣指標來代表全及指標所做的推斷,可信的程度也越高(估 計的精度在下降)。Interval Estimation 抽樣

16、估計:1.點估計: X = x,P=p2.區間估計:X一 X w X +x,p-pWPW p+ pSampling MethodsSimple random sampling (簡單隨機抽樣)Systematic sampling (系統抽樣)Stratified random sampling(分層抽樣) Cluster samplingl 群抽樣)Judgment sampling斷抽樣)Simple random samplingSimple random sampling: A simple random sample of sizen from a population of siz

17、e N is a sample selected such that each possible sample of size n has the same probability of being select. 如果總體N中每一個容量為n的可能樣本都有相同的概率被選取,這樣選擇出來的樣本就 稱為簡單隨機抽樣。按隨機數字表示選定樣本總體,計算x,計算ux、up、x、Ap,點估計或區間估計例1,對磚的質量進行抽樣調查,隨機抽出220塊磚,其中有廢磚4塊,計算不合格磚占全 部磚的比重(概率保證程度95.45%).4(1 )p=4/220=1.82% RPP(1 - P) / 220220= 22

18、0如09%,Confidence leve 1(置信度)為 95.45%, t=2,confidence interval(置信區間)為:p-ApPp+Ap p 中 P p + 中1.82%-2x0.09%WPW1.82%+2x0.09%,0.02%WPW3.62例2:在某工地抽查144名工人,測得每人平均挖土 4.95立方米,方差為2.25,試以95.45% 的概率保證推斷全部工人的平均挖土量。.2.25尤=4.95,旦=、,=, =0.125,X : n 144Confidence leve 1(置信度)為 95.45%, t=2,confidence interval(置信區間)為:X

19、- AxW X W X +Ax,4.95-2X0.125W X 4.95+2x0.125,4.70W X 5.20簡單隨機抽樣存在的問題:當總體單位很多時,對總體的編號很困難當總體單位分散時,抽樣調查比較困難沒有利用總體的一些已知信息,有些可惜Systematic sampling將總體單位按某種標志的順序排列,先隨機地抽取一個單元作為起點,然后每隔一定的間隔 抽取一個樣本。排序,間隔d=N/n, 1 d中隨機抽取i ,依次抽取i+d ,i+2d,.系統抽樣存在的問題:d=N/n可能不是整數,取接近N/n的整數,這樣可能造成樣本容量不同抽樣誤差計算困難。簡單隨機抽樣的抽樣平均誤差在方差一定的條

20、件下,主要取決于樣 本容量n,隨n增大而減小,而系統抽樣,其估計量的抽樣平均誤差主要取決于總 體單元的排列方式,與n無明顯的關系,不能直接得出隨n增大便減小。系統抽樣實際中處理方法:按無關標志排序的系統抽樣與不重復隨機抽樣似乎是等價的一按純隨機抽樣處理如:排列結果與總體調查的標志值呈周期性變化,若d=周期l (或其倍數),系統抽樣的效率最差;若d=l-1,系統抽樣的效率最好,樣本平均數就等于總體平 均數,抽樣誤差為零。按有關標志排序一可以看作分層抽樣。系統抽樣優點:抽樣方法簡單,很適合在調查現場應用樣本在總體分布的更均勻,具有代表性,特別時采用有關標志排序時,結果 往往比其它形式有更好的精度系

21、統抽樣缺點:按無關標志排序時,如總體排序中存在事先無法預見的周期性,有可能獲得一個精度較差的估計僅從一個系統抽樣無法得出估計量抽樣平均誤差的精確估計。Stratified random sampling分層抽樣(stratified random sampling):將總體分為若干層(類型),從各層中分別獨立地抽樣,再把每層樣本合并即所求樣本分層不宜太多,每層中獨立隨機抽樣各層樣本抽取可以按比例分配,也可按變異程度分配抽樣估計:點估計或區間估計抽樣誤差計算:1.旦=氣(1 - ) ,。2 =Z w b2 平均層內方差尤 n Nwh h z 狀(1 p(1n),Phh層的成數p nNA =中,A

22、 =加例3:某企業有甲、乙兩車間。都生產同種產品,由于甲車間引進了新設備,提高了勞動生 產率,產量是乙車間的1.5倍?,F在要了解該產品使用壽命,按產量比例分別在兩車間抽樣, 共抽驗100個,得樣本資料如下:平均壽命標準差甲車間產品20006乙車間產品18008試按95.45%的概率保證,推斷該產品壽命范圍n=100, n =60 n =40 旦 =,生 :0.6 乂 62 + 0.4 乂 82 =0.687, 甲乙 - n100,Confidence leve 1(置信度)為 95.45%, t=2 A =甲=2x0.687=1.37confidence interva1(置信區間)為 192

23、0-2x1.37W X 1920+2x1.37該產品壽命范圍在1918.63與1921.37小時間。分層抽樣優點:可在不增大樣本容量的情況下,降低抽樣誤差,提高精度 便于對總體的各個部分進行研究 對不同的層可采用不同的抽樣方法組織實施按層進行,綜合也較簡便Cluster sampling整群抽樣:將總體單位劃分為若干個群,然后以群為抽樣單位,對抽中的群,調查包含的全 部個體??傮w劃分為R個群,每群包含M個個體,確定樣本容量r,中選的群內全部個體 進入樣本,抽樣估計。整群抽樣優點:節約調查費用,提高收集實地資料的效率群單元的抽樣框容易獲得在一個地點可以調查多個單位,較少人即能完成整群抽樣缺點:精

24、度比純隨機抽樣差6.3.5 Judgment sampling (判斷抽樣)In this approach, the person most knowledgeable on the subject of the study selects elements of the population that he or she feels are most representative of the population 在這個方法中,由對 所研究的總體非常了解的人選擇最能代表總體的元素組成樣本。The quality of the sample results depends on the judgment of the person selecting the sample.樣本 結果的質量依賴于選擇樣本的個人判斷力。6.4 De

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論