統計學課件 ch6 參數估計課件_第1頁
統計學課件 ch6 參數估計課件_第2頁
統計學課件 ch6 參數估計課件_第3頁
統計學課件 ch6 參數估計課件_第4頁
統計學課件 ch6 參數估計課件_第5頁
已閱讀5頁,還剩56頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第6章參數估計教學內容6.1抽樣與抽樣分布6.2參數估計的基本方法6.3總體均值的區間估計6.4總體成數的區間估計6.5樣本容量的確定學習目標掌握樣本平均數和樣本成數的抽樣分布理解總體參數點估計的基本方法及其優良標準;掌握總體均值和成數指標的區間估計方法;會做題目6.1抽樣與抽樣分布6.1.1什么是抽樣推斷抽樣推斷是按隨機性原則,從研究對象中抽取一部分個體進行觀察,并根據所得到的觀察數據,對研究對象的數量特征作出具有一定可靠程度的估計和推斷,以達到認識總體的目的的一種統計方法。統計推斷的過程樣本總體樣本統計量例如:樣本均值、比例、方差總體均值、比例、方差6.1抽樣與抽樣分布6.1.2抽樣推斷中的基本概念總體與樣本(見第一章)樣本量與樣本個數總體參數與樣本統計量重復抽樣與不重復抽樣這些概念是統計學特有的,體現了統計學的基本思想與方法。4-6(一)總體和樣本(參見第1章)1.總體:又稱全及總體、母體,指所要研究對象的全體,由許多客觀存在的具有某種共同性質的單位構成。總體單位數用N

表示。2.樣本:又稱子樣,來自總體,是從總體中按隨機原則抽選出來的部分,由抽選的單位構成。樣本單位數用

n

表示。3.總體是唯一的、確定的,而樣本是不確定的、可變的、隨機的。4-7(二)樣本容量與樣本個數樣本容量:一個樣本中所包含的單位數,用n表示。樣本個數:又稱樣本可能數目,指從一個總體中所可能抽取的樣本的個數。對于有限總體,樣本個數可以計算出來。樣本個數的多少與抽樣方法有關。(這個概念只是對有限總體有意義,對無限總體沒有意義!)8(三)總體參數和樣本統計量總體參數:反映總體數量特征的指標。其數值是唯一的、確定的。樣本統計量:根據樣本分布計算的指標。是隨機變量。平均數標準差、方差成數參數、2P統計量s、s2p總體樣本9(四)重復抽樣與不重復抽樣重置抽樣與不重置抽樣例如從A、B、C、D、E五個字母中隨機抽取兩個作為樣本。N=5,n=2重復抽樣:樣本總個數=不重復抽樣:不考慮順序:樣本總個數注:不重復抽樣的樣本量受總體大小限制,即n不能超過N,最多等于N;但重復抽樣的樣本量不受總體大小的影響。106.1.3抽樣分布抽樣分布:主要求出樣本平均數的期望與方差包括以下內容樣本平均數的分布樣本成數的分布抽樣分布

設從總體中抽出的樣本為X1,X2,…,Xn,由于是重復抽樣,每個Xi,(i=1,2,…,n)都是從總體中隨機抽出的,都是與總體同分布的隨機變量,并且是相互獨立的。我們設總體的平均數為,方差為2,則樣本平均數的期望值與方差分別是:一、重置抽樣條件下樣本平均數的抽樣分布12(一)樣本平均數的分布(P108-109)某班組5個工人的日工資為34、38、42、46、50元。=422=32現用重置抽樣的方法從5人中隨機抽2個構成樣本。共有52=25個樣本。如右圖。13驗證了以下兩個結論:抽樣平均數的標準差反映所有的樣本平均數與總體平均數的平均誤差,稱為抽樣平均誤差,用表示。(一)樣本平均數的分布14(一)樣本平均數的分布由概率論知,如果總體是正態分布的,則樣本平均數的抽樣分布是如下正態分布這是一個非常重要的結論,有廣泛的應用。15(二)樣本成數的分布(P111-112)總體成數P是指具有某種特征的單位在總體中的比重。成數是一個特殊平均數,設總體單位總數目是N,總體中有該特征的單位數是N1。設x是0、1變量(總體單位有該特征,則x取1,否則取0),則有:現從總體中抽出n個單位,如果其中有相應特征的單位數是n1,則樣本成數是:p也是一個隨機變量,利用樣本平均數的分布性質結論,即有:16二、不重置抽樣條件下樣本均值和成數的抽樣分布樣本均值的分布性質:樣本成數的分布性質17抽樣分布總結樣本平均數的分布樣本成數的分布重復抽樣不重復抽樣(三)抽樣分布定理1.正態分布再生定理113總體是正態分布,抽取容量n的樣本,樣本平均數也服從正態分布。樣本平均數是更加集中的分布在總體平均數的周圍。2.中心極限定理114大樣本的平均數近似服從正態分布。6.2參數估計6.2.1估計量與估計值用樣本統計量估計總體參數,用來估計總體參數的統計量叫做估計量,估計量的取值稱為估計值。參數估計的方法估計方法點估計區間估計二、點估計

點估計的定義

點估計就是根據總體參數與樣本統計量之間的內在聯系,直接以樣本統計量作為相應總體參數的估計量。在統計中經常使用的點估計量有:【例6-1】對某企業的產品進行抽樣檢驗,設抽出100件產品,其中不合格產品5件,試估計該企業產品的合格率是多少?

我們可以通過樣本的合格率來估計企業產品的合格率。樣本合格率p=95/100=95%,我們估計該企業產品的合格率是95%。二、點估計所謂區間估計,就是估計總體參數的區間范圍,并要求給出區間估計成立的概率值。設和是兩個統計量(<),分別作為總體參數區間估計的下限與上限,則要求:

P()=1-α式中α(0<α<1)是區間估計的顯著性水平,其取值大小由實際問題確定,經常取1%、5%和10%;1-α稱為置信度。(二)區間估計1、總體未知參數落在區間內的概率2、表示為(1-為顯著性水平,是總體參數未在區間內的概率3、常用的置信水平值有99%,95%,90%相應的為0.01,0.05,0.10置信水平(置信度)區間與置信水平均值的抽樣分布(1-)%區間包含了

%的區間未包含1-aa/2a/2(二)區間估計參數估計應滿足以下兩個要求:一是估計的精確度要求,二是可靠性要求。所謂精確度就是估計誤差的最大范圍,即誤差的最大值,可通過極限誤差來反映;所謂可靠性是指估計結果正確的概率大小。置信區間越小,精確性越高,但是可靠性下降;置信區間越大,可靠性越大,但是精確性降低。因此,精確性和可靠性是一對矛盾。

無偏性用表示總體的待估計參數,是估計的樣本統計量,我們說是的無偏估計,指的是滿足:6.2.3評價估計量的標準

無偏性無偏性要求用來估計總體參數的樣本統計量,其分布是以總體參數真值為中心的。在一次具體的抽樣估計中,估計量或者大于總體參數,或者小于總體參數;但是,在進行重復抽樣估計的過程中,所有估計量的平均數應該等于待估的總體參數。這說明,無偏估計要求估計量沒有系統偏差。估計量的優良性準則——(無偏性)P(X)XCA無偏有偏無偏性:估計量的數學期望等于被估計的總體參數這就是為什么樣本方差用n-1的原因!

一致性一致性是指隨著樣本容量不斷增大,樣本統計量接近總體參數的可能性就越來越大,或者,對于任意給定的偏差控制水平,兩者間偏差高于此控制水平的可能性越來越小,接近于0。

一致性用公式表示就是:

公式中,ε為一任意小的數。上式說明,當n充分大時,與之間的偏差,可以有很大的把握被控制在任意給定的范圍之內。當n趨于無窮大時,估計量依概率收斂于。估計量的優良性準則——(一致性)一致性:隨著樣本容量的增大,估計量越來越接近被估計的總體參數AB較小的樣本容量較大的樣本容量P(X)X

有效性

和都是總體參數的無偏估計量,如果,則說明估計量比更有效。

有效性設總體的方差是,我們有:顯然,樣本平均數的方差比樣本中某個單位的標志值的方差要小,只是其方差的1/n,所以作為估計量,樣本平均數更加有效。6.3.1區間估計基本原理6.3總體均值的區間估計所謂抽樣極限誤差范圍是指變動的樣本估計值與確定的總體參數之間離差的可能范圍,它可以用樣本估計值與總體參數的最大絕對誤差限來表示。6.3.2正態分布且總體方差已知;或非正態分布方差未知,且大樣本2

已知2未知均值方差成數區間

估計平均數的區間估計對總體平均數區間估計時,使用下面的式子

(式中Δ是極限誤差)有兩種模式:1、根據置信度1-α,求出極限誤差Δ,并指出總體平均數的估計區間。2、給定極限誤差,求置信度(略)。當σ已知時,根據相關的抽樣分布定理,服從標準正態分布N(0,1)。查正態分布概率表,

可得(一般記為),則,根據重復抽樣與不重復抽樣的求法的不同,進一步可得總體平均數的估計區間:重復抽樣時,區間的上下限為:不重復抽樣時,區間的上下限為:均值區間估計—第1種模式(求置信區間)正態分布且總體方差已知P.119【例6.3】這一類計算題的基本做法:先計算出樣本指標,然后根據所給條件(重復抽樣或不重復抽樣)進行抽樣平均誤差的計算,抽樣極限誤差的計算,最后根據樣本指標和極限誤差進行期間估計。大樣本,一般總體在大樣本條件下,根據中心極限定理,樣本平均數近似服從正態分布,仍可按上述方法進行估計。如果總體方差已知用總體方差,如果總體方差未知用樣本方差代替總體方差,樣本平均數仍然近似服從正態分布。

大樣本,一般總體(方差已知)【例】某地區的電視臺委托調查公司估計地區內居民平均每日的看電視時間。調查公司隨機抽取了100名居民進行調查,樣本數據顯示平均每人每天看電視時間是4個小時。如果已知總體的標準差σ=1.5小時。試求:(1)該地區內居民每天看電視的平均時間的置信區間(置信度是95%);大樣本,一般總體(方差未知)總體分布未知且總體方差未知,大樣本條件下,由中心極限定理知,近似服從正態分布,此處用樣本方差s代替總體方差。P120,例6.4總體方差未知(2未知),小樣本

當總體服從正態分布但方差未知時,可用樣本的標準差s代替總體標準差。這時統計量是:t服從的分布不是標準正態分布,而是自由度為n-1的t-分布(當n很大時,近似正態分布)。因此,總體均值的區間估計是:總體方差未知(2未知)

:重復抽樣不重復抽樣

4-48總體均值區間估計總結總體平均數估計區間的上下限總體方差已知N(0,1)重復抽樣不重復抽樣總體方差未知t(n-1)大樣本時近似服從N(0,1)重復抽樣不重復抽樣

如果是正態總體4-49

如果不是正態總體,或分布未知總體方差已知且是大樣本總體方差未知且是大樣本

此時不考慮小樣本情況因此,大樣本情況下,直接用標準正態分布求置信區間即可。成數指標是一個特殊的平均數。所以,類似于總體平均數的區間估計,總體成數的區間估計是:式中的成數抽樣平均誤差在重復抽樣條件下是:在不重復抽樣的條件下是:在實踐中,由于總體成數常常未知,這時,抽樣平均誤差公式中的總體成數用樣本成數代替。6.4總體成數的區間估計【例6-3】某工廠要估計一批總數5000件的產品的廢品率,于是采用不重復性抽樣方法,隨機抽出400件產品進行檢測,發現有32件廢品。試給出該批產品的廢品率的區間估計(置信度是90%)。

總體平均數的區間估計第一,樣本抽取后,用簡單算術平均或加權平均的方法計算樣本平均數。第二,搜集總體數量標志方差的經驗數據或計算樣本數量標志方差s2。第三,計算抽樣平均數的平均誤差:第四,根據概率F(Z)確定Z,計算平均數的極限誤差。第五,總體平均數的置信區間。區間估計小結(重置抽樣)(不重置抽樣)第一,樣本抽取后,計算樣本成數。第二,用樣本是非標志方差p(1-p)或經驗數據代替總體是非標志方差P(1-P)。第三,計算抽樣成數的平均誤差:第四,根據概率F(Z)確定Z,計算平均數的極限誤差:第五,總體平均數P的置信區間。

總體成數的區間估計(重置抽樣)(不重置抽樣)練習某地有八家銀行,從它們所有的全體職工中隨機抽取600人進行調查,得知其中的486人在銀行里有個人儲蓄存款,存款金額平均每人3400元,標準差500元,試以95.45%的可靠性推斷:(1-α=95.45%,則z=2)1)全體職工中有儲蓄存款者所占比率的區間范圍2)平均每人存款金額的區間范圍(1)已知:n=600,p=81%,又1-α=95.45%,則z=2所以故全體職工中有儲蓄存款者所占比率的區間范圍為81%±0.032%(2)平均每人存款金額的區間范圍為6.5樣本容量的確定在前面我們已經知道,極限誤差、概率度與抽樣平均誤差三者間的數量關系是:。當抽樣平均誤差保持不變時,極限誤差與概率度兩者間關系是:Δ增大,z也增大了,Δ減小,z也減小了。樣本容量的確定因此,抽樣估計的精度與可靠性之間存在矛盾:要提高精度(Δ減小),需以犧牲概率度(z減小)為代價;要提高概率度(z增大),又要以犧牲估計精度(Δ增大)為代價。在不變的情況下,這對矛盾是不可調和的;但是,降低抽樣平均誤差后,就可以同時提高估計的精度與概率度。樣本容量的確定例如:通過增加樣本容量n來達到降低抽樣平均誤差目標。這時應該考慮,樣本容量n究竟取多大合適?這就是樣本容量的確定問題。6.5.1估計總體均值時樣本容量的確定總體方差已知,重復抽樣(重點)這時有:上式兩邊平方整理后可得:

這就是在給定極限誤差、概率度要求下,至少應抽取的樣本容量。估計總體均值時樣本容量的確定總體方差已知,不重復抽樣這時有:上式兩邊平方整理后可得:

6.5.2估計總體成數時樣本容量的確定重復抽樣(重點)不重復抽樣4-62確定樣本容量在設計抽樣時,先確定允許的誤差范圍和必要的概率保證程度,然后根據歷史資料或試點資料確定總體的標準差,最后來確定樣本容量。估計總體均值時樣本容量的確定重復抽樣不重復抽樣估計成數時樣本容量的確定重復抽樣不重復抽樣6.5.3應注意的問題

計算樣本容量時,一般總體的方差與成數都是未知的,可用有關資料替代:一是用歷史資料已有的方差與成數代替;二是在進行正式抽樣調查前進行幾次試驗性調查,用試驗中方差的最大值代替總體方差;三是成數方差在完全缺乏資料的情況下,就用成數方差的最大值0.25代替。三、應注意的問題

如果進行一次抽樣調查,同時估計總體

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論