第八章_參數估計_第1頁
第八章_參數估計_第2頁
第八章_參數估計_第3頁
第八章_參數估計_第4頁
第八章_參數估計_第5頁
已閱讀5頁,還剩51頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第八章 參數估計 參數估計是統計推斷的基本問題之一。對于總體X,當知道其分布類型,但其中的參數 (有時是多個參數 1 1, 2 2 , , , k k )未知時,還需要確定參數。因為只有當參數 確定后,才能利用概率密度函數求出其概率。這就是本章要討論的參數估計問題:設總體X的概率密度函數f(x; )分布類型已知,但其中 未知,運用樣本X X1 1, X X2 2 , , , X Xn n所提供的信息,對未知參數 作出估計,這類統計問題就稱為參數估計問題 對未知參數進行估計有兩種方式,一種是通過樣本X1, X2 , , Xn對被估計的參數合理地給出一個估計量 (表示的估計量(值)這是所謂點估計問

2、題。另一種是通過樣本尋求一個區間,使之有一定把握包含被估計的參數 ,這是所謂區間估計問題8.1 估計量的優劣標準8.2 獲得估計量的方法點估計8.3 區間估計8.1 估計量的優劣標準 對于同一個參數,用不同的估計方法求出的估計量可能不同,那么采用哪一個估計量好呢?這就涉及到用什么樣的標準來評價估計量。常用的標準有三個,即無偏性,有效性,一致性。 (一一) 一致估計一致估計 定義8.1 這里是的估計量,即 若則是的一致估計量。1n1nP P (X ,X )(X ,X ) , n n,0lim ( P)=1 如果當時, 依概率收斂于即任給,則稱 為參數 的一致估計。 一致性是對于極限性質而言的,它

3、只在樣本容量較大時才起作用。 由于未知參數的估計量是一個隨機變量,每次抽樣后得到的的估計值不一定與真值相吻合,一般有誤差,誤差分為系統性誤差和隨機性兩種,系統性誤差指的是該理論不是它所要描述的現象的正確理論,理論和經驗之間的誤差在本質上無法彌合,而隨機性誤差指的是該理論的所要描述的現象的正確理論,理論和經驗之間的不盡一致,是由于無法控制的隨機因素干擾所致.(二)無偏估計(二)無偏估計E 稱為以 作為 的估計的系統誤差1(,),.nXXE設為 的估計量 若則稱 是 的無偏估計量無偏估計的實際意義就是無系統誤差(即系統誤差等于零)定義8.2在經濟科學技術中,由定義可知,無偏性的驗證關鍵在于求出未知

4、參數的估計量 的期望,例1 從總體中 取一樣本( X1, ,Xn ),E = ,D = 2 , 試證樣本平均數 分別是及2的無偏估計。2XS及樣本方差證 11 ,niiXXn2211()1niiSXXn11()()niiE XEXn11niiEXn1nn樣本均值是的無偏估計。()E X2211()1niiESEXXn2111niiEXXn2211()1niiEXn Xn2211111nniiiiDXDXDXnnn222111nnnnn221111niinE XE Xnn21=DXnS2是2的無偏估計若設 22011()niiSXXn22201111() 1niinnSXXSnnn2222011

5、1()nnnESESESnnn220ES S02 不是2的無偏估計。則故注:由于用S02 估計方差2時,有系統誤差,所以,常用樣本方差S2估計總體方差2 。 用n/n-1乘S02 ,所得到的估計量就是無偏的了,稱S2為修正的樣本方差,稱S02 為未修正的樣本方差。無偏性的要求正是引進修正樣本方差的原因。 要注意,并非一切有偏估計都可修正為無偏的如果從總體中隨機取出兩個相互獨立的樣本( X11 , ,X1n1 )及(X21 , ,X2n2),則可以證明分別是總體中和2的無偏估計量。其中,12i ,221122211221212111 2nSnSXn Xn XSnnnn221111 ()1nnii

6、 jii jijjiXXSXXnn 對總體的某一參數的無偏估計量往往不止一個,而且無偏性僅僅表明 所有可能取的值按概率平均等于,可能它取的值大部分與相差很大。為保證 的取值能集中與附近,自然要求 的方差越小越好。(三)有效估計定義8.3 設 和 都是的無偏估計,若樣本容量為 n , 的方差小于 的方差,則稱 是比 有效的估計量。如果在的一切無偏估計量中, 的方差達到最小,則 稱為的有效估計量。即11212(,),1, 2,.iinXXiDD設分別是參數 的兩個無偏估計 若則稱 比有效由定義,要證明兩個無偏估計哪一個更有效,只須證明它們的方差,看哪一個方差較小。例2 比較總體期望值的兩個無偏估計

7、的有效性。11niiXXn11niiiniia XXa10niia解:()E X21DXn11Xniiiniia EEXa利用不等式21niina222112211nniiiinniiiia DXaDXaa21DXn2 ()0ijaa222ijija aaa22112nniiijiiijaaa a2221niijiijaaa(+ )21211niiniiana222112211nniiiinniiiia DXaDXaa21DXn21211niiniiana2221211niiniiaDXDXnnaXX故 比有效8.2 獲得估計量的方法點估計 點估計就是以樣本的某一函數值作為總體中未知參數的估計

8、值的一種估計方法若(x1, x2 ,xn)是樣本的一個觀測值,以1f( ,),nxx作為 的估計值 由于f(x1, x2 ,xn) 是實數域上的一個點,用 它來估計 , 故稱這種估計為點估計點估計。 點估計的經典方法是矩估計法與最最(極)大極)大似然估計法。似然估計法。( (一)矩估計法(簡稱一)矩估計法(簡稱“矩法矩法”)矩法是求估計量的最古老的方法。具體的做法是:以樣本矩作為相應的總體矩的估計,以樣本矩的函數作為相應的總體矩的同一函數的估計。常用的是用樣本平均數 估計總體期望值 。因此,矩估計法的基本思想就是“替換”的思想因此總體的期望是它的一階原點矩,方差是其二階中心矩()(1,2,)k

9、E Xk ()(1,2,)kE XEXk矩是隨機變量的數字特征,它有兩種:原點矩和中心矩,對總體X而言, 稱為總體X的k階原點矩.它是隨機變量X的k次冪的數學期望稱為總體X的k階中心矩.它是隨機變量離差的k次冪的數學期望11(1,2,)nkkiiAXkn11()(1,2,)nkkiiBXXkn樣本矩可類似定義,對統計量而言,樣本原點矩是指當k =1時,就是樣本均值當k=2時,就是二階樣本中心矩.樣本中心矩是指例1 某燈泡廠某天生產了一大批燈泡,從中抽取了10個進行壽命實驗,得數據如下(單位:小時)問該天生產的燈泡平均壽命是多少? 矩法比較直觀,求估計量有時也比較直接,但它產生的估計量往往不夠理

10、想。1050110010801120120012501040113013001200解 計算出x1147,以此作為總體期望值的估計。(二)最大似然估計法(二)最大似然估計法1、最大似然思想、最大似然思想 有甲乙兩個射手,甲的命中率為0.9,乙的命中率為0.2,現在他們中的一個向目標射擊了一發,結果命中了,估計是誰射擊的? 從這個例子,我們悟出一個基本想法:如果在一次試驗中事件A發生了,那么試驗的條件應最有利于A的出現,換言之,試驗的條件應使A發生的概率最大。這就是最大似然估計法的直觀想法。 最大似然估計法是要選取這樣的 ,當它作為 的估計值時,使觀察結果出現的可能性最大。對于連續型的隨機變量就

11、是估計概率密度中的。對于離散型的隨機變量就是估計概率函數中的參數;設為連續性隨機變量,它的分布函數是F(x;),概率密度是 ,其中是未知參數,可以是一個值,也可以是一個向量。由于樣本的獨立性,則樣本X1, X2 ,,Xn 的聯合概率密度聯合概率密度是對每一個取定的樣本值, x1,xn是常數,L是參數 的函數,稱稱L L為樣本的似然函數為樣本的似然函數(如果 是一個向量,則L 是多元函數); x1,;1,;nniiL xxx設為離散型隨機變量,有概率函數 則似然函數似然函數;iiPxp x11,;nniiLxxpx定義8.4 如果 在 處達到最大值,即存在 則稱 是的最大似然估計。如何把的最大似

12、然估計 求出來,由高等數學知識知道,L()的最大值常用求導方法求得,由于 L與L同時達到最大值,故只需求 L的最大值點即可,一般通過解方程來得到參數的最大似然估計1,;nL xx12=,)( )max ( )nx xxLL (,使ln ( )0dLd求最大似然估計的步驟求最大似然估計的步驟(1) 做似然函數做似然函數11( )( ,; )( ; )nniiLL xxx(2) 做對數似然函數做對數似然函數11ln ( )( ,; )ln ( ; )nniiLL xxx(3) 求導數,列似然方程求導數,列似然方程ln ( )0dLd若該方程有解,則其解就是的最大似然估計。(4) 解似然方程解似然方

13、程如果是一個向量,即 12,m 則,解似然方程組:1lnL0 lnL0m1,m1,m其解就分別是的最大似然估計1 0; 00 xexx其他例2 已知(x1, x2 ,xn)為 的一組樣本觀察值,求的最大似然估計。解: 似然函數1112;111,niiixnxnniL x xxee 解似然方程 x 就是 的最大似然估計。1112;111,niiixnxnniL x xxee11lnL=lnniinx21lnL1niidnxd 2110niinx11niixxn取對數得求導數得得例3 某電子管的使用壽命(從開始使用到初次失效為止)服從指數分布(概率密度見例2),今抽取一組樣本,其具體數據如下;問如

14、何估計 ?162950681001301402702803404104505206201902108001100解 根據例2的結果,參數用樣本平均數估計1572331818為的估計值。1111629800 100018niixn318(x1, x2 ,xn)為的一組樣本觀察值,用最大似然估計法估計,2 2 的值。解2222112ixniLe2211()222112niinnxe 222111lnL= lnln()222niinnx例4 已知服從正態分布N(N(,2 2 ), ), 22241lnL1()22niinx 21ln L1niix222111lnL= lnln()222niinnx2

15、12241101()022niiniixnX解似然方程組212241101()022niiniixnX解似然方程組11niixxn2221111()()nniiiixxxnn得P164 2 前一節介紹的參數的點估計是用樣本觀測值計算總體參數的估計值,它是參數的真值的近似值。為了了解估計值的精確度,希望對的取值估計出一個范圍,為了了解其可靠性,希望知道這個范圍包含參數的真值的可靠程度,這樣的范圍通常用區間的形式給出,這就是本節討論的參數的區間估計8.3 區間估計區間估計一、概念一、概念 定義:定義: 設總體X的分布函數F(x;)含有未知參數,對于給定值(0 1),若存在兩個統計量 則稱隨機區間隨

16、機區間 為的置信度置信度為1的的置信置信區間區間注:F(x;)也可換成概率密度或分布律。1121(,)(,)nnXXXX與12()1*P 12 ( ,) 使是事先給定的一個小正數,它是指參數估計不準的概率,一般常給 =5%或1%未知參數的區間估計,應掌握兩類題型一類是推導正態總體中未知參數區間估計另一類是給出樣本值,求單個正態總體的期望和方差的置信區間求置信區間的一般步驟是:1、明確問題 要求的是什么參數的置信區間,置信度有多大?2、構造含未知參數且有確定分布的隨機變量3、根據隨機變量的分布,對給定的置信度1-定出4、利用不等式變形,求出的置信區間u如何理解置信區間的置信度1 ?在所給的一個樣

17、本值之下,假設得到了一個確定的常數區間a,b,如果獨立地再取一個樣本,又會得到另一個常數區間,如果獨立地取100個樣本,那么會得到100個這種常數區間,為方便計,設置信度1=0.90=90%,其含義:從統計意義看,這100個常數區間中約有90%包含 =EX ,只有約10%的區間不包含 =EX,既然絕大多數區間都包含 =EX ,那么就可認為區間a,b包含 =EX ,當然也可能遇上正好這個區間不包含 =EX的偶然情況,這時我們就作了錯誤的判斷,不過出現這種情況的可能性很小,僅有約10%一 總體期望E 的區間估計1、總體分布未知,方差已知、總體分布未知,方差已知,估計期望,估計期望2()1DPE 1

18、1 niiXXn利用切貝謝夫不等式進行估計從總體中抽取樣本(X1, X2 ,,Xn ),令則 E,/XEDXDn2()1DP XEn 20 P()()DXEP XEn利用切貝謝夫不等式,有若要求P(X E )95%,如果D 0,則取=20D /n,得到由上式看出,有95%以上的把握保證20 DXEn2020DDXEXnn P()1DDXEXnn 即因此,對于已知方差 D 的一般總體,估計E的置信區間按如下確定上式左邊不是隨機變量落在某一確定區間內的概率,而是常數E 被隨機區間蓋住的可能性,即平均每100次抽樣(每次抽n個樣品)計算得到的100個區間中,至少有(1-)100個區間包含E例1 某燈

19、泡廠某天生產了一大批燈泡,從中抽取了10個進行壽命實驗,得數據如下(單位:小時),如果知道該天生產的燈泡壽命的方差是8,試找出燈泡平均壽命的置信區間( = 0.05).1050110010801120120012501040113013001200解:用表示該天燈泡的壽命, 已知D = 8,X=1147, D / n =4于是,E 的置信區間為(1147-4,1147+4)即(1143,1151)2、總體分布為正態分布、總體分布為正態分布N( , 2 ), 2已知,估計已知,估計211(), 1. nnXXNxx設, , 是來自正態總體,的樣本 給定,由觀測值,求出 的置信區間X U(0,1)

20、Nn即()1P Uu ()1/XPun ()1(8.6)P XuXunn 對于給定的 ,查附表3可以確定 ,使因此,的置信度為1的置信區間為(,)XuXunnu例2 若燈泡壽命服從正態分布N( ,8),從中抽取了10個進行壽命實驗,得數據如下(單位:小時)試估計平均壽命所在范圍( =0.05).1050110010801120120012501040113013001200解:已知 =0.05, 所以所以 n=10, =2 2而 1147x 計算出1.96u根據樣本值計算1.961147 1.753 1145.25 xun2 21147-101.961147 1.753 1148.75 xun

21、2 21147+10的置信度為1- 0.95的置信區間是 (1145.25,1148.75)根據(8,6)式得例例3 3 已知某煉鐵廠的鐵水中含碳量在正常情況下服從正態分布,其方差2 = 0.1082 .現在測定了9爐鐵水,其平均含碳量為4.484.按此資料計算該廠鐵水平均含碳量的置信區間,并要求有95% 的可靠性。解:設該廠鐵水平均含碳量為已知 0.05,查表確定1.96u根據樣本值計算4.555xun4.413xun的置信系數為1- 0.95的置信區間是 (4.413,4.555)3、一般總體大樣本下E 的區間估計根據中心極限定理,當樣本容量相當大時,X漸近地服從正態分布,故大樣本情況下,對于一般總體仍然可以用(8.6)式對E 進行估計 4、正態總體方差、正態總體方差 2未知,期望未知,期望的區間估計的區間估計因此,的1置信區間為對于給定的,查附表4,可確定 (1)/XTt nSn選取估計量() P Tt令()P( ) 1n XtS ( ) P 1(8.8)SSXtXtnn 設

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論