統計量與參數估計_第1頁
統計量與參數估計_第2頁
統計量與參數估計_第3頁
統計量與參數估計_第4頁
統計量與參數估計_第5頁
已閱讀5頁,還剩2頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第十章 統計量與參數估計§10.1 樣本與統計量 一. 總體與樣本 例1 欲了解一批燈泡的壽命X (小時)的分布情況,只能抽取n 個作破壞性試驗,根據試驗結果來推斷X 的分布。 1總體與個體 研究對象的全體稱為總體。例1中,我們關心的是全體燈泡壽命的分布情況,即壽命X 的所有可能的取值及其概率分布。因此壽命X 是連續的隨機變量。一般地把我們關心的隨機變量X 稱為總體。組成總體的每個單元稱為個體。例1中,我們關心的是燈泡的壽命。所以個體也可理解為總體X 的取值。 2簡單隨機抽樣為了使抽樣具有充分的代表性,所以要求: (1)每個個體被抽到的機會均等; (2)每次抽取是獨立的(共抽取n 次

2、)。這樣的抽樣叫做簡單隨機抽樣。通常的抽樣都是無放回的,當總體很大時,可以滿足獨立性。 3樣本 在總體中抽取n 個個體,稱為總體的一個樣本,記為 ( X1 , X2 , , Xn ) ,其中每次抽樣Xi ( i = 1 , 2 , , n )也都是隨機變量(解釋),共n 個隨機變量,加上括號,表示樣本是一個整體。 4樣本的容量 抽取的個體數n ,稱為樣本的容量。5獨立同分布 每次抽取的Xi 來自總體,應該與總體X有相同的分布(概率密度相同),所以說樣本是一組具有獨立同分布的隨機變量。 6樣本觀察值(樣本值) 樣本的測試結果記為 ( x1 , x2 , , xn ) ,是一組數據,在容易產生誤會

3、時,大小寫要分清,尤其在作理論分析時,一般都取大寫,作為隨機變量處理。二統計量 1三個重要統計量 (1)樣本均值: (2)樣本方差: (3)樣本標準差(又稱為樣本均方差 ): 其中作為均值可以反映總體X的均值(不是等同),S 2 是數據與均值偏離值平方的平均,體現樣本的離散程度,因而可以反映總體X的方差。和s(計算值)可以利用函數計算器的統計功能快速得到(可安排多媒體課件演示)。 2統計量的概念統計量是含有樣本X1 , X2 , , Xn 的一個數學表達式,并且式中不含未知參數,因而可以在得到樣本值后立即算出它的數值來。在抽樣之前,統計量的值無法確定,抽樣測試之后,可以觀察到它的取值,因此統計

4、量是隨機變量,是由樣本派生出來的隨機變量。三抽樣分布統計量既然是隨機變量,當然有它的概率分布,稱為抽樣分布。以下僅給出結論,結論都對正態總體而言。1樣本均值的分布(1)若總體,則(獨立同分布),于是作為線性函數 (2)特別地,標準化以后,得。 2t 分布當總體標準差未知時,U 不再是統計量,這時可用樣本標準差S 代替,但不再是正態分布,而是一種新的分布叫做服從于自由度的t 分布。它的密度曲線與正態曲線相類似 (見圖8)。 3分布 為了將樣本方差S 2和總體相比較、聯系。構造出,叫做服從于自由度為的分布,也是一種新的分布。其密度曲線 (見圖9)在原點右側,這是因為統計量是不會出現負值的。 、是繼

5、、后第二輪復合而成的統計量,可以更有利于實際的應用。四臨界值1設UN (0,1) ,有關U 的概率可查表。如果反過來,已知概率,求使或,倒查表得到的稱為標準正態分布的右側臨界值,意為右側的概率為,又叫分位點,記為(見圖10)。若求使,則查表得到的是,稱為雙側臨界值 (見圖11),意為對稱兩側的概率之和為,它們的概率意義分別是和。比如,。2t 分布和分布的右側臨界值記為和。括號內的n 是自由度,不要與樣本容量相混淆,如,的概率意義為 (見圖12、13)t 分布表和分布表已直接編為臨界值表,不必“倒查表”。正態分布和t 分布的左側臨界值是對稱值 和(左側概率為),不必另行查表。而分布無對稱性,左側

6、臨界值是(右側概率是,左側概率當然是)(見圖14),需另行查表。分布的雙側臨界值(見圖15)是(左)和(右)。例2 求滿足以下概率式的臨界值并給出對應的記號(1),則;(2),則;(3),則;(4),則;(5),則。例3 對于查表得到的和,給出它們的概率意義。解 ,。§10.2 點估計一點估計的概念總體X 的分布類型往往是已知的,如,但它的參數不知道,要通過樣本來估計,稱為點估計。二樣本數字特征法用樣本的均值、方差來估計總體的均值、方差是很自然的,即,這里在字母上加一個“帽子”是為了表明這僅僅是估計值而非準確值。這樣的估計方法稱為樣本數字特征法。 例1 某果園有1000株果樹,在采摘

7、前欲估計果樹的產量,隨機抽選了10株,產量(公斤)分別為 :161, 68, 45, 102, 38, 87, 100, 92, 76, 90假設果樹的產量服從正態分布,試求果樹產量的均值與標準差的估計值,并估計一株果樹產量超過100公斤的概率。解 利用計算器的統計功能,可計算得到產量均值公斤,標準差公斤。于是即一株果樹產量超過100公斤的概率為0.34 。三估計量及其評選標準用來估計未知參數的統計量(如、)稱為估計量。一般的提法是:設是總體X 的未知參數,找一個統計量(表達式)來估計,即以的觀測值作為的估計值,則稱為的估計量。這里是未知的但客觀存在的固定常數,不是隨機變量,而是隨樣本值而變動

8、的,是隨機變量。估計量不是唯一的,可以通過多種途徑和方法去尋找、構造,如矩估計法、最大似然估計法等,應該制定一套評判標準來評價它們的優劣。(1)無偏性設是的估計值,若,則稱是的無偏估計量。其統計意義是:是隨機變量,它的波動中心(均值)等于,即經過多次抽樣,的觀察值將圍繞著變動,沒有“系統”誤差,當然是較好的。和都分別是總體均值,總體方差的無偏估計,其中顯然,而的推導復雜,S 2 的表達式中,分母是而不是,正是為了滿足無偏性。(2)有效性對于多個無偏估計量,方差小的波動小,穩定性好。即方差越小越好,設(都是無偏估計),若,則稱比有效。是的所有無偏估計中最有效的。§10.3 區間估計一置

9、信度與置信區間 有了點估計,還要進一步作誤差估計,數理統計中的誤差估計必然具有概率特征,即要用概率去描述,要與概率相聯系。設是未知參數,希望確定一個區間( a , b ) ,使它包含的把握很大,寫成概率式,即 。取時,把握是0.95%。往往事先取定,稱為置信度。( a , b ) 稱為參數的置信區間,稱為置信下限,稱為置信上限。二正態總體的區間估計直接求置信區間難度較大,實際求解時,往往從已知的統計量入手。比如統計量分布已知,如果總體標準差已知,那么關于U 的不等式變形可得到關于的不等式,所以只需求A , B ,使即可。滿足此式的區間很多,其中“區間居中”是效果最好的,所謂“區間居中”是指區間

10、左側和右側的概率相等,都等于。因為正態分布有對稱性,區間居中的概率公式是,于是可確定,將不等式變形可得(1)正態總體方差已知時,均值的置信區間按上面的公式,置信區間是注意:已知時,應借助于U 統計量,要查正態分布表;置信區間有兩個端點,所以要找雙側臨界值(下標帶有) 例2 設總體,測得n = 4 的樣本觀測值為:12.6,13.4,12.8,13.2,求的0.95置信區間。解 ,已知,采用U 統計量,查表得,計算,所以置信限為,置信區間為( 12.706 , 13.294 )。 (2)正態總體方差未知時,均值的置信區間未知,以S 代替,得到t 統計量,要查t 分布表;置信區間公式類似為例3 例

11、2中設, 未知,求的置信區間(取)。解 計算得, 。未知,采用t 統計量,查表得,所以置信限為置信區間為( 12.419 , 13.581 )。例3的信息量比例2少(未知),在同樣的置信度下置信區間比較寬,精度比較小是很自然的。 (3)正態總體方差及標準差的置信區間統計量就是為提取的信息而設計的,所以借助于統計量,由概率式及區間居中原理。可得,利用不等式變形,得到的置信區間是。的置信區間,只需將端點開平方即可 例4 設零件長度,抽取n = 16件零件測量,經計算得, S 2 = 0.00507,求零件長度與標準差的置信區間()。解 未知,求的置信區間應采用統計量,查表得t0.025(15)=2.1315,置信限為均值的置信區間為( 12.049 , 12.125 )。求的置信區間,采用統計量,查表得,的置信區間為 開方后即標準差的置信區間:( 0.0526 , 0.1102 ) 三置信

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論