參數估計與假設檢驗課件_第1頁
參數估計與假設檢驗課件_第2頁
參數估計與假設檢驗課件_第3頁
參數估計與假設檢驗課件_第4頁
參數估計與假設檢驗課件_第5頁
已閱讀5頁,還剩117頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、2021-9-25參數估計與假設檢驗課件1參數估計與假設檢驗參數估計與假設檢驗Parameter Estimation &Hypothesis Testing2021-9-25參數估計與假設檢驗課件2第五章第五章 參數估計與假設檢驗參數估計與假設檢驗 5.1 參數估計參數估計 5.2 假設檢驗假設檢驗 5.3 非參數檢驗非參數檢驗 2021-9-25參數估計與假設檢驗課件3什么是參數估計?什么是參數估計?參數是刻畫總體某方面概率特性的數量參數是刻畫總體某方面概率特性的數量. .當此數量未知時當此數量未知時, ,從總體抽出一個樣本,從總體抽出一個樣本,用某種方法對這個未知參數進行估計就用

2、某種方法對這個未知參數進行估計就是參數估計是參數估計. .例如,例如,X N ( , 2), 點估計點估計區間估計區間估計若若 , 2未知未知, 通過構造樣本的函數通過構造樣本的函數, 給出給出它們的估計值或取值范圍就是參數估計它們的估計值或取值范圍就是參數估計的內容的內容.2021-9-25參數估計與假設檢驗課件4參數估計在統計方法中的地位參數估計在統計方法中的地位參數估計參數估計假設檢驗假設檢驗v統計方法描述統計描述統計推斷統計推斷統計2021-9-25參數估計與假設檢驗課件5參數估計的類型參數估計的類型點估計點估計 估計未知參數的值估計未知參數的值區間估計區間估計 估計未知參數的取值范圍

3、,估計未知參數的取值范圍, 并使此范圍包含未知參數并使此范圍包含未知參數 真值的概率為給定的值真值的概率為給定的值.2021-9-25參數估計與假設檢驗課件6點估計的思想方法點估計的思想方法設總體X 的分布函數的形式已知, 但含有一個或多個未知參數:1,2, ,k設 X1, X2, Xn為總體的一個樣本構造 k 個統計量:),(),(),(21212211nknnXXXXXXXXX隨機變量點估計方法點估計方法2021-9-25參數估計與假設檢驗課件7當測得樣本值(x1, x2, xn)時,代入上述方程組,即可得到 k 個數:),(),(),(21212211nknnxxxxxxxxx數 值稱數

4、1,k為未知參數1,k的估計值7-6對應統計量 為未知參數的估計量1,k并建立k個方程。2021-9-25參數估計與假設檢驗課件8q 頻率替換法頻率替換法利用事件A 在 n 次試驗中發生的頻率/An n作為事件A 發生的概率 p 的估計量pnnpA7-7三種常用的點估計方法三種常用的點估計方法2021-9-25參數估計與假設檢驗課件9 方法方法用樣本 k 階矩作為總體 k 階矩的估計量, 建立含有待估參數的方程, 從而解出待估參數7-9一般, 不論總體服從什么分布, 總體期望 與方差 2 存在, 則它們的矩估計量分別為11niiXXn2122)(1nniiSXXnq 矩法矩法 2021-9-2

5、5參數估計與假設檢驗課件107-10事實上,按矩法原理,令niiXnX11)(12122XEXnAniiX)()(222XEXE22 A2211niiXXn212)(1nniiSXXn2021-9-25參數估計與假設檢驗課件117-11設待估計的參數為k,21設總體的 r 階矩存在,記為),()(21krrXE樣本 X1, X2, Xn 的 r 階矩為nirirXnB11kr, 2 , 1令),(21krniriXn11 含未知參數 1,2, ,k 的方程組2021-9-25參數估計與假設檢驗課件127-12解方程組 , 得 k 個統計量:11212(,)(,)nknX XXX XX 未知參數

6、 1, ,k 的矩估計量111212( , , , )( , , , )nkknx xxx xx 代入一組樣本值得 k 個數: 未知參數 1, ,k 的矩估計值2021-9-25參數估計與假設檢驗課件13q 極大似然估計法極大似然估計法 思想方法思想方法:一次試驗就出現的 事件有較大的概率 例如: 有兩外形相同的箱子,各裝100個球 一箱 99個白球 1 個紅球 一箱 1 個白球 99個紅球現從兩箱中任取一箱, 并從箱中任取一球,結果所取得的球是白球.答答: : 第一箱. .7-17問問: : 所取的球來自哪一箱?2021-9-25參數估計與假設檢驗課件14一般, 設 X 為離散型隨機變量,

7、其分布律為,),()(21uuxxfxXP則樣本 X1, X2, Xn的概率分布為),(2211nnxXxXxXP),(),(),(21nxfxfxf12, , ,1,2, , ,ixu uin7-21)(),(21LxxxLn記為或稱 L( ) 為樣本的似然函數2021-9-25參數估計與假設檢驗課件15),(21nxxxL),(),(),(max21nxfxfxf稱這樣得到的 ),(21nxxxg為參數 的極大似然估計值極大似然估計值稱統計量),(21nXXXg為參數 的極大似然估計量極大似然估計量7-22MLE簡記mle簡記選擇適當的 = ,使 取最大值, 即L( )極大似然法的思想20

8、21-9-25參數估計與假設檢驗課件16若 X 連續, 取 f (xi, )為Xi 的密度函數niixfL1),()(似然函數為注注1 1注注2 2 未知參數可以不止一個, 如1, k 設X 的密度(或分布)為1( ,)kf x則定義似然函數為111( ,)( ,)nkikiLf x,1,2,ixin1( , , )k11( ,; ,)nkL xx2021-9-25參數估計與假設檢驗課件17若11( , , ; , , )nkLxx關于1, , k可微,則稱0),;,(2121knrxxxL為似然方程組kr, 2 , 1若對于某組給定的樣本值 x1, x2, xn,參數 使似然函數取得最大值,

9、 即k,2111( , ; ,)nkL xx),;,(max2121),(21knxxxLk則稱1,k為1, k 的極大似然估計值2021-9-25參數估計與假設檢驗課件18顯然,),(21nrxxxgkr, 2 , 1稱統計量),(21nrXXXgkr, 2 , 1為1, 2, k 的極大似然估計量極大似然估計量7-252021-9-25參數估計與假設檢驗課件19極大似然估計方法極大似然估計方法1) 寫出似然函數 L2)求出k,21, 使得),;,(2121knxxxL),;,(max2121),(21knxxxLk7-282021-9-25參數估計與假設檢驗課件200),;,(2121kn

10、rxxxLkr, 2 , 1可得未知參數的極大似然估計值k,21然后, 再求得極大似然估計量.7-29 L是 的可微函數,解似然方程組1,k若若 L不是 的可微函數, 需用其它方法求極大似然估計值. 1,k若若2021-9-25參數估計與假設檢驗課件21引例引例 已知 X N ( ,1), 不同樣本算得的 的估計值不同,因此除了給出 的點估計外, 還希望根據所給的樣本確定一個隨機區間, 使其包含參數真值的概率達到指定的要求. 的無偏、有效點估計為X隨機變量常數區間估計區間估計2021-9-25參數估計與假設檢驗課件22如引例中,要找一個區間,使其包含 的真值的概率為0.95. ( 設 n =

11、5 )51,NX1, 051NX取05. 0查表得96. 12/z2021-9-25參數估計與假設檢驗課件23這說明即稱隨機區間為未知參數 的置信度為0.95的置信區間.95. 05196. 15196. 1XXP05. 096. 151XP5196. 1,5196. 1XX2021-9-25參數估計與假設檢驗課件24 反復抽取容量為5的樣本,都可得一個區間,此區間不一定包含未知參數 的真值, 而包含真值的區間占95%.若測得 一組樣本值, 它可能包含也可能不包含 的真值, 反復則得一區間(1.86 0.877, 1.86 + 0.877)抽樣得到的區間中有95%包含 的真值.86.1x算得置

12、信區間的意義置信區間的意義2021-9-25參數估計與假設檢驗課件25)51,51(22zXzX當置信區間為時區間的長度為5122z 達到最短?2/z為何要取2021-9-25參數估計與假設檢驗課件2697. 3)13. 2(84. 13321zz92. 3)96. 1(96. 1221zz32z31z-2-1120.10.20.30.4取 = 0.052z21z-2-1120.10.20.30.42021-9-25參數估計與假設檢驗課件27設 為待估參數, 是一給定的數, ( 0 50, 的置信區間的置信區間2121的置信區間為因此mSnSmn22212221)7(2021-9-25參數估計

13、與假設檢驗課件42令 Zi = Xi -Yi , i = 1,2, n, 可以將它們看成來自正態總體 Z N ( 1 2 , 12 + 22) 的樣本仿單個正態總體公式(2) 的置信區間為21niiiZYXYXnS122)()(112221,(4) 未知未知, 但但 n = m , 的置信區間的置信區間21nSntYXZ) 1()(2)8(,YXZ2021-9-25參數估計與假設檢驗課件43取樞軸量(5) 方差比方差比2221的置信區間的置信區間 ( 1 , 2 未知未知) 1, 1(/2221222122222121mnFSSSSF因此, 方差比2221的置信區間為) 1, 1(1,) 1,

14、 1(121222122221mnFSSmnFSS)9(2021-9-25參數估計與假設檢驗課件44取樞軸量),()()()(1)(122211221212212221121mnFYXnmYmXnFmjjniimjjnii(6) 方差比方差比2221的置信區間的置信區間 ( 1 , 2 已知已知)2021-9-25參數估計與假設檢驗課件45因此, 方差比2221 的置信區間為),()()(,),()()(221122121122121mnFYXnmmnFYXnmmjjniimjjnii)10(2021-9-25參數估計與假設檢驗課件46( (三三) ) 單側置信區間單側置信區間定義定義 對于給

15、定的 (0 p,pci=mle(bino,X,0.05,20) %求概率的估計值和置信區間,置信度為95% p = 0.85利用mle函數進行參數估計pci = 0.62107 0.967932021-9-25參數估計與假設檢驗課件52常用分布的參數估計函數 2021-9-25參數估計與假設檢驗課件53【例【例5.1.2】 我院某年級信息專業數學分析成績的平均值和我院某年級信息專業數學分析成績的平均值和標準差計算標準差計算我院學生的數據為我院學生的數據為excel文件:文件:2021-9-25參數估計與假設檢驗課件54% 我院某年級信息專業數學分析成績的平均值和標準差計算我院某年級信息專業數學

16、分析成績的平均值和標準差計算C=load(e:dataAA);B=C.A;mu_cul, sigma_cul = normfit(B(:,3)Score_max=max(B(:,3)Score_min=min(B(:,3)mu_cul = 77.037sigma_cul = 13.902Score_max = 100Score_min = 36利用上例估計出的均值和標準差,作出利用上例估計出的均值和標準差,作出正態分布的密度圖和分布圖形。分布函正態分布的密度圖和分布圖形。分布函數數cdf和密度函數和密度函數pdf的語法分別為:的語法分別為:2021-9-25參數估計與假設檢驗課件55X=lin

17、space(0,150,100);P = normcdf(X,mu_cul,sigma_cul);p = normpdf(X,mu_cul,sigma_cul);subplot(1,2,1),plot(X,P),title(成績分布圖成績分布圖)subplot(1,2,2),plot(X,p),title(成績密度圖成績密度圖)2021-9-25參數估計與假設檢驗課件56第五章第五章 參數估計與假設檢驗參數估計與假設檢驗 5.1 參數估計參數估計 5.2 假設檢驗假設檢驗 5.3 非參數檢驗非參數檢驗 2021-9-25參數估計與假設檢驗課件57若對若對參數參數有所有所了解了解但有懷但有懷疑猜

18、測疑猜測需要證需要證實之時實之時用假設用假設檢驗的檢驗的方法來方法來 處理處理若對參數若對參數一無所知一無所知用參數估計用參數估計的方法處理的方法處理假設檢驗的基本概念假設檢驗的基本概念2021-9-25參數估計與假設檢驗課件58 假設檢驗是指施加于一個或多個假設檢驗是指施加于一個或多個總體的概率分布或參數的假設總體的概率分布或參數的假設. . 所作所作假設可以是正確的假設可以是正確的, ,也可以是錯誤的也可以是錯誤的. . 為判斷所作的假設是否正確為判斷所作的假設是否正確, , 從從總體中抽取樣本總體中抽取樣本, ,根據樣本的取值根據樣本的取值, ,按按一定原則進行檢驗一定原則進行檢驗, ,

19、 然后作出接受或然后作出接受或拒絕所作假設的決定拒絕所作假設的決定. .何為假設檢驗何為假設檢驗?2021-9-25參數估計與假設檢驗課件59實際統計推斷原理:實際統計推斷原理: 小概率事件實際不可能發生小概率事件實際不可能發生。即事件發生可能性很小時,實際上我們認為不可能發生。例如:即事件發生可能性很小時,實際上我們認為不可能發生。例如:1)設姚明在罰球線投籃進與不進是一隨機變量)設姚明在罰球線投籃進與不進是一隨機變量X,進的可能性是,進的可能性是95%,不進的可能性是,不進的可能性是5%。則在一次投籃時不進這一事件是一個。則在一次投籃時不進這一事件是一個小概率事件,則我們認為他投籃不會不進

20、。小概率事件,則我們認為他投籃不會不進。2)設每個人上街發生交通事故的可能性為)設每個人上街發生交通事故的可能性為0.01%,這是一個小概,這是一個小概率事件。但實際我們認為不可能發生,周末我們照樣逛街購物。率事件。但實際我們認為不可能發生,周末我們照樣逛街購物。假設檢驗的原理假設檢驗的原理2021-9-25參數估計與假設檢驗課件60事實上我們并不知道,姚明的命中率。我們是用統計推斷的事實上我們并不知道,姚明的命中率。我們是用統計推斷的方法來決定的。按以下步驟進行推斷:方法來決定的。按以下步驟進行推斷:1)H0:進球的概率為:進球的概率為95%2)對)對X進行抽樣,即觀測投籃結果。進行抽樣,即

21、觀測投籃結果。3)如果進了接受原假設)如果進了接受原假設H0,進球的概率為,進球的概率為95%。如果沒有。如果沒有進,按小概率事件實際不可能發生原理,認為不進球不是小進,按小概率事件實際不可能發生原理,認為不進球不是小概率事件。因此推翻原假設。概率事件。因此推翻原假設。 對總體對總體X的分布律或分布參數作某種假設,根據抽取的分布律或分布參數作某種假設,根據抽取的樣本觀察值,運用數理統計的分析方法,檢驗這種假設的樣本觀察值,運用數理統計的分析方法,檢驗這種假設是否正確,從而決定接受假設或拒絕假設是否正確,從而決定接受假設或拒絕假設.2021-9-25參數估計與假設檢驗課件611.參數檢驗參數檢驗

22、:如果觀測的分布函數類型已知,這時構造出如果觀測的分布函數類型已知,這時構造出的的 統計量依賴于總體的分布函數,這種檢驗稱為參數檢驗統計量依賴于總體的分布函數,這種檢驗稱為參數檢驗. 參數檢驗的目的往往是對總體的參數及其有關性質作出明參數檢驗的目的往往是對總體的參數及其有關性質作出明確的判斷確的判斷.2.非參數檢驗非參數檢驗:在很多實際問題中我們得到的樣本并不知道其分布特在很多實際問題中我們得到的樣本并不知道其分布特性,而是只利用樣本本身進行統計推斷,這樣的參數推斷稱為非參數統性,而是只利用樣本本身進行統計推斷,這樣的參數推斷稱為非參數統計推斷。計推斷。假設檢驗分類假設檢驗分類2.分布的擬合優

23、度檢驗分布的擬合優度檢驗一組樣本:一組樣本:我們關心的是它們來自那一種分布,這時首先假定是服從某一分布,然后用我們關心的是它們來自那一種分布,這時首先假定是服從某一分布,然后用樣本構造其分布特性,并和假設的理論分布擬合的好壞進行檢驗,這就是分樣本構造其分布特性,并和假設的理論分布擬合的好壞進行檢驗,這就是分布的擬合優度檢驗。描述隨機變量的分布特性有兩種方法,一是隨機變量的布的擬合優度檢驗。描述隨機變量的分布特性有兩種方法,一是隨機變量的分布函數,另一個是隨機變量的密度函數,我們可以分別構造不同的統計量分布函數,另一個是隨機變量的密度函數,我們可以分別構造不同的統計量進行檢驗。進行檢驗。12,n

24、XXX2021-9-25參數估計與假設檢驗課件62 假設檢驗步驟(三部曲三部曲) 其中 )(VVP)()(221VVVV雙邊檢驗雙邊檢驗)(1VV左邊檢驗左邊檢驗確定拒絕域 .q 計算,并作出相應判斷.右邊檢驗右邊檢驗)(VV 0Hq 根據實際問題建立 與 .1H0Hq 在 為真時,選擇合適統計量 ,V1H由2021-9-25參數估計與假設檢驗課件63接受域接受域拒絕域拒絕域統計量計算結果統計量計算結果顯著性水平顯著性水平0.05下下2021-9-25參數估計與假設檢驗課件64 某廠生產的螺釘某廠生產的螺釘, ,按標準強度為按標準強度為68/mm68/mm2 2, , 而實際生產的強度而實際生

25、產的強度X X 服服N N( ( ,3.6,3.62 2 ). ). 若若E E( (X X)=)= =68,=68,則認為這批螺釘符合要求則認為這批螺釘符合要求, ,否否則認為不符合要求則認為不符合要求. .為此提出如下假設為此提出如下假設: :H0 : = 68 稱為稱為原假設原假設或或零假設零假設 原假設的對立面原假設的對立面: :H1 : 68 稱為稱為備擇假設備擇假設【例【例5.2.15.2.1】假設檢驗假設檢驗的任務的任務必須在原假設與必須在原假設與備擇假設備擇假設 之間作一選擇之間作一選擇2021-9-25參數估計與假設檢驗課件65若原假設正確若原假設正確, , 則則)36/6

26、. 3,68(2NX因而因而 68)(XE,即即X偏離偏離6868不應該太遠不應該太遠, ,故故取較大值是小概率事件取較大值是小概率事件.6/6 .368X可以確定一個常數可以確定一個常數c c 使得使得cXP6/6 . 368因此因此, ,取取 , ,則則05. 0 現從整批螺釘中取容量為現從整批螺釘中取容量為3636的樣本的樣本, ,其均值為其均值為 , ,問原假設是否正確問原假設是否正確? ?5 .68x96. 1025. 02zzc2021-9-25參數估計與假設檢驗課件66681.963.6/6X 由由為檢驗的為檢驗的接受域接受域 (實際上沒理由拒絕實際上沒理由拒絕),現現5 .68

27、x落入接受域落入接受域, ,則接受原假設則接受原假設824.6618.69XX或即區間即區間( ,66.824 ) 與與 ( 69.18 , + )為檢驗的為檢驗的拒絕域拒絕域稱稱 的取值區間的取值區間X( ( 66.824 , , 69.18 ) )H H0 0: : = = 682021-9-25參數估計與假設檢驗課件67在給定在給定 的前提下的前提下, ,接受還是拒絕原假接受還是拒絕原假設完全取決于樣本值設完全取決于樣本值, , 因此所作檢驗因此所作檢驗可能導致以下兩類錯誤的產生:可能導致以下兩類錯誤的產生: 第一類錯誤棄真錯誤第二類錯誤取偽錯誤2021-9-25參數估計與假設檢驗課件6

28、8正確正確正確正確 犯第一類錯誤的概率通常記為犯第一類錯誤的概率通常記為 犯第二類錯誤的概率通常記為犯第二類錯誤的概率通常記為 H0 為真為真H0 為假為假真實情況真實情況所作判斷所作判斷接受接受 H0拒絕拒絕 H0第一類錯誤第一類錯誤( (棄真棄真) )第二類錯誤第二類錯誤( (取偽取偽) )假設檢驗的兩類錯誤假設檢驗的兩類錯誤2021-9-25參數估計與假設檢驗課件69 任何檢驗方法都不能完全排除犯錯任何檢驗方法都不能完全排除犯錯 假設檢驗的指導思想是控制犯第一類假設檢驗的指導思想是控制犯第一類誤的可能性誤的可能性. .理想的檢驗方法應使犯兩類理想的檢驗方法應使犯兩類錯誤的概率都很小錯誤的

29、概率都很小, ,但在樣本容量給定的但在樣本容量給定的情形下情形下, ,不可能使兩者都很小不可能使兩者都很小, ,降低一個降低一個, , 往往使另一個增大往往使另一個增大. .錯誤的概率不超過錯誤的概率不超過 , , 然后然后, ,若有必要若有必要, ,通通過增大樣本容量的方法來減少過增大樣本容量的方法來減少 . .2021-9-25參數估計與假設檢驗課件70P P( (拒絕拒絕H H0 0| |H H0 0為真為真) )若若H H0 0為真為真, , 則則 2(68 , 3.6 /36)XN所以所以, ,拒絕拒絕 H H0 0 的概率為的概率為 , , 又稱為又稱為顯顯著性水平著性水平, 越大

30、越大, ,犯第一類錯誤的概犯第一類錯誤的概率越大率越大, , 即越顯著即越顯著. .前例前例 中,中,犯第一類錯誤的概率犯第一類錯誤的概率0.05 0853. 09147. 01)37. 1 () 3 . 5 (2021-9-25參數估計與假設檢驗課件71H H0 0不真不真, ,即即 68, 68, 可能小于可能小于68,68,也可能大于也可能大于68, 68, 的大小取決于的大小取決于 的真值的大小的真值的大小. .6.06682.666.06618.69下面計算犯第二類錯誤的概率 設設 = =P P( (接受接受H H0 0| |H H0 0不真不真) )6618. 6982. 66(6

31、6XP266,36, (66,3.6 /36)nXN6177.00002.06179.0)63.3()3.0(6.06982.666.06918.69)6918.6982.66(69XP2021-9-25參數估計與假設檢驗課件72若若26 9 ,3 6 , ( 6 9 ,3 . 6 /3 6 )n X N取偽的概率較大取偽的概率較大.6062.56567.57072.5750.020.040.060.080.10.122021-9-25參數估計與假設檢驗課件7367.5 70 72.5 75 77.5 80 82.50.020.040.060.080.10.1296. 1025. 02 zzc

32、/2/2H0 真真H0 不真不真2021-9-25參數估計與假設檢驗課件74仍取仍取 =0.05,=0.05,則則6 81 . 9 63 . 6/ 8X2(6 6 ,3 .6/6 4 )XN由由可以確定拒絕域為可以確定拒絕域為 ( , 67.118 ) 與與 ( 68.882 , + )因此,接受域為因此,接受域為(67.118, 68.882)(67.118, 68.882)現增大樣本容量現增大樣本容量, ,取取n = n = 64, 64, = 66,= 66,則則0853.00064.09936.01)49.2()4 .6(2021-9-25參數估計與假設檢驗課件756177. 0393

33、6. 0)6988.6812.67(69XP)1,(045.06612.6745.06688.68)66882.68118.67(66XPNoImage2021-9-25參數估計與假設檢驗課件76 一般一般, ,作假設檢驗時作假設檢驗時, ,先控制犯第一先控制犯第一類錯誤的概率類錯誤的概率 , ,在此基礎上使在此基礎上使 盡量盡量地小地小. .要降低要降低 一般要增大樣本容量一般要增大樣本容量. .當當H H0 0不真時不真時, ,參數值越接近真值參數值越接近真值, , 越大越大. .備擇假設可以是單側備擇假設可以是單側, ,也可以雙側也可以雙側. . H0 : = 68; H1 : 68注注

34、 1 1 注注 2 2 引例引例2 2中的備擇假設是雙側的中的備擇假設是雙側的. .若根據以若根據以往生產情況往生產情況, , 0 0=68.=68.現采用了新工藝現采用了新工藝, ,關關心的是新工藝能否提高螺釘強度心的是新工藝能否提高螺釘強度, , 越大越大越好越好. .此時可作如下的右邊假設檢驗此時可作如下的右邊假設檢驗: :2021-9-25參數估計與假設檢驗課件77關于原假設與備擇假設的選取關于原假設與備擇假設的選取H H0 0與與H H1 1地位應平等地位應平等, ,但在控制犯第一類但在控制犯第一類錯誤的概率錯誤的概率 的原則下的原則下, ,使得采取拒使得采取拒絕絕H H0 0 的決

35、策變得較慎重的決策變得較慎重, ,即即H H0 0 得到特得到特別的保護別的保護. .因而因而, ,通常把有把握的、有經驗的結論通常把有把握的、有經驗的結論作為原假設作為原假設, ,或者盡可能使后果嚴重的或者盡可能使后果嚴重的錯誤成為第一類錯誤錯誤成為第一類錯誤. .注注 3 3 2021-9-25參數估計與假設檢驗課件78設取出一容量為 n 的樣本,得到均值X和標準差 s,現要對總體均值是否等于某給定值0進行檢驗.記00:H; 01:H稱 H0為原原假假設設,H1為備備擇擇假假設設,兩者擇其一:接受 H0;拒絕 H0,即接受 H1.單個正態總體均值檢驗單個正態總體均值檢驗2021-9-25參

36、數估計與假設檢驗課件79 用 u檢檢驗驗,檢驗的拒絕域為21uzW 即 2121uzuzW或 用樣本方差2s代替總體方差2,這種檢驗叫 t檢檢驗驗.總體方差2已知統計量 z=nX0總體方差2未知統計量tnsX0H0H1在顯著水平下拒絕 H0,若0021 uz) 1(21ntt001uz) 1(1ntt001uz) 1(1ntt1、總總體體方方差差2已已知知2總總體體方方差差2未未知知2021-9-25參數估計與假設檢驗課件80設 X1,X2,Xn是來自正態總體),(2N的樣本,欲檢驗假設:2020:H 2021:H(或 202 或 202)這叫2檢檢驗驗.均值已知統計量212202)(1nii

37、X均值未知統計量212202)(1XXniiH0H1在顯著水平下拒絕 H0,若202202)(222n或)(2212n) 1(222n或) 1(2212n202202)(212n) 1(212n202202)(22n) 1(22n單個正態總體方差檢驗單個正態總體方差檢驗2021-9-25參數估計與假設檢驗課件81構造統計量 222121nnYXz.1、21與與22已已知知時時2、21與與22未未知知但但相相等等時時構造統計量212121222211)2() 1() 1(nnnnnnsnsnYXt,方差2221,已知統計量 z方差2221,未知但相等統計量tH0H1在顯著水平下拒絕 H0,若21

38、2121 uz)2(2121nntt21211uz)2(211nntt21211uz)2(211nntt兩個正態總體均值檢驗兩個正態總體均值檢驗2021-9-25參數估計與假設檢驗課件82設樣本 X1,X2,Xn1與 Y1,Y2,Yn2分別來自正態總體),(211N與),(222N,檢驗假設: 22210:H 22211:H(或2221或2221)均值21,已知統計量0F均值21,未知統計量FH0H1在顯著水平下拒絕 H0,若22212221),(21210nnFF或),(112210nnFF) 1, 1(2121nnFF或) 1, 1(11221nnFF22212221),(2110nnFF

39、) 1, 1(211nnFF22212221),(11210nnFF) 1, 1(1121nnFF21122212110)(1)(1niiniiYnXnF, 2221ssF (設2221ss )兩個正態總體方差檢驗兩個正態總體方差檢驗2021-9-25參數估計與假設檢驗課件83 在總體服從正態分布的情況下,可用以下命令進行假設檢驗在總體服從正態分布的情況下,可用以下命令進行假設檢驗.1、總體方差總體方差 2已知時,總體均值的檢驗使用已知時,總體均值的檢驗使用 z-檢驗檢驗h = ztest(x,m,sigma) % x為正態總體的樣本,為正態總體的樣本,m為均值為均值 0,sigma為標準差,

40、顯著性水平為為標準差,顯著性水平為0.05(默認值默認值) h = ztest(x,m,sigma,alpha) %顯著性水平為顯著性水平為alpha h,sig,ci,zval = ztest(x,m,sigma,alpha,tail) %sig為觀察值的概率,為觀察值的概率,當當sig為小概率時則對原假設提出質疑,為小概率時則對原假設提出質疑,ci為真正均值為真正均值的的1-alpha置信區間,置信區間,zval為統計量的值。為統計量的值。 參數假設檢驗參數假設檢驗Matlab實現實現說明說明 若若h=0,表示在顯著性水平,表示在顯著性水平alpha下,不能拒絕原假設;下,不能拒絕原假設;

41、 若若h=1,表示在顯著性水平,表示在顯著性水平alpha下,可以拒絕原假設。下,可以拒絕原假設。 原假設:,原假設:, H0:= 0=m若若tail=0,表示備擇假設:,表示備擇假設:H1 : 0 =m (默認,雙邊檢);(默認,雙邊檢); tail=1,表示備擇假設:,表示備擇假設: H1 : 0 =m (單邊檢驗);(單邊檢驗); tail=-1,表示備擇假設:,表示備擇假設: H1 : V (right-tailed test)v left - x=-1:1:5; y=randn(20,1); h,p,k=kstest2(x,y) h = 1 p = 0.0444 k = 0.5643

42、 說明 h=1表示可以認為向量x與y的分布不相同,相同的概率只有4.4%2021-9-25參數估計與假設檢驗課件101正態分布的擬合優度測試v 函數函數 jbtest v 格式格式 H = jbtest(X) %對輸入向量對輸入向量X進行進行Jarque-Bera測試,顯測試,顯著性水平為著性水平為0.05。 v H = jbtest(X,alpha) %在水平在水平alpha而非而非5%下施行下施行 Jarque-Bera 測試,測試,alpha在在0和和1之間。之間。 v H,P,JBSTAT,CV = jbtest(X,alpha) %P為接受假設的概率值,為接受假設的概率值,P越接近于

43、越接近于0,則可以拒絕是正態分布的原假設;,則可以拒絕是正態分布的原假設;JBSTAT為測為測試統計量的值,試統計量的值,CV為是否拒絕原假設的臨界值。為是否拒絕原假設的臨界值。 v 說明說明 H為測試結果,若為測試結果,若H=0,則可以認為,則可以認為X是服從正態分布的;是服從正態分布的;若若H=1,則可以否定,則可以否定X服從正態分布。服從正態分布。X為大樣本,對于小樣為大樣本,對于小樣本用本用lillietest函數。函數。 2021-9-25參數估計與假設檢驗課件102【例5.3.2】調用調用MATLAB中關于汽車重量的數據,測試中關于汽車重量的數據,測試該數據是否服從正態分布該數據是

44、否服從正態分布 load carsmall h,p,j,cv=jbtest(Weight) 說明說明 p=2.67%表示應該拒絕服從正態分布的假設;表示應該拒絕服從正態分布的假設;h=1也可也可否定服從正態分布;統計量的值否定服從正態分布;統計量的值j = 7.2448大于接受假設的臨大于接受假設的臨界值界值cv =5.9915,因而拒絕假設,因而拒絕假設(測試水平為測試水平為5%)。h = 1 p = 0.0267 j = 7.2448 cv = 5.9915 2021-9-25參數估計與假設檢驗課件103正態分布的擬合優度測試正態分布的擬合優度測試lillietest v格式格式 H =

45、lillietest(X) %對輸入向量對輸入向量X進行進行Lilliefors測試,顯著性水平為測試,顯著性水平為0.05。 vH = lillietest(X,alpha) %在水平在水平alpha而非而非5%下施行下施行Lilliefors測試,測試,alpha在在0.01和和0.2之間。之間。 vH,P,LSTAT,CV = lillietest(X,alpha) %P為接受假為接受假設的概率值,設的概率值,P越接近于越接近于0,則可以拒絕是正態分布,則可以拒絕是正態分布的原假設;的原假設;LSTAT為測試統計量的值,為測試統計量的值,CV為是否為是否拒絕原假設的臨界值。拒絕原假設的臨

46、界值。 v說明說明 H為測試結果,若為測試結果,若H=0,則可以認為,則可以認為X是服從是服從正態分布的;若正態分布的;若H=1,則可以否定,則可以否定X服從正態分布。服從正態分布。 2021-9-25參數估計與假設檢驗課件104【例5.3.4】 Y=chi2rnd(10,100,1); h,p,l,cv=lillietest(Y) h = 1 p = 0.0175 l = 0.1062 cv = 0.0886說明說明 h=1表示拒絕正態分布的假設;表示拒絕正態分布的假設;p = 0.0175表示服從正態分表示服從正態分布的概率很小;統計量的值布的概率很小;統計量的值l = 0.1062大于接

47、受假設的臨界值大于接受假設的臨界值cv =0.0886,因而拒絕假設,因而拒絕假設(測試水平為測試水平為5%)。 hist(Y) 從圖中看出,數據Y不服從正態分布。0510152025051015202530Probability Greater than Lower Bound is 0.88493DensityCritical Value2021-9-25參數估計與假設檢驗課件105) 1(2n統計量檢驗隨機數的密度函數擬合優度檢驗統計量檢驗隨機數的密度函數擬合優度檢驗 將樣本將樣本 定義域分為定義域分為k個相等的區間,記個相等的區間,記i區間的區間的觀測頻數為觀測頻數為ni(i=1,,k

48、),若隨機變量),若隨機變量X落于第落于第i區間的概率為區間的概率為Pi,則得理論頻數,則得理論頻數mi= N Pi,由,由ni,mi構造統計量。構造統計量。nXXX,2112kkiiiimnm12)(=漸近服從自由度為漸近服從自由度為k-1的卡方分布,簡記為的卡方分布,簡記為 。一般。一般要求樣本數要求樣本數N30。 12k2021-9-25參數估計與假設檢驗課件106【例例5.3.5 】抽標準正態分布機數】抽標準正態分布機數200個,對密度函數進行個,對密度函數進行統計推斷統計推斷X = normrnd(0,1,200,1) % 抽抽200個正態分布隨機數個正態分布隨機數histfit(X

49、,8); % 作示意圖作示意圖% 構造卡方統計量構造卡方統計量k=8;kk=linspace(-3,3,k+1); % 對區間分成對區間分成8個等區間個等區間P=normcdf(kk,0,1); % 計算每個區間的概率計算每個區間的概率n=(P(2:k+1)-P(1:k)*200 % 計算每個區間的理論頻計算每個區間的理論頻數數m=hist(X,k) % 計算每個區間的觀測頻數計算每個區間的觀測頻數kf_7 = sum(n-m).2)./m) % 計算卡方統計量計算卡方統計量% 進行統計推斷進行統計推斷chi2_p=chi2cdf(kf_8,k-1) % 計算下側概率計算下側概率2021-9-

50、25參數估計與假設檢驗課件107if chi2_p0.95chi2_str=接受接受;else chi2_str=拒絕拒絕;endchi2_str結果為接受原假設結果為接受原假設2021-9-25參數估計與假設檢驗課件108我們計算出的理論頻率與樣本頻率見表我們計算出的理論頻率與樣本頻率見表5-3-1表表5-3-1 理論頻率與樣本頻率計算結果理論頻率與樣本頻率計算結果自由度為自由度為7的卡方統計量結果為:的卡方統計量結果為:kf_7 = 9.8806最后的檢驗結果為接受原假設,樣本來自標準正態密度函數。最后的檢驗結果為接受原假設,樣本來自標準正態密度函數。2021-9-25參數估計與假設檢驗課

51、件109【例【例5.3.6】 一道工序用自動化車床連續加工某種零件,由于刀具損壞等會出現故障.故障是完全隨機的,并假定生產任一零件時出現故障機會均相同.工作人員是通過檢查零件來確定工序是否出現故障的.現積累有100次故障紀錄,故障出現時該刀具完成的零件數如下: 459 362 624 542 509 584 433 748 815 505 612 452 434 982 640 742 565 706 593 680 926 653 164 487 734 608 428 1153 593 844 527 552 513 781 474 388 824 538 862 659 775 859

52、755 49 697 515 628 954 771 609 402 960 885 610 292 837 473 677 358 638 699 634 555 570 84 416 606 1062 484 120 447 654 564 339 280 246 687 539 790 581 621 724 531 512 577 496 468 499 544 645 764 558 378 765 666 763 217 715 310 851試觀察該刀具出現故障時完成的零件數屬于哪種分布.2021-9-25參數估計與假設檢驗課件110解解 1、數據輸入保存在文件daex3_4_1

53、2.txt2、作頻數直方圖 hist(x,10)(看起來刀具壽命服從正態分布)02004006008001000120005101520252021-9-25參數估計與假設檢驗課件111 3、作正態概率圖 normplot(x)(刀具壽命近似服從正態分布)1002003004005006007008009001000 11000.0030.01 0.02 0.05 0.10 0.25 0.50 0.75 0.90 0.95 0.98 0.99 0.997DataProbabilityNormal Probability Plot2021-9-25參數估計與假設檢驗課件112JB正態分布檢驗正態

54、分布檢驗h,p,j,cv=jbtest(X) h = 0p = 0.69129j = 0.7384cv = 5.99152021-9-25參數估計與假設檢驗課件1134、參數估計: muhat,sigmahat,muci,sigmaci = normfit(x)muhat = 594sigmahat = 204.13muci = 553.5 634.5sigmaci = 179.23 237.132021-9-25參數估計與假設檢驗課件1145、假設檢驗 已知刀具的壽命服從正態分布,現在方差未知的情況下,檢驗其均值 m 是否等于594.結果:h = 0,sig = 1,ci =553.4962

55、,634.5038.檢驗結果: 1. 布爾變量h=0, 表示不拒絕零假設. 說 明提出的假設壽命均值594是合理的. 2. 95%的置信區間為553.5,634.5, 它 完全包括594, 且精度很高. 3. sig-值為1, 遠超過0.5, 不能拒絕零假 設. 2021-9-25參數估計與假設檢驗課件115非參數統計推斷 在參數統計推斷中,我們是在知道樣本服從某分布的前提下進在參數統計推斷中,我們是在知道樣本服從某分布的前提下進行的,例如在知道總體為正態分布的情況下,構造行的,例如在知道總體為正態分布的情況下,構造T統計量具有良統計量具有良好的估計性質。高但在很多實際問題中我們得到的樣本并不

56、知道其好的估計性質。高但在很多實際問題中我們得到的樣本并不知道其分布特性,而是只利用樣本本身進行統計推斷,這樣的參數推斷稱分布特性,而是只利用樣本本身進行統計推斷,這樣的參數推斷稱為非參數統計推斷。由于非參數統計推斷不需要預先知道樣本的分為非參數統計推斷。由于非參數統計推斷不需要預先知道樣本的分布,雖不能達到最優的統計性質,方法卻具有簡單、穩定的特點,布,雖不能達到最優的統計性質,方法卻具有簡單、穩定的特點,因此廣泛使用于生物、化學、醫學和社會科學各領域。因此廣泛使用于生物、化學、醫學和社會科學各領域。MATLAB提提供的非參數檢驗命令見下表供的非參數檢驗命令見下表2021-9-25參數估計與

57、假設檢驗課件116兩種處理方法好壞比較的兩種處理方法好壞比較的Wilcoxon秩和檢驗秩和檢驗秩的定義為:設有兩種樣本,秩的定義為:設有兩種樣本, , ,1,21nxxx2,21nyyy將它們放在一起進行排序,得由小到大的順序序列:將它們放在一起進行排序,得由小到大的順序序列: (5.3.1)如果如果xi位于數據(位于數據(5.4.1)的第五個位置,則稱它的秩為)的第五個位置,則稱它的秩為5,這樣數,這樣數據,中的每一個元素都對應一個秩。據,中的每一個元素都對應一個秩。秩和的定義為:將第一組數據的每個元素的秩相加得秩和的定義為:將第一組數據的每個元素的秩相加得R1,將第二組,將第二組數據每個元素的秩相加得數據每個元素的秩相加得R2,R1和和R2就分別是各組的秩和,顯然就分別是各組的秩和,顯然它們是統計量。如果兩組數據來自一個總體,那么我們計算出的秩它們是統計量。如果兩組數據來自一個總體,那么我們計算出的秩和統計量和就不應該相差太大。我們可以構造統計量和統計量和就不應該相差太大。我們可以構造統計量T。 21,21nnzzz212121210),min(),

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論