概率論與數理統計 第八章 假設檢驗_第1頁
概率論與數理統計 第八章 假設檢驗_第2頁
概率論與數理統計 第八章 假設檢驗_第3頁
概率論與數理統計 第八章 假設檢驗_第4頁
概率論與數理統計 第八章 假設檢驗_第5頁
已閱讀5頁,還剩89頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

概率論與數理統計主講教師陳爭第7章假設檢驗§7.1假設檢驗的基本概念§7.2單個正態總體的假設檢驗§7.3兩個正態總體的假設檢驗第7章假設檢驗§7.1假設檢驗的基本概念、假設檢驗問題

假設檢驗是統計推斷的基本問題之一.它根據歷史

資料和實際經驗,首先對總體的某種統計特征作出推斷

或假設,然后利用樣本值所提出的信息,運用統計分析

方法來檢驗假設是否正確,最后作出接受或拒絕原假設

的決定.假設檢驗是對總體的概率分布及參數而言的.如果

是檢驗總體是否具有某種已知類型的分布,則稱這種檢

驗為分布的假設檢驗.如果是檢驗總體某參數是否具有某種特征,則稱這種檢驗為參數的假設檢驗.§7.1假設檢驗的基本概念例1

拋擲一枚硬幣100次,“正面”出現了60次,問這枚硬幣是否均勻?這是一個總體的檢驗問題.若用X

描述拋擲一枚“X=1”及“X=0”分別表示“正面朝上”和“正面朝下”,上述問題就是要檢驗X是否服從的0-1分布.是概率分布的檢驗問題.

硬幣的試驗,

例2

從2005年的新生兒(女)中隨機地抽取20個,

測得其平均體重為3160克,樣本標準差為300克.而根據過去統計資料,新生兒(女)平均體重為3140克.問現在與過去新生兒(女)體重有無顯著差異(假定新生兒體重服從正態分布)?

這是一個總體的檢驗問題,是關于隨機變量的參數的判斷,叫做一個總體的參數檢驗問題.若把所有2005年新生兒(女)體重視為一個總體,用X表示,問題就是判斷E(X)=3140是否成立.

例3

在10個相同的地塊上對甲、乙兩種玉米進行品比試驗,得如下資料(單位:公斤):

甲951,966,1008,1082,983乙730,864,742,774,990假定農作物產量服從正態分布,問這兩種玉米產量有無顯著差異?這是兩個總體的參數檢驗問題.從直觀上看,兩者差異顯著.但是一方面由于抽樣的隨機性,我們不能以個別值進行比較就得出結論;另一方面直觀的標準可能因人而異.因此,這實際上需要比較兩個正態總體的期望值是否相等?關于總體的假設通常是提出兩個相互對立的假設,把需要檢驗是否為真的假設稱為原假設或零假

這里所說的“假設”只是一個設想,至于它是否成立,在建立假設時并不知道,需要進行考察.通過樣本對一個假設作出“是”或“否”的判斷程序,稱為檢驗這個假設.

具體的判斷規則稱為該假設的一個檢驗.檢驗的結果若是肯定該命題,則稱接受這個假設,否則稱否定或拒絕這個假設.

表示.表示,而把與之對立的另一個假設稱為備設,用選假設,用二、假設檢驗的基本思想與方法

1.小概率原理小概率事件在一次試驗中幾乎是不可能發生的.小概率事件是指概率很小的事件.

倘若某事件A發生的概率α=0.001,則可認為大體在1000次試驗中A才出現一次.因此,概率很小的事件在一次試驗中實際上不大可能出現,這個原理稱為小概率原理.

例如“飛機失事”、“優秀生高考落榜”、“從廢品率極低的產品中抽到一件廢品”都被視為小概率事件.小概率原理是人們在長期實踐中總結出來的.2.小概率原理是假設檢驗的理論依據定這個“假設”是真的,然后根據樣本提供的信息為了檢驗一個“假設”如果抽得的樣本使小概率事件發生了,我不真,從而拒絕原假設;如果抽得樣本沒有從而接受來判斷.們認為這是一種不合理的現象,有理由懷疑原假設導致小概率事件發生,則沒有足夠理由否定原假設,是否為真,我們先假3.顯著性水平

至于什么算“概率很小”,這要根據具體情況而定.在檢驗之前都事先指定.

比如概率為5%,1%等.

一般記作α,即α是一個事先指定的正數,稱為顯著性水平或檢驗水平.三、假設檢驗的形式對總體的分布或分布函數的某些參數作出“假設”稱為待檢假設(也稱為零假設),通常記作例如

(對總體均值

)對立面稱為備擇假設,用單側檢驗.第一個式子稱為雙側檢驗,二、三兩個式子稱為的表示.

在顯著水平下,根據統計量的分布將樣本空間劃分成互不相交的兩個區域:其中一個是接受零假設的

樣本值全體組成的,稱為接受域;反之稱為拒絕域

(也稱臨界域).

雙側檢驗的拒絕域位于概率分布圖形的兩端,單側檢驗的拒絕域位于概率分布圖形的一端.四、假設檢驗的兩類錯誤

由于人們作出判斷的依據是一個樣本,也就是由

部分來推斷整體,因而假設檢驗不可能絕對準確,它也可能犯錯誤.其可能性的大小,也是以統計規律性為依據的,所可能犯的錯誤有兩類.

第一類錯誤是:原假設符合實際情況,而檢驗結果把它否定了,這稱為棄真錯誤.第二類錯誤是:原假設不符合實際情況,而檢驗結果把它肯定下來了,這稱為取偽錯誤.五、假設檢驗的一般步驟根據實際問題提出原假設構造適當的統計量,并在假設確定該統計量的分布或漸進分布.給定檢驗水平拒絕域(和接受域).由樣本的觀測值計算出統計量的數值.1234為真的條件下查表確定臨界值,從而確定和備擇假設作出判斷:若統計量的觀測值落入拒絕域,則若統計量的值落入接受域,則接受假設5拒絕假設

提出假設

根據統計調查的目的,提出原假設H0

和備選假設H1作出決策抽取樣本檢驗假設

對差異進行定量的分析,確定其性質(是隨機誤差還是系統誤差.為給出兩者界限,找一檢驗統計量T,在H0成立下其分布已知.)拒絕還是不能拒絕H0顯著性水平P(TW)=-----犯第一類錯誤的概率,W為拒絕域小結設總體為的假設檢驗,本節介紹下列幾種:已知方差未知方差

未知均值μ,已知均值μ,其中關于總體參數檢驗假設檢驗假設檢驗假設檢驗假設都是已知數.中的§7.2單個正態總體參數的假設檢驗§7.2單個正態總體的假設檢驗1.總體方差例1

根據長期經驗和資料的分析,某磚瓦廠生產磚的“抗斷強度”X服從正態分布,方差從該廠產品中隨機抽取6塊,測得抗斷強度如下:32.56,29.66,31.64,30.00,31.87,31.03檢驗這批磚的平均抗斷強度為32.50是否成立?一、單個總體均值的假設檢驗(1)雙側檢驗原假設備擇假設已知時,總體均值μ的假設檢驗一、正態總體均值的假設檢驗建立假設基本思想:如果來自正態總體解正確,即樣本即與存在著差異,若比較大的可能性小,而比較小的可能性大.

成立,則這個差異因此,可以根據的大小來判斷是否成立,這就需要分析說大于一個什么值,這是一個小概率事件.的分布來求,如果這個值找到了,比如為那么根據觀測值計算大到什么程度,或者成立時,若即小概率事件發生了,則可以認為,就不能否定

不成立;若即原假設成立.

這要根據而成立時,關鍵在于找出成立時,總體服從

得其統計量給定檢驗水平

,為了求值方便,將其標準化,的分布,當所以服從構造一個小概率事件,使得其中然后計算U

的觀察值,若可由標準正態分滿足則小概率事件發生,拒絕若小概率事件沒有發生,接受布表查到.(2)當(3)

(4)計算統計量觀察值:認為這批產品的平均抗斷強度是32.50

綜合以上分析,有以下解題步驟:成立時,拒絕域為∴拒絕即不能(1)建立假設即U—檢驗法的檢驗步驟為:

提出原假設當

給定的檢驗水平

,根據樣本觀察值計算統計量U

的值觀察值;若若1243成立時,查表確定臨界值使則否定則接受備選假設5從而得拒絕域:(2)右側檢驗原假設備選假設已知對于給定的α,查表確定使得:中含有未知參數μ,所以它不是統計量,在原假設成立時,有從而即當時,小概率事件發生,拒絕時,接受原假設當例2

已知某正態總體的方差為50,抽取容量n=25的樣本,樣本均值為56.7,問總體均值小于55是否成立?解已知n=25,(1)建立假設

(2)構造檢驗函數(3)

拒絕域為(4)計算所以,接受(3)左側檢驗原假設備擇假設類似于右側檢驗,當統計量時,拒絕原假設時,接受原假設當統計量練習1

設在正常情況下,某包裝機包裝出來的奶粉凈重.現從包裝好的奶粉中隨機隨機抽取9袋,測得其凈重(單位:g)為:504496512490520505508499511問每包奶粉凈重是否為500g?(2)當(3)(4)計算解∴接受拒絕域為成立時,(1)假設總體方差未知,可用樣本方差代替,這時統計量利用T統計量進行檢驗的方法稱為T檢驗法.2.總體方差未知時,總體均值μ的假設檢驗一般步驟為:

提出原假設當

給定α,查表確定臨界值根據樣本觀察值計算統計量T的值,若若1243成立時,使則否定則接受備擇假設(1)雙側檢驗5未知,所以用

分析:

例3從2005年的新生兒(女)中隨機抽取20個,測得其平均體重為3160克,樣本標準差為300克.而根據過去統計資料,新生兒(女)平均體重為3140克.問現在與過去新生兒(女)體重有無顯著差異(假定新生兒體重服從正態分布)?(α=0.05)已知解選統計量

代替由于給定檢驗水平α,

成立時,即具有19個自由度的t

分布.然后計算T

的觀察值,接受拒絕時,統計量服從在構造一個小概率事件,使若若(2)當(3)

(4)計算即可認為現在與過去的新生兒(女)體重沒有顯著差異.解題步驟為:成立時,∴接受(1)假設拒絕域為

(2)右側檢驗原假設備擇假設已知對于給定的μ,查表確定使中含有未知參數μ,所以它不是統計量.在原假設成立時,有從而即當時,小概率事件發生,拒絕時,接受原假設當(3)左側檢驗原假設備擇假設類似于右側檢驗,當統計量時,拒絕原假設時,接受原假設當統計量(2)構造統計量例4某部門對當前市場的雞蛋價格情況進行調查,抽查了20個集市,計算得如下數據:解(3)

已知雞蛋的售價服從正態分布,且往年的售價一直穩定在3.25元/500克左右,能否認為當前雞蛋的售價明顯高于往年?拒絕域為,(1)假設(4)由樣本計算(5)因為即雞蛋的價格較往年明顯上漲.

故拒絕

練習2

根據長期資料分析,鋼筋強度服從正態分布,今測得六爐鋼生產出鋼的強度分別為

48.549.053.549.556.052.5能否認為其強度的均值為52.0?(2)當

解成立時,即認為鋼筋強度的均值為52.0.

∴接受(1)假設拒絕域為(4)計算課外作業:總習題七2,31.總體均值μ已知時,總體方差的假設檢驗二、單個正態總體方差的檢驗假設(1)雙側檢驗一般步驟為:

提出原假設當

給定檢驗水平α,查表確定臨界值123成立時,和備擇假設使二、單個正態總體方差的假設檢驗利用樣本觀察值計算若若4的值,則接受則拒絕或5(2)右側檢驗提出原假設備擇假設

給定檢驗水平α,查表確定臨界值使計算統計量的值,時,拒絕時,接受當當(3)左側檢驗提出原假設備擇假設

給定檢驗水平α,查表確定臨界值使計算統計量的值,時,拒絕時,接受當當2.總體均值μ未知時,總體方差的假設檢驗(1)雙側檢驗一般步驟為:

提出原假設當

給定檢驗水平α,查表確定臨界值123成立時,和備擇假設使或利用樣本觀察值計算若若4的值,則接受則拒絕或5例4

某煉鐵廠的鐵水含碳量X在正常情況下服從正態分布,現對操作工藝進行了某些改進,從中抽取

5爐鐵水測得含碳量數據如下:

4.4214.0524.3574.2874.683據此是否認為新工藝煉出的鐵水含碳量的方差仍為

已知解成立時,計算得(1)假設工藝的方差是∴否定即不能認為新查表得:(4)計算拒絕域為練習3

某項試驗中測量其溫度,通常情況下,溫度方差保持在.現在某天里抽測了25次,計算得.問該天的試驗溫度方差與要求比有無顯著差異?(該溫度值服從正態分布,)成立時,∴接受解(1)假設(4)計算(2)右側檢驗原假設備擇假設已知對于給定的α,查表確定臨界值使中含有未知參數所以它不是統計量,在原假設成立時,有從而即當時,小概率事件發生,拒絕時,接受原假設當(3)左側檢驗提出原假設備擇假設

給定檢驗水平α,查表確定臨界值使計算統計量的值,時,拒絕時,接受當當例5

打包機包裝水泥,現規定每袋水泥標準重量重量為100公斤,標準差不超過2公斤,為了檢查打包機工作是否正常,抽取了9袋水泥,其假定水泥的重量服從正態分布,問該天打包機工作是否

正常?

(2)成立時∴接受解(1)假設(4)計算拒絕域為(2)構造檢驗函數∴接受綜上,該天打包機工作正常.檢驗方差即認為方差不超過成立時,有(1)假設(4)計算練習4

某種導線,要求其電阻的標準差不得超過0.005(歐姆)。今在生產的一批導線中取樣品8根,測得s=0.007(歐姆),設總體為正態分布,問在α=0.05下能否認為這批導線的標準差顯著地偏大?(2)構造檢驗函數∴接受解(4)計算(1)假設練習5

設某次考試的學生成績服從正態分布,從

中隨機抽取30位考生的成績,算得平均成績為66.5,標準差為15分.問:(1)是否可認為這次考試全體考生的平均成績為70分?(2)是否可認為這次考試考生的成績的方差為?解設該次考試考生的成績為ξ,則ξ服從正態分布,且均為未知參數。1.檢驗均值(1)假設成立時,∴接受查表得(4)計算拒絕域為2.檢驗方差∴接受成立時,(1)假設(4)計算拒絕域為§7.3兩個正態總體參數的假設檢驗設

的樣本,且兩組樣本相互獨立.正態總體

§7.3兩個正態總體參數的假設檢驗分別是來自和正態總體一、兩個正態總體均值的假設檢驗已知時均值的檢驗(1)雙側檢驗一般步驟為:

提出原假設1備擇假設當

給定檢驗水平α,查表確定臨界值23成立時,統計量滿足根據樣本觀察值計算統計量U

的值,若若4則否定則接受5例1

從甲、乙兩廠生產的鋼絲總體X、Y中各取50截1米長的鋼絲作拉力強度試驗,得設鋼絲的拉抗強度服從正態分布,且問甲、乙兩廠鋼絲的拉抗強度是否有顯著差別?解假設1當2成立時,統計量認為兩廠鋼絲3查N(0,1)分布表,得計算4所以拒絕強度有顯著差別.5(2)右側檢驗原假設備擇假設當統計量時,拒絕原假設時,接受原假設當統計量給定檢驗水平α,查表確定臨界值滿足(3)左側檢驗原假設備擇假設當統計量時,拒絕原假設時,接受原假設當統計量給定檢驗水平α,查表確定臨界值滿足成立時

2未知,但知道(1)雙側檢驗一般步驟為:

提出原假設1備擇假設時均值的檢驗

給定α,查表確定臨界值若

計算統計量T

的值,34滿足則拒絕則接受若5例2

一種鋼軸產品的長度服從正態分布,從兩臺同類型機床生產出來的兩批產品中,分別取出容量的樣本,測其長度得到樣本均值及樣本方差:若其長度方差,問在檢驗水平時可否認為兩種產品的長度相等。成立時,解(1)假設∴拒絕即認為兩種產品的長度有顯著差異.(4)計算(2)右側檢驗原假設備擇假設拒絕原假設接受原假設給定α,查t分布表得臨界值滿足當當時,時,(3)左側檢驗原假設備擇假設類似于右側檢驗,時,拒絕原假設時,接受原假設當當二、兩個正態總體方差的假設檢驗已知時,正態總體方差的假設檢驗(1)雙側檢驗一般步驟為:

提出原假設當12成立時,備擇假設二、兩個正態總體方差的假設檢驗其中,3滿足給定α,查表確定臨界值計算統計量F的值,4時,接受當當和時,拒絕5(2)右側檢驗提出原假設備擇假設滿足給定α,查表確定臨界值計算統計量F

的值,

時,拒絕當時,接受當(3)左側檢驗提出原假設備擇假設滿足給定α,查表確定臨界值計算統計量F

的值,

時,拒絕當時,接受當未知時,正態總體方差的假設檢驗(1)雙側檢驗一般步驟為:

提出原假設當12成立時,統計量備擇假設給定α,查表確定臨界值3滿足其中,計算統計量F的值,4時,接受當當和時,拒絕5例3

比較甲、乙兩種槍彈的速度的穩定性,在相同條件下進行速度測定,算得樣本均方差如下:

甲:

乙:

假定槍彈速度服從正態分布,問兩種槍彈速度的方差

有無顯著差異.

設甲、乙兩種槍彈的速度分別為

且它們相互獨立,假定檢驗兩者方差是否相等.解(1)

假設成立時,∴接受(4)計算查表得:(2)右側檢驗提出原假設備擇假設滿足給定α,查表確定臨界值計算統計量F

的值,

時,拒絕當時,接受當(3)左側檢驗提出原假設備擇假設滿足給定α,查表確定臨界值計算統計量F

的值,

時,拒絕當時,接受當例4

在10個相同的地塊上對甲、乙兩種玉米進行品種比較試驗,得如下資料(單位:公斤):甲:95196610081082983乙:730864742774990

假定農作物產量服從正態分布,問這兩種玉米產量有無顯著差異?

分析:記獨立的,并且假設

即未知

關于兩個正態總體的期望值相等的假設檢驗,需

要用到兩個總體方差相等的條件.所以,需先檢驗兩總體的方差是否相等.分別表示甲、乙玉米產量,它們是假設檢驗(1)假設成立時,∴接受解(4)計算查表得:成立時,∴拒絕即認為兩種玉米的產量有顯著差異.解(1)假設(4)計算成立時,練習2

甲、乙兩廠生產同一零件,假定其日產量都服從正態分布,現分別在甲、乙兩廠作了

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論