大學統計學第8章 假設檢驗_第1頁
大學統計學第8章 假設檢驗_第2頁
大學統計學第8章 假設檢驗_第3頁
大學統計學第8章 假設檢驗_第4頁
大學統計學第8章 假設檢驗_第5頁
已閱讀5頁,還剩72頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第八章假設檢驗假設檢驗在統計方法中的地位統計方法描述統計推斷統計參數估計假設檢驗統計應用

藥物篩選中的假設檢驗

制藥公司開發研制新的藥物時,藥物篩選成為需面臨的一個極其重要的決策問題統計學是對藥物篩選技術做出了巨大貢獻的學科之一。藥物篩選過程中有兩種可能的行為“拒絕”開發的新藥,這意味著所檢驗的藥物無效或只有微弱的效果。此時采取的行動就是將該藥物廢棄暫時”接受”開發的新藥,此時需要采取的行動是對該藥物進行進一步的細致試驗根據兩種可能出現的研究結果,人們提出了如下相應的假設形式H0:新藥對治療某種特定疾病無效(或效果微弱)H1:新藥對治療某種特定疾病有效第8章假設檢驗8.1

假設檢驗的基本問題8.2

一個總體參數的檢驗8.3

兩個總體參數的檢驗什么是假設檢驗?

(hypothesistest)1.

先對總體的參數(或分布形式)提出某種假設,然后利用樣本信息判斷假設是否成立的過程2.邏輯上運用反證法,統計上依據小概率原理我認為這種新藥的療效比原有的藥物更有效!假設檢驗中的小概率原理

什么是小概率?1. 在一次試驗中,一個幾乎不可能發生的事件發生的概率2. 在一次試驗中小概率事件一旦發生,我們就有理由拒絕原假設3. 小概率由研究者事先確定總體假設檢驗的過程抽取隨機樣本x

=20s=6我認為人口的平均年齡是50歲提出假設

拒絕假設別無選擇!作出決策原假設與備擇假設原假設

(nullhypothesis)研究者想收集證據予以反對的假設又稱“0假設”總是有符號,

或表示為H0H0:

=某一數值指定為符號=,或例如,H0:

10cmnull研究者想收集證據予以支持的假設也稱“研究假設”總是有符號,

或表示為H1H1:

<某一數值,或某一數值例如,H1:

<10cm,或10cm備擇假設(alternativehypothesis)原假設和備擇假設是一個完備事件組,而且相互對立在一項假設檢驗中,原假設和備擇假設必有一個成立,而且只有一個成立先確定備擇假設,再確定原假設等號“=”總是放在原假設上因研究目的不同,對同一問題可能提出不同的假設(也可能得出不同的結論)提出假設(結論與建議)單側檢驗時零假設和備擇假設的選擇通常把研究者要證明的假設作為備擇假設;把需要充分證據才能證明的假設作為備擇假設;將所作出的聲明作為原假設;把現狀(StatusQuo)作為原假設;把不能輕易否定的假設作為原假設;【例】一種零件的生產標準是直徑應為10cm,為對生產過程進行控制,質量監測人員定期對一臺加工機床檢查,確定這臺機床生產的零件是否符合標準要求。如果零件的平均直徑大于或小于10cm,則表明生產過程不正常,必須進行調整。試陳述用來檢驗生產過程是否正常的原假設和備擇假設提出假設(例題分析)解:研究者想收集證據予以證明的假設應該是“生產過程不正常”。建立的原假設和備擇假設為

H0:

10cmH1:

10cm

【例】某品牌洗滌劑在它的產品說明書中聲稱:平均凈含量不少于500g。從消費者的利益出發,有關研究人員要通過抽檢其中的一批產品來驗證該產品制造商的說明是否屬實。試陳述用于檢驗的原假設與備擇假設提出假設(例題分析)解:研究者抽檢的意圖是傾向于證實這種洗滌劑的平均凈含量并不符合說明書中的陳述。建立的原假設和備擇假設為

H0:

500H1:

<500500g綠葉洗滌劑【例】一家研究機構估計,某城市中家庭擁有汽車的比例超過30%。為驗證這一估計是否正確,該研究機構隨機抽取了一個樣本進行檢驗。試陳述用于檢驗的原假設與備擇假設提出假設(例題分析)解:研究者想收集證據予以支持的假設是“該城市中家庭擁有汽車的比例超過30%”。建立的原假設和備擇假設為

H0:

30%H1:

30%雙側檢驗與單側檢驗備擇假設沒有特定的方向性,并含有符號“”的假設檢驗,稱為雙側檢驗或雙尾檢驗(two-tailedtest)

備擇假設具有特定的方向性,并含有符號“>”或“<”的假設檢驗,稱為單側檢驗或單尾檢驗(one-tailedtest)備擇假設的方向為“<”,稱為左側檢驗

備擇假設的方向為“>”,稱為右側檢驗

雙側檢驗與單側檢驗雙側檢驗與單側檢驗

(假設的形式)假設雙側檢驗單側檢驗左側檢驗右側檢驗原假設H0:m

=m0H0:m

m0H0:m

m0備擇假設H1:m

≠m0H1:m

<m0H1:m

>m0以總體均值的檢驗為例顯著性水平顯著性水平

(significantlevel)1. 是一個概率值2. 原假設為真時,拒絕原假設的概率抽樣分布的拒絕域3. 表示為(alpha)常用的

值有0.01,0.05,0.104.我們可以在事先確定用于拒絕原假設H0的證據必須強到何種程度。假如我們選擇=0.05,樣本數據能拒絕原假設的證據要強到:當H0正確時,這種樣本結果發生的頻率不超過5%;如果我們選擇=0.01,就是要求拒絕H0的證據要更強,這種樣本結果發生的頻率只有1%5. 由研究者事先確定顯著性水平和拒絕域

(雙側檢驗)H0臨界值臨界值

a/2a/2

樣本統計量拒絕H0拒絕H0抽樣分布1-置信水平顯著性水平和拒絕域

(左側檢驗)H0臨界值a樣本統計量拒絕H0抽樣分布1-置信水平顯著性水平和拒絕域

(右側檢驗)H0臨界值a樣本統計量抽樣分布1-置信水平拒絕H0顯著水平和拒絕域單側檢驗與雙側檢驗α/21–αα/2-Zα/2

Zα/2

α–Zα0

α0Zα雙側檢驗左側檢驗右側檢驗1.根據樣本觀測結果計算得到的,并據以對原假設和備擇假設作出決策的某個樣本統計量2.對樣本估計量的標準化結果檢驗統計量(teststatistic)

標準化的檢驗統計量總體均值的檢驗

(作出判斷)是否已知小(正態總體)樣本容量n大是否已知否t檢驗否z檢驗是z檢驗

是z檢驗假設檢驗結論的表述假設檢驗結論的表述

(“顯著”與“不顯著”)當拒絕原假設時,我們稱樣本結果是統計上顯著的拒絕原假設時結論是清楚的當不拒絕原假設時,我們稱樣本結果是統計上不顯著的不拒絕原假設時,并未給出明確的結論,不能說原假設是正確的,也不能說它不是正確的假設檢驗結論的表述

(“接受”與“不拒絕”)假設檢驗的目的在于試圖找到證據拒絕原假設,而不在于證明什么是正確的當沒有足夠證據拒絕原假設時,不采用“接受原假設”的表述,而采用“不拒絕原假設”的表述。“不拒絕”的表述實際上意味著并未給出明確的結論,我們沒有說原假設正確,也沒有說它不正確“接受”的說法有時會產生誤導,因為這種說法似乎暗示著原假設已經被證明是正確的了。但事實上,H0的真實值我們永遠也無法知道,H0只是對總體真實值的一個假定值,由樣本提供的信息也就自然無法證明它是否正確……正如一個法庭宣告某一判決為“無罪(notguilty)”而不為“清白(innocent)”,統計檢驗的結論也應為“不拒絕”而不為“接受”。

JanKmenta假設檢驗結論的表述

(為什么不說“接受”)【例】比如原假設為H0:=10,從該總體中抽出一個隨機樣本,得到x=9.8,s=1,在=0.05的水平上,樣本提供的證據沒有推翻這一假設,我們說“接受”原假設,這意味著樣本提供的證據已經證明=10是正確的。如果我們將原假設改為H0:=10.5,同樣,在=0.05的水平上,樣本提供的證據也沒有推翻這一假設,我們又說“接受”原假設。但這兩個原假設究竟哪一個是“真實的”呢?我們不知道假設檢驗步驟的總結陳述原假設和備擇假設確定一個適當的顯著性水平,并計算出其臨界值,指定拒絕域從所研究的總體中抽出一個隨機樣本,并利用樣本數據算出其具體統計量將統計量的值與臨界值進行比較,作出決策統計量的值落在拒絕域,拒絕H0,否則不拒絕H0也可以直接利用P值作出決策5.給出結論8.2一個總體參數的檢驗8.2.1總體均值的檢驗8.2.2總體比例的檢驗8.2.3總體方差的檢驗總體均值的檢驗總體均值的檢驗(例題分析)【例】一種罐裝飲料采用自動生產線生產,每罐的容量是255ml,標準差為5ml。為檢驗每罐容量是否符合要求,質檢人員在某天生產的飲料中隨機抽取了40罐進行檢驗,測得每罐平均容量為255.8ml。取顯著性水平=0.05,檢驗該天生產的飲料容量是否符合標準要求?H0

=255H1

255=0.05臨界值(c):檢驗統計量:決策:結論:

不拒絕H0樣本提供的證據還不足以推翻“該天生產的飲料符合標準要求”的看法0.025拒絕H0拒絕H00.025總體均值的檢驗(例題分析)【例】某一小麥品種的平均產量為5200kg/hm2

。一家研究機構對小麥品種進行了改良以期提高產量。為檢驗改良后的新品種產量是否有顯著提高,隨機抽取了36個地塊進行試種,得到的樣本平均產量為5275kg/hm2,標準差為120/hm2

。試檢驗改良后的新品種產量是否有顯著提高?(=0.05)H0

5200H1

>5200=0.05臨界值(c):z0拒絕H00.051.645檢驗統計量:拒絕H0(P=0.000088<

=0.05)改良后的新品種產量有顯著提高決策:結論:總體均值的檢驗

(例題分析)【例】一種汽車配件的平均長度要求為12cm,高于或低于該標準均被認為是不合格的。汽車生產企業在購進配件時,通常是經過招標,然后對中標的配件提供商提供的樣品進行檢驗,以決定是否購進。現對一個配件提供商提供的10個樣本進行了檢驗。假定該供貨商生產的配件長度服從正態分布,在0.05的顯著性水平下,檢驗該供貨商提供的配件是否符合要求?10個零件尺寸的長度(cm)12.210.812.011.811.912.411.312.212.012.3總體均值的檢驗

(例題分析)H0

=12H1

12=0.05df=10-1=9臨界值(c):檢驗統計量:不拒絕H0樣本提供的證據還不足以推翻“該供貨商提供的零件符合要求”的看法決策:結論:t02.262-2.2620.025拒絕

H0拒絕H00.025總體比例的檢驗

(例題分析)【例】一種以休閑和娛樂為主題的雜志,聲稱其讀者群中有80%為女性。為驗證這一說法是否屬實,某研究部門抽取了由200人組成的一個隨機樣本,發現有146個女性經常閱讀該雜志。分別取顯著性水平=0.05和=0.01,檢驗該雜志讀者群中女性的比例是否為80%?它們的P值各是多少?H0

=80%H1

80%

=0.05n

=200臨界值(c):z01.96-1.960.025拒絕

H0拒絕

H00.025檢驗統計量:拒絕H0(P=0.013328<

=0.05)該雜志的說法并不屬實

決策:結論:總體方差的檢驗20/22

020總體方差的檢驗

(檢驗方法的總結)假設雙側檢驗左側檢驗右側檢驗假設形式H0

:2=02H1:2

0H0

:2

02H1:2

<

02H0:2

02H1:2

>02統計量拒絕域P值決策

拒絕H0總體方差的檢驗(例題分析)【例】啤酒生產企業采用自動生產線灌裝啤酒,每瓶的裝填量為640ml,但由于受某些不可控因素的影響,每瓶的裝填量會有差異。假定生產標準規定每瓶裝填量的標準差不應超過和不應低于4ml。企業質檢部門抽取了10瓶啤酒進行檢驗,得到的樣本標準差為s=3.8ml。試以0.10的顯著性水平檢驗裝填量的標準差是否符合要求?H0

:2=42H1

:2

42=0.10df=10-1=9臨界值(s):2016.91903.32511/2=0.05統計量:不拒絕H0樣本提供的證據還不足以推翻“裝填量的標準差不符合要求”的看法

決策:結論:利用

P值進行決策什么是P值?

(P-value)如果原假設為真,所得到的樣本結果會像實際觀測結果那么極端或更極端的概率P值告訴我們:如果原假設是正確的話,我們得到得到目前這個樣本數據的可能性有多大,如果這個可能性很小,就應該拒絕原假設決策規則:若p值<,拒絕H0雙側檢驗的P值/

2/

2Z拒絕H0拒絕H00臨界值計算出的樣本統計量計算出的樣本統計量臨界值1/2P值1/2P值左側檢驗的P值0臨界值a樣本統計量拒絕H0抽樣分布1-置信水平計算出的樣本統計量P值右側檢驗的P值0臨界值a拒絕H0抽樣分布1-置信水平計算出的樣本統計量P值z檢驗的p-值:檢驗統計量為z統計量的p-值計算公式,表示檢驗統計量的抽樣數據,則p-值的計算方法如下:如果:,p-值=2 如果:,p-值= 如果:,p-值=

用P值進行檢驗比根據統計量檢驗提供更多的信息統計量檢驗是我們事先給出的一個顯著性水平,以此為標準進行決策,無法知道實際的顯著性水平究竟是多少比如,根據統計量進行檢驗時,只要統計量的值落在拒絕域,我們拒絕原假設得出的結論都是一樣的,即結果顯著。但實際上,統計量落在拒絕域不同的地方,實際的顯著性是不同的。比如,統計量落在臨界值附近與落在遠離臨界值的地方,實際的顯著性就有較大差異。而P值給出的是實際算出的顯著水平,它告訴我們實際的顯著性水平是多少P值決策與統計量的比較拒絕H0P值決策與統計量的比較拒絕H0的兩個統計量的不同顯著性Z拒絕H00統計量1

P1

值統計量2

P2

值拒絕H0臨界值總體均值的檢驗(例題分析)【例】某一小麥品種的平均產量為5200kg/hm2

。一家研究機構對小麥品種進行了改良以期提高產量。為檢驗改良后的新品種產量是否有顯著提高,隨機抽取了36個地塊進行試種,得到的樣本平均產量為5275kg/hm2,標準差為120/hm2

。試檢驗改良后的新品種產量是否有顯著提高?(=0.05)H0

5200H1

>5200=0.05臨界值(c):z0拒絕H00.051.645檢驗統計量:拒絕H0(P=0.000088<

=0.05)改良后的新品種產量有顯著提高決策:結論:總體均值的檢驗(z檢驗)

(P值的圖示)抽樣分布P=0.00008801.645a=0.05拒絕H01-計算出的樣本統計量=3.75P值總體均值的檢驗(例題分析)【例】一種罐裝飲料采用自動生產線生產,每罐的容量是255ml,標準差為5ml。為檢驗每罐容量是否符合要求,質檢人員在某天生產的飲料中隨機抽取了40罐進行檢驗,測得每罐平均容量為255.8ml。取顯著性水平=0.05,檢驗該天生產的飲料容量是否符合標準要求?H0

=255H1

255=0.05臨界值(c):檢驗統計量:決策:結論:

不拒絕H0(P=0.3104>

=0.05)樣本提供的證據還不足以推翻“該天生產的飲料符合標準要求”的看法0.025拒絕H0拒絕H00.025總體比例的檢驗

(例題分析)【例】一種以休閑和娛樂為主題的雜志,聲稱其讀者群中有80%為女性。為驗證這一說法是否屬實,某研究部門抽取了由200人組成的一個隨機樣本,發現有146個女性經常閱讀該雜志。分別取顯著性水平=0.05和=0.01,檢驗該雜志讀者群中女性的比例是否為80%?它們的P值各是多少?H0

=80%H1

80%

=0.05n

=200臨界值(c):z01.96-1.960.025拒絕

H0拒絕

H00.025檢驗統計量:拒絕H0(P=0.013328<

=0.05)該雜志的說法并不屬實

決策:結論:假設檢驗中的兩類錯誤假設檢驗中的兩類錯誤1. 第Ⅰ類錯誤(棄真錯誤)原假設為正確時拒絕原假設第Ⅰ類錯誤的概率記為被稱為顯著性水平2. 第Ⅱ類錯誤(取偽錯誤)原假設為錯誤時未拒絕原假設第Ⅱ類錯誤的概率記為(Beta)H0臨界值臨界值

a/2a/2

樣本統計量拒絕H0拒絕H0抽樣分布1-置信水平檢驗能力

(poweroftest)拒絕一個錯誤的原假設的能力根據的定義,是指沒有拒絕一個錯誤的原假設的概率。這也就是說,1-

則是指拒絕一個錯誤的原假設的概率,這個概率被稱為檢驗能力,也被稱為檢驗的勢或檢驗的功效(power)可解釋為正確地拒絕一個錯誤的原假設的概率

錯誤和

錯誤的關系你要同時減少兩類錯誤的惟一辦法是增加樣本容量!和的關系就像翹翹板,小就大,大就小8.3兩個總體參數的檢驗8.3.1兩個總體均值之差的檢驗8.3.2兩個總體比例之差的檢驗8.3.3兩個總體方差比的檢驗兩個總體均值之差的檢驗

兩個總體均值之差的檢驗

(獨立大樣本)1. 假定條件兩個樣本是獨立的隨機樣本正態總體或非正態總體大樣本(n130和n230)檢驗統計量12

,22

已知:12

,22

未知:兩個總體均值之差的檢驗

(12,

22

已知)假定條件兩個獨立的小樣本兩個總體都是正態分布12,22已知檢驗統計量兩個總體均值之差的檢驗

(12,22

未知但12=22)假定條件兩個獨立的小樣本兩個總體都是正態分布12、22未知但相等,即12=22檢驗統計量其中:自由度:兩個總體均值之差的檢驗

(12,

22

未知且不相等1222)假定條件兩個總體都是正態分布12,22未知且不相等,即1222檢驗統計量自由度:兩個總體均值之差的檢驗

(例題分析)

【例】某公司對男女職員的平均小時工資進行了調查,獨立抽取了具有同類工作經驗的男女職員的兩個隨機樣本,并記錄下兩個樣本的均值、方差等資料如右表。在顯著性水平為0.05的條件下,能否認為男性職員與女性職員的平均小時工資存在顯著差異?

兩個樣本的有關數據

男性職員女性職員n1=44n1=32=75=70S12=64S22=42.25兩個總體均值之差的檢驗

(例題分析)H0

:1-2=0H1

:1-2

0=0.05n1=44,n2

=32臨界值(c):檢驗統計量:決策:結論:

拒絕H0該公司男女職員的平均小時工資之間存在顯著差異

z01.96-1.960.025拒絕H0拒絕H00.025兩個總體均值之差的檢驗

(例題分析)

【例】某飲料公司開發研制出一新產品,為比較消費者對新老產品口感的滿意程度,該公司隨機抽選一組消費者(8人),每個消費者先品嘗一種飲料,然后再品嘗另一種飲料,兩種飲料的品嘗順序是隨機的,而后每個消費者要對兩種飲料分別進行評分(0分~10分),評分結果如下表。取顯著性水平=0.05,該公司是否有證據認為消費者對兩種飲料的評分存在顯著差異?兩種飲料平均等級的樣本數據舊飲料54735856新飲料66743976兩個總體比例之差的檢驗1. 假定條件兩個總體都服從二項分布可以用正態分布來近似檢驗統計量檢驗H0:1-2=0, >

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論