統計學-第八章假設檢驗_第1頁
統計學-第八章假設檢驗_第2頁
統計學-第八章假設檢驗_第3頁
統計學-第八章假設檢驗_第4頁
統計學-第八章假設檢驗_第5頁
免費預覽已結束,剩余67頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第8章假設檢驗8.1

假設檢驗的基本原理8.2

一個總體參數的檢驗正常人的平均體溫是37oC嗎?當問起健康的成年人體溫是多少時,多數人的回答是37oC,這似乎已經成了一種共識。下面是一個研究人員測量的50個健康成年人的體溫數據37.136.936.937.136.436.936.636.236.736.937.636.737.336.936.436.137.136.636.536.737.136.236.337.536.937.036.736.937.037.136.637.236.436.637.336.137.137.036.636.936.737.236.337.136.736.837.037.036.137.0正常人的平均體溫是37oC嗎?根據樣本數據計算的平均值是36.8oC

,標準差為0.36oC

根據參數估計方法得到的健康成年人平均體溫的95%的置信區間為(36.7,36.9)。研究人員發現這個區間內并沒有包括37oC因此提出“不應該再把37oC作為正常人體溫的一個有任何特定意義的概念”我們應該放棄“正常人的平均體溫是37oC”這個共識嗎?本章的內容就將提供一套標準統計程序來檢驗這樣的觀點8.1假設檢驗的基本原理

8.1.1怎樣提出假設?

8.1.2怎樣做出決策?

8.1.3怎樣表述決策結果?第8章假設檢驗8.1.1怎樣提出假設?8.1假設檢驗的基本原理什么是假設?

(hypothesis)在參數檢驗中,對總體參數的具體數值所作的陳述就一個總體而言,總體參數包括總體均值、比例、方差等分析之前必需陳述什么是假設檢驗?

(hypothesistest)先對總體的參數(或分布形式)提出某種假設,然后利用樣本信息判斷假設是否成立的統計方法有參數檢驗和非參數檢驗邏輯上運用反證法,統計上依據小概率原理小概率是在一次試驗中,一個幾乎不可能發生的事件發生的概率在一次試驗中小概率事件一旦發生,我們就有理由拒絕原假設原假設

(nullhypothesis)又稱“0假設”,研究者想收集證據予以反對的假設,用H0表示所表達的含義總是指參數沒有變化或變量之間沒有關系

最初被假設是成立的,之后根據樣本數據確定是否有足夠的證據拒絕它總是有符號,或H0:

=某一數值H0:

某一數值H0:

某一數值例如,H0:

10cmnull也稱“研究假設”,研究者想收集證據予以支持的假設,用H1或Ha表示所表達的含義是總體參數發生了變化或變量之間有某種關系備擇假設通常用于表達研究者自己傾向于支持的看法,然后就是想辦法收集證據拒絕原假設,以支持備擇假設

總是有符號

,

或H1:

某一數值H1:

某一數值H1:<某一數值備擇假設(alternativehypothesis)備擇假設沒有特定的方向性,并含有符號“”的假設檢驗,稱為雙側檢驗或雙尾檢驗(two-tailedtest)

備擇假設具有特定的方向性,并含有符號“>”或“<”的假設檢驗,稱為單側檢驗或單尾檢驗(one-tailedtest)備擇假設的方向為“<”,稱為左側檢驗

備擇假設的方向為“>”,稱為右側檢驗

雙側檢驗與單側檢驗雙側檢驗與單側檢驗

(假設的形式)假設雙側檢驗單側檢驗左側檢驗右側檢驗原假設H0:m

=m0H0:m

m0H0:m

m0備擇假設H1:m

≠m0H1:m

<m0H1:m

>m0以總體均值的檢驗為例【例】一種零件的生產標準是直徑應為10cm,為對生產過程進行控制,質量監測人員定期對一臺加工機床檢查,確定這臺機床生產的零件是否符合標準要求。如果零件的平均直徑大于或小于10cm,則表明生產過程不正常,必須進行調整。試陳述用來檢驗生產過程是否正常的原假設和被擇假設提出假設(例題分析)解:研究者想收集證據予以證明的假設應該是“生產過程不正常”。建立的原假設和備擇假設為

H0:

10cmH1:

10cm

【例】某品牌洗滌劑在它的產品說明書中聲稱:平均凈含量不少于500克。從消費者的利益出發,有關研究人員要通過抽檢其中的一批產品來驗證該產品制造商的說明是否屬實。試陳述用于檢驗的原假設與備擇假設提出假設(例題分析)解:研究者抽檢的意圖是傾向于證實這種洗滌劑的平均凈含量并不符合說明書中的陳述。建立的原假設和備擇假設為

H0:

500H1:

<500【例】一家研究機構估計,某城市中家庭擁有汽車的比例超過30%。為驗證這一估計是否正確,該研究機構隨機抽取了一個樣本進行檢驗。試陳述用于檢驗的原假設與備擇假設提出假設(例題分析)解:研究者想收集證據予以支持的假設是“該城市中家庭擁有汽車的比例超過30%”。建立的原假設和備擇假設為

H0:

30%H1:

30%原假設和備擇假設是一個完備事件組,而且相互對立在一項假設檢驗中,原假設和備擇假設必有一個成立,而且只有一個成立先確定備擇假設,再確定原假設等號“=”總是放在原假設上因研究目的不同,對同一問題可能提出不同的假設(也可能得出不同的結論)提出假設(結論與建議)8.1.2怎樣做出決策?8.1假設檢驗的基本原理兩類錯誤與顯著性水平研究者總是希望能做出正確的決策,但由于決策是建立在樣本信息的基礎之上,而樣本又是隨機的,因而就有可能犯錯誤原假設和備擇假設不能同時成立,決策的結果要么拒絕H0,要么不拒絕H0。決策時總是希望當原假設正確時沒有拒絕它,當原假設不正確時拒絕它,但實際上很難保證不犯錯誤第Ⅰ類錯誤(錯誤)原假設為正確時拒絕原假設第Ⅰ類錯誤的概率記為,被稱為顯著性水平2. 第Ⅱ類錯誤(錯誤)原假設為錯誤時未拒絕原假設第Ⅱ類錯誤的概率記為(Beta)兩類錯誤的控制一般來說,對于一個給定的樣本,如果犯第Ι類錯誤的代價比犯第Ⅱ類錯誤的代價相對較高,則將犯第Ⅰ類錯誤的概率定得低些較為合理;反之,如果犯第Ι類錯誤的代價比犯第Ⅱ類錯誤的代價相對較低,則將犯第Ⅰ類錯誤的概率定得高些一般來說,發生哪一類錯誤的后果更為嚴重,就應該首要控制哪類錯誤發生的概率。但由于犯第Ι類錯誤的概率是可以由研究者控制的,因此在假設檢驗中,人們往往先控制第Ι類錯誤的發生概率顯著性水平

(significantlevel)事先確定的用于拒絕原假設H0時所必須的證據能夠容忍的犯第Ⅰ類錯誤的最大概率(上限值)2. 原假設為真時,拒絕原假設的概率抽樣分布的拒絕域3. 表示為(alpha)

常用的值有0.01,0.05,0.104. 由研究者事先確定依據什么做出決策?若假設為H0:=500,H1:<500。樣本均值為495,拒絕H0嗎?樣本均值為502,拒絕H0嗎?做出拒絕或不拒絕原假設的依據是什么?傳統上,做出決策所依據的是樣本統計量,現代檢驗中人們直接使用由統計量算出的犯第Ⅰ類錯誤的概率,即所謂的P值根據樣本觀測結果計算出對原假設和備擇假設做出決策某個樣本統計量對樣本估計量的標準化結果原假設H0為真點估計量的抽樣分布檢驗統計量(teststatistic)

標準化的檢驗統計量

用統計量決策

(雙側檢驗)抽樣分布H0臨界值臨界值a/2a/2拒絕H0拒絕H01-置信水平RegionofRejectionRegionofNonrejectionRegionofRejection用統計量決策

(左側檢驗)抽樣分布H0臨界值a拒絕H01-置信水平RegionofRejectionRegionofNonrejection用統計量決策

(右側檢驗)抽樣分布H0臨界值2拒絕H01-置信水平RegionofNonrejectionRegionofRejection統計量決策規則給定顯著性水平,查表得出相應的臨界值z或z/2,t或t/2將檢驗統計量的值與水平的臨界值進行比較作出決策雙側檢驗:I統計量I>臨界值,拒絕H0左側檢驗:統計量<-臨界值,拒絕H0右側檢驗:統計量>臨界值,拒絕H0用P值決策

(P-value)如果原假設為真,所得到的樣本結果會像實際觀測結果那么極端或更極端的概率P值告訴我們:如果原假設是正確的話,我們得到得到目前這個樣本數據的可能性有多大,如果這個可能性很小,就應該拒絕原假設被稱為觀察到的(或實測的)顯著性水平決策規則:若p值<,拒絕H0雙側檢驗的P值/

2/

2Z拒絕H0拒絕H00臨界值計算出的樣本統計量計算出的樣本統計量臨界值1/2P值1/2P值左側檢驗的P值Z拒絕H00臨界值計算出的樣本統計量1/2P值右側檢驗的P值Z拒絕H00計算出的樣本統計量臨界值1/2P值P值是關于數據的概率P值與原假設的對或錯的概率無關它反映的是在某個總體的許多樣本中某一類數據出現的經常程度,它是當原假設正確時,得到目前這個樣本數據的概率比如,要檢驗全校學生的平均生活費支出是否等于500元,檢驗的假設為H0:=500;H0:500。假定抽出一個樣本算出的樣本均值600元,得到的值為P=0.02,這個0.02是指如果平均生活費支出真的是500元的話,那么,從該總體中抽出一個均值為600的樣本的概率僅為0.02。如果你認為這個概率太小了,就可以拒絕原假設,因為如果原假設正確的話,幾乎不可能抓到這樣的一個樣本,既然抓到了,就表明這樣的樣本不在少數,所以原假設是不對的P值越小,你拒絕原假設的理由就越充分要證明原假設不正確,P值要多小,才能令人信服呢?原假設的可信度又多高?如果H0所代表的假設是人們多年來一直相信的,就需要很強的證據(小的P值)才能說服他們拒絕的結論是什么?如果拒絕H0而肯定H1

,你就需要有很強的證據顯示要支持H1。比如,H1代表要花很多錢把產品包裝改換成另一種包裝,你就要有很強的證據顯示新包裝一定會增加銷售量(因為拒絕H0要花很高的成本)多大的P值合適?有了P值,我們并不需要用5%或1%這類傳統的顯著性水平。P值提供了更多的信息,它讓我們可以選擇任意水平來評估結果是否具有統計上的顯著性,從而可根據我們的需要來決定是否要拒絕原假設只要你認為這么大的P值就算是顯著了,你就可以在這樣的P值水平上拒絕原假設傳統的顯著性水平,如1%、5%、10%等等,已經被人們普遍接受為“拒絕原假設足夠證據”的標準,我們大概可以說:10%代表有“一些證據”不利于原假設;5%代表有“適度證據”不利于原假設;1%代表有“很強證據”不利于原假設固定顯著性水平是否有意義用P值進行檢驗比根據統計量檢驗提供更多的信息統計量檢驗是我們事先給出的一個顯著性水平,以此為標準進行決策,無法知道實際的顯著性水平究竟是多少比如,根據統計量進行檢驗時,只要統計量的值落在拒絕域,我們拒絕原假設得出的結論都是一樣的,即結果顯著。但實際上,統計量落在拒絕域不同的地方,實際的顯著性是不同的。比如,統計量落在臨界值附近與落在遠離臨界值的地方,實際的顯著性就有較大差異。而P值給出的是實際算出的顯著水平,它告訴我們實際的顯著性水平是多少P值決策與統計量的比較拒絕H0P值決策與統計量的比較拒絕H0的兩個統計量的不同顯著性Z拒絕H00統計量1

P1

值統計量2

P2

值拒絕H0臨界值8.1.3怎樣表述決策結果?8.1假設檢驗的基本原理假設檢驗不能證明原假設正確假設檢驗的目的主要是收集證據拒絕原假設,而支持你所傾向的備擇假設假設檢驗只提供不利于原假設的證據。因此,當拒絕原假設時,表明樣本提供的證據證明它是錯誤的,當沒有拒絕原假設時,我們也沒法證明它是正確的,因為假設檢驗的程序沒有提供它正確的證據這與法庭上對被告的定罪類似:先假定被告是無罪的,直到你有足夠的證據證明他是有罪的,否則法庭就不能認定被告有罪。當證據不足時,法庭的裁決是“被告無罪”,但這里也沒有證明被告就是清白的假設檢驗不能證明原假設正確假設檢驗得出的結論都是根據原假設進行闡述的我們要么拒絕原假設,要么不拒絕原假設當不能拒絕原假設時,我們也從來不說“接受原假設”,因為沒有證明原假設是真的采用“接受”原假設的說法,則意味著你證明了原假設是正確的沒有足夠的證據拒絕原假設并不等于你已經“證明”了原假設是真的,它僅僅意為著目前還沒有足夠的證據拒絕原假設,只表示手頭上這個樣本提供的證據還不足以拒絕原假設比如,在上例中,如果拒絕原假設,表明樣本提供的證據證明該品牌洗滌劑的凈含量與說明書所標識的不相符。如果不拒絕原假設,只能說這個樣本提供的證據還不足證明凈含量不是500克或500克以上,并不等于證明了凈含量就超過了500克“不拒絕”的表述方式實際上意味著沒有得出明確的結論假設檢驗不能證明原假設正確“接受”的說法有時會產生誤導這種說法似乎暗示著原假設已經被證明是正確的了實事上,H0的真實值我們永遠也無法知道,不知道真實值是什么,又怎么能證明它是什么?H0只是對總體真實值的一個假定值,由樣本提供的信息也就自然無法證明它是否正確采用“不拒絕”的表述方法更合理一些,因為這種表述意味著樣本提供的證據不夠強大,因而沒有足夠的理由拒絕,這不等于已經證明原假設正確假設檢驗不能證明原假設正確【例】比如原假設為H0:=10,從該總體中抽出一個隨機樣本,得到x=9.8,在=0.05的水平上,樣本提供的證據沒有推翻這一假設,我們說“接受”原假設,這意為著樣本提供的證據已經證明=10是正確的。如果我們將原假設改為H0:=10.5,同樣,在=0.05的水平上,樣本提供的證據也沒有推翻這一假設,我們又說“接受”原假設。但這兩個原假設究竟哪一個是“真實的”呢?假設檢驗不能證明原假設正確假設檢驗中通常是先確定顯著性水平,這就等于控制了第Ι類錯誤的概率,但犯第Ⅱ類錯誤的概率卻是不確定的在拒絕H0時,犯第Ⅰ類錯誤的概率不超過給定的顯著性水平,當樣本結果顯示沒有充分理由拒絕原假設時,也難以確切知道第Ⅱ類錯誤發生的概率采用“不拒絕”而不采用“接受”的表述方式,在多數場合下便避免了錯誤發生的風險因為“接受”所得結論可靠性將由第Ⅱ類錯誤的概率來測量,而的控制又相對復雜,有時甚至根本無法知道的值,除非你能確切給出,否則就不宜表述成“接受”原假設假設檢驗不能證明原假設正確在實際檢驗中,針對一個具體的問題,將檢驗結果表述為“不拒絕”原假設,這似乎讓人感到無所是從比如,你想購買一批產品,檢驗的結果沒有拒絕原假設,即達到合同規定的標準要求,你是否購買這批產品呢?這時,你可以對檢驗的結果采取某種默認態度,退一步說,你可以將檢驗結果表述為“可以接受”原假設,你但這并不等于說你“確實接受”它統計上顯著不一定有實際意義當拒絕原假設時,我們稱樣本結果是統計上顯著的(statisticallySignificant)當不拒絕原假設時,我們稱樣本結果是統計上不顯著的在“顯著”和“不顯著”之間沒有清除的界限,只是在P值越來越小時,我們就有越來越強的證據,檢驗的結果也就越來越顯著“顯著的”(Significant)一詞的意義在這里并不是“重要的”,而是指“非偶然的”一項檢驗在統計上是“顯著的”,意思是指:這樣的(樣本)結果不是偶然得到的,或者說,不是靠機遇能夠得到的如果得到這樣的樣本概率(P)很小,則拒絕原假設在這么小的概率下竟然得到了這樣的一個樣本,表明這樣的樣本經常出現,所以,樣本結果是顯著的統計上顯著不一定有實際意義統計上顯著不一定有實際意義在進行決策時,我們只能說P值越小,拒絕原假設的證據就越強,檢驗的結果也就越顯著但P值很小而拒絕原假設時,并不一定意味著檢驗的結果就有實際意義因為假設檢驗中所說的“顯著”僅僅是“統計意義上的顯著”一個在統計上顯著的結論在實際中卻不見得就很重要,也不意味著就有實際意義因為值與樣本的大小密切相關,樣本量越大,檢驗統計量的P值也就越大,P值就越小,就越有可能拒絕原假設統計上顯著不一定有實際意義如果你主觀上要想拒絕原假設那就一定能拒絕它這類似于我們通常所說的“欲加之罪,何患無詞”只要你無限制擴大樣本量,幾乎總能拒絕原假設當樣本量很大時,解釋假設檢驗的結果需要小心在大樣本情況下,總能把與假設值的任何細微差別都能查出來,即使這種差別幾乎沒有任何實際意義在實際檢驗中,不要刻意追求“統計上的”顯著性,也不要把統計上的顯著性與實際意義上的顯著性混同起來一個在統計上顯著的結論在實際中卻不見得很重要,也不意為著就有實際意義統計上顯著不一定有實際意義

(樣本量對檢驗結果的影響)投擲硬幣1000次、4040次和10000次時出現正面樣本比例的抽樣分布0.50.507這個結果出乎預料嗎?n=1000n=4040n=100008.2一個總體參數的檢驗

8.2.1總體均值的檢驗

8.2.2總體比例的檢驗

8.2.3總體方差的檢驗第8章假設檢驗8.2.1總體均值的檢驗

(大樣本)8.2一個總體參數的檢驗總體均值的檢驗

(大樣本)1. 假定條件大樣本(n30)使用z檢驗統計量2

已知:2

未知:總體均值的檢驗(2

已知)

(例題分析—大樣本)【例】一種罐裝飲料采用自動生產線生產,每罐的容量是255ml,標準差為5ml。為檢驗每罐容量是否符合要求,質檢人員在某天生產的飲料中隨機抽取了40罐進行檢驗,測得每罐平均容量為255.8ml。取顯著性水平=0.05

,檢驗該天生產的飲料容量是否符合標準要求?雙側檢驗總體均值的檢驗(2

已知)

(例題分析-大樣本)H0

=255H1

255

=

0.05n

=

40臨界值(c):檢驗統計量:決策:結論:

因為Z=1.01<1.96,所以在

=

0.05的顯著性水平上不拒絕H0.用Excel中的【NORMSDIST】函數得到的雙尾檢驗P=0.3125>0.05不拒絕H0沒有證據表明該天生產的飲料不符合標準要求

z01.96-1.960.025拒絕H0拒絕H00.025總體均值的檢驗(2

未知)

(例題分析—大樣本)【例】一種機床加工的零件尺寸絕對平均誤差為1.35mm。生產廠家現采用一種新的機床進行加工以期進一步降低誤差。為檢驗新機床加工的零件平均誤差與舊機床相比是否有顯著降低,從某天生產的零件中隨機抽取50個進行檢驗。利用這些樣本數據,檢驗新機床加工的零件尺寸的平均誤差與舊機床相比是否有顯著降低?(=0.01)

左側檢驗50個零件尺寸的誤差數據(mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.86總體均值的檢驗

(例題分析—大樣本)H0

1.35H1

<1.35

=

0.01n

=

50臨界值(c):檢驗統計量:因為Z=-2.6061<-2.33,所以在

=

0.01的顯著性水平上不拒絕H0.新機床加工的零件尺寸的平均誤差與舊機床相比有顯著降低決策:結論:-2.33z0拒絕H00.01總體均值的檢驗

(P值的圖示)計算出的樣本統計量=2.6061P=0.004579

Z拒絕H00臨界值P值總體均值的檢驗(2

未知)

(例題分析)【例】某一小麥品種的平均產量為5200kg/hm2

。一家研究機構對小麥品種進行了改良以期提高產量。為檢驗改良后的新品種產量是否有顯著提高,隨機抽取了36個地塊進行試種,得到的樣本平均產量為5275kg/hm2,標準差為120/hm2

。試檢驗改良后的新品種產量是否有顯著提高?(=0.05)

右側檢驗總體均值的檢驗(2

未知)

(例題分析)H0

5200H1

>5200

=

0.05n

=

36臨界值(c):檢驗統計量:拒絕H0

(P=0.000088<

=0.05)改良后的新品種產量有顯著提高

決策:結論:z0拒絕H00.051.645總體均值的檢驗(z檢驗)

(P值的圖示)抽樣分布P=0.000088

01.645a=0.05拒絕H01-計算出的樣本統計量=3.75P值總體均值的檢驗

(小樣本)1. 假定條件總體服從正態分布小樣本(n<

30)檢驗統計量2

已知:2

未知:總體均值的檢驗

(例題分析—小樣本)【例】一種汽車配件的平均長度要求為12cm,高于或低于該標準均被認為是不合格的。汽車生產企業在購進配件時,通常是經過招標,然后對中標的配件提供商提供的樣品進行檢驗,以決定是否購進。現對一個配件提供商提供的10個樣本進行了檢驗。假定該供貨商生產的配件長度服從正態分布,在0.05的顯著性水平下,檢驗該供貨商提供的配件是否符合要求?10個零件尺寸的長度(cm)12.210.812.011.811.912.411.312.212.012.3總體均值的檢驗

(例題分析—小樣本)H0

=12H1

12

=0.05df=10-1=9臨界值(c):檢驗統計量:不拒絕H0沒有證據表明該供貨商提供的零件不符合要求

決策:結論:t02.262-2.2620.025拒絕

H0拒絕H00.025一個總體均值的檢驗

(作出判斷)是否已知小樣本量n大是否已知否t檢驗否z檢驗是z檢驗

是z檢驗8.2.2總體成數的檢驗8.2一個總體參數的檢驗總體成數檢驗假定條件總體服從二項分布可用正態分布來近似(大樣本)檢驗的z統計量0為假設的總體成數總體成數的檢驗

(例題分析)【例】一種以休閑和娛樂為主題的雜志,聲稱其讀者群中有80%為女性。為驗證這一說法是否屬實,某研究部門抽取了由200人組成的一個隨機樣本,發現有146個女性經常閱讀該雜志。分別取顯著性水平

=0.05和=0.01

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論