概統(tǒng)(茆詩松)第二版第七章假設檢驗_第1頁
概統(tǒng)(茆詩松)第二版第七章假設檢驗_第2頁
概統(tǒng)(茆詩松)第二版第七章假設檢驗_第3頁
概統(tǒng)(茆詩松)第二版第七章假設檢驗_第4頁
概統(tǒng)(茆詩松)第二版第七章假設檢驗_第5頁
已閱讀5頁,還剩76頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

7.2.2兩個正態(tài)總體均值差的檢驗檢驗法條件原假設備擇假設檢驗統(tǒng)計量拒絕域u檢驗已知t檢驗未知大樣本檢u驗

未知m,n充分大近似t檢驗未知m,n不很大例7.2.3

某廠鑄造車間為提高鑄件的耐磨性而試制了一種鎳合金鑄件以取代銅合金鑄件,為此,從兩種鑄件中各抽取一個容量分別為

8和9的樣本,測得其硬度為

鎳合金:76.4376.2173.5869.6965.2970.8382.7572.34銅合金:73.6664.2769.3471.3769.7768.1267.2768.0762.61根據經驗,硬度服從正態(tài)分布,且方差保持不變。試在顯著性水平下判斷鎳合金的硬度是否有明顯提高。解:用X表示鎳合金的硬度,Y表示銅合金的硬度,則由假定,

要檢驗的假設是:

經計算,

從而二、兩個正態(tài)總體方差比的F檢驗

是來自

的樣本,

是來自

的樣本。考慮如下三個假設檢驗問題

通常

,均未知,記

,分別是由算得的

的無偏估計和由

算得的

的無偏估計.可建立檢驗統(tǒng)計量:三種檢驗問題對應的拒絕域依次為}。

或例7.2.5

甲、乙兩臺機床加工某種零件,零件的直徑服從正態(tài)分布,總體方差反映了加工精度,為比較兩臺機床的加工精度有無差別,現(xiàn)從各自加工的零件中分別抽取7件產品和8

件產品,測得其直徑為

X(機床甲)16.216.415.815.516.715.615.8Y(機床乙)15.916.016.416.116.515.815.715.0這就形成了一個雙側假設檢驗問題,原假設是

備擇假設為此處m=7,n=8,經計算查表知于是

,若取

=0.05,其拒絕域為由此可見,樣本未落入拒絕域,即在0.05水平下可以認為兩臺機床的加工精度一致。

§7.3

其他分布參數的假設檢驗7.3.1指數分布參數的假設檢驗設x1,x2

,

…,xn

是來自指數分布的樣本,關于的如下檢驗問題:

(7.3.1)拒絕域的形式是

,由于在=0時,所以拒絕域為例7.3.1

設我們要檢驗某種元件的平均壽命不小于6000小時,假定元件壽命為指數分布,現(xiàn)取

5個元件投入試驗,觀測到如下5個失效時間:395,4094,119,11572,6133。

解:由于待檢驗的假設為

若取=0.05,則檢驗拒絕域為:

故接受原假設,可以認為平均壽命不低于6000小時.經計算得7.3.2比例的檢驗比例

p可看作某事件發(fā)生的概率。作

n次獨立試驗,以

x記該事件發(fā)生的次數,則

。我們可以根據

x檢驗關于

p的一些假設:

(1)

直觀上看拒絕域為:

,由于x只取整數值,故c可限制在非負整數中。這是在對離散總體作假設檢驗中普遍會遇到的問題.一般情況下,對給定的a,不一定能正好取到一個正整數c使下式成立:一般較常見的是找一個c0,使得

(2)檢驗的拒絕域為:c為滿足的最大正整數。(3)檢驗的拒絕域為:或其中c1為滿足下式的最大正整數:c2為滿足下式的最小正整數:例7.3.2某廠生產的產品優(yōu)質品率一直保持在

40%,近期對該廠生產的該類產品抽檢20

件,其中優(yōu)質品7件,在下能否認為優(yōu)質品率仍保持在40%?

解:以p表示優(yōu)質品率,x表示20件產品中的優(yōu)質品件數,則

,待檢驗的假設為拒絕域為或由于下求c1與c2:故取c1=3,又因為從而c2=12,拒絕域為附帶指出,該拒絕域的顯著性水平實際上不是0.05,而是0.0160+0.021=0.0370。由于觀測值沒有落入拒絕域,故接受原假設。

或7.3.3大樣本檢驗

在二點分布參數p的檢驗問題中,臨界值的確定比較繁瑣,使用不太方便。如果樣本量較大,我們可用近似的檢驗方法——大樣本檢驗。大樣本檢驗一般思路如下:設是來自某總體的樣本,又設該總體均值為,方差為的函數,記為

,譬如,對二點分布b(1,),其方差(1-)是均值的函數,則在樣本容量n充分大時,

故可采用如下檢驗:由此近似地確定拒絕域。統(tǒng)計量

例7.3.3

某廠產品的不合格品率為

10%,在一次例行檢查中,隨機抽取80件,發(fā)現(xiàn)有

11件不合格品,在=0.05下能否認為不合格品率仍為10%?解:這是關于不合格品率的檢驗,假設為:若取=0.05,則u0.975=1.96,故拒絕域為

故不能拒絕原假設。因為n=80比較大,可采用大樣本檢驗方法。檢驗統(tǒng)計量為例

7.3.4

某建筑公司宣稱其麾下建筑工地平均每天發(fā)生事故數不超過0.6起,現(xiàn)記錄了該公司麾下建筑工地200天的安全生產情況,事故數記錄如下:天數10259308010200一天發(fā)生的事故數012345合計6試檢驗該建筑公司的宣稱是否成立(取=0.05)。

解:以X記建筑工地一天發(fā)生的事故數,可認為

,要檢驗的假設是:

由于n=200很大,可以采用大樣本檢驗,泊松分布的均值和方差都是,這里

,檢驗統(tǒng)計量為若取=0.05,則

u0.95=1.645,拒絕域為如今u=2.556已落入拒絕域,故拒絕原假設,認為該建筑公司的宣稱明顯不成立。

大樣本檢驗是近似的:

近似的含義是指檢驗的實際顯著性水平與原先設

定的顯著性水平有差距,這是由于諸如(7.3.12)中

u

的分布與N(0,1)有距離。如果n

很大,則這種差異就很小。實用中我們一般并不清楚對一定的n,

u

的分布與N(0,1)的差異有多大,因而也就不能確定檢驗的實際水平與設定水平究竟差多少。在區(qū)間估計中也有類似問題。因此,大樣本方法是一個“不得已而為之”的方法。只要有基于精確分布的方法一般總是首先要加以考慮的。7.3.4檢驗的p值假設檢驗的結論通常是簡單的:在給定的顯著水平下,不是拒絕原假設就是保留原假設。然而有時也會出現(xiàn)這樣的情況:在一個較大的顯著水平(=0.05)下得到拒絕原假設的結論,而在一個較小的顯著水平(=0.01)下卻會得到相反的結論。這種情況在理論上很容易解釋:因為顯著水平變小后會導致檢驗的拒絕域變小,于是原來落在拒絕域中的觀測值就可能落入接受域。但這種情況在應用中會帶來一些麻煩:假如這時一個人主張選擇顯著水平=0.05,而另一個人主張選=0.01,則第一個人的結論是拒絕H0,而后一個人的結論是接受H0,我們該如何處理這一問題呢?例7.3.5

一支香煙中的尼古丁含量X服從正態(tài)分布N(,1),質量標準規(guī)定不能超過1.5毫克。現(xiàn)從某廠生產的香煙中隨機抽取20支測得其中平均每支香煙的尼古丁含量為

毫克,試問該廠生產的香煙尼古丁含量是否符合質量標準的規(guī)定。這是一個假設檢驗問題:H0:1.5,H1:>1.5,采用u檢驗,計算得:對一些的顯著性水平,表7.3.1列出了相應的拒絕域和檢驗結論。表7.3.1例7.3.5中的拒絕域顯著性水平拒絕域u=2.10對應的結論

=0.05u1.645拒絕H0

=0.025u1.96拒絕H0

=0.01u2.33接受H0

=0.005u2.58接受H0我們看到,不同的有不同的結論。

現(xiàn)在換一個角度來看,在=1.5時,u的分布是N(0,1)。此時可算得,P(u2.10)=0.0179,若以0.0179為基準來看上述檢驗問題,可得

<0.0179時,

>2.10。于是2.10就不在中,此時應接受原假設H0;

0.0179時,

2.10。于是2.10就落在中,此時應拒絕H0。u由此可以看出,0.0179是能用觀測值2.10做出“拒絕H0”的最小的顯著性水平,這就是p值。u定義7.3.1

在一個假設檢驗問題中,利用觀測值能夠做出拒絕原假設的最小顯著性水平稱為檢驗的p值。

引進檢驗的p值的概念有明顯的好處:

第一,它比較客觀,避免了事先確定顯著水平;其次,由檢驗的p值與人們心目中的顯著性水平進行比較可以很容易作出檢驗的結論:

如果

p,則在顯著性水平

下拒絕H0;

如果<p,則在顯著性水平

下保留H0.

p值在應用中很方便,如今的統(tǒng)計軟件中對檢驗問題一般都會給出檢驗的p值。例7.3.6

是來自b(1,)的樣本,要檢驗如下假設:若取顯著性水平為,則在得到觀測值后,我們只需要計算概率:

這就是檢驗的p值。譬如若取=0.05,由于p<

,則應拒絕原假設。例7.3.7

某工廠兩位化驗員甲、乙分別獨立地用相同方法對某種聚合物的含氯量進行測定。甲測9次,樣本方差為0.7292;乙測11次,樣本方差為0.2114。假定測量數據服從正態(tài)分布,試對兩總體方差作一致性檢驗:檢驗統(tǒng)計量為,在原假設成立下,

F

F(8,10),拒絕域為

如今我們不是把拒絕域具體化,而是由觀測值算得F=0.7292/0.2114=3.4494,再去計算該檢驗的p

值。

或首先,我們用F分布算得其次考慮到雙側檢驗的拒絕域W分散在兩端,且兩端尾部概率相等(見圖7.3.2),據此可定出p值為

此p值不算很小,若

=0.05,則接收兩方差相等的假設。在這種雙側檢驗情況下,如何由觀測值F=3.4494算得p值呢?圖7.3.2

觀測值F=3.4494對應的p值由兩端尾部概率之和確定§7.4分布擬合檢驗7.4.1總體分布只取有限個值的情況

設總體X可以分成k類,記為

,現(xiàn)對該總體作了n次觀測,k個類出現(xiàn)的頻數分別為:檢驗如下假設:n1,…,nk,且其中諸且一、諸pi

均已知如果H0成立,則對每一類Ai,其頻率ni/n與概率pi應較接近。即觀測頻數ni

與理論頻數npi

應相差不大。據此,英國統(tǒng)計學家K.Pearson提出如下檢驗統(tǒng)計量:(7.4.2)并證明在H0成立時對充分大的n,(7.4.2)

給出的檢驗統(tǒng)計量近似服從自由度為k-1的分布。拒絕域為:例7.4.1

為募集社會福利基金,某地方政府發(fā)行福利彩票,中彩者用搖大轉盤的方法確定最后中獎金額。大轉盤均分為20份,其中金額為5萬、10萬、20萬、30萬、50萬、100萬的分別占2份、4份、6份、4份、2份、2份。假定大轉盤是均勻的,則每一點朝下是等可能的,于是搖出各個獎項的概率如下:

概率0.10.20.30.20.10.1額度5萬10萬20萬30萬50萬100萬現(xiàn)20人參加搖獎,搖得5萬、10萬、20萬、30萬、50萬和100萬的人數分別為2、6、6、3、3、0,由于沒有一個人搖到100萬,于是有人懷疑大轉盤是不均勻的,那么該懷疑是否成立呢?這就需要對轉盤的均勻性作檢驗。解:這是一個典型的分布擬合優(yōu)度檢驗,總體共有6類,其發(fā)生概率分別為0.1、0.2、0.3、

0.2、0.1和0.1,這里k=6,檢驗拒絕域為:由本例數據可以算出若取=0.05,則查附表3知=由于未落入拒絕域,故接受原假設,沒有理由認為轉盤不均勻。在分布擬合檢驗中使用p值也是方便的。本例中,以T記服從

(5)的隨機變量,則使用統(tǒng)計軟件可以算出這個p值就反映了數據與假設的分布擬合程度的高低,p值越大,擬合越好。二、諸pi不完全已知

若諸

由r(r<k)個未知參數

確定,即

首先給出

的極大似然估計然后給出諸

的極大似然估計

Fisher證明了

在H0成立時近似服從自由度為k-r-1的

分布,于是檢驗拒絕域為例7.4.2

盧瑟福在2608個等時間間隔內觀測一枚放射性物質放射的粒子數X,表7.4.1是觀測結果的匯總,其中ni表示2608次觀測中放射粒子數為i的次數。

ni

572033835255324082731394527106i01234567891011試利用該組數據檢驗該放射物質在單位時間內放射出的粒子數是否服從泊松分布。

解:本例中,要檢驗總體是否服從泊松分布。

觀測到0,1,…,11共12個不同取值,這相當于把總體分成12類。這里有一個未知參數,采用極大似然估計,

=將

代入可以估計出諸

。于是可計算出列表如下。012345678910115720338352553240827313945271060.02090.08070.15620.20150.19500.15090.09730.05380.02600.01120.00430.002254.5210.5407.4525.5508.6393.5253.8140.367.829.211.25.70.11470.26721.46140.00051.07660.53431.45250.01207.66730.16580.12580.0158合計26081.00002068

=12.8967i本例中

=12.8967<18.307,故接受原假設。使用統(tǒng)計軟件可以計算出此處檢驗的p值是0.2295。

若取

=0.05,則列聯(lián)表是將觀測數據按兩個或更多屬性(定性變量)分類時所列出的頻數表。例如,對隨機抽取的1000人按性別(男或女)及色覺(正常或色盲)兩個屬性分類,得到如下二維列聯(lián)表,又稱2×2表或四格表。

7.4.2

列聯(lián)表的獨立性檢驗男53565女38218性別視覺正常色盲一般,若總體中的個體可按兩個屬性A與B分類,A有r個類,B有c個類從總體中抽取大小為n的樣本,設其中有個個體既屬于類又屬于類,稱為頻數,將rc個排列為一個r行c列的二維列聯(lián)表,簡稱rc表(表7.4.3)。

表7.4.3rc列聯(lián)表列聯(lián)表分析的基本問題是:考察各屬性之間有無關聯(lián),即判別兩屬性是否獨立。如在前例中,問題是:一個人是否色盲與其性別是否有關?在rc表中,若以

分別表示總體中的個體僅屬于

,僅屬于

和同時屬于

的概率,可得一個二維離散分布表(表7.4.4),則“A、B兩屬性獨立”的假設可以表述為表7.4.4

二維離散分布表這就變?yōu)樯弦恍」?jié)中諸

不完全已知時的分布擬合檢驗。這里諸

共有rc個參數,在原假設H0成立時,這rc個參數

由r+c個參數

決定。在這r+c后個參數中存在兩個約束條件:

所以,此時pij實際上由r+c-2個獨立參數所確定。據此,檢驗統(tǒng)計量為

在H0成立時,上式服從自由度為rc-(r+c-2)-1的

分布。其中諸

是在H0成立下得到的

的極大似然估計,其表達式為

對給定的顯著性水平

,檢驗的拒絕域為:例7.4.3

為研究兒童智力發(fā)展與營養(yǎng)的關系,某研究機構調查了1436名兒童,得到如表7.4.5的數據,試在顯著性水平0.05下判斷智力發(fā)展與營養(yǎng)有無關系。

表7.4.5兒童智力與營養(yǎng)的調查數據營養(yǎng)良好營養(yǎng)不良合計

智商合計3423672663291304564020132164233822863451436<8080909099100解:用A表示營養(yǎng)狀況,它有兩個水平:表示

營養(yǎng)良好,

表示營養(yǎng)不良;B表示兒童智商,

它有四個水平,

分別表示表中四種情況。沿用前面的記號,首先建立假設

H0:營養(yǎng)狀況與智商無關聯(lián),即A與B獨立的。統(tǒng)計表示如下:

在原假設H0成立下,我們可以計算諸參數的極大似然估計值:

進而可給出諸

,如其它結果見表7.4.6表7.4.6

的計算結果

營養(yǎng)良好384.1677346.8724259.7631313.35880.90810.29460.26600.19920.2403營養(yǎng)不良38.877935.103626.288131.71200.0919<8080909099100由表7.4.5和表7.4.6可以計算檢驗統(tǒng)計量的值此處r=2,c=4,(r-1)(c-1)=3,若取

=0.05

,查表有

,由于19.2785>7.815,故拒絕原假設,認為營養(yǎng)狀況對智商有影響。本例中檢驗的p值為0.0002。7.4.3正態(tài)性檢驗正態(tài)分布是最常用的分布,用來判斷總體分布是否為正態(tài)分布的檢驗方法稱為正態(tài)性檢驗,它在實際問題中大量使用。一、正態(tài)概率紙正態(tài)概率紙可用來作正態(tài)性檢驗,方法如下:利用樣本數據在概率紙上描點,用目測方法看這些點是否在一條直線附近,若是的話,可以認為該數據來自正態(tài)總體,若明顯不在一條直線附近,則認為該數據來自非正態(tài)總體。例7.4.4

隨機選取10個零件,測得其直徑與標準尺寸的偏差如下:(單位:絲)

9.48.89.610.210.17.211.18.28.69.6在正態(tài)概率紙上作圖步驟如下:

(1)首先將數據排序:

7.28.28.68.89.49.69.810.110.211.1;(2)對每一個i,計算修正頻率

(i-0.375)/(n+0.25),i=1,2,…,n,

(3)將點

逐一點在正態(tài)概率紙上,(4)觀察上述n個點的分布:

若諸點在一條直線附近,則認為該批數據來自正態(tài)總體;若諸點明顯不在一條直線附近,則認為該批數據的總體不是正態(tài)分布。

從圖7.4.2可以看到,10個點基本在一條直線附近,故可認為直徑與標準尺寸的偏差服從正態(tài)分布。

如果從正態(tài)概率紙上確認總體是非正態(tài)分布時,可對原始數據進行變換后再在正態(tài)概率紙上描點,若變換后的點在正態(tài)概率紙上近似在一條直線附近,則可以認為變換后的數據來自正態(tài)分布,這樣的變換稱為正態(tài)性變換。常用的正態(tài)性變換有如下三個:對數變換

、倒數變換

和根號變換

圖7.4.3給出這10個點在正態(tài)概率紙上的圖形,這10個點明顯不在一條直線附近,所以可以認為該電子元件的壽命的分布不是正態(tài)分布。例7.4.5

隨機抽取某種電子元件10個,測得其壽命數據如下:110.47,99.16,97.04,77.60,4269.82,539.35,179.49,782.93,561.10,286.80.

圖7.4.3例7.4.5的正態(tài)概率紙對該10個壽命數據作對數變換,結果見表7.4.8

表7.4.8對數變換后的數據

132.623.48490.0616286.805.65880.549297.044.57520.1597539.356.29040.646399.164.59670.2568561.106.32990.7434110.474.70480.3549782.936.66300.8415179.495.19010.451102269.827.72750.939ii利用表7.4.8中最后兩列上的數據在正態(tài)概率紙上描點,結果見圖7.4.4,從圖上可以看到10個點近似在一條直線附近,說明對數變換后的數據可以看成來自正態(tài)分布。這也意味著,原始數據服從對數正態(tài)分布圖7.4.4變換后數據的正態(tài)概率紙二、夏皮洛-威爾克(Shapiro-Wilk)檢驗

夏皮洛-威爾

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論