K-S分布檢驗和擬合優度χ2檢驗_第1頁
K-S分布檢驗和擬合優度χ2檢驗_第2頁
K-S分布檢驗和擬合優度χ2檢驗_第3頁
K-S分布檢驗和擬合優度χ2檢驗_第4頁
K-S分布檢驗和擬合優度χ2檢驗_第5頁
已閱讀5頁,還剩40頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第八章分布檢驗和擬合優度χ2檢驗K-S分布檢驗和擬合優度χ2檢驗第八章分布檢驗和擬合優度χ2檢驗Kolmogorov-Smirnov單樣本檢驗及一些正態性檢驗1235Kolmogorov-Smirnov兩樣本分布檢驗Pearsonχ2

擬合優度檢驗K-S分布檢驗和擬合優度χ2檢驗第一節K—S單樣本分布檢驗一、適用范圍Kolmogorov-Smirnov檢驗常譯為柯爾莫哥洛夫-斯米爾諾夫檢驗,簡寫為K-S檢驗,亦稱D檢驗法,也是一種擬合優度檢驗法。K-S單樣本檢驗主要用來檢驗一組樣本數據的實際分布是否與某一指定的理論分布相符合。二、基本原理和方法1、基本原理:這種檢驗主要是將理論分布下的累計頻數分布與觀察到的累計頻數分布相比較,找出它們間最大的差異點,并參照抽樣分布,定出這樣大的差異是否處于偶然。K-S分布檢驗和擬合優度χ2檢驗2、方法用Fn(x)表示樣本量為n的隨機樣本觀察值的累計分布函數,且Fn(x)=i/n(i是等于或小于x的所有觀察結果的數目,i=1,2,…,n)。F(x)表示理論分布的累計概率分布函數。K-S單樣本檢驗通過樣本的累計分布函數Fn(x)和理論分布函數F(x)的比較來做擬合優度檢驗。檢驗統計量是F(x)與Fn(x)間的最大偏差Dn:若對每一個x值來說,Fn(x)與F(x)都十分接近,則表明實際樣本的分布函數與理論分布函數的擬合程度很高。K-S分布檢驗和擬合優度χ2檢驗三、檢驗步驟1.建立假設組:H0:Fn(x)=F(x)H1:Fn(x)≠F(x)2.計算樣本累計頻率與理論分布累計概率的絕對差,令最大的絕對差為Dn;3.用樣本容量n和顯著水平a在附表11中查出臨界值Dna;4.通過Dn與Dna的比較做出判斷,若Dn<Dna,則認為擬合是滿意的。K-S分布檢驗和擬合優度χ2檢驗四、實例例8.1:正態擬合。某織布廠工人執行的生產定額(織機每小時生產織物的米物)情況如表8-1,試檢驗這些樣本數據能否作正態擬合?表8-1工人執行生產定額情況分組表按定額執行情況分組工人數3.75~4.25204.25~4.753724.75~5.254985.25~5.751035.75~6.2571000K-S分布檢驗和擬合優度χ2檢驗例8.1正態擬合解:首先,由于做正態擬合的均值、標準差未知,因此,先計算樣本均值和標準差,再做正態擬合。通過對樣本資料的計算得:=4.85;s=0.352,分別作為?和的估計值,建立假設:H0:樣本數據服從均值為4.85,標準差為0.352的正態分布H1:樣本數據不服從均值為4.85,標準差為0.352的正態分布計算資料列如表8-2:K-S分布檢驗和擬合優度χ2檢驗表8-2表8-2正態擬合計算表X的組限標準化標準正態概率累計概率(理論概率)累計工人數實際累計頻率(2)-(4)的絕對值甲乙(1)(2)(3)(4)(5)不足4.25-∞~-1.700.0450.045200.0200.0254.25-4.75-1.70~-0.280.3450.3903920.3920.0024.75-5.25-0.28~1.140.4830.8738900.8900.0175.25-5.751.14~2.560.1220.9959930.9930.0025.75-6.252.56-+∞0.0051.00010001.0000.000合計——1.000——-————K-S分布檢驗和擬合優度χ2檢驗例8.1根據表8-2中第(5)列數據,取最大絕對差數D1ooo=0.025作為檢驗統計量。若取a=0.05,n=1000,從臨界值表中查(檢驗表K-S)得:。因為D1ooo<0.043,故認為樣本數據所提供的信息無法拒絕H0,即接受H0,認為可做正態分布的擬合。K-S檢驗法是一種精確分布的方法,不受觀察次數多少的限制。這個方法可應用于分組或不分組的情形。檢驗量Dn也可用于檢驗隨機樣本是否抽自某特定的總體的問題。K-S分布檢驗和擬合優度χ2檢驗第二節K-S雙樣本分布檢驗一、適用范圍K-S雙樣本檢驗主要用來檢驗兩個獨立樣本是否來自同一總體(或兩樣本的總體分布是否相同)。其單尾檢驗主要用來檢驗某一樣本的總體值是否隨機地大于(或小于)另一樣本的總體值。二、理論依據和方法1、理論依據:與K-S單樣本檢驗相似,K-S雙樣本檢驗是通過兩個樣本的累計頻數分布是否相當接近來判斷Ho是否為真。如果兩個樣本間的累計概率分布的離差很大,這就意味著兩樣本來自不同的總體,就應拒絕Ho。K-S分布檢驗和擬合優度χ2檢驗2、方法如果令S1(x)表示第一個樣本觀察值的累計概率分布函數,S2(x)表示另一個樣本觀察值的累計概率分布函數,那么K-S雙樣本的單尾檢驗統計量為:K-S雙樣本的雙尾檢驗統計量為:K-S分布檢驗和擬合優度χ2檢驗三、檢驗步驟1、雙尾檢驗假設:H0:S1(x)=S2(x)H1:S1(x)≠S2(x)單尾檢驗假設:H0:S1(x)=S2(x)或H0:S1(x)=S2(x)H1:S1(x)>S2(x)H1:S1(x)<S2(x)

2、把兩組樣本分別排成累計頻數分布(對兩個分布用相同的間隔或分類,并利用盡可能多的間隔。3、計算檢驗統計量D值,如是單尾檢驗,應按H1的方向計算D值。K-S分布檢驗和擬合優度χ2檢驗三、檢驗步驟4、顯著性檢驗:⑴小樣本情況下,及n1=n2=n,n≤30,用附表12。對于單尾檢驗和雙尾檢驗,該表列出了不同顯著性水平下的臨界值。⑵大樣本情況下,n1不一定等于n2,但都小于40的雙尾檢驗,可用附表12續表中的公式算出D的臨界值。⑶當n1和n2都較大,但又是單尾檢驗時,用算式K-S分布檢驗和擬合優度χ2檢驗四、實例例8.2(小樣本)檢驗兩礦的金屬含量率是否相同。在甲、乙兩礦坑中各抽取10個礦石樣本,礦石中含有某種金屬含量率(%)的資料如表8-3所示:表7-3解:這是一個雙樣本的K-S檢驗,根據題意,建立雙側檢驗假設組:

甲礦3.11.22.93.00.62.81.61.73.21.7乙礦3.82.13.27.22.33.53.04.63.13.2K-S分布檢驗和擬合優度χ2檢驗四、實例1、列等距分組表,計算各組次數f甲、f乙,累計次數F甲、F乙,累計頻率、及其差額。計算結果列如表8-4所示。表7-4例7.2的計算表

金屬含量率(%)次數累計次數累計頻率F甲/10-F乙/10f甲f乙F甲F乙F甲/10F乙/100.0~0.910101/1001/101.0~1.940505/1005/102.0~2.922727/102/105/103.0~3.93610810/108/102/104.0~4.90110910/109/101/105.0`5.90010910/109/101/106.0~6.90010910/109/101/107.0~7.901101010/1010/100K-S分布檢驗和擬合優度χ2檢驗四、實例2、確定檢驗統計量:本例D=5/103、檢驗與判斷。由于n1=n2=10,屬小樣本,查附表12得臨界值D0.05=7/10,因為D=5/10<7/10,所以接受Ho假設,認為兩礦的金屬含量率相同。當樣本容量較大時,一般當n1+n2>35時,可用附表12續表中的公式計算臨界值,只有當樣本容量相當大時,檢驗統計量才漸進服從自由度為2的X2分布,此時可用X2分布表查得臨界值。

K-S分布檢驗和擬合優度χ2檢驗四、實例例8.3(大樣本)用識別卡片的方法對98名男生進行智力測驗。54名男生學習成績高于中位數為第一組(n1=54),44名男生學習成績低于中位數為第二組(n2=44),能否認為高分組的智力高于低分組?表7-5識別出卡片的張數高分組低分組累計頻率離差高分組低分組0-21111/5411/440.2323-5374/5418/440.3356-86810/5426/440.4069-1112322/5429/440.25212-1412534/5434/440.14315-1714548/5439/440.18218-206554/5434/440合計5444---K-S分布檢驗和擬合優度χ2檢驗例8.3解:這是雙側檢驗,建立雙側假設組:Ho:兩組“認出”的卡片數相同;H1:兩組“認出”的卡片數不同。比較離差大小,得最大離差:D=Max|S1(x)-S2(x)|=0.406已知n1=54,n2=44,都大于40,當α=0.05時,進行雙尾檢驗的臨界值為

因為D=0.406>Da,因此在0.05的顯著性水平下拒絕Ho,即。兩組學生的智力不相同。K-S分布檢驗和擬合優度χ2檢驗例8.3如建立單尾檢驗假設組:Ho:兩組“認出”的卡片數相同;H1:高分組“認出”的卡片數多于低分組。根據表8-5的數據計算得:

D=Max[S1(x)-S2(x)]=-0.406由于是大樣本,故計算卡方統計量:當α=0.05,df=2時,查得臨界值C=5.991。因X2=15.986>C,故在5%的顯著性水平下拒絕Ho,即高分組的學生智力顯著高于低分組的學生。K-S分布檢驗和擬合優度χ2檢驗第三節卡方(X2)擬合優度檢驗一、什么是卡方(X2)擬合優度檢驗人們通常關心隨機變量的概率分布,如:“隨機變量服從參數為n=10和p=2的二項分布”,這樣的命題假設可以用“擬合優度檢驗”來檢驗。即設計一個檢驗來比較從假設的分布中抽取的樣本,看所假設的分布函數與樣本數據是否“擬合”。所以,擬合檢驗就是檢驗抽取樣本的總體分布與某種特定分布的符合程度,也就是檢驗觀察值與理論數之間的緊密程度。以X2分布為依據的這種檢驗,稱為X2擬合優度檢驗K-S分布檢驗和擬合優度χ2檢驗英國統計學家Pearson(皮爾遜)于1900年首先提出了卡方統計量。1、數據:由隨機變量X的N個觀測組成。這N個觀測可劃分為k類,即把X的樣本空間S劃分成k個互不相交的部分S1,S2,…,Sk,且Si與Sj相互獨立。即Si∩Sj=ф,(i≠j),記Oi為類i中的觀測數,i=1,2,…,k.則第三節卡方(X2)擬合優度檢驗K-S分布檢驗和擬合優度χ2檢驗2、假設條件

1.樣本是隨機的2.度量尺度至少是名義的3、檢驗統計量

在零假設為真的條件下,令X的一個隨機觀測落入類i的概率為pi。定義Ei為H0為真時觀測值落入類i的期望觀測數,即Ei=piN,i=1,2,…,k.給出如下卡方檢驗統計量:

第三節卡方(X2)擬合優度檢驗K-S分布檢驗和擬合優度χ2檢驗4、零分布:由于

的精確分布難以求得,所以我們用自由度為k-1的卡方分布來近似。5、假設組:H0:pi=p(i=1,2,…,k.)

H1:pi≠p(對某個i.)

若>(自由度為k-1的卡方分布的1-a分位數),則拒絕H0,p-值近似等于p(X2(c-1)>Q),這個概率可由附表10獲得。第三節卡方(X2)擬合優度檢驗K-S分布檢驗和擬合優度χ2檢驗三、X2檢驗的具體步驟1.數據分組.根據樣本觀測值的范圍劃分為K組;2.求X落在各組的頻數Yi和頻率Yi/n。3.求理論概率Pi。當H0成立時,X出現在(bi-1,bi)內的概率Pi4.計算檢驗統計量X2。5.求出拒絕域.根據給定的顯著性水平α和自由度k-r-1查X2分布表(附表10),可得臨界值C,統計量X2的拒絕域為X2>C。6.作出判斷.若X2>C則拒絕H0,否則接受H0。K-S分布檢驗和擬合優度χ2檢驗實例單樣本擬合檢驗一、檢驗某固定比率的假設例8.4:據標準規定,某批工業產品中不良品的比例為10%,則可檢驗如下假設:H0:P=0.1;H1:P≠0.1。為此,我們在產品批中抽出100個作為樣本,發現不合格品數(Y1)為16,則合格品數Y2=100-16=84。當H0成立時,不合格品的期望數應為nP1=10個,相應地,合格品的期望數n(1-P1)=90。則:k=2,自由度為k-1=1,顯著水平a=0.05,查表10得臨界值為3.841。由于Xn2>Xa2,所以拒絕Ho假設。K-S分布檢驗和擬合優度χ2檢驗二、檢驗某固定比率的假設例8.5:檢驗隨機變量X在(0,1)區間是否為均勻分布。假設如下:H0:X在(0,1)區間為均勻分布(假設分10類,pi=1/10);H1:X在(0,1)區間不是均勻分布(pi≠p≠1/10);從未知總體中抽取50個樣本。為了檢驗,我們可以將(0,1)區間分為10等份,即0-0.1,0.1-0.2,…,0.9-1.0。如果Ho為真,那么任何觀察值落入類i的概率為1/10,任何小區間的期望觀測數為(1/10)×50=5。實例單樣本擬合檢驗K-S分布檢驗和擬合優度χ2檢驗例8.5實際50個樣本落入類i的觀察如下:區間0-0.10.1-0.2

0.2-0.3

0.3-0.40.4-0.5

0.5-0.6觀測數645674區間0.6-0.7

0.7-0.80.8-0.90.9-1.0觀測數6534檢驗統計量查X2分布表,自由度為9,顯著水平a=0.05時,查得Xa2=16.92,因X2=2.80<Xa2

,所以接受Ho假設,即觀察值取自均勻分布。K-S分布檢驗和擬合優度χ2檢驗

三、檢驗多面體無偏性的假設例8.6:以六面體的骰子為例。如果將一顆骰子拋擲120次,其結果如表8-4所示:表8-4根據題意,檢驗假設如下:Ho:這顆骰子是無偏的(pi=1/6);H1:這顆骰子是有偏的(pi≠1/6);如果零假設為真,各點出現的期望次數

nP1=1/6×120=20點數123456合計觀測次數132816103221120實例單樣本擬合檢驗K-S分布檢驗和擬合優度χ2檢驗

三、檢驗多面體無偏性的假設例8.6:檢驗統計量為:查X2分布表,自由度k-1=6-1=5,取a=0.05,查得Xa2=11.07因X2>X0.052,故應拒絕Ho假設,認為這顆骰子是有偏的。K-S分布檢驗和擬合優度χ2檢驗實例總體分布擬合檢驗一、正態分布擬合例8.7:一家鐘表廠把檢驗鐘表的精確度作為質量控制的一部分。該廠將700只手表效準后使之走24小時,然后記下每只表走快或走慢的秒數(數據見表5-3)。這些數據是否提供了充分的證據,說明觀察值并非來自正態總體。解:假設:H0:樣本數據來自正態總體分布;H1:樣本數據并非來自正態總體分布。表8-3中,K=11,實際觀察頻數Oi已知,預期頻數Ei則尚需確定。K-S分布檢驗和擬合優度χ2檢驗表5-3700只手表時間誤差的頻數分布24小時內走快或走慢的秒數表的數目Oi0-9.993810-19.995120-29.996230-39.997440-49.998350-59.999160-69.998170-79.997280-89.996190-99.9952100-109.9935合計700K-S分布檢驗和擬合優度χ2檢驗一、正態分布擬合1.預期頻數Ei的計算根據概率分布原理,我們可以通過求正態分布曲線下的面積來確定理論預期頻數。為了計算正態分布曲線下的面積,利用公式Zo=(Xo-u)/δ將Xo標準化,求標準正態表上相應的面積(即頻率)。因為零假設中并沒指定總體分布的均值(u)和標準差(δ)。所以只有將樣本均值

=54.71和標準差S=27.61分別作為u和δ的估計值。如在區間[10-19.99]內的預期頻數,可按如下步驟計算:K-S分布檢驗和擬合優度χ2檢驗1.預期頻數Ei的計算(1)分別對x=10和x=20標準化:Z=(10-54.71)/27.61=-1.62和Z=(20-54.71)/27.61=-1.26。其余類推。(2)查標準正態分布表,介于0和-1.62之間的面積(概率)為0.4474,介于0和-1.26之間的面積為0.3962,所以介于-1.62和-1.26之間的面積等于0.4474-0.3962=0.0512。其余類推。(3)于是落在10與20之間的預期頻數為0.0512×700=35.84。其余類推。一、正態分布擬合K-S分布檢驗和擬合優度χ2檢驗2.約束條件r的確定⑴預期頻數之和必等于700,即等于樣本容量,這就構成一個約束;⑵又由于我們必須通過樣本來估計u和δ,所以對數據還須增加兩個約束。于是γ=3,自由度k-γ=11-3=8。注意:如果u和δ在零假設中已被指定,那就不必再用樣本數據來估計,這時γ=1。檢驗統計量X2=(Oi-Еi)2/Еi=20.3558,X2的臨界值為15.507。由于X2的計算值大于臨界值,所以否定零假設,樣本數據并非來自正態分布。一、正態分布擬合K-S分布檢驗和擬合優度χ2檢驗小預期頻數在應用卡方檢驗時,有可能遇到預期頻數很小的情形,這時將隨機分布取作卡方的近似分布并不完全正確。對于什么樣的預期頻數才算小預期頻數,學者們的意見并不一致。較保守的學者一般要求預期頻數至少應大于等于5。而科庫蘭Cochran(1952,1954)主張預期頻數小于1的就算小預期頻數,很多學者同意這種意見。本教材也采用了這一觀點。對小預期頻數的處理一般采用的科克蘭的法則。如將相鄰類目的頻數合并(前提是不破壞其分類意義),以達到所要求的最小頻數。合并后的類數應相應地減小。K-S分布檢驗和擬合優度χ2檢驗二、二項分布擬合例8.8:一個市場分析員想研究食品店的顧客對待信用卡付款方式的態度。研究員從100家超級市場各抽選了25名經常性顧客作為隨機樣本,并對其中每一個進行訪問以確定此人是否喜歡除信用卡付款方式以外的別的某種付款方式。調查結果列于表8-5:解:這個分析員應先提出如下假設:

H0:在這些容量為25的樣本中,喜歡另外某種付款方式的顧客數服從二項分布;

H1:不服從二項分布。(取a=0.05)K-S分布檢驗和擬合優度χ2檢驗表5-5例5.5中的抽樣結果喜歡另外某一種付款方式的顧客數商店數0415283104145156127168109610或更多0合計100二、二項分布擬合K-S分布檢驗和擬合優度χ2檢驗首先求得P的估計值如下:P={4(0)+5(1)+8(2)…+6(9)}/2500=0.20。由于二項分布的參數P沒有指定,必須通過樣本數據對它作出估計,因此要損失一個自由度。1.預期頻數Еi通過計算函數f(x)=C25x(0.2)x(0.8)25-x(其中x為某一特定商店中喜歡另外某種付款方式的顧客數,x=0,1,2,…,25)或查的二項分布表,可以得到所需的相對預期頻數。二、二項分布擬合K-S分布檢驗和擬合優度χ2檢驗2.自由度的確定合并后的類目數10,但由于預期頻數之和必須與觀察頻數之和一致,這個自由度應減去1,又由于P必須通過樣本數據來估計,自由度再減1。于是真正的自由度應為10-2=

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論