卡方檢驗與非參數檢驗詳解演示文稿_第1頁
卡方檢驗與非參數檢驗詳解演示文稿_第2頁
卡方檢驗與非參數檢驗詳解演示文稿_第3頁
卡方檢驗與非參數檢驗詳解演示文稿_第4頁
卡方檢驗與非參數檢驗詳解演示文稿_第5頁
已閱讀5頁,還剩38頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

卡方檢驗與非參數檢驗詳解演示文稿第一頁,共四十三頁。優選卡方檢驗與非參數檢驗第二頁,共四十三頁。檢驗的基本原理(1)設x1,x2,,xn為總體X的一組樣本觀察值,F(x)為某一已知分布的分布函數,1,

2,,

r是的r個待定參數,分別是r個參數的點估計,以分別代替1,

2,….,r,作原假設H0:總體X的分布函數為F(x)(2)將F(x)的定義域劃分為k個互不相交的區間(ai,ai+1,i=1,2,…,k;記fi為樣本觀察值x1,x2,…,xn落在第個區間(ai,ai+1

內的頻數,并記Pi=P{ai<X≤ai+1}=F(ai+1)-F(ai)

3§.1總體分布的檢驗第三頁,共四十三頁。為以F(x)為分布函數的隨機變量在區間(ai,ai+1

上取值的概率,i=1,2,…,k。則當H0為真時,由貝努里定理,當n充分大時,n次獨立重復試驗結果的實際頻率與其概率Pi之間的差異并不顯著,于是顯然可以用統計量來刻畫它們間總的差異的大小。其中nPi為理論頻數。當H0為真時,下式的值就應當較小

4第四頁,共四十三頁。(3)可以證明,當n充分大時(n≥50),若H0為真,則統計量近似服從(k-r-1)分布。其中r為分布F(x)中待定參數的個數于是在給定顯著性水平下,若就拒絕H0,說明總體X的真實分布函數與F(x)間存在顯著差異;否則接受H0,即可以認為兩者在水平下并無顯著差異。5第五頁,共四十三頁。

某廠有一臺經常需要維修的設備,該設備中有一個易損壞的重負荷軸承,設備故障的主要原因是軸承損壞。為了制定該設備的維修計劃和維修預算,需要了解該軸承的壽命分布。表10.1給出了100個軸承壽命的觀察數據,問:該軸承壽命是否服從正態分布?6第六頁,共四十三頁。

解:由表中數據,用Excel可求得=120.95,S2=40.582,故可作原假設H0:X~N(120,402)將實軸劃分為如下7個互不相交的區間。用Excel的FREQUENCY函數計算數據落在各區間內的頻數,用NORMDIST函數求出各理論頻數nPi,統計量的計算如表所示。7第七頁,共四十三頁。8第八頁,共四十三頁。取顯著性水平

=0.25(由于原假設H0是我們希望得到的結果,為使檢驗結論更具說服力,控制的重點應是與原假設H0不真而接受H0的概率,故

應取的稍大些)。本例中k=7,r=2,k–r-1=4。故在水平

=0.25下接受原假設H0,即可認為該軸承的使用壽命服從N(120,402)分布。9第九頁,共四十三頁。§.2比例差異的檢驗(獨立樣本)§10.2.1兩個比例差異的檢驗前面,我們研究了兩個比例的Z檢驗。這部分從不同角度檢驗數據。假設檢驗過程使用近似卡方()分布的檢驗數據。如果想要比較兩個獨立樣本組的分類變量,可以做兩維的列聯表,顯示每組的第1類(正向類,如“成功”,“是”等)和第2類(反向類,如“失敗”,“否”等)出現的頻數,如表所示10第十頁,共四十三頁。為了檢驗組一樣本有關類1的比例是否等于第二組樣本有關類1的比例,即假設檢驗為:原假設為兩比例之間無顯著差異:備擇假設為兩比例之間有差異:使用卡方()檢驗的基本思路為:(1).確定統計量為

(10.2.1)其中為列聯表中特定單元的觀測頻數,為列聯表中特定單元的期望頻數,因此這里的統計量是觀測頻數和期望頻數差的平方除以每單元的期望頻數,并對表中的所有單元格取和求得;11第十一頁,共四十三頁。(2)可以證明上述統計量近似服從自由度為1的分布,因此在顯著性水平下,決策規則為:如果,拒絕否則,接受。12第十二頁,共四十三頁。13第十三頁,共四十三頁。應用案例

有兩家酒店,為了確定服務質量,要求顧客離開時做滿意度調查,顧客可能會再次入住;根據調查數據得到的列聯表如表10.5所示。問在顯著性水平的情況下,顧客會回到酒店一和酒店二的比例是否相同。

14第十四頁,共四十三頁。15第十五頁,共四十三頁。16第十六頁,共四十三頁。17第十七頁,共四十三頁。1810.2.2兩個以上比例差異的檢驗

第十八頁,共四十三頁。統計量是觀測頻數和期望頻數差的平方除以每單元的期望頻數,并對表中的2×c個所有單元格取和求得因此統計量的自由度為19第十九頁,共四十三頁。20第二十頁,共四十三頁。應用案例如果有四家酒店,根據調查數據得到的列聯表如表10.10所示。問在顯著性水平的情況下,顧客會回到這四家酒店的比例是否相同。21第二十一頁,共四十三頁。22第二十二頁,共四十三頁。23第二十三頁,共四十三頁。獨立性檢驗24第二十四頁,共四十三頁。假設在上面例子中的酒店顧客滿意度的調查中,向表明不會再次入住酒店的顧客問第二個問題。即不會再次入住的原因是什么,包括價格、位置、客房服務和其他等。調查結果的列聯表如表10.14所示。試問在顯著性水平的情況下,不會再次入住理由與酒店之間是否有聯系?25第二十五頁,共四十三頁。26第二十六頁,共四十三頁。27第二十七頁,共四十三頁。28第二十八頁,共四十三頁。§10.3兩個相關樣本比例差異檢驗29第二十九頁,共四十三頁。30第三十頁,共四十三頁。31第三十一頁,共四十三頁。應用案例32第三十二頁,共四十三頁。33第三十三頁,共四十三頁。如果樣本容量很小,并且無法確定樣本數據是否來自正態分布總體,此時可以選擇以下兩種方法來分析兩獨立總體均值間的區別:(1)用不依賴于正態總體假設的Wilcoxon秩和檢驗;(2)對于數據進行正態轉換后使用合并方差的t檢驗。本節介紹用Wilcoxon秩和檢驗來檢驗兩組值間是否有差別。在合乎這些檢驗的條件下,Wilcoxon秩和檢驗和合并方差及獨立方差的t檢驗一樣有效;當t檢驗假設不符合時,Wilcoxon秩和檢驗更有效。3410.4兩個獨立總體的非參數分析:Wilcoxon秩和檢驗第三十四頁,共四十三頁。35第三十五頁,共四十三頁。36第三十六頁,共四十三頁。應用案例37第三十七頁,共四十三頁。38第三十八頁,共四十三頁。39第三十九頁,共四十三頁。40第四十頁,共四十三頁。§10.5單因素方差分析的非參數分析:Kruskal-Wallis秩檢驗

如果第9章中單因素方差分析的F檢驗的正態分布假設

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論