




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第一節假設檢驗的基本問題第二節幾種常見的假設檢驗第三節假設檢驗的兩類錯誤與功效
第七章假設檢驗第一節假設檢驗的基本問題一、假設檢驗的概念與種類二、原假設和備擇假設三、顯著性水平和拒絕域四、假設檢驗的基本步驟所謂假設檢驗,就是事先對總體參數或總體分布形態做出一個規定或假設,然后利用樣本提供的信息,以一定的概率來檢驗假設是否成立(或是否合理),或者說判斷總體的真實情況是否與原假設存在顯著的系統性差異。
在統計中,常見的統計假設有:總體均值(或總體成數、總體方差等)等于(或大于、小于)某一數值,總體相關系數等于0,兩總體均值(或兩總體成數、兩總體方差)相等,總體分布服從正態分布等。
根據檢驗的目的不同,假設檢驗可以分為雙側檢驗和單側檢驗兩類。雙側檢驗是指同時注意總體參數估計值與其假設值相比的偏高和偏低傾向的檢驗。單側檢驗是指只注意總體參數估計值比其假設值偏高或偏低傾向的檢驗,它是單方向的。要進行假設檢驗,必須設立原假設和備擇假設。原假設也稱零假設或虛無假設,是研究者對總體參數值事先提出的假設,是被檢驗的假設。備擇假設也稱對立假設,是研究者通過檢驗希望能夠成立的假設,是當原假設不成立時供選擇的假設。
設總體參數的假設值為,那么原假設記為:它表示總體參數值與其假設值之間沒有顯著差異。備擇假設記為:(雙側檢驗時)或(右單側檢驗時)或(左單側檢驗時)假設檢驗的實質就是樣本信息是否有充分的理由來否定原假設。一方面原假設H0受到保護而不被輕易否定,使它處于有利地位;另一方面當原假設H0被接收時,又認為它不一定正確。還須指出,備擇假設的表達式中是不含有等號的,即等號一定存在于原假設中。進行假設檢驗,概率論中關于小概率事件在一次試驗中是不可能事件的原則是其所要遵循的基本原則。由抽樣分布理論可知,若原假設成立,則樣本統計值與總體參數假設值偏差很大的事件是一個小概率事件。倘若在一次抽樣中,樣本統計值與總體參數假設值相差很大,那么在原假設成立的條件下,就是出現了一個小概率事件。一旦出現小概率事件,就要懷疑原假設的正確性,從而否定原假設。若一次抽樣的樣本統計值與總體參數假設值相差不大,那么就沒有理由拒絕原假設,也就只好接受原假設。現在的問題是,概率小到多少的事件為小概率事件?這個概率是在假設檢驗之前由人們事先主觀選定的,用表示。究竟取多大為宜,應視具體情況而定,通常取0.05或0.01,有時也取0.10,而把概率小于上述值的事件稱為小概率事件。越大,樣本統計值與總體參數假設值之間的差異成為顯著性差異的可能性越大;越小,這種差異成為顯著性差異的可能性越小。因此的大小就成了判定這種差異是否顯著的一個標準,故稱為顯著性水平。1-,則是樣本統計值與總體參數假設值之差不超過一定范圍的概率。接受或拒絕原假設,最終要以顯著性水平為依據確定評判的規則。評判規則有兩種;臨界值規則和P-值規則。所謂臨界值規則,就是先把值轉化為一定分布下的臨界值,然后計算檢驗統計值,最后把檢驗統計值與臨界值相比較來判斷是否拒絕原假設。所謂P-值規則,就是先計算檢驗統計值,然后求出統計量分布曲線圖中與檢驗統計值相對應的、稱之為觀測到的顯著性水平P-值,最后把P-值與事先給定的顯著性水平值相比較來判斷是否拒絕原假設。檢驗統計量是樣本統計量的標準化形式,其構造公式為或。凡是檢驗統計量之值的絕對值小于臨界值的絕對值,那么就接受原假設;若檢驗統計量之值的絕對值大于或等于臨界值的絕對值,那么就拒絕原假設。這樣,臨界值就把樣本統計量的概率分布區域分成了兩部分(即把檢驗統計量的取值分成了兩個區域):不超過臨界值的區域和超過臨界值的區域。我們把不超過臨界值的區域稱為接受域,把超過臨界值的區域(含臨界值點)稱為拒絕域。標準正態分布的拒絕域如圖5-1、圖5-2所示。接受域拒絕域拒絕域
0
圖5-1正態分布雙側檢驗接受域與拒絕域示意圖
(a)左單側檢驗(b)右單側檢驗
圖5-2正態分布單側檢驗接受域與拒絕域示意圖接受域拒絕域
0接受域拒絕域
0假設檢驗的基本原理
(一)提出原假設和備擇假設;(二)確定檢驗的顯著性水平;(三)根據樣本統計量的概率分布確定出與相對應的臨界值,即確定接受域和拒絕域;(四)構造檢驗統計量,并根據樣本觀測數據計算出檢驗統計值;(五)比較檢驗統計值與臨界值,做出接受或拒絕原假設的判斷。
第二節幾種常見的假設檢驗一、總體均值的檢驗二、兩個總體均值之差的檢驗三、總體成數的檢驗四、兩總體成數之差的檢驗五、總體方差的檢驗六、兩總體方差之比的檢驗總體均值檢驗的目的是總體均值是否等于(或大于,或小于)。我們可以建立假設如下:(雙側檢驗)或(左單側檢驗)或(右單側檢驗)下面我們分幾種情況加以介紹。(一)總體服從正態分布且方差已知根據抽樣分布原理,當總體服從正態分布時,那么從中抽取容量為n的樣本,其樣本均值服從正態分布(為了簡便,只討論重復抽樣情況),而統計量服從標準正態分布。所以,當原假設為真時,我們可以構造檢驗統計量為:
對于雙側檢驗,針對給定的顯著性水平,當時,要接受H0;當時,則要拒絕H0而接受H1。(二)總體分布及其方差均未知但大樣本根據中心極限定理,當樣本容量足夠大時(n>30),樣本均值也趨于服從數學期望為,方差為的正態分布。但由于未知,要以樣本方差來估計,這時統計量趨于服從標準正態分布。所以,如果原假設成立,我們也可以構造檢驗統計量為:根據與(一)相同的規則,通過比較值與臨界值或,可以做出接受H0或拒絕H1的判斷,唯一不同之處,就是以代替了。(三)總體為正態分布,但方差未知且小樣本若總體服從正態分布,但未知而要用樣本方差估計,那么當時,統計量服從自由度為n-1的t分布。如果原假設成立,則檢驗統計量為:根據規定的顯著性水平來確定臨界值或,通過比較t和(或),來做出接受或拒絕原假設的判斷。這種檢驗稱為小樣本t檢驗。對于雙側檢驗,當,接受原假設而拒絕備擇假設;若,則要拒絕H0而接受H1。同理,對于左單側檢驗,當時,拒絕而接受;若。則接受H0。對于右單側檢驗,當時,拒絕而接受若,則接受H0。
設兩個總體的均值分別為和,兩個總體的方差分別為和,來自兩個總體的樣本容量分別為n1和n2,樣本均值分別為和。檢驗的目的是兩個總體的均值是否相等,或兩個總體的均值之差是否為零。我們可以建立假設如下:(雙側檢驗)或(左單側檢驗)
或(右單側檢驗)下面分幾種情況加以介紹。
(一)兩個總體服從正態分布且方差已知根據抽樣分布原理,統計量服從標準正態分布。如果原假設成立,我們可構造檢驗統計量為:對于雙側檢驗,當時拒絕H0,當時接受H0。對于左單側檢驗,當時拒絕H0,當時接受H0。對于右單側檢驗,當時拒絕H0,當時接受H0。
(二)兩個總體方差未知但大樣本若兩個總體方差和未知且不相等,要分別以樣本方差和來估計,那么當n1和n2都足夠大時,統計量
趨于服從標準正態分布。當原假設成立時,我們可構造檢驗統計量為:
(三)兩個總體服從正態分布,但方差未知且小樣本若兩個總體服從正態分布,方差未知且相等,那么當n1和n2都不夠大時,那么下列統計量服從自由度為n1+n2-2的t分布,即:
其中為合并標準差。
當原假設成立時,檢驗統計量為:對于雙側檢驗,當時要拒絕H0,當要接受H0。對于左單側檢驗,當時要拒絕H0,當時要接受H0。對于右單側檢驗,當時要拒絕H0,當要接受H0。
檢驗的目的是判斷總體成數P是否等于P0,我們可以建立假設如下:(雙側檢驗)
或(左單側檢驗)或(右單側檢驗)根據抽樣分布定理可知,當樣本容量足夠大,即nP和n(1-P)都大于5時,樣本成數p的抽樣分布近似服從正態分布,而統計量服從標準正態分布。其中,由于N一般都很大,因此總體方差簡化為。因此,當原假設為真時,我們可以構造檢驗統計量為:
對于給定的顯著性水平,可查得臨界值或。通過比較與或,可做出拒絕原假設H0或接受原假設H0的判斷。判斷規則與總體均值檢驗相同。設兩個總體成數分別為P1和P2,來自兩個總體的樣本容量分別為n1和n2,樣本成數分別為p1和p2。檢驗兩個總體成數是否相等,或兩個總體成數之差是否為零,我們可以建立假設如下:(雙側檢驗)或(左單側檢驗)或(右單側檢驗)
當n1和n2都足夠大時(即n1P1、n1P1
(1-P1)、n2P2、n2P2(1-P2)均大于5),兩個樣本成數之差的抽樣分布漸近服從正態分布,即:由于P1、P2未知,要以p1和p2來估計,因此在原假設H0為真時,我們要以兩個樣本的合并成數作為兩個總體成數的共同的估計值,即:
這樣,當原假設成立時,檢驗統計量就成為:
檢驗目的是判斷正態總體方差S2是否S02等于,我們可建立假設為:(雙側檢驗)或(左單側檢驗)或(右單側檢驗)當原假設為真時,我們可構造服從自由度為n-1的分布的檢驗統計量:
對于給定的顯著性水平,在雙側檢驗時,分布的左臨界值為,右臨界值為。當,就接受原假設H0;若或,就要拒絕原假設H0。在左單側檢驗時,臨界值為,當時,就接受原假設H0;若,就拒絕原假設H0。在右單側檢驗時,臨界值為,當,就接受原假設H0;若,就拒絕原假設H0。分布檢驗的拒絕域如圖5-3、圖5-4所示。
拒絕域接受域
拒絕域圖5-3分布雙側檢驗接受域與拒絕域示意圖拒絕域接受域接受域拒絕域(a)左單側檢驗
(b)右單側檢驗圖5-4分布單側檢驗接受域與拒絕域示意圖設兩個總體方差分別為S12和S22,相應的樣本方差分別s12為和s22,檢驗目的是判斷兩個總體方差是否相等,我們可建立假設為:(雙側檢驗)或(左單側檢驗)或(右單側檢驗)
如果原假設成立,那么來自兩個總體的兩個樣本方差之比應接近于1。因此當兩個總體為正態總體時,我們可構造檢驗統計量為:它服從分子自由度為n1-1,分母自由度為n2-1的F分布。對于給定的顯著性水平,在雙側檢驗時,分布的左臨界值為右臨界值為。當時,接受原假設H0;若或,則要拒絕原假設H0而接受H1。在左單側檢驗時,臨界值為,若,要接受原假設H0;若,則拒絕原假設H0而接受H1。在右單側檢驗時,臨界值為,若,要接受H0;若,要拒絕H0而接受H1。分布檢驗的拒絕域于圖5-3、圖5-4相似。第三節假設檢驗的兩類錯誤與功效一、假設檢驗的兩類錯誤二、犯第二類錯誤的概率的計算三、假設檢驗的功效第一類錯誤是“以真為假”的錯誤,即原假設正確但卻被拒絕的錯誤,也稱為“棄真”錯誤。產生第一類錯誤的概率是由假設檢驗的顯著性水平給出的,即是,因此它又稱為錯誤。
第二類錯誤是“以假為真”的錯誤,即原假設不正確卻被接受的錯誤,也稱為“納偽”錯誤。犯第二類錯誤的概率是當備擇假設成立時,檢驗統計值落入接受域的概率,一般用表示,因此它又稱為錯誤。
假設檢驗的兩類錯誤
接受域
圖5-5雙側檢驗兩類錯誤的關系
接受域
圖5-6單側檢驗兩類錯誤的關系
(一)在雙側檢驗中的計算先求出當原假設為真時的兩個臨界值:和其中抽樣標準誤通常要以來估計。然后求出當備擇假設
為真時,樣本均值落入區間內的概率,此即為,計算公式為:
(二)在單側檢驗中的計算對于左單側檢測,先求出原假設為真時的臨界值,然后求出當備擇假設為真時,樣本均值落入區間
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 上海市閔行區2025年五下數學期末監測試題含答案
- 漳州衛生職業學院《速度輪滑》2023-2024學年第一學期期末試卷
- 寧夏理工學院《醫學史》2023-2024學年第一學期期末試卷
- 云南省大理白族自治州賓川縣2025年數學三下期末學業質量監測試題含解析
- 天津農學院《高品質黑白攝影》2023-2024學年第二學期期末試卷
- 采購合同履行供應鏈協同重點基礎知識點
- 船舶振動分析設計重點基礎知識點
- 韶關市高三上學期期中考試生物試題
- 邯鄲市雞澤縣第一中學高二上學期期中考試物理試題
- 支教老師年終述職報告(10篇)
- 壁紙施工協議書范本
- 呼和浩特2025年內蒙古呼和浩特市融媒體中心第二批人才引進20人筆試歷年參考題庫附帶答案詳解
- 2025年遼寧沈陽地鐵集團有限公司所屬分公司招聘筆試參考題庫附帶答案詳解
- 2024年供應鏈數字化轉型試題及答案
- 學校健身俱樂部的盈利模式探索
- 2025年浙江嘉興市海寧實康水務有限公司招聘筆試參考題庫含答案解析
- 培養孩子競爭意識
- 2025年中考道德與法治仿真模擬測試卷(含答案)
- 工程造價司法鑒定與糾紛調解典型案例-記錄
- 2025年濟源職業技術學院單招職業技能測試題庫學生專用
- 2025年春季學期初中歷史中考復習計劃
評論
0/150
提交評論