概率論與數理統計ch8假設檢驗_第1頁
概率論與數理統計ch8假設檢驗_第2頁
概率論與數理統計ch8假設檢驗_第3頁
概率論與數理統計ch8假設檢驗_第4頁
概率論與數理統計ch8假設檢驗_第5頁
已閱讀5頁,還剩129頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1第八章假設檢驗

關鍵詞: 假設檢驗 正態總體參數的假設檢驗擬合優度檢驗

28.1假設檢驗

統計推斷的另一類重要問題是假設檢驗問題。它包括(1)已知總體分布的形式,需對其中的未知參數給出假設檢驗.—參數檢驗(2)總體的分布形式完全未知的情況下,對總體的分布或數字特征進行假設檢驗.—非參數檢驗例1

設某種清漆的9個樣品,其干燥時間(以小時計)分別為:

6.05.75.56.57.05.85.26.15.0

根據以往經驗,干燥時間的總體服從正態分布N(6.0,0.36),現根據樣本檢驗均值是否與以往有顯著差異?(一)問題的提出例2

一種攝影藥品被其制造商聲稱其貯藏壽命是均值180天、標準差不多于10天的正態分布。某位使用者擔心標準差可能超過10天。他隨機選取12個樣品并測試,得到樣本標準差為14天。根據樣本有充分證據證明標準差大于10天嗎?5例3

孟德爾遺傳理論斷言,當兩個品種的豆雜交時,圓的和黃的、起皺的和黃的、圓的和綠的、起皺的和綠的豆的頻數將以比例9:3:3:1發生。在檢驗這個理論時,孟德爾分別得到頻數315、101、108、32、這些數據提供充分證據拒絕該理論嗎?假設:(二)檢驗統計量和拒絕域對例1的統計分析(三)兩類錯誤由于樣本的隨機性,任一檢驗規則在應用時,都有可能發生錯誤的判斷。第I類錯誤:拒絕真實的原假設(棄真)第II類錯誤:接受錯誤的原假設(取偽)原假設為真原假設不真根據樣本拒絕原假設第I類錯誤正確根據樣本接受原假設正確第II類錯誤171920處理假設檢驗問題的基本步驟

8.2單個正態總體參數的假設檢驗293031323334思考題:比較與你能寫出右邊假設問題檢驗的拒絕域嗎?363738394041424344例

某種元件的壽命X(以小時記)服從正態分布均未知。現測得16只元件的壽命如下:

280101212224379179264222362168250149260485170問是否有理由認為元件的平均壽命大于225(小時)?(取顯著性水平為0.05)沒有落在拒絕域內,故不能拒絕原假設,認為元件的平均壽命不大于225小時。問:若將原假設和備擇假設互換,即考慮左邊檢驗檢驗結果怎么樣?請給出合理的解釋。一般地,在有關參數的假設檢驗中,備擇假設是我們根據樣本資料希望得到支持的假設。49例3

要求某種元件的平均使用壽命不得低于1000小時,生產者從一批這種元件中隨機抽取25件,測得其平均壽命為950小時,標準差為100小時。已知這批元件的壽命服從正態分布。試在顯著性水平0.05下確定這批元件是否合格?50t落在拒絕域內,故拒絕原假設,認為這批元件的平均壽命小于1000小時,不合格。525355例4:為了試驗兩種不同谷物種子的優劣,選取了十塊土質不同的土地,并將每塊土地分為面積相同的兩部分,分別種植這兩種種子。設在每塊土地的兩部分人工管理等條件完全一樣。下面給出各塊土地上的產量。

土地12345678910種子A(xi)23352942392937343528種子B(yi)26393540382436274127di=xi-yi-3-4-621517-61問:以這兩種種子種植的谷物產量是否有顯著的差異(取顯著性水平為0.05)?5657在Excel中的實現-------TTEST函數本例的分析步驟如下:(1)

將兩品種種子的產量數據輸入Excel表中,設數據區域分別為A1:A10和B1:B10;(2)下拉菜單“插入”選項卡═>單擊“函數”═>在類別的下拉式菜單中選擇“統計”═>選“TTEST”;(3)

在“Array1”文本框中輸入“A1:A10”,在“Array2”文本框中輸入“B1:B10”,“Tails”文本框中輸入”2”(“1”代表單尾概率,”2”代表雙尾概率),“Type”文本框中輸入“1”(“1”代表成對數據的t檢驗,“2”代表方差齊性的兩樣本t檢驗,“3”代表異方差的兩樣本t檢驗);(4)點擊Enter鍵,即顯示P_值為“0.889921”,因此認為兩品種種子產量沒有顯著差異。60616263656667從資料來看想要支持的結論是:新品種蘋果的重量差異小68例2

一種攝影藥品被其制造商聲稱其貯藏壽命是均值180天、標準差不多于10天的正態分布。某位使用者擔心標準差可能超過10天。他隨機選取12個樣品并測試,得到樣本標準差為14天。根據樣本有充分證據證明標準差大于10天嗎?(取顯著水平為0.05)70717273747576777879808182838485

例7:某廠使用兩種不同的原料A,B生產同一類型產品。各在一周的產品中取樣分析。取用原料A生產的樣品220件,測得平均重量為2.46(公斤),樣本標準差s=0.57(公斤)。取用原料B生產的樣品205件,測得平均重量為2.55(公斤),樣本標準差為0.48(公斤)。設兩樣本獨立,來自兩個方差相同的獨立正態總體。問在水平0.05下能否認為用原料B的產品平均重量μ2較用原料A的產品平均重量μ1為大。

8687(二)比較兩個正態總體方差的檢驗888990

例7:兩臺機床生產同一個型號的滾珠,從甲機床生產的滾珠中抽取8個,從乙機床生產的滾珠中抽取9個,測得這些滾珠的直徑(毫米)如下:甲機床15.014.815.215.414.915.115.214.8乙機床15.215.014.815.114.614.815.114.515.091929394在Excel中的實現----FTSET函數和TTEST函數

利用FTSET函數作方差齊性檢驗,再利用TTEST函數進行兩樣本的均值比較。本例的分析步驟如下:(1)

將兩組數據輸入Excel表中,設數據區域分別為A1:A8和B1:B9;(2)下拉菜單“插入”選項卡═>單擊“函數”═>在類別的下拉式菜單中選擇“統計”═>選“FTEST”;(3)

在“Array1”文本框中輸入“A1:A8”,在“Array2”文本框中輸入“B1:B9”,并點擊Enter鍵,即顯示P_值為“0.7752”,因此認為兩總體方差相同.(4)重新下拉菜單“插入”選項卡═>單擊“函數”═>在類別的下拉式菜單中選擇“統計”═>選“TTEST”;(5)

在“Array1”文本框中輸入“A1:A8”,在“Array2”文本框中輸入“B1:B9”,“Tails”文本框中輸入”1”(“1”代表單尾概率,”2”代表雙尾概率),“Type”文本框中輸入“2”(“1”代表成對數據的t檢驗,“2”代表方差齊性的兩樣本t檢驗,“3”代表異方差的兩樣本t檢驗);(6)點擊Enter鍵,即顯示P_值為“0.0979”,因此在顯著水平為0.1下,拒絕原假設(7)

若在步驟(5)中的“Tails”文本框中輸入”2”,并點擊Enter鍵,即顯示P_值為“0.19587”,因此在顯著水平0.1下,接受原假設1008.4假設檢驗與區間估計作假設檢驗時,對參數有一個先驗的認識(例如μ=μ0),但由于某種情形的出現(如工藝改良等),猜測真實參數值可能發生了變化,所以假設檢驗的目的是:根據樣本確認參數是否真的發生了改變。作區間估計時,對參數沒有先驗的認識,但確定參數是固定不變的,只是未知,所以區間估計的目的是:根據樣本對參數進行估計;但置信區間與假設檢驗的拒絕域之間又有密切的關系。101102103104105106107108109110待估參數

原假設樞軸量

檢驗統計量

分布置信區間拒絕域

一個正態總體兩個正態總體正態總體均值、方差的置信區間與假設檢驗1128.5擬合優度檢驗

前面介紹的各種檢驗都是在總體服從正態分布前提下,對參數進行假設檢驗的。實際中可能遇到這樣的情形,總體服從何種理論分布并不知道,要求我們直接對總體分布提出一個假設。113

例如,要檢驗在計算機上產生隨機數的一個程序。指令該程序產生0到9之間的100個單個數字。觀察整數的頻數如下表。那么以0.05的顯著性水平,有充分的理由相信該批整數不是均勻產生的嗎?整數0123456789頻數1187710108111414114

例如,從1500到1931年的432年間,每年爆發戰爭的次數可以看作一個隨機變量,據統計,這432年間共爆發了299次戰爭,具體數據如下:戰爭次數X01234發生X次戰爭的年數22314248154通常假設每年爆發戰爭的次數服從泊松分布。那么上面的數據是否有充分的理由推翻每年爆發戰爭的次數服從泊松分布假設?115注意:在擬合優度檢驗中,一般地,把想要支持結論放在原假設。116117118119120121

例:從1500到1931年的432年間,每年爆發戰爭的次數可以看作一個隨機變量,據統計,這432年間共爆發了299次戰爭,具體數據如下:戰爭次數X01234發生X次戰爭的年數22314248154通常假設每年爆發戰爭的次數服從泊松分布。那么上面的數據是否有充分的理由推翻每年爆發戰爭的次數服從泊松分布假設?122戰爭次數x01234實測頻數22314248154概率估計0.5020.3460.1190.0270.006理論頻數21714951123124例2

孟德爾遺傳理論斷言,當兩個品種的豆雜交時,圓的和黃的、起皺的和黃的、圓的和綠的、起皺的和綠的豆的頻數將以比例9:3:3:1發生。在檢驗這個理論時,孟德爾分別得到頻數315、101、108、32、這些數據提供充分證據拒絕該理論嗎?125126豆子狀態x1234實測頻數31510110832

概率9/163/163/161/16理論頻數312.75104.25104.2534.75127141148132138154142150146155158150140147148144150149145149158143141144144126140144142141140145135147146141136140146142137148154137139143140131143141149148135148152143144141143147146150132142142143153149146149138142149142137134144146147140142140137152145例3

下面列出了84個伊特拉斯坎(Etruscan)人男子的頭顱的最大寬度(mm),試檢驗這些數據是否來自正態總體(取α=0.1)128解為粗略了解數據的分布情況,先畫出直方圖。步驟如下:1.找出數據的最小值、最大值為126、158,取區間[124.5,159.5],它能覆蓋[126,158];2.將區間[124.5,159.5]等分為7個小區間,小區間的長度Δ=(159.5-124.5)/7=5,Δ稱為組距,小區間的端點稱為組限,建立下

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論