大學統計學 第6章 假設檢驗與方差分析ppt課件_第1頁
大學統計學 第6章 假設檢驗與方差分析ppt課件_第2頁
大學統計學 第6章 假設檢驗與方差分析ppt課件_第3頁
大學統計學 第6章 假設檢驗與方差分析ppt課件_第4頁
大學統計學 第6章 假設檢驗與方差分析ppt課件_第5頁
已閱讀5頁,還剩121頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、統計學導論統計學導論第六章第六章 假設檢驗與方差分析假設檢驗與方差分析n第一節第一節 假設檢驗的根本原理假設檢驗的根本原理 n第二節第二節 總體均值的假設檢驗總體均值的假設檢驗 n第三節第三節 總體比例的假設檢驗總體比例的假設檢驗 n第四節第四節 單因子方差分析單因子方差分析n第五節第五節 雙因子方差分析雙因子方差分析n第六節第六節 Excel在假設檢驗與方差分析在假設檢驗與方差分析 n 中的運用中的運用第一節第一節 假設檢驗的根本原理假設檢驗的根本原理n一、什么是假設檢驗一、什么是假設檢驗n二、原假設與備擇假設二、原假設與備擇假設n三、檢驗統計量三、檢驗統計量n四、顯著性程度、四、顯著性程度

2、、P-值與臨界值值與臨界值n五、雙側檢驗和單側檢驗五、雙側檢驗和單側檢驗n六、假設檢驗的兩類錯誤六、假設檢驗的兩類錯誤n七、關于假設檢驗結論的了解七、關于假設檢驗結論的了解一、什么是假設檢驗一、什么是假設檢驗n【例【例6-1】假定咖啡的分袋包裝消費線的裝袋】假定咖啡的分袋包裝消費線的裝袋分量服從正態分布分量服從正態分布N,2。消費線按每袋。消費線按每袋凈重凈重150克的技術規范控制操作。現從消費線克的技術規范控制操作。現從消費線抽取簡單隨機樣本抽取簡單隨機樣本n=100袋,測得其平均分量袋,測得其平均分量為為 =149.8克,樣本規范差克,樣本規范差s=0.872克。問該克。問該消費線的裝袋凈

3、重的期望值能否為消費線的裝袋凈重的期望值能否為150克即克即問消費線能否處于控制形狀問消費線能否處于控制形狀?xn 所謂假設檢驗,就是事先對總體的參數所謂假設檢驗,就是事先對總體的參數或總體分布方式做出一個假設,然后利用抽或總體分布方式做出一個假設,然后利用抽取的樣本信息來判別這個假設原假設能取的樣本信息來判別這個假設原假設能否合理,即判別總體的真實情況與原假設能否合理,即判別總體的真實情況與原假設能否存在顯著的系統性差別,所以假設檢驗又否存在顯著的系統性差別,所以假設檢驗又被稱為顯著性檢驗。被稱為顯著性檢驗。 一個完好的假設檢驗過程,包括以下幾個步一個完好的假設檢驗過程,包括以下幾個步驟:驟

4、:1提出假設;提出假設;2構造適當的檢驗統計量,并根據樣本計構造適當的檢驗統計量,并根據樣本計 算統計量的詳細數值;算統計量的詳細數值;3規定顯著性程度,建立檢驗規那么;規定顯著性程度,建立檢驗規那么;4做出判別。做出判別。二、原假設與備擇假設二、原假設與備擇假設n原假設普通用原假設普通用H0表示,通常是設定總體參數等于某表示,通常是設定總體參數等于某值,或服從某個分布函數等值,或服從某個分布函數等n備擇假設是與原假設相互排斥的假設,原假設與備擇備擇假設是與原假設相互排斥的假設,原假設與備擇假設不能夠同時成立。假設不能夠同時成立。n所謂假設檢驗問題本質上就是要判別所謂假設檢驗問題本質上就是要判

5、別H0能否正確,能否正確,假設回絕原假設假設回絕原假設H0 ,那么意味著接受備擇假設,那么意味著接受備擇假設H1 。 n如在例如在例6-1中,我們可以提出兩個假設:假設平均袋中,我們可以提出兩個假設:假設平均袋裝咖啡分量與所要控制的規范沒有顯著差別,記裝咖啡分量與所要控制的規范沒有顯著差別,記為為 ;n假設平均袋裝咖啡分量與所要控制的規范有顯著差別,假設平均袋裝咖啡分量與所要控制的規范有顯著差別,記為記為 。150:0H150:1H三、檢驗統計量三、檢驗統計量n所謂檢驗統計量,就是根據所抽取的樣本計所謂檢驗統計量,就是根據所抽取的樣本計算的用于檢驗原假設能否成立的隨機變量。算的用于檢驗原假設能

6、否成立的隨機變量。n檢驗統計量中該當含有所要檢驗的總體參數,檢驗統計量中該當含有所要檢驗的總體參數,以便在以便在“總體參數等于某數值的假定下研總體參數等于某數值的假定下研討樣本統計量的觀測結果。討樣本統計量的觀測結果。n檢驗統計量還應該在檢驗統計量還應該在“H0成立的前提下有成立的前提下有知的分布,從而便于計算出現某種特定的觀知的分布,從而便于計算出現某種特定的觀測結果的概率。測結果的概率。 四、顯著性程度、四、顯著性程度、P-值與臨界值值與臨界值n1、判別的根據:、判別的根據:n小概率原理:小概率事件在單獨一次的小概率原理:小概率事件在單獨一次的實驗中根本上不會發生,可以不予思索。實驗中根本

7、上不會發生,可以不予思索。n2、判別的邏輯:、判別的邏輯:n假設在原假設正確的前提下,檢驗統計假設在原假設正確的前提下,檢驗統計量的樣本觀測值的出現屬于小概率事件,量的樣本觀測值的出現屬于小概率事件,那么可以以為原假設不可信,從而否認那么可以以為原假設不可信,從而否認它,轉而接受備擇假設。它,轉而接受備擇假設。n什么是小概率?這要根據實踐問題而定。什么是小概率?這要根據實踐問題而定。n假設檢驗中,通常取假設檢驗中,通常取=0.01,=0.05 ,最大到最大到=0.10 。n又稱為顯著性程度。又稱為顯著性程度。n3、判別規那么:、判別規那么:n一是一是P-值規那么;值規那么;n二是臨界值規那么。

8、二是臨界值規那么。n1P-值規那么值規那么n 所謂所謂P-值,實踐上是檢驗統計量值,實踐上是檢驗統計量超越超越(大于或小于大于或小于)詳細樣本觀測值的概詳細樣本觀測值的概率。率。n單側檢驗單側檢驗n假設假設p-值值 ,不回絕不回絕 H0n假設假設p-值值 /2, 不回絕不回絕 H0n假設假設p-值值 /2, 回絕回絕 H0n【例【例6-3】假定,根據例】假定,根據例6-2的結果,計算該問題的的結果,計算該問題的P-值,并做出判別。值,并做出判別。n 解:查規范正態概率表,解:查規范正態概率表,n 當當z=2.29時,時,(0.9774+0.9786)/2=0.9780,n 尾部面積為尾部面積為

9、(10.9780)/2=0.011,n 由對稱性可知,當由對稱性可知,當z= 2.29時,左側面積為時,左側面積為0.011。n 0.011/2=0.025n 0.011這個數字意味著,假假設我們反復抽取這個數字意味著,假假設我們反復抽取n=100的樣本,在的樣本,在100個樣本中僅有能夠出現一個使個樣本中僅有能夠出現一個使檢驗統計量等于或小于檢驗統計量等于或小于2.29的樣本。該事件發生的的樣本。該事件發生的概率小于給定的顯著性程度,所以,可以判別概率小于給定的顯著性程度,所以,可以判別=150的假定是錯誤的,也就是說,根據觀測的樣本,有的假定是錯誤的,也就是說,根據觀測的樣本,有理由闡明總

10、體均值與理由闡明總體均值與150克的差別是顯著存在的。克的差別是顯著存在的。n二臨界值規那么二臨界值規那么n 假設檢驗中,根據所提出的顯著性程度規假設檢驗中,根據所提出的顯著性程度規范它是概率密度曲線的尾部面積查表得到相范它是概率密度曲線的尾部面積查表得到相應的檢驗統計量的數值,稱作臨界值,應的檢驗統計量的數值,稱作臨界值,n直接用檢驗統計量的觀測值與臨界值作比直接用檢驗統計量的觀測值與臨界值作比較,觀測值落在臨界值所劃定的尾部稱之為回較,觀測值落在臨界值所劃定的尾部稱之為回絕域內,便回絕原假設;絕域內,便回絕原假設;n觀測值落在臨界值所劃定的尾部之外稱觀測值落在臨界值所劃定的尾部之外稱之為不

11、能回絕域的范圍內,那么以為回絕原假之為不能回絕域的范圍內,那么以為回絕原假設的證據缺乏。設的證據缺乏。n留意:留意:n1P-值規那么和臨界值規那么是等價的。值規那么和臨界值規那么是等價的。在做檢驗的時候,只用其中一個規那么在做檢驗的時候,只用其中一個規那么即可。即可。n2P-值規那么較之臨界值規那么具有更值規那么較之臨界值規那么具有更明顯的優點。第一,它更加簡捷;第二,明顯的優點。第一,它更加簡捷;第二,在在P-值規那么的檢驗結論中,對于犯第值規那么的檢驗結論中,對于犯第一類錯誤的概率的表述更加準確。一類錯誤的概率的表述更加準確。n引薦運用引薦運用P-值規那么。值規那么。n【例【例6-4】假定

12、,根據例】假定,根據例6-2的結果,用臨界的結果,用臨界值規那么做出判別。值規那么做出判別。n 解:查表得到,臨界值解:查表得到,臨界值z0.025= 1.96。由于由于n z= 2.29 1.96,即,檢驗統計量的觀測值,即,檢驗統計量的觀測值落在臨界值所劃定的左側即落在回絕域,落在臨界值所劃定的左側即落在回絕域,因此回絕因此回絕150克的原假設。克的原假設。n上面的檢驗結果意味著,由樣本數據得上面的檢驗結果意味著,由樣本數據得到的觀測值的差別提示我們:裝袋消費線的到的觀測值的差別提示我們:裝袋消費線的消費過程曾經偏離了控制形狀,正在向裝袋消費過程曾經偏離了控制形狀,正在向裝袋分量低于技術規

13、范的形狀傾斜。分量低于技術規范的形狀傾斜。五、雙側檢驗和單側檢驗五、雙側檢驗和單側檢驗 圖圖6-1 雙側、單側檢驗的回絕域分配雙側、單側檢驗的回絕域分配/21 /2Z/2 Z/2 Z 0 0 Z (a)雙側檢驗(b)左側檢驗 (c)右側檢驗 表表6-1 回絕域的單、雙側與備擇假設之間的對應關系回絕域的單、雙側與備擇假設之間的對應關系拒絕域位置P-值檢驗的顯著性水平判斷標準原假設備擇假設雙側/2H0:0H1:0左單側H0:0H1:0六、假設檢驗的兩類錯誤六、假設檢驗的兩類錯誤n例;某工廠預備購買一批較廉價的原資料,要例;某工廠預備購買一批較廉價的原資料,要是這批原資料的次品率大到是這批原資料的次

14、品率大到5%以上,就回絕以上,就回絕購買。購買。n當假設檢驗后回絕購買,就會犯第一類錯誤,當假設檢驗后回絕購買,就會犯第一類錯誤,失去購買廉價原資料,而出高價購買,添加產失去購買廉價原資料,而出高價購買,添加產品本錢;品本錢;n當假設檢驗后接受購買,就會犯第二類錯誤,當假設檢驗后接受購買,就會犯第二類錯誤,n不合格原資料使產品的次品率上升。不合格原資料使產品的次品率上升。n怎樣辦?工廠決策者有必要搞清楚哪一類錯誤怎樣辦?工廠決策者有必要搞清楚哪一類錯誤呵斥的損失小,以減少本錢。呵斥的損失小,以減少本錢。七、關于假設檢驗結論的了解七、關于假設檢驗結論的了解在假設檢驗中,當原假設被回絕時,在假設檢

15、驗中,當原假設被回絕時,我們可以以較大的把握一定備擇我們可以以較大的把握一定備擇假設的成立。而當原假設未被回假設的成立。而當原假設未被回絕時,我們并不能以為原假設確絕時,我們并不能以為原假設確實成立。實成立。 第二節第二節 總體均值的假設檢驗總體均值的假設檢驗n一、單個總體均值的檢驗一、單個總體均值的檢驗n二、雙總體均值能否相等的檢驗二、雙總體均值能否相等的檢驗一、單個總體均值的檢驗一、單個總體均值的檢驗n例:某車間消費一種機器零件,知其直例:某車間消費一種機器零件,知其直徑平均長度為徑平均長度為32.05,方差為方差為1.21。現進展。現進展工藝改革,假設質量不下降,可以進展工藝改革,假設質

16、量不下降,可以進展全面改革,假設質量下降那么暫不改革。全面改革,假設質量下降那么暫不改革。現隨機抽取現隨機抽取6個零件,測得其直徑為:個零件,測得其直徑為:32.56,29.66,31.64,30.00,31.87,31.03。試以。試以95%的顯著程度檢驗該改革的顯著程度檢驗該改革能否可以實行?能否可以實行?n解:13.31676.186nxx假設為:假設為:臨界值:臨界值:接受域:接受域:否認域:否認域:Z1.96Z1.96或或Z-1.96Z-1.96檢驗統計量:檢驗統計量:判別:判別:Z Z值落在否認域內,故回絕值落在否認域內,故回絕H0H0。闡明工藝改。闡明工藝改革前后,零件的平均直徑

17、有顯著的差別,對消費影革前后,零件的平均直徑有顯著的差別,對消費影響是顯著。該改革是不可以實行響是顯著。該改革是不可以實行0532053210.:.: HH96. 1%,951025. 0Z96. 196. 1Z0487. 24491. 092. 061 . 105.3213.310nxZn例:知總體服從N90, 502 。從該總體中隨機抽取容量為25的樣本,得出樣本平均值為70。試以95%的顯著程度檢驗原假設 。900n解:n結論:否認原假設2255090700nxZ96. 1%,951025. 0Z90:90:10HHn例:某廠消費一種產品,原月產量服從例:某廠消費一種產品,原月產量服從N

18、75,14。設備更新后,為了調查。設備更新后,為了調查產量能否提高,抽查了六個月產量,得產量能否提高,抽查了六個月產量,得到平均月產量為到平均月產量為78。問在顯著程度。問在顯著程度95%下,設備更新后月產量能否有顯著的提下,設備更新后月產量能否有顯著的提高?高?n解:75:75:10HH645. 1%,95105. 0Z964. 161475780nxZ為什么是為什么是單側檢驗?單側檢驗?結論:否認原假設,闡明設備更新后,月產量有所提結論:否認原假設,闡明設備更新后,月產量有所提高。高。n例:知某種汽油用二某種型號的汽車,例:知某種汽油用二某種型號的汽車,每公升油可行駛每公升油可行駛18公里

19、。現研制出一種公里。現研制出一種添加劑以后,每公升汽油行駛的里程能添加劑以后,每公升汽油行駛的里程能否有變化?現隨機抽取否有變化?現隨機抽取25輛汽車作實驗,輛汽車作實驗,結果平均行駛里程為結果平均行駛里程為18.5公里,方差為公里,方差為2.2。試作出檢驗。試作出檢驗。n解:n結論:接受原假設,有95%把握預言參與添加劑后每公升汽油行駛的里程無顯著變化。18:18:10HH711. 1)24(%,95105. 0t6892.1296.05 .0252 .2185 .180nsxt雙側n例:知某種柴油發動機,運用柴油每升例:知某種柴油發動機,運用柴油每升運轉時間服從正態分布。現測試裝配好運轉時

20、間服從正態分布。現測試裝配好的的6臺,它們運轉時間分別為臺,它們運轉時間分別為28,27,31,29,30,27分鐘。按設計要求分鐘。按設計要求應在應在30分鐘以上。據測試結果,在分鐘以上。據測試結果,在95%的顯著程度時,能否闡明這種發動機能的顯著程度時,能否闡明這種發動機能否符合設計要求?否符合設計要求?n解:解:n 接受域:接受域:30:30:10HH02. 2)5(%,95105. 0t,02. 2633.153334.131)(67.2861722nxxsnxx單側單側n檢驗統計量的值:n結論:接受原假設,即以為裝配的這種發動機符合設計要求。995. 16667. 033. 1663

21、3. 13067.280nsxt二、雙總體均值能否相等的檢驗二、雙總體均值能否相等的檢驗然后,從總體然后,從總體A A和和B B中各選一個能夠樣本配中各選一個能夠樣本配成對,計算每一對樣本平均數之差成對,計算每一對樣本平均數之差兩個樣本平均數之差的抽樣分布兩個樣本平均數之差的抽樣分布就是就是指來自兩個總體成對樣本平均數之關的分指來自兩個總體成對樣本平均數之關的分布。布。2 2性質:性質:總體總體A A: 樣本:樣本:總體總體B B: 樣本:樣本:那么:那么:21xx 211,222,22,xn11,xn222121212121nnxxxx為什么是取加號?或任意常數可以為其中0:,:,:,:21

22、1210211210211210HHHHHH假設檢驗方式:假設檢驗方式:n1兩個總體是正態分布,且方差知,那么檢驗統計量為:2221212121)()(nnxxZn2兩個總體是正態分布,且方差未知但相等,假設為小樣本即 ,那么檢驗統計量為:2) 1() 1()2()11()()(212222112212122121nnsnsnsnnTnnsxxt3021 nnn3兩個總體是正態分布,且方差未知但相兩個總體是正態分布,且方差未知但相等,假設為大樣本即等,假設為大樣本即 ,那,那么檢驗統計量為:么檢驗統計量為:3021 nn)()()(2221212121nsnsxxZ例:某農業研討所實驗磷肥和氮

23、肥能否提高小麥產例:某農業研討所實驗磷肥和氮肥能否提高小麥產量,為此做了兩種實驗:量,為此做了兩種實驗:1 1選八塊實驗田不施磷肥和氮肥;選八塊實驗田不施磷肥和氮肥;2 2選取十塊實驗田在播種前施磷肥,播種后分選取十塊實驗田在播種前施磷肥,播種后分三次加施氮肥,而其它條件一樣。三次加施氮肥,而其它條件一樣。成熟后,分別丈量了它們的畝產,數據如下:成熟后,分別丈量了它們的畝產,數據如下:實驗實驗1 252,204,234,246,222,210,212,244;1 252,204,234,246,222,210,212,244;實驗實驗2 2 172,158,186,214,224,228,19

24、6,190,202,170172,158,186,214,224,228,196,190,202,170試以試以95%95%的顯著程度檢驗施肥與不施肥的平均產量的顯著程度檢驗施肥與不施肥的平均產量有沒有差別有沒有差別? ?n解:設兩個總體服從正態分布,且方差未知但相等。n實驗1的數據計算如下:6 .340723841)()(228818242211nxxskgnxx實驗實驗2 2:551949601)()(1941019402222nxxskgnxxn提出假設:提出假設:n臨界值:臨界值:n接受域:接受域:-2.12,2.12)n統計檢驗量的值為:統計檢驗量的值為:0:, 0:211210HH

25、12. 2)16()2(%,951025. 0212tnnt346.3225.045934101812108551)110(6.340)18(194228112)1()1()11()()(212122221121212121nnnnsnsnxxnnsxxt結論:結論:t t值落在回絕域,故回絕值落在回絕域,故回絕H0H0接受接受H1H1。即闡明適當施肥對小麥增產有顯著的作用。即闡明適當施肥對小麥增產有顯著的作用。n例:假定有人作一次調查,評判甲、乙兩例:假定有人作一次調查,評判甲、乙兩個城市的工人單位時間工資能否一樣。資個城市的工人單位時間工資能否一樣。資料如下:料如下:n城市城市 樣本平均樣

26、本平均 樣本樣本 樣本樣本n 小時的收入小時的收入 (元元) 規范差規范差 容量容量n 甲甲 6.95 0.40 200n 乙乙 7.10 0.60 175n試在試在95%的顯著程度下檢驗兩個城市工人的顯著程度下檢驗兩個城市工人單位時間平均工資能否有差別單位時間平均工資能否有差別?n解:假設n檢驗統計量的值為:0:, 0:211210HH830.2053.015.017560.020040.0010.795.6)()(222221212121nsnsxxZn臨界值:n結論:Z值落在否認域中,故回絕H0,接受H1,闡明兩個城市工人單位時間工資之間明顯的差別。96. 1%,9512Zn例:某工廠為

27、了比較兩種裝配方法的效率,分別組織了兩組員工,每組9人,一組采用新的裝配方法,另外一組采用舊的裝配方法。假設兩組員工設備的裝配時間均服從正態分布,兩總體的方差相等但未知。現有18個員工的設備裝配時間見表6-2,根據這些數據,能否有理由以為新的裝配方法更節約時間?顯著性程度0.05n 表6-2 兩組員工設備的裝配時間 單位:小時 新方法(x2) 353129253440273231舊方法(x1) 323735384144353134第三節第三節 總體比例的假設檢驗總體比例的假設檢驗n一、單個總體比例的假設檢驗一、單個總體比例的假設檢驗n二、兩個總體的比例能否相等的檢驗二、兩個總體的比例能否相等的

28、檢驗一、單個總體比例的假設檢驗一、單個總體比例的假設檢驗 n【例【例6-7】一項調查結果聲稱,某市小學生每】一項調查結果聲稱,某市小學生每月零花錢到達月零花錢到達200元的比例為元的比例為40%,某科研機,某科研機構為了檢驗這個調查能否可靠,隨機抽選了構為了檢驗這個調查能否可靠,隨機抽選了100名小學生,發現有名小學生,發現有47人每月零花錢到達人每月零花錢到達200元,調查結果能否證明早先調查元,調查結果能否證明早先調查40%的看的看法?法? 05. 0n例:某工廠指點以為超越35%的工人稱心該廠的任務環境。為了證明該結論,有關部門作了一次調查,隨機抽取了150名工人,其中有69人對任務環境

29、稱心。試以95%的顯著程度檢驗 的假設。%35:0PHn解:假設:解:假設:n臨界值:臨界值:n接受域:接受域:n檢驗統計量的值:檢驗統計量的值:%35:%,35:10PHPH64. 1%,951Z64.1 ,83. 20389. 011. 0150)35. 01 (35. 035. 046. 0)1 (46. 0150691nPPPpZnnpn結論:Z值落在回絕域內,故回絕原假設,接受備擇假設,闡明該廠工人對任務環境的稱心程度確實超越了35%。例:某公司推出一種男女均宜的飲料,例:某公司推出一種男女均宜的飲料,以為這種飲料的消費者性別比例各為以為這種飲料的消費者性別比例各為50%50%。對消

30、費者抽樣調查結果闡明:。對消費者抽樣調查結果闡明:100100名接受調查的消費者中,男性飲用名接受調查的消費者中,男性飲用者者5555人,女性有人,女性有4545人。當人。當 時,問該飲料消費者的性別比例相等時,問該飲料消費者的性別比例相等的看法能否成立?的看法能否成立?%5解:解:5 . 0:, 5 . 0:10PHPH96195102502.%,.ZZ接受域:-1.96,1.96P=0.5,那么:結論:Z值落在回絕域內,故回絕原假設,接受備擇假設,闡明該飲料消費者的性別比例相等的看法是成立的。當然用女性資料也可得出一樣結論110050150505501).(.)(nPPPpZ二、兩個總體的

31、比例能否相等的檢驗二、兩個總體的比例能否相等的檢驗 第四節第四節 單因子方差分析單因子方差分析n一、問題的提出一、問題的提出n二、方差分析的檢驗統計量二、方差分析的檢驗統計量n三、關于方差分析的兩點闡明三、關于方差分析的兩點闡明One-Factor ANOVA一、問題的提出一、問題的提出n【例【例6-8】知在一組給定的條件下豢養小雞所添加的體重服從正態分布。】知在一組給定的條件下豢養小雞所添加的體重服從正態分布。某養雞場欲檢驗四種飼料配方對小雞增重的影響能否不一樣假定曾經某養雞場欲檢驗四種飼料配方對小雞增重的影響能否不一樣假定曾經經過檢驗闡明不同飼料配方下的小雞增重方差相等。為此,他們對四經過

32、檢驗闡明不同飼料配方下的小雞增重方差相等。為此,他們對四組初始條件完全一樣的小雞,在完全一樣的其他豢養條件下,分別運用組初始條件完全一樣的小雞,在完全一樣的其他豢養條件下,分別運用四種不同的飼料配方進展喂養。所得到的增重數據如表四種不同的飼料配方進展喂養。所得到的增重數據如表6-3。n 表表6-3 四種不同飼料配方下小雞的增重情況四種不同飼料配方下小雞的增重情況飼料配方飼料配方 i小雞序號小雞序號 j38周后小雞個體增重周后小雞個體增重yij(克克) 123456配方13704204504901730配方24903804003905004102570配方33303404003804701920

33、配方44104804004203804102500160016201650168013508208720n對于類似本例的問題,普通地,把隨機變量對于類似本例的問題,普通地,把隨機變量分組的數目記作分組的數目記作m,我們可建立以下假設:,我們可建立以下假設:不全相等,mmHH,:211210方差分析方差分析Analysis of Variance ANOVA ) 要素也稱為處置要素要素也稱為處置要素factor名義分類變量,每名義分類變量,每一處置要素至少有兩個程度一處置要素至少有兩個程度(level)也稱也稱“處置組。處置組。 一個要素程度間獨立一個要素程度間獨立 單要素方差分析單要素方差分析

34、 兩個要素程度間獨立或相關兩個要素程度間獨立或相關雙要素方差分析雙要素方差分析 一個個體多個丈量值一個個體多個丈量值可反復丈量資料的方差分析可反復丈量資料的方差分析 ANOVA與回歸分析相結合與回歸分析相結合協方差分析協方差分析 目的:用這類資料的樣本信息來推斷各處置組間多個總目的:用這類資料的樣本信息來推斷各處置組間多個總體均數的差別有無統計學意義。體均數的差別有無統計學意義。 ANOVA ANOVA 由英國統由英國統計學家計學家R.A.FisherR.A.Fisher首首創,為留念創,為留念FisherFisher,以以F F命名,故方差分析命名,故方差分析又稱又稱 F F 檢驗檢驗 F

35、F testtest。用于推斷多。用于推斷多個總體均數有無差別個總體均數有無差別 組間變異組間變異總變異總變異組內變異組內變異二、方差分析的檢驗統計量二、方差分析的檢驗統計量一切丈量值之間一切丈量值之間總的變異程度總的變異程度各組均數與總均數各組均數與總均數的離均差平方和的離均差平方和用各組內各丈量用各組內各丈量值值Yij與其所在與其所在組的均數差值的組的均數差值的平方和來表示平方和來表示(mean square,MS)10,10215, 1215, 52122121122/22/12121121)(222)(FFFf【例6-9】利用表6-3中的數據進展單因子方差分析顯著程度為=0.05。 表

36、6-4 方差分析表F變異來源離差平方和自由度均方差值P-值臨界值組間7112.1432370.7141.012320.4115733.196774組內39811.67172341.863總計46923.81203n一方差分析中變量的類型一方差分析中變量的類型n 方差分析中的因變量是數量型變量。自變量方差分析中的因變量是數量型變量。自變量可以是質量型變量,也可以是數量型變量。當自變可以是質量型變量,也可以是數量型變量。當自變量是數量型變量的時候,也要對其作統計分組設計,量是數量型變量的時候,也要對其作統計分組設計,也就是將它按質量型變量來處置。也就是將它按質量型變量來處置。n 二總體的正態性和同

37、方差二總體的正態性和同方差n 方差分析適用于多個正態總體方差分析適用于多個正態總體Yii=1,2,m均值的比較,且要求它們具有一樣的方差。不均值的比較,且要求它們具有一樣的方差。不過在實踐運用中,即使對于正態性和同方差性都存過在實踐運用中,即使對于正態性和同方差性都存在很大背叛的數據,方差分析仍不失為一種提供有在很大背叛的數據,方差分析仍不失為一種提供有用的近似信息的技術。用的近似信息的技術。 三、關于方差分析的兩點闡明三、關于方差分析的兩點闡明第五節第五節 雙因子方差分析雙因子方差分析n一、問題的提出一、問題的提出n二、有交互作用的雙因子方差分析二、有交互作用的雙因子方差分析一、問題的提出一

38、、問題的提出n 方差分析中的方差分析中的“因子,也稱要素。它因子,也稱要素。它是一個獨立的變量自變量。在上一節的是一個獨立的變量自變量。在上一節的例子中,我們要分析飼料能否為影響增重產例子中,我們要分析飼料能否為影響增重產生差別的緣由,所以飼料是因子。該例中所生差別的緣由,所以飼料是因子。該例中所調查的因子只需調查的因子只需“飼料一個,而其他因子飼料一個,而其他因子如雞的種類,豢養條件等堅持不變,我們稱如雞的種類,豢養條件等堅持不變,我們稱這種方差分析為單因子方差分析。假設要同這種方差分析為單因子方差分析。假設要同時調查飼料和雞的種類兩個因子對小雞的增時調查飼料和雞的種類兩個因子對小雞的增重能

39、否有影響,那么稱之為雙因子方差分析。重能否有影響,那么稱之為雙因子方差分析。n 在這里要留意,不能把A的r個處置和B的c個處置看成“隨機樣本。如今的rc個處置是rc個總體,即Ai和Bj的每一種搭配構成的組格都是一個總體隨機變量Yij。對一個組格總體的nij個觀測yij1,yij2,yij 才是隨機樣本。n 我們把Ai與Bj的搭配所構成的組格總體即隨機變量Yij的期望值記作 ,于是可以寫出與表6-5樣本相應的總體期望值表如表6-6。 ijnij二、有交互作用的雙因子方差分析二、有交互作用的雙因子方差分析 樣本數據的方差分析恒等式。樣本數據的方差分析恒等式。SST=SSA+SSB+SSAB+SSE 6.24 式中式中,SST是總離差平方和,是總離差平方和, SSA 是是A因子處置間的離差平方和,因子處置間的離差平方和, SSB 是是B因子處置間的離差平方和,因子處置間的離差平方和, SSAB 是是AB交互作用途置間的離差平方交互作用途置間的離差平方和,和, SSE 是組格內離差平方和。是組格內離差平方和。 第六節第六節 Excel在假設檢驗與方差分析中的運用在假設檢驗與方差分析中的運用n一、假設檢驗一、假設檢驗n二、方差分析二、方差分析一、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論