




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
統計學課件(賈俊平)人大課件8統計學課件(賈俊平)人大課件81第八章方差分析第一節方差分析的基本問題第二節單因素方差分析第三節雙因素方差分析第八章方差分析第一節方差分析的基本問題學習目標解釋方差分析的概念解釋方差分析的基本思想和原理2. 掌握單因素方差分析的方法及應用3. 掌握雙因素方差分析的方法及應用學習目標解釋方差分析的概念第一節方差分析的基本問題一.方差分析的內容二.方差分析的原理三.F分布第一節方差分析的基本問題一.方差分析的內容什么是方差分析?什么是方差分析?什么是方差分析?
(概念要點)檢驗多個總體均值是否相等通過對各觀察數據誤差來源的分析來判斷多個總體均值是否相等2. 變量一個定類尺度的自變量2個或多個(k個)處理水平或分類一個定距或比例尺度的因變量3. 用于分析完全隨機化試驗設計什么是方差分析?
(概念要點)檢驗多個總體均值是否相等什么是方差分析?
(一個例子)表8-1該飲料在五家超市的銷售情況超市無色粉色橘黃色綠色1234526.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.829.632.431.732.8【例8.1】某飲料生產企業研制出一種新型飲料。飲料的顏色共有四種,分別為橘黃色、粉色、綠色和無色透明。這四種飲料的營養含量、味道、價格、包裝等可能影響銷售量的因素全部相同。現從地理位置相似、經營規模相仿的五家超級市場上收集了前一時期該飲料的銷售情況,見表8-1。試分析飲料的顏色是否對銷售量產生影響。什么是方差分析?
(一個例子)表8-1該飲料在五家什么是方差分析?
(例子的進一步分析)檢驗飲料的顏色對銷售量是否有影響,也就是檢驗四種顏色飲料的平均銷售量是否相同設1為無色飲料的平均銷售量,2粉色飲料的平均銷售量,3為橘黃色飲料的平均銷售量,4為綠色飲料的平均銷售量,也就是檢驗下面的假設H0:1234
H1:1,2,3,4不全相等檢驗上述假設所采用的方法就是方差分析什么是方差分析?
(例子的進一步分析)檢驗飲料的顏色對銷售方差分析的基本思想和原理方差分析的基本思想和原理方差分析的基本思想和原理
(幾個基本概念)因素或因子所要檢驗的對象稱為因子要分析飲料的顏色對銷售量是否有影響,顏色是要檢驗的因素或因子水平因素的具體表現稱為水平A1、A2、A3、A4四種顏色就是因素的水平觀察值在每個因素水平下得到的樣本值每種顏色飲料的銷售量就是觀察值方差分析的基本思想和原理
(幾個基本概念)因素或因子方差分析的基本思想和原理
(幾個基本概念)試驗這里只涉及一個因素,因此稱為單因素四水平的試驗總體因素的每一個水平可以看作是一個總體比如A1、A2、A3、A4四種顏色可以看作是四個總體樣本數據上面的數據可以看作是從這四個總體中抽取的樣本數據方差分析的基本思想和原理
(幾個基本概念)試驗1. 比較兩類誤差,以檢驗均值是否相等2. 比較的基礎是方差比3. 如果系統(處理)誤差顯著地不同于隨機誤差,則均值就是不相等的;反之,均值就是相等的4. 誤差是由各部分的誤差占總誤差的比例來測度的方差分析的基本思想和原理1. 比較兩類誤差,以檢驗均值是否相等方差分析的基本思想和原方差分析的基本思想和原理
(兩類誤差)隨機誤差在因素的同一水平(同一個總體)下,樣本的各觀察值之間的差異比如,同一種顏色的飲料在不同超市上的銷售量是不同的不同超市銷售量的差異可以看成是隨機因素的影響,或者說是由于抽樣的隨機性所造成的,稱為隨機誤差
系統誤差在因素的不同水平(不同總體)下,各觀察值之間的差異比如,同一家超市,不同顏色飲料的銷售量也是不同的這種差異可能是由于抽樣的隨機性所造成的,也可能是由于顏色本身所造成的,后者所形成的誤差是由系統性因素造成的,稱為系統誤差方差分析的基本思想和原理
(兩類誤差)隨機誤差方差分析的基本思想和原理
(兩類方差)組內方差因素的同一水平(同一個總體)下樣本數據的方差比如,無色飲料A1在5家超市銷售數量的方差組內方差只包含隨機誤差組間方差因素的不同水平(不同總體)下各樣本之間的方差比如,A1、A2、A3、A4四種顏色飲料銷售量之間的方差組間方差既包括隨機誤差,也包括系統誤差方差分析的基本思想和原理
(兩類方差)組內方差方差分析的基本思想和原理
(方差的比較)如果不同顏色(水平)對銷售量(結果)沒有影響,那么在組間方差中只包含有隨機誤差,而沒有系統誤差。這時,組間方差與組內方差就應該很接近,兩個方差的比值就會接近1如果不同的水平對結果有影響,在組間方差中除了包含隨機誤差外,還會包含有系統誤差,這時組間方差就會大于組內方差,組間方差與組內方差的比值就會大于1當這個比值大到某種程度時,就可以說不同水平之間存在著顯著差異方差分析的基本思想和原理
(方差的比較)如果不同顏色(水平)方差分析中的基本假定方差分析中的基本假定方差分析中的基本假定每個總體都應服從正態分布對于因素的每一個水平,其觀察值是來自服從正態分布總體的簡單隨機樣本比如,每種顏色飲料的銷售量必需服從正態分布各個總體的方差必須相同對于各組觀察數據,是從具有相同方差的總體中抽取的比如,四種顏色飲料的銷售量的方差都相同觀察值是獨立的比如,每個超市的銷售量都與其他超市的銷售量獨立方差分析中的基本假定每個總體都應服從正態分布方差分析中的基本假定在上述假定條件下,判斷顏色對銷售量是否有顯著影響,實際上也就是檢驗具有同方差的四個正態總體的均值是否相等的問題如果四個總體的均值相等,可以期望四個樣本的均值也會很接近四個樣本的均值越接近,我們推斷四個總體均值相等的證據也就越充分樣本均值越不同,我們推斷總體均值不同的證據就越充分方差分析中的基本假定在上述假定條件下,判斷顏色對銷售量是否有方差分析中基本假定如果原假設成立,即H0:m1=m2=m3=m4四種顏色飲料銷售的均值都相等沒有系統誤差這意味著每個樣本都來自均值為、差為2的同一正態總體
Xf(X)1
2
3
4
方差分析中基本假定如果原假設成立,即H0:m1=m方差分析中基本假定如果備擇假設成立,即H1:mi(i=1,2,3,4)不全相等至少有一個總體的均值是不同的有系統誤差這意味著四個樣本分別來自均值不同的四個正態總體
Xf(X)3
1
2
4
方差分析中基本假定如果備擇假設成立,即H1:mi(i=第二節單因素方差分析一.單因素方差分析的步驟二.方差分析中的多重比較三.單因素方差分析中的其他問題第二節單因素方差分析一.單因素方差分析的步驟單因素方差分析的數據結構
觀察值(j)因素(A)i水平A1水平A2…水平Ak12::n
x11x12…x1kx21x22…x2k::::::::xn1
xn2…xnk單因素方差分析的數據結構觀察值(j)因素(A)i單因素方差分析的步驟提出假設構造檢驗統計量統計決策單因素方差分析的步驟提出假設一般提法H0:m1=m2=…=mk(因素有k個水平)H1:m1,m2,…,mk不全相等對前面的例子H0:m1=m2=m3=m4顏色對銷售量沒有影響H0:m1,m2,m3,m4不全相等顏色對銷售量有影響提出假設一般提法構造檢驗的統計量為檢驗H0是否成立,需確定檢驗的統計量
構造統計量需要計算水平的均值全部觀察值的總均值離差平方和均方(MS)
構造檢驗的統計量為檢驗H0是否成立,需確定檢驗的統計量構造檢驗的統計量
(計算水平的均值)假定從第i個總體中抽取一個容量為ni的簡單隨機樣本,第i個總體的樣本均值為該樣本的全部觀察值總和除以觀察值的個數計算公式為式中:ni為第i個總體的樣本觀察值個數
xij為第i個總體的第j個觀察值
構造檢驗的統計量
(計算水平的均值)假定從第i個總體中抽取構造檢驗的統計量
(計算全部觀察值的總均值)全部觀察值的總和除以觀察值的總個數計算公式為構造檢驗的統計量
(計算全部觀察值的總均值)全部觀察值的總構造檢驗的統計量
(前例計算結果)表8-2四種顏色飲料的銷售量及均值超市(j)水平A(i)無色(A1)粉色(A2)橘黃色(A3)綠色(A4)1234526.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.829.632.431.732.8合計136.6147.8132.2157.3573.9水平均值觀察值個數x1=27.32n1=5x2=29.56n2=5x3=26.44n3=5x4=31.46n4=5總均值x=28.695構造檢驗的統計量
(前例計算結果)表8-2四種顏色構造檢驗的統計量
(計算總離差平方和
SST)全部觀察值與總平均值的離差平方和反映全部觀察值的離散狀況其計算公式為前例的計算結果:
SST=(26.5-28.695)2+(28.7-28.695)2+…+(32.8-28.695)2=115.9295構造檢驗的統計量
(計算總離差平方和SST)全部觀察值構造檢驗的統計量
(計算誤差項平方和
SSE)每個水平或組的各樣本數據與其組平均值的離差平方和反映每個樣本各觀察值的離散狀況,又稱組內離差平方和該平方和反映的是隨機誤差的大小計算公式為前例的計算結果:SSE=39.084構造檢驗的統計量
(計算誤差項平方和SSE)每個水平或組的構造檢驗的統計量
(計算水平項平方和
SSA)各組平均值與總平均值的離差平方和反映各總體的樣本均值之間的差異程度,又稱組間平方和該平方和既包括隨機誤差,也包括系統誤差計算公式為前例的計算結果:SSA=76.8455構造檢驗的統計量
(計算水平項平方和SSA)各組平均值構造檢驗的統計量
(三個平方和的關系)總離差平方和(SST)、誤差項離差平方和(SSE)、水平項離差平方和(SSA)之間的關系SST=SSE+SSA構造檢驗的統計量
(三個平方和的關系)總離差平方和(SST構造檢驗的統計量
(三個平方和的作用)
SST反映了全部數據總的誤差程度;SSE反映了隨機誤差的大小;SSA反映了隨機誤差和系統誤差的大小如果原假設成立,即H1=H2=…=Hk為真,則表明沒有系統誤差,組間平方和SSA除以自由度后的均方與組內平方和SSE和除以自由度后的均方差異就不會太大;如果組間均方顯著地大于組內均方,說明各水平(總體)之間的差異不僅有隨機誤差,還有系統誤差判斷因素的水平是否對其觀察值有影響,實際上就是比較組間方差與組內方差之間差異的大小為檢驗這種差異,需要構造一個用于檢驗的統計量構造檢驗的統計量
(三個平方和的作用)SST反映了全部數據構造檢驗的統計量
(計算均方
MS)各離差平方和的大小與觀察值的多少有關,為了消除觀察值多少對離差平方和大小的影響,需要將其平均,這就是均方,也稱為方差計算方法是用離差平方和除以相應的自由度三個平方和的自由度分別是SST的自由度為n-1,其中n為全部觀察值的個數SSA的自由度為k-1,其中k為因素水平(總體)的個數SSE的自由度為n-k構造檢驗的統計量
(計算均方MS)各離差平方和的大小與觀察構造檢驗的統計量
(計算均方
MS)
SSA的均方也稱組間方差,記為MSA,計算公式為
SSE的均方也稱組內方差,記為MSE,計算公式為構造檢驗的統計量
(計算均方MS)SSA的均方也稱組間方構造檢驗的統計量
(計算檢驗的統計量
F)將MSA和MSE進行對比,即得到所需要的檢驗統計量F當H0為真時,二者的比值服從分子自由度為k-1、分母自由度為n-k的F分布,即構造檢驗的統計量
(計算檢驗的統計量F)將MSA和MSE構造檢驗的統計量
(F分布與拒絕域)如果均值相等,F=MSA/MSE1aF分布F(k-1,n-k)0拒絕H0不能拒絕H0F構造檢驗的統計量
(F分布與拒絕域)如果均值相等,F=MSA統計決策
將統計量的值F與給定的顯著性水平的臨界值F進行比較,作出接受或拒絕原假設H0的決策根據給定的顯著性水平,在F分布表中查找與第一自由度df1=k-1、第二自由度df2=n-k相應的臨界值F
若F>F,則拒絕原假設H0,表明均值之間的差異是顯著的,所檢驗的因素(A)對觀察值有顯著影響若FF,則不能拒絕原假設H0,表明所檢驗的因素(A)對觀察值沒有顯著影響統計決策將統計量的值F與給定的顯著性水平的臨界值F單因素方差分析表
(基本結構)方差來源平方和SS自由度df均方MSF值組間(因素影響)組內(誤差)總和SSASSESSTk-1n-kn-1MSAMSEMSAMSE單因素方差分析表
(基本結構)方差來源平方和SS自由度均方F單因素方差分析
(Excel的輸出結果)單因素方差分析
(Excel的輸出結果)單因素方差分析
(一個例子)【例】為了對幾個行業的服務質量進行評價,消費者協會在零售業、旅游業、航空公司、家電制造業分別抽取了不同的樣本,其中零售業抽取7家,旅游業抽取了6家,航空公司抽取5家、家電制造業抽取了5家,然后記錄了一年中消費者對總共23家服務企業投訴的次數,結果如表9.7。試分析這四個行業的服務質量是否有顯著差異?(=0.05)單因素方差分析
(一個例子)【例】為了對幾個行業的服務質量進單因素方差分析
(一個例子)消費者對四個行業的投訴次數
觀察值(j)行業(A)零售業旅游業航空公司家電制造業12345675755464554534762496054565551494855477068636960單因素方差分析
(一個例子)消費者對四個行業的投訴次數觀察單因素方差分析
(計算結果)解:設四個行業被投訴次數的均值分別為,m1、m2、m3、m4,則需要檢驗如下假設
H0:m1=m2=m3=m4(四個行業的服務質量無顯著差異)H1:m1,m2,m3,m4不全相等(有顯著差異)Excel輸出的結果如下結論:拒絕H0。四個行業的服務質量有顯著差異單因素方差分析
(計算結果)解:設四個行業被投訴次數的均值分方差分析中的多重比較方差分析中的多重比較方差分析中的多重比較
(作用)多重比較是通過對總體均值之間的配對比較來進一步檢驗到底哪些均值之間存在差異多重比較方法有多種,這里介紹Fisher提出的最小顯著差異方法,簡寫為LSD,該方法可用于判斷到底哪些均值之間有差異
LSD方法是對檢驗兩個總體均值是否相等的t檢驗方法的總體方差估計加以修正(用MSE來代替)而得到的方差分析中的多重比較
(作用)多重比較是通過對總體均值之間的方差分析中的多重比較
(步驟)提出假設H0:mi=mj(第i個總體的均值等于第j個總體的均值)H1:mi
mj(第i個總體的均值不等于第j個總體的均值)檢驗的統計量為若|t|t,拒絕H0;若|t|<t,不能拒絕H0方差分析中的多重比較
(步驟)提出假設若|t|t,拒方差分析中的多重比較
(基于統計量xi-xj的LSD方法)通過判斷樣本均值之差的大小來檢驗H0檢驗的統計量為:xi–xj檢驗的步驟為
提出假設H0:mi=mj(第i個總體的均值等于第j個總體的均值)H1:mi
mj(第i個總體的均值不等于第j個總體的均值)計算LSD若|xi-xj|LSD,拒絕H0,若|xi-xj|<LSD
,不能拒絕H0方差分析中的多重比較
(基于統計量xi-xj的LSD方法方差分析中的多重比較
(實例)根據前面的計算結果:x1=27.3;x2=29.5;x3=26.4;x4=31.4提出假設H0:mi=mj;H1:mi
mj計算LSD方差分析中的多重比較
(實例)根據前面的計算結果:x1方差分析中的多重比較
(實例)|x1-x2|=|27.3-29.5|=2.2>2.096顏色1與顏色2的銷售量有顯著差異|x1-x3|=|27.3-26.4|=0.9<2.096顏色1與顏色3的銷售量沒有顯著差異|x1-x4|=|27.3-31.4|=4.1>2.096顏色1與顏色4的銷售量有顯著差異|x2-x3|=|29.5-26.4|=3.1>2.096顏色2與顏色3的銷售量有顯著差異|x2-x4|=|29.5-31.4|=1.9<2.096顏色2與顏色4的銷售量沒有顯著差異|x3-x4|=|26.4-31.4|=5>2.096顏色3與顏色4的銷售量有顯著差異方差分析中的多重比較
(實例)|x1-x2|=|27第三節雙因素方差分析一.雙因素方差分析的基本問題二.雙因素方差分析的數據結構雙因素方差分析的步驟一個應用實例第三節雙因素方差分析一.雙因素方差分析的基本問題雙因素方差分析的基本問題雙因素方差分析的基本問題雙因素方差分析
(概念要點)分析兩個因素(因素A和因素B)對試驗結果的影響
分別對兩個因素進行檢驗,分析是一個因素在起作用,還是兩個因素都起作用,還是兩個因素都不起作用如果A和B對試驗結果的影響是相互獨立的,分別判斷因素A和因素B對試驗指標的影響,這時的雙因素方差分析稱為無交互作用的雙因素方差分析如果除了A和B對試驗結果的單獨影響外,因素A和因素B的搭配還會對銷售量產生一種新的影響,這時的雙因素方差分析稱為有交互作用的雙因素方差分析對于無交互作用的雙因素方差分析,其結果與對每個因素分別進行單因素方差分析的結果相同雙因素方差分析
(概念要點)分析兩個因素(因素A和因素B)對雙因素方差分析的基本假定每個總體都服從正態分布對于因素的每一個水平,其觀察值是來自正態分布總體的簡單隨機樣本各個總體的方差必須相同對于各組觀察數據,是從具有相同方差的總體中抽取的觀察值是獨立的雙因素方差分析的基本假定每個總體都服從正態分布雙因素方差分析的數據結構
因素A(i)因素(B)j平均值
B1B2…BrA1A2::Ak
x11x12…x1kx21x22…x2k::::::::xr1
xr2…
xrk
::平均值…雙因素方差分析的數據結構因素A因素(B)j平均值雙因素方差分析的數據結構
是因素A的第i個水平下各觀察值的平均值是因素B的第j個水平下的各觀察值的均值是全部kr個樣本數據的總平均值雙因素方差分析的數據結構是因素A的第i個水平雙因素方差分析的步驟雙因素方差分析的步驟提出假設對因素A提出的假設為H0:m1=m2=…=mi=…=mk(mi為第i個水平的均值)H1:mi
(i=1,2,…,k)不全相等對因素B提出的假設為H0:m1=m2=…=mj=…=mr(mj為第j個水平的均值)H1:mj
(j=1,2,…,r)不全相等提出假設對因素A提出的假設為構造檢驗的統計量為檢驗H0是否成立,需確定檢驗的統計量
構造統計量需要計算總離差平方和水平項平方和誤差項平方和均方
構造檢驗的統計量為檢驗H0是否成立,需確定檢驗的統計量構造檢驗的統計量
(計算總離差平方和
SST)全部觀察值與總平均值的離差平方和反映全部觀察值的離散狀況計算公式為構造檢驗的統計量
(計算總離差平方和SST)全部觀察值構造檢驗的統計量
(計算SSA、SSB和SSE)因素A的離差平方和SSA因素B的離差平方和SSB誤差項平方和SSE構造檢驗的統計量
(計算SSA、SSB和SSE)因素A的離差構造檢驗的統計量
(各平方和的關系)總離差平方和(SST)、水平項離差平方和(SSA和SSB)、誤差項離差平方和(SSE)之間的關系SST=SSA+SSB+SSE構造檢驗的統計量
(各平方和的關系)總離差平方和(SST構造檢驗的統計量
(計算均方
MS)各離差平方和的大小與觀察值的多少有關,為消除觀察值多少對離差平方和大小的影響,需要將其平均,這就是均方,也稱為方差計算方法是用離差平方和除以相應的自由度三個平方和的自由度分別是總離差平方和SST的自由度為kr-1因素A的離差平方和SSA的自由度為k-1因素B的離差平方和SSB的自由度為r-1隨機誤差平方和SSE的自由度為(k-1)×(r-1)構造檢驗的統計量
(計算均方MS)各離差平方和的大小與觀察構造檢驗的統計量
(計算均方
MS)因素A的均方,記為MSA,計算公式為因素B的均方,記為MSB,計算公式為隨機誤差項的均方,記為MSE,計算公式為構造檢驗的統計量
(計算均方MS)因素A的均方,記為MSA構造檢驗的統計量
(計算檢驗的統計量
F)為檢驗因素A的影響是否顯著,采用下面的統計量為檢驗因素B的影響是否顯著,采用下面的統計量構造檢驗的統計量
(計算檢驗的統計量F)為檢驗因素A的影響統計決策
將統計量的值F與給定的顯著性水平的臨界值F進行比較,作出接受或拒絕原假設H0的決策根據給定的顯著性水平在F分布表中查找相應的臨界值F
若FAF,則拒絕原假設H0,表明均值之間的差異是顯著的,即所檢驗的因素(A)對觀察值有顯著影響若FBF,則拒絕原假設H0,表明均值之間有顯著差異,即所檢驗的因素(B)對觀察值有顯著影響統計決策將統計量的值F與給定的顯著性水平的臨界值F雙因素方差分析表
(基本結構)方差來源平方和SS自由度df均方MSF值因素A因素B誤差總和SSASSBSSESSTk-1r-1(k-1)(r-1)kr-1MSAMSBMSEFAFB雙因素方差分析表
(基本結構)方差來源平方和自由度均方F值雙因素方差分析
(一個例子)不同品牌的彩電在各地區的銷售量數據品牌(因素A)銷售地區(因素B)B1B2B3B4B5A1A2A3A4365345358288350368323280343363353298340330343260323333308298【例】有四個品牌的彩電在五個地區銷售,為分析彩電的品牌(因素A)和銷售地區(因素B)對銷售量是否有影響,對每個品牌在各地區的銷售量取得以下數據,見下表。試分析品牌和銷售地區對彩電的銷售量是否有顯著影響?雙因素方差分析
(一個例子)不同品牌的彩電在各地區的銷售量雙因素方差分析
(提出假設)對因素A提出的假設為H0:m1=m2=m3=m4
(品牌對銷售量沒有影響)H1:mi
(i=1,2,…,4)不全相等(品牌對銷售量有影響)對因素B提出的假設為H0:m1=m2=m3=m4=m5
(地區對銷售量沒有影響)H1:mj
(j=1,2,…,5)不全相等(地區對銷售量有影響)雙因素方差分析
(提出假設)對因素A提出的假設為雙因素方差分析
(Excel輸出的結果)結論:
FA=18.10777>F=3.4903,拒絕原假設H0,說明彩電的品牌對銷售量有顯著影響
FB=2.100846<F=3.2592,接受原假設H0,說明銷售地區對彩電的銷售量沒有顯著影響雙因素方差分析
(Excel輸出的結果)結論:本章小結方差分析(ANOVA)的概念方差分析的思想和原理方差分析中的基本假設用Excel進行方差分析本章小結方差分析(ANOVA)的概念結束結束謝謝觀賞!2020/11/572謝謝觀賞!2020/11/572統計學課件(賈俊平)人大課件8統計學課件(賈俊平)人大課件873第八章方差分析第一節方差分析的基本問題第二節單因素方差分析第三節雙因素方差分析第八章方差分析第一節方差分析的基本問題學習目標解釋方差分析的概念解釋方差分析的基本思想和原理2. 掌握單因素方差分析的方法及應用3. 掌握雙因素方差分析的方法及應用學習目標解釋方差分析的概念第一節方差分析的基本問題一.方差分析的內容二.方差分析的原理三.F分布第一節方差分析的基本問題一.方差分析的內容什么是方差分析?什么是方差分析?什么是方差分析?
(概念要點)檢驗多個總體均值是否相等通過對各觀察數據誤差來源的分析來判斷多個總體均值是否相等2. 變量一個定類尺度的自變量2個或多個(k個)處理水平或分類一個定距或比例尺度的因變量3. 用于分析完全隨機化試驗設計什么是方差分析?
(概念要點)檢驗多個總體均值是否相等什么是方差分析?
(一個例子)表8-1該飲料在五家超市的銷售情況超市無色粉色橘黃色綠色1234526.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.829.632.431.732.8【例8.1】某飲料生產企業研制出一種新型飲料。飲料的顏色共有四種,分別為橘黃色、粉色、綠色和無色透明。這四種飲料的營養含量、味道、價格、包裝等可能影響銷售量的因素全部相同。現從地理位置相似、經營規模相仿的五家超級市場上收集了前一時期該飲料的銷售情況,見表8-1。試分析飲料的顏色是否對銷售量產生影響。什么是方差分析?
(一個例子)表8-1該飲料在五家什么是方差分析?
(例子的進一步分析)檢驗飲料的顏色對銷售量是否有影響,也就是檢驗四種顏色飲料的平均銷售量是否相同設1為無色飲料的平均銷售量,2粉色飲料的平均銷售量,3為橘黃色飲料的平均銷售量,4為綠色飲料的平均銷售量,也就是檢驗下面的假設H0:1234
H1:1,2,3,4不全相等檢驗上述假設所采用的方法就是方差分析什么是方差分析?
(例子的進一步分析)檢驗飲料的顏色對銷售方差分析的基本思想和原理方差分析的基本思想和原理方差分析的基本思想和原理
(幾個基本概念)因素或因子所要檢驗的對象稱為因子要分析飲料的顏色對銷售量是否有影響,顏色是要檢驗的因素或因子水平因素的具體表現稱為水平A1、A2、A3、A4四種顏色就是因素的水平觀察值在每個因素水平下得到的樣本值每種顏色飲料的銷售量就是觀察值方差分析的基本思想和原理
(幾個基本概念)因素或因子方差分析的基本思想和原理
(幾個基本概念)試驗這里只涉及一個因素,因此稱為單因素四水平的試驗總體因素的每一個水平可以看作是一個總體比如A1、A2、A3、A4四種顏色可以看作是四個總體樣本數據上面的數據可以看作是從這四個總體中抽取的樣本數據方差分析的基本思想和原理
(幾個基本概念)試驗1. 比較兩類誤差,以檢驗均值是否相等2. 比較的基礎是方差比3. 如果系統(處理)誤差顯著地不同于隨機誤差,則均值就是不相等的;反之,均值就是相等的4. 誤差是由各部分的誤差占總誤差的比例來測度的方差分析的基本思想和原理1. 比較兩類誤差,以檢驗均值是否相等方差分析的基本思想和原方差分析的基本思想和原理
(兩類誤差)隨機誤差在因素的同一水平(同一個總體)下,樣本的各觀察值之間的差異比如,同一種顏色的飲料在不同超市上的銷售量是不同的不同超市銷售量的差異可以看成是隨機因素的影響,或者說是由于抽樣的隨機性所造成的,稱為隨機誤差
系統誤差在因素的不同水平(不同總體)下,各觀察值之間的差異比如,同一家超市,不同顏色飲料的銷售量也是不同的這種差異可能是由于抽樣的隨機性所造成的,也可能是由于顏色本身所造成的,后者所形成的誤差是由系統性因素造成的,稱為系統誤差方差分析的基本思想和原理
(兩類誤差)隨機誤差方差分析的基本思想和原理
(兩類方差)組內方差因素的同一水平(同一個總體)下樣本數據的方差比如,無色飲料A1在5家超市銷售數量的方差組內方差只包含隨機誤差組間方差因素的不同水平(不同總體)下各樣本之間的方差比如,A1、A2、A3、A4四種顏色飲料銷售量之間的方差組間方差既包括隨機誤差,也包括系統誤差方差分析的基本思想和原理
(兩類方差)組內方差方差分析的基本思想和原理
(方差的比較)如果不同顏色(水平)對銷售量(結果)沒有影響,那么在組間方差中只包含有隨機誤差,而沒有系統誤差。這時,組間方差與組內方差就應該很接近,兩個方差的比值就會接近1如果不同的水平對結果有影響,在組間方差中除了包含隨機誤差外,還會包含有系統誤差,這時組間方差就會大于組內方差,組間方差與組內方差的比值就會大于1當這個比值大到某種程度時,就可以說不同水平之間存在著顯著差異方差分析的基本思想和原理
(方差的比較)如果不同顏色(水平)方差分析中的基本假定方差分析中的基本假定方差分析中的基本假定每個總體都應服從正態分布對于因素的每一個水平,其觀察值是來自服從正態分布總體的簡單隨機樣本比如,每種顏色飲料的銷售量必需服從正態分布各個總體的方差必須相同對于各組觀察數據,是從具有相同方差的總體中抽取的比如,四種顏色飲料的銷售量的方差都相同觀察值是獨立的比如,每個超市的銷售量都與其他超市的銷售量獨立方差分析中的基本假定每個總體都應服從正態分布方差分析中的基本假定在上述假定條件下,判斷顏色對銷售量是否有顯著影響,實際上也就是檢驗具有同方差的四個正態總體的均值是否相等的問題如果四個總體的均值相等,可以期望四個樣本的均值也會很接近四個樣本的均值越接近,我們推斷四個總體均值相等的證據也就越充分樣本均值越不同,我們推斷總體均值不同的證據就越充分方差分析中的基本假定在上述假定條件下,判斷顏色對銷售量是否有方差分析中基本假定如果原假設成立,即H0:m1=m2=m3=m4四種顏色飲料銷售的均值都相等沒有系統誤差這意味著每個樣本都來自均值為、差為2的同一正態總體
Xf(X)1
2
3
4
方差分析中基本假定如果原假設成立,即H0:m1=m方差分析中基本假定如果備擇假設成立,即H1:mi(i=1,2,3,4)不全相等至少有一個總體的均值是不同的有系統誤差這意味著四個樣本分別來自均值不同的四個正態總體
Xf(X)3
1
2
4
方差分析中基本假定如果備擇假設成立,即H1:mi(i=第二節單因素方差分析一.單因素方差分析的步驟二.方差分析中的多重比較三.單因素方差分析中的其他問題第二節單因素方差分析一.單因素方差分析的步驟單因素方差分析的數據結構
觀察值(j)因素(A)i水平A1水平A2…水平Ak12::n
x11x12…x1kx21x22…x2k::::::::xn1
xn2…xnk單因素方差分析的數據結構觀察值(j)因素(A)i單因素方差分析的步驟提出假設構造檢驗統計量統計決策單因素方差分析的步驟提出假設一般提法H0:m1=m2=…=mk(因素有k個水平)H1:m1,m2,…,mk不全相等對前面的例子H0:m1=m2=m3=m4顏色對銷售量沒有影響H0:m1,m2,m3,m4不全相等顏色對銷售量有影響提出假設一般提法構造檢驗的統計量為檢驗H0是否成立,需確定檢驗的統計量
構造統計量需要計算水平的均值全部觀察值的總均值離差平方和均方(MS)
構造檢驗的統計量為檢驗H0是否成立,需確定檢驗的統計量構造檢驗的統計量
(計算水平的均值)假定從第i個總體中抽取一個容量為ni的簡單隨機樣本,第i個總體的樣本均值為該樣本的全部觀察值總和除以觀察值的個數計算公式為式中:ni為第i個總體的樣本觀察值個數
xij為第i個總體的第j個觀察值
構造檢驗的統計量
(計算水平的均值)假定從第i個總體中抽取構造檢驗的統計量
(計算全部觀察值的總均值)全部觀察值的總和除以觀察值的總個數計算公式為構造檢驗的統計量
(計算全部觀察值的總均值)全部觀察值的總構造檢驗的統計量
(前例計算結果)表8-2四種顏色飲料的銷售量及均值超市(j)水平A(i)無色(A1)粉色(A2)橘黃色(A3)綠色(A4)1234526.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.829.632.431.732.8合計136.6147.8132.2157.3573.9水平均值觀察值個數x1=27.32n1=5x2=29.56n2=5x3=26.44n3=5x4=31.46n4=5總均值x=28.695構造檢驗的統計量
(前例計算結果)表8-2四種顏色構造檢驗的統計量
(計算總離差平方和
SST)全部觀察值與總平均值的離差平方和反映全部觀察值的離散狀況其計算公式為前例的計算結果:
SST=(26.5-28.695)2+(28.7-28.695)2+…+(32.8-28.695)2=115.9295構造檢驗的統計量
(計算總離差平方和SST)全部觀察值構造檢驗的統計量
(計算誤差項平方和
SSE)每個水平或組的各樣本數據與其組平均值的離差平方和反映每個樣本各觀察值的離散狀況,又稱組內離差平方和該平方和反映的是隨機誤差的大小計算公式為前例的計算結果:SSE=39.084構造檢驗的統計量
(計算誤差項平方和SSE)每個水平或組的構造檢驗的統計量
(計算水平項平方和
SSA)各組平均值與總平均值的離差平方和反映各總體的樣本均值之間的差異程度,又稱組間平方和該平方和既包括隨機誤差,也包括系統誤差計算公式為前例的計算結果:SSA=76.8455構造檢驗的統計量
(計算水平項平方和SSA)各組平均值構造檢驗的統計量
(三個平方和的關系)總離差平方和(SST)、誤差項離差平方和(SSE)、水平項離差平方和(SSA)之間的關系SST=SSE+SSA構造檢驗的統計量
(三個平方和的關系)總離差平方和(SST構造檢驗的統計量
(三個平方和的作用)
SST反映了全部數據總的誤差程度;SSE反映了隨機誤差的大小;SSA反映了隨機誤差和系統誤差的大小如果原假設成立,即H1=H2=…=Hk為真,則表明沒有系統誤差,組間平方和SSA除以自由度后的均方與組內平方和SSE和除以自由度后的均方差異就不會太大;如果組間均方顯著地大于組內均方,說明各水平(總體)之間的差異不僅有隨機誤差,還有系統誤差判斷因素的水平是否對其觀察值有影響,實際上就是比較組間方差與組內方差之間差異的大小為檢驗這種差異,需要構造一個用于檢驗的統計量構造檢驗的統計量
(三個平方和的作用)SST反映了全部數據構造檢驗的統計量
(計算均方
MS)各離差平方和的大小與觀察值的多少有關,為了消除觀察值多少對離差平方和大小的影響,需要將其平均,這就是均方,也稱為方差計算方法是用離差平方和除以相應的自由度三個平方和的自由度分別是SST的自由度為n-1,其中n為全部觀察值的個數SSA的自由度為k-1,其中k為因素水平(總體)的個數SSE的自由度為n-k構造檢驗的統計量
(計算均方MS)各離差平方和的大小與觀察構造檢驗的統計量
(計算均方
MS)
SSA的均方也稱組間方差,記為MSA,計算公式為
SSE的均方也稱組內方差,記為MSE,計算公式為構造檢驗的統計量
(計算均方MS)SSA的均方也稱組間方構造檢驗的統計量
(計算檢驗的統計量
F)將MSA和MSE進行對比,即得到所需要的檢驗統計量F當H0為真時,二者的比值服從分子自由度為k-1、分母自由度為n-k的F分布,即構造檢驗的統計量
(計算檢驗的統計量F)將MSA和MSE構造檢驗的統計量
(F分布與拒絕域)如果均值相等,F=MSA/MSE1aF分布F(k-1,n-k)0拒絕H0不能拒絕H0F構造檢驗的統計量
(F分布與拒絕域)如果均值相等,F=MSA統計決策
將統計量的值F與給定的顯著性水平的臨界值F進行比較,作出接受或拒絕原假設H0的決策根據給定的顯著性水平,在F分布表中查找與第一自由度df1=k-1、第二自由度df2=n-k相應的臨界值F
若F>F,則拒絕原假設H0,表明均值之間的差異是顯著的,所檢驗的因素(A)對觀察值有顯著影響若FF,則不能拒絕原假設H0,表明所檢驗的因素(A)對觀察值沒有顯著影響統計決策將統計量的值F與給定的顯著性水平的臨界值F單因素方差分析表
(基本結構)方差來源平方和SS自由度df均方MSF值組間(因素影響)組內(誤差)總和SSASSESSTk-1n-kn-1MSAMSEMSAMSE單因素方差分析表
(基本結構)方差來源平方和SS自由度均方F單因素方差分析
(Excel的輸出結果)單因素方差分析
(Excel的輸出結果)單因素方差分析
(一個例子)【例】為了對幾個行業的服務質量進行評價,消費者協會在零售業、旅游業、航空公司、家電制造業分別抽取了不同的樣本,其中零售業抽取7家,旅游業抽取了6家,航空公司抽取5家、家電制造業抽取了5家,然后記錄了一年中消費者對總共23家服務企業投訴的次數,結果如表9.7。試分析這四個行業的服務質量是否有顯著差異?(=0.05)單因素方差分析
(一個例子)【例】為了對幾個行業的服務質量進單因素方差分析
(一個例子)消費者對四個行業的投訴次數
觀察值(j)行業(A)零售業旅游業航空公司家電制造業12345675755464554534762496054565551494855477068636960單因素方差分析
(一個例子)消費者對四個行業的投訴次數觀察單因素方差分析
(計算結果)解:設四個行業被投訴次數的均值分別為,m1、m2、m3、m4,則需要檢驗如下假設
H0:m1=m2=m3=m4(四個行業的服務質量無顯著差異)H1:m1,m2,m3,m4不全相等(有顯著差異)Excel輸出的結果如下結論:拒絕H0。四個行業的服務質量有顯著差異單因素方差分析
(計算結果)解:設四個行業被投訴次數的均值分方差分析中的多重比較方差分析中的多重比較方差分析中的多重比較
(作用)多重比較是通過對總體均值之間的配對比較來進一步檢驗到底哪些均值之間存在差異多重比較方法有多種,這里介紹Fisher提出的最小顯著差異方法,簡寫為LSD,該方法可用于判斷到底哪些均值之間有差異
LSD方法是對檢驗兩個總體均值是否相等的t檢驗方法的總體方差估計加以修正(用MSE來代替)而得到的方差分析中的多重比較
(作用)多重比較是通過對總體均值之間的方差分析中的多重比較
(步驟)提出假設H0:mi=mj(第i個總體的均值等于第j個總體的均值)H1:mi
mj(第i個總體的均值不等于第j個總體的均值)檢驗的統計量為若|t|t,拒絕H0;若|t|<t,不能拒絕H0方差分析中的多重比較
(步驟)提出假設若|t|t,拒方差分析中的多重比較
(基于統計量xi-xj的LSD方法)通過判斷樣本均值之差的大小來檢驗H0檢驗的統計量為:xi–xj檢驗的步驟為
提出假設H0:mi=mj(第i個總體的均值等于第j個總體的均值)H1:mi
mj(第i個總體的均值不等于第j個總體的均值)計算LSD若|xi-xj|LSD,拒絕H0,若|xi-xj|<LSD
,不能拒絕H0方差分析中的多重比較
(基于統計量xi-xj的LSD方法方差分析中的多重比較
(實例)根據前面的計算結果:x1=27.3;x2=29.5;x3=26.4;x4=31.4提出假設H0:mi=mj;H1:mi
mj計算LSD方差分析中的多重比較
(實例)根據前面的計算結果:x1方差分析中的多重比較
(實例)|x1-x2|=|27.3-29.5|=2.2>2.096顏色1與顏色2的銷售量有顯著差異|x1-x3|=|27.3-26.4|=0.9<2.096顏色1與顏色3的銷售量沒有顯著差異|x1-x4|=|27.3-31.4|=4.1>2.096顏色1與顏色4的銷售量有顯著差異|x2-x3|=|29.5-26.4|=3.1>2.096顏色2與顏色3的銷售量有顯著差異|x2-x4|=|29.5-31.4|=1.9<2.096顏色2與顏色4的銷售量沒有顯著差異|x3-x4|=|26.4-31.4|=5>2.096顏色3與顏色4的銷售量有顯著差異方差分析中的多重比較
(實例)|x1-x2|=|27第三節雙因素方差分析一.雙因素方差分析的基本問題二.雙因素方差分析的數據結構雙因素方差分析的步驟一個應用實例第三節雙因素方差分析一.雙因素方差分析的基本問題雙因素方差分析的基本問題雙因素方差分析的基本問題雙因素方差分析
(概念要點)分析兩個因素(因素A和因素B)對試驗結果的影響
分別對兩個因素進行檢驗,分析是一個因素在起作用,還是兩個因素都起作用,還是兩個因素都不起作用如果A和B對試驗結果的影響是相互獨立的,分別判斷因素A和因素B對試驗指標的影響,這時的雙因素方差分析稱為無交互作用的雙因素方差分析如果除了A和B對試驗結果的單獨影響外,因素A和因素B的搭配還會對銷售量產生一種新的影響,這時的雙因素方差分析稱為有交互作用的雙因素方差分析對于無交互作用的雙因素方差分析,其結果與對每個因素分別進行單因素方差分析的結果相同雙因素方差分析
(概念要點)分析兩個因素(因素A和因素B)對雙因素方差分析的基本假定每個總體都服從正態分布對于因素的每一個水平,其觀察值是來自正態分布總體的簡單隨機樣本各個總體的方差必須相同對于各組觀察數據,是從具有相同方差的總體中抽取的觀察值是獨立的雙因素方差分析的基本假定每個總體都服從正態分布雙因素方差分析的數據結構
因素A(i)因素(B)j平均值
B1B2…BrA1A2::Ak
x11x12…x1kx21x22…x2k::::::::xr1
xr2…
xrk
::平均值…雙因素方差分析的數據結構因素A因素(B)j平均值雙因素方差分析的數據結構
是因素A的第i個水平下各觀察值的平均值是因素B的第j個水平下的各觀察值的均值是全部kr個樣本數據的總平均值雙因素方差分析的數據結構是因素A的第i個水平雙因素方差分析的步驟雙因素方差分析的步驟提出假設對因素A提出的假設為H0:m1=m2=…=mi=…=mk(mi為第i個水平的均值)H1:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年初級銀行從業資格之初級個人理財題庫綜合試卷A卷附答案
- 提高生產連續性的措施與方法計劃
- 冷凍半成品轉讓合同范例
- 針對不同性格員工的管理策略計劃
- 農村荒山購買合同樣本
- 與超市合伙合同標準文本
- 與員工勞務派遣合同樣本
- 全職保姆雇用合同樣本
- 兌fan店合同樣本
- 臨街網吧轉讓合同范例
- 配電變壓器運行管理制度
- 不可gdqwz01-ae001l01eel cl0501rev.0物料電力電纜表
- 應急管理概論-理論與實踐電子教案完整版
- 幼兒繪本故事:波西和皮普大怪獸
- 保安隊排班表
- (完整版)ERCP并發癥及應急預案
- AD域部署方案完整版
- T∕CAGHP 066-2019 危巖落石柔性防護網工程技術規范(試行)
- 初一數學趣味競賽試題
- 微機ATX電源電路的工作原理與維修
- 2019JGJ196塔式起重機安裝使用拆卸安全技術規程
評論
0/150
提交評論