




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
55.1方差分析基本原理5.2單因素方差分析5.3單因素方差分析的SPSS5.4雙因素方差分析大家好1某飲料生產企業研制出一種新型飲料飲料的顏色:橘黃色、粉色、綠色和無色透明飲料的營養含量、味道、價格、包裝相同收集該飲料的銷售情況的超級市場地理位置相似、經營規模相仿試分析飲料的顏色是否對銷售量產生影響四色飲料在五家超市的銷售情況大家好25.1方差分析基本原理方差分析的實質:檢驗多個總體均值是否有顯著性差異(觀測值變異原因的數量分析)將k個處理的觀測值作為一個整體看待,把觀測值總變異的平方和及自由度分解為相應于不同變異來源的平方和及自由度,進而獲得不同變異來源總體方差估計值通過計算這些總體方差的估計值的適當比值,檢驗各樣本所屬總體平均數是否相等大家好35.1.1基本概念(待續)因素:影響實驗結果的條件,常用大寫字母A、B、C、…等表示單因素實驗:當研究中只考察一個因素雙因素(多因素)實驗:同時研究兩個或兩個以上的因素因素水平/水平:因素所處的某種特定狀態或數量等級,用代表該因素的字母加添足標表示,如A1、A2、…,B1、B2、…處理:事先設計好的實施在實驗單位上的具體項目在單因素實驗中,實施在實驗單位上的具體項目就是實驗因素的某一水平在多因素實驗中,實驗因素的一個水平組合就是一個處理大家好4基本概念(續)兩類誤差①隨機誤差:在因素的同一水平(同一個總體)下,樣本的各觀察值之間的差異,由抽樣的隨機性所造成②系統誤差:在因素的不同水平(不同總體)下,各觀察值之間的差異,由系統性因素造成兩類方差①組內方差:因素的同一水平(同一個總體)下樣本數據的方差,組內方差只包含隨機誤差②組間方差:因素的不同水平(不同總體)下各樣本之間的方差,組間方差既包括隨機誤差,也包括系統誤差大家好5實例說明不同顏色(水平)對銷售量(結果)沒有影響組間方差中只包含有隨機誤差,沒有系統誤差組間方差與組內方差很接近,二者比值接近1不同的水平對結果有影響組間方差中包含隨機誤差和系統誤差組間方差大于組內方差,二者比值就會大于1當這個比值大到某種程度時,不同水平之間存在著顯著差異大家好6例5.1單因素四水平的試驗某飲料生產企業研制出一種新型飲料飲料的顏色:橘黃色、粉色、綠色和無色透明飲料的營養含量、味道、價格、包裝相同收集該飲料的銷售情況的超級市場地理位置相似、經營規模相仿試分析飲料的顏色是否對銷售量產生影響四色飲料在五家超市的銷售情況大家好7例題分析設
1為無色飲料(A1)的平均銷售量
2粉色飲料(A2)的平均銷售量
3為橘黃色飲料(A3)的平均銷售量
4為綠色飲料(A4)的平均銷售量用方差分析,分析飲料的顏色對銷售量是否有影響,檢驗假設H0:
1
2
3
4
H1:
1,
2,
3,
4不全相等顏色是要檢驗的因素或因子A1、A2、A3、A4四種顏色就是因素的水平每種顏色飲料的銷售量就是觀察值A1、A2、A3、A4四種顏色可以看作是四個總體,從中抽取的樣本數據大家好85.1.2方差分析中的基本假定(1)變異的可加性(2)每個總體都應服從正態分布(分布的正態性)(3)各組觀察數據,是從具有相同方差的總體中抽取的(4)觀察值是獨立的 如果總體的均值相等,可期望樣本的均值也會很接近:
①樣本的均值越接近,總體均值相等的證據也就越充分
②樣本均值越不同,總體均值不同的證據就越充分大家好9實例分析例5.1中如果原假設成立,即H0:
1
2
3
4四種顏色飲料銷售的均值都相等,且沒有系統誤差每個樣本都來自均值為
、方差為
2的同一正態總體如果備擇假設成立,即H1:
i(i=1,2,3,4)不全相等則至少有一個總體的均值是不同的,且有系統誤差這意味著四個樣本分別來自均值不同的四個正態總體不同正態總體同一正態總體大家好105.2單因素方差分析5.2.1多個總體均值是否相同的檢驗5.2.2多個總體均值的多重比較檢驗大家好115.2.1多個總體均值是否相同的檢驗例5.1中μ表示總體X的均值,μi表示總體Ai的均值,方案i的主效應
i=μi-μ反映水平Ai對銷售量的影響隨機樣本Xij,可以視為各個方案的總體均值μi與隨機誤差之和:Xij=
i+
ij
由于Xij是來自Ai的觀察值,于是有Xij=
i+
ij=i++ij
(i=1,2,…,4;j=1,2,…,5)大家好12表5-2單因素方差總體Xij構成表Xij表達為總平均、方案的主效應i與隨機項之和εij表示觀測過程中各種隨機影響引起的隨機誤差(εij相互獨立,服從N(0,
2)分布對應于μi的樣本均值(統計量)是
xi
,也就是說,
xij-
xi表示是隨機誤差項由
i=μi-μ,若各個方案的主效應都是0,則各個方案的均值相同
單因素方案分析的基本任務是檢驗如下假設H0:所有
i=0或μ1=μ2
=…=μs=μH1:不全相等(至少有兩個不相等)大家好13多個總體均值是否相同的檢驗考察例5.1中顏色是否是影響該飲料銷售量的主要因素若飲料的銷售量服從正態分布,不同顏色飲料銷售量方差相等考察不同顏色對飲料銷售量有無顯著影響,即考察4個水平對銷售量的影響是否差異顯著,即要檢驗假設:H0:a1=a2=a3=a4=0大家好14分析過程(待續)①將總體離差分解總體銷售量離差平方和ST有兩個來源一是由水平不同造成的不同水平下平均銷售量差異SA一是由除了顏色之外的隨機干擾造成的、同一水平下的銷售量差異SE其中,m表示因素A(顏色)的水平數m=4,n表示觀測次數n=5②將總體離差的自由度分解n的含義不同,前者n表示樣本總容量,后者表示觀測次數大家好15分析過程(續)③將離差均方化,得均方和(為了具有可比性)MSA=SA/fAMSE=SE/fE
④比較,計算F值:F=MSA/MSE⑤檢驗,所示看F統計量是否落在接受域還是拒絕域中若F≤F0.05(fA,fE),則無顯著影響,記為/若F0.05(fA,fE)<F<F0.03(fA,fE),則影響較顯著,記為*若F>F0.03(fA,fE),則影響特別顯著,記為**大家好16單因素方差分析表注:F0.05(3,16)=3.24,F0.01(3,16)=5.29由于F=10.458>F0.03(fA,fE),所以顏色對飲料銷售量有特別顯著影響例5.1的單因素方差分析表大家好17例5.2數學成績分析40名學生隨機分成5個班,每個班的班主任負責不同科目A表示班主任教數學B表示班主任教語文C表示班主任教生物D表示班主任教地理E表示班主任教物理用方差分析的方法檢驗5組不同班主任的學生數學成績是否有顯著差異大家好18解題過程①建立假設H0:
1=
2=
3=
4=
5②平方和ST=1160.4,SA=314.4SE=ST-SA=1160.4-314.4=864③自由度fA=k-1=5-1=4,fE=k(n-1)=35④均方MSA=SA/fA=314.4/4=78.6MSE=SE/fE=846/35=24.17⑤F檢驗F=MSA/MSE=78.6/24.17=3.252查F分布表(單側)F0.05(4,35)=2.64,F>F0.05,p<0.05,拒絕原假設,故在不同班主任的班級中數學成績有顯著不同⑥方差分析表注:*表示在0.05水平上顯著大家好19例5.3服務質量分析為了對幾個行業的服務質量進行評價在零售業、旅游業、航空公司、家電制造業分別抽取了不同的樣本記錄了一年中消費者對總共23家服務企業投訴的次數試分析這四個行業的服務質量是否有顯著差異?(
=0.05)大家好20解題過程設四個行業被投訴次數的均值分別為,
1,
2,
3,
4,則需要檢驗如下假設H0:
1=
2=
3=
4=
5(四個行業的服務質量無顯著差異)H1:
1,
2,
3,
4不全相等(有顯著差異)計算結果如下:大家好215.2.2多個總體均值的多重比較檢驗多重比較:在因變量的三個或三個以上水平下均值之間進行兩兩比較檢驗,檢驗均值間差異LSD方法:由Fisher提出的最小顯著差異方法,是對檢驗兩個總體均值是否相等的t檢驗方法的總體方差估計加以修正(用MSE來代替)而得到的,可用于判斷均值之間差異大家好22LSD的操作步驟(1)提出假設H0:
i=j(第i個總體的均值等于第j個總體的均值)H1:
i
j(第i個總體的均值不等于第j個總體的均值)(2)檢驗的統計量為(3)若|t|t
,拒絕H0;若|t|<t
,不能拒絕H0大家好23基于統計量的LSD方法的操作步驟為(1)通過判斷樣本均值之差的大小來檢驗H0(2)檢驗的統計量為:,檢驗的步驟為①提出假設H0:
i=
j(第i個總體的均值等于第j個總體的均值)H1:
i
j(第i個總體的均值不等于第j個總體的均值)②計算LSD③檢驗若||
LSD,拒絕H0,若|
|<LSD,接受H0大家好24實例分析
針對例5.1,根據前面的計算結果有:
x1=27.3;
x2=29.5;
x3=26.4;
x4=31.4①提出假設H0:
i=
j;H1:
i
j②計算LSD③檢驗|
x1-
x2|=|27.3-29.5|=2.2>2.096,顏色1與顏色2的銷售量有顯著差異|
x1-
x3|=|27.3-26.4|=0.9<2.096,顏色1與顏色3的銷售量沒有顯著差異|
x1-
x4|=|27.3-31.4|=4.1>2.096,顏色1與顏色4的銷售量有顯著差異|
x2-
x3|=|29.5-26.4|=3.1>2.096,顏色2與顏色3的銷售量有顯著差異|
x2-
x4|=|29.5-31.4|=1.9<2.096,顏色2與顏色4的銷售量沒有顯著差異|
x3-
x4|=|26.4-31.4|=5>2.096,顏色3與顏色4的銷售量有顯著差異大家好255.3單因素方差分析的SPSS應用例5.4
根據下列隨機抽樣數據,試分析各地區平均每天交通事故的次數是否有顯著性差異(α=0.05)五個地區每天發生交通事故的次數表大家好26分析過程分析不同的地理位置是否為影響每天交通事故次數的因素因素的每個水平——東部、北部、中部、南部、西部看作五個總體設五個地區平均每天發生交通事故的次數分別為
1、
2、
3、
4、
5,從不同總體抽取的樣本數據的個數,分別是4,5,5,6,6檢驗各地區平均每天交通事故的次數是否有顯著性差異,是一個單因素方差分析問題原假設H0:
1=
2=
3=
4=
5備擇假設H1:
1、
2、
3、
4、
5不全相等大家好27One-WayANOVA對話框設置打開數據文件,需要注意“所在地區”對應的變量值標簽定義為1=“東部”,2=“北部”,3=“中部”,4=“南部”,5=“西部”Analyze→CompareMeans→One-WayANOVA→{One-WayANOVA}放置因變量,可放置多個放置自變量用于比較和分析均值的特性,一元方差分析的時候,一般不用此功能方差相等或方差不相等情況下的檢驗選項選擇統計量和缺少值處理方式大家好28One-WayANOVAOptions對話框設置{One-WayANOVA}→(變量Y(交通事故次數))→
DependentList→(變量X(所在地區)→
Factor)→
Options→{One-WayANOVA:Options}要求輸出描述統計量要求輸出固定效應模型的標準離差、標準誤差、和95%的置信區間,還輸出隨機效應模型的標準誤差、95%的置信區間和因素水平間方差估計要求進行方差齊次性檢驗,輸出結果計算Brown-Forsythe統計量,檢驗各組均值是否相等計算Welch統計量,檢驗各組的均值是否相等大家好29Meansplot輸出Continue→OK→{Meansplot輸出}大家好30描述統計值Descriptives交通事故次數不同地區平均每天交通事故的次數分別是14.25、13.20、12.80、9.17和11.17大家好31方差齊性檢驗表
設不同地區的交通事故次數的方差分別為
原假設H0:原假設H1:不全相等方差齊性檢驗表TestofHomogeneityofVariances交通事故次數LeveneStatistic(統計量)的值為0.096組間、組內自由度分別為4、21,相應的顯著性概率p(Sig.)為0.983,非常大因此,沒有理由拒絕原假設,認為不同地區的交通事故次數的方差沒有顯著性差異,即方差具有齊性大家好32方差分析表ANOVA
F=3.676,顯著性概率(Sig.)=0.02當取α=0.05時,Sig.=0.02<0.05,故拒絕原假設,認為各地區平均每天交通事故次數有顯著性差異如果查F統計量分布表得到F0.05(4,21)=2.85,α=0.05時,F=3.676>F0.05(4,21)=2.85,則拒絕原假設H0,表明所檢驗的因素即地區對平均每天交通事故的次數觀測值有顯著影響大家好33兩兩比較不同水平的差異在{One-WayANOVA對話框}→變量Y(交通事故次數)移入到DependentList框,變量X(所在地區)移入Factor框內→
PostHoc→
{One-WayANOVA:PostHocMultipleComparisions對話框}方差相等假設下的可選擇方法方差非齊次性假設大家好34EqualVariancesAssumedEqualVariancesAssumed:方差相等假設下的可選擇方法LSD:最小二乘法,是T檢驗的變形,在變異與自由度計算上利用了整個樣本信息,敏感度最高Bonferroni:由LSD修正而來,通過設置每個檢驗的α水平來控制總的α水平水,這個方法的敏感度介于LSD和Scheffe之間Sidak:用T檢驗完成多重配對比較,可以調整顯著性水平,比Bonfferroni方法的調整界限小Scheffe:它利用F分布進行均值間的配對比較R-E-G-WF(Ryan-Einot-Gabriel-WelschF):利用F檢驗進行多重比較R-E-G-WQ(Ryan-Einot-Gabriel-Welschrangetest):基于t分布進行多重逐步比較S-N-K(Student-Newman-Keuls):它利用T分布進行均值間的配對比較大家好35Tukey(Tukey’shonestlysignificantdifference):利用T化極差分布進行均值間的配對比較Tukey’s-b:利用T化極差分布進行均值間的配對比較,精確值為前兩種檢驗相應值的平均值,利用該方法時一般要選擇前兩種方法Duncan(Duncan’smultiplerangetest):逐步比較一系列分布值,得出結論,適用于分布不明確的情況Hochberg’sGT2:利用T化極差分布進行多重比較Gabriel:利用T化極差分布進行配對比較Waller-Duncan:利用t檢驗進行多重比較Dunnett方法:選擇開頭一組或者最后一組為對照,其他組跟它進行比較,當選中這一種方法后,ControlCategory被激活,它后面的下拉菜單框中有兩個選項,即:First和Last,可以選擇其中一個,它們就是對照組EqualVariancesAssumed
(續)大家好36EqualVariancesNotAssumedEqualVariancesNotAssumed:方差非齊次性假設下的方法有:Tamhane’sT2:利用t檢驗進行配對比較,是一種比較老式的方法Dunnett’sT3:在T化極差分布下進行配對比較Games-Howell:它是一種較靈活的方差不具齊次時的配對比較檢驗法Dunnett’sC:基于t分布下的配對比較大家好37多重比較結果表MultipleComparisons選擇LSD→Tamhane’sT2→Continue→{ANOVA}→OK→{多重比較結果表MultipleComparisons}LSD大家好38(續表)*Themeandifferenceissignificantatthe.05level.(*表示在0.05的顯著性水平下均值差有顯著性差異)只有南部地區的平均每天交通事故次數與東部、北部、中部地區的平均每天交通事故次數有顯著性差異大家好395.4雙因素方差分析(待續)雙因素:是指問題中有兩個(反映條件或前提的)變量As是變量A的一個取值(又稱因素A的一個水平)Bn是變量B的一個取值(又稱因素B的一個水平)假設在Ai與Bj下的總體Xij,服從N(μij,σ2)分布雙因素方差分析的數據結構表表中,xij表示因素Ai和因素Bj下的試驗效果的觀察值大家好40雙因素方差分析(續)總體Xij的總平均:第i行總體的平均:
第j列總體平均:Ai的主效應:Aj的主效應:如果Ai與Bj間不存在交互效應,就有μij=μ+ai+bj
大家好415.4.1無交互作用的雙因素方差分析隨機樣本Xij可以視為其總體均值ij與隨機誤差εij之和
Xij=μij+εijεij服從N(0,σ2)分布,并且εij之間相互獨立于是有Xij=μ+ai+bj+εij
稱為“無交互影響的雙因素(一元)模型”效果的數據是多元的(向量),就是雙因素多元問題大家好42無重復實驗雙因素方差分析方案的假設零假設:備擇假設:之間不完全相等(至少有兩個不等),或不全等于0
之間不完全相等(至少有兩個不等),或不全等于0
大家好43統計量大家好44無交互影響的雙因素模型下的結論①SA、SB、SE相互獨立,且ST=SA+SB+SE②SE/
2服從分布
2((s-1)(n-1))③H0A成立時,有SA/
2
服從
2(s-1)④H0B成立時,有SB/
2
服從
2(n-1)⑤H0A成立時,有FA服從F((n-1),(s-1)(n-1))
分布對給定的α,查表得
F
((n-1),(s-1)(n-1))
若FA>F
((n-1),(s-1)(n-1))
拒絕H0A,即至少A因素中有兩個水平之間的平均效果(均值),差異足夠大反之,接受H0A,即A因素的不同水平的效果(均值)沒有顯著差異若FB>F
((n-1),(s-1)(n-1))
,拒絕H0B,即至少B因素有兩個水平之間的平均效果(均值)差異足夠大反之,接受H0B,即B因素中的不同水平的效果(均值)沒有顯著差異大家好455.4.2無交互作用的雙因素方差分析SPSS應用
例5.5
考察原料用量和產地對產品質量是否有影響現有三個產地:甲(A1)、乙(A2)、丙(A3)原料用量有三種情況:現用量(B1)、增加5%(B2)、增加8%(B3)每個水平組合做一次試驗現需要分析原料用量及產地對產品質量的影響是否顯著表5-17產品合格率數據大家好46GeneralLineralModel:UnivariateAnalyze→GeneralLineralModel→{Univariate}因變量矩形框,將因變量放入其中固定因素欄,放入固定因素隨機因素欄,放入隨機因素協變量欄,放入協變量加權變量欄大家好47Model模型對話框quality→選入DependentVariable→選中group1和group2→選入FixedFactor(s)→“Model”→{模型對話框}指定模型類型建立因素全模型自定義模型大家好48Univariate:Model對話框中選擇Cutom單擊Custom選項,選擇自定義模型大家好49選擇模型中的主效應的方法用鼠標單擊個變量名,然后單擊BuildTerm(s)欄中下面的箭頭,該變量出現在Model框中,重復這種操作,就可以設置多個主效應,但是不要同時送入,否則可能是交互效應在BuildTerm(s)欄下面的小菜單中選擇Maineffects項,然后選擇多個主效應變量進入Model框中,如果只進行主效應分析,則單擊Continue按鈕確認并返回主對話框,否則進入下一步大家好50建立模型中的交互項BuildTerm(s)→Interaction右側向下的黑色小箭頭Interaction:指定任意的交互效應ALL2-way:指定所有2維交互效應ALL3-way:指定所有3維交互效應ALL4-way:指定所有4維交互效應ALL5-way:指定所有5維交互效應因素變量的交互效應,要求模型中包括因素變量:group1和group2的交互效應①BuildTerm(s)→Interaction→group1→group2→BuildTerm(s)欄中下面的箭頭→交互項就出現在Model框中②BuildTerm(s)→ALL2-way,其他步驟同上大家好51選擇分解平方和的方法TypeI:分層處理平方和的方法,僅對模型主效應之前的每項進行調整,一般適用于平衡ANOYA模型和嵌套模型,在前一模型中一階交互效應前指定主效應,二階交互效應前指定一階交互效應,依此類推TypeII:對其他所有效應進行調整,一般適用于平衡ANOYA模型、主因素效應模型、回歸模型和嵌套設計TypeIII(默認值):對其他任何效應都進行調整,其優勢是把所估計剩余常量也考慮到單元頻數中,一般適用于TypeI、TypeII所列的模型,沒有空單元格的平衡和非平衡模型TypeIV:對任何效應F計算平方和,沒有缺失單元的設計使用該法一般使用TypeI、TypeII所列的模型,沒有空單元格的平衡和非平衡模型大家好52無重復試驗的雙因素方差分析表Continue→{Univariate}→OKDependentVariable:QUALITY因素“產地”(用Group1標識)的檢驗,P=0.269>0.05,接受H0A,因此,可有95%的把握可以認為原料產地對產品的質量影響不大因素“原料用量”(用Group2標識)的檢驗P=0.026<0.05,所以拒絕H0B,表明有95%的把握可以認為原料的用量對產品的質量有顯著影響aRSquared=.860(AdjustedRSquared=.720)大家好535.4.3有交互作用的雙因素方差分析雙因素重復試驗的方差分析數據結構表問:(1)因素A的不同水平(方案)的效果(均值)有無顯著影響?(2)因素B的不同水平(方
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年智能制造業的技術前沿考試試卷及答案
- 健康與社會工作專業考試題及答案2025年
- 2025年信息經濟學基本理論考試卷及答案
- 2025年文化創意產品開發與管理考試試題及答案
- 2025年師范生教育理論考試試卷及答案
- 2025年石油工程師考試試卷及答案
- 2025年民族文化研究考試試卷及答案
- 2025年農村教育與發展政策分析考試試題及答案
- 2025年技術經濟與管理研究生入學考試試卷及答案
- 2025年口腔醫學專業研究生入學考試題及答案
- 修腳師勞動合同(新標準版)6篇
- TCHSA-012-2023-兒童口腔疾病治療中靜脈鎮靜技術規范
- 三方合伙開店協議合同
- 2025年新疆中考第一次模擬化學試題(含答案)
- 2025年危險品水路運輸從業資格考試復習題庫-上(單選題)
- 2025年-河北建筑安全員B證考試題庫附答案
- 《2024年版煤礦安全生產化標準化管理體系基本要求及評分方法》
- 2025-2030中國床墊行業市場深度調研及投資前與投資策略景研究報告
- 碼頭安全隱患
- 《FTA分析案例》課件 - 深入解析自由貿易協定對經濟發展的影響
- 深圳醫藥產業政策研究-深度研究
評論
0/150
提交評論