應用統計學:方差分析_第1頁
應用統計學:方差分析_第2頁
應用統計學:方差分析_第3頁
應用統計學:方差分析_第4頁
應用統計學:方差分析_第5頁
已閱讀5頁,還剩78頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第三章方差分析概述單因素方差分析(one-wayANOVA)單響應變量方差分析(ANOVA)協方差分析(ANCOVA)多響應變量方差分析(MANOVA)一、概述方差分析:英國統計兼遺傳學家費舍爾在設計多種農業試驗,特別是田間試驗,并對試驗進行評估中發展起來的。主要用于研究某種因素(如廣告)對所感興趣的因變量(如銷售額)是否有顯著影響抽樣得到的實驗數據顯示出實驗結果的差異性,其原因可能有三類:觀測條件不同(影響因素)引起試驗結果有所不同此結果差異是系統性的其他影響因素不同引起試驗結果有所不同此結果差異是系統性的——干擾:其他條件不變由于各種隨機因素的干擾,試驗結果也會有所不同此差異是偶然性的協方差分析方差分析的目的將觀測條件不同而引起的系統差異與隨機因素引起的偶然差異用數量形式區別開來,以確定在實驗中有沒有系統性因素在起作用。例1某公司希望對新進銷售人員進行銷售培訓以保證銷售業績。如何培訓才能達到好的效果成為公司關注的問題。為此設置了兩組培訓課程。為了比較它們的有效性,進行了一項實驗:隨機選擇三組新進銷售人員,每組五人。一組接受A課程銷售訓練一組接受銷售B課程銷售訓練另一組C沒有參與任何訓練(對照組)當前兩組的訓練課程結束后,三組人員都開始實踐。兩個星期后統計了各組銷售人員的銷售記錄如下:銷售培訓會提高銷售人員的業績嗎?注意不僅不同組中銷售員的業績有區別,同一組中接受相同培訓的銷售員的業績也有區別銷售業績:組內差異:隨機因素造成組間差異:培訓和隨機因素造成如果三組銷售人員的平均業績沒有顯著差別(組間差異不明顯),則說明銷售訓練失敗如果接受銷售訓練的銷售人員的業績顯著突出,則說明銷售訓練成功影響業績的因素:培訓課程隨機因素:如個人特質、運氣從上表可以看出,各組樣本數據差異較大,尤其是3組與1、2組的均值具有一定的差異。這是否說明銷售訓練會提高銷售業績呢?當然這種差異也許是由于隨機因素所造成,所以需要進行統計檢驗。影響業績的因素:培訓課程隨機因素:如個人特質、運氣方差分析的假設為:如果原假設成立,說明培訓對銷售業績沒有顯著影響,組間差異與各組內差異都是隨機因素造成的。如果備擇假設成立,說明培訓對銷售業績有顯著影響,各組內的差異由隨機因素造成,而組間差異則由隨機因素和銷售訓練所導致的系統性差異造成。檢驗方法:組間變異是否遠大于組內變異方差分析的術語因素:一個獨立的變量,是方差分析研究的對象。在例1中,“培訓”就是一個待研究的因素。水平:因素的不同狀態就稱為“水平”。分組是按因素的不同水平劃分的。例1中,因素“培訓”分為三個水平(A課程、B課程、無訓練)。響應變量(性能指標):在分組試驗中,對試驗對象所觀測記錄的變量稱為“響應變量”,它是受“因素”影響的變量,如例1中“銷售業績”。方差分析的類型單因素方差分析(一維方差分析):檢驗由單一因素影響的一個或幾個獨立的響應變量的組間均值差異是否顯著。如上例,一個影響因素(培訓)的不同水平對一個響應變量(銷售業績)的影響分析。(one-wayANOVA過程)單響應變量多因素方差分析:對一個響應變量是否受一個或多個因素影響進行分析,包括協方差分析。常用的是雙因素方差分析。(Univariate過程)多響應變量多因素方差分析:研究一個或多個因素變量與多個響應變量集之間的關系。(Multivariate過程)重復測量方差分析:因素對響應變量影響的試驗如果是重復測量的,就需要用重復測量方差分析。(RepeatedMeasures過程)問題的表述和假設按實驗因素水平形成分組數據同一組中的數據看成是來自同一總體,它們有一個理論上的均值,不同組的數據來自不同總體,一般認為這些總體具有相同方差(其他條件保持不變),而它們的均值可能相同,也可能不同。方差分析的目的:通過假設檢驗,判斷實驗因素對響應變量是否有顯著影響,即各組均值是相同,還是不同一般地,有r個水平的因素,H0:1=2=…=r=對上例,r=3二、單因素方差分析方差分析的

檢驗方法:基本思路:判斷樣本均值的變異是由于因素的不同水平造成的,還是純粹由于隨機因素造成的。研究數據間的“變異”(也稱為平方和),即離差平方和:變異來源分解,組內變異(樣本與組均值的離差平方和):隨機因素造成,記作S組內。組間變異(組均值與總均值的離差平方和):可能單純由于隨機因素造成,也可能是因素的不同水平造成,記作S組間。S組內+S組間=S總(總變異:樣本與總均值的離差平方和)S組間和S組內的比值反映了兩種差異大小的對比,比值越大說明因素各個水平引起的差異越顯著服從F分布通過F值與其臨界值的比較,推斷各組均值是否相同。結論:在0.05水平上培訓對銷售業績的影響不顯著。平方和/自由度=均方和檢驗統計量:因素水平試驗次數123…j…r123……ix11x12x13x1jx1rx21x22x2jx2rx31x32x3jx3rxi1xi2xijxir…………設:因素有r個水平,各水平的實驗次數為nj,得到樣本數據如表單因素方差分析的一般模型方差分析步驟F檢驗計算各水平均值和總均值計算檢驗統計量F計算離差平方和:S計算均方和:S/自由度⒈計算水平均值和總均值因素水平試驗次數123…j…r12……ix11x12x13x1jx1rx21x22x2jx2rxi1xi2xijxir…………水平均值2、計算離差平方和誤差項離差平方和:組內變異S組內總離差平方和(總變異S總)水平項離差平方和:組間變異S組間三個離差平方和的關系為:三個離差平方和的關系為:證明:SSTSSESSA3、計算均方和離差平方和自由度均方和MSSSASSESSTr-1r(nj-1)=n-rn-1MSA=SSA/(r-1)MSE=SSE/(n-r)自由度:觀測值的個數約束條件數4、計算檢驗統計量和假設檢驗~F(r-1,n-r)建立假設本例r=3。培訓例水平均值⒈計算水平均值和總均值培訓例-續拒絕域接受域F=3.17<3.89,接受原假設,培訓沒有顯著效果單因素方差分析過程

one-wayANOVA分析→比較均值→單因素ANVOA響應變量因素“對比”對話框:均值多項式比較例如:4mean1-mean3“兩兩比較…”對話框:選擇均值多重比較方法方差相等時可選擇的比較方法方差不等時可選擇的比較方法與對照組的配對比較用t檢驗完成各組均值的配對比較“選項”對話框:輸出統計量描述統計量固定因素和隨機效應的統計量等方差檢驗顯示均值圖培訓-銷售業績SPSS輸出結果多重比較檢驗方法LSD(Least-significantdifference)最小顯著性差異法:用t檢驗完成個組均值間的配對比較。Duncan多重極差檢驗:將進行比較的各組均值分成幾個有顯著差異的子集。一個子集中均值之間的差異不顯著。Dunnett法:指定一個組作對照組(last),其他各組分別與對照組進行配對均值比較。例有五種治療麻疹的藥,要比較它們的療效。假定將30個病人分成五組,每組6人使用同一種藥,記錄病人從使用藥物開始到痊愈所需時間(天)如表。試進行方差分析。輸入數據:痊愈時間和組別調用“One-WayANOVA”過程,選擇如下選項:方差齊性檢驗多重比較方法:LSD,Duncan,輸出描述統計量。Duncan多重極差檢驗結果說明:所有5個待比較組分為兩個子集(3,2,4,5)和(1,5),屬同一子集的藥物可認為無明顯差異。對于第一個子集,“2、3、4、5藥物治愈所需天數均值相等”的假設接受的概率僅為0.067,略大于0.05。單因素方差分析例一DVD廠商希望了解不同年齡段(agegroup)的消費者對其生產的一種新型DVD的評價(dvdscore)做單因素方差分析,畫出均值圖多重均值比較第四組評價最高第三組評價次高比較第三組均值與第四組均值是否有顯著差異一、二組評價較低五、六組評價最低比較32歲以下和46歲以上人群是否有顯著差異用單因素ANOVA中的contrast選項:1)mean3-mean42)0.5mean1+0.5mean2-0.5mean5-0.5mean632歲到45歲的評價無顯著差異32歲以下和46歲以上消費者的評價無顯著差異例:某企業準備上市一種新型香水,需要進行市場調研。經驗表明除香水氣味外,香水包裝對需求也有很大影響。現對三種不同的包裝、三種不同香型的香水進行測試,每種組合采用一個不同的市場調查,調查結果見下表。1.923.152.54包裝311.53.29包裝21.582.042.8包裝1流行激情高雅AB三、單響應變量方差分析——以雙因素方差分析為例雙因素不重復試驗B1B2…BmA1A2…An

x11x12…x1mx21x22x2mxn1xn2xnm…兩因素分別為A(包裝)和B(香型),A有n種水平(n=3),B有m種水平(m=3),每種因素組合只有一個樣本值,這樣的實驗稱為不重復試驗。實驗數據建立下表不重復試驗不能識別因素間的交互作用列均值行均值雙因素不重復試驗方差分析方法與單因素方差分析類似,總變異可分成兩個因素的離差平方和及誤差平方和:方差分析表:因素的主效應檢驗離差平方和自由度均方和MSSASBSESTn-1m-1(n-1)(m-1)nm-1MSA=SA/(n-1)MSB=SB/(m-1)MSE=SE/(n-1)(m-1)檢驗統計量FA=MSA/MSEFB=MSB/MSE行效應(A因素)顯著性檢驗列效應(B因素)顯著性檢驗B香型A包裝包裝1包裝2包裝31高雅2激情3流行2.83.292.542.041.53.151.5811.92Bj2.882.231.5Ai2.141.932.542.20離差平方和自由度均方和MSSA=0.57SB=2.85SE=1.57ST=4.992248MSA=0.285MSB=1.425MSE=0.392檢驗統計量FA=0.73FB=3.64F=6.94結論:包裝與香型的影響都不顯著雙因素重復試驗兩因素分別為A和B,A有n種水平,B有m種水平,兩種因素不同水平共有mn中組合,在每種因素組合(i,j)下作d次重復試驗,以減輕誤差的干擾,實驗數據建立下表A1…j…m1x111,x112,…x11d

x1j1,x1j2,…x1jd

x1m1,x1m2,…x1md…

ixi11,xi12,…xi1d

xij1,xij2,…xijd

xim1,xim2,…ximd…

nxn11,xn12,…xn1d

xnj1,xnj2,…xnjd

xnm1,xnm2,…xnmdB雙因素方差分析符號說明

雙因素分析模型在雙因素模型中可以進行多種檢驗:因素A的主效應檢驗因素B的主效應檢驗因素A和因素B的交互作用檢驗雙因素方差分析表

sumofsquaresdfmeansquareF-RatioacrossSSAnm-1MSA=SSA/(nm-1)MSA/MSWfactorASS(a)n-1MS(a)=SS(a)/(n-1)MS(a)/MSWfactorBSS(b)m-1MS(b)=SS(b)/(m-1)MS(b)/MSWinteractSS(ab)(n-1)(m-1)MS(ab)=SS(ab)/(n-1)(m-1)MS(ab)/MSWwithinSSWN-nmMSW=SSW/(N-nm)

totalSSTN-1

香水例“單變量”過程數據格式響應變量因素協變量隨機因素“模型”對話框:模型設定自定義模型指定模型類型建立全模型指定主效應指定所有三維交互效應指定所有四維交互效應選擇分解平方和的方法:指定交互效應指定所有兩維交互效應本例只有主效應“對比”對話框:效應比較默認:無效應比較改變效應比較設置比較因素每個水平的效應因素變量每一水平都與參考水平比較:選擇last或first為參考水平因素每一水平都與其前面個水平比較因素每一水平都與后續水平比較“圖”對話框:因變量均數分布圖選擇橫坐標選擇縱坐標散點圖框“兩兩比較”對話框:多重比較與one-wayANOVA相同Save對話框:保存“選項”對話框比較主效應均值指定輸出統計量效應量估計顯示觀測功效參數估計:因變量與自變量的回歸系數等等方差檢驗觀測量均值對方差的圖擬合度不足的檢驗香型與包裝方差分析結果新食品定價和廣告策略研究為了確定新食品的定價和廣告策略,某企業做了一次市場研究:選出24家商場分別以高、中、低三種價格,和高、低兩種廣告策略推銷產品,經過一段時間之后統計各家商場的銷售量,并對此作方差分析。新食品銷售的均值圖價格低高低廣告高廣告1.銷售量的價格效應較明顯2.廣告效應較不明顯3.交互作用:低價格高廣告的銷量較大方差分析表四、協方差分析基本思想:在方差分析中引入其它獨立變量,以矯正由于非試驗因素對響應變量的影響干擾方差分析的準確性。方差分析應在“其它條件不變”下實施。但是,這一點有時難以做到。前例:在研究價格和廣告對新食品銷售的影響時,如果所選擇的商場規模不同,也會對銷售量產生影響。我們收集了各個參加試驗商場的規模,做銷售量對商場規模的散點圖銷售量對商場規模散點圖:綠色點-高廣告,紅色點-低廣告很明顯:做高廣告的商場規模偏小,低廣告的商場規模較大。一般來說,規模大的商場銷量較大,規模小的商場銷量較小。因此,商場規模的差異可能會干擾對廣告效應的評估。將Storesiz作為協變量引入后的方差分析結果協變量調整后的均值圖協變量調整前的均值圖廣告效應變得明顯了協變量調整前協變量調整后協變量的作用機理:單因素例:芬蘭曾有一條法規:只有城市可以從事商業性賣酒。當這條法規取消時,人們開始擔心農村的交通事故會因此增多。一些研究者在12個鄉村鎮進行了試驗:其中4個村鎮只允許商店賣酒、4個村鎮商店和飯店都可以賣酒,最后4個村鎮作為對照組,不許賣酒。一年后統計的交通事故數如表。對此數據進行方差分析,發現賣酒模式對交通事故影響不顯著。組間變異不比組內變異顯著地大結論是否可信?影響交通事故的其他因素:由于道路狀況、天氣狀況等的差別,有些鄉鎮比另一些鄉鎮更容易發生交通事故,選取解禁前各鄉鎮年交通事故數numpre為參考變量,從數據表中可以看出,第二組各城鎮在未解禁前事故率就相當高,解禁后的事故率相對來說并不很高。不同城鎮的交通事故數差異很大(甚至同一試驗組的城鎮之間),原因何在?accidnum解禁后事故數vs解禁前事故數組間相關組內亦相關且相關度更高剔除協變量影響后的組間變異與組內變異協變量調整后,組間變異增大,組內變異減小協變量調整后模型:Intercept+numpre+group協變量調整前模型:Intercept+group均值圖比較未考慮協變量協變量調整后協變量調整后調整前協變量調整后,賣酒模式對交通事故數影響顯著調整前調整后的成對比較飯店里賣酒對交通事故影響最大bT為X對Z回歸的系數X與Z的協方差為0時SST(Xa

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論