



版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第五章方差分析與正交設計.單因素方差分析在實際問題中,人們常常需要在不同的條件或不同的狀態下,對所研究的對象進行對比試驗,從而得到若干組數據(樣本)。方差分析就是一種分析、處理多組試驗數據均值間差異顯著性的統計分析方法。其主要任務是通過對數據的分析處理,搞清各試驗條件以及它們所處的狀態對試驗結果(又稱試驗指標)的影響,以便有效地指導實踐,提高經濟效益或科研水平。基本概念例1某燈泡廠用四種不同材料的燈絲生產了四批燈泡,除燈絲材料不同外,其他生產條件完全相同。今由每批燈泡中隨機地抽取若干個燈泡,測得使用壽命(單位:h)數據如表(1)所示,現在要求推斷出燈泡使用壽命是否因燈絲材料不同而有顯著差異。表⑴燈泡壽命燈絲12345678A)1600161016501680170017001780AI1500164014001700175016401550160016201640160017401800A4151015201530157016401680如果在一項試驗中,只有一個因素變化,其他因素保持不變,我們稱這種試驗為單因素試驗。因素所處的狀態稱為水平。本例考慮的是一個因素即燈絲,這個因素具有四個水平,即四個不同材料的燈絲,a1,a2,a3,A4°從表中的數據看到,即使對于同一種材料的燈絲,雖然生產條件都一樣,但燈泡的使用壽命還是可以不相等的,這說明燈泡的使用壽命是一隨機變量。現在用2,曷表示四種材料的燈絲所生產的燈泡的使用壽命,這樣就有四個總體。若從這四個總體中分別隨機地抽取容量為%的樣本或看,2,…,舄-,?=123,4,我們應用這四個樣本來推斷四個總體之間有無顯著差異。要判斷不同燈絲材料的燈泡對使用壽命的影響問題,就是要辨別使用壽命之間的差異是主要由抽樣誤差造成的還是由燈絲材料不同造成的。這一問題可以歸結為判斷四個總體是否具有相同的分布。另外,在方差分析中,總是假定各總體相互獨立,且都服從正態分布。由于除因素外,試驗的其他條件都認為相同,這樣就可以假設每個總體的方差相同。因此推斷四個總體是否具有相同分布的問題,就歸結為檢驗四個具有相同方差的正態總體,其均值是否相等的問題。實際上,方差分析就是檢驗若干個具有相同方差相互獨立的正態總體,它們的均值是否相等的一種統計分析方法。前幾章中我們曾介紹了檢驗兩個正態總體均值間差異顯著性的t檢驗法。現在對多個正態總體,我們能否仍用r檢驗法兩兩進行檢驗呢?結論是否定的。設想有十組數據,客觀上它們來自同一正態總體,因而有相同的均值。在這種情況下,任取兩組數據采用r檢驗法檢驗其均值是否相等。設a=0.05,則接受假設認為兩組均值相等的概率為1一。=0.95。但從十組數據中任取兩組,共有。1=45種不同的取法,所以接受“0的概率為(0.95)45比0.099。客觀上十組數據均值相等,而采用,檢驗法兩兩檢驗時,犯第一類錯誤(認為至少有兩組均值不等)的概率為0.901.由此可見,當組數增多時,采用f檢驗法兩兩檢驗時,犯第一類錯誤的概率將大大增加,使我們判斷的結果很不可靠。波蘭數學家R.A.Fisher(1923)提出的方差分析法,可同時判斷多組數據均值間差異的顯著性。下面給出單因數方差分析的一般概念。設有p個相互獨立的正態總體i=1,2,—,p,設當,。2,…,殳,,是從第i個總體。中抽取的容量為〃,的簡單隨機樣本。由于的~N(m,ct2)(i=1,2,…,ptj=1,2,—,%),易與〃i的差務.一M.可以看成是一個隨機誤差。因此%滿足務=〃,+%, ⑴而%~N(0q2),且互相獨立,其中i=1,2,…,p;)=1,2,…,〃,”要求檢驗假設?〃1=〃2=…=〃p°統計分析下面構造檢驗假設”0:〃|=〃2=…=〃p用的統計量。記TOC\o"1-5"\h\z〃=£%,己=,之務。 ⑵尸I這是第i個總體。.的樣本均值,也叫做組平均值。稱- 1pMl_1P—總率3嵩唁 ⑶“i=] j=\ "/=|為總平均值。〃是從p個總體抽得的樣本的總容量。由(2),(3)兩式可得一(務g,)?T)=°。〃1=1j=\由此得到pn\—P — — —S7=EE&T)2=££[④TJ+4一口2i=lj=l ;=1)=1務苫)+X〃,4T)2=s,+Sa。 (4)<=1j=\ i=l其中TOC\o"1-5"\h\zC _ p__1=££(務TN,54工〃,自一廳。?=1J=1 i=ls7是所有觀察資料曷與總平均值占的差的平方和,稱為總偏差平方和。它是描述所得全部數據離散程度的一個指標。由上式知,總偏差平方和可以分解為1、Sa兩項之和。我們再來看2、Sa的意義。記〃=一三〃,〃, (5)n,=i是各均值的平均,叫做均值的總平均。令。產出一〃,j=1,2,…,po它是各總體的均值與理論總均值〃的差異。名稱為因素的第i個水平的效應。易知p個效應滿足關系式pZ〃,,=0。1=1當假設"0:〃|=〃2=…=〃p成立時,由(5)式可得〃]=〃2=…=〃p=",從而%=0(i=12…,p)o故假設"°也可寫為//0:%=%=…=6Zp=0o式(1)用水平的效應表示,可以寫成易=〃:+%=〃+%+/(i=l,2,—,p;J=l,2,-,%)此時曷=一工務=一工(〃+%+%)=〃+%+£,。nij=lnij=l其中£,=上E務是第i個總體樣本誤差的平均,又nij=l一1W—]白 - ip- -八一£〃4=一工〃,(〃/=1 〃 〃2其中工='£凡&='£之£表示所有樣本誤差的平均,從而有〃/=| n/=|j=i= 務乞)2=£之(〃+%+%—〃一區一田)2=£方(%—田)2。i=lj—\ i=lj—\ /=!j=lP— —P _ _P 一一Sa=Z%MT)2=Z%(〃+《+?一〃一£)2=Z%(a,+£i—£)2。1=1 i=l i=l由這兩式可以看出,工僅依賴于隨機誤差%,Sa除與隨機誤差有關外,還與各水平間的效應%=4一M有關。這就是引起易波動的兩個原因:一個純粹是由隨機誤差與引起的,另一個在一定程度上是由各總體均值從之間的差異引起的。如何構造檢驗統計量呢?這可以從Se,5.的數學期望得到啟發,因為(務W)2?/(〃「力bj=l所以3=e["(務名尸]=曲忖&七)2TOC\o"1-5"\h\z[i=l7=1 J>=lL>=1 _ni=Z(n—1)o-2=(n-p)cr2.ES『e]£;〃,(Fi-萬]=£>了(百一名)2=5-1方2+4仙一〃)2。J=1 Ji=l ?=1記C2_Se2_SAlj?一 ?o2— °n-p -p-l則有ES;=標.ES:Z+」—£%(〃,_〃)2。P-1m由此可見,不論對從的假設如何,S:是1的一個無偏估計,而5;僅當假設:〃1=〃2=…="p成立時,它才是b?的一個無偏估計,否則它的期望值要大于tT:。這說明比值S;(n-p)SA—S;~5-1電’在假設“0不成立時,有偏大傾向。
下面討論尸的分布。當“0成立時,〃[=〃2=…=〃p=〃,此時,&廣NQl,/)。于是由(4)式有p% p _££3)+《-〃)『i=lJ=1 i=lJ=1=11啕T)2+t9(占-〃)『+2£之?-)j=lj=l <=!j=] i=]j=lp"i _ _工X(務-工+〃(J")?i=lj=l=S?+Sa+〃痣-〃)2。對于%它有P個線性關系£(務-刁=0,i=l,2,…,P,所以它的秩為〃-P。對;=1于Sa,它含有一個線性關系£%(m-孑)=0,所以它的秩為p-l。對于〃痣-〃尸,其秩為1?sS由于(〃一p)+(p—l)+l=〃,故由Cochran定理知,當假設成立時,一^?和g相互獨cra立,且—T-Z2(?P)>心~72(PT),(y~ b山此知S;(〃S;(〃-P)Sa("1電~F(p-\,n-p)給定顯著性水平a,由尸分布的分位數知P{尸>K-a(pT,"P)}=a。當尸的觀察值F>K_a(P-L〃-pW'h拒絕假設”°,否則認為試驗結果與假設“°無顯著差異。為應用方便起見,將上面討論中所需的結果列成方差分析表,如表(2)?例2檢驗例1的四種燈絲材料對燈泡使用壽命是否有顯著影響(a=0.05)。解4n=Z%=7+5+8+6=26,i=i計算得SA=44360.7,S,=151350.85;P-1n-p14786.91879.5844360.735;P-1n-p14786.91879.5844360.73=14786.9,151350.826-4=6879.58,把計算結果整理列成下面的方差分析表(表(3)表(2)方差來源平方和自由度均方和產值因素的影響Sa=£〃,出一斤1=1P-lo2 Sa邑=…si誤差鼠=£之啖-己)21=1y=ln—ps;-n-p總和5產t七④W)2i=lj=ln-1s2=-^-〃-1表(3)方差來源平方和自由度均方和產值因素的影響SA=44360.7〃-1二35;=14786.92.15誤差Se=151350.8n-p=22S,2=6879.58總和Sr=195711.5〃-1=25S2=7828.46這里產的自由度為(3,22),若給定顯著性水平a=0.05,查得臨界值尸「a(3,22)=3.05。因為F=2.15<3.05=F,_o(3,22),故應接受,即認為四種燈絲生產的燈泡其平均使用壽命之間沒有顯著的差異。§2.雙因素方差分析在實際問題中,影響試驗結果(試驗指標)的因素往往都不止一個,而是兩個或更多。此時,要分析因素的作用,就要用到多因素試驗的方差分析。這里只討論兩個因素的方差分析。至于更多因素的問題,用正交試驗法比較方便。在兩個因素的試驗中,不但每一個因素單獨對試驗起作用,往往兩個因素會聯合起來起作用。這種作用叫做這兩個因素的交互作用。例如,有些合金,當單獨加入元素A或元素B時,性能變化不大,但當兩者同時加入時,合金性能的變化就特別顯著。交互作用在多因素的方差分析中把它當成一個新因素來處理。不考慮交互作用的方差分析設因素A有p個不同的水平A1,&,…,AP'因素B有<7個不同水平81,人,…,約。對每種情況(A,嗎)進行一次獨立試驗,共得pq個試驗結果務(i=1,2,-,p;j=1,2,-,q),如表(1)所示。表(1)因素^B\當…Bq平均值m丸hJpl丸務以2???丸丸比A務平均值…短占其中_ 1&4,=一方卻,i=l,2,…,P,W.j=L£^ij,j=1,2,…,q,設務是相互獨立的服從正態分布N(/q2)的隨機變量,即務是從服從正態分布N(/,(t2)的總體中抽得的樣本。由于認為A,8兩個因素間不存在交互作用,故假定其均值i=1,2,—,p;j=1,2,—,q,名為因素A的第i個水平的效應,它表示因素A的各個水平的影響的大小。用為因素8的第j個水平的效應,它表示因素8的各個水平的影響的大小。記]qMZ"。'i=l,2,…,p>qj=\]G〃廣一Z/,J=12,??,q,Pi=l%=從.一〃,i=1,2,—,p,4=/—〃,j=1A-,q,則顯然有£%=0,£4=0,TOC\o"1-5"\h\zi=i j-\這樣,無交互作用的方差分析模型為務=〃+%+〃,+%,i=1,2,—,p;j=1,2,—,q, (1)p qZ%=°,工0j=°,i=i j=i%iid,%~N(0,cr2)。符號“iid”表示獨立同分布,因此要判斷因素A的影響是否顯著,就等價于要檢驗假設”oi:。|=%=…=%=0。要判斷因素8的影響是否顯著,就等價于要檢驗假設h02?P\-Pi-…=4=。。下面來尋找檢驗統計量。和前面類似,將總偏差平方和?進行分解:S產££(務一斤=££((務-久-口+&)+?/-4)+?T))2/=1;=1 /=!)=1P__ f/__P4 ___=可七-廳+P9氏T)2+t之④-以-務+分1=1 ;=1 1=1j=l=SA+SB^SeO其中-1,Sp=p汽鬲一占)2,Se=£玄-j+“。i=1 j—\ i=lj—\由式(1)務=〃+/+丹+%知以=-2扁=-2?4+區+尸產%)=〃+火+—25
qj=\qj=i q可=〃+%+£”,i=l,2,…,po(2)一1工其中£,.=L?.同理&j="Pj+£.j,j=1,2,—,q,(3)其中£./=,£號。
p1=1又務=」Z(〃+%+“,)=〃+£'pq/=ij=\pi=i(4)_ip1Pq其中-zz與為所有樣本誤差的平均。pi=\pq/=i;=1將(2),(3),(4),三式代入上面S%,S人邑的表示式中得SiS后.-占尸=虎(%+£,—£)2*=1 /=!Sb=pZ(E/-去)2=p£(fij+e.j—e了,J=1 尸1Se=Z£?—.j+E)2=Zt(%—Hj+3),i=l;=! i=lj=X山此可知,S,反映了誤差引起的波動,S,除與誤差有關外,還反映了因素A各水平效應間的差異,S8除與誤差有關外,還反映了因素8各水平效應間的差異。還可以求得E(Sa)=(p-l)(r2+q^a.,f=le(sq=G7-1)。2+〃£氏,,=iE(Se)=(p-l)(q-l)cr\n2_Sb《2°2- ~'°3q-iE(S:)=E(S:)=6T2+E(S;)=E(S;)=E(S;)=CT與單因素方差分析類似,可采用下面統計量:V2p-1P-1邑當假設“01不成立時,扁大,故可用來檢驗假設“01;當假設“02不成立時,七偏大,故可用來檢驗假設“02。再討論統計量匕,%的分布。當假設”01和“02成立時,有為=4,此時一切與?N(〃q2),于是11[④—己+(占—〃)『=S7+pq記一〃)21=1j=\ i=lj=\=SA+SB+Se+pq(^-/i)2,其中X,Sb,Se,pq(己一〃尸都是非負二次型。SA=q£&.-Z)2,包含一個線性關系S(£-E)=。,故〃的秩為p-l。1=1 1=158=。2(七一分,包含一個線性關系9=°,故,的秩為4一1。j=l j=lS” .j+分,包含p+q個線性關系£(務—£Y.j+豆=0,i=l;=1 i=lj=l,2,…,q和演—+Z)=3i=l,2,…,p,由于f£(如一并一窘+占)j=l i=lj=l=0,故上面p+g個線性關系中,只有p+g-l個是獨立的,因而S,的秩為pg-(p+q-l)=(p-l)(q-l)。又四咨-〃產的秩是1。而以上各項的秩相加得(p-l)+(q-l)+(p-1)(q-l)+l=pq。ssS由Cochran定理知,當及"o2同時成立時,心,七,一?相互獨立,且a"<y'a"TOC\o"1-5"\h\zS, s, S,T~/(p-i),(g-1),—^~/((pT)(g-i))。a~ a a~從而當“01,”02為真時S:(p-D(g-l)s"=77= : ((p-1),(p-l)(g-l)),S3 p-i sePS; (p-l)(q-I)Sb (n.n,八、尸8=77= ; — ((g-1),(p-D(q-l))。S3 p-l將上面的結果列成方差分析表(表(2))所示。表(2)方差來源平方和自由度均方和E值A的影響Sa='?.一分1=1p-1s;告p-lS2B的影響工——S8=pX?jT)2j=lqts;告q-i心等誤差Se=H()2Z=1j=l(p-i)(4-i)s;=^——(p-D(q-l)
總和s產£力務一斤/=1;=1pq-i例1為了研究蒸儲水的pH值和硫酸銅溶液濃度對化驗血清中的白蛋白與球蛋白的影響,對蒸儲水的pH值(A)取了四個不同水平,對硫酸的濃度(B)取了三個不同水平,在不同水平組合(A,, )下,各測一次白蛋白與球蛋白之比,將其結果列成表(3)。試在a=0.05下檢驗兩個因素對化驗結果有無顯著差異。表(3)與b2當或Ai3.52.32.07.8a22.62.01.96.5&2.01.51.24.7A1.40.80.32.5Z.J9.56.65.4解檢驗假設H0l:a1=a2=aJ=a4=0,“02:B\= 瓦=。。通過計算得方差分析表(表(4))。表⑷方差來源平方和自由度均方和尸值A的影響5八=5.293S:=1.76Fa=40.9B的影響Sb=2.222S;=1.11Fb=25.8誤差Se=0.266S;=0.043總和Sr=7.7711由于當假設成立時,Fa~F(3,6),查尸分布表得人?(3,6)=4.8.因為Fi4=40.9>4.8=F1_a(3,6),所以拒絕”(“,即因素A的不同水平對化驗結果有顯著影響。又由于當”02假設成立時,Fb~F(2,6),查尸分布表得K.a(2,6)=5.1。因為Ffl=25.8>5.1=F,.a(2,6),所以拒絕即因素B的不同水平對化驗結果有顯著影響。考慮交互作用的方差分析在以上討論中,由于只對兩個因素各水平的組合進行了一次觀察,所以不能了解4,8兩因素之間是否存在交互作用的影響。上面假設均值/=〃+%+%i=1,2,—,p;j=1,2,—,q.而現在要考慮A,B各水平的交互作用,很自然為?#〃+?,+Bj,我們稱學=/一"一名一用為因素A的第i個水平與因素8的第,個水平的交互效應(即交互作用的影響)。對兩個因素A和8的各水平(4,嗎),i=l,2,…,p;j=1,2,-,q,重復進行r次觀察,設其觀察值為%”,i=1,2,—,p;j=1,2,—,q,k=1,2,—,r,并假設(1)務”獨立,^ijk~N(///y,cr2).i=1,2,—,p;j=1,2,—,q,k=1,2,—,r;(2)4=〃+生+4+2。于是TOC\o"1-5"\h\zp q p qZ%=0,XA=0,Z盤=0,j=q,2丹=0,i=l,2,…,pqf=l j=l j=l這樣就得到兩個因素有交互作用的方差分析模型為務k=〃〃=〃+%+/j+%+£,冰,P 4 P </=0,Z4=。,24句,?=1 j=l i=l j=\力”id,£桃~"(0,。2)(i=l,2,…,p;j=l,2,…,q,k=1,2,**\r)o因此要判斷因素A,8的影響以及交互作用的影響是否顯著,分別等價于檢驗假設H0]:%=%=…=。〃=0,"o2,P\~…=4=。,“03:2=0,i=1,2,—,p;j=1,2,—,qo為了檢驗上述假設,類似地將總偏差平方和S7進行分解。s產i=lJ=1k—\[(孩一:)+(蔡一孑)+(靠-1.~窘+占)+陶-黑)]2;=1;=1a=1=££f(屐-分+£££(占廠方+£汽f(蔡-矗Y/+辦+;=!;=1*=1 /=lj=lk=\ i=lj=\k=\i=\y=lA=lTOC\o"1-5"\h\z+Sfi+54xfi+Seo (5)其中i=lJ=l*=1 f=lPJ7r_ _ q_ _氏T)2=p,£璃TPi=lj=\k=\ ;=lSa*b=£££(蔡-齊-8+分=「££(嘉-噩-乙+分,i=lj=\k=l i=ly=l= (%-蔡尸。/=!>1k=\_ 1prrTxzz務*。pq『i=\k=\k=\在平方和分解公式(5)中,Sa除反映誤差波動外,還反映了A因素的各水平間效應的差
異;Sg除反映誤差波動外,還反映了8因素的各水平間效應的差異;Sam除反映誤差波動外,還反映了交互作用的差異所引起的波動;S,僅僅反映了誤差的波動。可以計算得E(S人)=(p_l)<r,qr之a;,i=lE(SB)=(q-l)a2+pr^^j,六ipq成5例)=5-1)(4一1)。2+,££尾i=\j=lE(Se)=pq(r-l)a2o令C2_梟C2_梟c2_
$2- 79$3-夕一1SaxB(〃一1)(4一1),果—pq(r-1)則得E(S;)=內片少3
q_[E(S;)=內片少3
q_[j=iE(S;)=rPq(y2+ ,E(S:)=(T構造統計量:S2S2FaB=^FX=TT-Fb=-^'J4 J4當假設”01不成立時,尸A有偏大傾向,故可用配檢驗假設“01:當假設“02不成立時,Fb有偏大傾向,故可用七檢驗假設“02;當假設“03不成立時,工8有偏大傾向,故可用"b檢驗假設”03。可以證明士?/2(pq(r_1))。cr-S當“01成立時,T■?%2(p_l),且與凡獨立,所以(7~FA~F(p-\,pq(r-1))。當“02成立時,-t~Z2(g-D>且與工獨立,所以bFB-F(q-l,pq(r-l))。s當“03成立時,T?((4-1)(4—1)),且與S,獨立,所以O?一尸物?尸((p-l)(q-l),pq(r-l))。將上面的結果列成有交互作用的方差分析表(表(5))。表(5)方差來源平方和自由度均方和產值A的影響Sa=t方舟.-修1=1p-1s;告p-1s2YB的影響Sb=p也旗一分>1qTs:=生I交互影響AXB邑卜8=*之藐W/+占)2/=17=1(p-1)(q-Dqr2_ °4x8L(p-l)(q-l)誤差pqr _i=lJ=1*=1P<i(r-1)s:二」一pq(r-1)總和sT=ttt^-^2Z=1j=\k=\pqr-1例2在某橡膠配方中,考慮三種不同的促進劑,四種不同分量的氧化鋅,同樣的配方重復一次,測得300%的定伸強力如表(6)所示。試問氧化鋅、促進劑以及它們的交互作用對定伸強力有無顯著影響(a=0.01)?
表(6)當B、Ai31,33343635,3639,38&33,3436,3737.3938,41435,3737,3839,4042,44解山表(6)數據可算得相應的方差分析,結果見表(7)所示。表(7)方差來源平方和自由度均方和產值顯著性ASA=56.62S;=28.3/a=19.4顯著BSB=132.23S;=44.1Fb=30.2顯著AXB§4x8*76S;=0.8F.?=0.55f\D不顯著誤差S?=17.512=1.46總和211.023由顯著性水平a=0.01,查尸分布表得五%Q,⑵=69尸f(312)=60;4a(612)=4.82。所以在顯著性水平a=0.01下,促進劑種類影響和氧化鋅總量的影響都是顯著的,而它們之間的交互作用則認為可以忽略。§3正交試驗設計的直觀分析試驗設計是數理統計中的一個較大的分支,它的內容十分豐富,這里只介紹正交試驗設計(簡稱正交設計或正交試驗)。這種方法第二次世界大戰后在日本全國普遍推廣,據日本某些專家估計,“(日本)經濟發展中至少有10%的功勞歸于正交設計”,可見其經濟效益之大。在我國,正交設計也有很多應用,它的進一步推廣將會在我國現代化建設中獲得更加豐碩的成果。正交設計是利用“正交表”進行科學地安排與分析多因素試驗的方法。它的主要優點是,能在很多試驗方案(也稱試驗條件)中挑選出代表性強的少數試驗方案,并通過對這少數試驗方案的試驗結果的分析,推斷出最優方案,同時還可以作進一步的分析,得到比試驗結果本身給出的還要多的有關各因素(也稱因子)的信息。在§2中介紹的兩個因素的方差分析的計算已經比較復雜,當因素及水平數較多時,試驗次數是驚人的。例如,考慮5個因素4水平的試驗,若每個因素的水平搭配(水平組合)只做2次重:復試驗,就要做2x45=2048次試驗,而且,對這么多試驗數據進行統計分析計算,也將是非常繁重的任務。此時如果用正交設計來安排試驗,則試驗次數會大大減少,而統計分析的計算也將變得簡單。按“正交表”來安排回歸試驗,也會使多元線性回歸分析的計算變得更簡單。對正交試驗結果的分析,通常采用兩種方法,i種是直觀分析法或稱極差分析法,另?種是方差分析法。在實際工作中兩種方法都有用,本節討論直觀分析法。正交表下面的表(1)是一張正交表,把它記為L8(2’)。表(1)列號12345671111111121112222312211224122221152121212621221217221122182212112記號院(27)中的“L”代表正交表,L右下角的數字“8”表示這個正交表有8行,即安排8次試驗,括號內的數字“2”表示集中只出現“1”和“2”兩個數字,它們分別是因子的1水平和2水平的代號,數字2的右上角“7”表示這張正交表有7歹IJ。正交表的列是用來安放因子和交互作用的,因此正交表L8Q7)最多可安排7個二水平因子的試驗。常用的正交表有L403),L8(27),L16(215),L32(231),L9(34),L27(313),L/44)等,它們的含義與L8(27)類似。正交表有如下兩個性質:(1)每列中不同水平出現的次數相等。例如L8(27)中的1水平和2水平在各列中各出現4次。(2)任意兩列,將同一橫行的兩個數字看成有序數對時,每種數對出現的次數相等,例如表L8(27)中,可能的次序對為(1,1),(1,2),(2,1),(2,2),它們在任意兩列中各出現兩次。凡滿足上述兩條性質的表稱為正交表。正交試驗及其結果的分析根據試驗指標(即表示試驗結果特性的值),可把正交試驗設計分為單(一個)指標試驗設計與多指標試驗設計。下面通過例子說明如何用正交表進行單指標正交設計,以及對試驗結果進行分析。例1合成氨最佳工藝條件試驗。數據以往生產積累的經驗,決定選取的試驗因素與水平如表(2)所示。假定各因素之間無交互作用。試驗目的是提高氨產量,即要找到最高產量的最優的水平組合方案。
表(2)例1的因素與水平表水平A反應溫度(℃)B反應壓力(大氣壓)C催化劑種類1460250H12490270乙3520300丙解首先,選擇合適的正交表。本例是一個3水平的試驗,因此要選用Ln(3)型正交表。本例共有3個因素,不考慮因素之間的交互作用,所以要選一張t23的表,而LG,)是滿足條件t23的最小的LK3')型表,故選用正交表1^(34)安排試驗。選定正交表后,接著進行表頭設計。本例不考慮因素之間的交互作用,只需將各因素分別填寫在所選用的正交表的上方與列號對應的位置上,一個因素占有一列,不同因素占有不同的列,就得到表頭設計(見表(3))。表(3)例1的表頭設計因素ABC空列列號1234未放置因素或交互作用的列稱為空白列(空列)。空白列在正交設計的方差分析中也稱為誤差列,它有著重要作用,一般要求至少有一個空白列。完成表頭設計后,就可以判定試驗方案。把表中各列的數字“1”、“2”、“3”分別看成是該列所填因素在各個試驗中的水平數,而正交表的每一行就是一個試驗方案。于是,本例得到9個試驗方案。如:第六號試驗方案:A2B3C,o這就是用溫度490℃、壓力300大氣壓、甲種催化劑三種水平組合進行試驗。下面用正交表來分析試驗結果。按正交表的各試驗號中規定的水平組合進行試驗。本例總共要進行9個試驗,將試驗結果(數據)月,丫2,…,、9(單位:0填寫在表的最后一列中。例1的試驗方案及試驗結果見表(4)。表(4)例1的試驗方案及試驗結果分析ABC空白產量列號試驗號234指標%(t)11(460)1(250)1(甲)1"=1.722I2(270)2(乙)2313(300)3(丙)3>2=1.82y3=1.80
42(490)123刈=1.925223162312K=1.83尤=19873(520)132>,7=1-598321393321y8=1.60y9=i.8i5.345.235.305.369K”5.735.255.555.395.005.595.225.32i=\=16.07K”y=-=1.7869F1.7801.7431.7671.7871.9101.7501.8501.797心1.6671.8631.7401.773心R,0.730.360.330.07因素主一次ABC優方案A]B3C2引進下列記號以計算極差和確定因素的主次順序。K廣第/列上水平號為i的各試驗結果之和。用)=」儲『其中S為第j列上水平號i出現的次數;用)表示第,列的因素取水平i時,進行試驗所得試驗結果的平均值。/?j=max{K/-min{K/。勺稱為第,列的極差或其所在因素的極差。R,也可定義為R尸max{K“一min{K/。但對于水平數不等的試驗,就只能用后者。對于本例,有-11^>1=-Kll=-(丫|+丫2+為)1, 、5.34=-(1.72+1.82+1.80)= =1.780;3 3-11勺1=§ (九+九+九)1, 、5.73=-(1.92+1.83+1.98)= =1.910;3 3-11^31=-^31=-(為+%+%)1/ 、5.00=-(1.59+1.60+1.82)= =1.667;3 3R]=max{4[],長2],43[}min{K■,K,K31}=5.73—5.00=0.73o其它的K,廠用尸勺的計算過程就不寫出來了,它們的計算結果列在表(4)中。注意:如果第j列放置因素A,為了方便,有時也把KuM分別寫成K泡,KiA,其它記號如KiB,KiB,KiC,KiC作類似的理解。一般地說,各列的極差是不相等的,這說明各因素的水平改變時對試驗結果的影響是不相同的。極差越大,說明這個因素的水平改變對試驗結果的影響越大,極差最大的那一列的因素,就是因素的水平改變對試驗結果影響最大的因素,也就是最主要的因素。對于本例有Rx>R2>/?.>/?40IZJ4因此,它的各因素的主次順序為主f次:ABC現在,可以根據分析結果確定最優試驗方案了。挑選因素的優水平與所要求指標有關,若指標越大越好,則應該選取使指標大的水平,即各列K“,K2j,K3,(或%,.,冗,八玄3)中最大的那個水平;反之,若指標越小越好,則應取1J JJ 'J TJJ使指標最小的那個水平。本例的試驗目標是提高合成氨的產量,指標越大越好,所以應該挑選每個因素的K“,K2j,J中最大的那個水平。由于故得最優方案為A2B3c2。即反應490℃,反應壓力300大氣壓,乙種催化劑。我們通過分析計算得到的最優方案A?B3c2,并不包含在正交表中已做過的9個試驗方案之中。這正體現了正交設計的優越性。但是,實際上它是不是真正的最優方案呢?這可以通過進一步的試驗來驗證,我們也可以作進一步的理論計算來證實。3.3有交互作用的正交試驗設計分析前面討論的正交試驗設計和對試驗結果的分析,都是在因素之間沒有(或不考慮)交互作用的情況下進行的。實際上,在許多試驗中,因素的交互作用不但存在,而且不能忽略。在這種情況下,對多因素的正交試驗的表頭設計還必須另外借助兩列間的交互作用表,許多正交表的后面都附有相應的交互作用表。表(5)就是正交表L807)所對應的交互作用表。表(5) L807)兩列間交互作用列表號列葭3\1234567(1)325476(2)16745(3)7654(4)123(5)32(6)1(7)用正交表安排有交互作用的試驗時,把交互作用看成一個新的因素,它要在正交表上占有列,稱為交互作用列。交互作用列不能隨意安排在任意列上,應該通過查交互作用表來安排。從表(5)就可以查出正交表L8@7)中任何兩列的交互作用列。例如,要查第2列與第6列的交互作用列,先在表6-25的對角線上查出列號(2)與(6),然后從(2)向右橫看、從(6)向上豎看,交叉數字為4就是它們的交互作用列的列號。即是說,用LK27)安排試驗時,如果因素A被安排在第2列,因素8被安排在第6歹IJ,那么,交互作用因素AXB就只能安排到第4列上,此列不能再安排其它因素,以避免發生效應之間的''混雜”。在分析試驗結果時,AX8仍然作為一個單獨因素,同樣計算它的極差,極差的大小反映A和8的交互作用的大小。下面舉例說明有交互作用的試驗設計與試驗結果的分析。例2工件的滲碳層深度要求為1±0.25mm,要通過試驗考察的因素與水平如表(6)所示,還要考察交互作用AXB.BXC。表(6)例2的因素與水平表水平因素A催化劑B溫度(℃)C保溫時間(h)D工件重量(kg)甲70021乙80031.5試驗目的是確定這4個因素及2個交互作用對滲碳指標的影響的重要性的主次順序,并找到最優的生產方案。解首先,選定合適的正交表。這是一個4因素2水平試驗,4個因素加上2個交互作用Ax8、BxC,因此所選的2水平正交表至少要有6列。滿足這種條件的2水平正交表中以IQ7)為最小,因此選用正交表L8(27)安排試驗。然后進行表頭設計。把因素A、8分別放在表L807)的第1、2列上,查及(27)兩列間的交互作用表,可知交互作用A義B占用第3歹U,因此第3列不能安排因素C(或其它因素),否則第3列的極差就分不清楚是因素。的作用還是AX5的作用,這便產生了效應“混雜”。現將因素C放在第4歹I」,查LgQ?)兩列間的交互作用表,可知交互作用BXC占用第6歹IJ,因此第6列不能再安排別的因素。最后,因素。可安排在第5列或第7列上,現安排在第5列上,于是第7列成為空白列。這樣,便得到不會有因素與交互作用“混雜”的表頭設計,如表(7)所示。表(7)例2的表頭設計因素ABAXBCDBXC空列列號1234567下面制訂試驗方案與進行試驗。完成了表頭設計以后,只要把表1(27)安排有因素的第1、2、4、5列上的數字“1”、“2”分別看成是該列所安排的因素在各個試驗中的水平數,從而正交表的每一行就確定一個試驗方案,于是得到本例的8個試驗方案。注意,在完成了表頭設計以后,交互作用所在列與空白列一樣,對確定試驗方案不起任何作用,因為那些列的數字“1”、“2”不代表任何實際水平。按正交表規定的試驗方案進行試驗,測定試驗結果。試驗方案與試驗結果見表(8)?下面分析試驗結果,計算極差,確定因素的主次順序。由于滲碳層深度七越接近1越好,為了便于討論,把試驗指標為變換為Ix—\|=%,從而問題轉化為匕越小越好。用%(i=1,2,…,8)來計算K”%,計算K",勺與第/列放置什么因素或交互作用無關,所以計算Kg,0的公式與無交互作用情形相同。計算所得結果以及根據極差0由大互小所確定的因素的主次順序見表(8)o最后,確定最優方案。如果不計交互作用,注意到指標必是越小越好,很容易得到最優方案應該是A1B2C1D”但是,由于交互作用AX8是影響試驗結果的最重要因素,是挑選水平組合的最主耍依據,所以不能不計。可是,AX8沒有實際水平,說它取哪個水平是沒有意義的,因而不能按63,長23值的大小來確定,應該按因素A,8的水平搭配的好壞來確定。怎樣看出兩因素水平搭配的好壞呢?通常把兩因素各種水平搭配下對應試驗結果(數據)之和列成的表格稱為搭配表(也稱為二元表),表(9)便是本例的A,8兩因素的搭配表。表(8)例2的試驗方案與結果分析夕試驗號號ABAXBCDBXC空列滲碳層深度Xj(麗)y二1Xj-11123456711伸)1(700)1K2)1(1)110.850.1521112(3)2(1.5)220.750.25312(800)211221.030.03
412222110.980.0252(乙)1212121.090.09621221211.160.16722112210.810.19822121120.920.080.450.650.670.460.420.340.520.520.320.300.510.550.630.450.070.330.370.050.130.290.07因素主f次AXBBBXCDAC優方案A12c2D1表(9)例2因素A,B的水平搭配表B?D“=y1+為=0.15+0.25=0.40d12=y3+=0.03+0.02=0.05A?D2i=y5+y6=0.09+0.16=0.25D22=為+y8=019+0.08=0.27由于本例的指標.越小越好,根據正交表的綜合可比性,表中最小值所對應的水平搭配就是因素A,8的最優水平搭配,即最好的搭配是A1?。由于交互作用8XC比因素C重要,我們也列出因素8,C的水平搭配表(見表(10))。表(10)例2的因素8,C水平搭配表GC2Di尸%%=0.15+0.09=0.24D]2=y2+兒=0-25+0.16=0.41生D2i=y3+y7=0.03+0.19=0.22d22=y4+y8=0.02+0.08=0.10與因素A,8找最優水平搭配的道理一樣,由表(10)得到因素8,C的最優水平搭配為B2c2。綜上所述,不考慮交互作用時得到的最優方案為A1B2CQ1,考慮交互作用時得到的最優方案為A|B2c2D.這兩個方案一致之處在于因素C的水平選取上,在有交互作用時,這種矛盾現象是經常發生的。此時,因素C取哪一個水平好呢?一般來說,次要因素應該服從主要因素(交互作用AX8、8XC分別都看作是因素),本例交互作用BXC比因素。重要,因此應該選擇由因素8,C的優水平搭配所確定的水平。于是,最后確定的最優方案為A|B2c2四。即甲種催化劑,溫度800℃,保溫時間3h,工件重量1kg。當因素取3水平或3水平以匕時,交互作用的分析比較復雜,不便于應用直觀分析法(極差分析法),通常都用方差分析法。§4正交試驗設計的方差分析前面介紹了用正交表安排多因素試驗的方法,并對試驗結果進行了極差分析。極差分析方法的優點是方法簡單、直觀,計算量較少,便于普及和推廣,對于生產實際中的一般問題用極差分析法能夠得到很好解決。但極差分析法不能估計試驗過程中以及試驗結果測定中必然存在的誤差的大小,因而不能真正區分各因素各水平所對應的試驗結果的差異究竟是由于水平的改變所引起的,還是由于試驗誤差所引起的。而且,對影響試驗結果的各因素的重要程度,極差分析法不能給出精確的數量估計,也不能提供一個標準來考察、判斷因素對試驗結果的影響是否顯著。特別,對于水平數大于等于3且要考慮交互作用的試驗,極差分析法不便于使用。方差分析能彌補極差分析法的這些不足。4.1不考慮交互作用的正交試驗的方差分析利用正交表對試驗結果進行方差分析的思想與步驟類似于兩個因素全面試驗中的方差分析:先將數據(試驗結果)的總偏差平方和分解為各因素以及誤差的偏差平方和,然后求出F值,再應用F檢驗法。若用正交表L.(r')安排試驗,總的試驗次數為〃,試驗結果為弘,打,…,尤,則數據的總偏差平方和ST為=±yj 工y,2_療2=才匕2___0TOC\o"1-5"\h\zi=l i=\ /=1 〃其中,ni=] ,=i由一個因素的方差分析知道,因素A所引起的數據的偏差平方和(即組間平方和)為Sa=S〃,(1一切2=£明了,2一方2=£q-2_ZLOi=l (=1 i=l 〃其中,r為因素A的水平數;司為因素A的水平A,所對應的試驗結果的平均值。用正交表安排試驗時,每一個因素的任一個水平的試驗次數都是相等的。設因素A的每一個水平的試驗次數為5,則(記號K,尸月八斗與前節的含義相同)_-1〃j-Stn—rs;yj—K次=—K消?于是,Sa可表示為TOC\o"1-5"\h\zr 1 “ 1r 1 " rr T2Sa=,,Z舄一以2>)2」£代一,=l ?i=l §i=l 〃,=l 〃,'=1 ?若因素A安排在正交表的第,列上,記Sa=Sj,且稱Sj為第/列所引起的數據的偏差平方和(簡稱邑為第/列平方和),于是有特別地,對于2水平的正交試驗,計算邑的公式可簡化為7 111Sj=—(&:+《)——(//+~=_(&廠KQ2=_R。Jn n n n若用正交表Ln(r')安排試驗,可以證明有如下平方和分解公式:Sr=ZSj"j=i也就是說,我們用正交表將總偏差平方和力分解為各列偏差平方和邑之和,且S7的自由度fT=n—1;Sj的自由度fj=r—1。例1苯酚合成工藝條件試驗。某化工廠在原有基礎上要對苯酚的合成條件做進一步的研究,目的在于提高苯酚的產率。試驗考察的因素與水平為(不考慮交互作用):A:反應溫度CC)A|=300,42=320;B:反應時間(min)=20,B2=30:C:壓力G=200,C2=250;D:催化劑種類O產甲,。2=乙;E:NaOH溶液用量(L)Et=80,E2=100.解由于各因素皆為2水平,共有5個因素,可選用正交表L8Q7)。表頭設計、試驗方案、試驗結果及的計算結果見表(1)?表(1)例1的試驗與計算表ABcDE試驗結果以
列試驗號號12345671211111112121212%=83.43411222212122121%=84.05622112212211221%=87.37822221112212112以=84.8%=873y6=88.0打=92.3丫8=90.4339.5358.0342.7354.8350.1347.4350.3347.2348.4349.1351.6345.9348.5349.07=697.5區=87.2院84.989.585.788.787.586.987.686.887.187.387.986.587.187.3碣R,18.512.12.73.10.75.70.5s.42.78118.3010.9111.2010.0614.0610.031S7=67.349本例是用正交表L807)安排試驗,于是有:] 8 1 1Sr=£y;--(Xy,)2;Sj=、(K|j—R;。i=l8i=1 O 3各列的跖計算結果見表(Do山正交表的平方和分解分式及本例的表頭設計,得Sr=S.+Sfl+Sr+S.,+Sf+S,+S7o//iOV/-/t1J/其中S3,S7均為空白列的偏差平方和。由于空白列的偏差平方和不是由任何因素所引起的,故是誤差所引起的,因此誤差平方和S,為所有空白列的偏差平方和之總和,本例為Se=S3+S-j且自由度有/e=+6,于是又有5r=S4+5?+Sr+SD+5F+5oi d uc.e要進行方差分析,還必須把試驗結果理解為%理解為隨機變量7(i=1,2,-,8),并假定它們服從正態分布。在無交互作用時,假定7,%,…,%滿足下面模型。7]l=/j+al+bl+ci+dl+el+elrt2=M+al+bi+c1+d2+e2+£2〃3="+。[+b2+c]+d}+e2+s3〃4=〃+。1+/?2+c2+1/2+4+4%=N+ +c^d2+et〃6=〃+。2+么+。2+4+02+4%=〃+。2+62+0+d2+e2+e7r/s=^+a2+b2+c2+d,+e,+£g免s也=3i=\ /=1 ;=1i=l/=!£t,£2,…,/血~N(0,/),從而7,%,…,人相互獨立其中q也,q,d,?分別為因素的水平A,,B,,C,,Dt,E,的效應(i=1,2),它們與〃及b?均是未知參數。檢驗A,8,C,O,E各因素對試驗結果有無顯著影響,分別等介于對下列假設:HA:a]=0,HH:b}=/??=0,Hc:C1—c^=0,HD:d]=d)=0,He:6]=6)=0。卜.面作出顯著性檢驗。我們己指出有St=Sa+Sb+Sc+S[)+Sf+S°還可以證明有下列結論:(1)Sa,Sb,Sc,S‘,,Se,S,相互獨立,且必?/(/);(7s(2)當“八成立時,T??/(/a);(7~S當Hb成立時,—y-/2(fn);q當"c成立時,-T^Z2(/c);(7當”。成立時,—y*/2(//));crs當"e成立時,—7**Z-(fE)o其中人稱為S.(或因素A)的白由度。有£=因素A的水平數一1。同理,可知力,人,4的含義及計算公式。。稱為5/或誤差)的自由度,它的另一個計算公式為。二37一各因素的自由度之和二(〃一1)一各因素的自由度之和。由此得到檢驗"a的統計量為F號"")其中,SA=SA/fA;&=S/A。一般$=Sj/力稱為第j列的均方和。于是,對于給定的顯著性水平a,由樣本值必,力,…,為算出統計量%的觀測值卻,那么檢驗假設“A的法則為:若則拒絕”a,認為因素A對試驗結果的影響是顯著的;若E/居Y(i,/e),則接受”A,認為因素A對試驗結果的影響不顯著。類似可得到檢驗”8,“C,”。,"E的法則。但是,有些因素時試驗結果的影響明顯地不顯著。應該把這些因素所在列的S,并入誤差平方和S‘中。通常是比較Sa與S‘的大小,如果Sa<S/就可以將并入S,中。如果有若€7 zi C: Zl C J C.干列皆如此,就把這些列的Sj全部加起來,將它們與S.并在一起作為新的誤差平方和S/相應的自由度也并入力成為//(注意,有時S,異常地小,此時甚至把滿足,^>1,但相對于其它一些列的偏差平方和來說小得多的少數一些列的Sj也并入誤差平方和S,中),然后再對其它因素用來作檢驗:若計算出的觀測值尸閃》K-a(%,//),則以顯著性水平a推斷此因素對試驗結果的影響顯著,否則推斷此因素對?試驗結果的影響不顯著。在例1中得到Se=S3+Sy=0.911+0.031=0,942;/小力+6=1+1=2;_o942-Sn=0.061〈匕絲=S,。2于是ASe=Se+SD=0.942+0.061=1.003。fe&=fe+fD/3+/7=1+1+1=3?查尸分布表得卑03(1,3)=34.12;F,_005(1,3)=10.13;Fl_010(l,3)=4.54.TOC\o"1-5"\h\zblS.42.781/1 廣因匕="= =128.1>F,001(1,3)=34.12,*Se1.003/3 1-001故因素A對試驗結果的影響是高度顯著的。類似可得因素8的影響是高度顯著的,而因素E的影響是顯著的。對因素C,由于Fc=^~=L2。]/]=3.6<K0|0(1,3)=4.54,cS-1.003/3 1-010
故因素C對試驗結果無顯著影響。將以上分析計算列成方差分析表(表(2))。表(2)例1的方差分析表方差來源平方和s自由度f均方和3產值顯著性A42.781142.781128.1**B18.301118.30154.8**C1.20111.2013.60A0.06110.061E4.06114.06112.2*e0.94220.4711.00330.334下面來確定最優方案。在無交互作用的情形,對試驗結果影響顯著的因素應該選最好的水平,由于Ka<K2A>故因素A的水平人2比A|好。(在本例中,指標越大越好)。類似可得因素8的水平生比與好;對于因素E,水平目比當好。對于作用不顯著的因素,可根據提高效率、降低消耗、便于生產等多方面考慮任取?個水平。本例對作用不顯著的因素C,。,可選G,R,故確定的最優工藝條件為aB2EiGR,即溫度320℃、時間30min、NaOH溶液80L,大氣壓200及甲種催化劑。我們計算得出的最優方案A?B2E.C,2不包含在正交表排出的試驗方案中,按正交表的安排在已做過的8個試驗中,以第7號試驗結果為最好,可將第7號試驗方案與最優方案作對比驗證試驗。4.2考慮交互作用的正交試驗的方差分析我們通過例子來說明。例2某紡織廠在梳棉機上紡粘棉混紡紗,為了降低棉結粒數,想通過試驗確定有關因素的最優方案。試驗要考察的因素與水平為:A:金屬針布產地4=甲地,42=乙地;B:產量(kg)C:速度C:速度(r/rain)G=238,C2=320o還要考察3個因素之間可能存在的一級交互作用AX8,AXC,8XC。解選擇正交表、表頭設計、明確試驗方案及進行試驗等這些步驟都與前述類似,所得結果見表(3).為了便于計算,我們把試驗結果進行了如下簡化:y,.=100(X,—0.30) (i=l,2,…,8)。由于數據經過線性變換后方差分析的結論不變,故對正交試驗的方差分析也是如此。表(3) 例2的試驗與計算表AABAXBcAXCBxC棉結粒數%=100X列試驗號1234567X:(xi~號0.30)11(甲)1(6)11(238)1110.30021112(320)2220.355312(10)211220.20-10412222110.300521212120.15-1562乙)1221210.502072211221040105-5010-150-5-403520-25-505-10T=—5y=-0.625s,3.12578.1253.125703.125253.1253.12528.125利用簡化數據yg=l,2,…,8)計算勺,S,,計算與第,列安排什么因素或什么交互作用無關,所以計算K〃,Sj的公式與無交互作用的情形完全相同,具體計算結果見表(3)。下面對例2進行方差分析。為了進行方差分析,我們把試驗結果,理解作隨機變量,并記作?(i=l,2,…,8),假定它們滿足下列模型:%/+fe|+(aZ?)j?+C]+(ac)H+(&c)n+£,(r/2=/j+at+bl+(ab)ll+c2+(ac)l2+(bc)l2+£2%=〃+4]+h,+(aZ7)12+c1+(ac)n+(Z>c)21+£,,7]4=/j+ai+b2+(ab)]2+c2+(ac)p+(bc)22+=〃+。2+仇+("bi+G+(ac)2]+(be)]1+£5〃6=〃+。2+4+(ab)2i+c2+(ac)22+(bc)l2+%=〃+〃2+%+(")22+C]+(ac)21+(bc)2]+£7%+(")22+c2+(ac)22+(be)l2+4TOC\o"1-5"\h\z=E&=Z,i=°i=li=\ /=12 2 2=Z(孫=Z(叫1=1 j=\ 1=]=£("%=£(反),7=£s%=0j=l /=1 J=1£},£2,…,4同?NQtr?)(從而7,%,…,%相互獨立)其中,〃,q,d,G,(ab%,(ac)u,(bearer?均是未知參數。〃稱為理論總均值;《,2,二分別為A,B,,G的效應(,=1,2),它們的(估計值)計算方法與無交互作用的情形相同;("%,(。叫,仍叫分別表示從與Bj、A,與Cj、B.與g的交互效應,它們的(估計值)計算方法稍后再討論。檢驗因素4,8,。及交互作用4乂8,4X。,8X。對試驗結果有無顯著影響,分別等價于對下列假設:HA:a1=。2=0,HB:/?)=b2=0?Hq:c[=c,—0>“axh:(。*=°(,=1,2;J=1.2),“Axe:(ac)(>=0(i=l,2;)=1,2),Hbxc:S%=0(i=l,2:j=l,2)。作顯著性檢驗。前面已指出,正交試驗的總偏差平方和分解公式為S7,對本例有;=1+Saxb+Saxc+Sbxc+S-。其中,Sa=S[,SB=S29SC=S49^AxB=^39^AxC=^59SBxC=S6, =S]。而且有fA=fB~fc=fAxB=fAxC=fBxC=S?=1。還可以證明有下列結論:⑴SA,S8,Sc,SAx3,SAxC,SwC,Se相互獨立,且十二工);(7s(2)當"a成立時,(7~當Hb成立時,—y~/(于b);s當“C成立時,—y (fc);(J當“AxB成立時,9等~/(/*b);q當“A/成立時,一~/(九*Q。bS當〃8久成立時,號-/(/*C)。(T山此得到檢驗假設”A的統計量為Fa=沿?=》F5心,JJe'e于是,對于給定的顯著性水平a,由樣本值%,為,…,以算得統計量的觀測值入,檢驗〃A的法則為:若FA》K-a(LJ)則拒絕"A,認為在顯著性水平a下,因素A對試驗結果的影響是顯著的;若"(耳-a(L,/),則接受“A,認為在顯著性水平a下,因素A對試驗結果的影響不顯著。類似地可以得到檢驗其它假設(包括交互作用的假設)的法則。但要注意,若有則應該把這些Sj并入誤差平方和S,之中而成為sr,然后用/=去空?Q(九,/「)/Je去檢驗那些沒有并入力之中的邑的因素或交互作用的顯著性(把交互作用看成因素)。對于本例,有?SA3.12528.125Se-34= =v= =3〃,A1i feeTOC\o"1-5"\h\z。 SAxB 3.125 -Saxb=3 =~\<28.125=Se,JAxB ,c SAxB 3.125 -SBc= = <28.125=S,oxv£ [ eJAxB 1故應該把Sa,Saxb,SbxC并入S,之中,得s/=se+sA+sAxB+sBxC=28.125+3.125+3.125+3.125=37.500,而相應的自由度為 f'=fe+fA+fAxB+fBxC=^剩下要檢驗的假設為“8,“c,”a*c,于是lSR/fR78.125/1Fb=- -= =8.33;S////37.500/4.Sc/fc703.125/1「…Fc=—; -= =75.00;Se/fe37.500/4尸Sa3,*c253.125/1、F.r= -= =27.00os//// 37.500/4查廠分布表,得尸y(加J「)的值為^i-o.oi(1,4)=21.2;K_(),o5(1,4)=7.71。把馬,,尸C,FAxB與查得的Fj(/,*),//)值相比較,就可以得出各因素及各交互作用對試驗結果影響是否顯著的結論,見表(4)。表(4)例2的方差分析表方差來源平方和5自由度/均方和6產值顯著性A3.12513.125B78.125178.1258.33*(AX8)A703.1251703.12575.00**AXC3.12513.125(BXC)A253.1251253.12527.00**E3.12513.125e28.125128.12537.50049.375山此知因素。及交互作用4XC對試驗結果的影響是高度顯著的,而因素6的影響顯著。順便指出,若用正交表)安排試驗,對任意兩個因素的交互作用4XB的自由度有Axb=/ax/B=(r—l)(r—1)o每一列的自由度為(r—1),故此時任何兩個因素的交互作用都要在正交表L?(r,)上占用(r—1)列。例如,用2水平的正交表安排試驗時,任何兩個因素的交互作用占用(2—1)=1列;用3水平的正交表安排試驗時,任何兩個因素的交互作用占用(3—1)=2歹人下面考慮最優方案。令q,b,,c,.分別表示A.8,,G的效應,它們的計算公式(稱為水平效應公式)為ai=KiA-y=-(Tk,a—t);n,—_1bi=KiB~y=-(rKiB——t);n-_1〃c產 —'=一任"—T)。n["%表示4與鳥的水平組合對試驗結果的聯合效應(也稱總效應),它等于Aj與嗎搭配條件下的均值與總均值之差。用(叭表示A,與Bj的水平組合對試驗結果的交互效應,簡稱為A,與Bj的交互效應。在有交互作用的兩個因素方差分析模型時,得到/=〃+%+凡+為,或寫成為—〃=%+4+Ya。用我們現在的記號,這個式子就成為["%=《+鳥+(。%,或改寫成(4”了=[。/?]“.一at—bjo可以用因素A與8的水平搭配表(也稱A與8的二元表)來求出鳥(如果只求生,鳥),則用水平效應公式計算為簡),從而易算得交互效應伍。),了。下面以因素A,8安排在表LK27)的第1,2歹U(從而AX8應占用第3歹口為例,來說明用二元表計算[必],了嗎,句的方法(見表(5)).表(5)當KiAa.4Dif+y2Dl2=y3+y4j=l心一反口2尸治+”口22=丫7+y82Z£>2j=K”j=\K2A~yK,b£。.也/=!=K?bi=12 21=1j-lbi^?-yK2B-y表中。”為因素A,5取水平搭配從氏時所對應的試驗結果之和。因為.等于4與當搭配條件下的均值與總均值之差(實際上這里計算出的是【。封,了的估計量或估計值),于是有["%=%一歹=<0廠y=J(22%—T)。Z o一般,若用表"(,)安排試驗,則—?1?[ab]tj=Dtj—y=—(r~Djj—T),,其中,R,為A,嗎搭配條件下各試驗結果之和,及丁則為其平均值。在例2中,各交互作用中只有AXC是顯著的,我們通過因素A與C的水平搭配表(二元表)來求米c]”。,“(見表(6)).表(6)例2的因素A,C的二元表GG%4Dii=J]+%=0-10=-10D12=y2+^4=5+0=5-5-0.625&021=y5+^7-15-15=-30D22=y6+y8=20+10=3000.625-4035T=-5Ci-9.3759.375于是,A,與C,的聯合效應(總效應)為:_ _-10-5 — _5-5[ac]11=D11—y=^-——=—4.375;[ac]l2=D12—y=-——=3.125;[dc]2\=^2i-y=-一—~■=-14.375;[ac]22=^22-J -—^=15.625。再計算A與C.的交互效應(ac)..:(qc)u=[qc][]—%—C)=-4.375-(―0.625)一(—9.375)=5.625;(qc)]2=[〃c]]2—a\—c2=3.375—(—0.625)―9.375=一5.625;(〃c)2[=[ac]2i一a2一c\~-14.375—0.625-(-9.375)=一5.625;(〃c)22=[qc]22—a2—c2=15.625—0.625—9.375=5.625。注意,由于有2 2Z(a%=0,Z(a%=°i=l j=\因此,在水平數r=2時,只須求出(at%中的任一個,其它三個立即可以寫出結果來。下面討論有交互作用時,確定最優方案的方法,此時,可按以下四種情況分別處理(假定指標越大越好):(1)若因素A及交互作用AX8的影響顯著,但因素8的影響不顯著。則計算(ab)m=max{(a&)..},au=max{a,}及(ab)uv=max{(aZ?)uJ}。(若滿足此條件的(ab)u或4不止一個,則凡滿足此條件的都要進行下面的計算與比較,從中找出最大值用以確定最優水平組合。①若(ab')kl+ak>au+(ab)ui,,則優水平組合為AkB,②若(ab)kl+ak<au+(ab)uv,則優水平組合為AUBV③若(ab)kl+4=4+(")“,,,則優水平組合取A*B,或AUBV都可以。(2)若因素8及交互作用Ax8的影響均顯著,但因素A的影響不顯著,這種情況實質上就是情況(1),所以只需把情況(1)后面討論中的A與8互換且。與b互換,便得到情況(2)的結論。(3)若交互作用AX8的影響顯著,但因素A,8的影響均不顯著,則選交互效應(ab%中最大者所對應的水平4Bj為優水平組合(若(ab%中最大者不止一個,則其中任一個皆可)。(4)若因素A,8及交互作用AXB的影響均顯著,則選聯合效應(ab%中最大者所對應的水平從鳥為優水平組合(若(ab%中最大者不止一個,則其中任一個皆可)。當然,如果交互作用AX8無顯著影響,那就是屬于無交互作用的情況,此時因素各自單獨選優水平。如果討論的問題是指標越小越好,那么把上述四種情況中的(ab%,[ab]ir/,鳥中的“最大”改為“最小”,“max”改為“min”,“>”改為“V”,便可得到指標越小越好時的最優水平組A口。在例2中,指標越小越好,由例2的方差分析知道,因素。及交互作用AXC的影響顯著,但因素A的影響不顯著,所以是屬于情況(Do此時,有:}=(ac)]2=(QC)2i=—5.625;min{c-}=c.=9.375;1業2 1 1min{(QC)“}二(ac)2i=15.625。又有(ac)I2+c2=—5.625+9.375=3.750;(〃c)2]+C]=-5.625+(—9.375)=—15;(ac)21+C1=Cj+(ac)21=-15o比較上面算得的三個數值,以q+3c%為最小,因此,確定最優水平組合為4G。又由例2的方差分析表可以看出,因素5的影響顯著,但交互作用4X3、6XC的影響均不顯著,故因素B單獨選優水平。由于K|b>K2b,因此因素3的優水平為82。綜上所述,得到最優方案為A2%G,也就是正交表L8Q7)的第7號試驗方案。第六章 多元數據的統計模型6.1多元數據在科研生產和社會實踐中,我們的研究對象往往比較復雜,需要用多項指標對其進行描述與刻畫。比如在嫦娥1號登月衛星的變軌過程中,我們會關注衛星的飛行速度、近地點高度,遠地點高度、瞬態加速度增量、雷達及太陽帆板的朝向、衛星的姿態等多項參數。在對月觀測中,我們也會觀察月球的多項指標,形成大量的多元觀測數據。在社會經濟研究中,我們經常會同時關注國民生產總值、物價指數、消費指數、進出口貿易總額、勞動生產率等多項經濟指標,也會面對大量的多元觀測數據。對這些多元數據進行科學的分析和處理,可以為揭開月球的神秘面紗、揭示經濟運行規律提供科學的分析平臺。為了了解多元數據,我們以表6.1.1所示的多元抽樣數據為例。在社會調查中經常會遇到類似的數據表。表6.1.1某小區居民情況抽樣調查數據姓名X]性別年齡%3職業身高%5健康狀況%6月收入X]顏色愛好%8黃玉梅女42教師1.65很好3800紅田超男31工程師1.78較好2790黃張文逍男56公務員1.73一般4325黃王泰昊男48公務員1.81一般3978紅郭放女22職員1.71較好2200XL.陳文韜男34工程師1.83很好3600AZ.葉珥女27教師1.61很好3000紅楊學治男25職員1.69較差1800紅在表6.1.1中,每個居民的狀況有8項指標組成。根據指標度量特性的不同,通常可以把這些指標分為三種尺度:X|、*2、與、工8表明對象具有某種屬性,稱它們為名義尺度變量,這些變量沒有量化,計算這些變量的均值方差沒有什么實際意義,也無法對它們進行
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 個人與企業的承包合同模板
- 二人股權轉讓合同書
- 二手手機買賣合同樣本
- 合作伙伴銷售代理合同范本
- 專家課件視頻職業
- 人才交流合同
- 高速公路標志牌工程承包合同
- 不玩火安全教育課件
- 煙臺汽車工程職業學院《材料結構基礎與應用B》2023-2024學年第二學期期末試卷
- 長沙師范學院《人體形態與結構》2023-2024學年第二學期期末試卷
- 五年級《歐洲民間故事》知識考試題庫(含答案)
- 廢品入庫單模板
- PFMEA的嚴重度SOD的評分和優先級別
- 婚育情況登記表
- INVOICE-商業發票樣本格式
- 圓周率1000000位 完整版
- DB33-1036-2021《公共建筑節能設計標準》
- 巖芯鑒定手冊
- 快速排序算法高校試講PPT
- 甘肅歷史與甘肅文化
- 工程勘察設計收費標準
評論
0/150
提交評論