2.1-第六章 方差分析ppt課件_第1頁
2.1-第六章 方差分析ppt課件_第2頁
2.1-第六章 方差分析ppt課件_第3頁
2.1-第六章 方差分析ppt課件_第4頁
2.1-第六章 方差分析ppt課件_第5頁
已閱讀5頁,還剩48頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第六章第六章 方差分析方差分析第一節第一節 方差分析的基本原理方差分析的基本原理第二節第二節 多重比較多重比較第三節第三節 方差分析的基本假定和數據轉換方差分析的基本假定和數據轉換第一節第一節 方差分析的基本原理方差分析的基本原理 所謂方差分析所謂方差分析(analysis of variance) ,是關于是關于k(k3)個個樣本平均數的假設測驗方法,是將總變異剖分為各個變異來樣本平均數的假設測驗方法,是將總變異剖分為各個變異來源的相應部分,從而發現各變異原因在總變異中相對重要程源的相應部分,從而發現各變異原因在總變異中相對重要程度的一種統計分析方法。度的一種統計分析方法。 假設測驗的依據是

2、假設測驗的依據是:扣除了各種試驗原因所引起的扣除了各種試驗原因所引起的變異后的剩余變異提供了試驗誤差的無偏估計變異后的剩余變異提供了試驗誤差的無偏估計 。 方差是平方和除以自由度的商。方差是平方和除以自由度的商。 一、自由度和平方和的分解一、自由度和平方和的分解 設有設有k組數據,每組皆具組數據,每組皆具n個觀察值,則該資料共有個觀察值,則該資料共有nk個觀個觀察值,其數據分組如表察值,其數據分組如表6.1。表表6.1 6.1 每組具每組具n n個觀察值的個觀察值的k k 組數據的符號表組數據的符號表組別組別觀察值觀察值 ( yij,i=1,2,k;j=1,2,n)總和總和平均平均均方均方1y

3、11y12y1jy1nT12y21y22y2jy2nT2iyi1yi2yijyinTikyk1yk2ykjyknTkyyTij1y2yiykyy21s22s2is2ks 在表在表6.1中,總變異是中,總變異是nk個觀察值的變異,故其自由度個觀察值的變異,故其自由度v = nk1,而其平方和,而其平方和SST則為:則為:nknkijijTCyyySS1122)((61)其中的其中的C稱為矯正數:稱為矯正數: nkTnkyC22)(62)對于第對于第 i 組的變異,有組的變異,有212121121212)()()()(2)()()(yynyyyyyyyyyyyyyyyyinjiijnjinjiii

4、jnjiijnjiiijnjij從而總變異從而總變異(61)可以剖分為可以剖分為: kiikinjiijkinjijTyynyyyySS12112112)()()((63) 即即 總平方和總平方和=組內組內(誤差誤差)平方和平方和+處理平方和處理平方和 組間變異由組間變異由k個個 的變異引起,故其自由度的變異引起,故其自由度 v =k1 , 組組間平方和間平方和 SSt 為:為:iykkiitCnTyynSS1122)( 組內變異為各組內觀察值與組平均數的變異,故每組具有組內變異為各組內觀察值與組平均數的變異,故每組具有自由度自由度 v =n1和平方和和平方和 ;而資料共有;而資料共有k 組,

5、故組,故組內自由度組內自由度 v = k (n1) ,組內平方和組內平方和 SSe 為:為: niijyy12)( kntTiijeSSSSyySS112)( (65) (64) 因而,得到表因而,得到表6.1類型資料的自由度分解式為:類型資料的自由度分解式為:1)(1)(1)(nkknk(66) 總自由度總自由度DFT =組間自由度組間自由度DFt +組內自由度組內自由度DFe 求得各變異來源的自由度和平方和后,進而可得求得各變異來源的自由度和平方和后,進而可得:(67)()()()(1 2 1 222222nkyysMSkyynsMSnkyysMSiijeeittijTT組內均方組內均方組

6、間的均方組間的均方總的均方總的均方 例例6.1 以以A、B、C、D 4種藥劑處理水稻種子,其中種藥劑處理水稻種子,其中A為對照,每處理各得為對照,每處理各得4個苗高觀察值個苗高觀察值(cm),其結果如表,其結果如表6.2,試分解其自由度和平方和。試分解其自由度和平方和。 表表6.2 6.2 水稻不同藥劑處理的苗高水稻不同藥劑處理的苗高(cm)(cm)藥劑藥劑苗高觀察值苗高觀察值總和總和Ti 平均平均 A18 21 20 137218B20 24 26 229223C10 15 17 145614D28 27 29 3211629T=336 =21iyy 根據(66)進行總自由度的剖分: 總變異

7、自由度DFT=(nk1)=(44)1=15 藥劑間自由度DFt=(k1)=41=3 藥劑內自由度DFe=k(n1)=4(41)=12根據根據(63)進行總平方和的剖分:進行總平方和的剖分:70564433622nkTC6023221182222CCySSijT5044)116569272()(2222122C/CnTyynSSkiit或或 504)2129()2114()2123()2118(42222tSS98504602)(1111222tTknnkkiijiijeSSSSnTyyySS或或 藥劑藥劑A內:內: 藥劑藥劑B內:內: 藥劑藥劑C內:內: 藥劑藥劑D內:內:3847213202

8、118222221eSS2049222262420222222eSS2645614171510222223eSS14411632292728222224eSS所以所以 kniijeyySS1129814262038)( 進而可得均方:進而可得均方: 1340156022./sMSTT0016835042./sMStt17812982./sMSee二、二、F分布與分布與F測驗測驗 在一個平均數為在一個平均數為 、方差為、方差為 的正態總體中,隨機抽的正態總體中,隨機抽取兩個獨立樣本,分別求得其均方取兩個獨立樣本,分別求得其均方 s12 和和 s22,將,將 s12 和和 s22 的比值定義為的比

9、值定義為F:22221)(ssF21,(68)此此F值具有值具有s12 的自由度的自由度 v1 和和 s22 的自由度的自由度 v2。 所謂所謂F分布,就是在給定的分布,就是在給定的 v1 和和 v2 下按上述方法從下按上述方法從正態總體中進行一系列抽樣,就可得到一系列的正態總體中進行一系列抽樣,就可得到一系列的F 值而作值而作成一個分布。成一個分布。 F分布下一定區間的概率可從已制成的統計表查出。 F分布曲線特征:(1具有平均數 =1(2取值區間為0,;(3某一特定曲線的形狀則僅決定于參數 v1和 v2 。在 v1=1或 v1=2時,F分布曲線是嚴重傾斜成反向J型;F0.51.01.52.0

10、2.53.03.54.04.55.05.56.00.00.20.40.60.81.0Ff(F)當當 v13時,曲線轉為偏態時,曲線轉為偏態(圖圖6.1)。4, 5215, 2215, 121圖圖6.1 F分布曲線分布曲線(隨(隨v1和和v2的不同而不同)的不同而不同)F測驗需具備條件:(1)變數y遵循正態分布N( , ),(2) s12 和 s22 彼此獨立 。 2 在在F 測驗中,如果作分子的均方小于作分母的均方,測驗中,如果作分子的均方小于作分母的均方,則則F0.05,應接受,應接受H0。 例例6.2 測定東方紅測定東方紅3號小麥的蛋白質含量號小麥的蛋白質含量10次,得均方次,得均方 s1

11、2 =1.621;測定農大;測定農大139小麥的蛋白質含量小麥的蛋白質含量5次,得均方次,得均方 s22 =0.135。試測驗東方紅。試測驗東方紅3號小麥蛋白質含量的變異是否號小麥蛋白質含量的變異是否比農大比農大139為大。為大。 假設假設H0:東方紅小麥總體蛋白質含量的變異和農大:東方紅小麥總體蛋白質含量的變異和農大139一樣,即一樣,即 ,對,對 。 22210:H2221:HA 顯著水平顯著水平 =0.05,v1=9,v2 =4時,時,F0.05 =6.00。 測驗計算測驗計算: F =1.621/0.135=12.01 此此FF0.05,即,即PF0.01F0.05 。 推斷:否認推斷

12、:否認 ,接受,接受 ;即藥劑間;即藥劑間變異顯著地大于藥劑內變異,不同藥劑對水稻苗高是具有不變異顯著地大于藥劑內變異,不同藥劑對水稻苗高是具有不同效應的。同效應的。 220:etH22:etAH 例例6.1和例和例6.3的分析結果可以歸納在一起,列出方差的分析結果可以歸納在一起,列出方差分析表,如表分析表,如表6.3所示。所示。表表6.3 6.3 水稻藥劑處理苗高方差分析表水稻藥劑處理苗高方差分析表變異來源變異來源DFSSMSF顯著顯著F值值藥劑處理間藥劑處理間 3504168.0020.56F 0.05(3,12) = 3.49 藥劑處理內藥劑處理內(誤差誤差)12 98 8.17F 0.

13、01(3,12) =5.95總總15602第二節第二節 多重比較多重比較 所謂多重比較所謂多重比較multiple comparisons是指一個是指一個試驗中試驗中k個處理平均數間可能有個處理平均數間可能有k(k1)/2個比較,亦稱個比較,亦稱為復式比較。為復式比較。 多重比較有多種方法,本節將介紹常用的三種:多重比較有多種方法,本節將介紹常用的三種: 最小顯著差數法最小顯著差數法 復極差法復極差法( q法法) Duncan氏新復極差法氏新復極差法一、最小顯著差數法一、最小顯著差數法 最小顯著差數法最小顯著差數法(least significant difference,簡稱,簡稱LSD法法

14、), 法實質上是第五章的法實質上是第五章的t 檢驗。檢驗。 其程序是:其程序是: (1在處理間的在處理間的F測驗為顯著的前提下,計算出顯著測驗為顯著的前提下,計算出顯著水平為水平為 的最小顯著差數的最小顯著差數 ; (2任何兩個平均數的差數任何兩個平均數的差數( ),如其絕對值,如其絕對值 ,即為在水平上差異顯著;反之,則為在水平上差異,即為在水平上差異顯著;反之,則為在水平上差異不顯著。不顯著。 LSDjiyy LSD知:知: )21ji,k,jisyytjiyyji;,(假設假設|t| , 即為在即為在 水平上顯著。水平上顯著。t因而,最小顯著差數為:因而,最小顯著差數為:jiyy jiy

15、ystLSD(69)當兩樣本的容量當兩樣本的容量n相等時,相等時,nsseyyji22 在方差分析中,上式的在方差分析中,上式的se2有了更精確的數值有了更精確的數值 MSe因為此自由度增大),因而因為此自由度增大),因而(69)中中 的為:的為:jiyyseMSnMSseyyji2 (610) 例例6.4 試以試以LSD法測驗表法測驗表6.2資料各種藥劑處理的苗高資料各種藥劑處理的苗高平均數間的差異顯著性。平均數間的差異顯著性。 由由(例例6.3)計算得計算得F=20.56為顯著,為顯著,MSe=8.17,DFe=12,故故 )(cm02241782.sjiyy由附表由附表4,v =12時,

16、時,t0.05 =2.179,t0.01=3.055故故 LSD0.05 =2.1792.02=4.40(cm) LSD0.01=3.0552.02=6.17(cm) 然后將各種藥劑處理的苗高與對照苗高相比,差數大然后將各種藥劑處理的苗高與對照苗高相比,差數大于于4.40cm為差異顯著;大于為差異顯著;大于6.17cm為差異極顯著。為差異極顯著。 二、二、q法法 q測驗是測驗是Student-Newman-Keul基于極差的抽樣分布理基于極差的抽樣分布理論提出來的,或稱復極差測驗,有時又稱論提出來的,或稱復極差測驗,有時又稱SNK測驗或測驗或NK測測驗。驗。 q法是將一組法是將一組k個平均數由

17、大到小排列后,根據所比較的個平均數由大到小排列后,根據所比較的兩個處理平均數的差數是幾個平均數間的極差分別確定最小兩個處理平均數的差數是幾個平均數間的極差分別確定最小顯著極差值顯著極差值 的。的。 q測驗因是根據極差抽樣分布原理的,其各個比較都可測驗因是根據極差抽樣分布原理的,其各個比較都可保證同一個保證同一個 顯著水平。顯著水平。LSR q測驗尺度值構成為:測驗尺度值構成為:SEqLSRpdf,;(611)nMSSEe/ (612) 式中式中2pk,p是所有比較的平均數按大到小順序排列所是所有比較的平均數按大到小順序排列所計算出的兩極差范圍內所包含的平均數個數計算出的兩極差范圍內所包含的平均

18、數個數(稱為秩次距稱為秩次距)。 SE為平均數的標準誤,可見在每一顯著水平下該法有為平均數的標準誤,可見在每一顯著水平下該法有k1個尺度值。個尺度值。平均數比較時,尺度值隨秩次距的不同而異。平均數比較時,尺度值隨秩次距的不同而異。例例6.5 試對表試對表6.2資料的各平均數作資料的各平均數作q測驗。測驗。 由由6.1資料得:資料得: 431429214178././nMSSEe 查附表7 q值表,當DF=12時,p=2,3,4的 值,并由(611)計算出尺度值 ,列于表6.4。qLSRpq0.05q0.01LSR0.05LSR0.0123.084.324.406.1833.775.045.39

19、7.2144.205.506.017.87表表6.4 表表6.2資料資料 值的計算值的計算(q測驗測驗) LSR由表由表6.2可知可知, =29cm, =23cm, =18cm, =14cm。:。:由此可得到由此可得到- - - -當當p=2時,時, =6(cm)5水平上顯著;水平上顯著; =5(cm)5水平上顯著;水平上顯著; =4(cm)不顯著。不顯著。當當p=3時,時, =11(cm)1水平上顯著;水平上顯著; =9(cm)1水平上顯著。水平上顯著。當當p=4時,時, =15(cm)1水平上顯著。水平上顯著。DyByAyCyBDyy AByy CAyy ADyy CDyy CByy 三、

20、新復極差法三、新復極差法新復極差法是新復極差法是D.B. Duncan(1955)基于不同秩次距基于不同秩次距p下下的最小顯著極差變幅比較大而提出的,又稱最短顯著極差的最小顯著極差變幅比較大而提出的,又稱最短顯著極差法法( shortest significant ranges,SSR )。pSSRSELSR,pSSR,查得查得 后,有后,有(613) 此時,在不同秩次距此時,在不同秩次距p下,平均數間比較的顯著水平下,平均數間比較的顯著水平按兩兩比較是按兩兩比較是 ,但按,但按p個秩次距則為保護水平個秩次距則為保護水平 1p)(11例例6.6 試對表試對表6.2資料的各平均數作新復極差測驗。

21、資料的各平均數作新復極差測驗。 知知 =29cm, =23cm, =18cm, =14cm, MSe=8.17,DyByAyCy 查附表查附表8,得值,由,得值,由(613)算得在算得在p=2,3,4時的值時的值(表表6.5),即為測驗不同,即為測驗不同p時的平均數間極差顯著性的尺度值。時的平均數間極差顯著性的尺度值。)1.43(cmSEpSSR0.05SSR0.01LSR0.05LSR0.0123.084.324.406.1833.234.554.626.5143.334.684.766.69表表6.5 表表6.2資料資料LSR值的計算值的計算(新復極差測驗新復極差測驗)當當p=2時,時,

22、=6(cm) 5水平顯著;水平顯著; =5(cm) 5水平顯著;水平顯著; =4(cm) 不顯著。不顯著。當當p=3時,時, =11(cm) 1水平上顯著;水平上顯著; =9(cm) 1水平上顯著。水平上顯著。當當p=4時,時, =15(cm)1水平上顯著。水平上顯著。BDyy AByy CAyy ADyy CByy CDyy 結論:表結論:表6.2資料的資料的4個處理的苗高,除處理個處理的苗高,除處理A與與C差異差異不顯著外,其余處理間均達顯著差異,本例結果與上面介紹不顯著外,其余處理間均達顯著差異,本例結果與上面介紹的的q測驗法相同,但測驗法相同,但q法的法的 要比新復極差法的要比新復極差

23、法的 大。大。LSRLSR四、多重比較結果的表示方法四、多重比較結果的表示方法(一一) 列梯形表法列梯形表法(二二) 劃線法劃線法(三三) 標記字母法標記字母法 將全部平均數從大到小順次排列,然后算出各平將全部平均數從大到小順次排列,然后算出各平均數間的差數。凡達到均數間的差數。凡達到 =0.05水平的差數在右上角水平的差數在右上角標一個標一個“*”號,凡達到號,凡達到 =0.01水平的差數在右上角水平的差數在右上角標兩個標兩個“*”號號,凡未達到凡未達到 =0.05水平的差數則不予標水平的差數則不予標記。若以列梯形表法表示,則成表記。若以列梯形表法表示,則成表6.6。(一一) 列梯形表法列梯

24、形表法處理處理平均數平均數( )差差 異異 14 18 23D2915*11*6*B239*5*A184C14表表6.6 表表6.2資料的差異顯著性資料的差異顯著性(新復極差測驗新復極差測驗)iyiyiyiy優點:十分直觀,優點:十分直觀,缺點:占篇幅較大,特別是處理平均數較多時。缺點:占篇幅較大,特別是處理平均數較多時。 (二二) 劃線法劃線法 將平均數按大小順序排列,以第將平均數按大小順序排列,以第1個平均數為標準與以后個平均數為標準與以后各平均數比較,在平均數下方把差異不顯著的平均數用橫線各平均數比較,在平均數下方把差異不顯著的平均數用橫線連接起來,依次以第連接起來,依次以第2,k1個平

25、均數為標準按上述方個平均數為標準按上述方法進行。這種方法稱劃線法。下面就是表法進行。這種方法稱劃線法。下面就是表6.2資料用劃線法標資料用劃線法標出出0.01水平下平均數差異顯著性結果水平下平均數差異顯著性結果(q法法)。29cm(D)23cm(B)18cm(A)14cm(C) 優點:直觀、簡單方便,所占篇幅也較少。優點:直觀、簡單方便,所占篇幅也較少。 (三三) 標記字母法:標記字母法: (1將全部平均數從大到小依次排列。將全部平均數從大到小依次排列。 (2在最大的平均數上標上字母在最大的平均數上標上字母a;將該平均數與以下;將該平均數與以下各平均數相比,相差不顯著的,都標上字母各平均數相比

26、,相差不顯著的,都標上字母a,直至某一個,直至某一個與之相差顯著的平均數則標以字母與之相差顯著的平均數則標以字母b(向下過程向下過程), (3再以該標有再以該標有b的平均數為標準,與上方各個比它大的平均數為標準,與上方各個比它大的平均數比,凡不顯著的也一律標以字母的平均數比,凡不顯著的也一律標以字母b(向上過程向上過程); 再以該標有再以該標有b的最大平均數為標準,與以下各未標記的平均的最大平均數為標準,與以下各未標記的平均數比,凡不顯著的繼續標以字母數比,凡不顯著的繼續標以字母b,直至某一個與之相差顯,直至某一個與之相差顯著的平均數則標以字母著的平均數則標以字母c。 (4如此重復進行下去,直

27、至最小的一個平均數有了如此重復進行下去,直至最小的一個平均數有了標記字母且與以上平均數進行了比較為止。標記字母且與以上平均數進行了比較為止。 (5這樣各平均數間,凡有一個相同標記字母的即為這樣各平均數間,凡有一個相同標記字母的即為差異不顯著,凡沒有相同標記字母的即為差異顯著。差異不顯著,凡沒有相同標記字母的即為差異顯著。 在實際應用時,可以小寫字母表示在實際應用時,可以小寫字母表示 =0.05顯著水平,顯著水平,大寫字母表示大寫字母表示 =0.01顯著水平。顯著水平。 (1在表在表6.7上先將各平均數按大小順序排列,并在上先將各平均數按大小順序排列,并在行上標行上標a。 (2由于由于 與與 呈

28、顯著差異,故呈顯著差異,故 上標上標b。 (3然后以然后以 為標準與為標準與 相比呈顯著差異,故標相比呈顯著差異,故標c。 (4以以 為標準與為標準與 比,無顯著差異,仍標比,無顯著差異,仍標c。 同理,可進行同理,可進行4個在個在1水平上的顯著性測驗,結果列水平上的顯著性測驗,結果列于表于表6.7。例例6.7 試對例試對例6.6測驗結果作出字母標記。測驗結果作出字母標記。DyByDyByByAyAyCy表表6.7 6.7 表表6.26.2資料的差異顯著性資料的差異顯著性( (新復極差測驗新復極差測驗) )處 理苗 高平均數(cm)差異顯著性0.050.01D29 a AB23 b ABA18

29、 c BCC14 c C 由表由表6.7就可清楚地看出,該試驗除就可清楚地看出,該試驗除A與與C處理無顯著差處理無顯著差異外,異外,D與與B及及A、C處理間差異顯著性達到處理間差異顯著性達到 =0.05水平。水平。處理處理B與與A、D與與B、A與與C無極顯著差異;無極顯著差異;D與與A、C,B與與C呈極顯著差異。呈極顯著差異。五、多重比較方法的選擇五、多重比較方法的選擇多重比較方法選用原則:多重比較方法選用原則: (1試驗事先確定比較的標準,凡與對照相比較,或試驗事先確定比較的標準,凡與對照相比較,或與預定要比較的對象比較,一般可選用最小顯著差數法;與預定要比較的對象比較,一般可選用最小顯著差

30、數法; (2根據否定一個正確的根據否定一個正確的H0和接受一個不正確的和接受一個不正確的H0的相對重要性來決定。的相對重要性來決定。 方差分析的基本步驟是:方差分析的基本步驟是: (1將資料總變異的自由度和平方和分解為各變異原將資料總變異的自由度和平方和分解為各變異原因的自由度和平方和,并進而算得其均方;因的自由度和平方和,并進而算得其均方; (2計算均方比,作出計算均方比,作出F 檢驗,以明了各變異因素的檢驗,以明了各變異因素的重要程度;重要程度; (3對各平均數進行多重比較。對各平均數進行多重比較。 第三節第三節 方差分析的基本假定和數據轉換方差分析的基本假定和數據轉換一、方差分析的基本假

31、定一、方差分析的基本假定二、數據轉換二、數據轉換一、方差分析的基本假定一、方差分析的基本假定 方差分析是建立在線性可加模型的基礎上的。所有進方差分析是建立在線性可加模型的基礎上的。所有進行方差分析的數據都可以分解成幾個分量之和,以例行方差分析的數據都可以分解成幾個分量之和,以例6.13資料資料(樣本樣本)采用采用6生長素處理試驗資料為例,該資料具有三生長素處理試驗資料為例,該資料具有三類原因或效應:類原因或效應: (1)處置處置(生長素生長素)原因或效應;原因或效應; (2)環境環境(組組)原因或效應;原因或效應; (3)試驗誤差試驗誤差(這是處理內和環境內的其它非可控因素這是處理內和環境內的

32、其它非可控因素的變異的變異)。故其線性模型為:故其線性模型為:ijijijy 建立這一模型,有如下建立這一模型,有如下3個基本假定:個基本假定: (1) 處理效應與環境效應等應該具有處理效應與環境效應等應該具有“可加可加性性”(additivity) 以組合內只有單個觀察值的兩向分組資料以組合內只有單個觀察值的兩向分組資料的線性可加模型為例予以說明,如對其取離差式,那么的線性可加模型為例予以說明,如對其取離差式,那么)()(ijjiijy上式兩邊各取平方求其總和,則得平方和為:上式兩邊各取平方求其總和,則得平方和為:2222)(ijjiy (638) 因為三類原因均各自獨立,所以右邊有三個乘積

33、和,因為三類原因均各自獨立,所以右邊有三個乘積和,即即 、 和和 ,皆為零值。,皆為零值。 當從樣本估計時,則為:當從樣本估計時,則為:或或 eBATSSSSSSSS樣本平方和的可加性樣本平方和的可加性 :2222)()()()( yyyyyyayybyyjiji 對于非可加性資料,一般需作對數轉換或其他轉換,對于非可加性資料,一般需作對數轉換或其他轉換,使其效應變為可加性,才能符合方差分析的線性模型。使其效應變為可加性,才能符合方差分析的線性模型。 有一種非可加性事例是效應表現為倍加性。將倍加有一種非可加性事例是效應表現為倍加性。將倍加性數據轉換為對數尺度,則又表現為可加性模型。如表性數據轉

34、換為對數尺度,則又表現為可加性模型。如表6.37假設數字假設數字(不考慮誤差不考慮誤差). 表表6.37 6.37 可加性模型與非可加性模型的比較可加性模型與非可加性模型的比較處處 理理可加性可加性倍加性倍加性對倍加性取對數對倍加性取對數(lg10)121212A102010201.001.30B304030601.481.78 (2)試驗誤差試驗誤差 應該是隨機的、彼此獨立的,具有平應該是隨機的、彼此獨立的,具有平均數為零而且作正態分布,即均數為零而且作正態分布,即“正態性正態性”(normality) . 因為多樣本的因為多樣本的F測驗是假定測驗是假定k個樣本從個樣本從k個正態總體中個正態

35、總體中隨機抽取的,所以一定是隨機性的。隨機抽取的,所以一定是隨機性的。 ij 如果試驗誤差如果試驗誤差 不作正態分布,則將表現為一個處理的不作正態分布,則將表現為一個處理的誤差趨向于作為處理平均數的一種函數關系。例如,二項分誤差趨向于作為處理平均數的一種函數關系。例如,二項分布數據,平均數為布數據,平均數為p,方差為,方差為p(1p)/n,方差與平均數有函,方差與平均數有函數關系。如果這種函數關系是已知的,則可對觀察值進行反數關系。如果這種函數關系是已知的,則可對觀察值進行反正弦轉換或對數轉換、平方根值轉換,從而使誤差正弦轉換或對數轉換、平方根值轉換,從而使誤差 作成近作成近似的正態分布。似的

36、正態分布。ij ij (3)所有試驗處理必須具有共同的誤差方差,即誤差同質所有試驗處理必須具有共同的誤差方差,即誤差同質性性(homogeneity) 因為方差分析中的誤差項方差是將各處理的誤差合并而因為方差分析中的誤差項方差是將各處理的誤差合并而獲得一個共同的誤差方差的,因此必須假定資料中有這樣一獲得一個共同的誤差方差的,因此必須假定資料中有這樣一個共同的方差存在,即假定各處理的個共同的方差存在,即假定各處理的 都具有都具有N(0, )的。的。這就是所謂誤差的同質性假定。這就是所謂誤差的同質性假定。 如果各處理的誤差方差具有異質性如果各處理的誤差方差具有異質性( ),則在假設,則在假設測驗中

37、必然會使某些處理的效應得不到正確的反映。測驗中必然會使某些處理的效應得不到正確的反映。 如果不同質如果不同質( ),可將方差特別大或變異特殊的處,可將方差特別大或變異特殊的處理從全試驗中剔除,或者將試驗分成幾個部分,使每一部分理從全試驗中剔除,或者將試驗分成幾個部分,使每一部分具有比較同質的誤差方差,以作出較為準確的假設測驗。具有比較同質的誤差方差,以作出較為準確的假設測驗。ij222i22i二、數據轉換二、數據轉換 對于并不符合基本假定的試驗資料,在進行方差分析之前,對于并不符合基本假定的試驗資料,在進行方差分析之前,一般可采用以下補救辦法:一般可采用以下補救辦法: (1剔除某些表現剔除某些

38、表現“特殊的觀察值、處理或重復。特殊的觀察值、處理或重復。 (2將總的試驗誤差的方差分裂為幾個較為同質的試驗將總的試驗誤差的方差分裂為幾個較為同質的試驗誤差的方差。誤差的方差。 (3針對數據的主要缺陷,采用相應的變數轉換;然后針對數據的主要缺陷,采用相應的變數轉換;然后用轉換后的數據作方差分析。常用的轉換方法有:用轉換后的數據作方差分析。常用的轉換方法有: 平方根轉換平方根轉換( square root transformation ) 如果樣本平均數與其方差有比例關系,如如果樣本平均數與其方差有比例關系,如poisson分分布那樣,布那樣, ,這種資料用平方根轉換是有效的。,這種資料用平方根

39、轉換是有效的。 采用平方根轉換可獲得一個同質的方差,同時也可減采用平方根轉換可獲得一個同質的方差,同時也可減小非可加性的影響。小非可加性的影響。 一般將原觀察值一般將原觀察值y轉換成轉換成 。這種轉換常用于存在。這種轉換常用于存在稀有現象的計數資料,例如稀有現象的計數資料,例如1平方米面積上某種昆蟲的頭平方米面積上某種昆蟲的頭數或某種雜草的株數等資料。數或某種雜草的株數等資料。 如果有些觀察值甚小,甚至有零出現,則可用如果有些觀察值甚小,甚至有零出現,則可用 轉換。轉換。2iiy1y 對數轉換對數轉換( logarithmic transformation ) 如果數據表現的效應為非可加性,而

40、成倍加性或可乘性,如果數據表現的效應為非可加性,而成倍加性或可乘性,同時樣本平均數與其極差或標準差成比例關系,則采用對數同時樣本平均數與其極差或標準差成比例關系,則采用對數轉換,可獲得一個同質的方差。轉換,可獲得一個同質的方差。 對于改進非可加性的影響,這一轉換比之平方根轉換更對于改進非可加性的影響,這一轉換比之平方根轉換更為有效。一般將為有效。一般將y轉換為轉換為lg y. 如觀察值中有零而各數值皆不大于如觀察值中有零而各數值皆不大于10,則可用,則可用lg(y+1)轉轉換。換。 反正弦轉換反正弦轉換(arcsine transformation) 如果資料系成數或百分數,則它將作二項分布,

41、而已如果資料系成數或百分數,則它將作二項分布,而已知這一分布的方差是決定于其平均數知這一分布的方差是決定于其平均數p的。所以,在理論的。所以,在理論上如果上如果p0.7皆需作反正弦轉換,以獲得一個比較皆需作反正弦轉換,以獲得一個比較一致的方差。反正弦轉換是將百分數的平方根值取反正弦一致的方差。反正弦轉換是將百分數的平方根值取反正弦值,即將值,即將p轉換成轉換成 ,從而成為角度。,從而成為角度。 附表附表12為百分數的反正弦轉換表,可直接查得為百分數的反正弦轉換表,可直接查得p的反的反正弦值。正弦值。 p1sin 采用幾個觀察值的平均數作方差分析采用幾個觀察值的平均數作方差分析 因為平均數比之單個觀察值更易做成正態分布,如因為平均數比之單個觀察值更易做成

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論