建模培訓講座第二講方差分析及_第1頁
建模培訓講座第二講方差分析及_第2頁
建模培訓講座第二講方差分析及_第3頁
建模培訓講座第二講方差分析及_第4頁
建模培訓講座第二講方差分析及_第5頁
已閱讀5頁,還剩95頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

建模培訓講座第二講方差分析及第1頁,共100頁,2023年,2月20日,星期四在現實的生產和經營管理中,經常要分析各種因素對研究對象某些特征值的影響.方差分析(analysisofvariance)就是采用數理統計方法對數據進行分析,以鑒別各種因素對研究對象的某些特征值影響大小的一種有效方法.研究對象的特征值,即所考察的試驗(其涵義包括調查,收集等)結果(如產品質量、數量、銷量、成本等)稱為試驗指標,簡稱指標,常用x表示.在試驗中對所關心的“指標”有影響的、要加以考察而改變狀態的原因稱為因素,用A,B,C等大寫英文字母表示.第2.1節方差分析的基本思想

第2頁,共100頁,2023年,2月20日,星期四在科學實驗中常常要探討不同實驗條件或處理方法對實驗結果的影響。通常是比較不同實驗條件下樣本均值間的差異方差分析是檢驗多組樣本均值間的差異是否具有統計意義的一種方法。例如醫學界研究幾種藥物對某種疾病的療效;農業研究土壤、肥料、日照時間等因素對某種農作物產量的影響不同飼料對牲畜體重增長的效果等都可以使用方差分析方法去解決第3頁,共100頁,2023年,2月20日,星期四因素在試驗中所取的各種不同狀態稱為因素的水平.因素A的r個水平常用A1,A2,…,Ar表示,其中r稱為因素A的水平數.若在試驗中考慮了因素的全部水平,則該因素稱為固定因素;若在試驗中僅隨機選擇了因素的部分水平,則該因素稱為隨機因素.若只考察一個因素對指標的影響,這種試驗稱為單因素試驗,相應的方差分析就稱為單因素方差分析;若一個試驗中同時考察兩個因素,則相應的試驗稱為雙因素試驗,這時所作的方差分析稱為雙因素方差分析,在多因素試驗中要考察的因素多于兩個,相應的方差分析稱為多因素方差分析.第4頁,共100頁,2023年,2月20日,星期四

方差分析(ANOVA)又稱

F

檢驗,其目的是推斷多組資料的總體均數是否相等。本章主要內容包括單因素方差分析(即完全隨機設計資料的方差分析)、兩因素方差分析(即隨機區組設計資料的方差分析)和三因素方差分析(即拉丁方設計資料的方差分析)及多個樣本均數間的多重比較。第5頁,共100頁,2023年,2月20日,星期四方差分析的基本思想

方差分析的基本思想借助以下例題予以說明:

例9-1為研究煤礦粉塵作業環境對塵肺的影響,將18只大鼠隨機分到甲、乙、丙3個組,每組6只,分別在地面辦公樓、煤炭倉庫和礦井下染塵,12周后測量大鼠全肺濕重(g),數據見表9—2,問不同環境下大鼠全肺濕重有無差別?第6頁,共100頁,2023年,2月20日,星期四甲組乙組丙組4.24.55.63.34.43.63.73.54.54.34.25.14.14.64.93.34.24.7

ni666第7頁,共100頁,2023年,2月20日,星期四

從以上資料可看出,三個組的數據各不相同,這種差異(總變異)可以分解成兩部分:即

(1)組間變異:甲、乙、丙三個組大鼠全肺濕重各不相等(此變異反映了處理因素的作用,以及隨機誤差的作用)

(2)組內變異:各組內部大鼠的全肺濕重各不相等(此變異主要反映的是隨機誤差的作用)第8頁,共100頁,2023年,2月20日,星期四各部分變異的計算:

①總變異(全部試驗數據間大小不等)用總離均差平方和來表示。

其中第9頁,共100頁,2023年,2月20日,星期四甲組乙組丙組4.24.55.63.34.43.63.73.54.54.34.25.14.14.64.93.34.24.7

ni666第10頁,共100頁,2023年,2月20日,星期四

②組間變異(由于所接受的處理因素不同而致各組間大小不等)用組間離均差平方和來表示。

各組均數之間相差越大,它們與總均數的差值就越大,越大;反之,越小。第11頁,共100頁,2023年,2月20日,星期四甲組乙組丙組4.24.55.63.34.43.63.73.54.54.34.25.14.14.64.93.34.24.7

ni666第12頁,共100頁,2023年,2月20日,星期四③組內變異(同一處理組內部試驗數據大小不等)用組內離均差平方和來表示。

第13頁,共100頁,2023年,2月20日,星期四三個變異之間的關系:

其中:

第14頁,共100頁,2023年,2月20日,星期四離均差平方和只能反映變異的絕對大小。變異程度除與離均差平方和的大小有關外,還與其自由度有關,由于各部分自由度不相等,因此各部分離均差平方和不能直接比較,須除以相應的自由度,該比值稱均方差,簡稱均方(MS)。

的大小就反映了各部分變異的平均大小。第15頁,共100頁,2023年,2月20日,星期四

方差分析就是通過比較組內均方和組間均方的大小關系來判斷處理因素有無效應。

檢驗統計量:

如果各組的總體均數相等,即無處理因素的作用,則組內變異和組間變異都只反映隨機誤差的大小,此時組間均方和組內均方大小相當,即F值則接近1,各組均數間的差異沒有統計學意義;反之,如果處理有作用,則組間變異不僅包含隨機誤差,還有處理因素引起的變異(組間變異主要反映處理因素的作用),此時組間均方遠大于組內均方,則F值遠大于1,各組均數間的差異有統計學意義。故依據F值的大小可判斷各組之間有無差別。第16頁,共100頁,2023年,2月20日,星期四

可見,方差分析的基本思想就是根據實驗設計的類型,將全部測量值總的變異分解成兩個或多個部分,每個部分的變異可由某個因素的作用(或某幾個因素的作用)加以解釋,通過比較各部分的均方與隨機誤差項均方的大小,借助

F

分布來推斷各研究因素對實驗結果有無影響。第17頁,共100頁,2023年,2月20日,星期四二、方差分析的應用條件(1)各觀測值相互獨立,并且服從正態分布;(2)各組總體方差相等,即方差齊性。第18頁,共100頁,2023年,2月20日,星期四例2.1.1

某公司為了研究三種內容的廣告宣傳對某種無季節性的大型機械銷售量的影響進行了調查統計.經廣告廣泛宣傳后,按寄回的廣告上的訂購數計算,一年四個季度的銷售量(單位:臺)為:廣告類型 第一季度 第二季度 第三季度 第四季度A1 163 176 170 185 A2 184 198 179 190 A3 206 191 218 224 A1是強調運輸方便性的廣告,A2是強調節省燃料的經濟性的廣告,A3是強調噪音低的優良性的廣告.試判斷:新聞廣告的類型對該種機械的銷售量是否有顯著影響?若影響顯著,哪一種廣告內容為好?新聞廣告是所要檢驗的因素,三種不同的內容是三個水平,這是一個單因素三水平的試驗.第19頁,共100頁,2023年,2月20日,星期四試驗過程中各種偶然性(隨機性)因素的干擾所致差異,稱為試驗誤差.如果差異單純是由誤差引起的,那么我們認為廣告的不同類型對銷售量沒有顯著影響,則可簡稱因素(新聞廣告)不顯著,如果不同廣告下銷售量的不同,除了誤差影響外,主要是由于廣告類型(水平)不同所造成的,那么我們就認為因素的不同水平對銷售量有顯著影響,簡稱因素顯著.方差分析就是通過對試驗結果的分析去判斷因素本身及各因素間交互作用對指標是否影響顯著的一種統計方法.第20頁,共100頁,2023年,2月20日,星期四單因素方差分析(singlefactoranalysisofvariance)是要判斷因素各水平對指標是否有顯著影響,歸結為判斷不同總體是否有相同分布的問題.由于實際中常遇到的是具有正態分布的總體,同時,在進行方差分析時,除了所關心的因素外,其他條件總是盡可能使其保持一致,這樣就可以認為每個總體的方差是相同的,因而,判斷幾個總體是否具有相同分布的問題就簡化為檢驗幾個具有等方差的正態總體均值是否相等的問題.第2.2節單因素方差分析第21頁,共100頁,2023年,2月20日,星期四考慮的因素記為A,假定它有r個水平,并對水平Ai作了ni次觀察,第i水平的第j次觀察為,這樣可得觀察資料設是來自總體的簡單隨機樣本,檢驗其中1.數學模型

第22頁,共100頁,2023年,2月20日,星期四記則等價于記總觀察次數,組平均值,總平均值,則有平方和分解式:2.方差分析第23頁,共100頁,2023年,2月20日,星期四Q稱為總離差平方和,簡稱總平方和,它反映全部數據之間的差異;Q1稱為誤差平方和或組內平方和,反映了隨機誤差的影響;Q2稱為組間平方和或因素A的平方和,反映了各總體的樣本平均值之間的差異,在一定程度上反映了間的差異程度,因而通過Q2與Q1的相對大小可以反映H0是否成立.若Q2顯著地大于Q1,說明間的差異顯著地大于隨機誤差,那么H0可能不成立.第24頁,共100頁,2023年,2月20日,星期四取也就是說有的把握認為因素對指標有顯著影響,即間的差異是顯著的.給定顯著性水平時,拒絕H0.第25頁,共100頁,2023年,2月20日,星期四通常情況下要列出方差分析表(analysisofvariancetable):第26頁,共100頁,2023年,2月20日,星期四例2.1.1

某公司為了研究三種內容的廣告宣傳對某種無季節性的大型機械銷售量的影響進行了調查統計.經廣告廣泛宣傳后,按寄回的廣告上的訂購數計算,一年四個季度的銷售量(單位:臺)為:廣告類型 第一季度 第二季度 第三季度 第四季度A1 163 176 170 185 A2 184 198 179 190 A3 206 191 218 224 A1是強調運輸方便性的廣告,A2是強調節省燃料的經濟性的廣告,A3是強調噪音低的優良性的廣告.試判斷:新聞廣告的類型對該種機械的銷售量是否有顯著影響?若影響顯著,哪一種廣告內容為好?第27頁,共100頁,2023年,2月20日,星期四所以拒絕H0,即認為廣告內容不同對銷售量的影響是顯著.分析結果如下:第28頁,共100頁,2023年,2月20日,星期四例2.設有三臺機器,用來生產規格相同的鋁合金薄板.取樣,測量薄板的厚度精確至千分之一厘米.得結果如表所示.問不同機器對生產的鋁合金板的厚度有無影響請看分別用菜單系統和程序進行討論程序名datalb給出了單因素方差分析的典型解法,進行了方差分析同時又在各水平組間進行了均值的比較,作了直方圖,菜單系統和程序中均有選項”Dunnett”進行某一水平和其余水平的均值差異比較和檢驗,選項”snk”則進行所有水平間均值差異的比較和檢驗.第29頁,共100頁,2023年,2月20日,星期四例.設有三臺機器,用來生產規格相同的鋁合金薄板.取樣,測量薄板的厚度精確至千分之一厘米.得結果如表所示.問不同機器對生產的鋁合金板的厚度有無影響?第30頁,共100頁,2023年,2月20日,星期四1.編程輸入數據:DataE411;inputc$y@@;cards;10.23620.25730.25810.23820.25330.26410.24820.25530.25910.24520.25430.26710.24320.26130.262;procprint;RUN;第31頁,共100頁,2023年,2月20日,星期四Solution→Analysis→Analyst(分析員系統)(出現空白數據表)→File→OpenBySasName…

(在Makeoneselection窗口中)work選中數據名E411→(OK)→Statistics→ANOVA→One-WayANOVA…Independent填分類變量c→Dependent因變量yPlots—可選擇分水平的盒形圖(Box-&-WhiskerPlot),條形圖(BarChart)及均值、標準差圖Means—ComparisonsMethods給出了10種多重比較的方法

α為選擇的顯著性水平,Breakdown可按水平分組出描述性統計量→OK(點擊運行后的結果樹標簽則會打開相應圖.第32頁,共100頁,2023年,2月20日,星期四編程進行單因素方差分析DataE411;inputc$y@@;cards;10.23620.25730.25810.23820.25330.26410.24820.25530.25910.24520.25430.26710.24320.26130.262;procglm

data=E411;/*glm為方差分析*/classc;/*分類變量c*/modely=c;/*模型因變量=自變量*/lsmeansc;/*最小誤差法*/meansc;/*求c的均值*/RUN;第33頁,共100頁,2023年,2月20日,星期四第34頁,共100頁,2023年,2月20日,星期四自由度公式總自由度ft=試驗次數n-1;誤差自由度fe=總自由度ft-模型自由度f模型方差分析中

(單因素模型)因素A(即模型)的自由度fA=水平數-1(A,B雙因素考慮交互效應模型)

因素A的自由度fA=水平數-1

因素B的自由度fB=水平數-1

交互效應A*B的自由度fA*B=fA*fB

模型自由度f模型=fA+fB+fA*B

回歸分析中項自由度=1

模型自由度f模型=項自由度之和第35頁,共100頁,2023年,2月20日,星期四第2.3節雙因素方差分析雙因素方差分析的數據結構為1.無交互作用的雙因素方差分析(doublefactoranalysisofvariance)因素第36頁,共100頁,2023年,2月20日,星期四因素A的第i種效應和因素B的第j種效應分別記作,試驗誤差記作,那么其中假定(1)數學模型ji,ba第37頁,共100頁,2023年,2月20日,星期四判斷因素A是否顯著,等價于檢驗假設判斷因素B是否顯著等價于檢驗假設將總離差平方和Q進行分解:選取檢驗統計量:(2)方差分析第38頁,共100頁,2023年,2月20日,星期四列出如下方差分析表:第39頁,共100頁,2023年,2月20日,星期四例2.3.1為提高某種產品的合格率,考察原料用量和來源地對其是否有影響.原料來源地有三個:甲、乙、丙.原料用量有三種:現用量、增加5%、增加8%.每個水平組合各做一次試驗,得到的數據如下:試分析原料用量及來源地對產品合格率的影響是否顯著.解:設原料來源地為因素A,三個地區為因素A的三個水平,第i個水平對合格率的特殊效應為;原料用量為因素B,三種用料量為因素B的三個水平,第j個水平對合格率的特殊效應為,原假設為第40頁,共100頁,2023年,2月20日,星期四雙因素試驗的方差分析,案例第41頁,共100頁,2023年,2月20日,星期四第42頁,共100頁,2023年,2月20日,星期四因素和指標之間的應該是什么樣的模型是由它們之間的客觀關系確定的,譬如雙因素A、B數據表(類似數據Rocket處數據表)進行方差分析討論時可能的模型有以下幾種:1)主效應A、B都顯著、交互效應A*B顯著(有交互效應的雙因素方差分析模型)2)只有主效應A顯著、主效應B顯著(只有主效應的雙因素方差分析模型)3)只有主效應A顯著(單因素方差分析模型)4)只有主效應B顯著(單因素方差分析模型)第43頁,共100頁,2023年,2月20日,星期四我們的研究是發現這樣的合適的模型.看下例分析過程.

例3分析下面數據表,說明合適的模型是個單因素模型(數據名E632)

下表(數據名E632)給出某種化工過程在三種濃度、四種溫度水平下得率的數據.第44頁,共100頁,2023年,2月20日,星期四第45頁,共100頁,2023年,2月20日,星期四例2.3.2

抗牽拉強度是硬橡膠的一項重要的性能指標,現試驗考察下列兩個因素對該指標的影響.A(硫化時間):A1(40秒),A2(60秒).B(催化劑種類):B1(甲種),B2(乙種),B3(丙種).六種組合水平下,各重復做了兩次試驗,測得數據(單位:kg/cm2)如下,試問因素A,因素B對該指標的影響是否顯著?2.有交互作用的雙因素方差分析

第46頁,共100頁,2023年,2月20日,星期四第二節兩因素方差分析第47頁,共100頁,2023年,2月20日,星期四

1.數據輸入:見DataRocket2.編程進行:procglm

data=rocket;classfm;/*class語句說明對分類變量

f,m分析*/modelr=fmf*m;

/*模型:連續變量r;考慮因素f,m及交互f*m*/lsmeansfmf*m;run;說明:如果要考慮交互效應,則每一水平組合必須做重復試驗,否則可以不做重復試驗.第48頁,共100頁,2023年,2月20日,星期四3.應用分析員應用系統:Solution→Analysis→Analyst(分析員系統)→(出現空白數據表)→File→OpenBySas(在Makeoneselection窗口中)→work(選中數據名Datarocket)→(OK)Statistics→ANOVA→FactorialANOVA…→Independent填分類變量f,m→Dependent填因變量R

→Model-----StandardModelsMaineffectsonly只考慮主效應;Effectsupto2-wayinteractions考慮交互效應Plots—可選擇響應變量的均值(主效應或交互效應)連線圖Means—ComparisonsMethods給出了10種多重比較的方法

α為選擇的顯著性水平,Breakdown可按水平分組出描述性統計量→OK請看演示第49頁,共100頁,2023年,2月20日,星期四第三節多因素(≥3)方差分析

指標y(回收率),因素:XA(尿素量),XB(水量),XC(反應時間),XD(溶劑量)(一)初步分析:從數據表(見dataQ98)看出各因素等間距取值,由正交多項式理論,此時因素的主效應(在以下變換的前提下,注意未經變換主效應的線性部分和二次項部分無法有正交性分解)可以進一步分解成線性部分和二次項部分.對于顯著因素,如果二次項部分不顯著,只是線性項部分顯著,那么因素與指標呈線性關系;如果二次項部分顯著那么因素與指標呈拋物線關系.因素等間距取值時,因素的取值與水平數(自然數1,2,3)可以有線性變換關系

新變量(可看成水平序號,已經無量綱影響)=(原變量-左端點)/步長+1此時在SAS中應先用水平數為自變量進行項的刪選,刪選結束用水平數與原始變量進行方差分析和回歸分析結論完全相同第50頁,共100頁,2023年,2月20日,星期四說明:A,B,C,B分別是四個因素在正交表上的水平值(二)數據輸入dataQ98;inputnumber$ABCDXAXBXCXDy;A2=A**2;B2=B**2;C2=C**2;D2=D**2;XA2=XA**2;XB2=XB**2;XC2=XC**2;XD2=XD**2;cards;(數據略)procprint;run;第51頁,共100頁,2023年,2月20日,星期四

(三)分析過程進行分析時(1)當因素很多或誤差自由度顯然不夠時可先只考察所有因素的主效應,如有可能再進一步考慮主要因素的二次項和交互項或(2)當試驗次數相對較多時直接在進行變量代換新變量(可看成水平序號)=(原變量-左端點)/步長+1后,可考慮所有一次項和二次項采用逐步回歸刪去不顯著的項直接討論本例先采用方法(1)分步討論與直接采用方法(2)討論的結果是一致的方法(1)第一步得輸出表如下:第52頁,共100頁,2023年,2月20日,星期四第53頁,共100頁,2023年,2月20日,星期四分析:由于每個因素自由度2,合計模型自由度8,n-1-p=0即誤差自由度為0,從而無法產生統計量F和相應概率Pr,但從平方和分解中可以看出因素效應大小的順序,并看出因素D是不顯著的,故可以刪去因素D后進入

StatisticsRegression-Linear重新分析(在選項Statistics中選擇Ⅰ型平方和SS)得表如下(從平方和比較中可以看出因素A只是線性效應而因素B,C呈拋物線效應,):第54頁,共100頁,2023年,2月20日,星期四刪除A2項重新上步工作得最終結果如表:

第55頁,共100頁,2023年,2月20日,星期四項的刪選結束后當采用原始數據進行回歸可發現方差分析結束完成一致并且得原變量和指標的回歸方程見下表方法(1)的以上過程與對新變量采用方法(2)直接利用逐步回歸直接完成的結論相同第56頁,共100頁,2023年,2月20日,星期四第57頁,共100頁,2023年,2月20日,星期四第58頁,共100頁,2023年,2月20日,星期四多因素(≥3)方差分析(續)五因素三水平安排在正交表L18(37)上,要考察每個因素和其平方對指標y的影響的顯著性.數據見下程序dataQ146;inputnumber$ABCDEy;A2=A*A;B2=B*B;C2=C*C;D2=D*D;E2=E*E;cards;111111943.44212222975.06(…數據部分略);procprint;run;第59頁,共100頁,2023年,2月20日,星期四Solution→Analysis→Analyst(“分析員應用”)→File→OpenBySasName…→

(在Makeoneselection窗口中)work選中數據名Q146→(OK)→Statistics→Regression→Linear…線性回歸在線性回歸主窗口中Dependen填入因變量;Explanatory填入各自變量;(以下為返回式選項窗口,進入該類窗口并進行選擇后→OK返回)→OK→Model選擇篩選變量的方法→逐步回歸stepwiseselection(如果對項的入選采取較寬容的態度可以適當調大α值譬如0.1)→OK;→Statistics選擇Type1sumofsquares→OK→OK請看演示第60頁,共100頁,2023年,2月20日,星期四第61頁,共100頁,2023年,2月20日,星期四總和T,修正項CT,以及各列的波動平方和Si和總波動平方和ST等可以用SAS求得:dataQ143;inputABCEmy;cards;11115.09/*數據前三列為正交表L9(34)前三列*/122220.39133324.56212316.8223123.23231218.94313221.01321315.59332122.34;procprint;run;第62頁,共100頁,2023年,2月20日,星期四運行數據后再利用SAS菜單系統進行方差分析:Solution→Analysis→Analyst→(分析員系統)(出現空白數據表)→File→OpenBySas(在Makeoneselection窗口中)

→work(選中數據名DataQ143)→(OK)→Statistics→ANOVA→LinearModels…→Independent填分類變量A,B,C→Dependent因變量(響應變量)填y→在選項Statistics→

Type1下打勾→OK→OK請看演示第63頁,共100頁,2023年,2月20日,星期四發現因素A不顯著,準備刪去因素A,重新進入菜單系統:Statistics→ANOVA→LinearModels…→Reset后→Independent填分類變量B,C→Dependent因變量(響應變量)填y在選項Statistics→Type1下打勾→OK→OK請看演示第64頁,共100頁,2023年,2月20日,星期四第四節拉丁方設計資料的方差分析

一、拉丁方設計完全隨機設計只涉及到一個處理因素;隨機區組設計涉及一個處理因素和一個區組因素。若實驗涉及一個處理因素和兩個控制因素,而且每個因素的水平數相等,此時可采用拉丁方設計來安排實驗,將兩個控制因素分別安排在拉丁方的行和列上。第65頁,共100頁,2023年,2月20日,星期四4×4ABCDDABCCDABBCDA第66頁,共100頁,2023年,2月20日,星期四拉丁方是由g個拉丁字母排成的g×g方陣,每行或每列中每個字母都只出現一次,這樣的方陣稱為g階拉丁方。拉丁方設計是在隨機區組設計的基礎上發展的,它可多安排一個已知的對實驗結果有影響的非處理因素,提高了效率。應用時,根據水平數g

來選定拉丁方大小。第67頁,共100頁,2023年,2月20日,星期四3×34×45×5ABCCABBCAABCDDABCCDABBCDAABCDEEABCDDEABCCDEABBCDEA第68頁,共100頁,2023年,2月20日,星期四

例9-3研究A、B、C、D四種食品,以及甲、乙、丙、丁四種加工方法對小白鼠增體重的影響。擬用4窩大鼠,每窩4只,每只小白鼠隨機喂養一種食品、隨機采用一種加工方法;8周后觀察大鼠增體重情況。實驗結果如表9-9所示。問:(1)食品種類是否影響大鼠體重增加?(2)食品加工方法是否影響大鼠增體重?(3)不同窩別的大鼠體重增加是否不同?區組號甲乙丙丁180(D)70(B)51(C)48(A)247(A)75(C)78(D)45(B)348(B)80(D)47(A)52(C)446(C)81(A)49(B)77(D)表9-9四種食品及四種加工方法喂養大鼠所增體重(g)第69頁,共100頁,2023年,2月20日,星期四4×4ABCDDABCCDABBCDA第70頁,共100頁,2023年,2月20日,星期四二、變異分解表9-8拉丁方設計資料的方差分析表

表中C為校正數,、、分別為不同處理、行區組、列區組的合計。第71頁,共100頁,2023年,2月20日,星期四三、分析步驟例9-3問:(1)食品種類是否影響大鼠體重增加?(2)食品加工方法是否影響大鼠增體重?(3)不同窩別的大鼠體重增加是否不同?表9-9四種食品及四種加工方法喂養大鼠所增體重(g)第72頁,共100頁,2023年,2月20日,星期四解:

(1)建立檢驗假設,確定檢驗水準H處理0:A=B=C=D

即四種食品對大鼠體重增加相同

H處理1:A,B,C,D不全相等即四種食品對大鼠體重增加不全相同H行0:1=2=3=4

即不同窩別大鼠體重增加相同

H行1:1,2,3,4不全相等即不同窩別大鼠體重增加不全相同H列0:甲=乙=丙=丁

即不同加工方法對大鼠體重增加相同

H列1:甲,乙,丙,丁不全相等即不同加工方法對大鼠體重增加不全相同

=0.05第73頁,共100頁,2023年,2月20日,星期四(2)計算檢驗統計量

=62772-59292.25=3479.75

(2232+2122+2242+3152)-59292.25=1726.25

(2492+2452+2272+2532)-59292.25=98.75(2212+3062+2252+2222)-59292.25=1304.25

=3479.75-1726.25-98.75-1304.25=350.5

第74頁,共100頁,2023年,2月20日,星期四表9-10例9-3方差分析表變異來源

SSV

MSFP處理間1726.253575.4179.85<0.01行區組98.75332.9170.56>0.05列區組1304.253434.7507.44<0.05誤差350.50658.417總3479.7515第75頁,共100頁,2023年,2月20日,星期四(3)確定P值,作出推斷結論①對處理:以處理=3和誤差=6查F界值表,F0.05(3,6)=4.76,F0.01(3,6)=9.78,得P<0.01,按=0.05水準拒絕H0,接受H1,差別有統計學意義,可認為食品種類能影響大鼠增重。②對行區組:以行=3和誤差=6查F界值表,F0.05(3,6)=4.76,F0.01(3,6)=9.78,得P>0.05,按=0.05水準不拒絕H0,差別無統計學意義,尚不能認為不同窩別可影響大鼠增重。③對列區組:以列=3和誤差=6查F界值表,F0.05(3,6)=4.76,F0.01(3,6)=9.78,得P<0.05,按=0.05水準拒絕H0,接受H1,差別有統計學意義,可認為食品加工方法會影響大鼠增重。第76頁,共100頁,2023年,2月20日,星期四拉丁方設計的要求:

①一定是三因素,且三因素水平數相等;②行間、列間、處理間均無交互作用;③各行、列、處理的方差齊。拉丁方設計的優缺點:

優點是可同時研究三個因素,減少實驗次數。從組內變異中不但分離出行區組變異,而且還分離出列區組變異,使誤差變異進一步減小。缺點是要求處理組數與所要控制的兩個因素水平數相等,一般實驗不容易滿足此條件,而且數據缺失會增加統計分析的難度。第77頁,共100頁,2023年,2月20日,星期四第五節多個均數間的兩兩比較

經過方差分析,若拒絕了檢驗假設H0,只能說明多個總體均數不等或不全相等。若要得到各組均數間更詳細的信息,應在方差分析的基礎上進行多個樣本均數的兩兩比較。多重比較常用的方法有:SNK-q檢驗、LSD-t

檢驗和Dunnett-t

檢驗。第78頁,共100頁,2023年,2月20日,星期四一、SNK-q檢驗

SNK(Student-Newman-Keuls)檢驗,亦稱q

檢驗,適用于多個均數兩兩之間的全面比較。檢驗統計量q

的計算公式為:

第79頁,共100頁,2023年,2月20日,星期四例9-4例9-1經

F檢驗結論有統計學意義,試用SNK-q檢驗方法對三組均數進行多重比較。解:

(1)建立假設,確定檢驗水準。

H0

:(對比組總體均數相等);

H1

:(對比組總體均數不等);

第80頁,共100頁,2023年,2月20日,星期四(2)計算檢驗統計量q值。

①計算差值的標準誤:本例nA=nB=6,MS誤差=MS組內=0.269

②將三個樣本均數從小到大排序,并賦予秩次:均數3.8174.2334.733

組別甲組乙組丙組秩次(R)

123

③列表計算檢驗統計量q

值:表9-12例9-1的3個樣本均數兩兩比較的q檢驗

第81頁,共100頁,2023年,2月20日,星期四(3)確定P值,作出推斷結論 以誤差=15及組數

a

q

界值表,并確定

P

值,填入表9-12。

結論:甲組與丙組(“1與3”)比較P<0.05,按=0.05水準拒絕H0,接受H1,有統計學意義,可認為甲組(辦公樓)全肺濕重小于丙組(礦井);其余對比組之間比較均P>0.05,按=0.05水準不拒絕H0。因此,可認為礦井下環境會造成肺功能損害。

第82頁,共100頁,2023年,2月20日,星期四二、Dunnett-t

檢驗

Dunnett–t檢驗適用于多個實驗組與一個對照組均數差別的多重比較。檢驗統計量為:

第83頁,共100頁,2023年,2月20日,星期四

例9-5例9-2中甲組是對照組,研究目的是比較乙營養素和丙營養素是否比甲營養素多增加體重,經F檢驗結論有統計學意義,試用Dunnett-t檢驗方法對三組均數進行多重比較。解:

(1)建立假設,確定檢驗水準。

H0:

(所比較實驗組與對照組總體均數相等)

H1:(所比較實驗組與對照組總體均數不等)

(2)計算檢驗統計量Dunnett-t值。

①本例

nT=nC=6,MS誤差=16.122,則差值的標準誤為

2.318第84頁,共100頁,2023年,2月20日,星期四

②列表計算tD統計量,如表9-13所示。

(3)確定P值,作出推斷結論。

以及處理數T=2查Dunnett-t檢驗界值表,并確定P值,填入表9-13。丙組與甲組比較P<0.05,按=0.05水準拒絕H0,接受H1,有統計學意義,可認為丙營養素比對照組體重增加更多。但乙組與甲組比較P>0.05,沒有統計學意義,按=0.05水準不拒絕H0,尚不能認為乙營養素與對照組增加體重不同。

表9-13例9-2的2個處理組與對照組均數比較的tD檢驗第85頁,共100頁,2023年,2月20日,星期四三、LSD-t

檢驗

LSD-t

檢驗即最小顯著差異t

檢驗,適用于一對或幾對在專業上有特殊意義的樣本均數間的比較。檢驗統計量

t

的計算公式為:

LSD-

第86頁,共100頁,2023年,2月20日,星期四例9-6例9-3中食品種類是否影響大鼠增體重,研究目的只為比較A食品與B食品,C食品與D食品便可;多組間經F檢驗結論有統計學意義,試用LSD-t檢驗方法對這兩對均數進行多重比較。 檢驗步驟為:

(1)建立檢驗假設,確定檢驗水準

H0:A=

B即所研究的兩個對比組的總體均數相等

H1:A≠

B即所研究的兩個對比組的總體均數不等

=0.05

(2)計算檢驗統計量

①本例nA=nB=4,MS誤差=58.417,=誤差=6第87頁,共100頁,2023年,2月20日,星期四

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論