




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
田同試It與統(tǒng)計(jì)公析上Sft賣罰指等-mms強(qiáng)腓進(jìn)行統(tǒng)計(jì)分*河北農(nóng)業(yè)大學(xué)教材科出版2003.7實(shí)驗(yàn)一SAS軟件基本操作實(shí)驗(yàn)二利用SAS軟件描述樣本數(shù)據(jù)實(shí)驗(yàn)三統(tǒng)計(jì)假設(shè)檢驗(yàn)的SAS程序一單個(gè)樣本的f檢驗(yàn)二配對數(shù)據(jù)t檢驗(yàn).成組數(shù)據(jù)/檢驗(yàn)實(shí)驗(yàn)四爐檢驗(yàn)的SAS程序試驗(yàn)五單因素方差分析的SAS程序?qū)嶒?yàn)六常用實(shí)驗(yàn)設(shè)計(jì)方差分析的SAS程序一三因素交叉分組實(shí)驗(yàn)的方差分析二隨機(jī)化完全區(qū)組實(shí)驗(yàn)的方差分析三拉丁方與正交拉丁方實(shí)驗(yàn)的方差分析四兩因素隨機(jī)化區(qū)組實(shí)驗(yàn)的方差分析五裂區(qū)實(shí)驗(yàn)設(shè)計(jì)的方差分析六套設(shè)計(jì)的方差分析實(shí)驗(yàn)七相關(guān)與回歸分析的SAS程序一一元線性回歸分析二一元線性回歸的圖形描述三一元非線性回歸四相關(guān)系數(shù)和偏相關(guān)系數(shù)的計(jì)算實(shí)驗(yàn)二利用SAS軟件描述樣本數(shù)據(jù)用SAS可以對樣本數(shù)據(jù)進(jìn)行全面描述,得出樣本的各種特征數(shù)以及頻數(shù)分布圖。在閱讀以下內(nèi)容之前請先閱讀試驗(yàn)一”SAS軟件基本操作”。一、用MEANS語句描述數(shù)據(jù)例2.1計(jì)算課本上習(xí)題1.2的平均數(shù)和標(biāo)準(zhǔn)差。解在進(jìn)行分析之前,最好先建立一個(gè)外部數(shù)據(jù)文件。如果不建立外部數(shù)據(jù)文件,在作業(yè)流中輸入數(shù)據(jù)也可以。一般來說,在數(shù)據(jù)量比較大,有可能重復(fù)使用時(shí),最好建立一個(gè)數(shù)據(jù)文件。在這里我們創(chuàng)建一個(gè)稱為2-ldata.dat的外部數(shù)據(jù)文件,存儲在A盤中。用MEANS過程描述數(shù)據(jù)的最基本的程序如下:optionslinesize=76;dataabc;infile*a:\2-ldata.dat';inputx;run;procmeans;run;提交SAS運(yùn)行后,所得結(jié)果如下:表2—1:例2.1輸出的結(jié)果TheSASSystemAnalysisVariable:XNMeanStdDevMinimumMaximum25063.27600003.013994155.000000070.0000000打印的結(jié)果中包括:數(shù)據(jù)個(gè)數(shù),平均數(shù),標(biāo)準(zhǔn)差,最小值和最大值。這是MEANS語句在缺省時(shí)得到的基本結(jié)果。若需要對數(shù)據(jù)作更詳細(xì)的描述,則要指明所需的統(tǒng)計(jì)量(關(guān)于統(tǒng)計(jì)量的概念見課本2.2.4)。用MEANS過程所計(jì)算的統(tǒng)計(jì)量,在這里也一并列出。下面還會(huì)反復(fù)提到''變量”這一名詞,關(guān)于變量的概念見課本2.2.1。MEANS過程所計(jì)算的統(tǒng)計(jì)量是用關(guān)鍵詞表示,這些關(guān)鍵詞及其含義如下:N:輸入的觀測值(觀測值的概念見課本2.2.1)個(gè)數(shù)NMISS:每個(gè)變量所含缺失值的個(gè)數(shù)MEAN:變量的平均數(shù)STD:變量的標(biāo)準(zhǔn)差MIN:變量的最小值MAX:變量的最大值RANGE:變量的極差SUM:變量所有值的和VAR:變量的方差USS:每一變量原始數(shù)據(jù)的平方和(未校正平方和)CSS:每一變量的離均差平方和(校正平方和)CV:變異系數(shù)STDERR:每一變量的標(biāo)準(zhǔn)誤差(平均數(shù)的標(biāo)準(zhǔn)差)T:在,o:〃=O時(shí)的f值(見課本5.1.4)PRT:在"o:"=O的假設(shè)下,統(tǒng)計(jì)量,大于f臨界值絕對值的概率(見課本4.1.1)SKEWNESS:偏斜度KURTOSIS:峭度CLM:置信區(qū)間的上限和下限(見課本6.2.1)LCLM:置信區(qū)間的下限UCLM:置信區(qū)間的上限另外,在PROCMEANS語句中還有12個(gè)選項(xiàng),其中幾個(gè)主要選項(xiàng)如下:DATA=(SAS數(shù)據(jù)集):指出SAS數(shù)據(jù)集的名稱,若省略,則使用最近產(chǎn)生的數(shù)據(jù)集MAXDEC=(數(shù)字):指出所輸出的結(jié)果中,小數(shù)部分的最大位數(shù)(0-8),缺省時(shí)為8位FW=(域?qū)挘褐赋龃蛴〉慕Y(jié)果中每個(gè)統(tǒng)計(jì)量的域?qū)挘笔r(shí)為12VARDEF=(DF/N):VARDEF=DF為缺省值,表示計(jì)算方差時(shí),使用n-1作分母,VARDEF=N表示計(jì)算方差時(shí),使用觀測值個(gè)數(shù)n作分母ALPHA=(a值):指出在計(jì)算置信區(qū)間時(shí),選用的顯著水平例2.2計(jì)算課本上習(xí)題1.2的離均差平方和,方差,偏斜度和平均數(shù)的0.95置信區(qū)間。解仍然使用2-ldata.dat外部數(shù)據(jù)文件。MEANS過程如下:optionslinesize=76;dataabc;infile4a:\2-ldata.dat';inputx;run;procmeansdata=abcmaxdec=4fw=8alpha=0.05cssvarskewnesselm;run;運(yùn)行的結(jié)果如下:表2—2:例2.2輸出的結(jié)果TheSASSystemAnalysisVariable:XCSSVarianceSkewnessKurtosisLower95.0%CLMUpper95.0%CLM2261.969.0842-0.1548-0.189462.900663.6514在PROCMEANS語句中,data=abc選項(xiàng)是可以省略的,因?yàn)镻ROCMEANS語句所分析的正是最近的SAS數(shù)據(jù)集,若需從SAS數(shù)據(jù)庫中調(diào)用某一數(shù)據(jù)集時(shí),則DATA選項(xiàng)不可省略。在建立外部數(shù)據(jù)文件時(shí),應(yīng)每個(gè)數(shù)據(jù)占一行,250個(gè)數(shù)據(jù)占250行(只占一列)。這樣輸入數(shù)據(jù)太麻煩,核對起來也不方便。如果想連續(xù)輸入數(shù)據(jù),則應(yīng)在INPUT語句的變量后加上@@,即“inpetx@@>,具體說明見例2.4。在進(jìn)行科學(xué)研究時(shí),需要處理的變量數(shù)目往往很多,而且變量之間還存在一定關(guān)系,經(jīng)常要計(jì)算在某一變量特定水平下,其它變量的一些特征數(shù)。例如,在做人群健康情況調(diào)查時(shí),涉及的變量多達(dá)十幾個(gè)甚至幾十個(gè)。如,性別、年齡、身高、體重、吸煙程度、飲酒程度、視力、聽力、血壓、脈搏、血黏度、膽固醇含量……。如果要計(jì)算不同程度吸煙者或不同性別受檢者的各項(xiàng)指標(biāo)或其中若干項(xiàng)指標(biāo)的某些統(tǒng)計(jì)量,只需加上VAR語句和CLASS語句,便能很容易完成此項(xiàng)工作。VAR語句指明所需描述的變量,CLASS語句可以按觀測值的不同類別分類計(jì)算指定的統(tǒng)計(jì)量。例2.3在做小麥育種時(shí),調(diào)查了雜交后代的若干性狀,選取其中一部分列在下表中(表2—3)。在表2—3中共列舉了四個(gè)變量,即:株高、穗長、穗粒數(shù)和成熟早晚。分別用hop、loe、nog和fas代表上述四個(gè)變量,以成熟的早(e)、中(m)、晚(1)分類,分別計(jì)算株高與穗長的平均數(shù)、標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤差以及穗粒數(shù)的范圍和變異系數(shù)。表2-3608.060m618.050m618.5611617.554e657.5501636.546e627.0481637.545m668.054m617.050e637.048e
678.050668.054707.044628.054658.0551639.056e679.052m647.046e628.056e659.058m688.548e646.544m637.052e628.048e637.0501698.0521637.552m687.046e617.552e657.548e668.0481668.554e708.046e688.048m628.562m658.566m609.064e697.548e668.046e687.542m709.046m697.0421728.052e667.552m708.050m697.5501718.050e676.0381677.548e解先建立一個(gè)稱之為2-2data.dat的外部數(shù)據(jù)文件,外部數(shù)據(jù)文件的格式如表2-3所示。PROCMEANS程序如下:optionslinesize=76;datawheat;infile4a:\2-2data.dat\inputhoploenogfas$;run;procmeansmaxdec=2fw=8maxminmeanstdstderr;varhoploe;classfas;procmeansdata=wheatrangecv;varnog;classfas;run;打印結(jié)果見表2—4。表2—4例2.3輸出的結(jié)果TheSASSystemFASNObsVariableMaximumMinimumMeanStdDevStdErrore23HOP72.0060.0065.093.640.76LOE9.006.507.700.670.14112HOP69.0061.0065.752.700.78LOE8.506.007.540.690.20m15HOP70.0060.0065.203.080.79LOE9.006.508.030.690.18TheSASSystemAnalysisVariable:NOGFASNObsRangeCVe2320.00000009.161237211223.000000011.8202275m1524.000000013.3156456除MEANS過程外,還可以使用SUMMARY過程和UNIVERIATE過程描述數(shù)據(jù)。其中SUMMARY過程與MEANS過程類似,對初學(xué)SAS軟件的讀者來說,能夠使用MEANS過程已經(jīng)夠用了。二頻數(shù)分布表的編制可以利用PROCFREQ過程編制頻數(shù)分布表。例2.4利用PROCFREQ過程,編制課本上例1.1原始數(shù)據(jù)的頻數(shù)分布表。解將120天中每天新生兒體重超過3公斤的人數(shù),建成一個(gè)名為2-3data.dat的外部數(shù)據(jù)文件,存儲在A盤中。編制頻數(shù)分布表的程序如下:optionslinesize=76;datababy;infile4a:\2-3data.dat,;inputnumber@@;run;procfreq;run;INPUT語句中的@@稱為雙尾符,它的作用是在SAS從數(shù)據(jù)文件中讀取數(shù)據(jù)時(shí),讀完一個(gè)數(shù)據(jù)行的第一個(gè)觀測后指針并不移到下一行,而停留在觀測后的第二列,接著讀這一行的第二個(gè)觀測,在指針移過數(shù)據(jù)行末尾時(shí),自動(dòng)為該行解固。因此,在建立數(shù)據(jù)文件時(shí),每一個(gè)數(shù)據(jù)行可以輸入幾個(gè)觀測。如建立2-2data.dat數(shù)據(jù)集時(shí),每一個(gè)數(shù)據(jù)行就不僅是一個(gè)觀測的四個(gè)值,而可以是兒個(gè)觀測,譬如608.060m618.050m618.5611617.554e 657.5501636.546e上述程序輸出的結(jié)果如表2—5:表2—5例2.4輸出的結(jié)果
TheSASSystemCumulativeCumulativeNUMBERFrequencyPercentFrequencyPercent310.810.8421.732.551210.01512.561915.83428.373932.57360.883428.310789.29108.311797.51032.5120100.0可以用同樣的方法編制非數(shù)值型變量的頻數(shù)分布表。例2.5編制表2—3中“成熟早晚”的頻數(shù)表。解datawheat;infile4a:\2-2data.dat5;inputhoploenogmature$;run;procfreq;tablemature;run;所得結(jié)果如下:表2—6例2.5輸出的結(jié)果TheSASSystemCumulativeCumulativeMATUREFrequencyPercentFrequencyPercente2346.02346.011224.03570.0m1530.050100.0對于連續(xù)型數(shù)據(jù),也可以用PROCFREQ過程編制頻數(shù)分布表。例2.6編制課本上表1?2高粱三尺三株高的頻數(shù)分布表。解先建立一個(gè)名為a:\2-4data.dat的外部數(shù)據(jù)文件。SAS程序如下:procformat;valuehfmt141/43:'141/43'144-146:'144-146'147/49='147-149'150-152=*150-152*153-155=153-155'156-158=,156-158,159/61:'159-161'162-164=,162-164,165-167=,165-167,168-170=168-170^run;datasorghum;infile*a:\2-4data.dat5;inputhight@@;run;procfreq;tablehight;formathighthfmt.;run;這里使用PROCFORMAT過程的目的是將數(shù)據(jù)按使用者的要求格式化。VALUE語句中要給出被定義的輸出格式名,在這里稱為hfmt。若以組界分組,還需加上“〈”或號,如143.5-<146.5="44-146,等,在PROCFREQ過程的FORMAT語句中一定要在hfmt之后加上一個(gè)輸出結(jié)果如下:表2—7例2.6輸出的結(jié)果TheSASSystemCumulativeCumulativeHIGHTFrequencyPercentFrequencyPercent141-14311.011.0144-14622.033.0147-14944.0770202004343071710868609696.0165-16733.09999.0168-17011.0100100.0三頻數(shù)分布圖的繪制繪制離散型數(shù)據(jù)的柱狀圖,可以用GCHART過程。以課本上例1.1的數(shù)據(jù)為例,程序如下:datababy;infile*a:\2-3data.dat\inputnumber@@;run;procgchart;vbarnumber;run;如果需要水平條狀圖,只需將vbar改為hbar即可。執(zhí)行上述程序的結(jié)果如下圖:圖2—1離散型數(shù)據(jù)的柱形圖用CAPABILITY過程繪制連續(xù)型數(shù)據(jù)的頻率直方圖是很方便的。最簡單的程序如F:datasorghum;infile'a:\2?4data.dat';inputhight@@;run;proccapabilitygraphicsnoprint;varhight;histogram;run;上述的GRAPHICS和NOPRINT的含義分別是,打出高分辨率的圖象和不打出概括性統(tǒng)計(jì)量表。執(zhí)行上述程序的結(jié)果如下:圖2—2頻率直方圖直方圖的組距是程序自動(dòng)選定的,組距的大小可以通過改變中值來調(diào)整。若組距定為3厘米,可以加進(jìn)選項(xiàng)“midpoint=142to169by3”。圖2—2是頻率直方圖,若要得到頻數(shù)直方圖,還需加入選項(xiàng)“vscale=count"。PROCCAPABILITY過程為:proccapabilitygraphicsnoprint;varhight;histogram/midpoint=142to169by3vscale=count;run;所得直方圖如圖2—3所示。圖2—3改變中值后所繪出的頻數(shù)直方圖實(shí)驗(yàn)三統(tǒng)計(jì)假設(shè)檢驗(yàn)的SAS程序一、單個(gè)樣本的,檢驗(yàn)對于課本5.1.4所介紹的單個(gè)樣本,檢驗(yàn),可以使用PROCMEANS過程計(jì)算。PROCMEANS過程在2.1.1中已經(jīng)做過介紹。這里只以課本中例5.5的數(shù)據(jù)為例,說明如何使用PROCMEANS過程進(jìn)行檢驗(yàn)。在這里數(shù)據(jù)采用在作業(yè)流中輸入,因此不必建立外部數(shù)據(jù)文件。optionslinesize=76;datamaize;inputweight@@;diff=weight-300;cards;308308305311298315300321294320procmeansntprt;vardiff;run;在PROCMEANS語句中的t是在Ho-,n=O假設(shè)下所得到的統(tǒng)計(jì)量,在這里"。:〃=300,因此在INPUT語句后,用賦值語句建立一個(gè)新變量diff,diff是每一觀測值與300之差,檢驗(yàn)這個(gè)差值的期望是否為0,輸出結(jié)果如下:表3-1單個(gè)樣本,檢驗(yàn)的輸出結(jié)果TheSASSystemAnalysisVariable:DIFFNTProb>ITI92.49540120.0372二配對數(shù)據(jù)t檢驗(yàn)配對數(shù)據(jù)t檢驗(yàn)的SAS程序與上述的程序基本相同,不同點(diǎn)只是在INPUT語句中包含三個(gè)變量,在賦值語句中的新變量是兩個(gè)變量的差而不是變量與一個(gè)常量的差。以課本中表5—3的數(shù)據(jù)為例,SAS程序如下:optionslinesize=76;datamatdat;inputidprepropostpro@@;difl^prepro-postpro;cards;procmeansnmeanstderrtprt;vardiff;run;
輸出結(jié)果見表輸出結(jié)果見表3-2表3?2配對數(shù)據(jù)f檢驗(yàn)的輸出結(jié)果18.4787.99427.5127.14137.2228.26748.0538.28057.6896.74068.5287.63276.9725.91387.3718.16995.7607.570107.9307.569117.2556.322126.7956.417TheSASSystemAnalysisVariable:DIFFNMeanStdErrorTProb>ITI120.12925000.26395130.48967360.6340三成組數(shù)據(jù)f檢驗(yàn)可以使用PROCTTEST過程做成組數(shù)據(jù)t檢驗(yàn)。以課本中例5.9的數(shù)據(jù)為例,說明成組數(shù)據(jù)t檢驗(yàn)的SAS程序。optionslinesize=76;datawheat;inputstraindays@@;cards;procttest;classstrain;vardays;nan;上述的CLASS語句稱為分類語句,在,檢驗(yàn)中的分類變量(品種),應(yīng)在CLASS語句中給予說明,以便PROCTTEST過程按不同類別(品種)進(jìn)行檢驗(yàn)。輸出結(jié)果見表3?3。1 10111001 991 10111001 991991 9811001 981 991 991 9921002 9821002 99表3-32 982 992 982 982 9921表3-3成組數(shù)據(jù),檢驗(yàn)的輸出結(jié)果TheSASSystemTTESTPROCEDUREVariable:DAYSSTRAINNMeanStdDevStdError11099.200000000.918936580.2905932621098.900000000.875595040.27688746VariancesTDFProb>ITIUnequal0.747418.00.4645Equal0.747418.00.4645ForHO:Variancesareequal,F*=1.10 DF=(9⑼ Prob>F'=0.887表3-3中給出了方差齊性檢驗(yàn)和/檢驗(yàn)結(jié)果以及方差不具齊性時(shí),用Satterthwaite方法計(jì)算的近似,統(tǒng)計(jì)量的自由度。從表的最后一行得知,方差具齊性,因此只選用Equal行的結(jié)果即可。Prob>ITI的含義是變量T大于統(tǒng)計(jì)量,的概率,P(T>t).(參考課本“小概率原理”一節(jié))。不論是單側(cè)檢驗(yàn)還是雙側(cè)檢驗(yàn),該概率值都是一樣的。做單側(cè)檢驗(yàn)時(shí)尸<0.05差異顯著,在做雙側(cè)檢驗(yàn)時(shí)尸<0.025時(shí)差異顯著。實(shí)驗(yàn)四一檢驗(yàn)的SAS程序使用PROCFREQ過程(實(shí)驗(yàn)二已介紹)進(jìn)行x2檢驗(yàn),首先應(yīng)使用TABLE語句生成一個(gè)兩向表。在TABLE語句的“/”后,可供使用的選項(xiàng)共有24個(gè),其中的幾個(gè)基本選項(xiàng)如下:CHISQ:x2檢驗(yàn)及2x2列聯(lián)表的Fisher精確檢驗(yàn)。EXACT:對大于2x2列聯(lián)表進(jìn)行Fisher精確檢驗(yàn)。ALPHA=(p):設(shè)置置信區(qū)間時(shí)使用的顯著水平,缺省時(shí)a=0.05。MISSIN:要求FREQ把缺失值當(dāng)做非缺失值看待,在計(jì)算百分?jǐn)?shù)或其它統(tǒng)計(jì)量時(shí)包括它們。例4.1以課本中例7.3的數(shù)據(jù)為例,說明M檢驗(yàn)的SAS程序。解記符號“。”為口服,“i”為注射,“e”為有效,“n”為無效。optionslinesize=76;datamedicine;inputway$effect$;cards;oeonieinprocfreqfbrmchar(l,2,7)='l-+';tableway*effect/chisq;run;在TABLE語句中way"effect將形成一個(gè)兩向表,第一個(gè)變量形成表的行,第二個(gè)變量形成表的列。在PROCFREQ語句中的選項(xiàng)formchar(1,2,7),是輸出表格線的形狀。輸出結(jié)果如下。表4?1例4.1輸出的結(jié)果TheSASSystemTABLEOFWAYBYEFFECTWAY EFFECT
59.1840.8247.5456.34i643133.1616.0667.3732.6352.4643.66Total1227163.2136.799549.22193100.00STATISTICSFORTABLEOFWAYBYEFFECTStatisticDFValueProbChi-Square11.3900.238LikelihoodRatioChi-Square11.3920.238ContinuityAdj.Chi-Square11.0600.303Mantel-HaenszelChi-Square11.3820.240FishefsExactTest(Left)0.908(Right)0.152(2-Tail)0.296PhiCoefficient0.0850ContingencyCoefficient0.0850Cramer'sV0.0850SampleSize=193表4-1給出X?值,連續(xù)性矯正值和精確檢驗(yàn)一值。該例如果使用以下程序,在數(shù)據(jù)步中數(shù)據(jù)的輸入變得很簡單了。optionslinesize=76;data;doway=lto2;doeffect=lto2;inputcase@@;output;end;end;cards;58406431procfreqformchar(l,2,7)='l-+*;weightcase;tablesway*effect;run;在數(shù)據(jù)步中使用了一個(gè)DO語句,這是一個(gè)循環(huán)語句。"way=lto2”表示“方式”有兩個(gè)水平,"effect=lto2"表示“效果”有兩個(gè)水平,如果實(shí)驗(yàn)是一個(gè)高階的列聯(lián)表,那么TO后面的數(shù)字也應(yīng)做相應(yīng)的改變。在程序步中的WEIGHT語句是一個(gè)權(quán)數(shù)語句,它的值是這些觀測相應(yīng)的權(quán)數(shù)。輸出的結(jié)果如下,因?yàn)樵赥ABLE語句中沒有規(guī)定統(tǒng)計(jì)分析選項(xiàng),所以只輸出列聯(lián)表:TheSASSystemTABLEOFWAYBYEFFECTWAY EFFECTFrequenyPercentRowPctColPct12Total158409830.0520.7350.7859.1840.8247.5456.34264319533.1616.0649.2267.3732.6352.4643.66Total1227119363.2136.79100.00比較前面的兩個(gè)列聯(lián)表,只是表的形式有些不同,其它結(jié)果沒有任何變化。在輸出的列聯(lián)表中還有一些選項(xiàng)可供使用,如:EXPECTED:住獨(dú)立性假設(shè)下,要求輸出單元頻數(shù)的期望值。NOCOL:不輸出交叉表里的單元列百分?jǐn)?shù)。NOROW:不輸出交叉表里的單元行百分?jǐn)?shù)。CELLCHI2:要求該過程輸出每個(gè)單元對總x2統(tǒng)計(jì)量的貢獻(xiàn)。NOPERCENT:不輸出交叉表的單元百分?jǐn)?shù)和累計(jì)百分?jǐn)?shù)。如果在TABLE語句中加入上述選項(xiàng),輸出的結(jié)果更接近教材中列聯(lián)表的格式。optionslinesize=76;data;doway=lto2;doeffect=lto2;inputcase@@;output;end;end;cards;64315840procfreqformchar(1,2,7)='l-+';weightcase;tablesway*effect/ce!lch2expectednocolnorownopercent;run;輸出結(jié)果如下表:TheSASSystemTABLEOFWAYBYEFFECTWAY EFFECT0.25960.446Total12271例4.2計(jì)算課本中例7.5的精確產(chǎn)。解記4飼料為1,B飼料為2;未增重為1,增重為2。SAS程序如下:optionslinesize=76;datamouse;inputfeedweight@@;cards;111111111222 22222222222procfreqformchar(1,2,7)=,l-+,;tablefeed*weight/chisqmissing;run;輸出結(jié)果如下:表4?2例4.2輸出的結(jié)果TheSASSystemTABLEOFFEEDBYWEIGHTFEEDWEIGHTFrequenyPercentRowPctColPct12Total141536.369.0945.4580.0020.00100.0014.2920660.0054.5554.550.00100.000.0085.71Total4711
36.3663.64STATISTICSFORTABLEOFFEEDBYWEIGHTStatisticDFValueProbChi-Square17.5430.006LikelihoodRatioChi-Square19.4170.002ContinuityAdj.Chi-Square14.4820.034Mantel-HaenszelChi-Square16.8570.009Fisher'sExactTest(Left)1.000(Right)0.015(2-Tail)0.015PhiCoefficient0.8280ContingencyCoefficient0.6380Cramer'sV0.8280SampleSize=11WARNING:100%ofthecellshaveexpectedcountslessthan5.Chi-Squaremaynotbeavalidtest.精確/值為0.015,與課本上例7.5的結(jié)果一致。實(shí)驗(yàn)五單因素方差分析的SAS程序單因素實(shí)驗(yàn)設(shè)計(jì)又稱為完全隨機(jī)化實(shí)驗(yàn)設(shè)計(jì)。該實(shí)驗(yàn)設(shè)計(jì)要求實(shí)驗(yàn)條件或?qū)嶒?yàn)環(huán)境的同質(zhì)性很高。例如,比較°個(gè)作物品種的產(chǎn)量,每一品種設(shè)置〃個(gè)重復(fù),全部實(shí)驗(yàn)共有a〃次。根據(jù)完全隨機(jī)化實(shí)驗(yàn)設(shè)計(jì)的要求,試驗(yàn)田中的an個(gè)試驗(yàn)小區(qū)的土質(zhì)、肥力、含水量、小氣候、田間管理等條件必須完全一致。至于哪一個(gè)品種的哪一次重夏安排在哪一個(gè)小區(qū),完全是隨機(jī)的,因此得到了“完全隨機(jī)化實(shí)驗(yàn)設(shè)計(jì)”這一名稱。例5.1下面以課本中例8」的數(shù)據(jù)為例,給出單因素方差分析的SAS程序。解:先按以下輸入方式建立一個(gè)稱為a:\2-5data.dat的外部數(shù)據(jù)文件。1 64.6 1 65.3 1 64.8 1 66.0 1 65.8 2 64.5 2 65.3 2 64.62 63.72 63.72 63.9 3 67.8 3 66.3 3 67.1 3 66.8 3 68.54 71.872.1 4 70.0 4 69.1 4 71.0 5 69.2 5 68.2 5 69.8 5 68.367.5SAS程序如卜:optionslinesize=76;datawheat;infile*a:\2-5data.dat,;inputstrainhight@@;run;procanova;classstrain;modelhight=strain;meansstrain/duncan;meansstrain/Isdcldiff;run;在PROCANOVA過程中的CLASS語句(分類語句)是必須的,而且一定要放在MODEL語句之前。在方差分析中要使用的分類變量(因素),首先要在CLASS語句中說明。分類變量可以是數(shù)值型的,也可以是字符型的。MODEL語句用來規(guī)定因素對實(shí)驗(yàn)結(jié)果的效應(yīng),一般形式為,因變量=因素效應(yīng)。本例即為株高=品系效應(yīng)。MEANS語句應(yīng)放在MODEL語句之后,MEANS語句后列出希望得到均值的那些變量。MEANS語句有很多選項(xiàng),下面列出幾個(gè)與本教材有關(guān)的選項(xiàng),將選項(xiàng)寫在MEANS語句的“/”之后。DUNCAN:對MEANS語句列出的所有主效應(yīng)均值進(jìn)行DUNCAN檢驗(yàn)。SNK:對MEANS語句列出的所有主效應(yīng)均值進(jìn)行Student-Newman-Keuls檢驗(yàn)。TILSD:對MEANS語句列出的所有主效應(yīng)均值進(jìn)行兩兩t檢驗(yàn),它相當(dāng)于在樣本含 量相同時(shí)的LSD檢驗(yàn)。ALPHA=均值間對比檢驗(yàn)的顯著水平,缺省值是0.05。當(dāng)用DUNCAN選項(xiàng)時(shí)只能取0.01、0.05和0.10,對于其它選項(xiàng),a可取0.0001到0.9999之間的任何值。CLDIFF:在選項(xiàng)T和LSD時(shí),過程將兩個(gè)均值之差以置信區(qū)間的形式輸出。CLM:在選項(xiàng)T和LSD時(shí),過程把變量的每一水平均值以置信區(qū)間的形式輸出。執(zhí)行上述程序,輸出結(jié)果見表5-1。表5-1:例5.1方差分析輸出結(jié)果TheSASSystemAnalysisofVarianceProcedureClassLevelInformationClassLevelsValuesSTRAIN512345
Numberofobservationsindataset=25TheSASSystemAnalysisofVarianceProcedureDependentVariable:HIGHTSumofMeanSourceDFSquaresSquareFValuePr>FModel4131.74000032.93500042.280.0001Error2015.5800000.779000CorrectedTotal24147.320000HIGHTR-SquareC.V.RootMSEMean0.894244 1.311846 0.88261 67.2800SourceDFAnovaSSMeanSquareFValuePr>FSTRAIN4131.74000032.93500042.280.0001TheSASSystemAnalysisofVarianceProcedureDuncan*sMultipleRangeTestforvariable:HIGHTNOTE:ThistestcontrolsthetypeIcomparisonwiseerrorrate,nottheexperimentwiseerrorrateAlpha=0.05df=20MSE=0.779NumberofMeans2345CriticalRange1.1641.2221.2591.285Meanswiththesameletterarenotsignificantlydifferent.DuncanGroupingMeanNSTRAIN
DuncanGroupingMeanNSTRAINA70.800054B68.600055C67.300053D65.300051D64.400052TheSASSystemAnalysisofVarianceProcedureTtests(LSD)forvariable:HIGHTNOTE:ThistestcontrolsthetypeIcomparisonwiseerrorratenottheexperimentwiseerrorrate.Alpha=0.05Confidence=0.95df=20MSE=0.779CriticalValueofT=2.08596LeastSignificantDifference=1.1644Comparisonssignificantatthe0.05levelareindicatedby'***'.LowerSTRAINComparisonDifferenceConfidenceLimitUpperBetweenMeansConfidenceLimit4-51.03562.20003.3644***4-32.33563.50004.6644***4-14.33565.50006.6644***4-25.23566.40007.5644***5-4-3.3644-2.2000-1.0356***530.13561.30002.4644***5-12.13563.30004.4644***523.03564.20005.3644***34-4.6644-3.5000-2.3356***3-5-2.4644-1.3000-0.1356***310.83562.00003.1644***3-21.73562.90004.0644***1-4-6.6644-5.5000-4.3356***1-5-4.4644-3.3000-2.1356***13-3.1644-2.0000-0.8356***1-2-0.26440.90002.06442-4-7.5644-6.4000-5.2356***25-5.3644-4.2000-3.0356***2-3-4.0644-2.9000-1.7356***2-1-2.0644-0.90000.2644表中的各項(xiàng)內(nèi)容都是很明確的,這里不再贅述。只有R?以前沒有見過,請參閱課本11.2.1。方差分析應(yīng)具備三個(gè)條件,有時(shí)這三個(gè)條件并不能夠得到滿足,這時(shí)對原始數(shù)據(jù)就要進(jìn)行變換,見課本§9.7。對原始數(shù)據(jù)進(jìn)行變換,只需加上一個(gè)賦值語句即可,可參考配對數(shù)據(jù),檢驗(yàn)的SAS程序。實(shí)驗(yàn)六常用實(shí)驗(yàn)設(shè)計(jì)方差分析的SAS程序在這本教材中我們只介紹了完全隨機(jī)化實(shí)驗(yàn)設(shè)計(jì)和交叉分組實(shí)驗(yàn)設(shè)計(jì)的方差分析。除這兩種實(shí)驗(yàn)設(shè)計(jì)外,還有很多實(shí)驗(yàn)設(shè)計(jì)需要用方差分析的方法處理數(shù)據(jù)。如隨機(jī)化完全區(qū)組設(shè)計(jì)、拉丁方設(shè)計(jì)、裂區(qū)設(shè)計(jì)、套設(shè)計(jì)、正交設(shè)計(jì)等。這些實(shí)驗(yàn)設(shè)計(jì)方法在很多教材中都可以找到,限于篇幅在這里就不做更多的介紹了,只給出線性統(tǒng)計(jì)模型、均方期望和檢驗(yàn)統(tǒng)計(jì)量。完全隨機(jī)化實(shí)驗(yàn)設(shè)計(jì)的SAS程序在實(shí)驗(yàn)四中已經(jīng)做過介紹,這一節(jié)將給出其它一些實(shí)驗(yàn)設(shè)計(jì)方差分析的SAS程序。在閱讀以下內(nèi)容之前,請先閱讀試驗(yàn)一“SAS軟件基本操作”。一三因素交叉分組實(shí)驗(yàn)的方差分析在課本953中已經(jīng)給出了一個(gè)混合模型(A、C固定,8隨機(jī))三因素交叉分組實(shí)驗(yàn)設(shè)計(jì)的均方期望及檢驗(yàn)統(tǒng)計(jì)量。下面以一個(gè)一般化的三因素交叉分組實(shí)驗(yàn)為例說明方差分析的SAS程序。例6.1由A、B、C三個(gè)因素構(gòu)成一個(gè)三因素交叉分組實(shí)驗(yàn),其中4、C固定,8隨機(jī)。4因素有三個(gè)水平,記為A1-A3;8因素有四個(gè)水平,記為B1-B4;C因素有五個(gè)水平,記為Cl-C5,實(shí)驗(yàn)重復(fù)兩次。記錄了和R2兩個(gè)因變量(即實(shí)驗(yàn)結(jié)果,如作物的株高、穗長,人的血壓、血黏度等),原始數(shù)據(jù)不再給出。按每一觀測的A、B、C,RI、R2的順序建立外部數(shù)據(jù)文件,路徑和文件名為a:\2-6datadat。11118.024.11 1219.624.71 1 317.5 24.71 1417.925.811519.125.21 2123.433.41 2 223.0 33.21 2323.932.912423.234.31 2527.035.01 3 124.5 29.61 3223.730.813323.531.71 3421.232.21 3 525.7 31.91 4119.427.64217.327.814318.128.014418.828.714518.828.421118.828.721219.628.621318.629.821418.230.11520.831.022124.238.222224.437.922325.338.322424.038.622527.333.723125.935.123223.634.423323.836.123421.135.923526.436.424118.934.224221.931.924323.532.324420.033.024520.433.311 19.231.2312 19.630.631319.2 32.5 3 1418.933.115 20.032.3321 22.638.732223.4 39.4 3 2325.541.0324 24.241.2325 28.342.433125.3 36.3 3 3223.937.23 23.836.933421.238.433525.4 37.4 3 4117.230.934217.932.034320.831.834418.233.134516.431.511 118.324.4 112 19.224.211318.4 25.5 1 1418.126.311 519.225.3 121 23.333.212223.0 32.9 1 2325.134.212 424.635.6 125 26.034.013124.5 29.5 1 3223.130.013 323.031.1 134 20.331.313525.5 31.4 1 4119.627.414 219.825.9 143 22.227.314419.5 28.5 1 4519.628.121 118.028.0 212 19.628.421319.3 30.6 2 1418.030.021520.130.322124.038.822223.837.422324.236.922424.238.922527.837.023125.634.723223.434.023323.735.723420.635.323526.135.924120.432.324224.634.624323.932.824421.134.124520.033.0311 18.330.131219.831.031317.6 30.6 3 1417.931.9315 20.832.832123.439.832223.4 39.4 3 2326.541.7324 24.441.632527.141.333125.6 36.6 3 3223.537.0333 23.737.933421.438.433525.5 37.5 34117.531.534219.531.634321.732.434418.433.434516.531.5解:SAS程序如下:optionslinesize=76;dataexample;infile4a:\2-6data.dat,;inputabcrlr2@@;run;procanova;classabc;modelrlr2=abca*ba*cb*ca*b*c;testh=ae=a*b;testh=ce=b*c;testh=a*ce=a*b*c;meansa/duncane=a*balpha=0.01;meansc/Isde=b*calpha=0.01;run;
與單因素方差分析的SAS程序相比,大同小異。在這里由于因素由1個(gè)變?yōu)?個(gè),因此分類變量相應(yīng)變?yōu)?個(gè)。在MODEL語句中rlr2=abca*ba*cb*ca*b*c;的含義是,需要分析a、b、c三個(gè)主效應(yīng),兩兩交互作用及三重交互作用對因變量rl和r2的貢獻(xiàn)。實(shí)際上,這里是兩次方差分析,得到兩個(gè)方差分析表,一個(gè)是對rl進(jìn)行的方差分析,一個(gè)是對r2進(jìn)行的方差分析。當(dāng)然也可以只計(jì)算其中的一部分,如rlr2=abcb*c或r2=abca*ba*b*c等。TEST語句中h=ae=a*b的含義是用AxB交互作用檢驗(yàn)A[因素效應(yīng),即FA=MSA/MSAB,另外兩個(gè)TEST語句含義為&=MSc/MSbc,F(xiàn)ac=MSac/MSabc.在沒有特別說明時(shí),因素的效應(yīng)都是用MSe檢驗(yàn)的(見課本9.5.3)。當(dāng)然,隨著模型的改變,檢驗(yàn)統(tǒng)計(jì)量會(huì)相應(yīng)改變,這里的TEST語句也要改變。MEANS語句中選項(xiàng)e=a*b是指明在做DUNCAN檢驗(yàn)時(shí),應(yīng)使用A/品作為誤差均方檢驗(yàn)因素A的效應(yīng),否則將使用MSe做檢驗(yàn)。實(shí)驗(yàn)結(jié)果中,若有缺失數(shù)據(jù),缺失的數(shù)據(jù)在方差分析中將被忽略掉,因此實(shí)驗(yàn)結(jié)果中的數(shù)據(jù)應(yīng)完整。執(zhí)行上述程序,輸出的結(jié)果見表6-1。表64例6.1方差分析輸出的結(jié)果TheSASSystemAnalysisofVarianceProcedureClassLevelInformationClassLevelsValuesA3123B41234C512345Numberofobservationsindataset=120TheSASSystemAnalysisofVarianceProcedureDependentVariable:RlSumofMeanDependentVariable:RlSumofMeanSourceDFSquaresSquareFValuePr>FModel591028.7162517.4358735.880.0001Error6029.155000.48592CorretedTotal1191057.87125R-SquareC.V.RootMSERIMean0.972440 3.199437 0.69708 21.7875SourceDFAnovaSSMeanSquareFValuePr>FA221.60800010.80400022.230.0001B3748.776917249.592306513.650.0001C468.00666717.00166734.990.0001A*B634.5113335.75188911.840.0001A*C86.0353330.7544171.550.1586B*C12129.35266710.77938922.180.0001A*B*C2420.4253330.8510561.750.0412TestsofHypothesesusingtheAnovaMSforA*BasanerrortermSourceADF2AnovaSS21.6080000MeanSquare10.8040000FValue1.88Pr>F0.2326TestsofHypothesesusingtheAnovaMSforB*CasanerrortermSourceDFAnovaSSMeanSquareFValuePr>FC468.006666717.00166671.580.2432TestsofHypothesesusingtheAnovaMSforA*B*CasanerrortermSourceDFAnovaSSMeanSquareFValuePr>FA*C86.035333330.754416670.890.5421TheSASSystemAnalysisofVarianceProcedureDependentVariable:R2SumofMeanDependentVariable:R2SumofMeanSourceDFSquaresSquareFValuePr>FModel592224.5296737.7038985.850.0001Error6026.350000.43917CorrectedTotal1192250.87967R-SquareC.V. RootMSE R2Mean0.988293 2.014173 0.66270 32.9017SourceDFAnovaSSMeanSquareFValuePr>FA2779.20117389.60058887.140.0001B31314.66700438.22233997.850.0001C438.033009.5082521.650.0001A*B653.473508.9122520.290.0001A*C85.840500.730061.660.1266B*C127.513000.626081.430.1798A*B*C2425.801501.075062.450.0027TestsofHypothesesusingtheAnovaMSforA*BasanerrortermSourceADF2AnovaSS779.201167MeanSquare389.600583FValue43.72Pr>F0.0003TestsofHypothesesusingtheAnovaMSforB*CasanerrortermSourceDFAnovaSSMeanSquareFValuePr>FC438.03300009.508250015.190.0001TestsofHypothesesusingtheAnovaMSforA*B*CasanerrortermSourceDFAnovaSSMeanSquareFValuePr>FA*C85.840500000.730062500.680.7052TheSASSystemAnalysisofVarianceProcedureDuncan'sMultipleRangeTestforvariable:R1NOTE:ThistestcontrolsthetypeIcomparisonwiseerrorrate,nottheexperimentwiseerrorrateAlpha=0.01df=6MSE=5.751889NumberofMeans2 3CriticalRange 1.988 2.063Meanswiththesameletterarenotsignificantlydifferent.DuncanGroupingMeanNAA22.3775402AA21.5875403AA21.3975401TheSASSystemAnalysisofVarianceProcedureDuncan'sMultipleRangeTestforvariable:R2NOTE:ThistestcontrolsthetypeIcomparisonwiseerrorrate,nottheexperimentwiseerrorrateAlpha=0.01df=6MSE=8.91225TOC\o"1-5"\h\zNumberofMeans2 3CriticalRange 2.475 2.567Meanswiththesameletterarenotsignificantlydifferent.DuncanGrouping MeanNAA 35.3975 40 333.905040 2B 29.4025 40 1TheSASSystemAnalysisofVarianceProcedureTtests(LSD)forvariable:RINOTE:ThistestcontrolsthetypeIcomparisonwiseerrorratenottheexperimentwiseerrorrate.Alpha=0.01df=12MSE=10.77939CriticalValueofT=3.05LeastSignificantDifference=2.895Meanswiththesameletterarenotsignificantlydifferent.TGroupingMeanNCA22.9083245AA22.2000243AA21.6917242AA21.4958241AA20.6417244TheSASSystemAnalysisofVarianceProcedure
Ttests(LSD)forvariable:R2NOTE:ThistestcontrolsthetypeIcomparisonwiseerrorratenottheexperimentwiseerrorrate.Alpha=0.01df=12MSE=0.626083CriticalValueofT=3.05LeastSignificantDifference=0.6977Meanswiththesameletterarenotsignificantlydifferent.TGrouping MeanNCA33.7375244AB A33.1917245BB33.0292243C32.2875242Cc32.2625241兩因素交叉分組實(shí)驗(yàn)的SAS程序比三因素交叉分組實(shí)驗(yàn)的SAS程序更簡單,在這里不再舉例了。二隨機(jī)化完全區(qū)組實(shí)驗(yàn)的方差分析完全隨機(jī)化實(shí)驗(yàn)設(shè)計(jì)要求實(shí)驗(yàn)條件或?qū)嶒?yàn)材料必須具同質(zhì)性,否則,由于實(shí)驗(yàn)誤差過大,有可能掩蓋處理間真正存在的差異。對于一些處理較多的實(shí)驗(yàn),同質(zhì)性這一要求有時(shí)很難滿足。為了保證結(jié)果的可靠性,于是把全部實(shí)驗(yàn)分成若干區(qū)組,每一區(qū)組內(nèi)必須保證實(shí)驗(yàn)條件或?qū)嶒?yàn)材料的同質(zhì)性,而且必須包含一次全部處理。將完全隨機(jī)化實(shí)驗(yàn)的〃次重復(fù)變成n個(gè)區(qū)組。由于設(shè)置了區(qū)組,從完全隨機(jī)化實(shí)驗(yàn)的誤差平方和中分離出區(qū)組平方和,從而提高了實(shí)驗(yàn)結(jié)果的可靠性,這樣的實(shí)驗(yàn)設(shè)計(jì)稱為隨機(jī)化完全區(qū)組設(shè)計(jì)(randomizedcompleteblockdesign)o隨機(jī)化完全區(qū)組設(shè)計(jì)仍屬于單因素實(shí)驗(yàn)設(shè)計(jì)。設(shè)計(jì)區(qū)組的F1的,是為了從完全隨機(jī)化實(shí)驗(yàn)設(shè)計(jì)的誤差平方和中分離出因區(qū)組(非同質(zhì)性)所產(chǎn)生的平方和。其結(jié)果,降低了誤差平方和,提高了對處理效應(yīng)的檢驗(yàn)效率。隨機(jī)化完全區(qū)組實(shí)驗(yàn)設(shè)計(jì)的線性統(tǒng)計(jì)模型為:由于隨機(jī)化完全區(qū)組設(shè)計(jì)中,處理間的隨機(jī)化只能在區(qū)組內(nèi)進(jìn)行,而不能在全部ab次實(shí)驗(yàn)間進(jìn)行,方差分析只能檢驗(yàn)處理效應(yīng),而不能檢驗(yàn)區(qū)組效應(yīng)。因此,統(tǒng)計(jì)假設(shè)為:至少有一個(gè)處理一般都屬固定型:而區(qū)組則有固定型與隨機(jī)型之分,當(dāng)區(qū)組為固定型時(shí)當(dāng)區(qū)組為隨機(jī)型時(shí)由課本9.5.2和9.5.3可以導(dǎo)出各均方期望及檢驗(yàn)統(tǒng)計(jì)量。當(dāng)處理為固定型,區(qū)組為隨機(jī)型時(shí),結(jié)果如下:FRRFRR因素abn 均方期望abn均方期望iJkiJk0an0an心b1nb1n(叫11n111£(小1!1上表中的女代表區(qū)組內(nèi)的重復(fù),因火=1,這時(shí)o2無法估計(jì)(因誤差自由度聯(lián)=0),在假設(shè)區(qū)組與主效應(yīng)間不存在交互作用時(shí),則可得出檢驗(yàn)各效應(yīng)的統(tǒng)計(jì)量。FA=MSA/MSe對于MS/的檢驗(yàn)應(yīng)十分慎重。前面已經(jīng)講過,由于分階段隨機(jī)化,對區(qū)組檢驗(yàn)缺乏充分的統(tǒng)計(jì)學(xué)依據(jù)。當(dāng)然,也可以計(jì)算出一個(gè)Fm紈,這個(gè)值只能提供一個(gè)區(qū)組間是否存在差異的信息,作為以后設(shè)計(jì)類似實(shí)驗(yàn)時(shí)是否設(shè)計(jì)區(qū)組的參考。隨機(jī)化完全區(qū)組實(shí)驗(yàn)方差分析的SAS程序,類似于兩因素交叉分組實(shí)驗(yàn)的SAS程序。例6.2一個(gè)采用隨機(jī)化完全區(qū)組設(shè)計(jì)的品種比較試驗(yàn),有五個(gè)品種參加產(chǎn)量評比,試驗(yàn)共設(shè)計(jì)了三個(gè)區(qū)組,結(jié)果如CARDS語句所示。
解:方差分析的SAS程序如卜:optionslinesize=76;datawheat;inputblockvarietyyield@@;cards;1 1 18 1 1 18 1 22 1 23 2 23 1 22 3 23613023033 31 1 43 34 2 43 34 3 421 1 5 3018 2 5 3018 3 5 42procanova;classblockvariety;modelyield=varietyblock;meansvariety/duncan;run;輸出結(jié)果見表6-2o表6-2 品種比較試驗(yàn)方差分析的結(jié)果TheSASSystemAnalysisofVarianceProcedure
ClassLevelInformationClassLevelsValuesBLOCK3123VARIETY512345Numberofobservationsindataset=15TheSASSystemAnalysisofVarianceProcedureDependentVariable:YIELDDependentVariable:YIELDSumofMeanSourceDFSquaresSquareFValuePr>FModel6635.200000105.8666676.460.0096Error8131.20000016.400000CorrectedTotal14766.400000
R-SquareC.V. RootMSE YIELDMean0.828810 14.56724 4.04969 27.8000SourceDFAnovaSSMeanSquareFValuePr>FVARIET4620.400000155.1000009.460.0040BLOCK214.8000007.4000(X)0.450.6521TheSASSystemAnalysisofVarianceProcedureDuncan'sMultipleRangeTestforvariable:YIELDNOTE:ThistestcontrolsthetypeIcomparisonwiseerrorrate,nottheexperimentwiseerrorrateAlpha=0.05df=8MSE=16.4NumberofMeans 2345CriticalRange 7.6257.9468.1258.233Meanswiththesameletterarenotsignificantlydifferent.DuncanGroupingMeanNVARIETYA34.00035AA33.00033AA32.00032B21.00031BB19.00()34三拉丁方與正交拉丁方實(shí)驗(yàn)的方差分析隨機(jī)化完全區(qū)組設(shè)計(jì),在一定程度上消除了由于實(shí)驗(yàn)條件或?qū)嶒?yàn)材料的非同質(zhì)性給實(shí)驗(yàn)帶來的誤差。若在同一區(qū)組內(nèi)仍不能保證實(shí)驗(yàn)材料或?qū)嶒?yàn)條件的同質(zhì)性,這時(shí)可以設(shè)計(jì)成兩個(gè)方向的隨機(jī)化區(qū)組,即拉丁方設(shè)計(jì)。拉丁方設(shè)計(jì)的行數(shù)與列數(shù)必須一致,從而構(gòu)成一個(gè)方陣。由于每一小區(qū)都是用拉丁字母表示的,所以稱為拉丁方(Latinsqua代)。與隨機(jī)化完全區(qū)組設(shè)計(jì)類似,拉丁方的行、歹h與主效應(yīng)之間的交互作用是不能估計(jì)出的。若在一個(gè)拉丁方上再重上一個(gè)拉丁方,兩個(gè)拉丁方上各小區(qū)的字母共同出現(xiàn)一次而且只出現(xiàn)一次,這樣的兩個(gè)拉丁方稱為正交拉丁方(orthogonalLatinsquare)。除p=6(6行,6列)拉丁方以外,任何p23的拉丁方都有正交拉丁方。一個(gè)p階拉丁方最多可有0一1個(gè)正交拉丁方。由于拉丁方和正交拉丁方從隨機(jī)化完全區(qū)組的誤差平方和中進(jìn)一步分解出一些可控因素的平方和,如行平方和與列平方和,使實(shí)驗(yàn)的精度得到進(jìn)一步的提高。以4x4正交拉丁方為例,其統(tǒng)計(jì)模型為:其中6!是第i行效應(yīng),g是第/列效應(yīng),弓是第一個(gè)拉丁方的第j次處理效應(yīng),磔是第二個(gè)拉丁方的第&次處理效應(yīng)。均方期望的推演與隨機(jī)化完全區(qū)組類似,這里不再重復(fù)。例6.35個(gè)大豆品種的比較試驗(yàn),已知試驗(yàn)田的肥力在兩個(gè)方向上存在差異,5名管理人員的田間操作也存在不同,因此設(shè)計(jì)了一個(gè)5階正交拉丁方。試驗(yàn)結(jié)果如下(括號內(nèi)為小區(qū)產(chǎn)量)。12345111(53)22(44)33(45)44(49)55(40)223(52)34(51)45(44)51(42)12(51)335(50)41(46)52(43)13(54)24(47)442(45)53(49)14(54)25(44)31(40)554(43)15(60)21(45)32(43)43(44)解:正交拉丁方的SAS程序與隨機(jī)化完全區(qū)組的類似,只是分類變量數(shù)較多。分別用r代表行,c代表列,v代表品種,m代表田間管理,yield為產(chǎn)量,SAS程序如下:optionslinesize=76;datasoybean;inputrcvmyield@@;cards;111153122244133345144449155540212352223451234544245142251251313550324146335243341354352447414245425349431454442544453140515443521560532145543243554344procanova;classrcvm;modelyield=rcvm;meansv/duncanalpha=0.01;run;輸出結(jié)果見表6-3。表6-3:拉丁方試驗(yàn)方差分析結(jié)果TheSASSystemAnalysisofVarianceProcedureClassLevelInformationClassLevelsValuesROW512345COLUMN512345STRAIN512345MANAGE512345Numberofobservationsindataset=25TheSASSystemAnalysisofVarianceProcedureDependentVariable:YIELDSumofMeanSourceDFSquaresSquareFValuePr>FModel16534.16000033.3850004.270.0217Error862.4800007.810000CorrectedTotal24596.640000
SourceDFAnovaSSMeanSquareFValuePr>FROW414.6400003.6600000.470.7580COLUMN496.24000024.0600003.080.0823STRAIN4357.04000089.26000011.430.0022MANAGE466.24000016.5600002.120.16980.8952805.9308952.7946447.12000.8952805.9308952.7946447.1200TheSASSystemAnalysisofVarianceProcedureDuncan'sMultipleRangeTestforvariable:YIELDNOTE:ThistestcontrolsthetypeIcomparisonwiseerrorrate,nottheexperimentwiseerrorrateAlpha=0.01df=8MSE=7.81NumberofMeans2345CriticalRange5.9316.1736.3206.417Meanswiththesameletterarenotsignificantlydifferent.DuncanGroupingMeanNSTRAINA54.40051B46.40052BB45.80053BB45.60054BB43.40055四兩因素隨機(jī)化區(qū)組實(shí)驗(yàn)的方差分析一個(gè)兩因素交叉分組實(shí)驗(yàn),若每一處理重復(fù)〃次,全部實(shí)驗(yàn)共。加次(見課本9.1.1)。這a加次實(shí)驗(yàn)的實(shí)驗(yàn)條件或?qū)嶒?yàn)材料必須具有同質(zhì)性。否則,由于實(shí)驗(yàn)材料或?qū)嶒?yàn)條件的差異所引起的誤差會(huì)混雜于實(shí)驗(yàn)誤差中,影響試驗(yàn)結(jié)果的可靠性。為避免這種情況的發(fā)生,與隨機(jī)化完全區(qū)組的做法一樣,將每一套水平組合,安排在一個(gè)區(qū)組中,n次重復(fù)構(gòu)成了n個(gè)區(qū)組。這樣種設(shè)計(jì)稱為兩因素隨機(jī)化區(qū)組設(shè)計(jì)。統(tǒng)計(jì)模型為:其中a,、和(a4為分別為A因素、B因素和48交互作用效應(yīng),成.是第k區(qū)組效應(yīng)。設(shè)A因素為固定因素,8和區(qū)組為隨機(jī)因素,模型中各分量的均方期望可由下表推演出。因素FRRRFRRRabn\均方期望abiJn1kI均方期望iJkIg0bn10hn1A-a1n1a1n1(孫01n101ni員ab11ab113辦*0b11網(wǎng)”a1111111(磔辦K01111111上表中的/為區(qū)組內(nèi)的重復(fù),因/=1,這時(shí)/無法估計(jì)(誤差自由度哄=0)。假設(shè)區(qū)組與因素間不存在交互作用,即將上表左半部的后四行合并,作為誤差估計(jì),得到表的右半部。由均方期望可以得到檢驗(yàn)統(tǒng)計(jì)量,F(xiàn)a=MSa/MSab,Fb=MSb/MS?,Fab=MSab/MSe.兩因素隨機(jī)區(qū)組實(shí)驗(yàn)的方差分析與三因素交叉分組實(shí)驗(yàn)的方差分析程序基本相同。例6.4課本上表9—11中的實(shí)驗(yàn),共需32名同質(zhì)受試者,因32名同質(zhì)受試者很難找到,因此將實(shí)驗(yàn)的兩個(gè)重復(fù)安排為兩個(gè)區(qū)組,每一區(qū)組只要16名同質(zhì)受試者即可。解:先創(chuàng)建一個(gè)名為a:\2-7datadat的外部數(shù)據(jù)文件。SAS程序?yàn)椋?/p>
datawork;infile4a:\2-7data.dat\inputblockabenergy@@;run;procanova;classblockab;modelenergy=blockaba*b;testh=ae=a*b;meansa/duncane=a*b;run;輸出結(jié)果見表6-4o表6-4例6.4方差分析輸出的結(jié)果TheSASSystemAnalysisofVarianceProcedureClassLevelInformationClassLevelsValuesBLOCK212A41234B41234Numberofobservationsindataset=32TheSASSystemAnalysisofVarianceProcedureDependentVariable:ENERGYSumofAnalysisofVarianceProcedureDependentVariable:ENERGYSumofMeanSourceDFSquaresSquareFValuePr>FModel1613.13290000.82080628.160.0001Error151.50838750.1005592CorrectedTotal3114.6412875SourceDFAnovaSSMeanSquareFValuePr>FBLOCKi0.277512500.277512502.760.1174A33.996337501.3321125013.250.0002B30.450562500.150187501.490.2567A*B98.408487500.934276399.290.00010.89697714.328640.317112.213130.89697714.328640.317112.21313TestsofHypothesesusingtheAnovaMSforA*BasanerrortermSourceDFAnovaSSMeanSquareFValuePr>FA 3 3.99633750 1.33211250 1.43 0.2982TheSASSystemAnalysisofVarianceProcedureDuncan*sMultipleRangeTestforvariable:ENERGYNOTE:ThistestcontrolsthetypeIcomparisonwiseerrorrate,nottheexperimentwiseerrorrateAlpha=0.05df=9MSE=0.934276NumberofMeans234CriticalRange1.0931.1411.169Meanswiththesameletterarenotsignificantlydifferent.DuncanGroupingMeanNAA2.640084AA2.290081AA2.265082AA1.657583五裂區(qū)實(shí)驗(yàn)設(shè)計(jì)的方差分析(選做)裂區(qū)設(shè)計(jì)(split-plotdesign)與兩因素隨機(jī)區(qū)組設(shè)計(jì)近似。不同點(diǎn)是后者在每一區(qū)組內(nèi)A、8兩因素的外次處理是完全隨機(jī)化的。而裂區(qū)設(shè)計(jì)的每一區(qū)組內(nèi)A因素先分為a個(gè)處理,在每一處理內(nèi)B因素再分為b個(gè)處理。隨機(jī)化過程只能在A因素的a個(gè)處理和8因素的b個(gè)處理
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年護(hù)士職業(yè)資格考試試題及答案
- 七下語文測試題及答案
- 水電材料合同協(xié)議書范本
- 文檔氫氣質(zhì)量測量和化學(xué)監(jiān)督課件
- 2025年氫氧化亞鎳合作協(xié)議書
- 澳大利亞市場拓展:海外分公司注冊與運(yùn)營管理合同
- 智能家居產(chǎn)品全國分銷網(wǎng)絡(luò)布局及市場開發(fā)合同
- 網(wǎng)絡(luò)游戲IP授權(quán)與衍生品制作合作協(xié)議
- 拼多多品牌店鋪綜合營銷策略執(zhí)行與合作合同
- 共享辦公空間戰(zhàn)略合作伙伴協(xié)議
- 《一棵小桃樹》閱讀
- 口腔科實(shí)習(xí)醫(yī)生手冊
- 營業(yè)線及臨近營業(yè)線施工方案
- 人教版PEP五年級下冊英語課件Unit4-B-Lets-talk-課件
- 仿生機(jī)械蝎子設(shè)計(jì)說明書
- 戴明管理思想精要:質(zhì)量管理之父的領(lǐng)導(dǎo)力
- 髖臼及股骨骨缺損的分型及評價(jià)-課件
- 國網(wǎng)西藏電力考試真題
- 云南德宏州事業(yè)單位隨軍家屬5人模擬預(yù)測(自我提高共1000題含答案解析)檢測試卷
- 外科學(xué)(2)智慧樹知到答案章節(jié)測試2023年溫州醫(yī)科大學(xué)
- 施工方案(更換絕緣子)
評論
0/150
提交評論