浙江大學醫學統計學方差分析舉例_第1頁
浙江大學醫學統計學方差分析舉例_第2頁
浙江大學醫學統計學方差分析舉例_第3頁
浙江大學醫學統計學方差分析舉例_第4頁
浙江大學醫學統計學方差分析舉例_第5頁
已閱讀5頁,還剩16頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第四章方差分析方差分析(analysis of varianee, ANOV A)是R.A. Fisher提出的,是數理統計的基本方法之 一,是醫學研究中分析數據的一種工具。目前各種實驗設計的方法在醫學領域中得到越來越廣泛的應用,取得了可喜的效果。方差分析就是實驗設計中分析數據的一種有效方法。方差分析主要應用范圍是:兩個及兩個以上樣本均數所代表的總體均數之間差異的比 較;同時可分析多個因素的作用;可以分析因素間的交互作用等。實際上,檢驗兩個樣本均數代表的總體均數差異的t檢驗是方差分析的特例。方差分析的應用條件: 各個樣本來自正態總體; 各個樣本是相互獨立的隨機樣本; 各樣 本代表的總體方差齊性

2、等。 方差分析可以說是檢驗幾個樣本代表的具有相同方差、相互獨立的正態總體均數是否相等的問題的一種統計分析方法。第一節 單因素方差分析在醫學領域中經常會遇到這樣的問題,有幾種不同的治療方案,要比較它們的治療效果;幾位檢驗員檢查同一份血樣,想了解他們的檢驗技術是否有所不同;給藥的不同時間對病人的治療效果是否有影響。這里研究的對象:治療方案、檢驗員、給藥時間稱為因素。當研究 的因素只有一個時, 稱為單因素問題, 所做的實驗叫單因素實驗。相應的設計叫單因素設計(完全隨機設計/成組設計),在實驗研究,將受試對象按照完全隨機方法分配到各處理組或 對照組之中;在抽樣研究中,指研究對象從相互獨立的總體中按隨機

3、化的方法抽樣得到。此類資料的組間總體均數的比較可以考慮用單因素方差分析(one-way ANOV A)。一、問題的提出先看一個例子。例4.1將24名貧血患者隨機分為三組,分別用甲、乙、丙三種方案治療,治療一月后血紅 蛋白變化量見表4-1,要分析三種治療方案對貧血患者的療效是否有差異。表4-1三種方案治療貧血患者血紅蛋白的變化量(g%)ABC0.51.42.12.3-0.21.93.72.32.0Xij2.40.7-0.31.10.21.12.71.20.93.60.00.53.2-0.40.8刀刀Xj19.55.29.033.7(刀 X)ni88824( n)2.43750.65001.125

4、0Xi1.1042( X )256.699.4215.02281.13 (刀 X )二 X ij(*資料來自:劉玉秀等主編新藥臨床研究設計與統計分析)從平均值來看,治療方案不同對貧血患者的療效是有一定影響的,但仔細觀察一下數 據就會發現如下問題:(1)同一治療方案下患者血紅蛋白的變化量并不完全一樣,產生這種變異的原因是由 于患者之間個體變異的存在以及由于各種偶然因素引起的隨機測量誤差所致。(2)不同治療方案下患者血紅蛋白的變化量并不完全一樣,產生這種變異的原因包括 治療方案的不同、患者之間個體變異的存在以及由于各種偶然因素引起的隨機測量誤差等。由于患者之間個體變異的存在以及由于各種偶然因素引起

5、的隨機測量誤差的存在,對于不同治療方案下得到的不同療效是由于方案不同引起的呢,還是有患者之間個體變異的存在以及由于各種偶然因素引起的隨機測量誤差造成的?因此,應做仔細的分析以后再下結論為好。由于治療方案不同引起的患者血紅蛋白的變化量的變異叫做處理變異。例4-1的全部24個數據,參差不齊,它們的變異叫做總變異。產生總變異的原因一是 隨機測量誤差,一是處理變異。方差分析解決這類問題的思想是:1. 由數據的總變異中分解出處理變異和隨機測量誤差,并賦予它們的數量表示。2. 用處理變異和隨機測量誤差在一定意義上進行比較,如果兩者相差不大,說明處理的不同對研究指標的影響不大;如處理變異比隨機測量誤差大得多

6、,說明處理的不同影響是很大的,不可忽視。3. 選擇較好的處理或確定進一步實驗的方向。 因此,首要的問題是如何給變異一個數量表示。 最后再介紹兩個常用的術語。1. 水平一一因素在實驗時所分的等級或組分叫水平。在例4-1中,治療方案分三個水平:A、B、C。2. 處理一一在一項實驗中,同一實驗條件下的實驗叫做一個處理,不同實驗條件下的實驗叫做不同處理。在例 4-1中有三個處理。二、變異的數量表示有n個參差不齊的數據X1,X2,Xn,它們之間的差異稱為變異。如何給變異一個數量表示 呢?一個最直觀的想法就是用極差R表示.極差簡單直觀,便于計算,但是其缺點是對數據提供的信息利用不夠。人們后來有想出另一種表

7、達的方法一一離均差平方和,以SS記之,n即 SS八(Xj _X)2i =4SS是每個數據離平均值有多遠的一個測度,它越大表示數據間的差異越大。由于求和符號后面的部分是非負數, 所以,在同樣的波動程度下,數據多的平方和要大 于數據少的平方和,因此僅用平方和來反映波動的大小還是不夠的。我們要設法消去數據個數的多少給平方和帶來的影響。為此引進自由度的概念。一個直觀的想法是用平方和除以相應的項數,但是從數理統計的理論上可以證明這不是一個最好的辦法,而應把項數加以修正,這個修正的數叫做自由度。設有n個數Xj,i=1,2,,n。如果有m個(Ow m< n)線形約束關系,并且這 m個方程是互n相獨立的

8、,即方程系數矩陣的秩等于m,則S=Xi2的自由度是n-m。i很容易可以證明,對于 n個數據的離均差平方和的自由度v =n-1。這么來確定自由度似乎還是比較麻煩,對于常見的方差分析類型,在以后各節均有簡單的確定自由度的方法,這里只要知道自由度的概念就行。下面引進均方的概念, 所謂均方是指一定的自由度條件下的離均差平方和。常用MS表示,即MS=SSV。其實MS亦是方差。它的值越大,說明數據變異越大;它的值越小,說明 數據變異越小。它在反映數據波動的大小更加合理。可以適用于不同組之間波動程度或說是變異程度的比較。三、單因素方差分析的基本思想和方差分析表的產生方差分析的基本思想就是把所有數據的總變異(

9、離均差平方和) 分解成幾個部分,然后將各部分的變異進行比較。 在單因素方差分析中,總變異可分成組間變異和組內變異兩部分。(總變異就是所有數據對總均數的離均差平方和,總變異產生的原因是處理因素和隨機測量誤差;組間變異包括處理因素和隨機測量誤差;組內變異就是包括隨機測量誤差。這里所說的隨機測量誤差也包括個體差異。)然后,把組間變異和組內變異分別除以相應的自由度得 到組間均方和組內均方。在理論上,如果H0成立,則統計量F=MS組間/MS組內應該為1;如果H0不成立,則F值大于1。反過來,我們可以從計算得到的F值大小,來推斷 H0是否成立。F值究竟大于多少時,H0不成立,就要查方差分析的 F臨界值來判

10、斷。下面以例4-1為例來說明方差分析表的產生的基本步驟:1.建立假設并給定檢驗水準 aH。123 (不同治療方案對貧血患者的療效無影響)1 ,不等或不全相等(不同治療方案對貧血患者的療效有影響)H km22SS、八X廠X八X C '總二N 1 斗 j #J12' 3:-=0.052 計算F值2(1)列計算表(見表4-1下部),計算各組刀Xj, n, Xi ,、Xjj(2)計算離均差平方和 SS及自由度XjnSS,自由度'、均方MS和F值4-2表示。a)求校正數CCb)計算各離均差平方和整個計算過程可用表表4-2 單因素方差分析計算表變異來源SSMSF值P值SS組間 f

11、M S組間組間SS組間:組間=k -1 MS組間一:組間一 M s組內組內 (誤差)SS組內S&內二SS -SS且間組內二匕總-組間蟲&MSw-內V組內總計S S總:總二N 一1kSS且間八Ni Xi X八ni' Xijj=1Jn-c;TLc,_k_i $ Ni-組間SS&內=SS、一 SSa間,:組內=總i組間二N K本例:33.72C=47.324i 4i 42SS、八 X C =81.1300-47.3204=33.8096,:總=24-仁232 2 2(195)(52) (90)ss間888憶3204 二i3-715 組間二 3亠2SS內二 SS、一 S

12、S間=33.8096-13.7158=20.0938112.971 2,組內二24 一3 =21 代入方差分析表中(表 4-2),求出相應的MS及F值,見表4-3。3 .查F值表,確定P值,并作出推斷下結論。由附表 4 查得 F 0.05(2,21)=3.47,,因 F=7.1675> 尸0.05(2,21)= 3.47,,所以 PV0.05。結論:按=0.05水準,拒絕Ho,可以認為3種不同治療方案對貧血患者血紅蛋白的 療效是有影響。以上方差分析的結果常以方差分析表的形式表達,如表 4-3所示。表4-3 表4-1資料的方差分析表變異來源SSVMSF值P值組間13.715826.8579

13、7.1675<0.05組內20.0938210.9568總33.809623第二節 雙因素方差分析一、問題的提出在醫學研究中,影響我們所關心的某個研究指標的因素往往不止一個,而是許多因素。它們相互聯結,相互滲透,相互對立,又相互依存。隨著因素的增多,要透過表面現象抓住事物的本質,揭示出事物發展的內部規律就愈加困難,這里有兩個方面的問題: 一是如何進行實驗設計,使得實驗次數既少,獲得的信息又多;一是如何分析數據。多因素實驗最簡單 的設計是全面實驗,即把每個因素的水平一切可能的組合都做一遍,這種方法的優點是揭示事物內部的規律性比較清楚。但是,全面實驗一般實驗次數太多,當因素較多時,在實際上是

14、行不通的,因此是不值得提倡的。當只有兩個因素時, 我們一般采用隨機區組設計、交叉設計、析因設計等等。先看下面三個例子:4窩不同種系的大白鼠例4-2為研究注射不同劑量雌激素對大白鼠子宮重量的影響,取表4-4大白鼠注射不同劑量雌激素后的子宮重量/g合計縫合方法1個月2個月1030(b=4),每窩3只,隨機地分配到3個組內k=3)接受不同劑量雌激素的注射,然后測定其 子宮重量,結果見表 4-4。問注射不同劑量的雌激素對大白鼠子宮重量是否有影響?大白鼠7r 、 BT Xj' iy 丿種類0.20.40.80A106116145367B4268115225C70111133314D4263871

15、92n °縫合后時間)44412(N )E65.089.5120.091.5(X )bTV"J壬2603584801 098 近 X )bQT Xjj壬19 66434 37059 508113 542吃 X?)(*資料來自徐勇勇主編醫學統計學)例4-3為了研究蒸餾水的PH值和硫酸銅溶液濃度對化驗血清中白蛋白與球蛋白的影響,將蒸餾水PH值和硫酸銅濃度分成如表4-5所示的水平進行實驗:表4-5蒸餾水的PH值和硫酸銅溶液濃度兩因素的水平分組情況水平因素1234PH值5.405.605.705.80硫酸銅濃度0.040.080.10實驗米取交叉分組,即同一種血清,在不同的PH值和

16、不同的硫酸銅濃度配比之下各做一次,實驗結果(白蛋白與球蛋白之比)如表4-6所示:表4-6血清實驗結果(白蛋白與球蛋白之比)PH值硫酸銅濃度5.405.605.705.800.043.52.62.01.40.082.32.01.50.80.102.01.91.20.3對于這樣一個實驗該如何分析?例4-4將20只神經損傷的家兔隨機等分4組,分別用兩種神經縫合方法、在縫合后兩個時間觀察縫合后神經的軸突通過率,試驗結果見表4-7。試進行統計分析。表4-7家兔神經縫合后軸突通過率(%)A雌激素劑量/ug *100g10403070外膜縫合5060103010502050束膜縫合307050603030(

17、*資料來自郭祖超主編醫學統計學)以上三個例子,均是研究兩個因素對觀察指標的影響情況的問題,但是從設計角度來看,是稍微有點不同的, 例4-2的設計是隨機區組設計(randomized block design )又稱配伍組設計。這種設計相當于配對設計的擴大。具體做法是將受試對象按性質(如實驗動物的性別、 體重,病人的性別、年齡及病情)相同或相近者組成b個單位組(配伍組),每個單位組中有k個受試對象,分別隨機地分配到 k個處理組。這樣,各個處理組所用受試對象不僅數量 相同,生物學特點也較均衡。例4-3是利用交叉分組無重復設計,方法是:先將兩個因素的各個水平全面組合,然后在不同組合條件下只做一次實驗

18、。而例4-4所采取的是交叉分組有重復設計,即析因設計,方法與交叉分組無重復設計基本相同,不同之處就在于在不同組合條件下是進行重復實驗的,即實驗次數不止一次。對于以上不同的設計情況,其分析數據的方法也各不相同,但是其基本思想大多來自方差分析,所以方差分析是分析雙因素數據的一個基本方法。二、無交互作用的雙因素方差分析象例4-2隨機區組設計資料,或者例 4-3交叉分組無重復設計的資料,均可以使用無交互作用的雙因素方差分析的方法。其基本思想類似于單因素的方差分析的方法,將總變異分解成處理變異、區組變異和誤差(或者說:因素1的變異、因素2的變異和誤差)。下面以例4-2為例介紹其方差分析的步驟-(雌激素對

19、大白鼠子宮重量無影響);0123H/ /不等或不全相等(雌激素對大白鼠子宮重量有影響);11 '2 '3 - 0.012 計算F值列方差分析表,計算各離均差平方和SS,自由度;,均方MS和F值。表4-8隨機區組設計的方差分析計算表SSMS處理處理二 k -1MS處理 SS處理處理F處理MS處理MS誤差區組二b 1SS組SS組區組F區組 MS區組MS區組SS誤差誤差S9差二SS、一 SS理-、S誤差區蛋' 總一處理一區組 MS誤差=N - k 一 b 1誤差總計SS、=N -117fb、瓦X ijli =1丿k區組二 b -1處理組間離均差平方和 s$理及自由度、處理的計

20、算與單因素方差分析的一樣,單位組間離均差平方和按下式計算:b 2SS立八k X j - x八j 生j =1各部分均方的計算方法也同完全隨機設計資料。注意,在計算f處理值時,分母是誤差均方MS誤差,分子是MS處理。本例:C= 1098 2 =100 467,12SS、 = 113 542 -00 467=13 075 ,2 2 2SS理二 260一358480 -100 467=6 074SS且2 2 2 2367 225 314 1923-100 467 =6 457.67S3差工 13 075-6 074-6 457.67=543.33。列方差分析表:按表 4-8填入離均差平方和并計算相應的

21、自由度;、均方MS和F值,得表4-9。變異來源SSVMSF值P值處理6 074.0023 037.0033.540.01區組6 457.6732 152.5623.77<0.01誤差543.33690.55總計13 075.0011表4-9例4-2資料方差分析3 .查F值(附表4)表,確定P值,下結論本例+處理=2 ,”誤差二6 ,查附表4得,F0.01(2,6)= 10.92,因F 處理 > F 0.0i(2,)= 10.92,所以 P 0.01 。結論;按=o.oi水準,拒絕 h 0,可以認為3個劑量組的大白鼠子宮重量的差別具 有統計學意義,即注射不同劑量的雌激素對大白鼠子宮的

22、重量有影響。若想進一步了解哪兩組間有差別,可進行多個均數的兩兩比較,具體見本章第三節。隨機區組設計在進行方差分析時將區組間的變異從組內變異中分解出來,當區組之間差異有統計學意義時,其誤差較完全隨機設計小,使試驗效率提高。三、有交互作用的雙因素方差分析在一些實驗中,不僅因素對研究指標有影響,而且因素之間還會聯合起來對研究指標產生作用,這個聯合的作用叫做交互作用。先看先面兩個實驗:A1A2A1A2B125B125B2710B273左邊一個實驗,當A從A1變化到A2時,研究指標都增加3,與B取B1或B2無關;同樣,B從B1變化到B2時,研究指標都增加5,與A的水平無關,即A2-A1B2-B 1B13

23、A15B23A25我們將A與B沒有交互作用。而右邊一個實驗情況則大不一樣,且看A2-A1B2-B 1B13A15B2-4A2-2這就是說,因素A對指標的影響與 B取什么水平有關,因素B對指標的影響與 A取什 么水平也有關,這時我們就稱 A和B之間有交互作用,記作 A X B。現在以例4-4的資料為例來介紹最簡單的2 X 2析因設計方差分析。所謂2X 2析因設計(factorial experiment),就是有G個處理組由2個因素(每個因素 有2個水平)全面組合而成,對此就有4個處理組。然后,采用完全隨機設計安排4個處理組。2X 2析因設計方差分析的基本思想:是在前面單因素方差分析和無交互作用

24、的方差分 析的基礎上對誤差進一步分解。將總變異分解成因素A的變異、因素B的變異、交互作用AX B的變異和誤差四項。注意: 2X2析因設計實驗要求各組例數相等,每組例數不少于2例,否則無法分析因素之間的交互作用。2X 2析因設計方差分析的基本步驟:1. 建立假設和給定檢驗水準H 0:神經縫合方法對縫合后神經的軸突通過率無影響H 1:神經縫合方法對縫合后神經的軸突通過率有一定的影響H 0:縫合后時間對縫合后神經的軸突通過率無的影響H1:縫合后時間對縫合后神經的軸突通過率有一定的影響H 0:神經縫合方法和縫合后時間無交互作用H神經縫合方法和縫合后時間有交互作用,/. =0.052. 按表4-10 2

25、 X 2析因設計的方差分析表計算表4-10 2 X 2析因設計的方差分析表變異來源VSSmsfp處理間31 2SStr=Ti _Cr主效應a11 八 2"2SSa=A1 ' A22r-CMS aFa= MS a/ MSeB11 4 2 = 2 SSb=B1' B22r-CMSbFb= MSb/ MSe交互作用A X B1SSab =SStr -SSa-SSbMS abFab =MS ab/MSe誤差N-4SSe=SSt-SStrMSe合計N-12SSt=匕 X -C注:A1、A2表示A因素兩水平的小計;B1> B2表示B因素兩水平的小計,Tj(i=1,2,3,4

26、)為4個處理組小計;r為每組的例數;c=' X 2N本例中,i=j=2,r=5,T i=120,T2=220,T3=140,T4=260,Ai=340,A2=400,Bi=260,B2=480,代入表4-10,得到表4-11的結果表4-11例4-4析因實驗的方差分析表變異來源ssVmsFP處理26203a18011800.60>0.05B2420124208.07<0.05A X B201200.07>0.05誤差480016300總7420193. 查F臨界值表,確定P值4. 推斷下結論。根據表4-11結果,在=0.05的水準下,只有縫合時間(B因素)對神經的軸突通

27、過率 有影響。第三節 多組間的兩兩比較當方差分析結果為p<0.05時,只說明k組總體均數之間不同或不完全相同。若想進一步了解哪兩組的差別有統計學意義,需進行多個均數間的兩兩比較或稱均數間的多重比較 (multiple compariso n)。若用上一章學習的兩均數比較的t檢驗進行多重比較,將會加大I類錯誤的概率,從而可能把本無差別的兩個總體均數判為有差別。例如,有4個均數,兩兩組合數為 C42=6,若用t檢驗做6次比較,且每次比較的檢驗水準選為二=0.05,則每次比較不犯I類錯誤的概率為(1-0.05 ), 6次均不犯I類錯誤的概率為 (1-0.05) 6,這時, 總的檢驗水準為1-(

28、1-0.05) 6=0.26,比0.05大多了。因此,均數間的多重比較不能直接用 兩均數t檢驗的檢驗水準和標準誤。多重比較檢驗的方法很多,如最小顯著差異檢驗(Least significant differenee test,LSDtest)、Duca n 多界值檢驗(Ducan 'multiple range test),亦稱 Duncan 新法、Newma n-Keuls 檢 驗(Student-Newman-Keuls test,SNK test)、Tukey 檢驗(Tukey ' honest significant differenee test,HSD test)、

29、Scheffe 檢驗(Scheffe'test)和 Dunnett 檢驗(Dunnett test)等,這些方法的 原理基本相似,不同的是其檢驗界值有所不同,SNK檢驗的敏感性居中。沒有一種檢驗在任何情況下都是最好的。目前對多個均數兩兩之間的全面比較,最常選用SNK檢驗法;LSD檢驗法適用于一對或幾對在專業上有特殊意義的均數間差別的比較;Dunnett檢驗法適用于幾個處理組與一個對照組均數差別的多重比較,該檢驗有專門與之對應的檢驗臨界值。另外還可以通過校正檢驗水準Bonferroni校正檢驗(Bonferroni correction test )。下面介紹四種多重比較的常用方法: S

30、NK檢驗、LSD檢驗、Dunnett檢驗和Bonferroni校正檢驗法。1、SNK檢驗SNK檢驗,亦稱q檢驗。檢驗統計量q的計算方法見下式XiXj其中M S誤差'丄+丄)2 e nj 丿式中,X i , ni為第i組的樣本均數及樣本例數,x i , ni為第j組的樣本均數及樣本例數,m s誤差為方差分析表中的誤差均方。完全隨機設計資料,m s誤差即是m s組內。例4-6 續例4-1。試比較3種治療方案療效兩兩之間的差別。i.建立假設并確定檢驗水準:H 0 :J j (即任兩對比組的血紅蛋白含量的總體均數相等);H1:J j (即各對比組的血紅蛋白含量的總體均數不等或不全相等);:=0

31、.052 計算q值將3個樣本均數從小到大排列,并賦予秩次:均數0.65001.12502.4375組別B萬案C萬案A萬案秩次123列出對比組(見表4-16 第(1)欄),并計算兩對比組均數之差的絕對值(見表4-16第(2)欄)。如第一行兩對比組均數之差的絕對值為:|0.6500-1.1250| =0.475。 寫出兩對比組所包含的組數:-(見表4-16第(3)欄)。如第2行,1與3比,包含了 1,2,3三個組,故=3。 計算檢驗統計量 q值。本例已求得 MS誤差=0.9568 (見表4-3),又各組列數均為10,所以,由公式4-5計算q值,其中sx=y警(8+8卜0.3458。結果見表4-16

32、第(4)欄。表4-163個均數兩兩比較q值表比較組秩次XiXjaqP值(1)(2)(3)(4)(5)1 , 20.475021.374>0.051 , 31.787535.169<0.012, 31.312523.796<0.053.查界q值表(附表5),確定P值,下結論已知、.誤差二21,查附表5,=2 時,q=2.95 ;0.05(20,3)=3 時,q3.58 ,q4.64。0.05(20,3)0.01(20,3)以實際的q值和相應的q界值做比較,確定對應的P值(見表4-16第(5)列)。結論:按=0.05水準,除了 1與2組外均拒絕H。,可以認為血紅蛋白上升克數在A方

33、案和B方案、A方案和C方案之間有統計學意義,而B方案和C方案之間沒有統計學意義。2、LSD檢驗LSD檢驗,即最小顯著差異(Least significant differenee ) t檢驗。其統計量 t的計算 公式為:XiXjSr巳誤差其中,MS誤差注意,這里的LSD檢驗中t統計量的計算公式與成組設計兩樣本均數代表的總體均數比較的t檢驗公式是不同的,區別就在于兩樣本均數差值的標準誤S和自由度的計X i -X j算上,在成組設計兩樣本均數代表的總體均數比較的t檢驗公式里是用合并方差s2來計算,v =ni n2 - 2,而這里是用方差分析表中的誤差均方MS誤差來計算XiX誤差3、Dunnett

34、檢驗Dunnett檢驗,檢驗統計量為 q ', q 的計算公式如下Xi-X。Sx-x;其中SXi殺In n。丿這里,Xni分別為第i個實驗組的樣本均數和樣本例數,X。,n。分別為對照組的樣本均數和樣本例數。4、Bonferroni校正檢驗多重比較的次數不多(如不超過 5次)時,可以考慮用 Bonferroni校正檢驗的方法。假 設原來所給的檢驗水準為,所用的檢驗統計量是成組設計的兩樣本比較的t (或u)統計量,需要進行兩兩比較的次數為m次,則單次的兩兩比較應以:-/m作為檢驗的實際水準,這種校正方法稱為Bonferroni校正檢驗。例如,3組均數之間的兩兩比較,原定=0.05,現在進行

35、了 3次t檢驗,則其每次t檢驗的檢驗水準該取 :/3=0.0167,而不是0.05。第四節方差分析中的若干問題一、題的提出前面已介紹了方差分析的一些常見的一些常見類型,以及這些類型的分析方法。在醫學研究的實際問題中有時會提出許多如下的問題:數據缺失了怎么辦?數據不符合方差分析的模型怎么辦?當某個因素是有統計學意義時,能否進一步判斷這個因素的各水平之間兩兩也有統 計學意義,等等。以上這些問題,就在本節中展開討論。二、數據的處理方差分析的數據一般都是通過精心安排的試驗而獲得的,當研究因素超過一個時,要求的數據很整齊的,否則分析時會帶來很多麻煩。有時,某些試驗不幸做壞了,或者數據丟失了,客觀條件不允

36、許重做。 例如,在實驗中,一只實驗動物不是處理之故而生病或突然死亡, 或由于測量儀器發生故障, 致使實驗數據發生缺失,這時就要考慮有無統計學方法進行彌補。 彌補數據可以有各種各樣的原則,最常用的是使SSe達到最小的辦法。 下面分兩種情況進行討論1、 試驗有重復,并且每個處理至少有一個數據沒有缺失。這種情況最簡單,既然每種處理都有數據,那么缺失的數據就是同處理而沒有丟失數據的平均值來代替。如果總共丟失了m個數據,則誤差的自由度等于原誤差自由度減去m,2、 有些處理的數據缺失。這種情況主要以隨機區組設計和正交設計為多見。即補上去的m個數不能算在自由度之內。C大白鼠,劑量0.2和B大白鼠,劑量0.4

37、對應的兩個數據缺失,分別記為a和b,按表4-12進行計算。表4-12大白鼠注射不冋劑量雌激素后的子宮重量/g大白鼠 種類雌激素劑量/ugJ*100g3、Xij0.20.40.80i =4A106116145367B42b115157+bCa111133244+aD4263871924- X ij j 1190+a290+b480960+a+b2由表 4-12 得, C=( 960+a+b) /121 2 2 2SStr=x (190+a) +(290+b) +480 -C先看一個例子,假如例4-2中缺失了1 2 2 2 2SSb=x 367 +(157+b) +(244+a) +192 -C42 2 2 2 2SSt=106 +116 + +87 +a +b -CSSe= SSt- SStr- SSb現在SS

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論