統計學第六章 方差分析課件_第1頁
統計學第六章 方差分析課件_第2頁
統計學第六章 方差分析課件_第3頁
統計學第六章 方差分析課件_第4頁
統計學第六章 方差分析課件_第5頁
已閱讀5頁,還剩38頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第六章方差分析(一)統計學第六章方差分析第一節方差分析的基本概念一、目的:AnalysisofvarianceANOVA用于檢驗兩個或兩個以上樣本均數間差別有無統計意義二、樣本均數間差別的原因(變異的來源):1、總變異:全部試驗數據大小不等。用觀察值與總均數的離均差平方和sumofsquaresofdeviationsfrommean表示,記為SS總,或l總;總的自由度

總=N-1統計學第六章方差分析

2、組間變異:各處理組的樣本均數大小不一,用各組均數與總均數的離均差平方和表示,記為SS組間或l組間,組間自由度

組間=k-1。MS組間=l組間/組間組間變異反映的是處理因素的作用,同時也包括隨機誤差均方:meansquare,MS統計學第六章方差分析3、組內變異:各處理組內部觀察值大小不等,用各處理組內部每個觀察值與組均數的離均差平方各表示,記為l組內。

組內=(n1-1)+…+(nk-1)=N-kMS組內=l組內/

組內組內變異反映的觀察值的隨機誤差,如個體差異和隨機測量誤差統計學第六章方差分析4、三種變異的關系l總=l組間+l組內

總=N-1=(k-1)+(N-k)=組間+組內統計學第六章方差分析三、方差分析的基本思想:總變異可分解為組間變異和組內變異兩個部分,相應的總自由度也分解為組間自由度和組內自由度。如果各樣本均數來自同一總體,即各組之間無差別,則組間變異和組內變異均只反映隨機誤差,這時若計算組間均方與組內均方的比值,F=MS組間/MS組內,應接近1。反之,若各樣本均數不是來自同一總體,組間變異較大,F值將明顯大于1。要大到多大程度才有統計學意義?統計學第六章方差分析這個程度就是與隨機誤差而言。即以隨機誤差進行衡量,若處理組間的變異明顯大于組內變異,則不能認為組間的變異僅反映隨機誤差,也就是說處理因素有作用。R.A.Fisher于20世紀20年代推導出在無效假設成立的情況下,統計量F的分布規律。1934年G.W.Snedecor以Fisher的名字命名了這一分布,稱F分布,故ANOVA又稱F檢驗。F(組間,組內)查表統計學第六章方差分析基本思想:根據資料變異的不同來源,將全部觀察值總的離均差平方和和自由度分解為兩個或多個部分,除隨機誤差外,其余每個部分的變異可由某個因素的作用(或某幾個因素的交互作用)加以解釋,如各組均數間的變異SS組間,可由處理因素的作用加以解釋,通過比較不同變異來源的均方,用F分布作出統計推斷,從而了解該因素對觀察指標有無影響。統計學第六章方差分析注意:1、ANOVA與試驗設計類型聯系在一起,并非任何變異都有適當的分解。2、數據要求:①各次觀察獨立,即任何兩個觀察值間均不相關;②每一水平下的觀察值xij分別服從總體均數為

ij的正態分布;③各總體的方差相等,即方差齊性homogeneityofvariance.(任何觀察值都是獨立地來自具有等方差的正態總體)統計學第六章方差分析第二節完全隨機設計的單因素ANOVA(one-wayANOVA)按完全隨機化的原則將受試對象隨機分配到一個研究因素的多個水平中去,然后觀察試驗效應。目的:比較不同水平下,各組均值間的差別是否具有統計學意義統計學第六章方差分析基本步驟:P59,例6-1為例1、建立檢驗假設和確定檢驗水準:Ho:4種衣料吸附硼氫量的總體均數相等,即

1=

2=

3=

4H1:4種衣料吸附硼氫量的總體均數不全相等=0.052、計算檢驗統計量F值:如下表統計學第六章方差分析成組設計方差分析計算表統計學第六章方差分析以P59表6-1實例進行計算:先計算基本數據結果,再代入上表的公式計算:C、SS、MS、F等一般將計算結果列為表6-2的形式,見P613、確定P值和作出統計推斷結論按計算所得F值:11.1644,查附表6-2,表中

1指分子均方的自由度,2為分母均方的自由度。F=11.164>F0.01(3,16)=5.29,故P<0.01。認為四組均數間差別有高度統計學意義統計學第六章方差分析各組樣本含量相等和各組樣本含量不等時,計算的基本方法完全一樣,只是在計算l組間時有所不同,相等時將ni直接用n計算即可。舉例:P61,例6-2統計學第六章方差分析第三節隨機區組設計的ANOVA

Two-wayANOVA一、概念:1、隨機區組設計randomizedblockdesign,亦稱配伍組設計:應用分層的思想,事先將受試對象按某種或某些特征分為若干個區組block,使每個區組內的觀察對象的特征盡可能的相近。每個區組內的觀察對象數與研究因素的水平數相等,分別使每個區組內的觀察對象隨機地接受研究因素某一水平的處理。統計學第六章方差分析2、此外,同一受試對象不同時間點上的觀察,或同一樣本給予不同處理的比較,亦當作隨機區組設計進行分析。3、由于區組內個體特征比較一致,減少了個體間變異對結果的影響,統計效率高,易檢出組間的差別。4、用兩因素方差分析two-wayANOVA,兩因素指研究因素和區組因素。研究因素有k個水平,共n個區組。5、當k=2時,兩因素方差分析等價于配對t檢驗,且F=t2統計學第六章方差分析二、隨機區組設計方差分析中變異的分解:總變異分解為:處理組間變異、誤差、區組間變異(新增的,用ss區組l區組表示,大小為各區組均數與總均數的離均差平方和)。ss總=ss處理+ss區組+ss誤差自由度分解:

總=處理+區組+誤差N-1=(k-1)+(n-1)+(k-1)(n-1).k為處理組數,n為區組數,N為總例數統計學第六章方差分析三、分析計算步驟:例6-3,P631、建立檢驗假設和確定檢驗水準H0:放置不同時間的血糖濃度相等,即

1=

2=

3=

4H1:放置不同時間的血糖濃度不全相等=0.052、計算檢驗統計量F值,根據下表計算公式計算統計學第六章方差分析隨機區組方差分析計算公式統計學第六章方差分析3、確定P值和作出推斷結論放置時間的F值=0.9681/0.0125=77.44受試者間的F值=0.3569/0.0125=28.55查附表6-2,

1(處理)=3,

2(誤差)=21,F0.05(3,21)=3.07,F0.01=4.87;當

1(區組)=7,

2(誤差)=21,F0.05(7,21)=2.49,F0.05=3.64F均>F0.01,P<0.01,說時放置時間長短對血糖濃度的變化是有影響的。另外,不同受試者間血糖濃度亦有差別。統計學第六章方差分析第四節均數間的相互比較一、幾點說明1、ANOVA并不能回答哪幾個均數間差別有統計學意義,需進一步做兩兩間的多重比較multiplecomparison2、兩兩比較,不可用t檢驗,因為會增加第一類錯誤的概率。k個樣本均數可做k!/[2!(k-2)!]次比較,如:5個樣本→10次,不犯第一類錯誤的概率為(1-0.05)10=0.5987,〔正確接受全部10次無效假設的概率〕,一類錯誤概率為1-0.5987=0.4013統計學第六章方差分析二、常用的多重比較的方法1、LSD-t檢驗:稱最小有意義差別(leastsignificantdifference)t檢驗,檢驗k組某一對或某幾對在專業上有特殊意義的均數dAB=XA-XB的總體水平是否為0。統計學第六章方差分析算得的t值以誤差自由來查t值表與前述t檢驗的的不同:舉例說明計算過程:t0.001(16)=4.015統計學第六章方差分析LSDt檢驗對比組A與B兩均數之差兩均數之差標準誤LSD

t值t臨界值P值棉與府棉與的棉與尼府與尼府與的的與尼統計學第六章方差分析2、Dunnett-t檢驗用于k-1個實驗組與一個對照組均數差別的多重比較:P66,例6-5統計學第六章方差分析Dunnett檢驗對比組A與B兩均數之差兩均數之差標準誤t值處理數Tt臨界值0.05t臨界值0.01P值棉與府棉與的棉與尼統計學第六章方差分析3、Student-Newman-Keuls法SNK法,檢驗統計量為q,通常稱q檢驗用于多個樣本均數間的兩兩比較統計學第六章方差分析SNKq檢驗對比組A與B兩均數之差兩均數之差標準誤q值處理數Tq臨界值0.05q臨界值0.01P值棉與府棉與的棉與尼府與尼府與的的與尼統計學第六章方差分析比較時應將均數按大小順序排列,一般先比較相關最大的兩個均數q的分布與兩比較組間跨度a及自由度有關。組間跨度a(對比組內包含組數a)是指XA與XB之間涵蓋的均數個數,包括XA與XB自身在內MS誤差為誤差均方或組內均方依q值、組間跨度a(處理數Ti)、誤差自由度及檢驗水準查q值表,q≥qα(a,ν)時,有統計學意義(P553,附表6-4)統計學第六章方差分析兩兩比較方法選用1、在研究設計階段未預先考慮或預料到,經假設檢驗得出多個總體均數不全相等的提示后,才決定的多個均數的兩兩事后比較(posthoccomparisons/unplannedcomparisons),常用于探索性研究exploratoryresearch,兩兩比較用:SNK法、Bonfferonit檢驗、Sidakt檢驗統計學第六章方差分析2、在設計階段就根據研究目的或專業知識而計劃好的某些均數間的兩兩比較(plannedcontrasts/comparisons)或稱事前beforehand比較,常用于事先有明確假設的證實性研究confirmatoryresearch,如多個處理組與對照組的比較、某一對或某幾對在專業上有特殊意義的均數間的比較,用Dunnett-t檢驗、LSD-t檢驗,也可用Bonfferonit檢驗(該方法最保守)或Sidakt檢驗統計學第六章方差分析第五節拉丁方設計資料的

方差分析*一、拉丁方設計latinsquaredesign:設計因素(標志)兩個以上,各因素的水平數相同,可用此設計。拉丁方是以拉丁字母排列的方陣的簡稱。二、分析步驟:,例6-6,P681、求C2、求l總3、求l受試者統計學第六章方差分析4、求l日期5、求l防護服6、求l誤差7、自由度:總格子數減1為總變異自由度,防護服間、受試者間、試驗日期間均為n-1=5-1=4;誤差自由度=總自由度-防護服間-受試者間-試驗日期間=24-4-4-4=128、列拉丁方分析表,見P70,表6-169、查表,判斷結果統計學第六章方差分析優點:可以從較少的實驗數據獲得較多的信息,比隨機區組設計來得優越。(控制受試者間個體的差異,及實驗日期間的差異)

缺點:各因素間有交互作用時,不適用。實施時,要求各因素的水平數相等,實際中不易辦到。拉丁方可由統計書中查到,亦可自己編寫。統計學第六章方差分析第七節方差齊性檢驗檢驗多個樣本的方差齊性用Bartlett法一、各組樣本含量相等時:P71,例6-7卡方值略大于某一臨界值時,應計算校正卡方值,公式見P72統計學第六章方差分析二、各樣本含量不等時:P72,例6-8Bartlett法在各樣本含量相等時是不敏感的。所以各組樣本含量相差不大,各組S2相差不過大,可不必進行Bartlett檢驗。統計學第六章方差分析第七節近似F檢驗方差不齊時:采用以下兩方法1、對原始數據進行轉換2、用加權的方法計算加權的方差進行F檢驗,即近似F檢驗(F’檢驗或pseudoFtest),具體計算方法,參見P73~74統計學第六章方差分析第八節變量變換ANOVA的要求:任何觀察值都獨自地來自具有等方差正態總體。不能滿足時,可導致F值偏大,從而有增加第一類錯誤的危險,尤其違反獨立性假設時,影響較為嚴重。明顯偏離可進行變量變換。樣本例數較多時,對總體的正態性并不苛求;每組樣本例數相等時,對方差齊性亦不苛求,故最好采用例數相等的平衡設計方案。統計學第六章方差分析一、變量變換:是將原始數據作某種函數轉換,可使各組達到方差齊性,亦可使資料轉換成正態分布,以滿足方差分析和t檢驗的要求。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論