醫學統計學:假設檢驗的基本思想和步驟_第1頁
醫學統計學:假設檢驗的基本思想和步驟_第2頁
醫學統計學:假設檢驗的基本思想和步驟_第3頁
醫學統計學:假設檢驗的基本思想和步驟_第4頁
醫學統計學:假設檢驗的基本思想和步驟_第5頁
已閱讀5頁,還剩59頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

假設檢驗一、假設檢驗的基本思想

例7.2某醫生研究一種新的治療充血性心力衰竭的方法,對50位心功能在2~3級之間的成年男性患者進行4周的治療,考察其療效。評價療效的一個指標是鍛煉持續時間的增加量(min)。以前常規的治療方法能使患者的鍛煉持續時間平均增加3min。該醫生通過50位接受新方法治療的患者的數據算得鍛煉持續時間平均增加4min,標準差為1.5min。該新療法使患者鍛煉持續時間的平均增加量是否多于常規療法的3min?(u≠?)=3min常規方法:新方法:n=50=4min

S=1.5minu=?問題:

樣本均數與已知總體均數不等,可能

①由于抽樣誤差所致(u

=

兩總體均數相等)

②由于兩種治療方案導致差異(u≠)=3minun=50=4min

S=1.5min如何確定具體的原因,需通過分析樣本數據,從兩種假設中作抉擇。一種假設是“新療法使患者鍛煉持續時間的平均增加量等于常規療法的3min”,稱之為零假設(nullhypothesis),也稱無效假設或無差異假設,記為H0

,表示目前的差異是由抽樣誤差引起的;另一種假設是“新療法使患者鍛煉持續時間的平均增加量不等于常規療法的3min”,稱之為備擇假設(alternativehypothesis)或對立假設,記為H1

,表示兩者的療效存在本質不同。假設新療法和常規療法的療效相同,那么由于偶然性得到樣本均數等于及大于4min的可能性有多大?如果能算出這個可能性(即概率值)的大小,就可以下結論了。同樣如果某事件發生的可能性≤

5%,就認為是小概率事件,在一次試驗中幾乎不會發生。

如果算出的概率P值≤5%,就可以拒絕H0,認為與的差別是不是偶然性造成的,新療法和常規療法在延長鍛煉持續時間上存在差異。

如果算出的概率P值>5%,就不能拒絕H0,認為與的差別是偶然性造成的,新療法和常規療法在延長鍛煉持續時間上不存在差異。

確定P值的大小是假設檢驗的關鍵。

假設成立,則可將用公式P值指零假設成立的條件下,出現等于及大于(或等于及小于)現有樣本統計量的概率。

查t界值表,自由度v近似取50,可得到P

<0.001

。說明在零假設成立的前提下,出現樣本均數等于及大于4min可能性很小(P

<0.001)。這是一個小概率事件,我們認為在一次試驗中幾乎不會發生,但現在發生了,只有懷疑原假設不成立。

假設檢驗的目的是推斷樣本統計量之差是由于總體參數存在差異造成的,抑或由于抽樣誤差造成的。

假設檢驗的基本思想是在總體參數相等這一假設成立的前提下,計算出現等于及大于(或等于及小于)現有樣本統計量的可能性(P值)。如果P值很小,小于等于事先規定的一個界值(例如5%),結論就是拒絕假設“總體參數相等”,認為總體參數之間存在差異。如果P值大于事先規定的界值,就不能拒絕這個假設,尚不能認為總體參數之間存在差異。二、假設檢驗的基本步驟1、建立檢驗假設,確立檢驗水準。

①檢驗假設(hypothesisundertest/tobetested)

無效假設(nullhypothesis):②備擇假設(alternativehypothesis)

對立假設:*檢驗假設是針對總體而非樣本;

*H0和H1是相互聯系、對立的假設,兩者缺一不可

*H0為無效假設,其假定通常是:某兩個(或多個)總體參數相等,或某兩個總體參數之差等于0

*H1的內容反映了檢驗的單雙側。若H1假設為

0或

<

0,則為單側檢驗(one-sidedtest)。若H1為

0,則為雙側檢驗(two-sidedtest)。單雙側檢驗應根據專業知識事先確定。③檢驗水準(sizeofatest),又稱

水準:過去稱顯著性水準(significancelevel)。是預先規定的概率值,它確定了小概率事件的標準。

為I型錯誤的概率大小。實際工作中常取

=0.05。注意:H0和

H1

的確定,以及單、雙側的選擇,都應結合研究設計,在未獲得樣本結果之前決定。2、選擇檢驗方法、計算檢驗統計量

根據分析目的、資料類型、設計類型、樣本大小、方法的適用條件等選擇相應的檢驗方法并計算檢驗統計量。所有檢驗統計量都是在假設H0

成立的條件下計算出來的,它是用于決定是否拒絕H0

的統計量,其統計分布在統計推斷中至關重要。3、確定P值和作出推斷結論

根據算出的檢驗統計量如t、Z值,查相應的界值表,即可得到概率P。

P是指從H0規定的總體作隨機抽樣,抽得等于及大于現有樣本獲得的檢驗統計量值的概率。推斷結論應包括統計結論與專業結論兩部分:

P≤α

,按α

水準,拒絕H0,接受H1,有統計學意義(統計結論),可認為……不同或不等(專業結論)

。

P>α

,按α

水準,不拒絕H0,無統計學意義,尚不能認為……不同或不等。統計結論只說明有統計學意義或無統計學意義,而不能說明專業上的差異大小。應注意統計學意義與專業意義的區別。

當P≤α,結論為按所規定α檢驗水準,拒絕H0

,接受H1

。因為現有樣本信息不支持H0

成立,故拒絕H0。顯然,拒絕H0,不能認為H0肯定不成立。Ⅰ型錯誤。相反,如P>α,即樣本信息支持H0成立,故不拒絕H0

。同樣,不拒絕H0

,也不能認為H0肯定成立。Ⅱ錯誤。假設檢驗必須對所檢驗的假設作出明確判斷。從“拒絕”或“不拒絕”中選擇一個較為合理的決定,因此,假設檢驗結論具有概率性。不論拒絕或不拒絕H0,都可能犯錯誤:Ⅰ型或Ⅱ型錯誤。三、Ⅰ型錯誤與Ⅱ型錯誤。I型錯誤

拒絕了實際上正確的H0,這類“棄真”的錯誤稱為I型錯誤,其概率大小為

。如規定

=0.05,當拒絕H0時,則理論上100次檢驗中平均有5次發生這樣的錯誤。

II型錯誤

不拒絕實際上不成立的H0,這類“存偽”的錯誤稱為II型錯誤,其概率大小用

表示,其大小未知t

(界值)H0H1αβ圖7.1兩型錯誤示意圖(以單側t檢驗為例)

假設檢驗的結論拒絕不拒絕(“接受”)正確I型錯誤(α

)推斷正確(1-α

)不正確推斷正確(1-β

)II型錯誤(β

)真實情況I型錯誤和II型錯誤

1

稱為檢驗效能(powerofatest)。其意義是當兩總體參數確實存在差異即H1:

0成立,使用假設檢驗方法能夠發現差異(即拒絕H0)的能力。

如1

=0.90,意味著若兩總體確有差別,則理論上在100次檢驗中,平均有90次能夠得出有統計學意義的結論。

拒絕H0,只可能犯I型錯誤,不可能犯II型錯誤;不拒絕H0,只可能犯II型錯誤,不可能犯I型錯誤。

愈小,

愈大;反之

愈大,

愈小。若要同時減小I型錯誤

以及II型錯誤

,則只有增加樣本含量n。

五、假設檢驗的注意事項嚴密的研究設計這是假設檢驗的前提。包括隨機抽樣和組間的可比性等。

2.數據應該滿足假設檢驗方法的前提條件

應根據分析目的、資料類型、設計方案、資料的分布、樣本含量的大小以及方法的適用條件等選擇適宜的統計檢驗方法。3.正確理解假設檢驗中概率P的含義

P值是指在成立的前提下,出現現有樣本統計量以及更極端情況的概率。P值越小說明當前樣本的證據越傾向于拒絕H0,當P值小于等于事先規定的檢驗水準時,就拒絕H0。

P值的大小不僅與總體參數間的差別有關,而且與抽樣誤差等有關。不能認為P值越小,總體參數間的差別越大。P值越小,說明實際觀測到的差異與之間不一致的程度就越大,越有理由拒絕。假設檢驗只做出拒絕或不拒絕的定性結論,但不能給出總體參數間差別大小的結論。4.結論不能絕對化

報告結果時應注意措辭,應列出檢驗水準、檢驗統計量值,P值的確切范圍、統計結論和專業結論。5.正確理解“顯著性”、“統計學意義”與“專業意義”

1)差別具有“顯著性”指差別具有“統計學意義”;

2)具有“統計學意義”不一定具有“專業意義”

六、假設檢驗與區間估計的聯系

假設檢驗用于推斷總體參數是否不相等。兩者既有區別,又有聯系。

就同一份資料,如例7.3,若假設檢驗的結果是,拒絕H0,接受H1,則其(1-

)的置信區間必定不包括所規定的總體參數,反之亦然。置信區間能夠給出總體參數的可能范圍,而假設檢驗能夠給出一個確切的概率P值。圖7.2置信區間提供的信息

置信區間與假設檢驗的作用是相輔的,若兩者結合起來,可以提供更為全面的統計推斷信息。因此學術期刊建議論文在報告假設檢驗結論的同時,應該報告相應的區間估計的結果。

t檢驗

假設檢驗一般以檢驗統計量命名,如t檢驗應用時應了解各種檢驗方法的應用條件和檢驗統計量的計算方法。然后按假設檢驗的一般步驟來處理實際問題。

t檢驗的應用條件:①樣本取自正態總體;②σ未知且n較小–單樣本t檢驗;③兩小樣本均數比較時,兩樣本的總體方差相等;若兩總體方差不齊可用t’檢驗;④兩大樣本均數比較時,可用Z檢驗。

1、樣本均數與總體均數比較的t檢驗

樣本均數與已知總體均數(理論值、標準值或經過大量觀察所得的穩定值)比較,其目的是推斷樣本所代表的未知總體均數u與已知總體均數有無差別。若n較大,則,可按算得的t值用v=∞查t界值表(t即為Z)得P值。v=n-1

例8.1

(1)建立檢驗假設,確定檢驗水準

H0:

=3.36,該地農村新生兒體重與該地新生兒平均體重相同

H1:

3.36,該地農村新生兒體重與該地新生兒平均體重不同

=0.05(2)計算統計量

已知n=40,=3.27kg,S=0.44kg,=3.36kg。按式(8.1)=n–1=40–1=39(3)確定P值,作出統計推斷

查附表3,t界值表,t=-1.294的絕對值,得0.2<P<0.4,按=0.05檢驗水準,不拒絕H0,差異無統計學意義,尚不能認為該地農村新生兒體重與該地新生兒平均體重相同。2、配對設計均數比較的t

檢驗(配對t

檢驗)配對設計:①配對的兩個受試對象分別接受兩種處理②同一樣品用兩種方法或儀器檢測的結果③同一受試對象兩個部位的檢測結果配對t

檢驗目的是推斷兩種處理或方法的結果有無差別

首先求出各對差值,再求出差值的均數。若兩種處理效應相同,差值的總體均數應為0,因此配對設計的均數比較可看成是差值的樣本均數與總體均數0的比較。見例8.2該資料為配對設計,所以可以用配對t檢驗作統

計推斷,具體步驟如下:(1)建立檢驗假設,確定檢驗水準H0:兩種方法檢驗結果相同,即

d=0

H1:兩種方法檢驗結果不同,即

d

0

=0.05(2)計算統計量

差值的標準差為

=3.250按公式

=n–1=12–1=11(3)確定P值,作出統計推斷

查附表2,t界值表,得P<0.001,按

=0.05水準拒絕H0,差異有統計學意義,可以認為兩種方法檢查的結果不同。3、兩樣本均數比較的t檢驗

為兩樣本均數差值的標準誤

在兩總體方差相等的條件下,可將兩方差合并,求合并方差(pooledvariance)例8.3組別例數均數標準差銀屑病患者12182.427.7正常人12149.719.5表8.2銀屑病組與正常對照組的血清IL-6(pg/ml)(1)建立假設檢驗,確定檢驗水準

H0:

1=

2,銀屑病患者與正常人血清IL-6均數相等,

H1:

1

2,銀屑病患者與正常人血清IL-6均數不相等,

=0.05(2)計算統計量

今n1=12,=182.4pg/mL,S1=27.7pg/mL,n2=12,=149.7pg/mL,S2=19.5pg/mL按式(8.4)得=n1+n2–2=12+12–2=22

(3)確定P值,作出統計推斷

查附表3,t界值表,得0.002<P<0.005,按

=0.05水準拒絕H0,接受H1,差異有統計學意義,故可認為銀屑病患者與正常人血清IL-6均數不同,銀屑病患者的血清IL-6較高。

當兩樣本均大于50,即使總體分布偏離正態,其樣本均數仍近似正態分布,可用Z檢驗。本資料是成組設計的兩樣本均數比較,可用t檢驗,

由于兩樣本含量皆較大,也可用Z檢驗以簡化算。

(1)建立假設檢驗,確定檢驗水準H0:該市高碘區與非高碘區兒童智力均數相等,即

1=2

H1:該市高碘區與非高碘區兒童智力均數不等,即

1

2=0.05(2)計算統計量

今=73.07,

S1=10.75,n1=100=80.30,S2=11.83,n2=105(3)確定P值,作出統計推斷

查附表2,t界值表(

=

時),得P<0.001,按

=0.05水準拒絕H0,接受H1,差異有統計學意義,可認為該農村高碘區與非高碘區兒童智力均數不等,高碘區較低。兩樣本幾何均數比較的t檢驗見教材例8.4t檢驗的應用條件:①樣本取自正態總體;②σ未知且n較小–單樣本t檢驗;③兩小樣本均數比較時,兩樣本的總體方差相等;若兩總體方差不齊可用t’檢驗;④兩大樣本均數比較時,可用Z檢驗。

正態性檢驗圖示法

方格坐標紙圖正態概率紙圖

P-P圖(Proportion-proportionplots)統計檢驗方法W檢驗(S.S.ShapiroandM.B.Wilk)D檢驗(D’Agostino)方差齊性檢驗

根據

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論