衛生統計ppt課件 第六章假設檢驗基礎_第1頁
衛生統計ppt課件 第六章假設檢驗基礎_第2頁
衛生統計ppt課件 第六章假設檢驗基礎_第3頁
衛生統計ppt課件 第六章假設檢驗基礎_第4頁
衛生統計ppt課件 第六章假設檢驗基礎_第5頁
已閱讀5頁,還剩128頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第六章假設檢驗基礎假設檢驗假設檢驗的概念與原理t檢驗二項分布與Poisson分布資料的Z檢驗假設檢驗與區間估計的關系假設檢驗的功效正態性檢驗一、假設檢驗的概念與原理統計描述統計推斷指標描述圖表描述參數估計假設檢驗統計分析

上一章介紹了統計推斷的一個方面,即總體均數的估計。本章將講述統計推斷的另一個方面,假設檢驗(hypothesistest)。區間估計和假設檢驗在原理上沒有根本區別,只是說明問題的角度不同。現以例6-1說明假設檢驗的基本原理和步驟。例6-1在某市城區6所小學按概率抽樣方法抽取400名小學生進行視力干預方法研究。基線調查時,干預組200人,屈光度的均數為-0.34D,標準差為0.12D,對照組200人,屈光度的均數為-0.57D,標準差為0.36D,試問干預組和對照組小學生屈光度在基線時總體均數有無差別?

講述抽樣誤差的概念時提到,從同一總體中隨機抽取樣本,所得樣本均數與總體均數以及樣本均數與樣本均數間是不同的,它們之間的差稱抽樣誤差,在抽樣研究中抽樣誤差是不可避免的,是必然存在的。具體到本例兩均數不同的可能原因有兩種:①兩個樣本是來自同一總體,其差僅僅是由抽樣誤差所致。②兩樣本不是來自同一總體,而是來自兩個不同的總體,其差不是由抽樣誤差所致(本質差異)。如何判斷是由那種原因所致,統計上是通過假設檢驗,按照小概率原理和反證法相結合來回答這個問題。假設檢驗的方法很多,但其檢驗的步驟是一致的。基本步驟如下:

二、檢驗假設的基本步驟1.

建立檢驗假設,確定檢驗水準進行假設檢驗首先必須建立檢驗假設,假設有兩種:一是無效假設(nullhypothesis)或稱零假設,用H0表示,二是備擇假設(alternativehypothesis)或稱對立假設,用H1表示。兩者都是根據推斷目的提出的對總體特征的假設,H0是從反證法的思想提出的,兩者既有聯系又是一對對立的假設。

假設檢驗主要是圍繞H0進行的,當H0被拒絕時,則接受H1,本例H0:干預組小學生和對照組小學生屈光度的總體均數相同(即)。H1:干預組小學生和對照組小學生屈光度的總體均數不同(即)。但要注意:在建立假設之前,應根據分析目的和專業知識明確使用單側檢驗還是雙側檢驗。上例是將干預組小學生屈光度的樣本均數-0.34D(它代表干預組未知的總體均數)與對照組小學生屈光度的樣本均數-0.57D(它代表對照組未知的總體均數)進行比較。研究者可能有兩種目的:①

推斷兩總體均數有無差別,既不論干預組小學生屈光度的總體均數高于還是低于對照組小學生屈光度的總體均數,兩種可能都存在,研究者同等關心,應用雙側檢驗(two-sidetest)。②

根據專業知識認為干預組小學生屈光度的總體均數不會低于對照組小學生屈光度的總體均數,或研究者只考慮干預組是否高于對照組,應用單側檢驗(one-sidetest)。又如比較兩種藥物療效時,若研究者能從專業知識上排除一種藥物不會比另一種藥物差時,只考慮前者是否優于后者,則用單側檢驗,若不能確定兩種藥物誰好誰差時,則用雙側檢驗。再如預實驗,具有探索性質的研究,亦用雙側檢驗,一般認為雙側檢驗較為穩妥,故常用。

現以常用的兩樣本均數的比較為例,用符號表示如下:樣本均數(其總體均數為)與已知總體均數為作比較

目的

H0H1雙側檢驗

是否

單側檢驗

是否

或是否

兩個樣本均數(其總體均數分別為與)的比較目的

H0H1雙側檢驗

是否

單側檢驗

是否

或是否

檢驗水準(significancelevel),符號為(也稱事先概率),常取0.05。應當強調的是:H0

,H1和的確定,以及單側檢驗或雙側檢驗的選擇都應結合研究設計,在未獲得樣本結果之前決定,而不能受樣本結果的影響。

2.

計算檢驗統計量

應根據資料的類型、設計方案、統計推斷目的和適用條件選擇檢驗統計量。如配對設計兩均數比較用配對t檢驗,完全隨機設計兩樣本均數比較可根據資料的特點選用統計量t,t’,z等。注意:所有的檢驗統計量都是在H0成立的前提下計算出來的。不同的統計量所涉及的統計分布是不同的。3.

確定P值,作出推斷結論

P值(也稱事后概率)其含義是指從H0規定的總體作隨機抽樣,其檢驗統計量等于及大于(或等于及小于)現有樣本獲得的檢驗統計量的概率。

上例用t檢驗,算得t=8.57。P值為,在的前提下抽樣,獲得的t值等于及小于-8.57和等于及大于8.57的概率。當求得檢驗統計量后,一般可通過查相應的統計表獲得P值。如例6-1,查t界值表,先從橫標目自由度=200,得8.57比界值3.34大,按題意用雙側檢驗,相對應縱標目雙側概率為0.001

,可見本例P<0.001。

根據獲得的事后概率P與事先規定的概率進行比較,看其是否為小概率事件而作出結論。推斷結論應包括統計結論和專業結論兩部分,統計結論說明有統計學意義(statisticallysignificant)或無統計學意義(nostatisticallysignificant),還必須結合專業得出最終結論。

一般地,當P≤時,按所取水準,拒絕H0,接受H1,有統計學意義(統計結論),可認為……不同或不等(專業結論),當P>時,按所取水準,不拒絕H0,無統計學意義,還不能認為……不同或不等。須知,拒絕H0,不能認為H0肯定不成立,雖然在H0成立的條件下出現等于及大于(或等于及小于)現有檢驗統計量的概率很小,但仍有可能出現,只是可能性很小而已;同理不拒絕H0,也不能認為H0肯定成立。由此可見假設檢驗的結論是概率性的,在拒絕H0或不拒絕H0時,都有可能犯錯誤,即第Ⅰ類錯誤和第Ⅱ類錯誤(第五節敘述)。第二節t檢驗

英國統計學W.S.Gosset(1908)導出了樣本均數的確切分布,即

t分布。

t分布的發現使小樣本的統計推斷成為可能,因而它被認為是統計學發展史上的里程碑之一。以t分布為基礎的檢驗稱為t檢驗。一、單樣本資料的t檢驗

一組樣本資料的t檢驗,也稱完全隨機設計單組均數的t檢驗。從總體中完全隨機的抽取一個含量為n的樣本,屬完全隨機設計。如欲比較樣本均數與已知總體均數(一般為理論值、標準值或經大量觀察所得的穩定值等),其比較目的是推斷樣本所代表的未知總體均數與已知總體均數是否相同。當樣本例數較小時,要求樣本取自正態總體。

這時檢驗統計量t值的計算按式

已知北方農村兒童前囟門平均閉合月齡為14.1月。某研究人員從東北某縣抽取36名兒童,得前囟門閉合月齡均值為14.3月,標準差為5.08月。問該縣兒童前囟門閉合月齡的均數是否大于一般兒童?

檢驗步驟如下:⑴

建立檢驗假設,確定檢驗水準H0:H1:

計算檢驗統計量t值現n=36,

14.3月,S=5.08月,

=14.1月按公式:⑶確定P值,作出推斷結論查附表2,t界值表,得單側P>0.25,按

α=0.05水準,不拒絕H0,無統計學意義,還不能認為該縣兒童前囟門閉合平均月齡大于北方農村兒童前囟門閉合的平均月齡。二、

配對設計資料t檢驗本方法適用于配對設計資料,配對設計是指將受試對象按某些重要特征相近的原則配成對子,每對中的兩個個體隨機分配給兩種處理。在醫學科學研究中配對設計主要有以下情況:①

同對的兩個受試對象分別給予兩種處理或同一受試對象分別給予兩種處理。②

同一受試對象處理前后的比較。配對設計下的數據具有一一對應的特征,對于這類問題人們關心的變量是對子效應的差值,而不是各自的效應值。與完全隨機設計相比,其可比性更好。解決這類問題首先要求出各對差值d的均數。理論上,若兩處理無差別,則差值d的總體均數應為0。因此可將配對設計的均數比較看成是樣本均數與總體均數0的比較。按下式計算檢驗統計量t值。

式中的為差值的樣本均數,為差值的標準差,為差值的標準誤,n為對子數。

例6-2為了研究孿生兄弟的出生體重是否是否與出生順序有關,共收集了15對孿生兄弟的出生順序和出生體重,見表6-2.試問孿生兄弟中先出生者的出生體重與后出生者的出生體重是否相同?編號先出生者體重后出生者體重差值12.792.690.1023.062.890.1732.342.240.1043.413.370.0453.483.50-0.0263.232.930.3072.272.240.0382.482.55-0.0793.032.820.21103.073.050.02113.613.580.03122.692.660.03133.093.20-0.11142.982.920.06152.652.600.05表6-215對孿生兄弟出生體重(kg)⑴

建立檢驗假設,確定檢驗水準H0:=0H1:≠0=0.05⑵

計算檢驗統計量t值本例⑶

確定P值,作出推斷結論查t界值表,得0.02<P<0.05,按所取水準,拒絕H0,接受H1,有統計學意義。可認為孿生兄弟的出生體重與出生順序有關,孿生兄弟中先出生者的出生體重大于后出生者的出生體重。例6-3用兩種方法測定12份血清樣品中Mg2+含量(mmol/L)的結果見表6-3。問兩種方法測定結果有無差別?試樣號甲基百里酚藍法葡萄糖激酶兩點法差值d10.940.92-0.0221.021.01-0.0131.141.11-0.0341.231.22-0.0151.311.320.0161.411.420.0171.531.51-0.0281.611.61091.721.720101.811.820.01111.931.930122.022.040.02表6-3

兩種方法測定血清Mg2+(mmol/L)的結果⑴

建立檢驗假設,確定檢驗水準H0:=0H1:≠0=0.05⑵

計算檢驗統計量t值⑶

確定P值,作出推斷結論查t界值表,得P>0.2,按所取水準,不拒絕H0,無統計學意義。還不能認為兩法測定結果不同。三、

兩組獨立樣本資料的t檢驗

有些研究的設計既不能自身配對,也不便異體配對,而只能把獨立的兩組相互比較。例如手術組與非手術組、新藥組與對照組。屬于完全隨機設計。兩個樣本均數比較的目的在于推斷兩個樣本所代表的兩總體均數1和2是否相等。

再如從兩個人群(某年齡組男性與女性)分別隨機抽取一定數量的觀察對象,測量某項指標進行比較,也屬于完全隨機設計的兩樣本比較。兩組獨立樣本資料的t檢驗的應用條件:

兩樣本取自正態總體,并且兩樣本所來自的總體方差相等,也稱方差齊。即1、兩樣本所來自的總體方差相等例6-4某醫師要觀察兩種藥物對原發性高血壓的療效,將診斷為Ⅱ期高血壓的20名患者隨機分為兩組(兩組患者基線時血壓之間的差別無統計學意義),一組用卡托普利治療,另以組用尼莫地平治療,3個月后觀察舒張壓下降的幅度,結果如下:試比較兩藥的降壓效果有無差異?卡托普利(X1)尼莫地平(X2)1211178131281349101098120107716兩組高血壓患者舒張壓的改變值

該資料是分別從兩研究的兩總體(兩種藥物)中抽取樣本,測量值均有度量衡單,屬于完全隨機設計。其目的是通過比較兩樣本均數,來推斷兩總體均數和有無差別。當兩樣本含量較小如()應用兩樣本均數比較的檢驗進行假設檢驗。

本例經方差齊性檢驗可認為總體方差和相等(具體假設檢驗方法后述)

建立假設,確定檢驗水準H0:H1:⑵計算檢驗統計量值今⑶

確定值,作出推斷結論查附表2,界值表,得,按水準,不拒絕H0,無統計學意義,還不能認為兩種藥物的降壓效果有差異.2、兩樣本所來自的總體方差不相等

當兩小樣本(n1,n2

均小于50)比較,方差不齊時,可選擇:①采用適當的變量變換,使方差齊(見第七章);②采用非參數統計(見第九章);③采用近似法檢驗。近似t檢驗也稱t’檢驗例6-5

為了比較特殊飲食與藥物治療改善血清膽固醇(mmol/L)的效果,將24名志愿者隨機分為兩組,每組12人,甲組為特殊飲食組,乙組為藥物治療組.受試者試驗前后各測量一次血清膽固醇,差值的結果見表6-4,請比較兩種降血清膽固醇措施的效果是否相同?本例經方差齊性檢驗可認為總體方差不相等(具體假設檢驗方法后述)

組別例數均數標準差特殊飲食組120.55920.5110藥物治療組120.14670.1107表6-4

兩種降血清膽固醇措施差值的結果⑴

建立假設,確定檢驗水準H0:H1⑵計算檢驗統計量t值:⑶

確定值,作出推斷結論查t界值表,得0.02>P>0.01,按水準,拒絕H0,有統計學意義,可認為兩種降血清膽固醇措施的效果有差異.四、兩獨立樣本幾何均數比較的t

檢驗

例某疾病預防控制中心對所在地區小學生卡介苗的抗體滴度進行了監測,隨機抽取了30名學生,測得結果如下:問小學生卡介苗抗體效價有無性別差異?男生:1:401:201:1601:401;3201:801:401:201:401:801:1601:401:801:401:40

1:40女生:1:801:201:1601:401:401:1601:401:201;401:1601:1601:401:801:40該資料是分別從兩人群(研究的兩總體)中抽取樣本,測每一個觀察對象的抗體滴度值,屬于計量資料。各組的平均水平應用幾何均數反映其平均滴度。本例的目的是比較兩樣本滴度的幾何均數是否不同,來推斷兩總體幾何均數(平均滴度)有無差別,應用兩樣本幾何均數比較的t檢驗進行假設檢驗。步驟及公式同兩樣本均數比較的t檢驗,但要將觀察值進行對數變換。解題如下:⑴建立假設,確定檢驗水準H0:兩總體幾何均數相等H1:兩總體幾何均數不相等⑵計算檢驗統計量t

值將兩樣本的觀察值取對數后求和()、平方和()、標準差()、幾何均數的對數(),即

按兩獨立樣本t檢驗公式得:

自由度:

(3)

確定值,作出推斷結論查附表2,t界值表,得P>0.5,按水準,不拒絕HO,無統計學意義,尚不能認為小學生卡介苗抗體效價有性別差異。

案例

為觀察美能注射液對酒精性脂肪肝降血脂的作用,將72例酒精性脂肪肝患者隨機分為兩組,觀察組38例應用美能注射液靜脈注射,對照組34例口服非諾貝特膠囊,一個療程后比較兩組療效。結果見表5-7。

表5-7兩組患者治療前后血脂變化情況(mmol/L)

TC

TG

LDL-C

HDL-C

觀察組治療前6.60±1.123.32±1.223.86±0.760.82±0.1(n=38)治療后5.64±0.862.46±0.862.86±0.701.74±0.24

對照組治療前6.58±0.973.34±1.282.68±0.780.86±0.18(n=34)治療后5.49±0.822.34±0.882.58±0.661.68±0.18

分析

①該設計方案包括配對設計和完全隨機設計。②觀察組和對照組治療前后比較屬配對設計,應行配對t檢驗分別說明兩種藥物是否有效。③對于本例要比較兩種藥物何者為優,應分別計算出兩組治療前后的差值(分別反映兩種藥物的效應),形成兩個樣本(屬完全隨機設計)進行兩獨立樣本t檢驗,作出結論。④有統計學意義不等于有實際意義,還應考慮差值的平均水平是否達到或超過有實際意義的差值。五、兩組獨立樣本資料的方差齊性檢驗

兩小樣本均數比較時要求相應的兩總體方差相等,即方差齊,即使兩總體方差相等,由于抽樣誤差的原因使得樣本方差不一定相等,故要檢驗樣本方差不等是否由于抽樣誤差所致。方差齊性檢驗的目的是通過比較兩樣本的方差是否不同,來推斷兩總體方差和有無差別。

檢驗統計量按下式計算數理統計證明:當H0成立時,服從F分布。因此得到F值后,可通過查F界值表確定P值。例6-6某口腔醫院選擇所在市40-50歲慢性牙周炎患者36,測得吸煙組18人菌斑指數均值為84.71,標準差8.14;非吸煙組18人菌斑指數均值為82.20,標準差6.18,試檢驗兩總體方差是否相等?⑴建立假設,確定檢驗水準H0:兩總體方差相等

H1:兩總體方差不等

⑵計算檢驗統計量F值

⑶確定P值,作出推斷結論查附表3.2,(P473)F界值表,得,,按水準,不拒絕H0,無統計學意義,還不能認為兩總體方差不等。對例6-5進行方差齊性檢驗⑴建立假設,確定檢驗水準H0:兩總體方差相等即H1:兩總體方差不等即⑵計算檢驗統計量F值

從方差齊性檢驗公式可看出,其實質上對兩個總體的變異程度是否相同作推斷。因此,它還可以用于兩種方法測定的精度有無差別。例

將同一批液樣分成20份。隨機分成兩組,每組10份。用不同的方法分別檢測液樣中某種物質的含量(mmol/L)。結果兩種方法測得樣本均數相同,樣本標準差分別為1.02和0.56。問兩種方法檢測精度是否相同。查表3.2,F0.05/2,(9,9)=4.03,P>0.05。按檢驗水準,不拒絕H0,還不能認為兩種方法檢測精度不相同。六、z檢驗大樣本時使用,對正態性和方差齊性都不做要求。(一般兩組例數均≥50例)1.一組樣本資料的Z檢驗例為了解老年人的心理健康問題,隨機抽取了某市60歲及以上的常住老年人304人,用SCL-90量表進行測定,算得十項因子總分的均分為124.6,標準差為19.53,全國因子總分的均分為130,問該市老年人的總分是否與全國水平相同。本例的目的是比較樣本均數與已知的總體均數是否不同,來推斷樣本所來自的總體均數與已知的總體均數有無差別。樣本含量較大(大于50)。可應用Z檢驗。具體步驟:⑴建立假設,確定檢驗水準H0:該市老年人的總分與全國水平相同

即H1:該市老年人的總分與全國水平不同

⑵計算檢驗統計量Z

本例,,,,計算Z值。

⑶確定值,推斷結論查附表2,界值表,得,得,按水準,拒絕H0,接受H1,有統計學意義,可認為該市老年人的總分與全國水平不同,因子總分的均數低于全國水平。

2.兩組獨立樣本資料的Z

檢驗對例6-1在某市城區6所小學按概率抽樣方法抽取400名小學生進行視力干預方法研究。基線調查時,干預組200人,屈光度的均數為-0.34D,標準差為0.12D,對照組200人,屈光度的均數為-0.57D,標準差為0.36D,試問干預組和對照組小學生屈光度在基線時總體均數有無差別?

由于兩樣本含量大均大于50。應用兩樣本均數比較的Z

檢驗。具體步驟:⑴

建立假設,確定檢驗水準H0:干預組小學生和對照組小學生屈光度的總體均數相同(即)。H1:干預組小學生和對照組小學生屈光度的總體均數不同(即)。

⑵計算檢驗統計量Z值

本例,⑶

確定

P

值,作出推斷結論查附表2,t界值表,得,得,按水準,拒絕H0

,接受H1,有統計學意義,可認為干預組和對照組小學生屈光度在基線時總體均數有差別。第三節二項分布與Poisson分布資料的Z檢驗一、二項分布資料的Z檢驗1、一組樣本資料的Z檢驗二項分布的π或1-π不太小,n足夠大時,尤其是均大于5時,二項分布就近似正態分布,可用Z檢驗。檢驗統計量為例6-7某醫院稱治療聲帶白班的有效率為80%。今統計前來求醫的此類患者60例,其中45例有效。問該醫院宣稱療效是否客觀?⑴建立假設,確定檢驗水準⑵計算檢驗統計量Z值⑶確定P值,作出推斷結論

按查t界值表,得P>0.1,按檢驗水準不拒絕H0。可認為該醫院宣稱的有效率尚屬客觀。2、兩組獨立樣本資料的Z檢驗檢驗統計量為例6-8為了解某校本科生體質合格率的性別差異,隨機抽查了本科男生110人和女生130人,其中男生有100人合格,女生有70人合格,問該校本科男女生體質合格率是否不同?⑴建立假設,確定檢驗水準⑵計算檢驗統計量Z值⑶確定P值,作出推斷結論

按查t界值表,得P<0.001,按檢驗水準,拒絕H0。可認為男女生體質合格率不同。二、Poisson分布資料的Z檢驗當總體均數時,Poisson分布近似正態分布,可用Z檢驗對其總體均數進行推斷。

1、一組樣本資料的Z檢驗檢驗統計量為例6-9某市計劃2005年接種吸附百白破聯合疫苗后無菌化膿發生率控制在25/10萬人次以內。免疫接種的統計報告數據顯示2005年接種吸附百白破聯合疫苗125538人次,其中發生無菌化膿例數為38例,問該市無菌化膿發生率能否達到要求?⑴建立假設,確定檢驗水準⑵計算檢驗統計量Z值⑶確定P值,作出推斷結論得P>0.05,按檢驗水準,不拒絕H0。可認為該地區達到了預定目標。

2、兩組獨立樣本資料的Z檢驗當兩總體均數時,Poisson分布近似正態分布,可用Z檢驗對其總體均數進行推斷。檢驗統計量為:1)當兩樣本觀察單位數相等時2)當兩樣本觀察單位數不等時例6-10某市在對不同性別成年人意外傷亡情況有無差異的研究中,隨機抽取了該市2002年男女疾病監測數據各10萬人,因意外傷亡的人數男女分別為51人和23人.試問2002年不同性別每10萬人口意外傷亡死亡平均人數是否相等?建立假設,確定檢驗水準⑵計算檢驗統計量Z值⑶確定P值,作出推斷結論

按查t界值表,得按檢驗水準,拒絕H0。可認為該市不同性別意外傷亡死亡平均人數有差異,男性較高.例6-11某車間改革生產工藝前,測得三次粉塵濃度,每升空氣中分別有38、29、36顆粉塵;改進工藝后,測取兩次,分別為25、18顆粉塵。問工藝改革前后粉塵數有無差別?⑴建立假設,確定檢驗水準⑵計算檢驗統計量Z值⑶確定P值,作出推斷結論

按查t界值表,得

P<0.01,按檢驗水準,拒絕H0。可認為工藝改革前后粉塵濃度不同,改革后粉塵濃度低。

第四節假設檢驗與區間估計的關系假設檢驗與置信區間回答的問題不同,前者用于推斷兩總體均數有無差別,后者用于推斷總體均數在哪個范圍。兩者既有聯系又有區別1、置信區間具有假設檢驗的主要功能

算得的可信區間若包含H0,則按α水準不拒絕H0,若不包含H0,則按α水準拒絕H0,接受H1。編號先出生者體重后出生者體重差值12.792.690.1023.062.890.1732.342.240.1043.413.370.0453.483.50-0.0263.232.930.3072.272.240.0382.482.55-0.0793.032.820.21103.073.050.02113.613.580.03122.692.660.03133.093.20-0.11142.982.920.06152.652.600.05表6-215對孿生兄弟出生體重(kg)⑶

確定P值,作出推斷結論查t界值表,得0.02<P<0.05,按所取水準,拒絕H0,接受H1,有統計學意義。可認為孿生兄弟的出生體重與出生順序有關,孿生兄弟中先出生者的出生體重大于后出生者的出生體重。結合例6-2的資料,對每對孿生兄弟出生體重差值的總體均數做區間估計。的95%置信區間為顯然不在上述區間內,因此按檢驗水準,拒絕H0,結論與假設檢驗相同。卡托普利(X1)尼莫地平(X2)1211178131281349101098120107716兩組高血壓患者舒張壓的改變值⑶

確定值,作出推斷結論查附表2,界值表,得,按水準,不拒絕H0,無統計學意義,還不能認為兩種藥物的降壓效果有差異.計算例6-4兩個總體均數間差值的95%置信區間.同樣0不在計算的區間內因此按檢驗水準,拒絕H0,結論與假設檢驗相同。

2、置信區間可提供假設檢驗沒有提供的信息置信區間在回答差別有無統計學意義的同時,還可以提示差別有無實際意義。如降壓藥至少平均降低血壓10mmHg以上,才具有臨床治療意義,即10mmHg是才具有實際意義的值。見下圖。6-33、假設檢驗比置信區間多提供的信息在拒絕H0時,假設檢驗可提供確切的概率,而置信區間只能在檢驗水準上拒絕H0。在不拒絕H0時,假設檢驗可以對檢驗的功效作出估計,來評價是否在識別差異能力較強的情形下不拒絕H0的。而置信區間不能。因此,假設檢驗與置信區間既有聯系又有區別,互相補充,兩者結合起來才能更全面、完整的提供信息。在報道結果時,應給出統計量、P值和可信區間。

第五節

假設檢驗的功效一、假設檢驗的兩類錯誤從我們的主觀愿望來講,總是希望經過假設檢驗作出正確的推斷,既H0確實成立,則接受它;若H0確實不成立,則拒絕它。但在客觀上,我們是根據樣本確定的檢驗統計量來作出推斷的,由于存在抽樣誤差,在推斷時就不可能不犯錯誤.因此當拒絕或接受H0時,就有可能發生兩類錯誤:①

拒絕了實際上成立的H0,這類“棄真”錯誤稱第Ⅰ類錯誤(typeⅠerror)。②

不拒絕實際上不成立的H0,這類“存偽”錯誤稱第Ⅱ類錯誤(typeⅡerror)。

第Ⅰ類錯誤的概率用表示(即檢驗水準),假設檢驗時,研究者可依據不同的研究目的確定的大小。如取=0.05,當拒絕H0時,則理論上100次檢驗中平均有5次發生這樣的錯誤。第Ⅱ類錯誤概率用表示,它只有與特定的H1結合起來才有意義。

β的大小一般是未知的,但我們知道α與β有如圖3-6所示的關系,即α增大β減小,α減小β增大。要想同時減小α和β,則只有增大樣本含量。7-5實際工作中,可根據要求通過調整α來控制β,若目的是減小Ⅰ類錯誤,α可取的小一些,如α可取0.01,0.05;若目的是減小Ⅱ類錯誤,α可取的大一些,如α可取0.05,0.1或0.2等。二、假設檢驗的功效圖中1-β為檢驗功效能(powerofatest),也稱把握度或檢驗效能,其意義是兩總體確有差別,按α水準能發現它們有差別的能力。如1-β=0.9意味著兩總體確有差別,則理論上在100次檢驗中,平均有90次能夠得出差異有統計學意義的結論。總結如下:

客觀實際

拒絕H0

不拒絕H0

H0成立

Ⅰ類錯誤(α)推斷正確(1-α)

H0不成立

推斷正確(1-β)Ⅱ類錯誤(β)在同一檢驗水準α下,功效大的檢驗方法更可取。1、一組樣本資料t檢驗的功效首先計算Zβn為樣本含量,δ為要發現的最小差異或允許誤差,σ為總體標準差,Zα為假設檢驗的臨界值。根據Zβ(單側)反查標準正態分布表來確定β,最后得到1-β。例6-12已知北方農村兒童前囟門平均閉合月齡為14.1月。某研究人員從東北某縣抽取36名兒童,得前囟門閉合月齡均值為14.3月,標準差為5.08月。問該縣兒童前囟門閉合月齡的均數是否大于一般兒童?P>0.25,按α=0.05水準,不拒絕H0,無統計學意義,還不能認為該縣兒童前囟門閉合平均月齡大于北方農村兒童前囟門閉合的平均月齡.計算檢驗的功效1-β假定根據現有知識可以

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論