參數估計與假設檢驗2016-7-3_第1頁
參數估計與假設檢驗2016-7-3_第2頁
參數估計與假設檢驗2016-7-3_第3頁
參數估計與假設檢驗2016-7-3_第4頁
參數估計與假設檢驗2016-7-3_第5頁
已閱讀5頁,還剩87頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

參數估計與假設檢驗實例結果

(1)現患狀況:瀏陽市18歲以上成年人糖尿病患病率為5.4%(95%CI:4.8%-5.9%),其中男性為5.0%(95%CI:4.3%-5.8%),女性為5.7%(95%CI:4.9%-6.7%);高血壓患病率為27.2%(95%CI:26.0%-28.4%),其中男性為26.5%(95%CI:24.9%-28.1%),女性為27.9%(95%CI:26.3%-29.7%);糖尿病患者合并高血壓的患病率為2.6%(95%CI:2.2%,3.1%),其中男性為2.4%(95%CI:1.9%,2.9%),女性為2.9%(95%CI:2.3%,3.6%),糖尿病患者中合并高血壓的比例為48.7%(148/304)。非條件多因素logistic回歸分析結果顯示與糖尿病有關的因素是:既往吸煙1.890(95%CI:1.175,3.040)、飲酒0.684(95%CI:0.482,0.970)、膽固醇1.411(95%CI:1.003,1.986)、甘油三酯2.190(95%CI:1.671,2.871)、腹型肥胖1.750(95%CI:1.358,2.253)、高血壓1.760(95%CI:1.362,2.274),

非條件多因素logistic回歸分析結果顯示有既往吸煙1.936(95%CI:1.059,3.540)、甘油三酯異常3.236(95%CI:2.267,4.619)、肥胖5.343(95%CI:1.174,24.325)、腹型肥胖1.737(95%CI:1.119,2.699),表3-1瀏陽市18歲以上不同性別、年齡糖尿病患病率年齡(歲)男

性女

性合

計調查數患病數率(%)調查數患病數率(%)調查數患病數率(%)18-2923710.423310.447020.430-39400

9

2.341281.98121721880374.21743643.750-59630447.0530427.91160867.760-69501336.63584011.2859738.570-792622911.1216209.34784910.280以上7268.37479.5146138.9合計29651495.027031555.756683045.4表3-5糖尿病合并高血壓單因素分析結果因素糖尿病組非糖尿病組檢驗統計量P值性別:男70(3.2)21021.8010.180

女78(4.0)1871年齡(歲):18-291(0.2)456131.9760.00030-395(0.7)72640-4926(1.9)137350-5944(5.9)72360-6946(9.4)44270-7918(8.4)19780以上8(12.5)56婚姻:

未婚5(2.2)22027.0160.000已婚120(3.3)3504喪偶22(9.7)204離異1(2.4)40本章開始學習統計推斷(statisticalinference)方法,內容涉及參數估計和假設檢驗的基本概念和原理。

統計推斷參數估計假設檢驗總體樣本抽取部分觀察單位

統計量

參數

統計推斷統計推斷

statisticalinference如:樣本均數樣本標準差S

樣本率P如:總體均數總體標準差總體率參數估計(estimationofparameters)

包括:點估計與區間估計假設檢驗(testofhypothesis)

統計學中的統計推斷包括兩個重要的方面:一是利用樣本統計量的信息對相應總體參數值做出推斷,如用樣本均數估計總體均數,用樣本標準差S估計總體標準差等,稱之為點估計。另一個是利用樣本統計量來推斷我們是否接受一個事先的假設,稱之為假設檢驗。本章只討論參數估計,假設檢驗將在下一章中討論。而參數估計又分為點估計與區間估計。

一、抽樣誤差在醫學研究中,絕大多數情況是由樣本信息推斷總體特征。由于個體存在差異,因此通過樣本推論總體時會存在一定的誤差,如樣本均數往往不等于總體均數,這種由抽樣造成的樣本統計量與總體參數的差異稱為抽樣誤差(samplingerror)。第一節參數估計抽樣試驗

從正態分布總體N(5.00,0.502)中,每次隨機抽取樣本含量n=5,并計算其均數與標準差;重復抽取1000次,獲得1000份樣本;計算1000份樣本的均數與標準差,并對1000份樣本的均數作直方圖。按上述方法再做樣本含量n=10、樣本含量n=30的抽樣實驗;比較計算結果。抽樣試驗(n=5)抽樣試驗(n=10)抽樣試驗(n=30)1000份樣本抽樣計算結果總體的均數總體標準差s均數的均數均數標準差n=55.000.504.990.22120.2236n=105.000.505.000.15800.1581n=305.000.505.000.09200.09133個抽樣實驗結果圖示(一)均數的標準誤統計學中為了區別個體觀察值之間變異的標準差與反映樣本均數之間變異的標準差,將后者稱為均數的標準誤(standarderrorofthemean)。顯然,均數的標準誤小于原始測量值的標準差,均數的標準誤越小說明估計越精確,因此可以用均數的標準誤表示均數抽樣誤差的大小。均數的標準誤用符號表示,計算公式為:

在樣本含量一定的情況下,均數的標準誤與標準差成正比,均數的標準誤與樣本含量的平方根成反比,說明在同一總體中隨機抽樣,樣本含量越大,均數的標準誤越小。均數的標準誤反映了樣本均數間的離散程度,也反映了樣本均數與總體均數的差異。

統計上通常將統計量(如樣本均數、樣本率p等)的標準差稱為標準誤(standarderror,SE)。所以,樣本均數的標準差又稱為樣本均數的標準誤,是反映樣本均數抽樣誤差大小的指標。

特點:

1.總體標準誤的大小與總體標準差成正比,與樣本含量的平方根成反比。即當樣本含量n一定時,標準差越大,即樣本的個體差異越大,標準誤就越大,樣本均數的抽樣誤差就越大;標準差越小,標準誤就越小,即樣本均數抽樣誤差就越小。

2.當標準差一定時,n越大,標準誤就越小;n越小,標準誤就越大。故影響抽樣誤差大小的主要因素是樣本含量。作為總體參數(常數)通常是未知的,因而,在實際工作中常用樣本標準差S來估計。

實際中,總體標準差往往未知,因而通常用樣本標準差代替,求得樣本均數標準誤的估計值,計算公式為:例3-1

在某地隨機抽查成年男子140人,得紅細胞均數,標準差,試計算其標準誤。 按公式計算得:(二)率的標準誤樣本率的標準差也稱為率的標準誤(standarderrorofrate),可用來描述樣本率抽樣誤差的大小。率的標準誤越小,則率的抽樣誤差越小,率的標準誤越大,則率的抽樣誤差越大。公式為:在一般情況下,總體率往往是未知的,此時可用樣本率來代替總體率,其估計值為:二、可信區間的概念點估計:是使用單一的數值直接作為總體參數的估計值,如用估計相應的,用估計相應的。該法表達簡單,但未考慮抽樣誤差的影響,無法評價參數估計的準確程度。區間估計(intervalestimation)是指按預先給定的概率,計算出一個區間,使它能夠包含未知的總體均數。事先給定的概率稱為可信度,計算得到的區間稱為可信區間(confidenceinterval,CI)。總體均數的估計

總體均數的點估計(pointestimation)與區間估計參數的估計點估計:由樣本統計量直接估計總體參數區間估計:在一定可信度(Confidencelevel)下,同時考慮抽樣誤差區間估計總體均數的區間估計(intervalestimation)是利用樣本信息給出一個區間,并同時給出重復試驗時該區間包含總體均數的概率。

1)可信區間的涵義

從總體中作隨機抽樣,對于含量為n的每個樣本而言,都可以算得一個區間。以95%的可信區間為例,意味著在同一總體中作100次重復抽樣,可得100個可信區間,平均有95個可信區間包含總體均數(估計正確),只有5個可信區間不包含總體均數(估計不正確),或對于某一個區間而言,它包含總體均數的可能性為95%,而不包含總體均數的可能性僅為5%。因此在實際應用中,以這種方法估計總體均數犯錯誤的概率僅為5%。

2)可信區間具有兩個要素

(1)準確度(accuracy),即可信區間包含的概率的大小,一般而言概率越大越好。

(2)精密度(precision),反映區間的長度,區間的長度越窄,估計的精密度越好,反之越差。

(一)已知一般情況其中為標準正態分布的雙側界值。

95%可信區間:三、總體均數的區間估計(二)未知通常未知,這時可以用其估計量S代替,但已不再服從標準正態分布,而是服從著名的t分布。

圖6-1

不同自由度的t

分布圖

ConfidenceintervalWilliamGosset可信區間的計算:原理與前完全相同,僅僅是兩側概率的界值有些差別。即需要注意:在小樣本情況下,應用這一公式的條件是原始變量服從正態分布。在大樣本下可以用替換。可信區間:Confidenceinterval例3-2

某醫生測得25名動脈粥樣硬化患者血漿纖維蛋白原含量的均數為3.32g/L,標準差為0.57g/L,試計算該種病人血漿纖維蛋白原含量總體均數的95%可信區間。下限:上限:Confidenceinterval例3-3

試計算例6-1中該地成年男子紅細胞總體均數的95%可信區間。本例屬于大樣本,可采用正態近似的方法計算可信區間。因為,則95%可信區間為:

下限:上限:Confidenceinterval單側可信區間:前面涉及的都是雙側可信區間。但有些情況下,我們所關心的僅僅是單側的可信限。單側可信區間與雙側可信區間的計算公式基本相同,只需將公式中的抽樣分布的雙側界值換成單側界值,同時只取下限或上限。Confidenceinterval實際中,有時需要計算兩個總體均數差值的可信區間,例如通過計算兩種降壓藥物平均降壓的差值比較兩種藥物的差別,其雙側可信區間的計算公式為 其中,為自由度,為兩樣本均數之差的標準誤。

四、兩總體均數差的區間估計當兩總體方差相同時,其中為兩樣本的合并方差。當兩樣本的樣本含量均較大時,上述計算可信區間中的可用相應的代替,而且無論兩總體的方差是否相同,有Confidenceinterval例3-4

評價復方纈沙坦膠囊與纈沙坦膠囊對照治療輕中度高血壓的有效性,將123名患者隨機分為兩組,其中試驗組和對照組分別為54例和48例。經六周治療后測量收縮壓,試驗組平均下降15.77mmHg,標準差為13.17mmHg;對照組平均下降9.53mmHg,標準差為13.55mmHg。試估計兩組收縮壓平均下降差值的95%可信區間。Confidenceinterval由公式計算:下限:上限:五、總體率的區間估計

1.

樣本率的區間估計:利用二項分布可估計其總體率可信區間,一般取。對于,且接近于0或1時,可直接查附表6百分率的可信區間表得到其總體率的可信區間。例3-52003年4~6月某醫院重癥監護病房收治重癥SARS患者38人,其中死亡14人,求SARS病死率的95%可信區間。(查附表6,95%的可信區間為22%~54%)。

2.當較大,和均不太小,如和均大于5時,可利用樣本率近似服從正態分布的原理來估計總體率的可信區間,計算公式為

,例6-6

某區疾病預防控制中心2002年對該鄉鎮250名小學生進行貧血的檢測,結果發現有86名貧血者,檢出率為34.40%,求貧血檢出率95%的可信區間。

六、兩總體率差值的區間估計在大樣本情況下,可采用正態近似法對兩總體率差值進行可信區間估計,其計算公式為:X1和X2分別表示兩組中某事件發生的例數。例3-7

某醫院口腔科醫生用極固寧治療牙本質過敏癥,以雙氟涂料作對照,進行了1年的追蹤觀察,結果見表6-1所示,試估計兩組有效率差別95%的可信區間。

表6-1治療牙本質過敏癥兩組有效率的比較組別總牙數有效數有效率(%)試驗組776179.22對照組693855.07合計1469967.81Confidenceinterval本例:

兩組總體率差別95%的可信區間為

Confidenceinterval第二節假設檢驗一、基本原理假設檢驗(hypothesistest):統計推斷另一重要內容,其目的是比較總體參數之間有無差別。

例3-8

使用黑加侖油軟膠囊治療高脂血癥,30名患者治療前后的血清甘油三酯檢測結果的差值為1.38±0.76(mmol/L),問治療后血清甘油三酯是否有所改善?假設檢驗過去稱顯著性檢驗。它是利用小概率反證法思想,從問題的對立面(H0)出發間接判斷要解決的問題(H1)是否成立。然后在H0成立的條件下計算檢驗統計量,最后獲得P值來判斷。

假設檢驗基本思想

樣本治療前后甘油三酯的變化(差值)問題歸納:樣本療效藥物作用+機遇

對上面問題可以作如下考慮:

問題:究竟多大能夠下“有效”的結論?Hypothesistest假設的基本思想是,首先對所需要比較的總體提出一個無差別的假設,然后通過樣本數據去推斷是否拒絕這一假設。如服從t分布圖3-2

利用t分布進行假設檢驗原理示意圖Hypothesistest假設檢驗步驟

Procedureofhypothesistesting

Step1:setuptesthypothesis(H0vs.H1)andsignificantlevel,Nullhypothesis:Theobserveddifferenceisduetochance(I.e.,thereisnorealdifference),Alternativehypothesis:Thereisarealdifference;Step2:selectandcalculatethestatistic;Step3:findthePvalueandmakeaconclusion.除t分布外,針對不同的資料還有其他各種檢驗統計量及分布,如F分布、分布等,應用這些分布對不同類型的數據進行假設檢驗的步驟相同,其差別僅僅是需要計算的檢驗統計量不同。

二、基本步驟(一)建立假設和確定檢驗水準假設檢驗中,包括原假設(nullhypothesis)和備擇假設(alternativehypothesis)兩種假設。Hypothesistest原假設符號為,指需要檢驗的假設,如治療前后血清甘油三酯沒有差別,即這一假設通常與我們要驗證的結論相反,是計算檢驗統計量和P值的依據。備擇假設符號為,是在成立證據不足的情況下而被接受的假設,如拒絕治療前后血清甘油三酯相同的假設,可表示為

Hypothesistest備擇假設有雙側和單側兩種情況。雙側檢驗指無論是正方向還是負方向的誤差,若顯著地超出檢驗水準則拒絕,即為雙側檢驗。單側檢驗指僅在正方向或負方向誤差超出規定的水準時則拒絕,如治療后血清甘油三酯下降的假設可表示為:或雙側檢驗和單側檢驗應如何選擇,需根據研究目的和專業知識而定。 Hypothesistest建立檢驗假設的同時,還必須給出檢驗水準。檢驗水準亦稱顯著性水準(significantlevel),用

表示,是預先規定的拒絕域的概率值,實際中一般取或。顯然,值越大越容易得出有差別的結論。Hypothesistest(二)選擇檢驗方法和計算檢驗統計量根據資料類型、研究設計方案和統計推斷的目的,選擇適當的檢驗方法和計算公式。許多假設檢驗方法是以檢驗統計量來命名的,如t檢驗、z檢驗、F檢驗和檢驗等。Hypothesistest(三)根據P值做出統計推斷查表得到檢驗用的臨界值,然后將算得的統計量與拒絕域的臨界值作比較,確定值。如對雙側檢驗,則,按檢驗水準拒絕,接受;若,則不能拒絕

。HypothesistestJerzyNeyman若,不拒絕H0,但不能下“無差別”或“相等”的結論,只能下“根據目前試驗結果,尚不能認為有差別”的結論。

t檢驗概述

BASICCONCEPTIONOFtTESTStudent'st-testAmethodoftestinghypothesesaboutthe

mean

ofasmallsampledrawnfromanormallydistributedpopulationwhenthepopulationstandarddeviationisunknown.In1908WilliamSealyGosset,publishingunderthepseudonymStudent,developedthet-testandtdistribution.Thetdistributionisafamilyofcurvesinwhichthenumberofdegreesoffreedomspecifiesaparticularcurve.Asthesamplesizeincreases,thetdistributionapproachesthebellshapeofthestandardnormaldistribution.Inpractice,fortestsinvolvingthemeanofasampleofsizegreaterthan30,thenormaldistributionisusuallyapplied.Preferablewhenthen<60Certainlyifn<30t檢驗的應用條件

AssumptionsNormaldistribution(正態分布)Equalvariance(兩總體方差相等(方差齊性)Randomsampling(隨機樣本)t檢驗依據的檢驗統計量是服從t分布的t值兩獨立樣本均數的t檢驗

ttestforIndependentsamples

兩樣本的完全隨機分組設計,即將受試對象(試驗單位)完全隨機地分為兩組,分別接受兩種不同的處理。由于當兩組樣本含量相等,兩個樣本均數之差的抽樣誤差最小,檢驗效能最高,故應采用適當的隨機分組方法,如隨機排列的分段隨機化,使兩組樣本含量相等。The2SampleIndependentt-TestUsedtocomparemeansbetweentwogroups.Assumesthedataarecontinuousandhaveasymmetric,uni-modal(onepeak)distribution.Assumesthetwogroupsareindependent.Thetteststatisticinvolvesthedifferencebetweenthesampleaveragesofthe2groups.Usingourknowledgeofthedistribution,wecancomputeap-valuetohelpdecidewhetherornottorejectthenullhypothesis.完全隨機設計資料的一般形式設有兩個平均數的差值-=d,統計學認為,從樣本直接得出的結論是不可靠的。因為抽樣誤差的隨機性,每次抽樣兩樣本平均數的差并不均等于d。造成這種差異可能有兩種原因

品種造成的差異,即是兩總體本質不同所致

試驗誤差(或抽樣誤差)The2SampleIndependentt-Test正常成年男性血紅蛋白

140g/L

130.83g/L男性鉛作業工人血紅蛋白

140g/L一種假設H0另一種假設H1抽樣誤差總體不同

本質差異抽樣研究:通過樣本研究其所代表的總體。設兩個總體平均數分別為,試驗研究的目的,就是要給、是否相同做出推斷。由于總體平均數、未知,在進行顯著性檢驗時只能以樣本平均數、作為檢驗對象,更確切地說,是以(-)作為檢驗對象。為什么以樣本平均數作為檢驗對象呢?這是因為樣本平均數具有下述特征:

1、離均差的平方和∑(-)2最小。說明樣本平均數與樣本各個觀測值最接近,平均數是資料的代表數。

2、樣本平均數是總體平均數的無偏估計值,即E()=μ。

3、根據統計學中心極限定理,樣本平均數服從或逼近正態分布。

由上所述,一方面我們有依據由樣本平均數和的差異來推斷總體平均數、相同與否,另一方面又不能僅據樣本平均數表面上的差異直接作出結論,其根本原因在于試驗誤差(或抽樣誤差)的不可避免性

通過試驗測定得到的每個觀測值,既由被測個體所屬總體的特征決定,又受個體差異和諸多無法控制的隨機因素的影響。所以觀測值由兩部分組成,即

=+

總體平均數反映了總體特征,表示誤差。若樣本含量為n,則可得到n

個觀測值:,,,。于是樣本平均數

說明樣本平均數并非總體平均數,它還包含試驗誤差的成分,對于接受不同處理的兩個樣本來說,則有:

=+,=+

這說明兩個樣本平均數之差(-)也包括了兩部分:一部分是兩個總體平均數的差(-),叫做試驗的處理效應(treatmenteffect);另一部分是試驗誤差(-)。

樣本平均數的差(-)包含有試驗誤差,它只是試驗的表面效應。因此,僅憑(-)就對總體平均數、是否相同下結論是不可靠的。只有通過顯著性檢驗才能從(-)中提取結論。對(-)進行顯著性檢驗就是要分析:試驗的表面效應(-)主要由處理效應(-)引起的,還是主要由試驗誤差所造成。雖然處理效應(-)未知,但試驗的表面效應是可以計算的,借助數理統計方法可以對試驗誤差作出估計。所以,可從試驗的表面效應與試驗誤差的權衡比較中間接地推斷處理效應是否存在,這就是顯著性檢驗的基本思想。例如:兩樣本比較的u檢驗(two-sampleu-test)

適用于兩樣本含量較大(如n1>30且n2>30)時。檢驗統計量為

兩均數之差的標準誤的估計值兩均數之差的標準誤的估計值由于u0.05/2=1.96,u0.01/2=2.58,|u|>u0.01/2,得P<0.01,按α=0.05水準,拒絕H0,接受H1,兩組間差別有統計學意義。可以認為試驗組和對照組退熱天數的總體均數不相等,兩組的療效不同。試驗組的平均退熱天數比對照組短。例7-7已計算了的95%的可信區間:天,給出了兩總體均數差別的數量大小。

兩均數之差的標準誤的估計值I型錯誤和II型錯誤

假設檢驗是利用小概率反證法思想,從問題的對立面(H0)出發間接判斷要解決的問題(H1)是否成立,然后在假定H0成立的條件下計算檢驗統計量,最后根據P值判斷結果,此推斷結論具有概率性,因而無論拒絕還是不拒絕H0,都可能犯錯誤。檢驗水準與兩類錯誤

I型錯誤:“實際無差別,但下了有差別的結論”,假陽性錯誤。犯這種錯誤的概率是(其值等于檢驗水準)

II型錯誤:“實際有差別,但下了不拒絕H0的結論”,假陰性錯誤。犯這種錯誤的概率是(其值未知)

但n

一定時,

增大,則減少。

可能發生的兩類錯誤圖3-2I型錯誤與II型錯誤示意圖(以單側u檢驗為例)

1-

:檢驗效能(power):當兩總體確有差別,按檢驗水準所能發現這種差別的能力。ab減少(增加)I型錯誤,將會增加(減少)II型錯誤增大n

同時降低a與ba與b間的關系減少I型錯誤的主要方法:假設檢驗時設定

值。減少II型錯誤的主要方法:提高檢驗效能。提高檢驗效能的最有效方法:增加樣本量。如何選擇合適的樣本量:實驗設計。假設檢驗注意事項(1)可比性(2)正確選用假設檢驗方法(3)差別的實際意義(4)判斷結論時不能絕對化(5)單側檢驗與雙側檢驗(6)報告結果應寫出統計量值、具體P值(1)可比性(2)正確選用假設檢驗方法(3)差別的實際意義(4)判斷結論時不能絕對化(5)單側檢驗與雙側檢驗(6)報告結果應寫出統計量值、具體P值為了保證試驗結果的可靠及正確,要有嚴密合理的試驗或抽樣設計,保證各樣本是從相應同質總體中隨機抽取的。并且處理間要有可比性,即除比較的處理外,其它影響因素應盡可能控制相同或基本相近。否則,任何顯著性檢驗的方法都不能保證結果的正確(1)可比性(2)正確選用假設檢驗方法(3)差別的實際意義(4)判斷結論時不能絕對化(5)單側檢驗與雙側檢驗(6)報告結果應寫出統計量值、具體P值選用的顯著性檢驗方法應符合其應用條件由于研究變量的類型、問題的性質、條件、試驗設計方法、樣本大小等的不同,所用的顯著性檢驗方法也不同,因而在選用檢驗方法時,應認真考慮其適用條件,不能濫用。要正確理解差異顯著或極顯著的統計意義。顯著性檢驗結論中的“差異顯著”或“差異極顯著”不應該誤解為相差很大或非常大,也不能認為在專業上一定就有重要或很重要的價值。“顯著”或“極顯著”是指表面上如此差別的不同樣本來自同一總體的可能性小于0.05或0.01,已達到了可以認為它們有實質性差異的顯著水平。有些試驗結果雖然差

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論