實(shí)驗(yàn)的診斷性能評價(jià)_第1頁
實(shí)驗(yàn)的診斷性能評價(jià)_第2頁
實(shí)驗(yàn)的診斷性能評價(jià)_第3頁
實(shí)驗(yàn)的診斷性能評價(jià)_第4頁
實(shí)驗(yàn)的診斷性能評價(jià)_第5頁
已閱讀5頁,還剩12頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、實(shí)驗(yàn)的診斷性能評價(jià)楊婷婷12級檢驗(yàn)3班2012081316前言本文系統(tǒng)闡述了診斷試驗(yàn)的評價(jià)方法、常用的評價(jià)指標(biāo)一一診斷靈敏度、診斷特異度、預(yù)測值、似然比等及其優(yōu)缺點(diǎn)、R0C曲線在診斷試驗(yàn)評價(jià)中的應(yīng)用情況及存在的問題,為診斷試驗(yàn)的進(jìn)一步評價(jià)研究提供了依據(jù)。關(guān)鍵詞:診斷試驗(yàn),R0C曲線,閾值,靈敏度,特異度,預(yù)測值,似然比診斷實(shí)驗(yàn)診斷試驗(yàn)是指對疾病進(jìn)行診斷的試驗(yàn)方法,它不僅包括各種實(shí)驗(yàn)室檢查,還包括各種影像學(xué)診斷,如X線診斷、CT等。應(yīng)用診斷試驗(yàn)有助于科學(xué)地選擇診斷方法、正確地分析和評價(jià)診斷結(jié)果。此外,診斷試驗(yàn)還可用于病例隨訪、預(yù)后估計(jì)、療效判斷以及治療的副作用檢測等,而診斷試驗(yàn)提供的這些信息的可

2、靠性大小依賴于診斷試驗(yàn)的準(zhǔn)確度評價(jià)結(jié)果。2.1臨床診斷試驗(yàn)的數(shù)據(jù)與患病情況的關(guān)系診斷試驗(yàn)分定性試驗(yàn)和定量試驗(yàn)。定性試驗(yàn)的結(jié)果分為陽性和陰性結(jié)果,定量試驗(yàn)的結(jié)果為一系列連續(xù)的計(jì)量數(shù)據(jù),這些數(shù)據(jù)可被分界值將其分為兩個(gè)部分,也可判斷為陽性和陰性結(jié)果。一般情況下,診斷試驗(yàn)的結(jié)果和患某病的情況之間可能出現(xiàn)四種關(guān)系:真陽性(Truepositive,TP)指經(jīng)試驗(yàn)而被正確分類的患者的數(shù)目。假陽性(Falsepositive,FP)指經(jīng)試驗(yàn)而被錯(cuò)誤分類的非患者的數(shù)目。真陰性(Truenegative,TN)指經(jīng)試驗(yàn)而被正確分類的非患者的數(shù)目。假陰性(Falsenegative,FN)指經(jīng)試驗(yàn)而被錯(cuò)誤分類的患

3、者的數(shù)目。2.2診斷性能評價(jià)實(shí)驗(yàn)的設(shè)計(jì)原理目前,診斷性能評價(jià)實(shí)驗(yàn)的研究設(shè)計(jì)大多采用橫斷面研究方案。在進(jìn)行評價(jià)實(shí)驗(yàn)前,首先需確定一個(gè)疾病診斷的金標(biāo)準(zhǔn),金標(biāo)準(zhǔn)是指當(dāng)前為臨床醫(yī)學(xué)界公認(rèn)的診斷某種疾病最可靠的診斷方法,可通過活檢、尸檢、外科手術(shù)、隨訪等所作出的決定性診斷,又稱確診試驗(yàn),如診斷腫瘤的金標(biāo)準(zhǔn)一般是病理學(xué)檢查,診斷冠心病的金標(biāo)準(zhǔn)是冠狀動(dòng)脈造影等;確立金標(biāo)準(zhǔn)后,再與診斷試驗(yàn)同步盲法測量研究對象,據(jù)金標(biāo)準(zhǔn)將研究對象劃分為“有某病”、“無某病”,據(jù)診斷試驗(yàn)的臨界值將其劃分為“陽性”、“陰性”結(jié)果,然后整理出相應(yīng)的四格表如表1計(jì)算準(zhǔn)確性、有效性等評價(jià)指標(biāo)。表1臨床檢驗(yàn)方法診斷性能評價(jià)試驗(yàn)結(jié)果四格表金

4、標(biāo)準(zhǔn)(標(biāo)準(zhǔn)診斷)合計(jì)有病無病診斷性+a真陽性(TP)b假陽性(FP)a+b試驗(yàn)c假陰性(FN)d真陰性(TN)c+d合計(jì)a+c=nib+d=n?N3臨床生化診斷試驗(yàn)的診斷性能評價(jià)指標(biāo)3.1臨床生化診斷試驗(yàn)的準(zhǔn)確性評價(jià)指標(biāo)準(zhǔn)確性(accuracy,AC),又稱真實(shí)性(validity)是診斷試驗(yàn)測量值與實(shí)際值的符合程度,即判斷受試者有病與無病的能力。如敏感度、特異度、準(zhǔn)確度等。3.1.1敏感度敏感度(Sensitivity),又稱真陽性率(Truepositiverate),是指在某疾病的患者中,用臨床檢驗(yàn)方法檢出患者的百分率。其計(jì)算公式為:敏感度=xlOO%a+c高靈敏度的檢驗(yàn)方法常應(yīng)用于:擬

5、診為病情嚴(yán)重但療效好的疾病,以防漏診;擬診為有一定療效的惡性腫瘤,以便早期診斷、早期治療;該病情可由多種疾病引起,用高靈敏度的檢驗(yàn)方法可以排除某一疾病的可能性;普查或定期健康體檢,用于篩選某一疾病。3.1.2特異度特異度(Specificity),又稱真陰性率(Truenegativerate),是指在非某疾病的患者中,用臨床檢驗(yàn)方法排除患者的百分率,其計(jì)算公式為:特異度=-xl00%b+a高特異性的檢驗(yàn)方法常應(yīng)用于:擬診患有某病的概率較大時(shí),以便確診;擬診疾病嚴(yán)重但療效和預(yù)后均不好的疾病,以防誤診;擬診疾病嚴(yán)重且根治方法具有較大損害時(shí),需確診,以免造成病人不必要的損害。3.1.3漏診率和誤診

6、率漏診率,又稱假陰性率(Falsenegativerate),即將患者錯(cuò)誤診斷的百分率,其計(jì)算公式為:漏診率二1-靈敏度二丄xlOO%。a+c誤診率,又稱假陽性率(Falsepositiverate),即將非患者錯(cuò)誤診斷的百分率,其計(jì)算公式為:誤診率二1-特異度=-xl00%ob+a漏診率、誤診率越小,說明該臨床檢驗(yàn)方法的性能就越好。3.1.4準(zhǔn)確度準(zhǔn)確度又稱總符合率、診斷效率(diagnosticefficiency,DF),是指在患病和非患病者中,用診斷試驗(yàn)?zāi)軠?zhǔn)確劃分患者和非患病者的百分比。反映診斷試驗(yàn)正確診斷患者與非患者的能力。其計(jì)算公式為:準(zhǔn)確度二齊巡7X100%。理想試驗(yàn)的診斷準(zhǔn)確度

7、為100%o準(zhǔn)確度高,真實(shí)性好。受發(fā)病率的影響很大。3.1.5準(zhǔn)確性評價(jià)指標(biāo)之間的關(guān)系由于靈敏度與漏診率、特異性與誤診率存在互補(bǔ)關(guān)系漏診率和誤診率可以通過靈敏度與特異度體現(xiàn)出來并求得,因此,靈敏度與特異度是評價(jià)一項(xiàng)診斷試驗(yàn)真實(shí)性的兩個(gè)基本指標(biāo)。從理論上講,一項(xiàng)理想的診斷試驗(yàn)其靈敏度、特異度最好均為100%,即假陽性與假陰性均為零,無一漏診與誤診。靈敏度和特異性之間的關(guān)系對于一項(xiàng)診斷試驗(yàn),可以通過調(diào)整分界值提高靈敏度或特異性,但二者不能同時(shí)提高。提高一個(gè),必然降低另一個(gè),因此,選擇分界時(shí)必須權(quán)衡,使兩者得到兼顧。在大多數(shù)情況下,如單獨(dú)使用敏感性很高的診斷試驗(yàn),雖然漏診率低,但由于其特異性相對較差

8、,結(jié)果誤診率必然較高;如單獨(dú)使用特異性很高的試驗(yàn)診斷,雖然誤診率低,但由于其敏感性相對較低,結(jié)果漏診率必然較高。此時(shí)可采用敏感度與特異性均高的試驗(yàn)相對結(jié)合的方法。3.2臨床生化診斷試驗(yàn)的有效性評價(jià)指標(biāo)有效性評價(jià)指標(biāo)包括預(yù)測值、流行率和似然比等。3.2.1預(yù)測值預(yù)測值(predictivevalue,PV)是指一項(xiàng)診斷試驗(yàn)?zāi)軌虼_定或排除某疾病存在與否的診斷概率,稱為預(yù)測值(predictivevalue,PV),又稱預(yù)告值,也稱為試驗(yàn)后診斷為患某病的可能性即驗(yàn)后概率(posttestprobability),包括陽性預(yù)測值和陰性預(yù)測值,分別表示診斷試驗(yàn)結(jié)果確定或排除某種疾病存在與否的診斷概率。預(yù)

9、測值受流行率的影響,不同流行率的人群中疾病的預(yù)告值不同。3.2.1.1陽性預(yù)測值陽性預(yù)測值(positivepredictivevalue,PPV或+PV)表示在診斷試驗(yàn)結(jié)果為陽性的人數(shù)中,真正患病者所占的百分率,即試驗(yàn)結(jié)果陽性者屬于真病例的概率。也叫患病的試驗(yàn)后可能性,其計(jì)算公式為:陽性預(yù)測值二斗xlOO%ci+b理想試驗(yàn)的陽性預(yù)測值為100%o陽性預(yù)測值主要受流行率的影響,流行率越高,則陽性預(yù)測值也高;臨床醫(yī)師根據(jù)某病的流行率和診斷試驗(yàn)的陽性結(jié)果就能預(yù)測就診者患某病的可能性大小;當(dāng)流行率一定時(shí),診斷試驗(yàn)的特異性越高,陽性預(yù)測值越準(zhǔn)確。3.2.1.2陰性預(yù)測值陰性預(yù)測值(negativepr

10、edictivevalue,NPV或一PV)表示在診斷試驗(yàn)結(jié)果為陰性的人數(shù)中,非患病者所占的百分率,即試驗(yàn)結(jié)果陰性者屬于非病例的概率。也叫非患病的試驗(yàn)后可能性。其計(jì)算公式為:陰性預(yù)測值二亠xlOO%c+d理想試驗(yàn)的陰性預(yù)測值為100%o當(dāng)流行率一定時(shí),診斷試驗(yàn)的敏感性越高,則陰性預(yù)測值越高。2.2流行率流行率(Prevalence,?)表示在受檢對象的總?cè)藬?shù)中,真正患病者所占的百分率,也叫患病的試驗(yàn)前可能性或患病率。其計(jì)算公式為:流行率二尹黯淙X100%流行率可從流行病學(xué)調(diào)查資料查知,也可以是臨床醫(yī)師在長期的醫(yī)療實(shí)踐中,對門診就診者患某病的比例的經(jīng)驗(yàn)認(rèn)識;由于在不同的地區(qū)、不同級別的醫(yī)院、普通

11、醫(yī)院和專科醫(yī)院,其就診者的組成差別可能很大,因此,同樣的疾病在不同醫(yī)院的流行率也不同,臨床醫(yī)師必須根據(jù)具體情況確定流行率,才能得出較為準(zhǔn)確的陽性預(yù)測值。預(yù)測值與流行率的關(guān)系:診斷試驗(yàn)的預(yù)測值與試驗(yàn)的靈敏度、特異度及受試人群中所研究疾病的流行率有關(guān)。三者有下列關(guān)系:特異性越高,假陽性率越低,陽性預(yù)測值越高;靈敏度越高,陰性預(yù)測值越高;受檢人群研究疾病流行率越高,假陽性率越低,陽性預(yù)測值越高,陰性預(yù)測值越低。流行率對陽性預(yù)測值的影響見表2。由表可以看出,即使診斷敏感度和特異度都達(dá)到99%,只有在流行率達(dá)到50%時(shí),才有較高的陽性預(yù)測值。所以在臨床診斷中,應(yīng)先詢問病史,后對懷疑的病人做診斷試驗(yàn)。同時(shí)

12、也說明部分臨床上很好的試驗(yàn),用作普查效果并不理想。表2流行率、靈敏度和特異度對某疾病+PV的影響流行率()十PV(%)靈敏度=95特異度=95靈敏度=99特異度=990.11.99.01.016.150.02.027.966.95.050.083.950.095.099.0根據(jù)某試驗(yàn)的靈敏度、特異度和群體中研究疾病的流行率,預(yù)測值亦可以用Bayes理論公式估計(jì):流行率x靈敏度十PV=流行率X靈敏度+(1流行率)x(1特異度)“(1-流行率)X特異度pv=(1流行率)X特異度+流行率X(1靈敏度)3.2.3似然比預(yù)測值和流行率隨檢查人群的不同而改變,診斷敏感性和特異性雖不隨被檢對象中患病者與非患

13、病者的不同比例而改變,但敏感性和特異性難于幫助醫(yī)生直接判斷就診者的患病可能性,因而引進(jìn)似然比的概念。驗(yàn)后概率較之驗(yàn)前概率的符合程度和變化方向取決于診斷試驗(yàn)的特性,表征這種特性的量化指標(biāo)稱為似然比(likelihoodratio,LR)。是診斷試驗(yàn)結(jié)果的某一特定水平在患病者中出現(xiàn)的可能性與在未患病者中出現(xiàn)的可能之比。似然比包括陽性似然比和陰性似然比。似然比性質(zhì)穩(wěn)定,不因流行率的改變而改變可直接評價(jià)診斷試驗(yàn)的好壞,但在評價(jià)和比較試驗(yàn)性能方面不是一種特別好的工具。3.2.3.1陽性似然比陽性似然比(positivelikelihoodratio,+LR或LR(+)是指用診斷試驗(yàn)檢測患病人群的陽性率與

14、非患病人群的陽性率Z間的比值,即真陽性率與假陽性率之比。其計(jì)算公式為:陽性似然比二靈敏度1-特異度a(b+d)b(a+c)可用以描述診斷試驗(yàn)陽性時(shí),患病與不患病的機(jī)會(huì)比。LR(+)提示正確判斷為陽性的可能性是錯(cuò)誤判斷為陽性的可能性的倍數(shù)。LR(+)數(shù)值越大,提示能夠確診患有該病的可能性越大。LR(+)1.0,其超過1.0的大小是當(dāng)試驗(yàn)結(jié)果為陽性時(shí),試驗(yàn)提示患病可能性增高能力的一種度量。LR(+)=2.0-5.0,認(rèn)為該試驗(yàn)不太好;超過10.0,認(rèn)為是好的。因真陽性率為敏感度,假陽性率與特異度成互補(bǔ)關(guān)系,所以,也可表示為敏感度與仃一特異度)之比。3.2.3.2陰性似然比陰性似然比(negativ

15、elikelihoodratio,LR或LR(_)是指用診斷試驗(yàn)檢測患病人群屮的陰性率與非患病人群的陰性率之間的比值,即假陰性率與真陰性率之比。其計(jì)算公式為:陰性似然比二1-靈敏度特異度c(b+d)d(a+c)可用以描述診斷試驗(yàn)陰性時(shí),患病與不患病的機(jī)會(huì)比。LR(-)提示錯(cuò)誤判斷為陰性的可能性是正確判斷為陰性的可能性的倍數(shù)。LR()數(shù)值越小,提示能夠否定患有該病的可能性越大。LR(-)1.0,其小于1.0的大小是當(dāng)試驗(yàn)結(jié)果為陰性時(shí),試驗(yàn)提示患病可能性降低能力的一種度量。LR()=0.50.2,認(rèn)為該試驗(yàn)不太妬而小于0.1,可認(rèn)為是好的試驗(yàn)。陰性似然比也可表示為(1-敏感度)與特異度之比。閾值(

16、cutoffvalue)又稱分界值、臨界值、鑒別值、指定值等,指劃分診斷試驗(yàn)結(jié)果正常與異常的界值。參考值概念的提出雖然澄清了正常值概念的模糊觀點(diǎn),但是當(dāng)用醫(yī)學(xué)試驗(yàn)作為過篩試驗(yàn)、確診或排除疾病等不同用途時(shí),單一個(gè)參考值不能滿足不同的要求。為了提高診斷指標(biāo)臨床使用效果,不僅要研究基本健康者的參考值,也要研究其他無關(guān)疾病患者的參考值及有關(guān)疾病在不同病情中的測定數(shù)據(jù),即根據(jù)不同的目的,研究健康(或稱非病理的)與病理的分界水平。4.1閾值的選擇閾值高低的確定直接影響診斷試驗(yàn)評價(jià)指標(biāo)。當(dāng)健康人的分布與病人的分布沒有重疊,如圖1A所示,可以取中間一點(diǎn)(D點(diǎn))為閾值,這時(shí)假陽性和假陰性均為0,這是一種罕見的理

17、想情況,實(shí)際上許多診斷試驗(yàn)健康人與病人的分布有交叉。這時(shí)閾值定在哪里是一個(gè)值得研究的問題。由圖1B可知,當(dāng)D向右移動(dòng),假陽性減少,假陰性增加,敏感性降低,特異性增加;反之,當(dāng)D向左移動(dòng),假陽性增加,假陰性減少,敏感性增大,特異性減少。DL:醫(yī)學(xué)決定水平,D:臨界值,TN:真陰性,TP:真陽性,F(xiàn)N:假陰性,F(xiàn)P:假陽性圖1正常人和病人分布曲線應(yīng)當(dāng)注意的是,在少數(shù)情況下正常人的測定值分布高于病人的測定值分布時(shí),如缺鐵性貧血患者的血清鐵蛋白含量明顯低于正常人,此時(shí)的閾值制定偏高或偏低后的指標(biāo)變化情況正好與圖1B相反。另外,還有一種低值某一類疾病病人、正常人、高值另一類疾病病人三條交叉分布曲線形式,

18、有2個(gè)臨界值,應(yīng)分開后按上述方式討論。2分界值的選擇方法一般是先初步確定幾個(gè)閾值,分別計(jì)算真陽性、真陰性、假陽性、假陰性數(shù)值,進(jìn)一步計(jì)算診斷敏感性、診斷特異性等指標(biāo),最后根據(jù)早期診斷、療效觀察、流行病學(xué)調(diào)查等各種不同目的確定閾值。受試者工作特征曲線醫(yī)學(xué)診斷試驗(yàn)中,常用的評價(jià)診斷試驗(yàn)準(zhǔn)確性的指標(biāo)是靈敏度與特異度。由于它們依賴于診斷界值點(diǎn)的選取,改變截?cái)帱c(diǎn)值可以提高診斷指標(biāo)的靈敏度,但同時(shí)會(huì)降低其特異度;反之,提高診斷指標(biāo)的特異度,則需要以降低靈敏度為代價(jià)。以診斷界值作為截?cái)帱c(diǎn),靈敏度、特異度與診斷界值的關(guān)系見圖2,由圖可知,隨著診斷界值的變化,靈敏度、漏診率、特異度以及誤診率均會(huì)發(fā)生相應(yīng)的變化。

19、這樣,僅采用某一特定界值對應(yīng)的靈敏度與特異度反映試驗(yàn)的診斷能力就不太全面。針對以上問題,研究者們引入了ROC分析(receiveroperatingcharacteristic,ROC),即受試者工作特征分析,也有人稱其為相對工作特征(relativeoperatingcharacteristic)。美國生物統(tǒng)計(jì)百科全書中關(guān)于ROC的定義是:“對于可能或?qū)?huì)存在混淆的2種條件或自然狀態(tài),需要試驗(yàn)者、專業(yè)診斷學(xué)工作者以及預(yù)測工作者作出精細(xì)判別,或者準(zhǔn)確決策的一種定量方法”C13o5.1受試者工作特征曲線分析的主要步驟5.1.1ROC曲線繪制依據(jù)專業(yè)知識,對疾病組和參照組測定結(jié)果進(jìn)行分析,確定測定

20、值的上下限、組距以及截?cái)帱c(diǎn)(cut-offpoint)(或判定值),按選擇的組距間隔列累積頻數(shù)分布表,分別計(jì)算出所有截?cái)帱c(diǎn)的敏感性、特異性和假陽性率(1特異性)。以敏感性為縱坐標(biāo)代表真陽性率,(1特異性)為橫坐標(biāo)代表假陽性率,作圖繪成ROC曲線。通常的臨床生化檢查,結(jié)果多為連續(xù)的變量,可以選擇任意點(diǎn)為判定值計(jì)算敏感性和假陽性率。按診斷等級進(jìn)行分類評價(jià)時(shí),最少應(yīng)將診斷結(jié)果分為五級:正常、大致正常、可疑、大致異常和異常。5.1.2ROC曲線評價(jià)統(tǒng)計(jì)量計(jì)算ROC曲線下面積的估計(jì)有參數(shù)法和非參數(shù)法兩種2】,均適用于結(jié)果為連續(xù)性資料或等級資料的診斷試驗(yàn)準(zhǔn)確度的評價(jià)。5.1.2.1非參數(shù)法非參數(shù)法是根據(jù)實(shí)

21、驗(yàn)結(jié)果直接計(jì)算繪制ROC曲線所需的工作點(diǎn)(假陽性率,真陽性率)即(1特異度,靈敏度),由此繪制的ROC曲線稱為經(jīng)驗(yàn)ROC曲線,其曲線下面積可由梯形規(guī)則計(jì)算得到,Bamber于1975年發(fā)現(xiàn):經(jīng)驗(yàn)ROC曲線下面積等價(jià)于患者和非患者實(shí)驗(yàn)結(jié)果秩和檢驗(yàn)的MannWhitney檢驗(yàn)統(tǒng)計(jì)量,因而可由MannWhitney統(tǒng)計(jì)量估計(jì)曲線下面積的大小,但在診斷試驗(yàn)檢測結(jié)果相同值較多(例如結(jié)果為有序資料的影像學(xué)檢查)時(shí)及樣本量較小時(shí),其結(jié)果常小于真實(shí)的面積4】。然而非參數(shù)法因其沒有限制條件,所以適用于任何診斷試驗(yàn)ROC曲線下面積的估計(jì)。非參數(shù)法估計(jì)ROC曲線下面積可通過SPSS、SAS等統(tǒng)計(jì)軟件實(shí)現(xiàn)。5.1.2

22、.2參數(shù)法曲線下面積估計(jì)的參數(shù)法是假設(shè)患者和非患者的實(shí)驗(yàn)結(jié)果均符合正態(tài)分布,根據(jù)試驗(yàn)結(jié)果擬合雙正態(tài)模型,由模型擬合的ROC曲線稱為擬合ROC曲線或光滑ROC曲線,該曲線可用2個(gè)參數(shù)表示,由2個(gè)參數(shù)可得到繪制光滑ROC曲線所需的工作點(diǎn)及曲線下面積的估計(jì)值,而且得到的面積估計(jì)值一般是無偏的。雙正態(tài)模型的兩個(gè)參數(shù)可由最大似然估計(jì)法得到。參數(shù)法的應(yīng)用條件為:患者與非患者的試驗(yàn)結(jié)果服從雙正態(tài)分布,但這是指ROC曲線的函數(shù)形式,而不是指試驗(yàn)結(jié)果的基本分布,因?yàn)樽兞孔儞Q幾乎可使任何試驗(yàn)結(jié)果轉(zhuǎn)換為雙正態(tài)分布,而且在樣本量較大時(shí)參數(shù)法與非參數(shù)法估計(jì)的ROC曲線下面積常常近似相等。參數(shù)法估計(jì)ROC曲線下面積的公式

23、為:A=T(al+b2)其中A為ROC曲線下的面積,a、b分別為雙正態(tài)模型的2個(gè)參數(shù),T表示標(biāo)準(zhǔn)正態(tài)分布函數(shù)。參數(shù)法估計(jì)ROC曲線下面積可通過軟件ROCKITO.9B來實(shí)現(xiàn)。參數(shù)法估計(jì)ROC曲線下面積的缺點(diǎn)是當(dāng)樣本量較小時(shí),或試驗(yàn)檢測值及其變量變換值均不符合參數(shù)法的應(yīng)用條件時(shí),結(jié)果可能會(huì)嚴(yán)重偏離真實(shí)值,此時(shí)應(yīng)增人樣本量或改用非參數(shù)法估計(jì)曲線下面積習(xí)。ROC曲線下面積的用途有兩個(gè),一是比較不同檢測方法的優(yōu)劣。面積較大者為優(yōu)。另一個(gè)是判斷ROC曲線的診斷準(zhǔn)確度或預(yù)測效率。ROC曲線下面積的取值范圍為0.5-1,AUC0.5不符合真實(shí)情況,在實(shí)際中極少出現(xiàn),0.5表明完全無診斷價(jià)值,1為最理想值。在

24、醫(yī)學(xué)領(lǐng)域中一般認(rèn)為:ROC曲線下面積在0.5-0.7之間時(shí)診斷價(jià)值較低,在0.7-0.9之間時(shí)診斷價(jià)值中等,在0.9以上時(shí)診斷價(jià)值較高。5.1.3兩種診斷方法的統(tǒng)計(jì)學(xué)比較這種比較可以在相同的特異性下比較它們的敏感性或在相同的敏感性下比較它們的特異性。但一個(gè)全面的方法是比較整個(gè)ROC圖。通過計(jì)算ROC曲線下的面積,不同試驗(yàn)之間的臨床準(zhǔn)確性可以通過它們的各自面積進(jìn)行定量比較,但單看面積這一數(shù)值,可能丟失一些信息,如兩條ROC曲線形狀不同,但它們有相似的面積。兩種診斷方法的比較,根據(jù)不同的試驗(yàn)設(shè)計(jì)可采用以下兩種方法:當(dāng)兩種診斷方法分別在不同受試者身上進(jìn)行時(shí),采用成組比較法。如果兩種診斷方法在同一受試

25、者身上進(jìn)行時(shí),采用配對比較法。5.2受試者工作特征曲線的主要作用ROC曲線能很容易地查出任意界限值時(shí)的對疾病的識別能力ROC曲線圖上的每一點(diǎn)代表某一分界值的一對敏感性和特異性,ROC曲線包含著選擇任意界限值時(shí)的敏感度和特異性。它能反映不同界限值時(shí)兩者的變化。選擇最佳的診斷界限值ROC曲線是表示靈敏度與特異度之間互相關(guān)系的一種方法,所得的曲線可以決定最佳分界值。一般多選擇曲線轉(zhuǎn)彎處,即敏感度與特異度均為較高的點(diǎn)為閾值。兩種或兩種以上不同診斷試驗(yàn)對疾病識別能力的比較根據(jù)診斷試驗(yàn)的ROC曲線,可以比較兩種或兩種以上不同診斷試驗(yàn)對診斷同種疾病的可靠性,ROC曲線可以幫助醫(yī)師作出最佳選擇。一個(gè)完美的試驗(yàn)

26、(病與非病兩個(gè)分布沒有重疊)的ROC圖通過左上角,其真陽性率為1.0或100%,即所有病人均顯陽性;假陽性率是0或特異性為100%,即正常人均為陰性。如兩個(gè)分布一致,不能鑒別病與非病的試驗(yàn)的ROC圖是45*的對角線。大多數(shù)試驗(yàn)的ROC圖是介于上述兩種極端之間。ROC曲線越靠近左上角,試驗(yàn)的準(zhǔn)確性就越高。最靠近左上角的ROC曲線的點(diǎn)是錯(cuò)誤最少的最好閾值,其假陽性和假陰性的總數(shù)最少。在對同一種疾病的兩種或兩種以上診斷方法進(jìn)行比較時(shí),可將各試驗(yàn)的ROC曲線繪制到同一坐標(biāo)中,以直觀地鑒別優(yōu)劣,靠近左上角的ROC曲線所代表的受試者工作最準(zhǔn)確。亦可通過分別計(jì)算各個(gè)試驗(yàn)的ROC曲線下的面積(AUC)進(jìn)行比較

27、,哪一種試驗(yàn)的AUC最大,則哪一種試驗(yàn)的診斷價(jià)值最佳。5.3受試者工作特征曲線的優(yōu)點(diǎn)與局限性5.3.1應(yīng)用ROC曲線圖的優(yōu)點(diǎn)ROC曲線的基本思路源于統(tǒng)計(jì)學(xué)決策理論,運(yùn)用ROC曲線圖進(jìn)行評價(jià)具有許多優(yōu)點(diǎn):(1)該方法簡單、直觀,通過圖示可觀察分析方法的臨床準(zhǔn)確性,并可用肉眼作出判斷。(2)ROC曲線將靈敏度與特異性以圖示方法結(jié)合在一起,可準(zhǔn)確反映某分析方法特異性和敏感性的關(guān)系,是試驗(yàn)準(zhǔn)確性的綜合代表。(3)與陽性預(yù)測值不同的是ROC曲線評價(jià)方法與群體患病率無關(guān)。但實(shí)際工作中取患者與非患者的數(shù)目相等最好。(4)ROC曲線不固定分類界值,允許中間狀態(tài)存在,利于使用者結(jié)合專業(yè)知識,權(quán)衡漏診與誤診的影響,選擇一更佳截?cái)帱c(diǎn)作為診斷參考值。(5)提供不同試驗(yàn)之間在共同標(biāo)尺下的直觀的比較,ROC曲線越凸越近左上角表明其診斷價(jià)值越大,利于不同指標(biāo)間的比較。曲線下面積可評價(jià)診斷準(zhǔn)確性。5.3.2應(yīng)用ROC曲線圖的缺點(diǎn)(1)ROC曲線圖上顯示的不是真正的判斷值,實(shí)際的分界值通常沒有在圖上表示出來。(2)研究分析對象的數(shù)目也沒有在圖上表示出來。(3)當(dāng)樣品數(shù)減少,圖形呈鋸狀和崎嶇不平,即使樣品數(shù)目大,也可能是崎嶇不平。(4)當(dāng)沒有微機(jī)時(shí),畫圖和計(jì)算均比較繁瑣。5.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論