誤差、偏倚及其控制-2007_第1頁
誤差、偏倚及其控制-2007_第2頁
誤差、偏倚及其控制-2007_第3頁
誤差、偏倚及其控制-2007_第4頁
誤差、偏倚及其控制-2007_第5頁
已閱讀5頁,還剩40頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

誤差、偏倚及其控制

研究的真實性和可靠性真實性(validity)反映了研究的結果和總體的真實的情況的相符合的程度。可靠性,表示相對穩定的情況,重復多次試驗之后,與均值的符合程度。舉例:真實性和可靠性研究的外部真實性與內部真實性1.外部真實性:

指研究樣本的結果和結論可以外推到研究的總體人群。遵循隨機抽樣原則和避免產生嚴重的選擇偏倚是保證樣本代表性的重要措施。2.內部真實性:

指研究樣本的結果真實可靠。嚴格控制和減少測量偏倚和混雜偏倚對結果的影響,保證研究結果真實性的關鍵。4一、誤差的概念及分類幾個基本概念

誤差error指研究所獲得的實際測定值與真實值之間的差別

系統誤差systemicerror

由于某種確定的原因,有固定的大小和方向,可消除隨機誤差randomerror(抽樣誤差)

由于偶然的原因,沒有固定的大小和方向,無法消除二、偏倚的概念及分類1.偏倚bias概念:指系統誤差,是指醫學研究中從設計、實施到分析的各個環節,由于某些固定的原因,使研究結果與真實值之間出現傾向性的差異。JohnLast在流行病學詞典中將偏倚定義:

在進行流行病學調查研究或推論過程中,由于某種或某些因素的影響,使所研究的結果或推論與真實的情況之間產生系統差別。

?偏倚的性質:是一種人為造成的系統誤差,與抽樣誤差完全不同。偏倚可以控制,抽樣誤差則不能。

?偏倚的特點:偏倚在整個研究過程中均可產生,從研究的設計,資料收集、結果分析直至結果的推論,其中任何一個環節均可產生

?偏倚與抽樣誤差的區別:

√偏倚是屬于系統誤差,人為因素造成,可以控制。

√抽樣誤差屬于隨機誤差,由個體差異決定,抽樣研究必然存在的客觀事實。2.偏倚的分類

選擇偏倚

信息偏倚

混雜偏倚

(一)選擇偏倚選擇偏倚指在對樣本進行研究時,入選的研究對象與總體之間的某些特征具有較大的差別,導致樣本不能代表總體,因而使樣本的研究結果與總體真實值之間有差別。

入院率偏倚

現患病例——新病例偏倚檢出征侯偏倚

無應答偏倚觀察性和實驗性研究都可能發生

易感性偏倚

志愿者偏倚

排除偏倚入院率偏倚也稱Berkson偏倚,指以醫院為基礎的病例對照研究中,目標疾病的入院率因待研究的暴露因素的存在與否或暴露水平的不同而存在差異,由此而引起的誤差。10Roberts(JChronDis,1978)研究了三個社區內幾種疾病與一些可疑病因之間的關系。

?研究對象:2784名成人;257名住院病人

?研究內容:醫學事件與影響因素關系

Roberts根據以人群為基礎的研究所獲得OR值,顯著地不同于僅以住院病例所獲的結果,認為Berkson偏倚是存在的。

Sackett(JChronDis,1979)根據這一調查研究的資料,做了另外兩項分析,該結果進一步證實了Berkson偏倚的存在。見表1和表2。11OR=1.06OR=4.06呼吸道疾病以人群為基礎的分析骨和運動器官疾病以住院病例為基礎的分析骨和運動器官疾病

+-合計+-合計+1720722451520-1842376256018219237合計2012583278423234257表1以不同人群為基礎的骨和運動器官疾病與呼吸道疾病關系的OR值比較12過敏或代謝病在一般人群中的研究在住院病人中的研究疲勞疲勞

+-合計+-合計+1313614912122-1272508263527208235合計1402644278428229257OR=1.89OR=0.37表2以不同人群為基礎的疲勞與過敏和代謝病之間OR值的比較13現患病例-新病例偏倚又稱奈曼(Neyman)偏倚,如果研究對象選自現患病例,可能會得到更多的信息,但其中很多信息可能只與存活有關,而未必與該病的發病有關,從而可高估某些暴露因素的病因作用。此外,某些疾病的幸存者可能已改變了原先的生活習慣,從而降低了某危險因素的水平,或當其被調查時夸大或縮小了病前生活習慣上的某些特征,從而導致對某因素與疾病關聯的錯誤估計。14膽固醇水平隊列研究*病例對照研究**病例非病例合計病例對照合計≥75th%85462547383472<75th%11615111627113117230OR2.401.16*膽固醇值系第一次測量值**膽固醇值系第六次研究時測量值表3血膽固醇與冠心病的關系15

人數平均膽固醇值(mg/ml)變動值

第一次檢查值第六次檢查值

患者*148243.6246.1+2.5非患者1620220.0241.5+21.5*患者為第六次檢查時現存的患者表4膽固醇值在冠心病病人與非病人中的變化16檢出癥候偏倚(Detectionsignalbias):

17檢出癥候偏倚,也叫暴露偏倚。病人常常因為一些與疾病無關的癥狀而去就醫,從而提高了早期病例的檢出率,導致過高的估計了暴露程度而產生的系統誤差。在研究雌激素和子宮內膜癌的關系中,HorwitzRI進行的病例對照研究中揭示了這種偏倚。選擇偏倚的控制充分了解在整個研究中可能會出現選擇偏倚的各個環節,從而在研究設計階段加以預防。嚴格掌握研究對象納入與排除標準

盡可能多地采用多組對照在實施階段,通過各種措施盡量取得對象的支持與合作,降低無應答率和失訪率18(二)信息偏倚

信息偏倚又稱觀察偏倚(observationbias)或測量偏倚(measurementbias),是指研究實施過程中,由于測量或資料收集方面存在缺陷,最終得到的信息與真實情況有差異。

回憶偏倚報告偏倚,即說謊偏倚測量偏倚

暴露懷疑偏倚診斷懷疑偏倚錯誤分類偏倚暴露錯分:

指對病例和非病例做測量或調查時,由于測量儀器的不準確,調查員的主觀傾向或過失,被調查者缺乏合作或記憶不準確等原因,造成暴露情況的判別或分類不符合事實。

-表5為比較醫院記錄和病人回憶兩種方法確定X-線暴露史的實例。

-病人回憶的方法導致調查暴露率(26/75)低于真實暴露率(37/75)。(二)信息偏倚表5用回憶法收集孕婦X-線照射史所致偏倚醫院記錄病人回憶

X-線(+)X-線(-)或不詳合計X-線(+)241337X-線(-)23638合計264975病例錯分:指對病例和非病例的診斷因使用了不相同的診斷標準,或使用了不相同的實驗室測量方法,而產生錯誤分類。-表6給出的是一模擬的情況。

(二)信息偏倚表6群組研究中病例錯分所致偏倚錯分情況暴露群組真實結局對照群組真實結局有病無病合計有病無病合計有病3263816824無病8546247276合計40601002080100

真實情況下的RR=(40/100)/(20/100)=2,錯分情況下的RR=(38/100)/(24/100)=1.6(過低估計)。信息偏倚的控制明確和統一各個研究因素的定義,研究設計階段加以預防“盲法”收集資料

掩蓋研究假說(三)混雜偏倚

一、混雜偏倚的概念

在對某病的病因學研究中,當對所關心的某種暴露因素(E)與某種疾病(D)之間的關聯進行定量估計時,由于其他因子(F)的影響,致使E和D之間關聯的真實性被歪曲,關聯強度被放大或縮小,這種歪曲關聯真實性的作用被稱作混雜作用(confoundingeffect),起到混雜作用的因子被稱為混雜因子(confounder或confoundingfactor,F)。

?混雜偏倚性質:

√一種人為造成的偏倚

√是在研究的設計階段未對混雜因子加以控制或資料分析時未能進行正確校正所致√是完全可以避免和控制的一種系統誤差(一)混雜因子成立的條件(1)必須是所研究疾病的危險因素或保護性因素(2)必須和暴露因素之間存在統計學關聯(3)一定不是暴露因素與疾病因果鏈上的中間變量(二)混雜偏倚產生的機理例:氡氣與肺癌的隊列研究

?以RR值描述暴露于氡氣人群與不暴露于氡氣人群在肺癌發生頻率之間的關聯強度。

肺癌患者(D+)未患肺癌者(D–)

暴露于氡氣的人群(E)aba+b未暴露于氡氣的人群(ē)cdc+da/(a+b)RR=----------------------c/(c+d)?RR值的真實性評價:

此RR值是否真實地反映了氡氣與肺癌之間的關聯強度,完全取決于下述條件:(1)氡氣暴露人群(E)和未暴露人群(ē)之間在產生肺癌的易感性方面是否可比

(2)導致肺癌的其它危險因素在兩組人群之間的分布頻率是否可比。

?a例肺癌的歸因可能性(來自暴露人群):(A)由氡氣所致

(B)由吸煙所致(研究者已知道的致肺癌因素)(C)由其它未知因素所致?

c例肺癌的歸因可能性(來自非暴露人群):(B)由吸煙所致

(C)由其它未知因素所致

?對RR值的解讀:此相對危險度RR在本項研究中包含有三種效應:

(A)氡氣的致癌效應

(B)吸煙的致癌效應(C)其它未知因素的致癌效應

?RR值產生混雜偏倚的條件:(B)吸煙的致癌效應RRS≠1(C)其它未知因素的致癌效應RRU≠1

?吸煙導致混雜偏倚產生的原因:

?研究設計階段:未保證吸煙者在兩人群中的均衡性

?分析階段:未先將兩人群按吸煙和未吸煙分層,然后再按每一層去確定氡氣暴露和肺癌之間的關聯

?小結:該研究中混雜偏倚產生的機理是由于導致肺癌產生的另一因素吸煙在兩組人群中分布不均衡所致

二、混雜偏倚和混雜因素的判別

(一)根據專業知識提出研究中可能存在的混雜因子?在流行病學研究中,混雜因子可分為兩類:1.人口統計學因素:

年齡、性別、種族、職業、經濟收入、文化水平等人口統計學指標,是經常遇到的混雜因子。

2.暴露因素以外的其它危險因子:研究中混雜因素廣泛存在,表現形式多樣,常常在隱匿中起到混雜作用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論