第九章 偏倚及其控制deng_第1頁
第九章 偏倚及其控制deng_第2頁
第九章 偏倚及其控制deng_第3頁
第九章 偏倚及其控制deng_第4頁
第九章 偏倚及其控制deng_第5頁
已閱讀5頁,還剩56頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

偏倚及其控制Biasandit'scontrol第九章中學生近視:40%中學生近視?PP=40%?描述性研究Population

Sample分析性研究假設:完全母乳喂養3個月以上的嬰兒1歲內感染性疾病的發病比人工喂養嬰兒少。設計類型:CasecontrolstudyCohortstudy結果:OR<1?RR<1?第一節研究結果的變異性

概述個體水平的變異性群體水平的變異性樣本水平的變異性變異性(variability)研究結果包括描述性和分析性數據(指標)的變動或波動。第一節研究結果的變異性一、概述生物學(真實)變異和測量變異

生物學變異真實的客觀變異

測量變異測量過程的誤差隨機變異和系統變異

隨機變異絕對值和方向交錯變化,正態分布

系統變異絕對值和方向保持恒定變異的來源分為兩個層次第一節研究結果的變異性某個體特征測得值的變化,是個體真值隨時間的改變,或是由于測量誤差引起的變化。二、個體水平的變異性第一節研究結果的變異性個體的累計變異

群體中的個體具有不同的遺傳素質并受環境影響常大于個體變異

根據群體的變異范圍確定“正常值”范圍,用于判定個體測得值是否“正常”群體水平的變異性受測量誤差影響三、群體水平的變異性第一節研究結果的變異性描述性結果的樣本變異性第一節研究結果的變異性四、樣本水平的變異性分析性結果的樣本變異性膳食改良組膳食改良組降低膽固醇藥物組降低膽固醇藥物組研究A(研究對象200人,隨機分配到兩組)第一節研究結果的變異性第二節研究的真實性

概述內部真實性外部真實性真實性(效度,validity):指研究收集的數據、分析結果和所得結論與客觀實際的符合程度。研究誤差(error):真實性的反面。包括隨機誤差和系統誤差。一、概述第二節研究的真實性真實值隨機抽樣誤差BIAS系統誤差第二節研究的真實性

系統誤差(偏倚):

來自于對象選取、測量和統計分析等的方法學缺陷,有固定方向和固定大小的誤差

隨機誤差:

用統計學方法來估計,增大樣本含量可減少,沒有固定方向和固定大小,一般呈正態分布。第二節研究的真實性二、內部真實性

內部真實性(internalvalidity)

定義研究結果與實際研究對象真實情況的符合程度,它回答一個研究本身是否真實或有效。改善措施

限制研究對象的類型和研究的環境條件。第二節研究的真實性

三、外部真實性

外部真實性(externalvalidity)

定義研究結果與推論對象真實情況的符合程度,又稱為普遍性(generalizability)。它回答一個研究能否推廣應用到研究對象以外的人群。改善措施增加研究對象的異質性,使得研究對象的代表性范圍擴大。第三節研究的偏倚

選擇偏倚信息偏倚混雜偏倚混雜偏倚的分層分析Bias:

systematic,non-randomdeviationofresultsandinferencefromthetruthorprocessleadingtosuchdeviation,anytrendinthecollection,analysis,interpretation,publicationorreviewofdata,thatcanbeleadtoconclusionwhicharesystematicallydifferencefromthetruth.DictionaryofEpidemiology,3rded.第三節研究的偏倚在流行病學研究中由于系統誤差的存在,使樣本人群的測量指標系統的偏離目標人群的真實值,從而影響研究結果和推論的現象。偏倚可發生于研究的任何階段。

1946年,Berkson最著名的偏倚研究并給予證實,又稱為Berkson偏倚。1976年,Miettinen詳細討論了偏倚的定義,并給出分類框架,分三類:

選擇偏倚信息偏倚混雜偏倚第三節研究的偏倚一、選擇偏倚(selectionbias)

定義研究對象的選取過程中,由于選取方式不當,導致入選對象與未入選對象之間存在系統差異,由此造成的偏倚稱為選擇偏倚。例如研究對象采用志愿者,方便樣本,或者研究對象的無應答或失訪等。第三節研究的偏倚中學生近視:40%重點高中學生近視?pP=40%?某計劃生育門診隨診的IUD使用者中,生殖道感染現象嚴重,為此,該門診收集了半年的病例進行了分析,發現STI感染率達到50%,所以,該門診醫生得出結論:IUD使用者中STI感染率為50%。IUD使用者有癥狀無癥狀就醫STI感染:50%SO:IUD使用者中STI感染率為:50%?呼吸道疾病一般人群骨和運動疾病住院病人骨和運動疾病+—合計+—合計+1720722451520—1842376256018219237合計2012583278423234257OR1.064.06一般人群和住院人群中骨、運動疾病和呼吸道疾病的關系

描述性研究的選擇偏倚

主要體現在樣本對總體的代表性上如不是采用隨機抽樣而是使用方便樣本,或某些特定群體(志愿者、因特網利用者等)造成的外部效度(外推)受限問題。控制方法盡量采用隨機抽樣,避免樣本選取的偏向對特定群體的結果在外推上要謹慎等

第三節研究的偏倚分析性研究的選擇偏倚

主要體現研究對象進入、排除、不參與或失訪等與研究暴露或處理因素存在關聯,由此增大或減少暴露與疾病、處理與效應的關聯,導致效應估計的偏倚。控制方法選取具體環節或已選取人群的具體特征分析研究對象的選取是否同暴露或處理因素有關第三節研究的偏倚常見選擇偏倚入院偏倚失訪偏倚志愿者偏倚第三節研究的偏倚確定有無選擇偏倚的關鍵把握選取環節或已入選對象,是否存在人為增大或減少研究因素與結局的關聯程度控制方法嚴密掌握對象選取的各個環節,注意選取對象的代表性,增加應答和減少失訪等第三節研究的偏倚二、信息偏倚(informationbias)

定義

又稱測量偏倚或觀察偏倚,是來自于測量或資料收集方法的問題,使得獲取的資料存在系統誤差。由于流行病學的暴露或疾病多為分類測量,所以信息偏倚又可稱為錯誤分類偏倚(misclassificationbias)。信息偏倚同樣影響描述性研究和分析性研究的結果。第三節研究的偏倚無差異性錯誤分類和差異性錯誤分類表8-3

無差異性錯誤分類

差異性錯誤分類 錯誤分類數據 錯誤分類數據

研究真實數據

研究真實數據第三節研究的偏倚

差異性信息偏倚的兩種常見類型

回憶偏倚(recallbias)產生于研究對象記憶過去活動和暴露能力的差異。

調查者偏倚(interviewerbias)產生于調查者對研究對象有差異性地收集信息。采取盲法,可以降低調查者偏倚。第三節研究的偏倚

為了減少錯誤分類以及改善測量的準確性,研究者們正在越來越多地使用生物學標記物(biologicalmarkers)。它們可以用來測量易感性、內暴露(實際進入體內)劑量或生物學效應(劑量)等。第三節研究的偏倚三、混雜偏倚(confoundingbias)

定義:在流行病學研究中,由于一個或多個與暴露和研究疾病均有關的第三因子的影響,掩蓋或夸大了研究因素和疾病之間的真實聯系。稱為混雜偏倚。第三節研究的偏倚混雜的特征:混雜因素是所研究疾病的一個獨立危險因素混雜因素與所研究的暴露因素存在統計學聯系混雜因素不是所研究暴露因素和疾病之間因果鏈的中間環節。混雜的判斷:未分層的OR不等于分層調整后OR在非暴露組可疑混雜因子與疾病相關在非疾病組中可以混雜因子與暴露相關當cRR=aRR(f)或cOR=aOR(f)時,則f無混雜作用。當cRR≠aRR(f)或cOR≠aOR(f)時,且分層后有f層和無f層的分層RRi或ORi相同,則f有混雜作用。

混雜的方向:正混雜:cRR>aRR負混雜cRR<aRR中年人少量飲酒與心肌梗塞危險性–混雜因素示例

少量飲酒不飲酒心肌梗塞發病(例)140100隨訪人年(人年)30,00030,000發病率(1/千)4.673.33

RR=1.40

不同性別中年人少量飲酒與心肌梗塞危險性–混雜因素示例

男性

女性

少量飲酒不飲酒

少量飲酒不飲酒心肌梗塞發病(例)12060

2040隨訪人年(人年)20,00010,000

10,00020,000發病率(1/千)6.006.00

2.002.00

RR=1.0

RR=1.0口服避孕藥心肌梗死對照合計+29135164—20516071812合計23417421796

cOR=1.68口服避孕藥與心肌梗死的關系心肌梗死組和對照組年齡分布年齡(歲)心肌梗死例數構成比(%)對照組人數

構成比(%)25~62.628616.430~219.042324.335~3715.835620.440~7130.337121.345~499942.330617.6合計234100.01742100.0年齡組病例組口服避孕藥暴露率對照組口服避孕藥暴露率ORi2566.721.77.23042.97.88.93510.87.31.5408.52.43.745~496.13063.9合計12.47.7cOR=1.68ORMH=3.97心肌梗死組和對照組口服避孕藥年齡別暴露率(%)C?DE高血清膽固醇冠心病黃色瘤?吸煙咖啡胰腺癌

繼發關聯(secondaryassociation)第三節研究的偏倚第三節研究的偏倚混雜的控制:設計階段:限制(restriction),匹配(matching)隨機化(randomization)

分析階段:標準化率、分層和多變量分析限制(restriction)是在選擇研究對象時,限制在具有一定特征的對象中進行觀察,以排除其他因素的干擾。可提高可比性。這種方法所獲得的結論常有很大局限性,影響研究對象的代表性,使研究結果外推至一般人群時受限。

匹配(matching)匹配是指在為研究對象設立對照時,使研究組對象和其對照在一個或多個潛在混雜因素上相同或相近,從而消除混雜因素對研究結果的影響。匹配的目的是為了控制混雜、提高研究的統計學效率。病例對照研究、隊列研究和實驗研究均可采用匹配。尤其是隊列研究,使用匹配可達到直接控制混雜的效果,但病例對照研究中仍需進行分層分析來較好地控制混雜。隨機化(randomization)隨機化是指以隨機化原則將研究對象以同等的機率被分配在各處理組中,從而使潛在的混雜因素在各組間分布均衡。隨機化多用于實驗研究,尤其是臨床試驗。標準化(standardization)當比較兩個率時,如果兩組對象內部構成存在的差別足以影響結論,可用率的標準化加以校正,亦即使可能影響結果的因素受到同等的加權,使這兩個率可比、無偏倚,這種方法稱為標準化。分層(stratification)分層是指將研究所獲資料按可疑的混雜因素分成數層(亞組)進行分析。Mantel-Haenszel分層分析是最常用的檢出和控制偏倚的方法之一。但如果欲控制的混雜因素較多,則分層分析對樣本量的要求較大,此時,可以應用多因素分析方法如Logistic回歸分析等來估計和控制混雜。

四、混雜偏倚的分層分析

M-H(Mantel-Haenszel)分層分析方法的步驟按可疑的混雜因素進行分層層間一致性檢驗;判定層間RR或OR是否相等或相近合并計算調整的(控制混雜后)RR或OR將調整RR或OR與分層前的粗

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論