傾向值匹配研究_第1頁
傾向值匹配研究_第2頁
傾向值匹配研究_第3頁
傾向值匹配研究_第4頁
傾向值匹配研究_第5頁
已閱讀5頁,還剩36頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、傾向值匹配研究(Propensity Matched Study)病例對照研究(case-control study)定義:病例對照研究是選擇患有特定疾病的人群作為病例組,和未患這種疾病的人群作為對照組,調查兩組人群過去暴露于某種(或某些)可能危險因素的比例,判斷暴露危險因素是否與疾病有關聯及關聯程度大小的一種觀察性研究方法。 用途 1、探索疾病的可能危險因素 2、用于藥物有害作用的研究 3、探討影響疾病的預后因素 4、評價某種疫苗在現場使用中的流行病學效果 設計與實施 (一)確定研究目的,提出研究假設 (二)病例的選擇 統一診斷標準,規定人口特征和外部特征。 來源:醫院病例 社區人群病例 隊

2、列內病例 類型:新發病例 現患病例 死亡病例(三)對照的選擇 采用與病例相同的診斷標準明確排除的非患者作為對照,并依照病例的人口學特征和外部特征的相同要求選擇對照。 醫院病例或門診病人 一般人群 鄰居、同事、親屬 (四)樣本含量估計 (五)暴露因素的確定與資料收集 暴露因素的確定:與目的有關的變量絕不可少,且盡量分解、分細。每項變量有明確的規定,盡可能采用國內外統一的標準。 資料的收集:主要以現場詢問的方式進行,應有專門設計的調查表,要求病例組與對照組均使用同一調查表。盡可能選擇客觀指標。調查人員應統一培訓,對待病例組和對照組均應同樣認真,以同樣的方式詢問。 (六)資料分析1、資料整理成組病例

3、對照研究資料整理表成組病例對照研究資料整理表 暴露史或特征暴露史或特征 病例病例 對照對照 合計合計 有有 a b a+b=n1 無無 c d c+d=n0 合計合計 a+c=m1 b+d=m0 a+b+c+d=N 2、統計學檢驗 檢驗病例組和對照組的暴露率的差異是否有統計學意義。即a/(a+c)和b/(b+d)的比較。 用以下公式010122mmnnNbcad3、計算暴露與疾病的關聯強度 采用比值比(odds ratio ,OR)來估計。比值(odds)是指某事物發生的概率與不發生的概率之比。 病例組的比值= 對照組的比值= camcma11dbmdmb00bcaddbcaOR四、常見偏倚及

4、控制 1、選擇偏倚(selection bias) 由于選擇研究對象的方法有問題或缺點,造成病例組和對照組缺乏均衡可比性。 常見的選擇偏倚 入院率偏倚(admission rate bias) 存活病例偏倚(prevalence-incidence bias) 檢出癥候偏倚(detection signal bias) 選擇偏倚的控制 隨機抽樣 保證病例和對照的代表性。 設立對照 兩個或多個對照。 嚴格診斷標準 明確入組和排除標準。 提高應答率2、信息偏倚(information bias) 收集資料階段由于觀察和測量暴露或結局的方法上有缺陷,使各比較組所獲得的信息產生系統誤差。 常見的信息偏

5、倚 暴露懷疑偏倚(exposure suspicion bias) 回憶偏倚(recall bias) 信息偏倚的控制 采用盲法收集資料 收集客觀指標的資料 廣泛收集各種資料 保證研究人員的科學態度 3、混雜偏倚(confounding bias) 由于一個或多個既與疾病有關,又與暴露因素有關的外部因素的影響,掩蓋或夸大了所研究的暴露因素與該病的聯系。 控制 限制(restriction) 配比(matching) 分層(stratification) 多因素分析(multivariate analysis)傾向值匹配研究(Propensity Matched Study)隨機對照試驗(ran

6、domized controlled trial,RCT)非隨機對照試驗(nonrandomized controlled trial,NRCT)在大量觀察性數據和臨床試驗研究中,為了估計并評價某種處理效應,選擇隨機對照試驗(randomized controlled trial,RCT)無疑是最理想的 RCT 在實際應用中卻受到了很多方面的限制,例如高昂的研究費用、倫理學的要求、實際中操作的困難性、不適用于發病率很低的疾病研究以及周期較長的科學研究等。在非隨機化研究中,由于基線特征在組間的分布不均衡,使之成為處理效應估計的混雜因素,從而導致處理效應的估計存在偏倚。多變量分析模型、Mantel

7、-Haenszel 分層分析、協變量匹配多變量分析模型在結局發生率很低,而混雜因素較多的情況下卻難以發揮作用;Mantel-Haenszel 分層分析法和協變量匹配法同樣不適用于混雜因子較多,數據維度很高的非隨機化數據分析傾向值匹配研究(Propensity Matched Study) 不再關注每個需要控制的混淆變量的具體取值 而是轉而關注將這些變量納入 Logistic 回歸方程后預測出來的傾向值取值 只要保證傾向值匹配,這些所有需要控制的混淆變量就都考慮到了( Rosenbaum Rubin,1983) 將對多個混淆變量的控制轉為對傾向值的控制從而達到“降維”( dimension re

8、duction) 的目的。 解決了這個多混淆變量下的“多維”( multiple dimensional) 問題傾向值是在 1983 年由學者 Rubin 和 Rosenbaum 首次給出了明確的定義:指指在一系列可觀察到的協變量條件下,在一系列可觀察到的協變量條件下,任意一任意一個研究對象被分配到試驗個研究對象被分配到試驗組或者對照組的概率組或者對照組的概率。綜合了研究對象所有特征的函數,最大限度的概括了所有可觀察到的協變量共同作用的結果。通過傾向值匹配使得處理組和對照組間的基線協變量均衡一致,從而達到控制偏倚,估計處理效應的目的。 傾向值匹配研究(Propensity Matched St

9、udy)在一個等比例分組的隨機對照試驗中,受試者分配到試驗組和對照組的概率是相等的,每一個受試者的傾向得分為 0.5。在一個非隨機對照試驗中,每一個受試者分配到哪個組的真正的概率是未知的傾向傾向值值的的理論認為,在非隨機化對照試驗中,處理組試驗對象和理論認為,在非隨機化對照試驗中,處理組試驗對象和對照組對照組試試驗對象如果具有相近或者相同的傾向得分,則可以認為,這兩個試驗驗對象如果具有相近或者相同的傾向得分,則可以認為,這兩個試驗對象對象的協變量特征服從相同的分布,它們被分配到處理組或者是對照組的的協變量特征服從相同的分布,它們被分配到處理組或者是對照組的概率概率是是相同的,因此可認為組間協變

10、量是均衡的,處理效應的估計也就是無偏相同的,因此可認為組間協變量是均衡的,處理效應的估計也就是無偏的的針對某個研究項目,不同的個體有不同的參與意愿,或者研究者對于研究個體的選擇有特定的傾向。這些選擇效應( selection effect) 使得研究者真正接觸的樣本是有一定“偏向的”。而基于一個帶有選擇性的樣本,我們得出的結論也會由于選擇效應的“污染”而出現偏差( Heckman,1979;Heckman Smith,1995) 傾向值匹配研究(Propensity Matched Study)理論基礎 將相同或相近傾向值的對照與試驗組病例進行匹配,從而使兩組病例在接受干預治療上的概率相等。

11、類似一個非隨機化試驗在試驗結束后進行了隨機化中的過程,均衡了組間的協變量,讓兩組可以進行統計學比較,從而得出真實的處理效應。 傾向值匹配(Propensity Matching)傾向值匹配(Propensity Matching)步驟(1)首先要對數據進行數據質量核查,鑒別數據類型,考察數據的完整性和邏輯性,然后根據數據類型和樣本量大小來選擇相應的傾向得分的分析方法。 (2)選擇納入模型的協變量。針對試驗目的,根據研究者的臨床經驗篩選混雜因素,并結合傾向得分變量選擇的要求,選擇合適合理的混雜因素。然后以處理因素為應變量,混雜因素為自變量來構建模型。根據模型獲得傾向得分的估計值。估計傾向得分可選

12、的模型包括 logistic 回歸、Probit 回歸、判別分析等,其中最常用的是 logistic 回歸模型。 (3)根據數據結構類型和選定的模型來計算每一個試驗對象的傾向得分,傾向得分在 01 之間,表示試驗對象被分配到試驗組或者對照組的概率。(4)選擇合適的傾向得分應用方法。PS 分層法、PS 匹配法和 PS 協變量校正法等。以傾向得分匹配法為例,在估計出試驗對象傾向得分之后,需要選擇合適的算法計算出組間傾向得分之間的距離,也就是近似程度。 (5)根據每個試驗對象的傾向得分值,通過選擇好的匹配算法進行組間匹配,匹配結束后得出匹配數據集。(6)在匹配前后,進行組間均衡性檢驗。組間基線的均衡

13、性優劣是評價傾向得分方法在實際應用中控制選擇性偏倚及混雜效應的較好的指標。傳統上常用的均衡性檢驗方法是假設檢驗,但假設檢驗法存在先天不足,針對此問題 1986 年由 Flury 和 Reidwyl 提出了標準化差異法,給出了明確的定義和計算方法 。 (7)對匹配后的數據集,選擇合適的統計學分析方法來估計處理效應。由于匹配后試驗組和對照組之間的協變量均已均衡,數據可以看作是近似隨機化的,如果選擇了合適的統計學方法則可以得出真實可信的處理效應。經過匹配,每一個試驗組個體都能在對照組找到一個或多個與之匹配的對照個體,所以我們在統計學處理時,也可以考慮類似配對設計的統計方法來進行分析。(8)對數據進行

14、敏感性分析。在一次試驗中,好的匹配方法產生不完整的匹配集是不可避免的,哪怕采用最大化匹配也不能消除匹配的不精確。因此,如何在匹配的精度和完整度之間進行選擇,值得探討。在臨床實踐中,由于匹配數據的不完整導致嚴重的偏倚要遠遠高于由于精度不夠導致的偏倚。所以選擇一種合適的匹配算法是十分重要的,因為它影響到處理效應的估計。比較數據集在匹配前后的精確度和完整度,以此來評價不同的匹配算法的優劣是至關重要的。 一巢式(套式、嵌入式)病例對照研究(nested case control study) 按隊列研究的方式進行,收集每個隊列成員的暴露信息及有關混雜因素,確定隨訪期內發生的病例作為病例組,對照來自同一

15、隊列,然后進行病例對照研究巢式病例對照研究的類型: 前瞻性巢式病例對照研究(prospective nested case-control study): 研究開始時根據一定的條件選擇某一人群作為隊列,然后前瞻性地隨訪一定的時間確定病例組和對照組。 回顧性巢式病例對照研究(retrospective nested case-control study): 研究開始之前的一段特定時間的情況選擇某一人群作為研究隊列,根據現在的情況確定病例組和對照組。二病例-隊列研究(case-cohort study)病例參比式研究(case-base reference study)原理 研究開始時在隊列中隨機

16、選取一組樣本作為對照,觀察結束時,隊列中出現被研究疾病的所有病例作為病例組。特點 可以同時研究幾種疾病,不同的疾病有不同的病例組,對照組是同一組隨機樣本。基本步驟: 根據研究目的確定合適的人群作為研究隊列(全隊列); 按照一定的抽樣比例在全隊列中抽取一部分對象作為對照組(子隊列); 隨訪一段預定的時間,隨訪期全隊列中發生的所有患者組成病例組;資料分析 抽取所有病例和子隊列成員的協變量信息做統計分析: (1)用病例對照研究的分析方法估計OR值; (2)用虛擬危險度估計RR值; (3)用Cox模型進行多因素分析和計算RR值。兩者的比較v相同 對隊列中的每個成員進行觀察與分析v不同 對照是隨機選取,

17、不與病例進行匹配 對照如發生被研究疾病,既為對照又為病例 1個隨機對照組可同時和幾個病例組比較兩者的優點v 按隊列研究設計進行,資料收集在發病前,故因果關系清楚,資料可靠,論證強度高v資料處理與分析按病例對照研究的方式,省時省力省錢v兼有病例對照研究與隊列研究兩者之優點巢式病例對照研究的優點: 統計效率高 統計方法常用 收集資料簡便病例-隊列研究的優點: 對照隨機選擇,代表性好 對照選擇不受時間限制,選擇快 一組對照可同時與幾種病例組比較三病例-病例研究(case-case study)或稱單純病例研究(case only study)定義: v探討不同臨床類型或具有某方面標志的病例與無標志的病例危險因素間的關系和交互作用。v按病例對照研究的方式處理資料。v不另設未患病的對照組,直接對患病的兩個亞組進行比較。 例如出血型腦卒中與缺血型腦卒中、p53突變陽性基因型的食管癌與p53突變陰性基因型的食管癌、食管癌的鱗癌與腺癌的比較研究等 基本步驟: 確定某一患者群體作為研究對象; 收集病人的一般情況、協變量、環境暴露資料,以及生物標本; 采用分子生物學技術檢測基因型; 根據某一基因型的有無將研究對

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論