臨床醫學科研設計方法評價_第1頁
臨床醫學科研設計方法評價_第2頁
臨床醫學科研設計方法評價_第3頁
臨床醫學科研設計方法評價_第4頁
臨床醫學科研設計方法評價_第5頁
已閱讀5頁,還剩125頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

臨床醫學科研設計方法及論文的嚴格評價中華醫學會姜永茂一、臨床醫學科研設計方法的分類描述性研究(DescriptiveStudy)病例報告(CaseReport)系列病例分析(CaseSeriesAnalysis)橫斷面調查(Cross-sectionalSurvey)分析性研究(AnalyticalStudy)病例-對照研究(Case-Controlstudy)隊列研究(CohortStudy)干預性研究(InterventionalStudy)隨機對照臨床試驗(RCT)、非隨機同期對照臨床實驗(CCT)、歷史對照臨床試驗、自身前后對照實驗(Before-AfterStudy)、交叉試驗(Cross-OverStudy)病例報告是有關單個病例或10例以下病例的詳盡臨床報告,系對罕見病進行臨床研究的主要形式。對新發生的疾病或臨床事件的首例報告具有重要的價值,許多疾病首次認識都是通過病例報告形式,如AIDS、萊姆病等病例報告由于詳細描寫病例的臨床表現和治療經過,有時可以提示實驗室尚不能證實的發病機制,如血小板減少性紫癜、海豹肢畸形高度選擇,容易出現偏倚不能估計疾病或臨床事件的發生頻率據Fletcher統計,國外主要的醫學期刊發表的原始研究中大約20%--30%為10例以下的病例報告,如BMJ的“LessonoftheWeek”病例報告實例1980-1981年6個月的時間內,洛杉磯三家醫院先后發現5例以前健康的男性同性戀青年患卡氏肺囊蟲肺炎,這種情況引起了人們的注意,因為這種類型的肺炎以前幾乎毫無例外地發生于老年男性或女性,因為他們的免疫系統受到了抑制。這種不常見的情況提示醫生他們可能患了一種以前不知道的疾病,后來證實他們患的是獲得性免疫缺陷綜合征,即艾滋病HymesKB,GreeneJB,MarcusA,etal.Kaposi’ssarcomainhomosexualmen-areportofeightcases.Lancet,1981,2:598.

系列病例分析是對一組病例資料進行的分析(一般>10例)可以是前瞻性的,但多數是回顧性的,病例資料不全對病例有一定的選擇性,容易導致偏倚缺少對照,難以比較效果評價:(1)樣本量;(2)前瞻性還是回顧性;(3)連續樣本、抽樣樣本、選擇樣本;(4)診斷標準系列病例分析實例1997年新英格蘭醫學雜志報道了24例既往健康且相對年輕的婦女患有瓣膜性心臟病。通過分析發現,這些婦女在患病前的1年時間里均服用了一種通過抑制食欲而達到減肥目的的減肥藥(fenfluramine-phentermine)。作者推論這種減肥藥可能導致嚴重的瓣膜性心臟病。后經病例-對照研究證實。ConnollyHM.Valvularheartdiseaseassociatedwithfenfluamine-phentermine.NEnglJMed,1997,337:581-588.描述性研究的評價病例報告和病例分析都是描述性研究,缺乏嚴格的科研設計和規范的對照分析,科學性差,論證強度低,只能為進一步進行分析性和試驗性研究提供線索,本身并不能驗證假設。但描述性研究容易進行,臨床醫生面臨大量臨床資料和病史記錄,隨時可以總結分析,所需時間短,不需很多的人力、物力,因此至今仍是臨床醫生應用的最主要的科研設計方案橫斷面研究是在某一時點或相當短的時間內(如1天、一周或一個月)對某一人群中有關疾病或臨床事件的患病(或發生)狀況及影響因素進行調查分析,因此又稱為現況研究或患病率研究現況研究的目的是了解某一疾病或臨床事件的發生狀況及其影響因素,根據不同的研究目的可獲得不同的結果,如患病率、抗體陽性率、實驗室指標的陽性率、疾病的傷殘率和死亡率等診斷試驗評價的科研設計可以視為特殊形式的橫斷面研究橫斷面研究實例我國糖尿病研究協作組進行的“我國14省市30萬人口糖尿病調查報告”,是我國首次在全國范圍內進行的糖尿病患病率調查,獲得我國糖尿病的實際患病率為0.609%,對研究我國糖尿病的分布及制定防治規劃都有十分重大意義。評價這項研究要注意:所抽取的30萬人口作為研究對象代表性如何?所應用的篩選試驗本身敏感性和特異性如何?糖尿病的診斷標準如何確定?可同時進行危險因素調查,如年齡、性別、吸煙、飲酒等橫斷面研究的評價橫斷面研究基本上屬于描述性研究,但與病例報告及病例分析相比,其研究設計較為嚴密,需要計算樣本大小,在選擇研究對象、抽樣方法、影響因素的調查及結果的分析等方面均較為規范,對患者和非患者的特征及影響因素又可以進行某些比較性研究和分析。現況研究主要是通過普查和抽樣調查方式進行。普查是對選定的目標人群的所有對象都進行調查,抽樣調查則隨機抽取目標人群的樣本人群作為研究對象。代表性最好的抽樣方法是隨機抽樣橫斷面研究的評價橫斷面研究論證強度較低,用于病因或預后研究時,因為是同時調查疾病和影響因素,沒有時間因果關系。因此,橫斷面研究主要功能是普查或抽樣調查獲得疾病的患病率及用于診斷試驗的評價,而對防治、病因、預后研究,只能是提供線索,為進一步作分析性研究或試驗性研究打下基礎病例-對照研究病例-對照研究是一種用于分析暴露和疾病(或臨床事件)之間因果關系的分析性研究設計方案。選擇具有所研究疾病(或臨床事件)的一組病人組成病例組,無此病(或臨床事件)的一組為對照組,比較兩組的暴露率或暴露水平的差異,以研究該疾病(或臨床事件)與暴露的關系。如果病例組的暴露率或暴露水平高于對照組,則認為該暴露因素與疾病或事件有聯系。這里“暴露”指暴露于某些危險因素、具有某種預后因素或接受某種診療措施等病例-對照研究的設計模式病例-對照研究的結果病例組對照組有暴露因素ab無暴露因素cdOddsRatio(OR)=(a/b)/(c/d)=ad/bc進行卡方檢驗,計算P值和可信區間(95%CI)病例-對照研究實例瑞典進行了一項大規模病例-對照研究來探討胃-食管反流和食管腺癌的關系。研究者收集了189例食管腺癌患者和820例經年齡、性別配對的對照組,以同樣方式調查了兩組燒心等癥狀的情況食管腺癌組對照組燒心、反胃或都有113135(至少每周一次)

無上述癥狀76685OR=7.5,95%CI=5.3-11.4,嚴重者OR=43.5(18.3-103.5)

Symptomaticgastroesophagealrefluxasariskfactorforesophagealadenocarcinoma.NewEnglJMed,1999,340:825-831.病例-對照研究的特點研究對象分成病例組和對照組并不是隨機化分組,因此按有無被研究的疾病或臨床事件來分組,因此病例組和對照組不是研究者能控制的所調查的研究因素是由研究者從現在對過去的回顧而獲得,因此是回顧性研究從因果關系的角度來看,是先有了疾病再去調查暴露情況,分析疾病和暴露的關系,因此是由果推因的研究病例-對照研究的優點所需樣本量較少,適合于罕少見疾病的研究調查暴露情況采用回顧性方法,適用于對長潛伏期疾病的研究,如化學因素致癌作用常需10-20年允許同時調查許多因素與研究疾病的聯系,可以使用病史記錄作為數據來源省人、省時、省錢,科研周期短,容易出成果病例-對照研究的缺點選擇合適對照組非常困難,對照組系由研究者自行選擇,難免產生選擇偏倚暴露率和暴露水平的測量是在患病之后回顧而獲得,因此特別容易受到回憶性偏倚的影響不能計算發病率,只能計算相對危險度,用優勢比(oddsratio,OR)來估計論證強度不及隊列研究和試驗性研究,因此當病例-對照研究得出的結論有爭議時,應進一步設計隊列研究加以證實隊列研究隊列研究也是一種用于分析暴露和疾病(或臨床事件)之間因果關系的分析性研究設計。它把一群研究對象按是否暴露于某種因素分成暴露組與非暴露組,隨訪適當長的時間,比較兩組之間所研究疾病(或臨床事件)的發生率(發病率或死亡率)的差異,以研究疾病與暴露之間的因果關系隊列研究的設計模式隊列研究的結果患病無病危險性暴露aba/(a+b)

非暴露cdc/(c+d)RelativeRisk(RR)=a/(a+b)/c/(c+d)AttributableRisk=a/(a+b)-c/(c+d)隊列研究的實例世界上最著名的隊列研究是由AustinBradfordHill爵士、RichardDoll爵士及后來的RichardPeto進行的,這項研究為最初的兩位作者贏得了爵位。他們通過問卷隨訪了34440名英國醫生,將他們分為四個隊列(非吸煙者、輕度吸煙者、中度吸煙者、重度吸煙者),應用全病因死亡率和特異病因死亡率作為觀察結果。在1964年發表的10年初步報告中,顯示吸煙者無論肺癌死亡率還是全病因死亡率都大幅度升高,并且有劑量-效應關系(吸煙越多,患肺癌的幾率越大)。這項重要研究的20年和40年的結果(對1951年收集并且沒有死亡的研究對象的隨訪率達到驚人的94%),不僅表明了吸煙的危害性,也表明了從一個執行良好的隊列研究中獲得證據的重要作用隊列研究的實例吸煙者和非吸煙者每年每100000人死于肺癌和缺血性心臟病的人數肺癌缺血性心臟病

非吸煙者10413吸煙者1406691-14/d7860815-24/d127652>25/d251792吸煙者和非吸煙者肺癌RR=140/10=14;>25/d者RR=25.1吸煙者和非吸煙者缺血性心臟病RR=669/413=1.6肺癌AR=140–10=130/100000/year缺血性心臟病AR=669–413=256/100000/year

隊列研究的優點可設立前瞻性的同期對照,除了暴露因素接觸與否外,各隊列中納入的觀察對象、診斷標準和納入/排除標準以及觀察指標等都可作到標準化,因此論證強度高,可靠性強因為暴露在前,疾病在后,確定暴露沒有偏倚由于是前瞻性觀察,沒有回憶性偏倚臨床應用廣,病因研究、預后研究、防治效果遠期療效的觀察等都可以應用,特別是在病因及危險因素的研究中有重要價值。RCT不能進行時,隊列研究是最好的設計方案隊列研究的缺點在發病率很低的疾病需要很大的樣本數,并且有些暴露因素從接觸到發病有很長的潛伏期,因此不適用于少見疾病的研究隊列研究屬于觀察性研究,分組是自然形成的,與試驗性研究相比,容易產生偏倚容易發生失訪偏倚,如失訪率在10%以上就可能會影響研究結果由于隨訪時間較長,在此過程中會發生許多事件或因素,很難判定最后出現的結果只與所研究的暴露因素有關隨機對照臨床試驗試驗組和對照組的分組是采用真正隨機化分配方法。兩組都被隨訪一個特定的時期,然后按預先確定的終點指標(死亡、心臟病發作、血清膽固醇水平等)進行分析。RCT還可按是否實行盲法(blinding)分為單盲試驗、雙盲試驗和開放試驗(open或openlabel),后者不實行盲法。隨機對照雙盲試驗(randomized,controlled,doubleblindedtrial)被認為是最佳的科研設計方法,是科研設計的“金標準”目標人群研究樣本隨訪時間未改善改善改善未改善試驗組比較組隨機對照臨床試驗實例4S研究(ScandinavianSimvastatinSurvivalStudy)入選4444例患有冠心病且血清膽固醇為5.5-8.0mmol/l的患者,隨機分為兩組,一組接受辛伐他汀治療,另一組接受安慰劑治療。該試驗是雙盲,且結果評價人員也不了解分組情況。一級終點是總死亡率,二級終點是主要冠狀動脈事件發生率。兩組隨訪條件一致,平均隨訪5.4年。結果:辛伐他汀組總死亡率8.2%,安慰劑組11.5%;相對危險性減少(RRR)為29%;絕對危險性減少(ARR)為3.3%;需要治療人數(NNT)為30

隨機對照臨床試驗的優點前瞻性設計,是檢驗一種假設的最有力的方法隨機化分組,試驗組和對照組之間的均衡性好,增加了可比性,排除了很多非研究因素的混雜偏倚有嚴格的診斷、納入/排除標準,觀察指標與判斷標準統一,在很大程度上減少了偏倚的發生雙盲法減少了觀察性偏倚允許作系統評價(systematicreview)和匯總分析(metaanalysis)隨機對照臨床試驗的缺點昂貴且耗時,因此許多RCT,或者從未作過,或者研究對象太少,或者研究的時間太短經常使用替代終點指標而非臨床結果,可導致潛在的偏倚隨機化方法不正確,或隨機化不理想沒有對所有合格的患者進行隨機化分組,排除了不典型、合并癥、預后差、禁忌癥的病人需要病人知情同意,實施困難醫學倫理學問題系統評價和匯總分析1973年,一個小樣本研究證實對早產婦女給予皮質類固醇激素可以降低嬰兒死亡率。隨后10年又進行了6個研究,因為樣本量都很小,所以其結果不一致。假如在1983年進行匯總分析,就會發現這些試驗總的結果表明類固醇激素治療具有有益的作用。但又過了10年并又進行了另外7個研究,才最終證實了類固醇治療的作用,臨床實踐才開始改變論文質量重要性原始性真實性可讀性可重復性科學性實用性倫理性二、醫學論文的嚴格評價醫學論文科學性的嚴格評價研究設計的因素研究對象的因素觀測結果的因素資料收集與整理的因素統計分析的因素證據的等級我國臨床研究的現狀科研設計方法1985年1995年

病例報告95(14.8%)72(7.6%)臨床試驗221(34.5%)298(31.2%)對照臨床試驗(CCT)36(5.6%)108(11.3%)隨機對照臨床試驗(RCT)8(1.3%)40(4.2%)前瞻性研究25(3.9%)57(6.0%)回顧性研究160(25.0%)133(13.9%)

橫斷面研究272(42.5%)452(47.4%)實驗性研究52(8.1%)132(13.8%)合計640(100%)954(100%)對科研設計方法的正確評價科研設計方法的選擇取決于不同的研究階段循序漸進取決于不同的研究領域診斷性研究取決于不同的疾病罕少見疾病取決于醫學倫理學的要求治療性研究的恰當時機各種科研設計方案的應用范圍應用范圍描述性橫斷面病例-對照隊列研究臨床試驗疾病的普查和+++抽樣調查診斷方法評價+++防治效果評價++++++預后研究++++++病因/危險因素+++++++研究對象的因素研究對象的納入、排除標準研究對象的代表性連續樣本、抽樣樣本、選擇樣本(RealWorld)樣本大小分組情況(無對照、對照、隨機對照)干預措施的隱匿情況隨訪時間、失訪率觀察結果的因素測量結果的質量控制方法是否采用盲法(客觀、主觀)替代終點指標與臨床終點指標診斷性研究的評價描述性研究橫斷面研究選擇研究對象確立標準診斷,將對象分為有病、無病用研究的診斷方法檢查對象,結果與標準診斷比較計算評價指標前瞻性或回顧性TestResultReferenceStandardDiseasePresentDiseaseAbsentDiseasePresentTrue

positive(a)False

positive(b)DiseaseAbsentFalse

negative(c)True

negative(d)Sensitivity=a/(a+c)Specificity=d/(b+d)Efficacy(Accuracy)=(a+c)/(a+b+c+d)PositivepredictiveValue=a/(a+b)NegativePredictiveValue=d/(c+d)診斷性試驗的評價1.是否與標準診斷方法進行盲法對比標準診斷方法指當前公認的診斷疾病最可靠的方法,也稱“金標準”常用的“金標準”有病理學診斷、手術、特殊的影象診斷(冠造診斷冠心病),也可用公認的綜合診斷標準標準診斷的選擇應結合臨床具體情況標準診斷選擇不妥,將造成病例組、對照組劃分錯誤如評價B超對膽石癥的診斷價值,采用口服膽囊造影作為診斷膽石癥的金標準,實際上口服膽囊造影要比B超為差,從而造成敏感性、特異性評價結果的不正確診斷性試驗的評價2.研究對象能否代表試驗檢查對象總體病例組應包括該病的各種臨床類型:輕、中、重型,早、中、晚期,典型和不典型,有和無并發癥等,使試驗結果具有代表性對照組應選自確實無該病的其他病例,應包括易與該病混淆的其他相關疾病,這樣才具有鑒別診斷價值研究對象應是同期進入研究的連續樣本或隨機抽樣樣本,避免選擇偏倚樣本量應足夠大樣本偏倚(SpectrumBias)分期病例組對照組目的

I小量典型病例觀察實驗的性能

II小量典型病例健康人初步鑒別診斷

III病例范圍擴大健康人更進一步鑒別診斷

IV包括伴發疾病包括易混淆的疾病具有臨床鑒別診斷意義

V廣泛病例廣泛的易混淆疾病驗證臨床價值AndrewA.Nierenberg,AlvanR.Feinstein

癌胚抗原的評價RansohoffDR和FeinsteinAR檢索了1969-1973年英文雜志發表的有關CEA診斷結腸癌的文章,發現17篇。其中3篇早期進行的研究報告CEA有很高的敏感性(>90%),1篇報告有很高的特異性(>90%)。但應用上述標準對這些研究進行評價,卻發現研究對象存在問題癌胚抗原的評價結腸癌病例組17個研究均沒有按臨床(如疾病嚴重程度)或合并疾病進行分類3個報告有高敏感性的研究沒有進行病理分期,即沒有說明是否包括局限性病例其他14個研究中7個報告低敏感性,病例均進行了病理分期,包括了局限性病例CEA對廣泛侵潤病例的敏感性比局限性病例高對照病例應包括其他部位的癌癥患者(如乳腺癌、肺癌)及同一部位的其他疾病患者(如結腸炎)17個研究中,只有1個報告CEA有高特異性。對照組包括其他癌癥和結腸疾病,但疾病的侵犯范圍沒有報道16個研究報告低特異性,6個指出了侵犯范圍診斷性試驗的評價3.是否介紹了研究對象的來源三級醫院的專科門診和基層醫院的普通門診,某些疾病的患病人數和病情有很大差別,如報道腎動脈造影對青年高血壓患者的診斷價值,專科醫院可查出10%的腎動脈狹窄對照組的來源也必須交待清楚,如實驗室工作人員、醫學生等診斷性試驗的評價

4.精確性及測量偏倚是否作了描寫必須描寫試驗的精確度和可靠度(可重復性),報告有否測量偏倚,操作者水平和操作者間偏倚(一致性,kappa值)診斷性試驗的評價5.參考值的確定是否合理、可靠正常值與參考值的區別正態分布的數據,參考值為均數+2s,包括95%的正常范圍,雙側各2.5%為不正常非正態分布的數據,參考值可用中位數和百分位數表示數據常有重疊,臨界點的確定取決于對敏感性和特異性的要求。ROC曲線可幫助確定臨界點診斷性試驗的評價6.是否說明了在一組試驗中的價值如診斷試驗作為一組試驗(平行試驗或系列試驗)之一用于臨床,除測定該組試驗總的診斷價值外,還應測定該試驗在該組試驗總的診斷價值中占多少價值診斷性試驗的評價7.是否介紹了具體方法和注意事項試驗對象、方法和結果的判斷應加以敘述,被檢查者是否需要攝入量、飲食或體力活動等方面的限制,是否要禁用某種藥物,是否有不良反應診斷性試驗的評價8.是否作了效用分析四格表計算敏感性、特異性、預測值、似然比介紹假陽性、假陰性病人的最后結局,如對診斷陽性的病人常進行特異的治療,對陰性的病人不治療,其中肯定包括假陽性的病人接受了治療,假陰性的病人未接受治療,會出現那些結果診斷性試驗中常見的偏倚1.病情檢查偏倚對試驗出現陽性結果的患者用金標準確診,而對陰性結果的患者則不再進一步檢查,造成缺乏假陰性的資料。這種情況下會出現敏感性升高,特異性降低的假象,即病情檢查偏倚據調查,1990—1993年世界主要期刊有關診斷性試驗的文章中38%的研究中存在這種問題診斷性試驗中常見的偏倚例如確定病史體檢在冠心病診斷中的作用,對1030例門診懷疑冠心病患者,通過病史體檢有168例進一步作心導管確診,報告敏感性74%,特異性84%,而全部病例無偏倚的敏感性為53%,特異性為93%診斷性試驗中常見的偏倚2.

缺乏對照人群試驗結果造成的偏倚實際上是一種描述性研究--病例分析。例如有腰背痛的患者做MRI檢查,發現許多人有椎間盤突出,故常用此結論來解釋原因,并進行治療。另一篇文章對98例無腰背痛患者作MRI檢查,2/3有椎間盤突出,發生率略低,但無統計學差異診斷性試驗中常見的偏倚3.由病例丟失引起的偏倚診斷試驗常有結果不明確者,在資料分析時作者常將他們剔除,從而造成結論不真實1990--1993年的世界主要期刊中約62%的研究存在此種偏倚診斷性試驗中常見的偏倚4.審閱者偏倚審閱者事先已知道試驗結果所造成的偏倚1990--1993年世界主要醫學期刊中約53%的研究有此偏倚診斷性試驗中常見的偏倚5.測量偏倚試驗操作不正規,缺乏質量控制,沒有進行重復性測定,沒有對觀察者、儀器在不同時間測定的變化加以分析1990--1993年世界主要醫學期刊中,約68%的研究有這類問題診斷性試驗中常見的偏倚6.評價指標不全面許多文章沒有關于敏感性、特異性、預測值、似然比可信區間、ROC曲線等評價指標全面的描述約76%的研究有此問題診斷性試驗中常見的偏倚7.樣本數太少樣本量的大小取決于對敏感性、特異性的要求和允許誤差的大小診斷性試驗中常見的偏倚8.參考試驗偏倚是指金標準選擇不當所造成的偏倚。如評價B超對膽石癥的診斷價值,采用口服膽囊造影作為診斷膽石癥的金標準,實際上口服膽囊造影要比B超為差,從而造成敏感性、特異性評價結果的不正確病因及發病因素研究的評價1.是采用哪一種研究方法?其論證強度如何?描述性研究<病例-對照研究<隊列研究<隨機對照臨床試驗暴露組與非暴露組的可比性如何病因及發病因素研究的評價2.因果關系相關性的強度如何?在隨機對照臨床試驗和隊列研究中,采用相對危險度(RR)作為表示因果關系相關性強度的指標,即試驗組該病發病率是對照組的多少倍。在病例-對照研究中,采用優勢比(OR)表示相關性強度,即暴露于某種危險因素發生某病的危險性是對照組的多少倍。RR或OR越大,表示因果關系相關性越強病因及發病因素研究的評價3.結論的重復性如何?如果結論能夠重復,也就是說在不同地區、不同作者、不同研究方法均能獲得一致結論,表明這種病因學的相關性是比較肯定的。如吸煙和肺癌的關系,美國作了前瞻性隊列研究,追蹤85348名男性老年人,吸煙者患肺癌的RR為10;我國天津曾作病例-對照研究,發現男性吸煙者患肺癌的OR為6病因及發病因素研究的評價4.因與果在時間上的先后關系是否正確?某一病因侵襲人體而導致發病是有一定的效應時間的,這種間隔時間還應呈現一定的規律。先暴露于發病因素或危險因素,然后發病,符合“暴露-發病”關系者,才能明確其因果關系病因及發病因素研究的評價5.是否有劑量-效應梯度?如口服雌激素避孕藥,發現使用1-4.9年者患子宮內膜癌的RR為5.6,使用5-6.9年者上升至7.2,使用7年以上者則為13.9。存在劑量-效應關系也是論證因果關系的一個重要根據病因及發病因素研究的評價6.因果關系是否有流行病學上的意義?如乙型肝炎發病率高的地區,肝癌的發病率也高。評價有關病因學方面的文獻,還要看所論證的因果關系是否符合流行病學的規律病因及發病因素研究的評價7.因果關系是否有生物學意義?如在人體肝細胞癌的組織細胞內發現HBV-DNA。HBV-DNA侵襲人體肝細胞時,有可能誘發肝癌。在肝癌發病率高的小鼠肝細胞內,也發現有類似HBV-DNA的物質,因此肝癌發病的病毒病因存在生物學證據病因及發病因素研究的評價8.因果關系是否有特異性如凝血因子VIII遺傳性缺陷引起血友病,這是特異的,但絕大多數疾病是多因素致病,要論證其因果關系比較復雜預防和治療研究的評價1.是否設有對照組?分組是否隨機化?2.隨訪是否完整?是否按隨機化分組進行分析?3.是否采用盲法?預防和治療研究的評價4.基線資料是否具有可比性?隨機化并不總是很好地平衡兩組,樣本小時機遇的作用更明顯,因此,必須對基線資料進行比較,以確定兩組資料的可比性。這里不是比較兩組間在預后因素的分布上有沒有統計學的顯著性差異,而是比較這些差異的大小,因為隨機分組后任何組間基線情況的差異都是由機遇產生的預防和治療研究的評價5.終點指標是否與臨床直接相關?是否報道了臨床上所有有關的結果?免疫增強劑提高免疫球蛋白水平,但是否能夠減少死亡率,還需進一步研究(替代終點)安妥明降低血脂,有預防心肌梗死發生的作用,但安妥明治療組的總死亡率卻比安慰劑組高,與安妥明引起心律失常的不良反應有關預防和治療研究的評價6.是否詳細介紹了研究對象的情況?納入、排除標準;病情輕重;研究地點(三級專科醫院還是基層醫院);有無并發癥。讀者可根據上述情況應用研究結果預防和治療研究的評價7.是否同時考慮到臨床意義和統計學意義?

P值說明如果無效假設正確(π1=π2)時,發現這種差異或更大差異的可能性。如果P

值很小(一般0.05),則推翻無效假設。P值越小越有理由推翻無效假設。推翻無效假設,則接受備擇假設,即π1≠π2。但這只是說π1與π2不相等,并不能得出兩者相差有多大的結論。當樣本很大時,盡管差異很小,P值也會很小,因為此時抽樣誤差很小預防和治療研究的評價7.是否同時考慮到臨床意義和統計學意義?

臨床意義是指這種差異在臨床上是否有價值。幾種情況:有臨床意義,有統計學意義;有臨床意義,無統計學意義(評價樣本量);無臨床意義,有統計學意義;無臨床意義,無統計學意義。預防和治療研究的評價7.是否同時考慮到臨床意義和統計學意義?例:有人對7674例男性和2896例女性進行了沙眼患病率的調查,結果男性沙眼患病率為81.25%,女性沙眼患病率為76.83%,作者認為男性與女性患病率相差不多。但某位統計學家對這一結果進行了差別的統計學檢驗,發現P<0.001,得出了“有極顯著差別”的結論。正確表達:差別有統計學意義,有高度統計學意義臨床意義不僅與差異的大小有關。如肺癌5年生存率有50%提高到55%,但肺癌死亡率很高,很有意義預防和治療研究的評價8.是否介紹了防治措施的實用性?治療方法應詳細描述,不良反應情況在臨床上和生物學上是合理的依從性成本-效益分析預后研究的評價1.是否都有統一的起始點?是否都是從最早出現癥狀開始觀察或是從確診開始觀察?起點不統一,常會造成偏倚。例如研究心肌梗死的預后,如收集心臟監護室的病人觀察其病死率多少常得出預后較好的結論,因為許多還來不及送到醫院或死于急診室的病例沒有統計進去預防和治療研究的評價2.是否介紹了研究對象的情況和病例的來源?如病例的年齡、性別、嚴重程度和有否并發癥等都與預后有關。三級醫院和基層醫院病人不同。例如有關兒童高熱驚厥一次發作后,癲癇的發生率如何?大醫院、兒童專科醫院中的病例和在人群中統計,有很大的差別預防和治療研究的評價3.是否所有的對象都進行了隨訪?如沒有,失訪率是多少?如果失訪率超過10%就會影響預后的估計;如果失訪率達20%以上,結論就不可靠預防和治療研究的評價4.是否有客觀的預后指標?腫瘤的預后可用5年生存率表示預防和治療研究的評價5.預后估計是否采用了盲法?三、我國醫學期刊發表的論文中存在

的問題科研設計方面能夠提供較強證據的論文很少缺少對照組或對照組不恰當樣本量不足樣本缺乏代表性沒有采用隨機化方法或隨機化方法描述不充分我國醫學期刊發表的論文存在的問題統計學分析方面沒有采用統計學分析方法沒有描述所采用的統計學方法所采用的統計學方法要求的前提條件不符合多重t檢驗代替方差分析將重復測量結果作為獨立變量進行處理忽略配對特性很少采用可信區間很少采用多元分析或生存分析方法我國醫學期刊發表的論文存在的問題結果解釋方面錯誤理解P值含義過分相信小樣本研究得出的陰性結果過分強調二級終點結果或亞組分析結果我國醫學期刊發表的論文存在的問題資料描述方面缺少關鍵信息的描述,尤其是在資料與方法部分我國醫學期刊發表的論文存在的問題發表偏倚陽性結果的論文比陰性結果的論文有更大地被發表的機會我國醫學期刊發表的診斷性研究的評價上海醫科大學檢查了5種中華系列雜志1985和1995年發表的112篇診斷性研究論文缺乏金標準18只有陽性率,無敏感性、特異性等指標40沒有論文采用似然比和ROC曲線我國醫學期刊發表的治療性研究的評價年份雜志名稱科研設計

論文數無對照CCTRCT1963新英格蘭醫學雜志3554.0%37.0%9.0%1975新英格蘭醫學雜志4734.0%26.0%40.0%1976中華內科雜志5074.0%24.0%2.0%1985中華內科雜志2751.9%25.9%22.2%1997中華內科雜志3633.3%35.2%31.4%1997-8中華消化雜志3138.7%25.8%35.5%1998-9中華老年醫學雜志277.5%1978-97中華結核呼吸雜志39476.7%12.8%10.5%1980-98上海中醫雜志197181.9%9.9%9.2%我國醫學期刊發表的治療性研究的評價1995-1996年35種中國醫學雜志發表的164篇治療性研究論文中隨機化描述25(15.2%)描述但錯誤9(5.5%)未描述130(79.3%)基線資料完整基線資料42(28.7%)簡單描述27(16.5%)未描述90(54.8%)樣本量10-15000,均未說明樣本量的確定方法我國醫學期刊發表的病因性研究的評價史宗道檢查了6本國內雜志1994-1997年發表的61篇有關病因研究的論文其中14篇為隊列研究,15篇為病例-對照研究,32篇為橫斷面研究14篇隊列研究中,5篇考慮了混雜因素,6篇采用了RR來指示聯系強度15篇病例-對照研究中,10篇考慮了混雜因素,14篇采用了OR來指示聯系強度32篇橫斷面研究中,8篇應用了OR或RR在29篇分析性研究中,14篇研究樣本量不足結論:大約一半的論文存在方法學缺陷我國醫學期刊發表的預后性研究的評價評價3本雜志發表的12篇預后研究的情況5篇為回顧性研究8篇無對照組4篇樣本量<30例部分論文不是一個一致的起始隊列在7篇前瞻性研究中,只有1篇失訪率<10%很少有論文應用Cox模型或邏輯回歸分析四、出現問題的原因一、作者的責任--論文質量不高-缺乏科研設計、統計學、論文寫作方面的培訓-缺少與有關科研設計方面專家的溝通-缺少簡明、實用的面向臨床醫生的科研設計和統計學方面的教科書-晉升的壓力,醫生只注重發表論文的數量,忽視論文的質量-大學和醫院的科研管理機構審查把關不嚴格出現問題的原因二、雜志的責任--稿件審查不嚴-審稿專家過于注重科研課題的重要性,對科研設計和統計學方法的問題重視不夠。-編輯人員過于依靠審稿專家在學術上把關,只注意文字和規范方面的編輯加工,忽視了對論文科學性方面的審查。-上述兩方面能力加強,許多問題(資料不完整,統計學缺陷或錯誤等)可以在發表前改正。-出版政策:篇幅限制、發表偏倚等。五、問題的后果研究對象承受了一定的風險和痛苦,但沒有獲得任何有益的結果。造成資源的浪費,包括時間、資金、醫院床位和設備等。因為錯誤的研究結果本身,或因為錯誤的研究結果延誤了更有效的治療方法的研究,患者可能因此而接受錯誤的治療方法。誤導:如果研究中存在的問題未經改正就發表,研究者以后還會犯同樣的錯誤,其他研究人員也可能會模仿采用錯誤的科研設計方法。問題的嚴重性醫學期刊發表的論文中出現質量問題會造成非常嚴重的后果,所以,有專家指出,錯誤應用科研設計方法和統計學方法不僅僅是科研水平問題,更是科研道德問題。作者、編輯、審稿人員應對這一問題應給予足夠的重視。六、改進措施一、長期措施:-加強對科研人員的培訓,普及科研設計和統計學方面的知識,尤其是應盡快為非統計學專業的臨床科研人員提供簡明、實用的教材。-加強統計學家和臨床流行病學家的咨詢作用,科研人員主動征求上述專家的意見。-提高科研管理人員的素質,強化科研管理部門的職能,使其在對科研人員的培訓、科研方案的審批、科研過程的監督、科研論文的投寄等方面起到應有的作用。改進措施二、短期措施鑒于目前醫學期刊發表的論文存在較嚴重質量問題的現狀,雜志應切實負起自己的責任。通過雜志自身的努力和引導,可以在較短的時間內提高所發表論文的學術質量。雜志應在以下三個方面加強工作:1、普及科研設計和統計學方面的知識,提高科研人員的科研水平,以便生產出更多、更好的“米”(科研成果)。2、普及醫學論文寫作方面的知識,為作者提供詳細的論文撰寫指南和投稿須知,以便作者做出最好的“飯”(稿件)。3、普及醫學論文嚴格評價方面的知識

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論