臨床科研數據的提取與管理_第1頁
臨床科研數據的提取與管理_第2頁
臨床科研數據的提取與管理_第3頁
臨床科研數據的提取與管理_第4頁
臨床科研數據的提取與管理_第5頁
已閱讀5頁,還剩143頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

臨床科研數據的提取與管理第1頁,課件共148頁,創作于2023年2月(一)研究設計(二)收集資料:完整、準確(三)整理資料:核查、清洗(四)分析資料統計工作的基本步驟

第2頁,課件共148頁,創作于2023年2月數據的質量控制第3頁,課件共148頁,創作于2023年2月(一)數據的來源與數據集觀察性數據實驗性數據科研數據第4頁,課件共148頁,創作于2023年2月觀察性數據(觀察性研究):衛生工作報表,病例資料觀察性研究:客觀地觀察、記錄和描述事物規律或現象的認識活動。實驗性數據(實驗性研究):臨床病例資料,動物實驗記錄實驗性研究:人為控制實驗條件或對研究對象施加一定干預措施所做的研究。多中心臨床實驗或大型調查研究:樣本量大,變量數多第5頁,課件共148頁,創作于2023年2月第6頁,課件共148頁,創作于2023年2月編號性別年齡民族體重(kg)身高(cm)冠心病糖尿病1男72漢78.54169.0有無2女81漢33.50142.0無無3男90回65.83170.0無可疑4男72漢86.26181.0無無5女70其他69.46158.5無有……………………735男71漢88.08181.0無無某地2002年735例65歲以上老年人健康檢查記錄casevariable數據矩陣第7頁,課件共148頁,創作于2023年2月編號性別年齡民族體重(kg)身高(cm)冠心病糖尿病1男72漢78.54169.0有無2女81漢33.50142.0無無3男90回65.83170.0無可疑4男72漢86.26181.0無無5女70其他69.46158.5無有……………………735男71漢88.08181.0無無某地2002年735例65歲以上老年人健康檢查記錄分析變量標識變量第8頁,課件共148頁,創作于2023年2月編號性別年齡民族體重(kg)身高(cm)冠心病糖尿病1男72漢78.54169.0有無2女81漢33.50142.0無無3男90回65.83170.0無可疑4男72漢86.26181.0無無5女70其他69.46158.5無有……………………735男71漢88.08181.0無無某地2002年735例65歲以上老年人健康檢查記錄反應變量解釋變量第9頁,課件共148頁,創作于2023年2月解釋變量:指示變量、分組變量、因素、協變量、預測變量等反應變量:表示試驗效應或觀測結果的指標。注意:變量名:英文、不超過8個字符,分類變量適當數量化處理。第10頁,課件共148頁,創作于2023年2月(二)數據錄入

數據錄入是將研究收集到的各種信息轉換為數據形式,輸入到計算機進行保存、管理的過程。數據審核:對收集到的原始資料進行審查與核實的過程。

真實、準確、完整、標準制定數據編碼表:使研究得到的信息數字化和標準化。

封閉性、開放性、缺失數據建立數據庫:運用專業的數據庫管理軟件。

數據管理、查詢、修改功能第11頁,課件共148頁,創作于2023年2月第12頁,課件共148頁,創作于2023年2月numbersexagenationalityweight(kg)height(cm)coronarydiabetes1172178.54169.0102081133.50142.0003190265.83170.0014172186.26181.0005070469.46158.502……………………735171188.08181.000原始數據錄入格式第13頁,課件共148頁,創作于2023年2月數據錄入的原則

1、方便錄入:將字符變量轉換成數值變量;2、便于核查:一定要有標識變量,以方便數據的核對;3、易于轉換:錄入數據時要考慮不同軟件的要求;4、利于分析:同一研究課題的結果最好錄成一個數據庫文件。同一資料進行雙人重復錄入方法,應用程序對兩個數據庫進行比對,核查錯誤。第14頁,課件共148頁,創作于2023年2月第15頁,課件共148頁,創作于2023年2月EpiData特點簡單易學、實用性強對計算機硬件要求不高調查表設計便捷與調查表形式一致的可視數據錄入界面數據核查功能強大且實現簡便

EpiData

Analysis可用于一般的統計分析與制圖

數據轉換功能強大

第16頁,課件共148頁,創作于2023年2月建立調查表文件創建數據庫建立核查文件錄入數據數據庫管理輸出數據

EpiData的基本流程第17頁,課件共148頁,創作于2023年2月數據庫的導出(Datain)SPSS文件SAS文件DBF文件

Stata文件REC文件第18頁,課件共148頁,創作于2023年2月第19頁,課件共148頁,創作于2023年2月二.

數據管理中的幾個常見問題第20頁,課件共148頁,創作于2023年2月(一)數據的質量控制1、輸入信息的有效性,即幅度檢查;2、輸入信息相互之間的一致性,即邏輯檢查;3、查漏:原始數據的編號與數據庫的編號核對;4、運用統計軟件觀察頻數分布是否異常;5、進行描述性統計,有無離群值和缺失值。第21頁,課件共148頁,創作于2023年2月(二)變量的設置1、連續型變量的輸入:直接錄入;2、離散型變量的輸入:數值化處理。變量的設置方式:資料類型、研究目的、變量的分布形式、統計方法的應用條件。第22頁,課件共148頁,創作于2023年2月(三)缺失值處理缺失值主要來自資料收集中的漏報和漏填;缺失值應控制在數據記錄總量的10%以內;注意將缺失值與“0”區分開來,缺失值一般用“.”表示;缺失比例很小時,可舍棄;缺失比例較大時,可進行插補(不得已,慎用)。第23頁,課件共148頁,創作于2023年2月(四)離群數據的處理有無離群值?

頻數表、箱式圖或直方圖可初步判斷;線性回歸方法判斷。離群值(outlier)是指超出數據通常變化范圍的特大值或特小值的觀測值。出現離群值的處理

在離群值附近多次抽樣,了解數據的真實結構;專業知識與統計方法結合。第24頁,課件共148頁,創作于2023年2月(五)統計學方法的應用條件正態性檢驗方差齊性檢驗多重共線性判斷第25頁,課件共148頁,創作于2023年2月統計方法的正確選擇第26頁,課件共148頁,創作于2023年2月三.統計分析結果與表達第27頁,課件共148頁,創作于2023年2月醫學論著的基本結構

摘要引言1.

材料與方法2.

結果3.

討論AbstractIntroductionMaterialsandMethodsResults

Discussion第28頁,課件共148頁,創作于2023年2月第29頁,課件共148頁,創作于2023年2月第30頁,課件共148頁,創作于2023年2月第31頁,課件共148頁,創作于2023年2月統計表第32頁,課件共148頁,創作于2023年2月統計圖第33頁,課件共148頁,創作于2023年2月摘要

Abstract對處理組和對照組的主要統計結果進行概述:

均數(中位數、率),標準差(標準誤),P值;兩組均數(率)之差或者OR值,95%可信區間(CI);多個觀察指標的相關系數及其P

值等.第34頁,課件共148頁,創作于2023年2月第35頁,課件共148頁,創作于2023年2月簡要說明研究背景和研究目的。給出文獻分析的綜合復習結果:

如組間差別(DifferenceAmongGroups);

P值(P-value)等。采用循證醫學的方法。引言Introduction第36頁,課件共148頁,創作于2023年2月第37頁,課件共148頁,創作于2023年2月材料與方法MaterialsandMethods統計表達

研究設計方案(DesignofResearchMethods)統計分析方法及軟件(AnalysisMethodsandSoftware)目的:以使讀者確認論文中所有統計分析結果的可靠性和研究結論的合理性。

第38頁,課件共148頁,創作于2023年2月研究設計方案(DesignofResearchMethods)研究對象的來源和選擇方法,包括觀察對象的基本情況

需要說明診斷標準病例入選標準、病例排除標準、病例剔除標準、療效評價標準。有無失訪(失訪比例,不可超過20%)、有無“知情同意”評價療效有無遮蔽(“單盲SingleBlind”、“雙盲DoubleBlind”或“多盲MultipleBlind”)等均衡性分析結果:影響因素(如年齡、性別、病情)樣本量估計的依據(SampleSize)第39頁,課件共148頁,創作于2023年2月第40頁,課件共148頁,創作于2023年2月常用統計方法簡單說明:

如檢驗、t檢驗、單因素方差分析(ANOVA)等;特殊的統計方法給出相應的參考文獻:

如聚類分析(Cluster)、生存分析(SurvivalAnalysis)等;一般統計計算軟件給出名稱如SPSS、SAS、STATA等,EXCEL不能作為處理軟件特殊的計算軟件要給出軟件的過程名統計分析方法及軟件(AnalysisMethodsandSoftware)第41頁,課件共148頁,創作于2023年2月第42頁,課件共148頁,創作于2023年2月統計表達

統計圖表(StatisticalGraphs&Tables)結果ResultsP值的表達(SuitableExpressionofP)統計指標(StatisticalIndexes)數據精度(NumericalPrecision)第43頁,課件共148頁,創作于2023年2月第44頁,課件共148頁,創作于2023年2月統計表第45頁,課件共148頁,創作于2023年2月統計圖第46頁,課件共148頁,創作于2023年2月討論Discussion統計解釋

P

值的解釋(InterpretationofP)關聯的解釋(InterpretationofAssociation)因果的解釋(InterpretationofCausation)r值的解釋(Interpretationofr)第47頁,課件共148頁,創作于2023年2月統計資料的分類Statisticalclassification第48頁,課件共148頁,創作于2023年2月編號性別年齡民族體重(kg)身高(cm)冠心病糖尿病1男72漢78.54169.0有無2女81漢33.50142.0無無3男90回65.83170.0無可疑4男72漢86.26181.0無無5女70其他69.46158.5無有……………………735男71漢88.08181.0無無某地2002年735例65歲以上老年人健康檢查記錄計量計量計量計數計數計數等級第49頁,課件共148頁,創作于2023年2月1.計量資料(或定量變量)

measurmentdata,quantitativedata定義:測定每個觀察單位的某項指標量的大小,所得的資料稱為計量資料。其變量值是定量的,一般帶有度量衡或其它單位。

特點:每個觀察單位的觀察值之間有量的區別。

第50頁,課件共148頁,創作于2023年2月

定義:將觀察單位按某種屬性或類別分組計數,分組匯總得到各組觀察單位數稱為計數資料。特點:計數排列是無序分組,同組各觀察單位之間沒有量的差別,但各組間有質的不同,各組互不相容。二項分類和多項分類2.計數資料(或無序分類變量)

enumerationdata,unorderedcategorydata第51頁,課件共148頁,創作于2023年2月3.等級資料(或有序分類變量)

rankeddata,

ordinalcategorydata定義:將觀察單位按某個指標量的大小分成等級或某種屬性的不同程度分成等級后分組計數,分類匯總各組的觀察單位數稱為等級資料。特點:等級是有序分組。同計數資料的區別是:屬性的分組有程度的差別,各組按一定順序排列;與計量資料的區別是:每個觀察單位未確切定量,所以又稱為半定量資料。第52頁,課件共148頁,創作于2023年2月第53頁,課件共148頁,創作于2023年2月常用的統計指標AnalysisIndex第54頁,課件共148頁,創作于2023年2月統計指標可用于描述性的統計分析,也是反映數據基本特征的統計分析方法。并可使人們準確、全面地了解數據資料所包涵的信息,以便于在此基礎上完成資料的進一步統計分析。第55頁,課件共148頁,創作于2023年2月

常用統計指標的特點及其應用場合指標特點應用場合精確,易受極端值影響均勻分布的小樣本數據或近似正態分布數據穩定,不受特大或特小值的影響應用范圍廣,特別是大樣本偏態分布資料粗糙,不受極端數值的影響小樣本的探索性數據同一資料,幾何均數<均數近似對數正態分布數據,等比級數資料標準差與均數的比值,無單位比較不同資料或同類資料均數相差懸殊時變異程度計量資料(數值資料)的指標第56頁,課件共148頁,創作于2023年2月第57頁,課件共148頁,創作于2023年2月常用相對數的算法和用途應用時需注意:分母一般不宜過小,不以構成比代替率,可比性。計數資料(分類資料)的指標第58頁,課件共148頁,創作于2023年2月第59頁,課件共148頁,創作于2023年2月統計表Statisticaltable第60頁,課件共148頁,創作于2023年2月統計表的構造

表號標題(包括何時、何地、何事)橫標目的總標目總標目總標目(單位)縱標目

縱標目…

縱標目縱標目…

橫標目××××××××.××××.××┆×××××.×××.××┆┆┆┆┆┆┆┆┆┆合計××××××××.××××.××備注:表頭標目線條數字備注表體標題合計第61頁,課件共148頁,創作于2023年2月標題是統計表的總名稱,位于表的上方;簡明確切,與內容一致,通常需注明資料的時間和地點。若一篇論文中有兩張以上的統計表,則每張統計表的標題前應加序號。

第62頁,課件共148頁,創作于2023年2月表3-2狗損失3/4循環血液量以氧化聚白明膠補充后各段時間血漿中氧化聚白明膠的濃度和24小時內尿中氧化聚白明膠排出量的百分數狗號體重(Kg)注入氧化聚白明膠量(克)注射后血漿內氧化聚白明膠的濃度(克/每100毫升)24小時尿內排出氧化聚白明膠的百分數15-20分1小時6小時12小時24小時4011.015.01.250.780.300.270.10934114.517.90.970.640.280.150.09924211.017.00.970.670.210.140.0470436.815.01.540.930.390.210.10--第63頁,課件共148頁,創作于2023年2月(修改)*:四只狗編號依次為40、41、42、43,體重分別為11.0、14.5、11.0、6.8公斤。表3-2氧化聚白明膠存留狗血液內各段時間的濃度和排出量*注入量(克)血漿內濃度(克/100毫升

)24小時內排出量的百分比(%)半小時內1小時6小時12小時24小時15.01.250.780.300.270.109317.90.970.640.280.150.099217.00.970.670.210.140.047015.01.540.930.390.210.10--第64頁,課件共148頁,創作于2023年2月根據其位置與作用可分為橫標目和縱標目。①橫標目:位于表的左側,向右說明各橫行數字的涵義。②縱標目:位于表頭右側,向下說明各縱欄數字的涵義。必要時可在橫標目或縱標目前冠以總標目。標目第65頁,課件共148頁,創作于2023年2月治療組患者例數治療結果良好死亡西藥組1367中西醫結合組10100表3-3急性心肌梗塞并發休克患者療效比較(修改表)并發癥西藥組中西醫結合組例數結果例數結果良好死亡良好死亡休克136710100表3-3

兩個治療組對比(原表)第66頁,課件共148頁,創作于2023年2月

通常用四條橫線將統計表分割成表頭、表體和合計三部分(即頂線、底線、縱標目下的橫隔線及合計上的橫隔線)。

線條正規印刷的統計表一般沒有豎線和斜線,但標目間應有明顯的間隔;第67頁,課件共148頁,創作于2023年2月

分型分度及療效單純型慢性支氣管炎喘息型慢性支氣管炎分度度別重中輕重中輕例數1365431935633療效指標治愈顯效好轉無效治愈顯效好轉無效例數6098511223836511小計%95%5%94.0%6.0%合計94.3%表3-4復方豬膽膠囊對403例不同類型老年慢性支氣管炎病例近期療效觀察(原表)第68頁,課件共148頁,創作于2023年2月疾病類型例數病情療效重中輕治愈顯效好轉無效有效率(%)單純型22113654316098511294.57喘息型1829356332383651193.96合計40322911064831811162394.29表3-4復方豬膽膠囊治療老年慢性支氣管炎的近期療效第69頁,課件共148頁,創作于2023年2月

數字是統計表的基本語言。主要內容為統計調查結果與計算結果,如均數、合計、率、百分比等;表內數據一律采用阿拉伯數字。要求:數字計算必須絕對準確;同一指標的小數位數應一致,位次要對齊;表內不應有空白項,數字為零時應寫“0”,暫時沒有數據時用“…”表示,不必合計時可用“—”表示。數字第70頁,課件共148頁,創作于2023年2月

備注不是統計表的必須項目,需要時才用,并用“*”號標出,寫在表的外面加以說明,如表3-2所示。備注第71頁,課件共148頁,創作于2023年2月*:四只狗編號依次為40、41、42、43,體重分別為11.0、14.5、11.0、6.8公斤。表3-2氧化聚白明膠存留狗血液內各段時間的濃度和排出量*注入量(克)血漿內濃度(克/100毫升

)24小時內排出量的百分比(%)半小時內1小時6小時12小時24小時15.01.250.780.300.270.109317.90.970.640.280.150.099217.00.970.670.210.140.047015.01.540.930.390.210.10--第72頁,課件共148頁,創作于2023年2月

從內容上看,每張統計表都有主語和賓語。

主語:是指被研究的事物,多位于表內左邊。

賓語:指說明主語的統計指標,多位于表內右邊。

將主語和賓語連接起來,應能讀成一個完整的句子。內容第73頁,課件共148頁,創作于2023年2月表3-4復方豬膽膠囊治療老年慢性支氣管炎的近期療效疾病類型例數病情療效重中輕治愈顯效好轉無效有效率(%)單純型22113654316098511294.57喘息型1829356332383651193.96合計40322911064831811162394.29第74頁,課件共148頁,創作于2023年2月統計表的內容要豐富:制表的目的是為了對統計結果進行對比分析,若指標過少,則不易湊統計表。1統計表要重點突出:一般一張統計表只表達一個中心內容,若包含內容過多,可分制成若干張統計表。

2統計表要有“自明性”

:即主謂分明,層次清楚。為此,標目的處理是決定統計表質量的關鍵。橫標目常為第一主辭,縱標目為第二主辭,切忌位置混亂,互相混雜,使讀者難以識別。3制表注意事項第75頁,課件共148頁,創作于2023年2月分組切除組姑息手術組探查合計手術方式胰十二指腸切除術膽腸吻合術胃腸加胃腸吻合術胃腸吻合術膽道外引流術剖腹探查術例數手術死亡隨訪例數生存月數29*32613871171314112472538262.547538219224161△

生存半年率一年

%二年壽三年命五年表十年法21.04±3.8911.91±4.9956.56±9.564.11±2.012.39±2.3628.74±8.811.03±1.02024.63±8.450021.13±8.010012.08±7.8700*:其中2例是其他切除術;△:3例為淋巴結活檢得到隨訪者。表3-5192例手術及效果(原表)第76頁,課件共148頁,創作于2023年2月手術方式例數術后平均生存月數手術手術死亡隨訪胰十二指腸切除29*32613.0姑息性手術:

膽腸吻合8711713.0

膽腸+胃腸吻合141124.0

胃腸吻合7253.0

膽道外引流8262.5剖腹探查475382.0合計19224158—*:其中2例是其它切除術。表3-5192例壺腹癌不同手術方式的生存情況第77頁,課件共148頁,創作于2023年2月隨訪時間(年)生存率(%)切除組姑息手術組探查組0.5…21.04±3.8911.91±4.99155.56±9.564.11±2.012.39±2.36228.74±8.811.03±1.020324.63±8.4500520.13±8.01001012.08±7.8700表3-5手術后各階段生存率(壽命表法)第78頁,課件共148頁,創作于2023年2月標題定義特點備注標目數字統計表線條內容豐富重點突出有自明性第79頁,課件共148頁,創作于2023年2月統計圖Statisticalgraph第80頁,課件共148頁,創作于2023年2月

統計圖(statisticalgraph)是指用幾何圖形(點、線段、直條等)顯示統計指標的大小、對比關系或變化趨勢。統計圖的定義第81頁,課件共148頁,創作于2023年2月圖域縱標目刻度標題圖例橫標目統計圖的構造第82頁,課件共148頁,創作于2023年2月縱軸:表示統計指標,可以是絕對數、相對數或平均數。橫軸:并排各相互比較的分組名稱,一般省略橫標目。

(一)條圖(barchart):用等寬直條的長短表示統計指標數量的大小。用于比較彼此獨立的若干組指標。常用統計圖第83頁,課件共148頁,創作于2023年2月按指標和分組因素的多少可分:

具有一個統計指標,一個分組因素。具有兩個統計指標,一個分組因素,且兩個統計指標必須有隸屬關系。

具有一個統計指標,兩個分組因素,

或一個分組因素,多個統計指標。單式條圖:

復式條圖:

分段條圖:第84頁,課件共148頁,創作于2023年2月條圖圖示(1)單式條圖

圖某石棉廠不同工作部門的石棉肺患病率(%)一個統計指標一個分組因素第85頁,課件共148頁,創作于2023年2月(2)復式條圖

圖三個直轄市的人口密度比較一個統計指標兩個分組因素第86頁,課件共148頁,創作于2023年2月(3)分段條圖

圖某師1991年傳染病與菌痢發病人數兩個統計指標一個分組因素第87頁,課件共148頁,創作于2023年2月(二)圓圖(piechart):用圓的總面積表示事物的全部,用各個扇形的面積(圓心角的大小)表示各個部分。用于表達事物的內部結構。圖10-5251例胃癌患者病理組織學類型的構成第88頁,課件共148頁,創作于2023年2月2002年某醫院1402例孕婦分娩結果分娩結果例數構成比(%)過期產21

1死產21

1早產212

15足月1148

83總計1402100圓圖圖示第89頁,課件共148頁,創作于2023年2月(三)百分條圖(percentagebarchart):用一個矩形條子的面積表示事物全部,而用其中各段表示各構成部分。也用于表達事物的內部結構,更適用于多組結構相對數的比較。縱軸:表示分組因素;橫軸:表示累計百分比,由0開始,最大刻度為100。第90頁,課件共148頁,創作于2023年2月百分條圖圖示圖251例男女胃癌患者病理組織學類型的構成第91頁,課件共148頁,創作于2023年2月(四)線圖(linechart):用點和點之間的連線表示統計指標的變化趨勢。適用于分組標志為連續型變量(如時間、年齡等)的資料。橫軸:代表分組標志(為連續型變量);縱軸:表示統計指標(相對數、平均數等)。

第92頁,課件共148頁,創作于2023年2月線圖圖示第93頁,課件共148頁,創作于2023年2月線圖示例第94頁,課件共148頁,創作于2023年2月半對數線圖

半對數線圖:線圖的一種特殊形式,適用于表示事物發展速度(相對比)。

其縱軸為對數尺度,橫軸為算術尺度,使線圖上的數量關系變為對數關系。

繪圖時,應使用特制的半對數坐標紙,也可以將統計指標(率)取對數值后在方格坐標紙上作圖。第95頁,課件共148頁,創作于2023年2月表10-6某部歷年普通感冒與支氣管炎發病率(‰)圖10-8某部隊歷年感冒與支氣管炎發病率

圖10-8某部隊歷年感冒與支氣管炎發病率半對數線圖圖示第96頁,課件共148頁,創作于2023年2月(五)直方圖(histogram):用矩形面積表示某個連續型變量的頻數(頻率)分布。縱軸:表示頻數或頻率;橫軸:連續型變量的組段。

第97頁,課件共148頁,創作于2023年2月直方圖圖示第98頁,課件共148頁,創作于2023年2月表10-7某市某年流行性乙型腦炎患者的年齡分布年歲0~1~2~3~4~5~6~7~8~9~10~20~30~40~50~合計人數33911232211148636131141175每歲患者人數3391123221114863.61.31.10.40.1—圖10-10某年某市流行性乙型腦炎患者的年齡分布圖10-10某年某市流行性乙型腦炎患者的年齡分布第99頁,課件共148頁,創作于2023年2月(六)箱式圖(box-whiskerplot):又叫箱-髯圖,用于比較兩個或多個樣本分布的中心位置和散布范圍。中心位置:用中位數(P50)表示;散布范圍:用四分位數間距(P75-P25)和極差

(Xmax-Xmin)或P2.5和P97.5或P0.5和

P99.5表示。第100頁,課件共148頁,創作于2023年2月血汞含量(umol/L)某市汞作業工人和居民血汞含量分布情況**00.10.20.30.40.50.6汞作業工人居民表10-8某市汞作業工人和居民血汞含量(μmol/L)的分布情況組別P0.5P25P50P75P99.5汞作業工人0.1020.1650.2000.2420.475居民0.0520.1050.1450.2100.405第101頁,課件共148頁,創作于2023年2月(七)誤差限圖(error-barchart):是在用條圖或線圖表示均數的基礎上,在圖中附上標準差的范圍,以反映數據的散布情況。

條的高度表示,條上的延長線表示+s。也可用來表示率±標準誤或均數±標準誤的范圍,以說明率或均數的抽樣誤差大小。第102頁,課件共148頁,創作于2023年2月表10-9不同地區入伍兩年戰士握力測定結果籍貫握力(kg)右手左手四川42.5±5.239.4±5.6貴州42.1±5.240.3±6.2云南41.8±6.039.2±5.4第103頁,課件共148頁,創作于2023年2月表10-10某地兒童錫克氏試驗結果年齡(歲)0.5~1~2~3~4~5~6~7~陽性率(%)44.645.433.424.821.717.916.711.01.96sP3.962.432.041.721.551.651.411.33第104頁,課件共148頁,創作于2023年2月統計圖的選擇

圖形資料性質分析目的條圖相互獨立(離散)多組資料某統計指標的比較百分條圖構成比計數資料多個事物內部構成比較圓圖構成比計數資料描述事物的內部構成線圖連續型計量資料表示事物的動態變化趨勢半對數線圖連續型計量資料變化事物的動態變化直方圖頻數表資料表示某連續型變量的頻數分布第105頁,課件共148頁,創作于2023年2月假設檢驗的結果表達SuitableExpressionofP第106頁,課件共148頁,創作于2023年2月P值的表達(SuitableExpressionofP)傳統表達P>0.05記為“NS”,

P≤0.05記為“*”,

P≤0.01記為“**”提倡表達提倡報告精確

P值應給出檢驗統計量的實際值第107頁,課件共148頁,創作于2023年2月相關系數保留2位小數;檢驗統計量,如Chi-square值、t值保留2位小數即可。計量資料的統計指標(均數、標準差、標準誤、中位數、百分位數等)的保留小數位數,應該與原始數據的保留小數位數相同;計數資料的百分比保留1位小數,一般不超過2位小數;病死率、發病率按慣例選擇比例基數,如1000‰,10000/萬,10萬/10萬等,或自行選擇合適的比例基數,使率的表達至少有1位整數;數據的精確度第108頁,課件共148頁,創作于2023年2月

關于

應用條件:只有屬于正態分布的數據才可以表示為,雖屬于正態分布,但出現負數(即<s時,如血清出現負數)時不能用表示,此時宜用最大值、最小值、四分位間距和中位數。第109頁,課件共148頁,創作于2023年2月其他常見的統計指標SuitableExpressionofP第110頁,課件共148頁,創作于2023年2月可信區間(confidenceinterval,CI)區間估計即是按預先給予的概率,確定未知參數值的可能范圍。此范圍稱為估計參數的可信區間或稱置信區間(confidenceinterval),預先給定的概率稱為可信度或置信水平(confidencelevel),符號為“1-”,常取95%或99%,按此確定的可信區間分別稱之為95%或99%可信區間。第111頁,課件共148頁,創作于2023年2月循證醫學中常用的是率的可信區間、RR或OR的可信區間、均數的可信區間、兩均數差值的可信區間。第112頁,課件共148頁,創作于2023年2月第113頁,課件共148頁,創作于2023年2月可信區間還可用于假設檢驗,尤其是試驗組與對照組某指標差值或比值的可信區間,在循證醫學中更為常用。試驗組與對照組某指標差值或比值的95%可信區間與α為0.05的假設檢驗等價,99%可信區間與α為0.01的假設檢驗等價。可信區間還可用于假設檢驗第114頁,課件共148頁,創作于2023年2月分類資料的指標在循證醫學的研究與實踐中,除了有效率、死亡率、患病率、發病率等常用率的指標外,相對危險度(RR)、比值比(OR)及由此導出的其他指標也是循證醫學中富有特色的指標。目前,在循證醫學中分類資料常用的描述指標主要有EER、CER、OR、RR、RRR、ARR、NNT、NNH等。第115頁,課件共148頁,創作于2023年2月1、EER與CER循證醫學中預防和治療性試驗中,率可細分為EER和CER兩類。EER即試驗組中某事件的發生率(experimentaleventrate,EER)如對某種暴露采用某些防治措施后該疾病的發生率。CER即對照組中某事件的發生率(controleventrate,EER)如對某種暴露不采取防治措施該疾病的發生率。第116頁,課件共148頁,創作于2023年2月2、RD(率差)及可信區間兩個發生率的差即為率差,也稱危險差(ratedifference,riskdifference,RD),如試驗組的發生率(EER)與對照組發生率(CER)的差,其大小可反映試驗效應的大小。兩率差的可信區間由下式計算:

|p1-p2|±uαSE(p1-p2)=(RD-uαSE(p1-p2),RD+uαSE(p1-p2))第117頁,課件共148頁,創作于2023年2月兩率差的標準誤:因而兩率差的可信區間不包含0(上下限均大于0或上下限均小于0),則兩個率有差別;反之,兩率差的可信區間包含0,則無統計學意義。第118頁,課件共148頁,創作于2023年2月某醫師研究了阿司匹林治療心肌梗死的效果,資料見下表

該試驗結果的EER和CER計算結果為:EER=a/n1=15/125=12%,CER=c/n2=30/120=25%

死亡未死亡例數治療組15(a)110(b)125(n1)對照組30(c)90(d)120(n2

)合計45200225(n)第119頁,課件共148頁,創作于2023年2月第120頁,課件共148頁,創作于2023年2月該試驗兩率差(RD)的95%可信區間為:RD±uαSE(p1-p2)=(0.12-0.25)±1.96×0.049=-0.23~-0.03

該例兩率差的可信區間為-0.23~-0.03,上下限均小于0(不包含0),兩率有差別。可認為阿斯匹林可降低心肌梗死的病死率。第121頁,課件共148頁,創作于2023年2月兩率差別有統計學意義。可認為阿斯匹林可降低心肌梗死的病死率。第122頁,課件共148頁,創作于2023年2月3、RR及可信區間相對危險度RR(relativerisk,RR)是前瞻性研究中較常用的指標,它是試驗組某事件發生率P1與對照組某事件發生率P0之比,用于說明前者是后者的多少倍,常用來表示試驗因素與疾病聯系的強度及其在病因學上的意義大小。第123頁,課件共148頁,創作于2023年2月RR計算的四格表:

組別發病未發病例數

試驗組a(r1)bn1

對照組c(r2)dn2試驗組的發生率為:p1=a/(a+b)=r1/n1對照組的發生率為:p0=c/(c+d)=r2/n2相對危險度按下式計算:RR=p1/p0=EER/CER第124頁,課件共148頁,創作于2023年2月當RR=1時,可認為試驗因素與疾病無關;當RR≠1時,可認為試驗因素與疾病有關;當RR>1時,可認為試驗組發生率大于對照組;當RR<1時,可認為試驗組發生率小于對照組;第125頁,課件共148頁,創作于2023年2月RR的可信區間,應采用自然對數進行計算,即應求RR的自然對數值ln(RR)和ln(RR)的標準誤SE(lnRR),其計算公式如下:第126頁,課件共148頁,創作于2023年2月ln(RR)的1-α可信區間為:

ln(RR)±uαSE(lnRR)RR的可信區間為:

Exp[ln(RR)±uαSE(lnRR)]由于RR=1時為試驗因素與疾病無關,故其可信區間不包含1時為有統計學意義;反之,其可信區間包含1時為無統計學意義第127頁,課件共148頁,創作于2023年2月阿斯匹林治療組的病死率p1=15/125,對照組的病死率p0=30/120,其RR和可信區間為:Ln(RR)=ln0.48=-0.734=0.289第128頁,課件共148頁,創作于2023年2月故RR的95%的可信區間為:

Exp[ln(RR)±1.96SE(lnRR)]=exp[-0.734±1.96×0.289]=[0.272,0.846]該例RR的95%的可信區間為0.272~0.846,使用阿斯匹林治療的病人,其病死率小于對照組,可認為阿斯匹林可降低心肌梗死有效。第129頁,課件共148頁,創作于2023年2月4、OR及其可信區間優勢比OR又稱比值比,指病例組中暴露人數與非暴露人數的比值除以對照組中暴露人數與非暴露人數的比值。OR計算的四格表:組別暴露非暴露例數病例組aba+b

非病例組cdc+d

合計a+cb+da+b+c+d第130頁,課件共148頁,創作于2023年2月當所研究疾病的發病率較低時,即a和c均較小時,OR近似于RR,故在回顧性研究中可用OR估計RR;由于前瞻性研究中,OR的可信區間與RR的可信區間很相近,且OR的計算更為簡便,因此,常用OR可信區間的計算來代替RR的可信區間的計算。OR值的解釋與RR相同。第131頁,課件共148頁,創作于2023年2月在臨床隨機對照試驗(RCT)中,常用OR代替RR,但必須注意使用條件,即發病率較低。第132頁,課件共148頁,創作于2023年2月OR的可信區間同樣需要采用自然對數計算,其ln(OR)的標準誤SE(lnOR)按下式計算:第133頁,課件共148頁,創作于2023年2月ln(OR)的可信區間為:

ln(OR)±uαSE(lnOR)OR的可信區間為:

Exp[ln(OR)±uαSE(lnOR)]第134頁,課件共148頁,創作于2023年2月OR計算的四格表:組別暴露非暴露例數病例組aba+b

非病例組cdc+d

合計a+cb+da+b+c+d阿斯匹林治療心肌梗死的效果試估計其OR的95%可信區間:第135頁,課件共148頁,創作于2023年2月OR的95%可信區間為:

Exp[ln(OR)±1.96SE(lnOR)]=exp[-0.894±1.96×0.347]=[0.207,0.807]該例OR的95%

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論