臨床科研數據的提取與管理_第1頁
臨床科研數據的提取與管理_第2頁
臨床科研數據的提取與管理_第3頁
臨床科研數據的提取與管理_第4頁
臨床科研數據的提取與管理_第5頁
已閱讀5頁,還剩146頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

數據的質量控制數據管理中的幾個常見問題統計分析結果與表達主要內容目前一頁\總數一百五十一頁\編于十一點(一)研究設計(二)收集資料:完整、準確(三)整理資料:核查、清洗(四)分析資料統計工作的基本步驟

目前二頁\總數一百五十一頁\編于十一點數據的質量控制目前三頁\總數一百五十一頁\編于十一點(一)數據的來源與數據集觀察性數據實驗性數據科研數據目前四頁\總數一百五十一頁\編于十一點觀察性數據(觀察性研究):衛生工作報表,病例資料觀察性研究:客觀地觀察、記錄和描述事物規律或現象的認識活動。實驗性數據(實驗性研究):臨床病例資料,動物實驗記錄實驗性研究:人為控制實驗條件或對研究對象施加一定干預措施所做的研究。多中心臨床實驗或大型調查研究:樣本量大,變量數多目前五頁\總數一百五十一頁\編于十一點目前六頁\總數一百五十一頁\編于十一點編號性別年齡民族體重(kg)身高(cm)冠心病糖尿病1男72漢78.54169.0有無2女81漢33.50142.0無無3男90回65.83170.0無可疑4男72漢86.26181.0無無5女70其他69.46158.5無有……………………735男71漢88.08181.0無無某地2002年735例65歲以上老年人健康檢查記錄casevariable數據矩陣目前七頁\總數一百五十一頁\編于十一點編號性別年齡民族體重(kg)身高(cm)冠心病糖尿病1男72漢78.54169.0有無2女81漢33.50142.0無無3男90回65.83170.0無可疑4男72漢86.26181.0無無5女70其他69.46158.5無有……………………735男71漢88.08181.0無無某地2002年735例65歲以上老年人健康檢查記錄分析變量標識變量目前八頁\總數一百五十一頁\編于十一點編號性別年齡民族體重(kg)身高(cm)冠心病糖尿病1男72漢78.54169.0有無2女81漢33.50142.0無無3男90回65.83170.0無可疑4男72漢86.26181.0無無5女70其他69.46158.5無有……………………735男71漢88.08181.0無無某地2002年735例65歲以上老年人健康檢查記錄反應變量解釋變量目前九頁\總數一百五十一頁\編于十一點解釋變量:指示變量、分組變量、因素、協變量、預測變量等反應變量:表示試驗效應或觀測結果的指標。注意:變量名:英文、不超過8個字符,分類變量適當數量化處理。目前十頁\總數一百五十一頁\編于十一點(二)數據錄入

數據錄入是將研究收集到的各種信息轉換為數據形式,輸入到計算機進行保存、管理的過程。數據審核:對收集到的原始資料進行審查與核實的過程。

真實、準確、完整、標準制定數據編碼表:使研究得到的信息數字化和標準化。

封閉性、開放性、缺失數據建立數據庫:運用專業的數據庫管理軟件。

數據管理、查詢、修改功能目前十一頁\總數一百五十一頁\編于十一點目前十二頁\總數一百五十一頁\編于十一點numbersexagenationalityweight(kg)height(cm)coronarydiabetes1172178.54169.0102081133.50142.0003190265.83170.0014172186.26181.0005070469.46158.502……………………735171188.08181.000原始數據錄入格式目前十三頁\總數一百五十一頁\編于十一點數據錄入的原則

1、方便錄入:將字符變量轉換成數值變量;2、便于核查:一定要有標識變量,以方便數據的核對;3、易于轉換:錄入數據時要考慮不同軟件的要求;4、利于分析:同一研究課題的結果最好錄成一個數據庫文件。同一資料進行雙人重復錄入方法,應用程序對兩個數據庫進行比對,核查錯誤。目前十四頁\總數一百五十一頁\編于十一點目前十五頁\總數一百五十一頁\編于十一點EpiData特點簡單易學、實用性強對計算機硬件要求不高調查表設計便捷與調查表形式一致的可視數據錄入界面數據核查功能強大且實現簡便

EpiData

Analysis可用于一般的統計分析與制圖

數據轉換功能強大

目前十六頁\總數一百五十一頁\編于十一點建立調查表文件創建數據庫建立核查文件錄入數據數據庫管理輸出數據

EpiData的基本流程目前十七頁\總數一百五十一頁\編于十一點數據庫的導出(Datain)SPSS文件SAS文件DBF文件

Stata文件REC文件目前十八頁\總數一百五十一頁\編于十一點目前十九頁\總數一百五十一頁\編于十一點二.

數據管理中的幾個常見問題目前二十頁\總數一百五十一頁\編于十一點(一)數據的質量控制1、輸入信息的有效性,即幅度檢查;2、輸入信息相互之間的一致性,即邏輯檢查;3、查漏:原始數據的編號與數據庫的編號核對;4、運用統計軟件觀察頻數分布是否異常;5、進行描述性統計,有無離群值和缺失值。目前二十一頁\總數一百五十一頁\編于十一點(二)變量的設置1、連續型變量的輸入:直接錄入;2、離散型變量的輸入:數值化處理。變量的設置方式:資料類型、研究目的、變量的分布形式、統計方法的應用條件。目前二十二頁\總數一百五十一頁\編于十一點(三)缺失值處理缺失值主要來自資料收集中的漏報和漏填;缺失值應控制在數據記錄總量的10%以內;注意將缺失值與“0”區分開來,缺失值一般用“.”表示;缺失比例很小時,可舍棄;缺失比例較大時,可進行插補(不得已,慎用)。目前二十三頁\總數一百五十一頁\編于十一點(四)離群數據的處理有無離群值?

頻數表、箱式圖或直方圖可初步判斷;線性回歸方法判斷。離群值(outlier)是指超出數據通常變化范圍的特大值或特小值的觀測值。出現離群值的處理

在離群值附近多次抽樣,了解數據的真實結構;專業知識與統計方法結合。目前二十四頁\總數一百五十一頁\編于十一點(五)統計學方法的應用條件正態性檢驗方差齊性檢驗多重共線性判斷目前二十五頁\總數一百五十一頁\編于十一點統計方法的正確選擇目前二十六頁\總數一百五十一頁\編于十一點三.統計分析結果與表達目前二十七頁\總數一百五十一頁\編于十一點醫學論著的基本結構

摘要引言1.

材料與方法2.

結果3.

討論AbstractIntroductionMaterialsandMethodsResults

Discussion目前二十八頁\總數一百五十一頁\編于十一點目前二十九頁\總數一百五十一頁\編于十一點目前三十頁\總數一百五十一頁\編于十一點目前三十一頁\總數一百五十一頁\編于十一點統計表目前三十二頁\總數一百五十一頁\編于十一點統計圖目前三十三頁\總數一百五十一頁\編于十一點摘要

Abstract對處理組和對照組的主要統計結果進行概述:

均數(中位數、率),標準差(標準誤),P值;兩組均數(率)之差或者OR值,95%可信區間(CI);多個觀察指標的相關系數及其P

值等.目前三十四頁\總數一百五十一頁\編于十一點目前三十五頁\總數一百五十一頁\編于十一點簡要說明研究背景和研究目的。給出文獻分析的綜合復習結果:

如組間差別(DifferenceAmongGroups);

P值(P-value)等。采用循證醫學的方法。引言Introduction目前三十六頁\總數一百五十一頁\編于十一點目前三十七頁\總數一百五十一頁\編于十一點材料與方法MaterialsandMethods統計表達

研究設計方案(DesignofResearchMethods)統計分析方法及軟件(AnalysisMethodsandSoftware)目的:以使讀者確認論文中所有統計分析結果的可靠性和研究結論的合理性。

目前三十八頁\總數一百五十一頁\編于十一點研究設計方案(DesignofResearchMethods)

研究對象的來源和選擇方法,包括觀察對象的基本情況

需要說明診斷標準病例入選標準、病例排除標準、病例剔除標準、療效評價標準。有無失訪(失訪比例,不可超過20%)、有無“知情同意”評價療效有無遮蔽(“單盲SingleBlind”、“雙盲DoubleBlind”或“多盲MultipleBlind”)等均衡性分析結果:影響因素(如年齡、性別、病情)樣本量估計的依據(SampleSize)目前三十九頁\總數一百五十一頁\編于十一點目前四十頁\總數一百五十一頁\編于十一點常用統計方法簡單說明:

如檢驗、t檢驗、單因素方差分析(ANOVA)等;特殊的統計方法給出相應的參考文獻:

如聚類分析(Cluster)、生存分析(SurvivalAnalysis)等;一般統計計算軟件給出名稱如SPSS、SAS、STATA等,EXCEL不能作為處理軟件特殊的計算軟件要給出軟件的過程名統計分析方法及軟件(AnalysisMethodsandSoftware)目前四十一頁\總數一百五十一頁\編于十一點目前四十二頁\總數一百五十一頁\編于十一點統計表達

統計圖表(StatisticalGraphs&Tables)結果ResultsP值的表達(SuitableExpressionofP)統計指標(StatisticalIndexes)數據精度(NumericalPrecision)目前四十三頁\總數一百五十一頁\編于十一點目前四十四頁\總數一百五十一頁\編于十一點統計表目前四十五頁\總數一百五十一頁\編于十一點統計圖目前四十六頁\總數一百五十一頁\編于十一點討論Discussion統計解釋

P

值的解釋(InterpretationofP)關聯的解釋(InterpretationofAssociation)因果的解釋(InterpretationofCausation)r值的解釋(Interpretationofr)目前四十七頁\總數一百五十一頁\編于十一點統計資料的分類Statisticalclassification目前四十八頁\總數一百五十一頁\編于十一點編號性別年齡民族體重(kg)身高(cm)冠心病糖尿病1男72漢78.54169.0有無2女81漢33.50142.0無無3男90回65.83170.0無可疑4男72漢86.26181.0無無5女70其他69.46158.5無有……………………735男71漢88.08181.0無無某地2002年735例65歲以上老年人健康檢查記錄計量計量計量計數計數計數等級目前四十九頁\總數一百五十一頁\編于十一點1.計量資料(或定量變量)

measurmentdata,quantitativedata定義:測定每個觀察單位的某項指標量的大小,所得的資料稱為計量資料。其變量值是定量的,一般帶有度量衡或其它單位。

特點:每個觀察單位的觀察值之間有量的區別。

目前五十頁\總數一百五十一頁\編于十一點

定義:將觀察單位按某種屬性或類別分組計數,分組匯總得到各組觀察單位數稱為計數資料。特點:計數排列是無序分組,同組各觀察單位之間沒有量的差別,但各組間有質的不同,各組互不相容。二項分類和多項分類2.計數資料(或無序分類變量)

enumerationdata,unorderedcategorydata目前五十一頁\總數一百五十一頁\編于十一點3.等級資料(或有序分類變量)

rankeddata,

ordinalcategorydata定義:將觀察單位按某個指標量的大小分成等級或某種屬性的不同程度分成等級后分組計數,分類匯總各組的觀察單位數稱為等級資料。特點:等級是有序分組。同計數資料的區別是:屬性的分組有程度的差別,各組按一定順序排列;與計量資料的區別是:每個觀察單位未確切定量,所以又稱為半定量資料。目前五十二頁\總數一百五十一頁\編于十一點目前五十三頁\總數一百五十一頁\編于十一點常用的統計指標AnalysisIndex目前五十四頁\總數一百五十一頁\編于十一點統計指標可用于描述性的統計分析,也是反映數據基本特征的統計分析方法。并可使人們準確、全面地了解數據資料所包涵的信息,以便于在此基礎上完成資料的進一步統計分析。目前五十五頁\總數一百五十一頁\編于十一點

常用統計指標的特點及其應用場合指標特點應用場合精確,易受極端值影響均勻分布的小樣本數據或近似正態分布數據穩定,不受特大或特小值的影響應用范圍廣,特別是大樣本偏態分布資料粗糙,不受極端數值的影響小樣本的探索性數據同一資料,幾何均數<均數近似對數正態分布數據,等比級數資料標準差與均數的比值,無單位比較不同資料或同類資料均數相差懸殊時變異程度計量資料(數值資料)的指標目前五十六頁\總數一百五十一頁\編于十一點目前五十七頁\總數一百五十一頁\編于十一點常用相對數的算法和用途應用時需注意:分母一般不宜過小,不以構成比代替率,可比性。計數資料(分類資料)的指標目前五十八頁\總數一百五十一頁\編于十一點目前五十九頁\總數一百五十一頁\編于十一點統計表Statisticaltable目前六十頁\總數一百五十一頁\編于十一點統計表的構造

表號標題(包括何時、何地、何事)橫標目的總標目總標目總標目(單位)縱標目

縱標目…

縱標目縱標目…

橫標目××××××××.××××.××┆×××××.×××.××┆┆┆┆┆┆┆┆┆┆合計××××××××.××××.××備注:表頭標目線條數字備注表體標題合計目前六十一頁\總數一百五十一頁\編于十一點標題是統計表的總名稱,位于表的上方;簡明確切,與內容一致,通常需注明資料的時間和地點。若一篇論文中有兩張以上的統計表,則每張統計表的標題前應加序號。

目前六十二頁\總數一百五十一頁\編于十一點表3-2狗損失3/4循環血液量以氧化聚白明膠補充后各段時間血漿中氧化聚白明膠的濃度和24小時內尿中氧化聚白明膠排出量的百分數狗號體重(Kg)注入氧化聚白明膠量(克)注射后血漿內氧化聚白明膠的濃度(克/每100毫升)24小時尿內排出氧化聚白明膠的百分數15-20分1小時6小時12小時24小時4011.015.01.250.780.300.270.10934114.517.90.970.640.280.150.09924211.017.00.970.670.210.140.0470436.815.01.540.930.390.210.10--目前六十三頁\總數一百五十一頁\編于十一點(修改)*:四只狗編號依次為40、41、42、43,體重分別為11.0、14.5、11.0、6.8公斤。表3-2氧化聚白明膠存留狗血液內各段時間的濃度和排出量*注入量(克)血漿內濃度(克/100毫升

)24小時內排出量的百分比(%)半小時內1小時6小時12小時24小時15.01.250.780.300.270.109317.90.970.640.280.150.099217.00.970.670.210.140.047015.01.540.930.390.210.10--目前六十四頁\總數一百五十一頁\編于十一點根據其位置與作用可分為橫標目和縱標目。①橫標目:位于表的左側,向右說明各橫行數字的涵義。②縱標目:位于表頭右側,向下說明各縱欄數字的涵義。必要時可在橫標目或縱標目前冠以總標目。標目目前六十五頁\總數一百五十一頁\編于十一點治療組患者例數治療結果良好死亡西藥組1367中西醫結合組10100表3-3急性心肌梗塞并發休克患者療效比較(修改表)并發癥西藥組中西醫結合組例數結果例數結果良好死亡良好死亡休克136710100表3-3

兩個治療組對比(原表)目前六十六頁\總數一百五十一頁\編于十一點

通常用四條橫線將統計表分割成表頭、表體和合計三部分(即頂線、底線、縱標目下的橫隔線及合計上的橫隔線)。

線條正規印刷的統計表一般沒有豎線和斜線,但標目間應有明顯的間隔;目前六十七頁\總數一百五十一頁\編于十一點

分型分度及療效單純型慢性支氣管炎喘息型慢性支氣管炎分度度別重中輕重中輕例數1365431935633療效指標治愈顯效好轉無效治愈顯效好轉無效例數6098511223836511小計%95%5%94.0%6.0%合計94.3%表3-4復方豬膽膠囊對403例不同類型老年慢性支氣管炎病例近期療效觀察(原表)目前六十八頁\總數一百五十一頁\編于十一點疾病類型例數病情療效重中輕治愈顯效好轉無效有效率(%)單純型22113654316098511294.57喘息型1829356332383651193.96合計40322911064831811162394.29表3-4復方豬膽膠囊治療老年慢性支氣管炎的近期療效目前六十九頁\總數一百五十一頁\編于十一點

數字是統計表的基本語言。主要內容為統計調查結果與計算結果,如均數、合計、率、百分比等;表內數據一律采用阿拉伯數字。要求:數字計算必須絕對準確;同一指標的小數位數應一致,位次要對齊;表內不應有空白項,數字為零時應寫“0”,暫時沒有數據時用“…”表示,不必合計時可用“—”表示。數字目前七十頁\總數一百五十一頁\編于十一點

備注不是統計表的必須項目,需要時才用,并用“*”號標出,寫在表的外面加以說明,如表3-2所示。備注目前七十一頁\總數一百五十一頁\編于十一點*:四只狗編號依次為40、41、42、43,體重分別為11.0、14.5、11.0、6.8公斤。表3-2氧化聚白明膠存留狗血液內各段時間的濃度和排出量*注入量(克)血漿內濃度(克/100毫升

)24小時內排出量的百分比(%)半小時內1小時6小時12小時24小時15.01.250.780.300.270.109317.90.970.640.280.150.099217.00.970.670.210.140.047015.01.540.930.390.210.10--目前七十二頁\總數一百五十一頁\編于十一點

從內容上看,每張統計表都有主語和賓語。

主語:是指被研究的事物,多位于表內左邊。

賓語:指說明主語的統計指標,多位于表內右邊。

將主語和賓語連接起來,應能讀成一個完整的句子。內容目前七十三頁\總數一百五十一頁\編于十一點表3-4復方豬膽膠囊治療老年慢性支氣管炎的近期療效疾病類型例數病情療效重中輕治愈顯效好轉無效有效率(%)單純型22113654316098511294.57喘息型1829356332383651193.96合計40322911064831811162394.29目前七十四頁\總數一百五十一頁\編于十一點統計表的內容要豐富:制表的目的是為了對統計結果進行對比分析,若指標過少,則不易湊統計表。1統計表要重點突出:一般一張統計表只表達一個中心內容,若包含內容過多,可分制成若干張統計表。

2統計表要有“自明性”

:即主謂分明,層次清楚。為此,標目的處理是決定統計表質量的關鍵。橫標目常為第一主辭,縱標目為第二主辭,切忌位置混亂,互相混雜,使讀者難以識別。3制表注意事項目前七十五頁\總數一百五十一頁\編于十一點分組切除組姑息手術組探查合計手術方式胰十二指腸切除術膽腸吻合術胃腸加胃腸吻合術胃腸吻合術膽道外引流術剖腹探查術例數手術死亡隨訪例數生存月數29*32613871171314112472538262.547538219224161△

生存半年率一年

%二年壽三年命五年表十年法21.04±3.8911.91±4.9956.56±9.564.11±2.012.39±2.3628.74±8.811.03±1.02024.63±8.450021.13±8.010012.08±7.8700*:其中2例是其他切除術;△:3例為淋巴結活檢得到隨訪者。表3-5192例手術及效果(原表)目前七十六頁\總數一百五十一頁\編于十一點手術方式例數術后平均生存月數手術手術死亡隨訪胰十二指腸切除29*32613.0姑息性手術:

膽腸吻合8711713.0

膽腸+胃腸吻合141124.0

胃腸吻合7253.0

膽道外引流8262.5剖腹探查475382.0合計19224158—*:其中2例是其它切除術。表3-5192例壺腹癌不同手術方式的生存情況目前七十七頁\總數一百五十一頁\編于十一點隨訪時間(年)生存率(%)切除組姑息手術組探查組0.5…21.04±3.8911.91±4.99155.56±9.564.11±2.012.39±2.36228.74±8.811.03±1.020324.63±8.4500520.13±8.01001012.08±7.8700表3-5手術后各階段生存率(壽命表法)目前七十八頁\總數一百五十一頁\編于十一點標題定義特點備注標目數字統計表線條內容豐富重點突出有自明性目前七十九頁\總數一百五十一頁\編于十一點統計圖Statisticalgraph目前八十頁\總數一百五十一頁\編于十一點

統計圖(statisticalgraph)是指用幾何圖形(點、線段、直條等)顯示統計指標的大小、對比關系或變化趨勢。統計圖的定義目前八十一頁\總數一百五十一頁\編于十一點圖域縱標目刻度標題圖例橫標目統計圖的構造目前八十二頁\總數一百五十一頁\編于十一點縱軸:表示統計指標,可以是絕對數、相對數或平均數。橫軸:并排各相互比較的分組名稱,一般省略橫標目。

(一)條圖(barchart):用等寬直條的長短表示統計指標數量的大小。用于比較彼此獨立的若干組指標。常用統計圖目前八十三頁\總數一百五十一頁\編于十一點按指標和分組因素的多少可分:

具有一個統計指標,一個分組因素。具有兩個統計指標,一個分組因素,且兩個統計指標必須有隸屬關系。

具有一個統計指標,兩個分組因素,

或一個分組因素,多個統計指標。單式條圖:

復式條圖:

分段條圖:目前八十四頁\總數一百五十一頁\編于十一點條圖圖示(1)單式條圖

圖某石棉廠不同工作部門的石棉肺患病率(%)一個統計指標一個分組因素目前八十五頁\總數一百五十一頁\編于十一點(2)復式條圖

圖三個直轄市的人口密度比較一個統計指標兩個分組因素目前八十六頁\總數一百五十一頁\編于十一點(3)分段條圖

圖某師1991年傳染病與菌痢發病人數兩個統計指標一個分組因素目前八十七頁\總數一百五十一頁\編于十一點(二)圓圖(piechart):用圓的總面積表示事物的全部,用各個扇形的面積(圓心角的大小)表示各個部分。用于表達事物的內部結構。圖10-5251例胃癌患者病理組織學類型的構成目前八十八頁\總數一百五十一頁\編于十一點2002年某醫院1402例孕婦分娩結果分娩結果例數構成比(%)過期產21

1死產21

1早產212

15足月1148

83總計1402100圓圖圖示目前八十九頁\總數一百五十一頁\編于十一點(三)百分條圖(percentagebarchart):用一個矩形條子的面積表示事物全部,而用其中各段表示各構成部分。也用于表達事物的內部結構,更適用于多組結構相對數的比較。縱軸:表示分組因素;橫軸:表示累計百分比,由0開始,最大刻度為100。目前九十頁\總數一百五十一頁\編于十一點百分條圖圖示圖251例男女胃癌患者病理組織學類型的構成目前九十一頁\總數一百五十一頁\編于十一點(四)線圖(linechart):用點和點之間的連線表示統計指標的變化趨勢。適用于分組標志為連續型變量(如時間、年齡等)的資料。橫軸:代表分組標志(為連續型變量);縱軸:表示統計指標(相對數、平均數等)。

目前九十二頁\總數一百五十一頁\編于十一點線圖圖示目前九十三頁\總數一百五十一頁\編于十一點線圖示例目前九十四頁\總數一百五十一頁\編于十一點半對數線圖

半對數線圖:線圖的一種特殊形式,適用于表示事物發展速度(相對比)。

其縱軸為對數尺度,橫軸為算術尺度,使線圖上的數量關系變為對數關系。

繪圖時,應使用特制的半對數坐標紙,也可以將統計指標(率)取對數值后在方格坐標紙上作圖。目前九十五頁\總數一百五十一頁\編于十一點表10-6某部歷年普通感冒與支氣管炎發病率(‰)圖10-8某部隊歷年感冒與支氣管炎發病率

圖10-8某部隊歷年感冒與支氣管炎發病率半對數線圖圖示目前九十六頁\總數一百五十一頁\編于十一點(五)直方圖(histogram):用矩形面積表示某個連續型變量的頻數(頻率)分布。縱軸:表示頻數或頻率;橫軸:連續型變量的組段。

目前九十七頁\總數一百五十一頁\編于十一點直方圖圖示目前九十八頁\總數一百五十一頁\編于十一點表10-7某市某年流行性乙型腦炎患者的年齡分布年歲0~1~2~3~4~5~6~7~8~9~10~20~30~40~50~合計人數33911232211148636131141175每歲患者人數3391123221114863.61.31.10.40.1—圖10-10某年某市流行性乙型腦炎患者的年齡分布圖10-10某年某市流行性乙型腦炎患者的年齡分布目前九十九頁\總數一百五十一頁\編于十一點(六)箱式圖(box-whiskerplot):又叫箱-髯圖,用于比較兩個或多個樣本分布的中心位置和散布范圍。中心位置:用中位數(P50)表示;散布范圍:用四分位數間距(P75-P25)和極差

(Xmax-Xmin)或P2.5和P97.5或P0.5和

P99.5表示。目前一百頁\總數一百五十一頁\編于十一點血汞含量(umol/L)某市汞作業工人和居民血汞含量分布情況**00.10.20.30.40.50.6汞作業工人居民表10-8某市汞作業工人和居民血汞含量(μmol/L)的分布情況組別P0.5P25P50P75P99.5汞作業工人0.1020.1650.2000.2420.475居民0.0520.1050.1450.2100.405目前一百零一頁\總數一百五十一頁\編于十一點(七)誤差限圖(error-barchart):是在用條圖或線圖表示均數的基礎上,在圖中附上標準差的范圍,以反映數據的散布情況。

條的高度表示,條上的延長線表示+s。也可用來表示率±標準誤或均數±標準誤的范圍,以說明率或均數的抽樣誤差大小。目前一百零二頁\總數一百五十一頁\編于十一點表10-9不同地區入伍兩年戰士握力測定結果籍貫握力(kg)右手左手四川42.5±5.239.4±5.6貴州42.1±5.240.3±6.2云南41.8±6.039.2±5.4目前一百零三頁\總數一百五十一頁\編于十一點表10-10某地兒童錫克氏試驗結果年齡(歲)0.5~1~2~3~4~5~6~7~陽性率(%)44.645.433.424.821.717.916.711.01.96sP3.962.432.041.721.551.651.411.33目前一百零四頁\總數一百五十一頁\編于十一點統計圖的選擇

圖形資料性質分析目的條圖相互獨立(離散)多組資料某統計指標的比較百分條圖構成比計數資料多個事物內部構成比較圓圖構成比計數資料描述事物的內部構成線圖連續型計量資料表示事物的動態變化趨勢半對數線圖連續型計量資料變化事物的動態變化直方圖頻數表資料表示某連續型變量的頻數分布目前一百零五頁\總數一百五十一頁\編于十一點假設檢驗的結果表達SuitableExpressionofP目前一百零六頁\總數一百五十一頁\編于十一點P值的表達(SuitableExpressionofP)傳統表達P>0.05記為“NS”,

P≤0.05記為“*”,

P≤0.01記為“**”提倡表達提倡報告精確

P值應給出檢驗統計量的實際值目前一百零七頁\總數一百五十一頁\編于十一點相關系數保留2位小數;檢驗統計量,如Chi-square值、t值保留2位小數即可。計量資料的統計指標(均數、標準差、標準誤、中位數、百分位數等)的保留小數位數,應該與原始數據的保留小數位數相同;計數資料的百分比保留1位小數,一般不超過2位小數;病死率、發病率按慣例選擇比例基數,如1000‰,10000/萬,10萬/10萬等,或自行選擇合適的比例基數,使率的表達至少有1位整數;數據的精確度目前一百零八頁\總數一百五十一頁\編于十一點

關于

應用條件:只有屬于正態分布的數據才可以表示為,雖屬于正態分布,但出現負數(即<s時,如血清出現負數)時不能用表示,此時宜用最大值、最小值、四分位間距和中位數。目前一百零九頁\總數一百五十一頁\編于十一點其他常見的統計指標SuitableExpressionofP目前一百一十頁\總數一百五十一頁\編于十一點可信區間(confidenceinterval,CI)區間估計即是按預先給予的概率,確定未知參數值的可能范圍。此范圍稱為估計參數的可信區間或稱置信區間(confidenceinterval),預先給定的概率稱為可信度或置信水平(confidencelevel),符號為“1-”,常取95%或99%,按此確定的可信區間分別稱之為95%或99%可信區間。目前一百一十一頁\總數一百五十一頁\編于十一點循證醫學中常用的是率的可信區間、RR或OR的可信區間、均數的可信區間、兩均數差值的可信區間。目前一百一十二頁\總數一百五十一頁\編于十一點目前一百一十三頁\總數一百五十一頁\編于十一點可信區間還可用于假設檢驗,尤其是試驗組與對照組某指標差值或比值的可信區間,在循證醫學中更為常用。試驗組與對照組某指標差值或比值的95%可信區間與α為0.05的假設檢驗等價,99%可信區間與α為0.01的假設檢驗等價。可信區間還可用于假設檢驗目前一百一十四頁\總數一百五十一頁\編于十一點分類資料的指標在循證醫學的研究與實踐中,除了有效率、死亡率、患病率、發病率等常用率的指標外,相對危險度(RR)、比值比(OR)及由此導出的其他指標也是循證醫學中富有特色的指標。目前,在循證醫學中分類資料常用的描述指標主要有EER、CER、OR、RR、RRR、ARR、NNT、NNH等。目前一百一十五頁\總數一百五十一頁\編于十一點1、EER與CER循證醫學中預防和治療性試驗中,率可細分為EER和CER兩類。EER即試驗組中某事件的發生率(experimentaleventrate,EER)如對某種暴露采用某些防治措施后該疾病的發生率。CER即對照組中某事件的發生率(controleventrate,EER)如對某種暴露不采取防治措施該疾病的發生率。目前一百一十六頁\總數一百五十一頁\編于十一點2、RD(率差)及可信區間兩個發生率的差即為率差,也稱危險差(ratedifference,riskdifference,RD),如試驗組的發生率(EER)與對照組發生率(CER)的差,其大小可反映試驗效應的大小。兩率差的可信區間由下式計算:

|p1-p2|±uαSE(p1-p2)=(RD-uαSE(p1-p2),RD+uαSE(p1-p2))目前一百一十七頁\總數一百五十一頁\編于十一點兩率差的標準誤:因而兩率差的可信區間不包含0(上下限均大于0或上下限均小于0),則兩個率有差別;反之,兩率差的可信區間包含0,則無統計學意義。目前一百一十八頁\總數一百五十一頁\編于十一點某醫師研究了阿司匹林治療心肌梗死的效果,資料見下表

該試驗結果的EER和CER計算結果為:EER=a/n1=15/125=12%,CER=c/n2=30/120=25%

死亡未死亡例數治療組15(a)110(b)125(n1)對照組30(c)90(d)120(n2

)合計45200225(n)目前一百一十九頁\總數一百五十一頁\編于十一點目前一百二十頁\總數一百五十一頁\編于十一點該試驗兩率差(RD)的95%可信區間為:RD±uαSE(p1-p2)=()±1.96×0.049=-0.23~-0.03

該例兩率差的可信區間為-0.23~-0.03,上下限均小于0(不包含0),兩率有差別。可認為阿斯匹林可降低心肌梗死的病死率。目前一百二十一頁\總數一百五十一頁\編于十一點兩率差別有統計學意義。可認為阿斯匹林可降低心肌梗死的病死率。目前一百二十二頁\總數一百五十一頁\編于十一點3、RR及可信區間相對危險度RR(relativerisk,RR)是前瞻性研究中較常用的指標,它是試驗組某事件發生率P1與對照組某事件發生率P0之比,用于說明前者是后者的多少倍,常用來表示試驗因素與疾病聯系的強度及其在病因學上的意義大小。目前一百二十三頁\總數一百五十一頁\編于十一點RR計算的四格表:

組別發病未發病例數

試驗組a(r1)bn1

對照組c(r2)dn2試驗組的發生率為:p1=a/(a+b)=r1/n1對照組的發生率為:p0=c/(c+d)=r2/n2相對危險度按下式計算:RR=p1/p0=EER/CER目前一百二十四頁\總數一百五十一頁\編于十一點當RR=1時,可認為試驗因素與疾病無關;當RR≠1時,可認為試驗因素與疾病有關;當RR>1時,可認為試驗組發生率大于對照組;當RR<1時,可認為試驗組發生率小于對照組;目前一百二十五頁\總數一百五十一頁\編于十一點RR的可信區間,應采用自然對數進行計算,即應求RR的自然對數值ln(RR)和ln(RR)的標準誤SE(lnRR),其計算公式如下:目前一百二十六頁\總數一百五十一頁\編于十一點ln(RR)的1-α可信區間為:

ln(RR)±uαSE(lnRR)RR的可信區間為:

Exp[ln(RR)±uαSE(lnRR)]由于RR=1時為試驗因素與疾病無關,故其可信區間不包含1時為有統計學意義;反之,其可信區間包含1時為無統計學意義目前一百二十七頁\總數一百五十一頁\編于十一點阿斯匹林治療組的病死率p1=15/125,對照組的病死率p0=30/120,其RR和可信區間為:Ln(RR)=ln0.48=-0.734=0.289目前一百二十八頁\總數一百五十一頁\編于十一點故RR的95%的可信區間為:

Exp[ln(RR)±1.96SE(lnRR)]=exp[-0.734±1.96×0.289]=[0.272,0.846]該例RR的95%的可信區間為0.272~0.846,使用阿斯匹林治療的病人,其病死率小于對照組,可認為阿斯匹林可降低心肌梗死有效。目前一百二十九頁\總數一百五十一頁\編于十一點4、OR及其可信區間優勢比OR又稱比值比,指病例組中暴露人數與非暴露人數的比值除以對照組中暴露人數與非暴露人數的比值。OR計算的四格表:組別暴露非暴露例數病例組aba+b

非病例組cdc+d

合計a+cb+da+b+c+d目前一百三十頁\總數一百五十一頁\編于十一點當所研究疾病的發病率較低時,即a和c均較小時,OR近似于RR,故在回顧性研究中可用OR估計RR;由于前瞻性研究中,OR的可信區間與RR的可信區間很相近,且OR的計算更為簡便,因此,常用OR可信區間的計算來代替RR的可信區間的計算。OR值的解釋與RR相同。目前一百三十一頁\總數一百五十一頁\編于十一點在臨床隨機對照試驗(RCT)中,常用OR代替RR,但必須注意使用條件,即發病率較低。目前一百三十二頁\總數一百五十一頁\編于十一點OR的可信區間同樣需要采用自然對數計算,其ln(OR)的標準誤SE(lnOR)按下式計算:目前一百三十三頁\總數一百五十一頁\編于十一點ln(OR)的可信區間為:

ln(OR)±uαSE(lnOR)OR的可信區間為:

Exp[ln(OR)±uαSE(lnOR)]目前一百三十四頁\總數一百五十一頁\編于十一點OR計算的四格表:組別暴露非暴露例數病例組aba+b

非病例組cdc+d

合計a+cb+da+b+c+d阿斯匹林治療心肌梗死的效果試估計其OR的95%可信區間:目前一百三十五頁\總數一百五十一頁\編于十一點OR的95%可信區間為:

Exp[ln(OR)±1.96SE(lnOR)]=exp[-0.894±1.96×0.347]=[0.207,0.807]該例OR的95%可信區間為0.207~0.807,可認為阿斯匹林治療心肌梗死有效。目前一百三十六頁\總數一百五十一頁\編于十一點5.RRR及可信區間RRR為相對危險度減少率(relativeriskreduction),其計算公式為:RRR=|CER-EER|/CER=1-RRRRR的可信區間可由1-RR計算得到:

如前例RR=0.48,95%可信區間為0.272~0.846則其RRR=1-

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論