




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
會計學1第二計量資料的統計描述
統計描述的意義
社會活動看似雜亂無章,對個體來說有很多不確定性,但總體上都是服從一些統計規律的。醫學工作有很多數據,統計學描述就是對這些數據進行加工和提煉,找出規律、預測未知。統計描述是最簡潔有力的語言。第1頁/共50頁
第二章計量資料的統計描述
概念:即用少量幾個統計指標刻畫出原始數據的特征稱為統計描述。計量資料的統計描述方法:(單變量)1.通過頻數表描述數據特征
2.用統計指標定量描述數據的特征。
第2頁/共50頁表100例高血壓患者治療后臨床記錄編號年齡性別治療組舒張壓體溫療效
X1
X2
X3
X4X5
X6137男A11.2737.5顯效
245女B12.5337.0有效
343男A10.9336.5有效
459女B14.6737.8無效
10054男B16.8037.6無效第3頁/共50頁
第一節頻數分布
一、頻數分布表頻數分布表:將變量值分為不同數量的組段,清點各組段的例數。意義:概括了解變量值在各組段的分布和規律。例:表2-1第4頁/共50頁例2-1從某單位1999年的職工體檢資料中獲得101名正常成年女子的血清總膽固醇(mmol/L)的測量結果
2.354.213.325.354.174.132.784.263.584.344.844.414.783.953.923.583.664.283.263.52.74.614.752.913.914.594.192.684.524.913.183.684.833.873.953.914.154.554.83.414.123.955.084.533.923.585.353.843.63.514.063.073.554.233.574.833.523.844.53.964.53.274.523.194.593.753.984.134.263.633.875.713.34.734.175.133.784.573.83.933.783.994.484.284.065.265.253.985.033.513.863.023.74.333.293.254.154.364.953.003.26第5頁/共50頁
計量資料頻數表的編制步驟例2-1數據
1.確定全距(R)=最大值—
最小值2.定組數(8-15組)和組距:例:3.36/10=0.336≈0.33.寫出組段的下限:第1組段值小于或等于最小變量值,并以整數(0,5或2,4,6,8)較好。如2.3~4.劃計并計數:變量(x)歸為L≤x<U(見表2-1)組距(i)=全距(R)/組數第6頁/共50頁表2-1101名正常成年女性血清總膽固醇頻數表
組段頻數(f)f(%)
2.3-11.02.6-33.02.9-66.03.2-88.03.5-1717.03.8-2020.04.1-1717.04.4-1212.04.7-99.05.0-55.05.3-22.05.6-5.911.0
合計101100.0第7頁/共50頁二頻數表及分布圖的用途1.通過頻數表了解數據的分布特征。
X值分布情況:偏態或正態分布取值情況:變量值取值范圍集中趨勢:變量值集中位置。2.便于發現資料中的可疑值。3.組段的頻率作為概率的估計。第8頁/共50頁例:表2-1資料頻數分布圖—直方圖圖2-1
101名正常成年女性血清總膽固醇頻數分布
頻數血清總膽固醇正態分布第9頁/共50頁圖2-259名鏈球菌咽喉炎患者潛伏期正偏態分布第10頁/共50頁講義表2-4數據圖2-3負偏態分布第11頁/共50頁例:某院出院患者住院天數的頻數表組段(天)頻數(f)
0-65-2110-1415-1320-625-230-335-140及以上13合計79第12頁/共50頁
第二節集中趨勢的描述
平均數指標的概念和作用概念:平均數表示一組同質計量數據集中趨勢的位置和平均水平。作用:是一組計量數據平均水平的代表值;可作為不同組間的比較值。醫學中常用的平均數指標有:算數均數、幾何均數、中位數第13頁/共50頁一、算術均數(mean)
簡稱均數,用表示.
公式適用頻數為正態或近似正態分布的計量資料.基本公式(2-1,2-2)加權法公式(例數多)適用條件第14頁/共50頁表2-1101名正常成年女性血清總膽固醇頻數表
組段頻數(f)組中值XfX
2.3-12.452.452.6-32.758.252.9-63.0518.303.2-83.35…
3.5-173.653.8-203.954.1-174.254.4-124.554.7-94.855.0-55.155.3-25.455.6-5.915.75
合計101——409.7第15頁/共50頁加權法公式計算頻數(f)作為X值的權數第16頁/共50頁二、幾何均數(Geometricmean)
適用條件:X值呈倍數增長或部分數據偏離過大偏態分布(正偏態)資料。計算公式:直接法,例數較少用(2-3)加權法,(2-4)或第17頁/共50頁例2-4某地5例微絲蚴血癥患者治療7年后用間接熒光抗體試驗測得其抗體滴度分別為1/10,1/20,1/40,1/80,1/160,求幾何均數。結論:平均抗體滴度為1:34(幾何均數法)第18頁/共50頁表2-569例RA患者血清EBV-lgG抗體測定結果
滴度倒數
X人數
flgXflgX1041.00004.00002031.30103.903040101.602116.021080101.903119.0310160112.204124.2451320152.505137.5765640142.806239.2868128023.10726.2144合計69150.2778第19頁/共50頁幾何均數計算例2-5:例數合計
結論:69例RA患者血清EBV-lgG抗體平均滴度為1:150.6
第20頁/共50頁三、中位數和百分位數(一)中位數(Median,
M):適用于描述偏態分布資料的平均水平。如潛伏期、病程資料。計算定義:將一組變量值由小到大依次排列,居以中間位次的觀察值即為中位數,為這組數據的平均數。
X:5,5,6,7,20(d)位次12345第21頁/共50頁中位數的計算1.例數較少(公式2-5,2-6)n為偶數n為奇數中位數優點:不受數據中極大或極小值的影響,取決于中間位置的數。第22頁/共50頁(二)百分位數百分位數(percentile)是一種位置指標,用表示。例計算定義:將一組變量值由小到大依次排列,為第x百分位數的秩次,其對應的變量值(x)為第x百分位數,記為Px。X:15810……48….105秩次123450100x%1%2%3%4%50%100%一組數據(n=100),由小到大排列例:第23頁/共50頁百分位數計算方法1.直接法(不要求)將樣本值由小到大排隊,用確定Px的位次和PX。當為帶有小數位時用式2.7:當為整數時用式2.8trunc(a)表示對數字取其整數。式2.8式2.7第24頁/共50頁例:8位患者某病的住院天數:
22233456求50%位數和80%位數。解:第50%位次:nX%=8×0.5=4,用式2.8
中位數=P50=3(天)第80%位次:nX%=8×0.8=6.4,用公式2.7第25頁/共50頁2.頻數表法(例數較多)Lx:第X%位數所在組段的下限值ix:第X%位數所在組段的組距fx:第X%位數所在組段的頻數:第X%位數所在組段上個組段的累計頻數式中:(2-9)第26頁/共50頁表2-5118名鏈球菌咽喉炎患者的潛伏期
天數人數累計頻數累計頻數%12~41-43.424~175-2117.836~3222-5344.948~2454-7765.360~189580.572~1210790.784~511294.996~411698.3108-2118100.0中位數所在組段第27頁/共50頁計算頻數表資料P25、P50和P951.計算x=25%和50%的位次2.按公式2-9計算Px第28頁/共50頁百分位數計算結果的應用1.常計算P25、P50、P75、和P95,為臨床治療提供依據。例2-9:120名細菌性痢疾治愈的住院天數
P5=3.5(天),即只有5%的人住院低于3.5天。
P95=15(天)2.確定醫學指標的參考值第29頁/共50頁如P25=39.2天P50=51天(中位數)118名鏈球菌咽喉炎患者的潛伏期第30頁/共50頁第三節、離散趨勢的描述
描述計量資料數據間離散(變異)程度的指標
—變異指標第31頁/共50頁例2-11三組同齡男孩的身高(cm)
R
甲組909510010511010020乙組96981001021041008丙組96991001011041008
三組男孩身高值的變異一樣嗎?第32頁/共50頁三個指標測定值分布變異不同變異的大小反映某組指標的穩定性第33頁/共50頁
幾個常用的變異指標一、極差(Range):用(R)表示即R=最大值–
最小值意義:
R值越大,表示該組數據的變異越大。缺點:數據利用不全,部分信息損失,在例數少時結果不穩定。極差、四分位數間距、方差、標準差、變異系數第34頁/共50頁二、四分位數間距(quartilerange)
四分位數間距:常用QR表示常計算:QR=P75%-P25%
作為變異指標比極差穩定。常用于表示偏態分布資料的變異。例:QR=P75%-P25%=67.7-39.2=28.5天表示方法:Md(QR)
M=51天,(QR=28.5天)第35頁/共50頁
三、標準差和方差
(Standarddeviationandvariance)
公式總體方差(σ2)(2-11)(2-12)總體標準差(σ)樣本標準差(s)(2-13)第36頁/共50頁
標準差的簡化計算公式:
(2-14)例數較少(2-15)頻數表資料第37頁/共50頁例2-11甲組5名同齡男孩的身高值(cm)
XX2908100959025100100001051102511012100
標準差的計算第38頁/共50頁表2-1101名正常女子血清膽固醇值組段(X)
頻數(f)fXfx22.30~2.4512.456.002.60~2.7538.2522.692.90~3.05618.3055.823.20~3.358…
….3.50~3.65173.80~3.95204.10~4.25174.40~4.55124.70~4.8595.00~5.1555.30~5.4525.6~5.751409.751705.09
合計101第39頁/共50頁統計描述:某地101名正常女子血清膽固醇值平均為4.06(mmol/L),標準差為0.654
(mmol/L)第40頁/共50頁例2-10三組同齡男孩的身高值(cm)
RS甲組9095100105110100207.91乙組969810010210410083.16丙組969910010110410082.92標準差的意義:
反映一組變量值變異程度,組間單位相同時,S越小,表示數據的變異程度越小。第41頁/共50頁四、變異系數(CV)應用:1.組間單位不同時變異程度的比較。
2.比較組單位相同,但均數相差懸殊的組間變異程度.意義:CV越大,表示數據變異越大。常用于衡量方法、儀器的精密度。公式:(2-16)第42頁/共50頁1.單位不同時組間變異程度的比較。
某地7歲年齡組男童身高與體重
指標SCV(%)身高(cm)123.104.713.83體重(kg)22.292.2610.14結論:7歲年齡組男童身高與體重值指標比較,體重指標的變異大于身高指標。第43頁/共50頁
某地不同年齡組男童身高(cm)年齡組SCV%1-2月56.32.13.735-6月66.52.23.313-3.5歲96.13.13.225-5.5歲107.83.33.06結論:隨著年齡增加,身高的變異變小。2.比較組單位相同,但均數相差懸殊的組間變異程度比較第44頁/共50頁計量數據的統計描述小結
1.在醫學雜志中正態或近似正態的資料,常以的形式表達,描述和比較數據的平均水平和離散程度。
兩組患者年齡(歲)的比較組別n范圍值試
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 鐵路旅客運輸服務普速列車服務備品規范課件
- 鐵路旅客運輸服務鐵路服務人員心理課件
- 2025年海南省海口市瓊山區中考物理一模自編綜合練習(一)(含解析)
- 數字選擇性DSC通信業務三GMDSS綜合業務課件
- 鐵路工程安全技術石家莊鐵路49課件
- 廣東室內植物墻施工方案
- 中國人的課件
- 咖啡店經營承包合同
- 個案護理痛風課件
- 產品購銷合同范本示例
- 基于PLC的自動生產線控制系統的設計畢業論文
- 17J008擋土墻(重力式、衡重式、懸臂式)圖示圖集
- 配電室運行維護投標方案(技術標)
- 關于完善和落實罪犯互監制度的思考
- JJF 1211-2008 激光粒度分析儀校準規范-(高清現行)
- YAV USB 8Multi多功能采集卡技術手冊USB6432
- 食堂改造與裝修設計方案
- 關于公司企業進行人員總量控制的實施方案
- 物流運輸托運單模板
- 油田結垢機理及防治技術
- 蘇教版五年級數學下冊第三單元測試題及答案一
評論
0/150
提交評論