




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第二章
計量資料的描述統計分析統計描述:
是用統計圖(表)、統計指標來描述資料的分布規律及其數量特征。統計推斷:
在醫學科學研究中通常應用抽樣研究的方法,即對總體中隨機抽取的部分觀察單位(樣本)進行研究,然后用樣本信息推斷總體特征,即統計推斷。教學要求:掌握:計量資料集中趨勢、離散趨勢統計描述的指標及其適用條件。熟悉:頻數分布表與頻數分布圖的編制方法及用途;百分位數的計算方法及應用。了解:頻數分布的類型(對稱分布、正態分布、正偏態與負偏態)及其形態。計量資料的統計描述
計量資料的頻數表集中趨勢的統計描述離散程度的統計描述頻數與頻數分布頻數:某個測量值的個(例)數。頻數分布表(frequencydistributiontable):
又稱頻數表。是對樣本量較大的資料進行統計描述的常用方法。是同時列出觀察指標的可能取值區間及其在各區間內出現的頻數。其作用是為了了解一組同質觀察值的分布規律。例:抽樣調查某地140名正常成年男子的紅細胞數(×1012/L),結果如下4.765.265.615.954.464.574.315.184.924.274.774.885.004.734.475.344.704.814.935.044.405.274.635.505.244.974.714.444.945.054.784.524.635.515.244.984.334.834.565.444.794.914.264.284.874.995.604.464.955.074.805.304.654.774.505.375.495.224.585.074.814.543.824.014.894.625.124.854.595.084.824.935.054.404.145.014.375.244.604.714.824.945.054.794.524.644.374.874.604.724.835.334.684.804.154.654.764.884.613.974.084.584.314.054.165.045.154.504.624.734.474.584.704.814.554.284.784.514.634.364.484.595.095.205.325.054.414.524.644.754.494.224.715.214.944.685.174.915.024.767頻數表的編制:
找全距全距(極差)=最大值-最小值。常用全距的1/10取整作為組距,等距全距為2.13,其1/10為0.213,取整為0.2。本例取0.2為組距。8頻數表的編制:
找全距全距(極差)=最大值-最小值。定組距常用全距的1/10取整作為組距,等距最大值為5.95,最小值為3.82,全距=5.95-3.82=2.13(mmol/L)9頻數表的編制:
找全距全距(極差)=最大值-最小值。定組距常用全距的1/10取整作為組距,等距寫組段每個組段的起點稱組下限,終點稱組上限。第1組段包括最小值,最后1組包括最大值。組段寫為上限開口型,最末一組段同時寫出其下限和上限。第1組段下限值取小于最小值的方便數,本例最小值為3.82,取3.80作為第1組段的下限值,則各組段分別為3.80~,4.00~,4.20~,…
余此類推。本例最大值為5.95,最后1個組段寫為5.80~6.00。10頻數表的編制:
找全距全距(極差)=最大值-最小值。定組距常用全距的1/10取整作為組距,等距寫組段每個組段的起點稱組下限,終點稱組上限。第1組段包括最小值,最后1組包括最大值。組段寫為上限開口型,最末一組段同時寫出其下限和上限。列表劃記將原始數據采用劃記法或計算機匯總,得到各個組段的觀察單位數(頻數),列成頻數表。紅細胞數(×1012/L)頻數頻率(%)累積頻率(%)3.80~
21.41.44.00~
64.35.74.20~
117.913.64.40~
2517.931.54.60~
3222.954.44.80~
2719.373.75.00~
1712.185.85.20~
139.395.15.40~
42.998.05.60~
21.499.45.80~
6.0010.7100.0合計140-100.0表2-2某地140名正常成年男子紅細胞數的頻數表
圖2-1140名正常男子紅細胞計數的直方圖繪制直方圖(Histogram)
直觀、形象地表示頻數分布的形態和特征。頻數分布的特征集中趨勢:一組數據向某一個位置聚集或集中的傾向離散趨勢:一組數據的分散性或變異度分布類型:對稱分布:集中位置在正中,左右兩側頻數分布大致對稱。偏態分布:指頻數分布不對稱,集中位置偏向一側。若集中位置偏向數值小的一側,稱為正偏態分布;集中位置偏向數值大的一側,稱為負偏態分布。年齡(歲)某市某年乙腦患者的年齡分布
正態與偏態分布曲線正態分布正偏態分布負偏態分布頻數表的用途作為陳述資料的形式,便于進一步計算指標和統計處理揭示資料的分布特征和分布類型便于發現某些特大或特小的可疑值n比較大時,可用各組段的頻率作為概率的估計值
集中趨勢的統計描述指標平均數(average)是描述一組同質觀察值的平均水平或中心位置的指標體系。包括均數、幾何均數、中位數、眾數、調和均數等,以前三種常用。意義:反映一組同質變量值的平均水平或分布的集中位置。作為一組資料的代表值,便于組間的分析比較。均數(mean)適用條件:對稱分布,特別是正態或近似正態分布的計量資料。符號:表示樣本均數,希臘字母表示總體均數。計算方法:直接法:加權法(weightingmethod):例:測得8只正常大鼠血清總酸性磷酸酶(TACP)含量(U/L)為4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。試求其算術均數。例:計算140名正常成年男子的紅細胞數(×1012/L)的平均值。表2-3加權法計算均數組段(1)f(2)組中值(X)(3)3.80~23.904.00~64.104.20~114.304.40~254.504.60~324.704.80~274.905.00~175.105.20~135.305.40~45.505.60~25.705.80~6.0015.90合計140---組中值=(上限+下限)/24.90=(4.80+5.00)/2表2-3加權法計算均數組段(1)f(2)組中值(X)(3)fiXi3.80~23.907.804.00~64.1024.604.20~114.3047.304.40~254.50112.504.60~324.70150.404.80~274.90132.305.00~175.1086.705.20~135.3068.905.40~45.5022.005.60~25.7011.405.80~6.0015.905.90合計140---669.80幾何均數(geometricmean,G)適用條件:某些呈正偏態分布,但數據經過對數變換后呈正態分布的資料,也可用于觀察值之間呈倍數或近似倍數變化(等比關系)的資料。符號:用G表示計算方法:直接法:或加權法(weightingmethod):例2.2測得10個人的血清滴度的倒數分別為2,2,4,4,8,8,8,8,32,32,求平均滴度。直接法胎盤浸液鉤端螺旋體菌苗接種兩個月后血清IgG抗體滴度IgG滴度倒數人數f201640578076160753205464025128023加權法lgX1.30101.60201.90312.20412.50512.80623.10722.7093-flgX20.816091.3140144.6356165.3075135.275470.155071.4656
合計326698.9691幾何均數注意事項1.幾何均數常用于等比級資料或對數正態分布資料。2.觀察值中若有0,則不宜直接使用幾何均數。3.觀察值一般不能同時有正值和負值。若全是負值,計算時可先將負號去掉,得出結果后再加上負號。中位數(median,M)是將一組觀察值從小到大按順序排列,位次居中的觀察值。適用條件:偏態分布資料以及頻數分布的一端或兩端無確切數據資料
;未知分布類型的資料符號:P50
或M計算方法:直接法:n為奇數時:n為偶數時:頻數表法(weightingmethod):例:某病患者9人發病潛伏期為2,3,3,3,4,5,6,9,16天,求中位數。若在第20天又發現1例患者,則其中位數為:例2.4對某地630名50~60歲的正常女性檢查了血清甘油三酯的含量(mmol/L),資料如表2-4,試計算其中位數。表2-4某地630名正常女性血清甘油三脂含量(mmol/L)甘油三脂頻數累積頻數累積頻率(%)0.10~27274.30.40~16919631.10.70~16736357.61.00~9445772.51.30~8153885.41.60~4258092.11.90~2860896.52.20~1462298.72.50~462699.42.80~362999.83.10~1630100.0頻數表法不是由全部觀察值計算出來的,因此不受特大值、特小值的影響,故適用于描述偏態資料的集中位置。只受居中觀察值波動的影響,因而不敏感。理論上,正態分布資料的均數等于中位數,對數正態分布的幾何均數等于中位數。但用中位數代替均數、幾何均數會減低靈敏度,且進一步統計處理的方法較少,應盡量使用均數和幾何均數。中位數的特點百分位數(percentile
)把一組數據從小到大排列,分成100等份,各等份含1%的觀察值,分割界限上的值就是百分位數,用PX表示。它是一種位置指標。計算方法頻數表法:試利用表2-4的頻數表求例2.4中血清甘油三酯含量的P25,P75,P90。甘油三脂頻數累積頻數累積頻率(%)0.10~27274.30.40~16919631.10.70~16736357.61.00~9445772.51.30~8153885.41.60~4258092.11.90~2860896.52.20~1462298.72.50~462699.42.80~362999.83.10~1630100.0甘油三脂頻數累積頻數累積頻率(%)0.10~27274.30.40~16919631.10.70~16736357.61.00~9445772.51.30~8153885.41.60~4258092.11.90~2860896.52.20~1462298.72.50~462699.42.80~362999.83.10~1630100.0試利用表2-4的頻數表求例2.4中血清甘油三酯含量的P25,P75,P90。甘油三脂頻數累積頻數累積頻率(%)0.10~27274.30.40~16919631.10.70~16736357.61.00~9445772.51.30~8153885.41.60~4258092.11.90~2860896.52.20~1462298.72.50~462699.42.80~362999.83.10~1630100.0試利用表2-4的頻數表求例2.4中血清甘油三酯含量的P25,P75,P90。百分位數應用用于描述樣本或總體觀察值序列在某百分位位置的水平。用于確定醫學參考值范圍。分布中部的百分位數穩定,具有較好的代表性;當樣本例數不多時,不宜取太近兩端的百分位數。離散趨勢的統計描述
例試觀察三組數據的離散狀況。
A組:26,28,30,32,34;
B組:24,27,30,33,36;
C組:26,29,30,31,34。離散程度指標反映一組同質觀察值的變異度常用的指標有全距、四分位數間距、方差、標準差和變異系數衡量變異程度的指標全距(range,簡記為R)概念:亦稱極差,是一組同質觀察值中最大值與最小值之差。它反映了個體差異的范圍,全距大,說明變異度大;反之,全距小,說明變異度小。計算:適用條件:常用于描述單峰對稱分布小樣本資料的變異程度或用于初步了解資料的變異程度。不足之處:只考慮最大值與最小值之差異,不能反映組內其它觀察值的變異度;樣本含量越大,抽到較大或較小觀察值的可能性越大,則全距可能越大,因此樣本含量懸殊時不宜用全距比較資料的變異程度。
優點:計算簡單,理論上可用于各種分布資料四分位數間距(quartilerange,Q)
四分位數:
P25、
P50、P753個點將全部觀察值分為四個部分,處于分位點上的數值即為四分位數Q=QU-QL=P75-P25
其間包括了一組觀察值的一半,故四分位數間距可看成是中間50%觀察值的極差。其數值越大,變異度越大;反之,變異度越小。與中位數一起描述偏態分布資料的分布特征。應用條件常用于描述偏態分布資料、兩端無確切值或分布不明確資料的離散程度。優缺點:四分位數間距較全距穩定,但仍未考慮全部觀察值的變異度。120名正常成年男子血清鐵含量(μmol/L)頻數表組段(1)頻數(2)頻率(%)(3)累計頻數(4)累計頻率(%)(5)6~10.8310.838~32.5043.3310~65.00108.3312~86.671815.0014~1210.003025.0016~2016.675041.6718~2722.507764.1720~1815.009579.1722~1210.0010789.1724~86.6711595.8326~43.3311999.1728~3010.83120100.00合計120100
-
-120名正常成年男子血清鐵含量(μmol/L)頻數表組段(1)頻數(2)頻率(%)(3)累計頻數(4)累計頻率(%)(5)6~10.8310.838~32.5043.3310~65.00108.3312~86.671815.0014~1210.003025.0016~2016.675041.6718~2722.507764.1720~1815.009579.1722~1210.0010789.1724~86.6711595.8326~43.3311999.1728~3010.83120100.00合計120100
-
-Q=QU-QL=21.44-16=5.44(μmol/L)方差(variance):,S2全面考慮每個觀察值的變異情況,克服全距和四分位數間距的缺點自由度(degreeoffreedom)隨機變量能夠自由取值的個數符號為,讀作niu。如n=4的樣本受到的條件限制,可自由取值的數字只有3個。
適用條件:對稱分布,特別是正態分布或近似正態分布資料。
意義:方差越大,數據間的變異越大計算:例:計算三組數據的方差
A組:26,28,30,32,34;
B組:24,27,30,33,36;
C組:26,29,30,31,34。優點:利用了每個數據的信息不足:度量衡單位發生了改變標準差(standarddeviation)將方差開方,恢復成原度量單位,得總體標準差和樣本標準差S
應用條件、意義同方差計算:直接法:加權法:例分別計算前例中三
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于人工智能的2025年智慧交通流量預測技術發展動態報告
- 建筑施工安全監測方法試題及答案
- 城市交通擁堵治理2025年公交優先戰略的實施效果分析報告
- 匯和銀行筆試題庫及答案
- 黃巖區面試真題及答案
- 黃河委面試真題及答案
- 安全工程師考試常識題目試題及答案
- 工業互聯網背景下量子通信技術2025年應用前景分析報告
- 物理學中的混沌現象研究試題及答案
- 智能建筑系統集成與節能降耗在體育場館中的應用效果研究報告
- 廣東省珠海市2024-2025學年高二下學期期中教學質量檢測英語試題(原卷版+解析版)
- 北京2025年中國環境監測總站招聘(第二批)筆試歷年參考題庫附帶答案詳解
- 美國加征關稅從多個角度全方位解讀關稅課件
- “皖南八校”2024-2025學年高一第二學期期中考試-英語(譯林版)及答案
- 2025-2030中國安宮牛黃丸行業市場現狀分析及競爭格局與投資發展研究報告
- 防洪防汛安全教育知識培訓
- 安寧療護人文關懷護理課件
- 2025年廣東廣州中物儲國際貨運代理有限公司招聘筆試參考題庫附帶答案詳解
- 商場物業人員缺失的補充措施
- 黑龍江省齊齊哈爾市龍江縣部分學校聯考2023-2024學年八年級下學期期中考試物理試題【含答案、解析】
- 《尋常型銀屑病中西醫結合診療指南》
評論
0/150
提交評論