計量資料的統計描述(2.18)_第1頁
計量資料的統計描述(2.18)_第2頁
計量資料的統計描述(2.18)_第3頁
計量資料的統計描述(2.18)_第4頁
計量資料的統計描述(2.18)_第5頁
已閱讀5頁,還剩43頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

(計量資料)

email

統計描述

DescriptiveStatistics

162名健康男性血清總膽固醇(mmol/L)5.534.345.603.554.133.934.204.354.314.815.804.084.904.923.946.344.894.163.054.504.483.624.523.974.114.375.264.982.725.393.753.704.943.906.104.564.394.093.764.824.694.024.543.785.334.444.534.503.794.284.534.555.204.495.574.214.884.444.964.704.574.454.333.534.844.103.845.114.455.654.475.014.214.563.894.734.865.104.675.403.224.983.524.113.823.595.024.665.235.054.234.684.905.004.752.964.744.354.714.855.254.255.144.293.394.723.435.085.174.965.214.276.124.915.434.934.874.464.264.764.694.795.224.614.784.244.514.714.563.864.455.294.504.724.004.544.205.305.185.734.974.665.494.375.344.683.664.385.414.535.074.784.694.715.035.375.685.835.934.626.015.77計量資料的統計描述頻數表與頻數分布描述幾種趨勢的指標

算術均數、幾何均數、中位數、眾數描述變異程度的指標極差、百分位數與四分位間距、方差、標準差、變異系數

頻數

(frequency)

某個測量值的個(例)數。

頻數分布表(frequencydistributiontable):

又稱頻數表。是將原始數據值適當分組后得到各組的頻數,

用于描述資料的分布特征,適用樣本量較大的資料進行統計描述的常用方法。通過頻數表可以顯示數據分布的范圍與形態。一、頻數與頻數分布

離散型定量變量的頻數分布

例1998年某山區96名孕婦產前檢查次數資料如下:0,3,2,0,1,5,6,3,2,4,1,0,6,5,1,3,3,…,4,7等共96個數值.96名婦女產前檢查次數分布的頻數分布表表

1998年某地96名婦女產前檢查次數分布檢查次數頻數頻率(%)累計人數累計頻率(%)(1)(2)(3)(4)(5)044.244.2177.31111.521111.52222.931313.53536.542627.16163.552324.08487.5>51212.596100.0合計96100

連續型定量變量的頻數分布

抽樣調查某地120名18歲~35歲健康男性居民血清鐵含量(μmol/L),將數據適當分組,計數每組的頻數,根據這些數據編制成的頻數分布表,則能顯示出這組數據分布的特點。160名正常成年女子的血清甘油三酯(mmol/L)

編號血清甘油三脂編號血清甘油三脂10.51……20.521531.6530.591541.6640.611551.6750.611561.6760.621571.6970.631581.780.641591.71……1601.77手工編制表步驟。(1)計算全距(range,R),也稱為極

R=最大值-最小值本例極差:R=1.77-0.51=1.26(mmol/L)(2)確定組段數與組距:組段數一般可在10~15之間選擇組距參考極差的十分之一,再略加調整。本例i=R/10=1.26/10=0.126≈0.1。(3)列表做出表格,將選好的組段順序地列在(1)列。按照“下限≤x<上限”的原則確定每一例數據x應歸屬的組段。(4)列出組段:第一組段的下限略小于最小值,最后一個組段上限必須包含最大值,其它組段上限值忽略。(5)劃記計數:用劃記法將所有數據歸納到各組段,得到各組段的頻數。

組段(1)

劃記(2)

頻數,f(3)

組中值,X(4)fX(5)=(3)×(4)0.5~

30.551.650.6~正90.655.850.7~正正120.759.000.8~正正130.8511.050.9~正正正170.9516.151.0~正正正181.0518.901.1~正正正正201.1523.001.2~正正正181.2522.501.3~正正正171.3522.951.4~正正131.4518.851.5~正91.5512.401.6~正81.6514.851.7~1.8

合計

31.755.25160182.30頻數分布圖:在表的基礎上,可以繪制出圖稱為直方圖(頻率直方圖)。

橫軸:血清甘油三酯

縱軸:頻率密度,即頻率/組距(直條面積等于相應組段的頻率)。在組距相等時,直方圖中矩形直條的高度與相應組段的頻率成正比。對稱分布:頻數最多的組段在中央,正偏峰分布:峰向左側偏移的分布,右側的組段數多于左側,為右偏峰分布。負偏峰分布:峰向右側偏移的分布,左側的組段數多于右側,稱為左偏峰分布。正態分布與偏態分布1.頻數表——正態分布normaldistribution

2.頻數表——右偏態(skewedtotheright),也稱正偏態(positiveskewed)

3.頻數表——左偏態(skewedtotheleft),也稱負偏態(negativeskewed)正態分布:中間高、兩邊低、左右對稱正偏態分布:長尾向右延伸負偏態分布:長尾向左延伸頻數分布①集中趨勢(centraltendency):變量值集中位置。——平均水平指標②離散趨勢(tendency

of

dispersion):變量值圍繞集中位置的分布情況。離“中心”位置越遠,頻數越小;且圍繞“中心”左右對稱。——變異水平指標

頻數表的用途1.揭示頻數分布的類型和特征;分布類型:對稱分布(正態)偏態分布分布特征:中心位置分布范圍對稱性變動趨勢2.便于進一步計算指標和分析處理;3.發現某些特大特小的可疑值;

4.進行正態性判定等集中趨勢指標

總稱為平均數(average)反映了資料的集中趨勢(centraltendency

)。

常用的有:

1.算術均數(arithmeticmean),簡稱均數

(mean)

2.幾何均數(geometricmean)

3.中位數

(median)

4.眾數(mode)1.均數(mean)Σ為求和符號,讀成sigma適用條件:資料呈正態或近似正態。

組段(1)

劃記(2)

頻數,f(3)

組中值,X(4)fX(5)=(3)×(4)0.5~

30.551.650.6~正90.655.850.7~正正120.759.000.8~正正130.8511.050.9~正正正170.9516.151.0~正正正181.0518.901.1~正正正正201.1523.001.2~正正正181.2522.501.3~正正正171.3522.951.4~正正131.4518.851.5~正91.5513.951.6~正81.6513.201.7~1.8

合計

31.755.25160182.30例:均數=182.3/160=1.142.幾何均數(geometricmean)幾何均數:變量對數值的算術均數的反對數。

幾何均數的適用條件與實例適用條件:呈倍數關系的等比資料或對數正態分布(正偏態)資料;如抗體滴度資料

例:血清的抗體效價滴度的倒數分別為:10、100、1000、10000、100000,求幾何均數。此例的算術均數為22222,顯然不能代表滴度的平均水平。同一資料,幾何均數<均數頻數表資料的幾何均數抗體滴度⑴

人數,f⑵

滴度倒數,X⑶lgX⑷

f·lgX⑸1:2.5

1:101:401:1601:640

合計141822126722.510.040.0160.0640.00.39791.00001.60212.20412.80625.570618.000035.246226.449216.8372102.1032例:幾何均數=反對數(102.1/72)=26.193.中位數(median)

中位數是將一批數據從小至大排列后位次居中的數據值,符號為Md,反映一批觀察值在位次上的平均水平。

適用條件:適合各種類型的資料。尤其適合于①大樣本偏態分布的資料;②資料有不確定數值;③資料分布不明等。

中位數計算公式與實例

先將觀察值按從小到大順序排列,再按以下公式計算:特點:僅僅利用了中間的1~2個數據例:9名病人潛伏期:2,3,3,3,4,5,6,9,16頻數表資料的中位數下限值L上限值Ui;fm中位數Md

組段(1)

劃記(2)

頻數,f(3)

累計頻數Sf(4)累計百分率0.5~

331.9(0~1.9)0.6~正9127.5(1.9~7.5)0.7~正正122415.0(7.5~15.0)0.8~正正133723.1(15.2~23.1)0.9~正正正175433.8(23.1~33.8)1.0~正正正187245.0(33.8~45.0)1.1~正正正正209257.5(45.0~57.5)1.2~正正正1811068.8(57.5~68.8)1.3~正正正1712779.4(68.8~79.4)1.4~正正1314087.5(79.4~87.5)1.5~正914993.1(87.5~93.1)1.6~正815798.1(93.1~98.1)1.7~1.8

合計

3160100.0(98.1~100)160中位數=1.1+0.1x[(160x50%-72)/20]

=1.14微克/毫升4.眾數(mode)

出現次數(或頻數)最多的觀察值;在頻數分布圖中對應于高峰所在位置的觀察值。適用于大樣本;較粗糙。從分布的角度看,眾數是具有明顯集中趨勢點的數值,一組數據分布的最高峰點所對應的變量值即為眾數。如果數據的分布沒有明顯的集中趨勢或最高峰點,眾數也可以不存在;如果有多個高峰點,也就有多個眾數特點:1.集中趨勢的測度值之一;2.出現次數最多的變量值;3.不受極端值的影響;4.可能沒有眾數或有幾個眾數;5.適用于定類數據、定序數據、定距數據和定比數據。眾數的不唯一性:無眾數原始數據:10591268一個眾數原始數據:659855多于一個眾數原始數據:252828364242均數、中位數、眾數三者關系正態分布時:均數=中位數=眾數右偏態分布時:均數>中位數>眾數左偏態分布時:均數<中位數<眾數三、變異(variation)指標

反映數據的離散度(Dispersion

)。即個體觀察值的變異程度。常用的指標有:

1.極差(Range)

(全距)

2.百分位數與四分位數間距

PercentileandQuartilerange

3.方差

Variance

4.標準差StandardDeviation

5.變異系數

CoefficientofVariation

盤編號甲乙丙14404804902460490495350050050045405105055560520510合計250025002500均數500500500

例:設甲、乙、丙三人,采每人的耳垂血,然后紅細胞計數,每人數5個計數盤,得結果如下(萬/mm3)甲乙丙1.極差(Range)(全距)優點:簡便缺點:1.只利用了兩個極端值

2.n大,R也會大

3.不穩定12040202.百分位數與四分位數間距

Percentileandquartilerange百分位數:數據從小到大排列;在百分尺度下,所占百分比對應的值。記為Px。四分位間距:QR=P75-P25四分位半間距quartiledeviation:QD=QR/2P100(max)P75P50(中位數)P25P0(min)Px頻數表資料的百分位數下限值L上限值Ui;fm百分位數Px

組段(1)

劃記(2)

頻數,f(3)

累計頻數Sf(4)累計百分率0.5~

331.9(0~1.9)0.6~正9127.5(1.9~7.5)0.7~正正122415.0(7.5~15.0)0.8~正正133723.1(15.2~23.1)0.9~正正正175433.8(23.1~33.8)1.0~正正正187245.0(33.8~45.0)1.1~正正正正209257.5(45.0~57.5)1.2~正正正1811068.8(57.5~68.8)1.3~正正正1712779.4(68.8~79.4)1.4~正正1314087.5(79.4~87.5)1.5~正914993.1(87.5~93.1)1.6~正815798.1(93.1~98.1)1.7~1.8

合計

3160100.0(98.1~100)160P25=0.9+0.1x[(160x25%-37)/17]=0.92P75=1.3+0.1x[(160x75%-110)/17]=1.36QR=1.36-0.92=0.44;QD=0.22百分位數的應用確定醫學參考值范圍(referencerange):如95%參考值范圍=P97.5-P2.5;表示有95%正常個體的測量值在此范圍。中位數Md與四分位半間距QD一起使用,描述偏態分布資料的特征3.方差

方差(variance)也稱均方差(meansquaredeviation),樣本觀察值的離均差平方和的均值。表示一組數據的平均離散情況。樣本方差為什么要除以(n-1)小樣本分母為n-1,稱為自由度。4.標準差

標準差(standarddeviation)即方差的正平方根;其單位與原變量X的單位相同。標準差的計算盤編號甲乙丙甲2乙2丙214404804901936002304002401002460490495211600240100245025350050050025000025000025000045405105052916002601002550255560520510313600270400260100合計250025002500標準差50.9915.817.91()155/25001222甲的標準差--=--=??nnXX

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論