




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、2022-5-81衛生統計學衛生統計學第二章第二章 定量資料的統計描述定量資料的統計描述2022-5-82 n 把握資料的基本特征把握資料的基本特征n 為統計分析打下基礎為統計分析打下基礎統計表統計表描述性統計量描述性統計量統計圖統計圖統計描述統計描述 -從資料中獲取信息最基本的方法從資料中獲取信息最基本的方法2022-5-83第一節第一節 頻率分布表與頻率分布圖頻率分布表與頻率分布圖頻數分布表頻數分布表(frequency distribution table),),又稱頻數表又稱頻數表 一、一、 離散型定量變量的頻率分布離散型定量變量的頻率分布 例例2-1 1998年某山區年某山區96名孕
2、婦產前檢查次數資名孕婦產前檢查次數資料如下:料如下: 0,3,2,0,1,5,6,3,2,4,1,0,6,5,1,3,3,4,72022-5-842022-5-85直條圖(直條圖(bar chart)橫坐標:產前檢查次數;橫坐標:產前檢查次數;縱坐標:縱坐標:頻率頻率, 檢查檢查k次的婦女所占的比例(次的婦女所占的比例(%)等寬矩形長條:高度為檢查次數的頻率等寬矩形長條:高度為檢查次數的頻率圖2-1 某地96名婦女產前檢查次率分布0510152025300123455產前檢查次數頻率(%)2022-5-86二、連續型定量變量的頻率分布二、連續型定量變量的頻率分布例例2-2 抽樣調查某地抽樣調查
3、某地120名名1835歲健康男性居歲健康男性居民血清鐵含量(民血清鐵含量(mol/L),數據如下),數據如下:7.42 8.65 23.02 21.61 21.31 21.46 9.97 22.73 14.94 20.18 21.62 23.07 20.38 8.40 17.32 29.64 19.69 21.69 23.90 17.45 19.08 20.52 24.14 23.77 18.36 23.04 24.22 24.13 21.53 11.09 18.89 18.26 23.29 17.67 15.38 18.61 14.27 17.40 22.55 17.55 16.10 17.
4、98 20.13 21.00 14.56 19.89 19.82 17.48 14.89 18.37 19.50 17.08 18.12 26.02 11.34 13.81 10.25 15.94 15.83 18.54 24.52 19.26 26.13 16.99 18.89 18.46 20.87 17.51 13.12 11.75 17.40 21.36 17.14 13.77 12.50 20.40 20.30 19.38 23.11 12.67 23.02 24.36 25.61 19.53 14.77 14.37 24.75 12.73 17.25 19.09 16.79 17.
5、19 19.32 19.59 19.12 15.31 21.75 19.47 15.51 10.86 27.81 21.65 16.32 20.75 22.11 13.17 17.55 19.26 12.65 18.48 19.83 23.12 19.22 19.22 16.72 27.90 11.74 24.66 14.18 16.52 2022-5-87表表 2 -2 1 2 0 名名 正正 常常 成成 年年 男男 子子 血血 清清 鐵鐵 含含 量量 ( m o l/L )頻頻 數數 表表 組組 段段 頻頻 數數 頻頻 率率 累累 計計 頻頻 數數 累累 計計 頻頻 率率 (1 ) (2
6、) (3 ) (4 ) (5 ) 6 1 0 .8 3 1 0 .8 3 8 3 2 .5 0 4 3 .3 3 1 0 6 5 .0 0 1 0 8 .3 3 1 2 8 6 .6 7 1 8 1 5 .0 0 1 4 1 2 1 0 .0 0 3 0 2 5 .0 0 1 6 2 0 1 6 .6 7 5 0 4 1 .6 7 1 8 2 7 2 2 .5 0 7 7 6 4 .1 7 2 0 1 8 1 5 .0 0 9 5 7 9 .1 7 2 2 1 2 1 0 .0 0 1 0 7 8 9 .1 7 2 4 8 6 .6 7 1 1 5 9 5 .8 3 2 6 4 3 .3 3
7、1 1 9 9 9 .1 7 2 8 3 0 1 0 .8 3 1 2 0 1 0 0 .0 0 合合 計計 1 2 0 1 0 0 2022-5-88手工編制的步驟:(1) 找出找出 最小值最小值= 7.42最大值最大值= 29.64(2)計算全距()計算全距(range,R),又稱極差),又稱極差 R = 最大值最小值最大值最小值 = 29.64-7.42 = 22.22 (3)確定組段數與組距)確定組段數與組距 組段數一般在組段數一般在1015之間之間(本例擬取本例擬取10個組段個組段) 下限:組段的左端點下限:組段的左端點 上限:右端點上限:右端點 組距組距=R/(預計的組段數)(預計
8、的組段數)-以相等為宜以相等為宜 本例組距本例組距 22.22/10=2.22 (4)列表)列表2022-5-89直方圖(頻率直方圖)直方圖(頻率直方圖)橫軸:血清鐵含量橫軸:血清鐵含量縱軸:縱軸:頻率密度頻率密度 = = 頻率頻率/ /組距組距 面積面積 = 頻率頻率注:組距相等時,矩形直條的高度與相應組段注:組距相等時,矩形直條的高度與相應組段的頻率成正比。的頻率成正比。 2022-5-810 圖圖2-2 120例健康成年男子血清鐵含量分布例健康成年男子血清鐵含量分布 單峰、對稱單峰、對稱 - 對稱分布對稱分布0246810127911 13 15 17 19 21 23 25 27 29
9、血清鐵(mol/L)頻率密度( %)2022-5-8110.020.040.060.080.012345678發汞含量(mol/kg)頻率密度圖圖2-3 某地居民某地居民238人發汞含量(人發汞含量(mol/kg)分布)分布單峰,不對稱單峰,不對稱 - 偏峰分布偏峰分布正偏峰分布:峰偏向左側,數軸的正偏峰分布:峰偏向左側,數軸的正正向有尾向有尾負偏峰分布:峰偏向右側,數軸的負偏峰分布:峰偏向右側,數軸的負負向有尾向有尾2022-5-812第二節第二節 定量變量的統計指標定量變量的統計指標定量地描述集中趨勢與離散趨勢是統計描述的定量地描述集中趨勢與離散趨勢是統計描述的重要內容重要內容一、一、 描
10、述集中趨勢的統計指標描述集中趨勢的統計指標 對于連續型定量變量,描述集中趨勢常用的統對于連續型定量變量,描述集中趨勢常用的統計量為算術均數、幾何均數和中位數。計量為算術均數、幾何均數和中位數。2022-5-8131. 算術均數算術均數簡稱均數(簡稱均數(mean),適合描述對稱分布資料的集中),適合描述對稱分布資料的集中位置(也稱為平均水平)。其計算公式為位置(也稱為平均水平)。其計算公式為nXXXXn.21nXnXnXiinii1 n:樣本含量:樣本含量 X1,X2,Xn:觀察值:觀察值 或或 :觀察值之和:觀察值之和iiXX例例2-3 測得測得8只正常大鼠血清總酸性磷酸酶(只正常大鼠血清總
11、酸性磷酸酶(TACP)含)含量(量(U/L)為)為4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。試求其算術均數。試求其算術均數。 按式(按式(2-1),算術均數為),算術均數為 9075. 3)38. 342. 504. 426. 245. 308. 243. 620. 4(81X2022-5-814頻數表基礎上近似計算頻數表基礎上近似計算(樣本量較大時)(樣本量較大時)nfXffXX00組中值的加權平均組中值的加權平均 :組段的頻數:組段的頻數 :組段的中值:組段的中值 =(組段上限(組段上限+組段下限)組段下限)/2 f0X2022-5-815例例2-4
12、2-4 試應用加權法近似地計算例試應用加權法近似地計算例2-22-2資料的算資料的算術均數術均數 表表 2-3 加加權權法法計計算算均均數數 組組段段 組組中中值值(0X) f 0fX (1) (2) (3) (4)=(2)(3) 6 7 1 7 8 9 3 27 10 11 6 66 12 13 8 104 14 15 12 180 16 17 20 340 18 19 27 513 20 21 18 378 22 23 12 276 24 25 8 200 26 27 4 108 2830 29 1 29 合合計計 120 2228 2022-5-8162. 幾何均數(幾何均數(geome
13、tric mean,G) 適用于觀察值變化范圍跨越多個數量級的資料適用于觀察值變化范圍跨越多個數量級的資料頻數圖一般呈正偏峰分布頻數圖一般呈正偏峰分布nnXXXG.21)log(log1nXG例例2-5 7名慢性遷延性肝炎患者的名慢性遷延性肝炎患者的HBsAg滴度資料滴度資料為為1:16,1:32,1:32,1:64, 1:64,1:128,1:512。試。試計算其幾何均數。計算其幾何均數。6451212864643232167G)log(log1nXG.648062. 1lg7512lg128lg64lg64lg32lg32lg16lglg112022-5-817頻數表資料,可用加權法計算幾
14、何均數頻數表資料,可用加權法計算幾何均數 nXffXfG0101loglgloglog74705.1195206977.108lg1G2022-5-8183. 中位數(中位數(median,M) 可用于各種分布的定量資料可用于各種分布的定量資料 總體中有一半個體的數值低于這個數,一半個體的數總體中有一半個體的數值低于這個數,一半個體的數值高于這個數。值高于這個數。 基于樣本資料基于樣本資料 將將n例數據按升序排列,第例數據按升序排列,第i個數據記為個數據記為 n為奇數時為奇數時 n為偶數時為偶數時 例例2-7 某藥廠觀察某藥廠觀察9只小鼠口服高山紅景天醇提取物只小鼠口服高山紅景天醇提取物(RS
15、AE)后在乏氧條件下的生存時間(分鐘)如下:)后在乏氧條件下的生存時間(分鐘)如下:49.1,60.8,63.3,63.6,63.6,65.6,65.8,68.6,69.0。試求其中位數。試求其中位數。*iX*21nXM)(21*12*2nnXXM6 .63*5*21XXMn2022-5-819組組 段段 頻頻 數數 頻頻 率率 累累 計計 頻頻 數數 累累 計計 頻頻 率率 (1 ) (2 ) (3 ) (4 ) (5 ) 6 1 0 .8 3 1 0 .8 3 8 3 2 .5 0 4 3 .3 3 1 0 6 5 .0 0 1 0 8 .3 3 1 2 8 6 .6 7 1 8 1 5
16、.0 0 1 4 1 2 1 0 .0 0 3 0 2 5 .0 0 1 6 1 8 2 0 1 6 .6 7 5 0 4 1 .6 7 1 8 2 0 2 7 2 2 .5 0 7 7 6 4 .1 7 2 0 1 8 1 5 .0 0 9 5 7 9 .1 7 2 2 1 2 1 0 .0 0 1 0 7 8 9 .1 7 2 4 8 6 .6 7 1 1 5 9 5 .8 3 2 6 4 3 .3 3 1 1 9 9 9 .1 7 2 8 3 0 1 0 .8 3 1 2 0 1 0 0 .0 0 合合 計計 1 2 0 1 0 0 頻頻 率率 50Lf 60%50n 77ffL 區區
17、間間 18L ? ?1850P 20 iL 74. 0507750602%50?ffniL2022-5-820百分位數(百分位數(percentile)總體中總體中, , 數值小于它的個體恰有數值小于它的個體恰有X X %,大于它的,大于它的個個體恰有體恰有1- 1-X X %樣本估計:按照升序排列的數列里樣本估計:按照升序排列的數列里, 其左側(即其左側(即小于它)的個體數在整個樣本中所占百分比為小于它)的個體數在整個樣本中所占百分比為X%。XP2022-5-821頻頻率率 Lf %Xn ffL 區區間間 L ? ? LPX iL ffXniL%?ffXniLPLX%2022-5-8224.
18、 眾數(眾數(mode)總體中出現機會最高的數值。總體中出現機會最高的數值。樣本估計:在樣本中出現次數最多的數值。樣本估計:在樣本中出現次數最多的數值。例例2-1 1998年某山區年某山區96名孕婦產前檢查次數資料名孕婦產前檢查次數資料: 0,3,2,0,1,5,6,3,2,4,1,0,6,5,1,3,3,4,7 眾數為眾數為4(次)(次)2022-5-823二、描述離散趨勢的統計指標二、描述離散趨勢的統計指標同一總體中不同個體之間的離散趨勢又稱為變異同一總體中不同個體之間的離散趨勢又稱為變異(variation)。)。 例例2-11 試觀察三組數據的離散狀況。(均數都是試觀察三組數據的離散狀
19、況。(均數都是30)A組:組:26,28,30,32,34B組:組:24,27,30,33,36C組:組:26,29,30,31,34 2022-5-8241. 極差(極差(range,R)R = 最大值最小值最大值最小值計算簡便,但僅利用了兩個數據的信息計算簡便,但僅利用了兩個數據的信息一般,樣本量一般,樣本量n越大越大R也往往會越大也往往會越大, 不夠穩定不夠穩定 例例2-12 計算上述三組數據的極差計算上述三組數據的極差A組組 R=34-26=8B組組 R=36-24=12C組組 R=34-26=82022-5-8252. 四分位數間距(四分位數間距(quartile range,Q)
20、Q= P75-P25 P25與與P75之間恰好包含之間恰好包含50%的個體的個體四分位數間距四分位數間距Q是總體中數值居中的是總體中數值居中的50%個體散個體散布的范圍布的范圍Q越大意味著數據間變異越大越大意味著數據間變異越大2022-5-826組組 段段 頻頻 數數 頻頻 率率 累累 計計 頻頻 數數 累累 計計 頻頻 率率 (1 ) (2 ) (3 ) (4 ) (5 ) 6 1 0 .8 3 1 0 .8 3 8 3 2 .5 0 4 3 .3 3 1 0 6 5 .0 0 1 0 8 .3 3 1 2 8 6 .6 7 1 8 1 5 .0 0 1 4 1 2 1 0 .0 0 3 0
21、 2 5 .0 0 1 6 1 8 2 0 1 6 .6 7 5 0 4 1 .6 7 1 8 2 0 2 7 2 2 .5 0 7 7 6 4 .1 7 2 0 1 8 1 5 .0 0 9 5 7 9 .1 7 2 2 1 2 1 0 .0 0 1 0 7 8 9 .1 7 2 4 8 6 .6 7 1 1 5 9 5 .8 3 2 6 4 3 .3 3 1 1 9 9 9 .1 7 2 8 3 0 1 0 .8 3 1 2 0 1 0 0 .0 0 合合 計計 1 2 0 1 0 0 )/,(1615100120251221425LolP)/ ;(44.21771001207512220
22、75LmoP2022-5-8273.方差(方差(variance) 又稱均方差(又稱均方差(mean square deviation)NXNii122)(:總體均數:總體均數 N:總體中個體的總數:總體中個體的總數 分子:離均差平方和分子:離均差平方和方差越大意味著數據間變異越大方差越大意味著數據間變異越大樣本方差樣本方差: 或或 n-1稱為自由度(稱為自由度(degrees of freedom):): 總體方差總體方差:1)(122nXXSnii1/)(222nnXXS2022-5-8284. 標準差(標準差(standard deviation,S)標準差是方差的算術平方根。標準差是方差的算術平方根。標準差的量綱與原變量一致。標準差的量綱與原變量一致。標準差越大意味著個體間變異越大。標準差越大意味著個體間變異越大。標準差適合用來表達對稱分布的離散趨勢。標準差適合用來表達對稱分布的離散趨勢。2022-5-829例例2-14 分別計算例分別計算例2-11中三組數據的標準差。中三組數據的標準差。 按照公式(按照公式(2-11)與標準差的定義)與標準差的定義 A組組 B組組 C組組 C組數據的離散趨勢最小,組數據的離散趨勢最小,B組的最大組的最大16. 3155/15045402S74. 4155/15045902S91. 2155/15045342S
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030年中國紫背草數據監測研究報告
- 2025至2030年中國漂白浴巾數據監測研究報告
- 2025至2030年中國淋病(NGH)檢測試紙數據監測研究報告
- 2025至2030年中國油動機行程監控儀數據監測研究報告
- 2025至2030年中國明火金屬打火機數據監測研究報告
- 2025至2030年中國數字式屏幕亮度計數據監測研究報告
- 2025至2030年中國德式鉚螺母數據監測研究報告
- 2025至2030年中國套裝木工鑿數據監測研究報告
- 2025至2030年中國發光冰墊數據監測研究報告
- 2025至2030年中國雙溫度表數據監測研究報告
- 提升地方政府行政效能的對策研究
- 船舶防污染基礎知識培訓
- 第十一章 80年代臺港文學
- 餐廳小院策劃方案
- 部編人教版六年級下冊小學道德與法治全冊單元測試卷(含答案)
- 城鄉飲用水水質監測工作
- 心理團體輔導的保密協議
- 電梯安裝施工計劃書
- 弘揚傳統文化勤儉節約傳承美德課件
- 小小的自然觀察筆記
- 鋰電池組規格書范本
評論
0/150
提交評論