(2)-2.定量資料描述_第1頁
(2)-2.定量資料描述_第2頁
(2)-2.定量資料描述_第3頁
(2)-2.定量資料描述_第4頁
(2)-2.定量資料描述_第5頁
已閱讀5頁,還剩31頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

定量數據的統計描述主要內容頻數分布統計指標123總結21.頻數分布3頻數表、直方圖頻數分布表的用途4現狀:原始數據(rawdata)往往是龐大的、混亂的;原因:由于個體變異的存在,各個體上的觀察結果不是恒定不變的;特點:表面上雜亂無章,但分布(distribution)有一定規律!解決:頻數分布表,頻數分布圖(直方圖)。頻數分布54.765.265.615.954.465.574.315.184.924.274.774.885.004.734.475.344.704.814.935.044.405.274.635.505.244.974.714.444.945.054.784.524.635.515.244.984.334.834.565.444.794.914.264.384.874.995.64.464.955.074.805.304.654.774.505.375.495.224.585.074.814.543.824.014.894.625.124.854.595.084.824.935.054.404.145.014.375.244.604.714.824.945.054.794.524.644.374.874.604.724.835.334.684.804.154.654.764.884.613.974.084.584.314.054.165.045.154.504.624.734.474.584.704.814.554.284.784.514.634.364.484.595.095.205.325.054.414.524.644.754.494.224.715.214.944.685.174.915.024.76例140名正常成年男性紅細胞計數(×1012/L),

結果如下6Range=5.95-3.82=2.13分10組,組距=Range/10=2.13/10=0.213,組距取?下界?

,上界?紅細胞計數(×1012/L)組中值頻數累積頻數頻率(%)累積頻率(%)3.8~3.9221.431.434.0~4.1684.295.714.2~4.311197.8613.574.4~4.5254417.8631.434.6~4.7327622.8654.294.8~4.93710319.2973.575.0~5.11712012.1485.715.2~5.3131339.2995.005.4~5.541372.8697.865.6~5.721391.4399.295.8~5.911400.71100.00

表140名正常成年男性紅細胞計數(×1012/L)的頻數表3.8~4.0~4.2~4.4~4.6~4.8~5.0~5.2~5.4~5.6~5.8~######################################################################################################################################################78圖140名正常成年男性紅細胞計數的直方圖頻數描述步驟確定組數(8~15組)確定組距(組距=全距/組數)確定界限(包含下限,不包含上限)確定頻數9頻數分布表的用途10可代替原始資料,便于進一步分析便于觀察數據分布類型便于發現遠離群體數值樣本量大,頻率接近概率

發汞含量(umol/kg)正偏態分布統計成績分布(分)負偏態分布2.統計指標11指標描述

集中趨勢:算術均數,幾何均數、中位數和百分位數

變異程度:極差、四分位數間距、方差、標準差,

變異系數集中趨勢的描述-平均數(1)算數均數(arithmeticmean,mean)12加權均數(weightedmean)

13集中趨勢的描述-平均數(2)幾何均數(geometricmean)

14集中趨勢的描述-平均數(3)幾何均數例測得10個人的血清滴度的倒數分別為2、2、4、4、8、8、8、8、32、3215因此10份血清滴度的平均水平為1:7中位數(median,M)

將一組數據按從小到大的順序排列,位置居中的數即是中位數。16“12348”的中位數是?“1234”的中位數是?集中趨勢的描述-平均數(4)M中位數例eg.1

7例正常人的舒張壓(mmHg)值:

7275767781828617eg.2

9例正常人的發汞值:

1.1,1.83.54.2

4.8

5.65.97.1>16

eg.310例正常人的發汞值:

1.1,1.83.54.24.85.65.97.110.5>16

M=77M=4.8M=(4.8+5.6)/2百分位數(percentile)X%

PX(100-X)%50%分位數是25%,75%分位數稱四分位數(quartile)

18中位數集中趨勢的描述-平均數(4)平均數應用的注意事項同質的資料計算平均數才有意義。算數均數適用于:單峰對稱分布的資料幾何均數適用于:對數變換后單峰對稱的資料中位數適用于:任何分布資料,有不確定值的資料有特大特小值的資料20平均數應用的注意事項21中位數、百分位數在樣本量較少時不穩定,越靠兩端越不穩定;中位數同時無法計算兩組合并中位數;中位數在抗極端值的影響方面,比算數均數或幾何均數穩定,但不如其精確,因此資料適合計算算數均數或幾何均數時,不宜用中位數表示其平均水平。一所學校要參加市內的籃球比賽,正式球員已經確定,體育老師還需要從兩名學生中挑選其中一名作為替補球員。為了選出替補球員,體育老師組織了5局比賽,這兩名學生的得分如下:人名第1次比賽第2次比賽第3次比賽第4次比賽第5次比賽中位數M王帥7889888張俊69961089變異程度的描述23甲組:2628303234乙組:2427303336丙組:2629303134離散程度的描述指標(1,2 )全距(range),極差

R=max-min四分位數間距(quartilerange)下四分位數即第25百分位數,常用QL表示;上四分位數即第75百分位數,常用QU表示。

24QLQUQ=

P75-P25離散程度的描述指標(2)方差(variance)

25標準差(standarddeviation,SD)

n-1:自由度(degreeoffreedom)

離均差平方和(sumofsquares)變異度比較甲組:2628303234乙組:2427303336丙組:2629303134

極差 方差 標準差甲組:8 10.0 3.16乙組:12 22.5 4.74丙組:8 8.5 2.9226變異程度的描述指標(3)變異系數(coefficientofvariation,CV)27身高與體重變異度比較28測得某地成年人舒張壓和收縮壓分別為

舒張壓:平均=77.5mmHg,標準差=10.7mmHg收縮壓:平均=122.9mmHg,標準差=17.1mmHg試比較舒張壓與收縮壓的變異程度?不同指標間變異度的比較29收縮壓的變異程度與舒張壓的變異程度幾乎沒有差別舒張壓:收縮壓:變異程度指標應用注意事項全距:反映資料的分布范圍,全距大說明數據的

變異度大,資料呈偏態分布結果不穩定;四分位間距:與全距相比不易受極端值影響,

未用到所有觀察值信息;方差/標準差:常用來描述正態分布資料變異程度;變異系數:

比較度量單位不同的兩組或多組資料變異度;

比較均數相差懸殊的兩組或多組資料的變異度。3031均數幾何均數中位數適用資料單峰對稱分布等比資料、對數正態分布各種分布、偏態分布、不確定值計算特點用到全部數據用到全部數據中間數據極端值的影響敏感敏感、不能同時有正負數不敏感集中趨勢的描述指標小結2.統計指標32極差四分位數間距方差、標準差變異系數適用資料任何分布用于偏態分布正態分布度量單位不同、均數相差懸殊計算特點用兩端數據用中間數據全部數據全部數據極端值的影響敏感不敏感敏感敏感離散程度的描述指標小結2.統計指標33每個觀察指標均有其特定的變異規律;描述變異:圖形描述頻數圖統計量描述平均數:算數均數、幾何均數、中位數變異度:標準差(方差)、四分位數間距、變異系數、極差不

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論