




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
定量資料的統計描述1編輯版ppt主要內容1、頻數分布表的編制和用途頻數分布的特征和類型2、集中趨勢指標均數、幾何均數、中位數3、離散趨勢指標極差、四分位數間距、方差、標準差、變異系數百分位數2編輯版ppt(一)、頻數分布表的編制
3編輯版ppt某地兒研所測得該地150名12歲健康男童體重(kg)原始數據如下,試編制頻數表。25.234.934.338.141.327.833.837.728.433.547.334.830.536.251.038.043.840.937.536.633.447.436.441.436.542.533.729.339.637.539.633.232.129.943.733.835.137.832.438.528.236.523.435.834.127.642.623.137.144.035.644.546.535.031.836.436.247.938.720.537.129.238.241.136.243.532.836.331.830.638.539.628.733.735.142.920.135.426.542.039.638.735.451.231.434.125.329.638.243.733.824.529.245.932.523.536.827.234.034.744.441.235.342.634.130.031.440.827.348.635.829.745.641.833.028.333.335.140.638.237.625.537.337.541.538.444.243.231.540.234.537.437.833.432.233.432.432.836.845.741.240.936.547.935.739.342.235.330.127.24編輯版ppt1.找出最大值和最小值,計算極差。最大值為51.2kg,最小值為20.1kg,極差R=51.2-20.1=31.1kg。極差(R)也叫全距,它是一組變量值中最大值與最小值之差。5編輯版ppt2.按極差大小決定組段數、組段和組距。
確定組段數:組段數的多少一般根據觀察單位的多少來確定,過多或過少均不能更好地反映資料的分布特征,以能夠反映頻數分布的特點為宜,一般分為8~15組,觀察單位少時可相對少些,觀察單位較多時組段數可酌情多些。本例初步確定為10個組。確定組距:相鄰組段下限值之差稱為組距,一般分組時取組距相等。組距=極差/組數,常取整數作組距,取整只是為了方便資料的整理匯總。本例組距=30.1/10=3.11≈3。6編輯版ppt劃分組段:各組段應有明確的界限,便于匯總,每個組段的起點稱“下限”,終點稱“上限”。第一組段必須包括最小值,一般取略小于最小值的整數作為第一組的下限,但是第一組的下限值不能等于最小值。各組段即不重疊,也不能留空隙,所以每一組段均為半開閉區間,后一組的下限就是前一組的上限。組段中的橫線~不能省略,它表示連續型資料。最后一個組段應該包括最大值,并且封口,但最后一個組段的上限不能等于最大值。7編輯版ppt本例最小值為20.1,故取20為第一組的下限。第二組下限即20+3=23,余類推。最后一個組段為50~53,包括最大值51.2。3.列表劃記,統計各組段頻數。4.計算頻率與累計頻率8編輯版ppt9編輯版ppt頻數分布的兩個特征體重雖有輕有重,但都向35~組段集中,數據大多數集中在32~38組段,共83人,占總人數的55%,這種趨勢稱為集中趨勢。另一方面,隨體重逐漸變大或變小,仍有小部分變量值存在,稱這種特征為離散趨勢,其變異程度是可以測定得。集中趨勢和離散趨勢是頻數分布的兩個重要特征,測定其集中趨勢和離散趨勢就可較全面地分析所研究的事物。10編輯版ppt頻數分布的類型
頻數分布分為對稱分布和偏態分布兩種類型。對稱分布是指集中位置在正中,左右兩側頻數分布大體對稱,如上表所示。若將其繪制成頻數分布直方圖,則更清楚。直方圖是以x(本例為體重)為橫坐標,頻數或百分數為縱坐標,用矩形面積大小表示頻數多少。11編輯版ppt
某地150名12歲男童體重頻數分布圖12編輯版ppt頻數分布的類型偏態分布指集中位置偏向一側,頻數分布不對稱。一些以兒童為主的傳染病,患者的年齡分布,集中位置偏于年齡小的一側,頻數尾部向右側延伸,稱為正偏態(峰)分布,如圖13編輯版ppt120例鏈球菌感染咽炎患者潛伏期分布圖(正偏峰分布)
14編輯版ppt一些慢性病患者的年齡分布,其集中位置偏向年齡大的一側,頻數尾部向左側延伸,稱為負偏態(峰)分布,如圖15編輯版ppt207例某惡性腫瘤患者年齡分布(負偏峰分布)
16編輯版ppt頻數表的用途
作為統計資料描述的一種表達方式,可以揭示資料分布類型與特征。便于計算統計指標和進一步分析處理。便于發現資料中遠離群體的某些特大或特小的可疑值,必要時經檢驗后舍去。正態性判斷的圖示法,為用正態近似法確定參考值范圍打基礎。17編輯版ppt(二)、集中趨勢指標
平均數是統計學中最重要、應用最廣泛的一個指標體系。用來描述一組變量的集中趨勢、中心位置或平均水平,常作為一組資料的代表值,使資料產生簡明概括的印象,又便于組間的比較。平均數的計算和應用必須具備同質基礎。常用的平均數有均數、幾何均數和中位數。18編輯版ppt1、均數(mean)均數是算術均數的簡稱,它反映了一組觀察值在數量上的平均水平。總體均數用希臘字母μ表示,樣本均數用表示。均數的計算均數的計算方法有直接法和加權法,計算機運算中多采用直接法。19編輯版ppt均數的計算直接法是將所有性質相同的觀察值x1,x2,x3…xn,直接相加再除以觀察值的個數n。例:10名12歲健康男童體重(kg)分別為39.6,33.2,32.1,29.9,43.7,33.8,35.1,37.8,32.4,38.5,求平均體重。20編輯版ppt均數的計算加權法當資料中相同觀察值較多時,可將相同觀察值的個數,即頻數f乘以該觀察值x,以代替相同觀察值逐個相加。對于頻數表資料,可用各組段的頻數為f,以相應的組中值為x,代入公式計算均數。從該公式中可以看出,某一變量值x的頻數越大,則該變量值對均數的影響越大,因此頻數也叫權數,這樣計算出來的均數又叫加權均數。權越大,該變量值對均數的影響也越大,故稱加權法。21編輯版ppt均數的計算22編輯版ppt均數的兩個重要特征
離均差的總和等于零,即各變量值與均數之差的代數和等于零。證明:各離均差的平方和小于各觀察值X與任何數a之差的平方(α≠)。23編輯版ppt均數的應用
用途:用來描述一組變量值的平均水平,具有代表性,因此變量值必須是同質的。應用條件:適用于呈對稱分布的資料,特別是正態分布或者近似正態分布的資料,因為這時均數位于分布的中心,最能反映分布的集中趨勢。24編輯版ppt2、幾何均數(geometricmean,G)有些醫學資料,如抗體的滴度、細菌計數、傳染病的潛伏期等,其頻數分布明顯偏態,各觀察值之間呈倍數變化,這時應該用幾何均數反映其平均增(減)倍數。幾何均數的計算直接法:是將n個觀察值x1,x2,x3…xn的乘積開n次方所得的根。加權法:25編輯版ppt幾何均數的應用用于等比級數資料和對數正態分布資料,如:某些傳染病的潛伏期、抗體滴度、細菌計數等。同一組資料的幾何均數小于算術均數。觀察值不能為0。因為0不能取對數,也不能與任何其它數呈對數關系。可以把所有的變量值均加上一個較小的常數,如加1。觀察值不能同時有正值和負值。若全是負值,計算是可把負號去掉,得出結果后再加上負號。26編輯版ppt3、中位數(M)和百分位數(P)中位數(median,M)是將一組觀察值從小到大按順序排列,位次居中的數值對應的觀察值就是中位數。因而全部觀察值中,大于和小于中位數的觀察值的個數相等。百分位數(percentile,P)是指把一組資料的全部觀測值分為兩部分,理論上講,有x%的觀測值比Px小,有(100-x)%的觀測值比Px大。中位數是特定的百分位數,即P50,它是表示一組資料集中位置的指標。27編輯版ppt直接法計算中位數
將原始觀察值按大小順序排列:n為奇數時,n為偶數時,例:臨床觀察7名某病患者,其潛伏期(天)分別為:2,3,3,5,6,9,16,求其平均潛伏天數。M=5臨床觀察8名某病患者,其潛伏期(天)分別為:2,3,3,5,6,9,16,20求其平均潛伏天數。M=(5+6)/2=5.528編輯版ppt頻數表法
M=P50Lx:第x百分位數所在組段的下限;fx:第x百分位數所在組段的頻數;ix:第x百分位數所在組段的組距;ΣfL:小于L各組段的累計頻數。29編輯版ppt中位數和百分位數的應用
中位數不是由全部觀察值的數量值綜合計算出來的,只受居中變量值波動的影響,不受兩端特小值和特大值的影響,僅僅反映了位次居中的觀察值的水平,因此中位數常用于描述偏態分布或末端無確定數據時資料的集中位置。百分位數用于描述樣本或總體觀察值序列在某百分位置水平,多個百分位數結合應用時,可更全面地描述總體或樣本的分布特征,可用來確定醫學參考值范圍。由于位于中部的百分位數比較穩定,所以最常用的百分位數是中位數,它有較好的代表性。30編輯版ppt(三)、離散程度指標三組同性別、同年齡兒童的體重(kg)如下,分析其集中趨勢與離散趨勢。甲組2628303234X甲=30kg乙組2427303336X乙=30kg丙組2629303134X丙=30kg哪一組數值的代表性好?31編輯版ppt離散趨勢即個體值之間的變異程度,數據越分散,變異程度越高。極差四分位數間距方差標準差變異系數32編輯版ppt1、極差(range,R)極差也叫全距,表示一組觀察值中最大值與最小值之差,反映個體差異的范圍。極差大,說明變異度大,各變量值離均數越遠,數據越分散;反之亦然。缺點:由于計算極差時只采用了最大值和最小值,未考慮組內其它數據的變異程度,因此用極差反映變異度不夠全面,穩定性也差;另外,當樣本例數增大時,得到較大或較小觀察值的機會可能會變大,所以極差也可能更大。33編輯版ppt2、四分位數間距(quartilerange,QR)QR=QU-QL=P75–P25四分位數間距包含一半的觀測值,其值越大,變異程度越大;其值越小,變異程度越小。優點:采用四分位數間距來反映一組資料的變異程度,比極差穩定。一般來說,樣本例數越多,四分位間距越穩定。實際工作中,常與中位數結合使用,描述偏態分布資料的分布特征。缺點:不能全面地反映所有觀察值的變異程度。34編輯版ppt極差R四分位數間距QR離均差(x-μ)離均差總和(x)=0離均差絕對值和|x|離均差平方和(x)2
均方(方差)σ2=(x)2/N
標準差3、方差與標準差35編輯版ppt但是在實際工作中,總體方差往往是未知的,常用樣本方差s2來估計。在公式中,用代替,用n代替N,這時計算的結果往往比總體方差σ2要小,所以分母用n-1來代替N,即公式變為:
這時樣本方差s2是總體方差σ2的無偏估計。N-1:自由度,常用ν或df表示,是指隨機樣本研究中,可獨立地隨機選擇變動的觀測值的個數。36編輯版ppt三組同性別、同年齡兒童的體重(kg)如下,分析其集中趨勢與離散趨勢。甲組2628303234X甲=30kgR=8S=3.16乙組2427303336X乙=30kgR=12S=4.74丙組2629303134X丙=30kgR=8S=2.91丙組數值的代表性好。37編輯版ppt標準差的應用標準差是反映數據變異程度的指標,其大
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 遼寧協作校2024-2025學年度高三第二次模擬考化學試題(含答案)
- 翻斗式密煉機企業縣域市場拓展與下沉戰略研究報告
- 冷凍飲品及食用冰制造企業縣域市場拓展與下沉戰略研究報告
- 凹版曬版機企業ESG實踐與創新戰略研究報告
- 2025年物業公司客戶滿意度調查總結范文
- 中小學教師繼續教育研修計劃
- 2025-2030中國大容量氯化鈉注射液行業市場發展趨勢與前景展望戰略研究報告
- 2025-2030中國圓頂露營帳篷行業市場發展趨勢與前景展望戰略研究報告
- 2025-2030中國啤酒廠管理軟件行業市場發展趨勢與前景展望戰略研究報告
- 2025-2030中國商業面食爐和再熱器行業市場發展趨勢與前景展望戰略研究報告
- T-ZAWS 006-2024 企業安全文化建設等級測評規范
- 《鋼鐵是怎樣煉成的》超全知識點考點合集
- 《餐飲服務常用英文表達》課件
- 城區供水設施智能化改造項目概述
- 項目式學習在小學數學教學中的應用
- 彩票行業風險管理-深度研究
- 加油站的智能監控與安全保障
- 煙草證委托經營管理協議書
- 2025豬場轉讓合同范本
- 生育友好醫院建設指南2024
- 2025年度智能零售貨柜租賃與運營管理合同范本3篇
評論
0/150
提交評論