




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第二章定量資料的統(tǒng)計(jì)描述第一節(jié)
頻數(shù)與頻數(shù)分布第二節(jié)
定量變量的特征數(shù)
頻數(shù)(frequency):對(duì)一個(gè)隨機(jī)變量做重復(fù)觀察,其中某變量值出現(xiàn)的次數(shù)。頻數(shù)分布表(frequencydistributiontable):將各變量值及其相應(yīng)的頻數(shù)列成表格的形式。
一、離散型定量變量的頻數(shù)分布
離散型變量的頻數(shù)分布圖直條圖橫坐標(biāo)為產(chǎn)前檢查次數(shù);縱坐標(biāo)為頻率,即產(chǎn)前檢查K次的婦女在被統(tǒng)計(jì)婦女中所占的比例%。圖中等寬矩形長條的高度與相應(yīng)檢查次數(shù)的頻率呈正比。二、連續(xù)型定量變量的頻數(shù)分布例2-2抽樣調(diào)查某地120名18歲~35歲健康男性居民血清鐵含量(μmol/L)見P12,試編制頻數(shù)分布表。(一)頻數(shù)分布表的編制步驟:(1)求全距:(極差)R=29.64-7.42=22.22(2)定組段數(shù)與組距:8~15個(gè)組段,組距i=全距/組段數(shù)(3)
劃組段:以一個(gè)稍小于或等于最小值的整數(shù)作為第一個(gè)組段的起點(diǎn)數(shù)據(jù)。下限:每個(gè)組段的起點(diǎn)(最小值)。上限:每個(gè)組段的終點(diǎn)(近似最大值)。
注:最后一個(gè)組段應(yīng)同時(shí)寫出上限和下限來。①兩端的組段應(yīng)分別包含最小值或最大值;②盡量取較整齊的數(shù)值作為組段的端點(diǎn),便于對(duì)數(shù)據(jù)進(jìn)行表述;③組距以相等為宜。(4)
歸組劃記:頻數(shù)、頻率、累積頻數(shù)、累積頻率。注:各組段的頻數(shù)之和應(yīng)等于總的觀察例數(shù)。頻率:各組頻數(shù)除以總例數(shù)n所得的比值。累計(jì)頻數(shù):本組段的頻數(shù)與以前各組段的頻數(shù)相加;
累計(jì)頻率:每組段的累計(jì)頻數(shù)除以總例數(shù)。
合計(jì)
6~8~10~12~14~16~18~20~22~24~26~28~30
一上正一正上正正丅正正正正正正正正正丅正正正上正正丅正上止一13681220271812841組段劃記頻數(shù)120
表2120名正常成年男子血清鐵含量的頻數(shù)分布表(二)連續(xù)型變量的頻數(shù)分布圖直方圖連續(xù)型變量的頻數(shù)分布圖,以直方的面積大小表示頻率的多少。
以橫軸表示被觀察變量,縱軸表示頻率密度,以各矩形(寬度為組距)的面積代表各組段的頻率。
圖中橫軸為血清鐵含量,縱軸為頻率密度,直條面積等于相應(yīng)組段的頻率。?三、頻數(shù)分布的兩個(gè)特征集中趨勢:血清鐵含量向中央部分集中,即中等含量者居多,集中在18這個(gè)組段,這種現(xiàn)象為集中趨勢。離散趨勢:從中央部分到兩側(cè)的頻數(shù)分布逐漸減少,而且血清鐵含量的值參差不齊,最低的接近6,最高的接近30,這種現(xiàn)象稱為離散趨勢。由于同質(zhì)性,所有實(shí)測值趨向同一數(shù)值的趨勢稱為集中趨勢。離散趨勢或變異程度是指觀察值之間參差不齊的程度。四、頻數(shù)分布的類型頻數(shù)分布偏態(tài)分布型對(duì)稱分布型正偏態(tài)分布負(fù)偏態(tài)分布
頻數(shù)表的用途
1.文獻(xiàn)中常將頻數(shù)表作為陳述資料的形式。揭示頻數(shù)分布的分布特征和分布類型。
2.便于進(jìn)一步計(jì)算統(tǒng)計(jì)指標(biāo)和進(jìn)行統(tǒng)計(jì)分析處理。
3.便于發(fā)現(xiàn)某些特大或特小的可疑值。第二章定量資料的統(tǒng)計(jì)描述第一節(jié)
頻數(shù)與頻數(shù)分布第二節(jié)
定量變量的特征數(shù)
總體中的某些個(gè)體總是具有某些同質(zhì)性,同一地區(qū)、同一年度、同一民族、同一年齡段、相同的性別與類似的健康狀況,這些共同點(diǎn)使得該人群的血清鐵含量應(yīng)趨向同一數(shù)值,即集中趨勢。不同總體間比較的方式之一就是對(duì)他們的集中趨勢進(jìn)行比較。另一方面,同一總體中的個(gè)體之間又普遍存在著各種差別,也就是說由于遺傳、營養(yǎng)、行為、發(fā)育、心理的各種因素在個(gè)體之間都不會(huì)完全相同,即個(gè)體間存在差異,因此導(dǎo)致某地18-35歲健康男性居民血清鐵含量不會(huì)完全相同,而是呈現(xiàn)或大或小的離散趨勢。一、描述集中趨勢的統(tǒng)計(jì)指標(biāo)平均數(shù):描述一組同質(zhì)計(jì)量資料的集中趨勢;反映一組觀察值的平均水平。常用的平均數(shù)有算術(shù)均數(shù),幾何均數(shù)和中位數(shù)。(一)算術(shù)均數(shù)(mean):簡稱均數(shù),總體均數(shù)用希臘字母μ表示,樣本均數(shù)用拉丁字母表示。
1.計(jì)算方法
1)直接法:適用于樣本例數(shù)n較少的資料。
其中X1,X2…Xn為各變量值,n為樣本例數(shù)。
2)加權(quán)法:適用于變量值較多的資料。
f1,f2…fn分別為各組段的頻數(shù),X1,X2…X0為各組段的組中值,組中值=(本組段下限+下組段下限)/2。權(quán)即頻數(shù)多,權(quán)數(shù)大,作用也大;頻數(shù)小,權(quán)數(shù)小,作用也小。
例2-3測得8只正常大白鼠總酸性磷酸酶(TACP)含量(U/L)為4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。試求其算術(shù)均數(shù)。求例2-2中某地120名正常成年男子的血清鐵含量的均數(shù)。
合計(jì)120(∑f)
2228(∑fX0)43640()
6~8~10~12~14~16~18~20~22~24~26~28~30
組段頻數(shù)(f)組中值(X0)
fX
0136812202712108417276610418034051337827620010829791113151719212325272949243726135227005780974779386348500029168412.均數(shù)的兩個(gè)重要特性
1).各離均差的總和等于0。(總體中各變量值X與均數(shù)之差稱為離均差)
2).離均差的平方和小于各觀察值X與任何數(shù)a之差的平方和。3.均數(shù)的應(yīng)用
最適用于對(duì)稱分布資料,尤其是正態(tài)分布資料。因?yàn)檫@時(shí)均數(shù)位于分布的中心,最能反映資料的集中趨勢。
(二)幾何均數(shù)(geometricmean):
幾何均數(shù)也稱為倍數(shù)均數(shù),用G表示。
1.幾何均數(shù)的計(jì)算方法
1)直接法:適用于樣本例數(shù)n較少的資料。將n個(gè)觀察值X1,X2,X3…Xn的乘積開n次方
對(duì)數(shù)形式:G=lg-1{(lgX1+lgX2+lgX3+…lgXn)/n}=lg-1(∑lgX/n)例2-57名慢性遷延性肝炎患者的HBsAg滴度資料為1:16,1:32,1:32,1:64,1:64,1:128,1:512。求其平均效價(jià)。7份HBsAg的平均滴度為1:642)加權(quán)法:適用于樣本例數(shù)n較多的資料。
X1,X2…Xn
為各組段的滴度或滴度倒數(shù)。f1,f2…fn分別為各組段的頻數(shù)。例2-652例慢性遷延性肝炎患者的HBsAg滴度數(shù)據(jù)見表2-4,求其平均滴度。52例慢性肝炎患者的HBsAg滴度的幾何均數(shù)為1:119.74705
2.幾何均數(shù)應(yīng)用的注意事項(xiàng):
1)幾何均數(shù)常用于等比級(jí)數(shù)資料或?qū)?shù)正態(tài)分布資料。
2)觀察值中不能有0。
3)觀察值中不能同時(shí)有正值和負(fù)值。(三)中位數(shù)和百分位數(shù)中位數(shù)(median,M):將一組變量值從小到大按順序排列,位次居中的那個(gè)變量值就是中位數(shù)。
百分位數(shù)(percentile,Px):指把數(shù)據(jù)從小到大排列后位于第X%位置的數(shù)值。有n個(gè)觀察值X1,X2…Xn,把他們由小到大按順序排列成X1≤X2≤X3…≤Xn,將這n個(gè)觀察值平均的分為100等份,對(duì)應(yīng)于每一等份的數(shù)值就是一個(gè)百分位數(shù),對(duì)應(yīng)于前面X%個(gè)位置的數(shù)值稱為第X百分位數(shù),用Px表示。1.中位數(shù)和百分位數(shù)的計(jì)算
1)直接法:適用于樣本例數(shù)n較少的資料。
將觀察值按大小順序排列,當(dāng)n為奇數(shù)時(shí),中間那個(gè)數(shù)就是中位數(shù)。當(dāng)n為偶數(shù)時(shí),中間兩個(gè)數(shù)的平均數(shù)就是中位數(shù)。
例2-7某藥廠觀察9只小鼠口服高山紅景天醇提物(RSAE)后在乏氧條件下的生存時(shí)間(分鐘)如下:49.1,60.8,63.3,63.6,63.6,65.6,65.8,68.6,69.0。
n為奇數(shù),M=63.6(cm)
2)頻數(shù)表法計(jì)算中位數(shù)和百分位數(shù):適用于樣本例數(shù)n較多的資料。
累計(jì)頻數(shù):本組段的頻數(shù)與以前各組段的頻數(shù)相加;
累計(jì)頻率:每組段的累計(jì)頻數(shù)除以總例數(shù)。
公式為
L為百分位數(shù)所在組段的下限,i為該組段的組距,fx為該組段的頻數(shù),fL為百分位數(shù)所在組段的前一組段的累計(jì)頻數(shù),n為總例數(shù)。例2-8利用表2-2的頻數(shù)表求血清鐵含量的中位數(shù)。
合計(jì)120
6~8~10~12~14~16~
18~20~22~24~26~28~30
組段頻數(shù)累計(jì)頻數(shù)累計(jì)頻率110.83343.336108.3381815.00123025.00205041.67277764.17189579.171210789.17811595.83411999.171120100.00
例某市大氣中SO2的日平均濃度見表2.5,求P25,P50,P75。2.中位數(shù)和百分位數(shù)的應(yīng)用
1)中位數(shù)常用于描述偏態(tài)分布資料的集中趨勢,反映位次居中的觀察值的平均水平。在對(duì)稱分布的資料中,中位數(shù)和均數(shù)在理論上是相同的。
2)百分位數(shù)可用于確定醫(yī)學(xué)參考值范圍(詳后)。
3)分布在中部的百分位數(shù)相當(dāng)穩(wěn)定,具有較好的代表性,但靠近兩端的百分位數(shù),只有在樣本例數(shù)足夠多時(shí)才比較穩(wěn)定。
應(yīng)用平均數(shù)的注意事項(xiàng)
1.平均數(shù)的計(jì)算和應(yīng)用必須具備同質(zhì)基礎(chǔ),必須先合理分組。不同質(zhì)的事物要分別求平均數(shù),以便分析比較。
2.根據(jù)資料的分布選用適當(dāng)?shù)钠骄鶖?shù)。對(duì)稱分布資料,尤其是正態(tài)分布資料,宜用均數(shù),也可用中位數(shù),而偏態(tài)分布資料則中位數(shù)的代表性較好,對(duì)數(shù)正態(tài)分布及等比級(jí)數(shù)資料宜用幾何均數(shù)。二、描述離散趨勢的特征數(shù)例2-11試觀察3組數(shù)據(jù)的離散情況。A組2628303234B組2427303336C組26293031341.極差(range,R)
也稱為全距,用R表示,一組資料中最大值與最小值之差。
缺點(diǎn):
1)除了最大、最小值外,不能反映組內(nèi)其他數(shù)據(jù)的變異度。
2)樣本例數(shù)越多,抽到較大或較小變量值的可能性越大,因而極差可能越大。
3)即使樣本含量相同,極差也不夠穩(wěn)定。
2.四分位數(shù)間距(quartilerange,Q)
P25表示全部觀察值中有25%(1/4)的觀察值比它小,記為下四分位數(shù)QL,P75表示全部觀察值中有25%(1/4)的觀察值比它大,記為上四分位數(shù)QU。
Q=P75-P25=QU-QL
Q適用于各種類型的連續(xù)型變量,特別是偏態(tài)分布的資料。例據(jù)表2.5資料求某市大氣中SO2日平均濃度分布的四份位數(shù)間距。3.方差(variance)A組2628303234C組2629303134(X-μ)總體方差
方差只取正值。同類資料比較時(shí),方差越大意味著數(shù)據(jù)間變異越大。4.標(biāo)準(zhǔn)差(standarddeviation,S)
式中n-1是自由度,為隨機(jī)變量能自由取值的個(gè)數(shù)。它描述了當(dāng)選定時(shí)n個(gè)變量值中能自由變動(dòng)的變量值的個(gè)數(shù)。1.直接法:適用于n較小的資料求例題中A組數(shù)據(jù)的標(biāo)準(zhǔn)差。2.加權(quán)法:適用于n較大的資料
合計(jì)120(∑f)
2228(∑fX0)43640()
6~8~10~12~14~16~18~20~22~24~26~28~30
組段頻數(shù)(f)組中值(X0)
fX
013681220271210841727661041803405133782762001082979111315171921232527294924372613522700578097477938634850002916841120名成年
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 窩工補(bǔ)償協(xié)議書
- 用水糾紛協(xié)議書
- 道路修護(hù)協(xié)議書
- 母親出車禍調(diào)解協(xié)議書
- 委托加工面膜廠協(xié)議書
- 股權(quán)咨詢協(xié)議書
- 紅酒贊助協(xié)議書
- 苗木嫁接協(xié)議書
- 用電負(fù)荷協(xié)議書
- 船員委培協(xié)議書
- TC4鈦合金拉拔工藝探索
- 糖尿病患者的飲食指導(dǎo)-課件
- 醫(yī)院藥物臨床試驗(yàn)倫理委員會(huì)倫理審查申請(qǐng)及受理表
- 2021譯林版高中英語選擇性必修三課文翻譯
- 智能網(wǎng)聯(lián)汽車線控技術(shù)課件
- 鄭州大學(xué)ppt模板
- (完整版)ECRS培訓(xùn)課件
- 第1本書出體旅程journeys out of the body精教版2003版
- 塑料制品事業(yè)部獨(dú)立核算體系文件
- 《鴻門宴》話劇劇本
- 灸法操作規(guī)程完整
評(píng)論
0/150
提交評(píng)論