




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第三章變異程度的統計描述2023/2/52住院號年齡身高體重住院天數職業文化程度分娩方式妊娠結局20256552716571.55無中學順產足月20256532216074.05無小學助產足月20258302515868.06管理員大學順產足月20225432316169.05無中學剖宮產足月20224662515962.011商業中學剖宮產足月20245352715768.02無小學順產早產20258342015866.04無中學助產早產20194642415870.53無中學助產足月20257832915457.07干部中學剖宮產足月計量計數等級計量計量計量計數等級1.試判斷下表的資料那些是計量資料?哪些是計數資料?那些是等級資料?2023/2/532.8位患者某病的住院天數求中位數:
22233456
潛伏期/h(1)頻數,f(2)
累計頻數Sf(3)
累計頻率(%)(4)0~171711.726~466343.4412~3810169.6618~3213391.7224~613995.8630~013995.8636~414398.6242~48
合計2145100.001453.下列資料是正態還是偏態分布?應計算何種平均數?P25,P80?中位數=12+6/38(145*50%-63)=13.5(h)P25
=6+6/46(145*25%-17)=8.51(h)P80
=18+6/46(145*80%-101)=19.96(h)2023/2/54計量資料的統計描述:
均數()幾何均數(G)中位數(M)
全距(R)、四分位數間距(Q)方差()、標準差(
)變異系數(CV)位置指標:變異指標:2023/2/55本章的內容和重點、難點一、幾個常用變異指標二、正態分布及其應用三、醫學參考值范圍
內容重點和難點方差和標準差、變異系數正態分布及其應用*醫學參考值范圍*
2023/2/56例1
對甲乙兩名高血壓患者連續觀察5天,測得的收縮壓(mmHg)分別是:
R
甲患者162145178142186162.6
44
乙患者164160163159166162.6
7
兩組患者收縮壓的變異一樣嗎?第一節幾個常用的變異指標2023/2/57
編號甲乙丙14404804902460490495350050050045405105055560520510
合計250025002500
均數500500500
例2:設甲、乙、丙三人,采每人的耳垂血,然后紅細胞計數,每人數5個計數盤,得結果如下(萬/mm3)甲乙丙
上面的圖表說明了什么?2023/2/581.極差(range)極差(R):最大值和最小值之差。(例1)
適用范圍:任何計量資料,是參考變異指標特點:易于理解,計算簡單,極差越大,數據變異程度越大;未利用全部數據信息,易受極端值的影響。2023/2/592.四分位數間距(quartileinterval)四分位數間距,用Q
表示:
適用范圍:(與中位數配套)常用于偏態分布資料、一端或兩端無確切數值的資料(開口資料)和分布不明的資料。特點:比極差穩定,可用于各種分布的資料。只反映中間兩端值的差異,計算不太方便。
上四分位數下四分位數
表2-4某地630名正常女性血清甘油三脂含量(mg/dl)甘油三脂頻數累積頻數累積頻率(%)0.10~
27
27
4.30.40~169196
31.10.70~167363
57.61.00~
94457
72.51.30~
81538
85.41.60~
42580
92.11.90~
28608
96.52.20~
14622
98.72.50~
4626
99.42.80~
3629
99.83.10~
1630100.0
合計630
-
-2023/2/511
說明有50%女性的甘油三酯在63.2和135.7之間,其四分位數間距為72.5(mg/dl)。
四分位數間距可以看作是在中間的一半變量值的極差(R)嗎?表4-1的四分位數間距:2023/2/5123.方差和標準差
(varianceandstandarddeviation)特點:
發映了每一個數值間的變異狀況;數據穩定,
應用廣泛;計算復雜,概念不好理解。
方差也稱均方差,與標準差都是反映一組數據的平均離散水平的指標。
總體方差、標準差用、表示;樣本方差、標準差用、表示.適用范圍:與均數配套用,適用于描述對稱分布資料的離散程度,特別是正態分布資料。2023/2/513
(1)方差的計算公式(通常未知
)(將原有的單位平方)
(2)標準差的計算公式(通常未知
)(應用非常廣泛)自由度:合計值不變的情況下,能夠自由取值的變量值的個數。記作:ν,df
為何標準差比方差更好用?
數學上:在N維或N度空間中能夠自由選擇的維數或度數方差的特點:充分反映每個數據間的離散狀況,意義深刻;指標穩定,應用廣泛,但計算較為復雜,不易理解;方差的單位與原數據不同,有時使用時不太方便;在方差分析中應用甚廣而極為重要。標準差的特點:意義同方差,是方差的開平方;標準差的單位與原數據相同,使用方便,意義深刻,應用廣泛;故一般已作為醫學生物學領域中反映變異的標準,故稱標準差。2023/2/515
對于頻數表的資料,標準差的計算公式如下:
式中x和f分別為各組段的組中值及出現的頻數。
一般地:標準差的變換公式
*!:大樣本小樣本2023/2/516用直接法計算例1的標準差編號甲乙丙甲2乙2丙214404804901936002304002401002460490495211600240100245025350050050025000025000025000045405105052916002601002550255560520510313600270400260100
合計250025002500126040012510001250250
標準差50.9915.817.912023/2/517
紅細胞計數組中值頻數
3.80~3.9027.8030.424.00~4.10624.60100.864.20~4.301147.30203.394.40~4.5025112.50506.254.60~4.7032150.40706.884.80~4.9027132.30648.275.00~5.101786.70442.175.20~5.301368.90365.175.40~5.50422.00121.005.60~5.70211.4064.985.80~5.955.9015.9034.81
合計140669.803224.20用加權法計算140名正常成年男子紅細胞計數的標準差
2023/2/518
與方差一樣表示數據分布的離散程度,與均數配套使用,但比方差更常用。常用作為計量資料數字特征的描述。結合均數描述正態分布的特征,并確定醫學參考值范圍。可用來計算均數的標準誤。
標準差的應用2023/2/519例1:某地120名7歲男孩身高的均數為123.10cm,標準差為4.71cm;體重均數為22.29kg,標準差為2.26kg,比較其變異度。單位不同能否得出身高的變異程度大于體重的變異程度?2023/2/520mmHg
均數
標準差
舒張壓77.510.7
收縮壓122.917.1例2:
某地男子身高舒張壓和收縮壓的變異程度。均數單位相同,但相差很大。從表中,舒張壓的變異程度小于收縮壓的變異程度?
變異系數(%)13.813.92023/2/521
變異系數CV,其計算公式為
可用于觀察指標單位不同時,如身高與體重的變異程度的比較。或用于均數相差較大時,如兒童身高與成人身高變異程度的比較。4.變異系數(coefficientofvariation)第二節正態分布1.正態分布的概念正態分布(normaldistribution):也稱高斯分布,是醫學和生物學最常見的連續性分布。如身高、體重、紅細胞數、血紅蛋白等。2023/2/523JohannCarlFriedrichGauss德國著名數學家、物理家、天文學家、大地測量學家。
高斯3歲時便能夠糾正他父親的借債賬目的事情,已經成為一個軼事流傳至今。他曾說,他在麥仙翁堆上學會計算。能夠在頭腦中進行復雜的計算,是上帝賜予他一生的天賦。當高斯9歲時候,高斯用很短的時間計算出了小學老師布置的任務:對自然數從1到100的求和。但是據更為精細的數學史書記載,高斯所解的并不止1加到100那么簡單,而是81297+81495++100899(公差198,項數100)的一個等差數列。
歷史貢獻和著作:高斯分布、三角形全等定理、天體運動論、地理測量、日光反射儀等。
圖2-1140名正常男子紅細胞計數的直方圖
2023/2/525頻數分布逐漸接近正態分布示意圖fffXXX2023/2/526正態分布的數理統計學定義:2023/2/527正態分布曲線:2023/2/5282.正態分布的特征2023/2/529圖2-5正態分布參數位置變化示意圖2023/2/530圖2-6正態分布變異度不同變化示意圖2023/2/531正態曲線下的面積分布示意圖
F(x)2023/2/5323.標準正態分布
與一般的正態分布具有相同的特征,但其更具有特殊性,其均數為0,方差為1。2023/2/533標準正態分布的概率密度函數(u)
曲線和分布函數值(u)(u)2023/2/534p194在標準正態分布下,常用u值對應的左側面積:1.u=-∞時,面積為0;u=+∞時,面積為1;2.u=-2.58時,面積為0.005;u=2.58時,面積為0.995;3.u=-1.96時,面積為0.025;u=1.96時,面積為0.95;4.u=-1.64時,面積為0.05;u=1.64時,面積為0.90;5.u=-1時,面積為0.1587;u=時,面積為0.8413。2023/2/5360標準正態曲線下的面積分布示意圖
(u)2023/2/537正態曲線下的面積分布示意圖
標準正態曲線下的面積分布示意圖
F(x)(u)2023/2/538正態分布的標準化—正態分布變換為標準正態分布X的標準正態變換公式2023/2/539例題:一次統計測驗的平均分是75,標準差是15,求60分、95分、75分的標準分數。例2中,收縮壓為166mmHg患者的標準分是多少?其中:μ=75σ=15
u=(x-μ)/σ2023/2/540
由于正態分布曲線下的面積求解較困難,但所有的正態分布都可變換為標準正態分布,然后根據統計學家編制的標準正態分布曲線下的面積分布表(即附表1,p194)求出其面積。Ux1x2Xf(x)面積相等F(x)(u)2023/2/541
例1:成年男子的紅細胞數近似服從正態分布,假設
均值為4.78,標準差為0.38
1)求X≥4所占的比例;
2)求X≤5.5所占的比例;
3)求4.0≤X≤5.5()所占的比例4)分別求出均數±1S、均數±1.96S、均數±2.58S范圍內成年男子人數占該140名成年男子總數的實際百分數,說明與理論百分數是否接近。*課外練習
2023/2/542根據題意,作u變換
例2.
某年某市120名12歲健康男孩身高,已知均數=143.07cm,標準差S=5.70cm,①估計該地12歲健康男孩身高在135cm以下者占該地12歲男孩總數的百分數;②估計身高界于135cm~150cm范圍內12歲男孩的比例;
根據題意,按公式(3.13)作u變換
身高范圍所占面積
故估計該地12男孩身高在135cm以下者約占7.78%;身高界于135cm~150cm范圍內者約占81.10%。2023/2/5454.正態分布的應用
估計頻數分布范圍制定醫學參考值范圍
**
質量控制
統計分析方法的基礎T分布、F
分布、分布2023/2/546第三節醫學參考值范圍
人體內很多生理生化指標的頻數分布呈正態分布或近似正態分布,還有少數指標近似對數正態分布。故可用正態分布的原理來制定很多生理生化指標的參考值范圍。2023/2/547
醫學參考值(referencevalue)是指包括絕大多數正常人的人體形態、機能和代謝產物等各種生理及生化指標,也稱正常值。
由于存在個體差異,生物醫學數據并非常數,而是在一定范圍內波動,故采用醫學參考值范圍作為判定正常和異常的參考標準。1.醫學參考值的概念2023/2/548
并不是指機體任何器官,組織的形態和機能都正常的健康人,而是排除了影響所研究指標的疾病和異常的同質人群。2.“正常人”的含義2023/2/5493.醫學參考值范圍的制定步驟醫學參考值范圍制定步驟正常人總體樣本(n≥120)控制測量誤差測定指標值決定單側或雙側選取合適的百分界95%估計參考值范圍的界限根據資料的分布類型選擇估計方法2023/2/550雙側:
血清總膽固醇無論過低或過高均屬異常
白細胞數無論過低或過高均屬異常單側:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論