




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
衛生統計學
10/13/20221第一章衛生統計學緒論
Fisher在1938年印度統計學大會演講時說:“作完實驗后才找統計學家,就好象要他作尸體解剖。他會說,這實驗死于什么原因”。10/13/20222第一章衛生統計學緒論第一章
衛生統計學緒論統計學:是一門處理數據中變異性的科學與藝,內容包括收集、整理、分析、解釋和表達數據,目的是求得可靠結果。10/13/20223第一章衛生統計學緒論
例1我的紅細胞數比其他同事都低,我是病了嗎?
10/13/20224第一章衛生統計學緒論3.985.394.544.745.134.434.814.674.67
4.963.795.494.665.264.904.905.405.294.174.284.634.944.334.844.754.775.384.014.49…………………………5.304.975.294.855.884.494.624.775.384.534.104.534.704.805.235.675.154.57
150名正常成年男子的紅細胞數(1012/L)10/13/20225第一章衛生統計學緒論
150名成年男子的紅細胞數(1012/L)頻數分布組段頻數
f頻率(%)3.7~10.673.9~42.674.1~117.334.3~171.134.5~2617.34.7~3221.34.9~2617.35.1~1812.05.3~106.675.5~42.675.7~5.910.67合計150100.010/13/20226第一章衛生統計學緒論某地150名正常成年男子紅細胞數(1012/L)頻數分布圖頻數紅細胞數(1012/L)10/13/20227第一章衛生統計學緒論例21、用某藥治某病,治療1例有效,能說該藥的有效率為100%嗎?2、治療2例都有效,能說該藥的有效率為100%嗎?3、治療10例9例有效,能說90%有效嗎?10/13/20228第一章衛生統計學緒論例3某醫生用某藥治療胃潰瘍病出血患者107例,有效101例,有效率為94.4%。如果別的醫生也用同樣的藥來治療胃潰瘍病出血患者,其有效率也一定是94.4%嗎?10/13/20229第一章衛生統計學緒論例4
某項關于某種藥物的廣告聲稱:“在服用本制劑的1000名上呼吸道感染的兒童中,有970名兒童在72小時內癥狀消失”,因此推斷此藥治療兒童的上呼吸道感染是非常有效的,可以推廣應用。這項推論正確嗎?10/13/202210第一章衛生統計學緒論例5對某地25~30歲婦女進行一項研究發現:在服用口服避孕藥者中,宮頸癌年發病率為6/10萬,而未服用者為3/10萬。據此認為服用口服避孕藥是引起宮頸癌的危險因素,此結論正確嗎?
10/13/202211第一章衛生統計學緒論例6《腫瘤患者體外淋巴細胞轉化率檢查及其評價》的研究中,研究對象是67例惡性腫瘤患者,其中44例為腫瘤患者(消化道癌23例,肺癌13例,其它癌腫8例),男39人,女5人,年齡36~73歲;23例為白血病患者(急淋7例,急粒8例,慢粒8例),男18人,女5人,年齡16~54歲。正常對照:33例正常人,均為健康獻血員,男20人,女13人,年齡21~33歲。作者得出腫瘤組和白血病組平均淋轉率比正常組低(P<0.01)。10/13/202212第一章衛生統計學緒論例:鏈霉素治療肺結核療效的臨床試驗從15~30歲肺雙側進行性肺結核患者(總體)中抽取107例患者(樣本),隨機分為兩組,試驗組55例接受鏈霉素加臥床休息的治療,對照組52例用常規治療(單純臥床休息)。6個月后,患者的X-光片分別由兩位放射學家和一位臨床學家獨立評價,結果見下:10/13/202213第一章衛生統計學緒論結果:試驗組生存率為93%(51/55)
對照組生存率為73%(38/52)
試驗組的放射學改善優于對照組。3、結果的評價是否客觀,有無偏倚?1、兩組患者的生存率不同是個體差異還是療法的效果?2、上兩組患者的病情是否相同或相似?10/13/202214第一章衛生統計學緒論兩組患者的生存率不同是個體差異還是療法的效果?兩組患者的生存率經假設檢驗,得P<0.05,有顯著性差異。10/13/202215第一章衛生統計學緒論
隨機化分組兩組患者的病情比較分組身體狀況血沉(mm.h-1)好一般差0~11~21~>50試驗組81730031636對照組8202412202910/13/202216第一章衛生統計學緒論患者的X-光片分別由兩位放射學家和一位臨床學家獨立評價,這種盲法和重復評價明顯增加了評價的客觀性,結果試驗組的存活率和放射學改善均優于對照組。10/13/202217第一章衛生統計學緒論生物醫學客觀現象推斷統計揭示生物醫學客觀總體內在數量規律描述統計
統計學探索生物醫學數量規律過程10/13/202218第一章衛生統計學緒論第一節醫學中統計思維的進化時期科學家發明與應用1749-1827Pierre-SimonLaplace研究概率(probability)。1745-1826PhilippePinel應用概率研究療效1787-1872Louis臨床療效,對照1822-1911FrancisGalton分布與變異統計思維的進化(發展簡史)10/13/202219第一章衛生統計學緒論衛生統計思維進化與概念時期科學家發明與應用1857-1936KarlPearson現代統計學之父相關分析,x21880-1949MajorGreenwood抽樣誤差1879-1940RaymondPearl醫院統計,生物統計1890-1962RonaldA.Fisher現代統計學奠基、誤差理論極大似然《實驗設計》隨機化做實驗,F檢驗1897-1991Hill爵士現代臨床試驗10/13/202220第一章衛生統計學緒論第二節統計學與公共衛生的關系
公共衛生專業人員的得力工具:統計設計:抽樣、樣本量、統計方法等統計描述:群體事件的分布特征統計推斷:找危險因素、評價效果、決策等歷史成就:JohnGraunt
、WilliamFarr(壽命表);JohnSnow(霍亂發生原因);
Doll和Hill(吸煙與肺癌)。
你的成就需要統計?10/13/202221第一章衛生統計學緒論現代公共衛生對統計學的挑戰
疾病譜的變化需要新的統計方法:為了研究非感染性疾病的流行,人們發展了多因素分析、生存分析、疾病自然史的模型等現代統計方法。
學科交叉結合需要新的統計學方法:如:人群藥物代謝動力學與現代統計學幾個分支的交叉結合,包括廣義線性混合效應模型、非線性混合效應模型、等級和經驗Bayes方法等。遺傳流行病學需要遺傳統計學方法;生物信息海量數據庫的統計分析;衛生經濟與決策的統計學方法。第二節統計學與公共衛生的關系10/13/202222第一章衛生統計學緒論
第三節統計學的若干概念10/13/202223第一章衛生統計學緒論
1、總體(population
)
:同質個體所構成的全體(大同小異的對象全體)。例如:一個國家的所有成年人某地的所有小學生所有的肺結核患者一、總體與樣本10/13/202224第一章衛生統計學緒論目標總體(targetpopulation):研究結果所要推論到的總體。研究總體(studypopulation):來源于目標總體中的一個較小的總體。如關于吸煙與肺癌的研究以英國成年男子為目標總體;1951年英國全部注冊醫生只是成年男子中的一部分,是研究總體。一、總體與樣本10/13/202225第一章衛生統計學緒論2、樣本(sample):從研究總體中隨機抽得的有代表性的一部分個體,其實測值的集合。例如:長沙市2002年7歲正常男童中隨機抽取
200名,其身高值構成一個樣本一、總體與樣本10/13/202226第一章衛生統計學緒論抽樣(sampling):從研究總體中抽取一部分有代表性的個體的方法。隨機化原則:使研究總體中的每個個體都有同樣的機會被抽取為樣本。數據(data):對樣本中個體進行深入的觀察與測量,獲取的測量值。一、總體與樣本10/13/202227第一章衛生統計學緒論抽樣的目的:由部分推斷全體,由樣本推斷總體。一、總體與樣本10/13/202228第一章衛生統計學緒論變量(觀察指標、因素等):個體的某項或某些特征例如:身高、體重、性別、血型、反應、療效等二、同質與變異10/13/202229第一章衛生統計學緒論
變量值:變量的觀察結果例如:身高1.65米;體重52公斤性別女;血型“O”型反應陰性;療效好轉二、同質與變異10/13/202230第一章衛生統計學緒論同質(homogeneity)
:給個體規定的一些相同性質即大同(主要的容易控制的影響因素相同)
例如:變量為身高,長沙市2002年7歲正常男童即為同質同質基礎:同地區、同年份、同年齡、同為正常男童。二、同質與變異10/13/202231第一章衛生統計學緒論變異(variation):同質個體變量值間的差異即小異
例如:長沙市2002年7歲正常男童的身高值各不相同原因:已知或未知或難于掌控的因素造成。二、同質與變異10/13/202232第一章衛生統計學緒論統計學的任務:在變異的背景上描述同一總體的同質性,揭示不同總體的異質性。二、同質與變異10/13/202233第一章衛生統計學緒論為研究同性別、同年齡的中國小學生和日本小學生的平均身高是否不同,分別從兩個總體中各抽取一份樣本,各得一個平均數。數值不同,能不能就此推斷兩國同性別、同年齡小學生的平均身高不等?例如:10/13/202234第一章衛生統計學緒論試想:如果再從中國小學生中抽取一份樣本,再得一個平均數。數值與前不同,也許你會說這是同一總體的個體大同小異造成的。那么,日本的那個均數與中國的那個均數不相等,是因為他們“大同小異”?還是因為兩個總體本不相同?分析:10/13/202235第一章衛生統計學緒論1、定性變量
分類變量(名義變量):有序變量(等級變量):
2、定量變量
離散型變量:連續型變量:
三、變量的類型10/13/202236第一章衛生統計學緒論分類變量:又稱名義變量。其變量值是定性的,表現為互不相容的屬性或類別(沒有大小、強弱、優劣之分)。二分類:如性別、生死、疾病有無;多分類:如A、B、O、AB血型。10/13/202237第一章衛生統計學緒論有序變量:又稱等級變量。其變量值具有半定量性質,表現為等級大小或屬性程度(即有大小、強弱、優劣之分)。
例如:
觀察用某藥治療某病患者的療效,以每名患者為觀察單位,結果可分為治愈、顯效、好轉、無效四級。10/13/202238第一章衛生統計學緒論定量變量:(measurementdata)其變量值是定量的,表現為數值大小,一般有度量衡等單位。離散性變量:如嬰幼兒的牙齒數,孕婦產前檢查次數等連續性變量:如身高、體重、紅細胞數等10/13/202239第一章衛生統計學緒論變量轉化:變量只能由高級向低級轉化離散型變量常常通過適當的變換或連續性校正后借用連續型變量或有序變量的方法來分析。連續型有序分類二值10/13/202240第一章衛生統計學緒論
例如:測得5人的WBC(個/m3)數如下:
12345
300060005000800012000
定量變量
過低正常正常正常過高
分類變量
過低1人,正常3人,過高1人
等級變量正常3人,異常2人
二分類變量10/13/202241第一章衛生統計學緒論四、參數與統計量參數(parameter):是統計模型的特征指標,是對總體而言,其大小是客觀存在的,然而往往是未知的,如總體均數(mean)和總體方差(variance);
10/13/202242第一章衛生統計學緒論四、參數與統計量統計量(statistic):由觀察資料計算出來的量,如計算觀察樣本中的個體得到的樣本均數,樣本方差。統計學關心的常常是總體參數(總體指標)的大小,其依據卻是統計量及其性質。10/13/202243第一章衛生統計學緒論五、設計與分析統計設計(statisticaldesign):是醫藥衛生科研設計不可或缺的部分。醫藥衛生科研主要有兩大類:干預性研究(interventionstudy)和觀察性研究(observationalstudy)。統計設計內容主要涉及對象選擇、隨機化、重復、匹配、盲法、統計方法選擇、統計圖表等。10/13/202244第一章衛生統計學緒論五、設計與分析統計分析:一定的設計樣式決定了一定的數據分析方法;不同設計下獲得的資料常常要用不同的方法來分析。隨機化區組設計(randomizedblockdesign)的方差分析不同于析因設計(factorialdesign)的方差分析病例-對照研究(case-controlstudy),成組對照的資料和匹配對照的資料的分析方法不同10/13/202245第一章衛生統計學緒論六、因果與聯系統計學聯系(association):事物之間存在統計學聯系,如某疾病與危險因素(riskfactor)之間存在聯系。(可能是:人為聯系、虛假聯系和因果關系。因此,存在聯系未必有因果關系。)因果關系(causality):在排除了人為聯系、虛假聯系后仍然存在的、無法用其他聯系解釋的兩個變量之間的關系。但也需要時間順序等標準進行因果判斷。10/13/202246第一章衛生統計學緒論七、概率與頻率頻率f:如果在n次重復試驗中,事件A發生了m
次,則稱比值是事件A在這n次試驗中發生的頻率,記為,即。表示某現象在樣本中出現的比率,是樣本特征,樣本指標。10/13/202247第一章衛生統計學緒論
概率P:定義:概率是度量隨機事件發生可能性大小的一個數值。用P表示,是總體特征,總體指標。七、概率與頻率10/13/202248第一章衛生統計學緒論小概率事件:特指發生概率P≤0.05,或者發生概率P≤0.01的事件。小概率事件原理:小概率事件在一次試驗中幾乎是不可能發生的,即把小概率事件當成不可能事件。七、概率與頻率10/13/202249第一章衛生統計學緒論如何學好衛生統計學正確理解統計學的基本概念了解統計設計與統計分析方法的關系熟悉基本統計方法的適應條件、結果解釋和表達熟悉常用統計學符號及書寫方法學會計算機統計軟件的基本操作和統計結果的閱讀、解釋和表達。不要過多思考公式的推導案例討論和習題的實踐要有行動10/13/202250第一章衛生統計學緒論1、某地一批人的血紅蛋白值資料比色法測得的具體值(如135g/L),為何類資料?根據測得值進行分類如“貧血”),為何類資料?試區分以下資料屬于哪種類型?10/13/202251第一章衛生統計學緒論觀察對象抗體滴度目測判斷免疫效果抗體水平
11:40++有效
21:60+++ 有效
31:320++++有效
4<1:20-無效…………
為何類資料?為何類資料?為何類資料?2.某疫苗皮下注射免疫結果10/13/202252第一章衛生統計學緒論定量資料的統計描述第二章Page11~2610/13/202253第一章衛生統計學緒論定量資料的統計描述
統計圖:頻數分布圖統計表:頻數分布表
統計指標:集中趨勢指標
離散趨勢指標利用統計表對數據進行概括;用統計圖對分布形態及分布間的關系做直觀的表達;用于描述定量資料的統計指標的意義與計算。10/13/202254第一章衛生統計學緒論第一節頻率分布表與頻率分布圖
頻數分布:n個變量值在各變量值區間內的個數(f)分配頻率分布:n個變量值在各變量值區間內所占的比例分配
10/13/202255第一章衛生統計學緒論表2-11998年某地96名孕婦產前檢查次數頻率分布檢查次數頻數頻率(%)累計人數累計頻率(%)(1)(2)(3)(4)(5)044.244.2177.31111.521111.52222.931313.53536.542627.16163.552324.08487.551212.596100.0合計96100.010/13/202256第一章衛生統計學緒論頻數(率)分布表(frequencytable):將資料的觀察值按大小分為若干組段,描述各組段及相應組段頻數(率)的統計表稱為頻數(率)分布表,簡稱頻數(率)表。10/13/202257第一章衛生統計學緒論
(一)頻率分布表
例2-11998年某山區96名孕婦產前檢查次數資料如下:0,3,2,0,1,5,6,3,2,4,1,0,6,5,1,3,3,……4,7。整理成表2-1得頻率分布表。一、離散型定量變量的頻率分布10/13/202258第一章衛生統計學緒論表2-11998年某地96名孕婦產前檢查次數頻率分布檢查次數頻數頻率(%)累計人數累計頻率(%)(1)(2)(3)(4)(5)044.244.2177.31111.521111.52222.931313.53536.542627.16163.552324.08487.551212.596100.0合計96100.010/13/202259第一章衛生統計學緒論
頻率:各組的頻數除以總例數n所得的比值。頻率描述了各組頻數在全體中所占的比重,各組
頻率之和等于100%。
累計頻數:本組段的頻數與以前各組段的頻數
相加;
累計頻率:每組段的累計頻數除以總例數。
10/13/202260第一章衛生統計學緒論(二)頻率分布圖——直條圖
橫坐標:變量,即產前檢查次數;縱坐標:頻率,即產前檢查K次的婦女在被統計婦女中所占的比例%。等寬直條的高度:表示各組頻率
10/13/202261第一章衛生統計學緒論圖2-1某地96名孕婦產前檢查次數頻率分布頻率(%)產前檢查次數10/13/202262第一章衛生統計學緒論(一)頻率分布表例2-2
:抽樣調查某地120名18歲~35歲健康男性居民血清鐵含量(μmol/L)見P12,試編制頻率分布表。二、連續型定量變量的頻率分布10/13/202263第一章衛生統計學緒論數據7.428.6523.0221.6121.3121.469.9722.7314.9420.1821.6223.0720.388.4017.3229.6419.6921.6923.9017.4519.0820.5224.1423.7718.3623.0424.2224.1321.5311.0918.8918.2623.2917.6715.3818.6114.2717.4022.5517.5516.1017.9820.1321.0014.5619.8919.8217.4814.8918.3719.5017.0818.1226.0211.3413.8110.2515.9415.8318.5424.5219.2626.1316.9918.8918.4620.8717.5113.1211.7517.4021.3617.1413.7712.5020.4020.3019.3823.1112.6723.0224.3625.6119.5314.7714.3724.7512.7317.2519.0916.7917.1919.3219.5919.1215.3121.7519.4715.5110.8627.8121.6516.3220.7522.1113.1717.5519.2612.6518.4819.8323.1219.2219.2216.7227.9011.7424.6614.1816.5210/13/202264第一章衛生統計學緒論
組段(1)f(2)6~18~310~
612~
814~1216~2018~2720~1822~24~26~28~12841合計120表2120名正常成年男子血清鐵含量的頻數分布表10/13/202265第一章衛生統計學緒論
1、求全距(極差)
極差(range):極差也稱全距,即最大值和最小值之差,記作R。本例
頻數表的編制步驟10/13/202266第一章衛生統計學緒論根據極差選定適當“組段”數。組段數通常取8~15
組。2、確定組段數、組距10/13/202267第一章衛生統計學緒論組距等組距頻數表:常見不等組距頻數表:少見2、確定組段數、組距10/13/202268第一章衛生統計學緒論組段下限(L):每個組段的起點組段上限(U):每個組段的終點3、確定各組段的上、下限①兩端的組段應分別包含最小值或最大值;②盡量取較整齊的數值作為組段的端點,便于對數據進行表述;③最后一個組段應同時寫出上限和下限來10/13/202269第一章衛生統計學緒論
6~8~10~12~14~16~18~20~22~24~26~28~30
合計
一上正一正上正正丅正正正正正正正正正丅正正正上正正丅正上止一13681220271812841組段劃記頻數120
4、列表整理、統計各組段的頻數、頻率
10/13/202270第一章衛生統計學緒論數據7.428.6523.0221.6121.3121.469.9722.7314.9420.1821.6223.0720.388.4017.3229.6419.6921.6923.9017.4519.0820.5224.1423.7718.3623.0424.2224.1321.5311.0918.8918.2623.2917.6715.3818.6114.2717.4022.5517.5516.1017.9820.1321.0014.5619.8919.8217.4814.8918.3719.5017.0818.1226.0211.3413.8110.2515.9415.8318.5424.5219.2626.1316.9918.8918.4620.8717.5113.1211.7517.4021.3617.1413.7712.5020.4020.3019.3823.1112.6723.0224.3625.6119.5314.7714.3724.7512.7317.2519.0916.7917.1919.3219.5919.1215.3121.7519.4715.5110.8627.8121.6516.3220.7522.1113.1717.5519.2612.6518.4819.8323.1219.2219.2216.7227.9011.7424.6614.1816.5210/13/202271第一章衛生統計學緒論10/13/202272第一章衛生統計學緒論同一組資料,不同的人編制的頻數表,結果不盡相同,允許幾個合理的結果并存。
10/13/202273第一章衛生統計學緒論橫坐標——指標(變量)縱坐標——頻率密度即頻數/組距或頻數(等組距頻數表)各矩形(寬度為組距)的面積——代表各組段的頻率(二)頻率分布圖——直方圖10/13/202274第一章衛生統計學緒論
圖中橫軸為血清鐵含量,縱軸為頻率密度,直條面積等于相應組段的頻率。10/13/202275第一章衛生統計學緒論1、作為陳述資料的形式:簡單明了或直觀形象,便于進一步計算指標和統計分析。三、頻率分布表(圖)的用途10/13/202276第一章衛生統計學緒論(1)對稱分布:若各組段頻數的分布以頻數最多的組段為中心左右兩側大體對稱(總體則完全對稱),就認為該資料是對稱分布
(2)偏態(峰)分布:正偏峰分布負偏峰分布2、揭示資料的分布類型10/13/202277第一章衛生統計學緒論含藥量(mg)
(1)
頻數
f(2)37~340~643~1546~1849~3052~1455~1158~2
61~641合計100表
某藥100片的含藥量的頻數表10/13/202278第一章衛生統計學緒論頻數圖
100片藥片含藥量的直方圖37404346495255586164含藥量(mg)10/13/202279第一章衛生統計學緒論正偏態(峰)分布115名正常成年女子血清轉氨酶(mmol/L)含量分布轉氨酶含量人數12~215~918~1421~2324~1927~1430~1133~936~739~442~45310/13/202280第一章衛生統計學緒論10/13/202281第一章衛生統計學緒論101名正常人的血清肌紅蛋白()含量分布
負偏態(峰)分布10/13/202282第一章衛生統計學緒論10/13/202283第一章衛生統計學緒論
頻數分布對稱分布型:指集中位置在正中,左右兩側頻數分布大體對稱。偏態分布型:指集中位置偏向一側,頻數分布不對稱。偏態分布型正偏態分布:集中位置偏向數值小的一側。負偏態分布:集中位置偏向數值大的一側。
10/13/202284第一章衛生統計學緒論集中趨勢:血清鐵含量向中央部分集中,即中等含量者居多,集中在18
這個組段,這種現象為集中趨勢離散趨勢:從中央部分到兩側的頻數分布逐漸減少,而且血清鐵含量的值參差不齊,最低的接近6最高的接近30,這種現象稱為離散趨勢3、描述資料的分布特征10/13/202285第一章衛生統計學緒論集中趨勢:觀察值的平均水平或集中位置,用平均數反映離散趨勢:觀察值的變異程度或離散程度,用變異指標反映3、描述資料的集中趨勢與離散趨勢10/13/202286第一章衛生統計學緒論4.便于發現某些特大和特小的可疑值可疑值可疑值10/13/202287第一章衛生統計學緒論計量資料(定量資料、數值變量資料)總體:有限或無限個(定量)變量值樣本:從總體隨機抽取的n個變量值:
X1,X2,X3,……,Xn
n為樣本例數(樣本大小、樣本含量)第二節描述集中趨勢的統計指標10/13/202288第一章衛生統計學緒論一、描述集中趨勢的統計指標平均數(average):描述一組變量值的集中位置或平均水平的指標。常用的平均數有(算術平)均數、幾何(平)均數、中位數不同的分布使用不同的平均數
10/13/202289第一章衛生統計學緒論1、算術均數(mean)意義:用于反映一組呈對稱性分布的變量值在數量上的平均水平或者說是集中位置的特征值。應用:對稱性分布,尤其是正態分布符號:10/13/202290第一章衛生統計學緒論(1)直接計算法10/13/202291第一章衛生統計學緒論
例2-3測得8只正常大白鼠總酸性磷酸酶含量(U/L)為4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。試求其算術均數。10/13/202292第一章衛生統計學緒論
(2)加權法(頻數表法,大樣本資料)f:各組段的頻數k:頻數表的組段個數(組中值)10/13/202293第一章衛生統計學緒論120名成年男子血清鐵含量均數、標準差計算表(加權法)
組段
頻數(f)
組中值(X0)
fX
0(1)(2)(3)(4)=(2)(3)(5)=(3)(4)
6~8~10~12~14~16~18~20~22~24~26~28~30合計13681220271210841120(∑f)72766104180340513378276200108292228(∑fX0)7911131517192123252729492437261352270057809747793863485000291684143640()10/13/202294第一章衛生統計學緒論均數的幾何意義均數代表每組觀察值的平衡點,也就是重心。如:(1,4,7,8)則均數為5。則圖示如下:均數的重要特性:離均差(各觀察值與均數之差)總和等于零1234567810/13/202295第一章衛生統計學緒論
均數的應用
它最適用于對稱分布資料,尤其是正態分布資料。因為這時均數位于分布的中心,最能反映資料的集中趨勢。10/13/202296第一章衛生統計學緒論2、幾何均數(geometricmean)意義:可用于反映一組經對數轉換后呈對稱分布的變量值在數量上的平均水平。應用:倍數關系或對數轉換后呈對稱分布,尤其是對數正態分布符號:(樣本)10/13/202297第一章衛生統計學緒論(1)直接計算法10/13/202298第一章衛生統計學緒論例:某公司五名職員的薪水分別是:
10,100,1000,10000,100000。10/13/202299第一章衛生統計學緒論
例2-57名慢性遷延性肝炎患者的HBsAg滴度資料為1:16,1:32,1:32,1:64,1:64,1:128,1:512。求其平均效價。7份HBsAg的平均滴度為1:6410/13/2022100第一章衛生統計學緒論
(2)加權法適用于相同觀察值較多或頻數表資料。10/13/2022101第一章衛生統計學緒論
例2-652例慢性遷延性肝炎患者的HBsAg滴度數據見表2-4,求其平均滴度。
52例慢性肝炎患者的HBsAg滴度的幾何均數為1:119.7470510/13/2022102第一章衛生統計學緒論
幾何均數應用的注意事項:
1)幾何均數常用于等比級數資料或對數正態分布資料。
2)觀察值中不能有0。
3)觀察值中不能同時有正值和負值。
10/13/2022103第一章衛生統計學緒論意義:是將n個變量值從小到大排列,位置居于中間的那個變量值。用途:偏態分布資料;一端或兩端無確切數值的資料(開口資料);分布不明的資料。符號:M(樣本)
3、中位數(median)10/13/2022104第一章衛生統計學緒論
1,3,7,55,86,100,中位數為多少?
1,3,7,55,100,中位數為多少?10/13/2022105第一章衛生統計學緒論(1)直接計算法
(小樣本時)n為奇數時
n為偶數時
10/13/2022106第一章衛生統計學緒論(2)頻數表法
(大樣本時)
LM,iM
,fM分別為M所在組段的下限、組距和頻數,fL為M所在組段之前各組段的累積頻數。
10/13/2022107第一章衛生統計學緒論下限值L上限值Ui;fm中位數M10/13/2022108第一章衛生統計學緒論發汞值(g/g)(1)頻數累積頻數累積頻率
(2)(3)(4)0.3~0.7~1.1~1.5~1.9~2.3~2.7~3.1~3.5~3.9~
121210.08354739.50327966.392510487.40711193.28411596.64311899.16011899.16011899.161119100.00
例
某地119名正常女性發汞值資料如下表所示,試計算其中位數。
M即該地119名正常女性平均發汞值為1.26(g/g)10/13/2022109第一章衛生統計學緒論
指把數據從小到大排列后位于第X%位置的數值。它是一種位置指標,用來表示。一個百分位數是將全部變量值分為兩部分,在不包含的全部變量值中有的變量值比它小,有變量值比它大。
4、百分位數(percentile
)10/13/2022110第一章衛生統計學緒論百分位數圖示X%
PX(100-X)%50%分位數就是中位數
10/13/2022111第一章衛生統計學緒論
百分位數示意圖10/13/2022112第一章衛生統計學緒論(1)百分位數的計算
LX,iX
,fX分別為PX
所在組段的下限、組距和頻數,fL為PX
所在組段之前各組段的累積頻數。10/13/2022113第一章衛生統計學緒論發汞值(g/g)(1)頻數累積頻數累積頻率%(2)(3)(4)0.3~0.7~1.1~1.5~1.9~2.3~2.7~3.1~3.5~3.9~
121210.08354739.50
327966.39
2510487.40711193.28
411596.64311899.16011899.16011899.161119100.00P25(g/g)
例
某地119名正常女性發汞值資料如下表所示,試計算其P25,P75,P90。
10/13/2022114第一章衛生統計學緒論發汞值(g/g)(1)頻數累積頻數累積頻率
(2)(3)(4)0.3~0.7~1.1~1.5~1.9~2.3~2.7~3.1~3.5~3.9~
121210.08354739.50
327966.39
2510487.40711193.28
411596.64311899.16011899.16011899.161119100.00P75
(g/g)
例
某地119名正常女性發汞值資料如下表所示,試計算其P25,P75,P90。
10/13/2022115第一章衛生統計學緒論發汞值(g/g)(1)頻數累積頻數累積頻率
(2)(3)(4)0.3~0.7~1.1~1.5~1.9~2.3~2.7~3.1~3.5~3.9~
121210.08354739.50
327966.39
2510487.40711193.28
411596.64311899.16011899.16011899.161119100.00P90
(g/g)
例
某地119名正常女性發汞值資料如下表所示,試計算其P25,P75,P90。
10/13/2022116第一章衛生統計學緒論(2)百分位數的應用用于描述樣本或總體觀察值序列某百分位置的水平。用于確定偏態分布資料的參考值范圍。用于描述偏態資料的變異程度。10/13/2022117第一章衛生統計學緒論5、眾數眾數:指總體中出現機會最高的數值。樣本眾數則是在樣本中出現次數最多的數值10/13/2022118第一章衛生統計學緒論正態分布時:均數=中位數=眾數
正偏態分布時:均數>中位數>眾數
負偏態分布時:均數<中位數<眾數10/13/2022119第一章衛生統計學緒論變異指標:描述一組變量值的變異程度或離散趨勢的指標.常用的變異指標有極差、四分位數間距、方差或標準差、變異系數不同的分布使用不同的變異指標第三節描述離散趨勢的特征數10/13/2022120第一章衛生統計學緒論例
三組同齡男孩的身高值(cm)10/13/2022121第一章衛生統計學緒論例2-11試觀察3組數據的離散情況。A組2628303234B組2427303336C組262930313410/13/2022122第一章衛生統計學緒論
設有甲、乙、丙三名醫生,分別對相同的5份血樣進行紅細胞計數(萬/mm3),甲得出了560、540、500、460、440,乙得出了520、510、500、490、480,丙得出了510、505、500、495、490,見下圖2,三名醫生的計數結果得到的均數均為500,5個數值之和均為2500。10/13/2022123第一章衛生統計學緒論甲醫生得出的5個觀察值間的差異離散程度)較大,而丙醫生得出的5個觀察值間的差異(離散程度)較小。10/13/2022124第一章衛生統計學緒論
1、極差適用范圍:任何計量資料,是參考變異指標極差(R):即一組變量值最大值與最小值之差。10/13/2022125第一章衛生統計學緒論四分位數間距,用Q
表示:
適用范圍:適用于各種類型的連續型變量,特別是偏態分布的資料
2、四分位數間距10/13/2022126第一章衛生統計學緒論
說明有50%女性的發汞值在0.90和1.66之間,其四分位數間距為0.76(g/g),中位數為1.26(g/g)。上例
計算四分位數間距10/13/2022127第一章衛生統計學緒論方差(variance)也稱均方差,與標準差(standarddeviation)都是反映一組數據的平均離散水平的指標。
適用范圍:與均數配套用
3、方差與標準差總體方差、標準差用、表示;樣本方差、標準差用、表示.10/13/2022128第一章衛生統計學緒論
方差的計算公式(通常未知
)(將原有的單位平方)10/13/2022129第一章衛生統計學緒論樣本方差為什么要除以(n-1)
與自由度(degreesoffreedom)有關。自由度是數學名詞,在統計學中,n個數據如不受任何條件的限制,則n個數據可取任意值,稱為有n個自由度。若受到k個條件的限制,就只有(n-k)個自由度了。計算標準差時,n個變量值本身有n個自由度。但受到樣本均數的限制,任何一個“離均差”均可以用另外的(n-1)個“離均差”表示,所以只有(n-1)個獨立的“離均差”。因此只有(n-1)個自由度。
10/13/2022130第一章衛生統計學緒論
標準差的計算公式(通常未知
)
(應用非常廣泛
)
10/13/2022131第一章衛生統計學緒論
直接法(小樣本):頻數表法:標準差的計算或10/13/2022132第一章衛生統計學緒論例用直接法計算甲組兒童身高的標準差公式(3-6)10/13/2022133第一章衛生統計學緒論可見:甲組5名兒童的身高的變異程度最大,丙組最小。10/13/2022134第一章衛生統計學緒論120名成年男子血清鐵含量均數、標準差計算表(加權法)
組段
頻數(f)
組中值(X0)
fX
0fX02(1)(2)(3)(4)=(2)(3)(5)=(3)(4)
6~8~10~12~14~16~18~20~22~24~26~28~30
合計
120(∑f)
2228(∑fX0)43640(∑fX02)13681220271210841
7276610418034051337827620010829
7911131517192123252729
4924372613522700578097477938634850002916841
10/13/2022135第一章衛生統計學緒論標準差的基本內容是“離均差”,它顯示一組變量值與其均數的間距,故標準差直接、平均、總結描述了變量值的離散程度。10/13/2022136第一章衛生統計學緒論表示數據分布的離散程度,與均數配套
使用,常用于對稱分布資料。常用作為計量資料數字特征的描述。結合均數描述正態分布的特征,并確定醫學參考值范圍。可用來計算均數的標準誤。
標準差的應用10/13/2022137第一章衛生統計學緒論變異系數CV,其計算公式為可用于觀察指標單位不同時,如身高與體重的變異程度的比較。或用于均數相差較大時,如兒童身高與成人身高變異程度的比較。4、變異系數(coefficientofvariation)10/13/2022138第一章衛生統計學緒論例一:某地120名7歲男孩身高的均數為123.10cm,標準差為4.71cm;體重均數為22.29kg,標準差為2.26kg,比較其變異度。10/13/2022139第一章衛生統計學緒論年齡組人數均數標準差變異系數(%)
3~3.5
100
96.1
3.1
3.2
30~35
100170.2
5.0
2.93例二:
某地不同年齡組男子身高(cm)的變異程度。10/13/2022140第一章衛生統計學緒論變異系數的兩個特點
沒有單位:反映標準差占均數的百分比或標準差是均數的幾倍
不受平均水平的影響反映的是以均數為基數的相對變異的大小10/13/2022141第一章衛生統計學緒論絕對變異受平均水平的影響相對變異排除了平均水平的影響10/13/2022142第一章衛生統計學緒論小結
1、平均數與變異度的關系
(1)平均數表示的集中性與變異度表示的離散性,是從兩個不同的角度闡明計量資料的特征—變異度越小,平均數對各變量值的代表性越好—變異度越大,平均數對各變量值的代表性越差
10/13/2022143第一章衛生統計學緒論(2)通常,平均數與變異指標一起描述資料的分布特征。—用均數和標準差描述正態分布資料的特征;—用中位數和四分位數間距描述偏態分布資料的特征。10/13/2022144第一章衛生統計學緒論2、資料的指標描述是統計描述的一個重要的組成部分定量資料的統計指標平均水平指標:算術均數、幾何均數、中位數離散程度指標:全距、四分位數間距、方差、標準差、變異系數。10/13/2022145第一章衛生統計學緒論3、描述指標的選擇分布類型集中趨勢離散趨勢正態分布:均數方差、標準差、變異系數偏態分布:對數正態分布幾何均數對數值的方差或標準差
偏態分布中位數極差、四分位數間距10/13/2022146第一章衛生統計學緒論第四節描述分布形態特征數
描述分布形態的統計量:偏度系數與峰度系數。偏度系數(coefficientofskewness,SKEW):理論上總體偏度系數為0時,分布是對稱的;取正值時,分布為負偏峰;取負值時分布為正偏峰。樣本偏度系數計算公式:
10/13/2022147第一章衛生統計學緒論峰度系數(coefficientofkurtosis,KURT)
理論上,正態分布的總體峰度系數為0;取負值時,其分布較正態分布的峰平闊;取正值時,其分布較正態分布的峰尖峭。樣本峰度系數
10/13/2022148第一章衛生統計學緒論統計表與統計圖第四章Page48~6110/13/2022149第一章衛生統計學緒論第三節常用統計圖表一、統計表:將統計資料及其指標以表格列出,它可代替冗長的文字敘述,便于資料間的對比。二、統計圖:將統計資料以幾何圖形形象化的表述。表達資料形象,直觀,但不如統計表精確10/13/2022150第一章衛生統計學緒論一、統計表1.統計表的結構2.統計表的種類3.編制統計表應注意的事項4.不良統計表的修改舉例10/13/2022151第一章衛生統計學緒論(1)標題:(2)標目:(3)線條:(4)數字:無數字用“—”表示,缺失數字用“”表示,數值為0者記為“0”,不要留空項。(5)備注:1、統計表的基本結構
10/13/2022152第一章衛生統計學緒論
表4-2某藥物療效的頻數表治療結果頻數頻率(%)治愈6543.3有效4530.3無效2516.7惡化1510.0合計150100.0標題縱標目橫標目頂線底線數值10/13/2022153第一章衛生統計學緒論2.統計表的種類
根據分組標目的復雜程度,統計表可大致分為簡單表和復合表。
簡單表(simpletable):只按單一變量分組,由一組橫標目和一組縱標目組成。
復合表(combinativetable):按兩個或兩個變量結合起來分組,由一組橫標目和兩組及以上縱標目組成。10/13/2022154第一章衛生統計學緒論治療結果頻數頻率(%)治愈6543.3有效4530.3無效2516.7惡化1510.0合計150100.0表4-2某藥物療效的頻數表
簡單表10/13/2022155第一章衛生統計學緒論
某年某地城鄉各年齡組居民乙型肝炎病毒抗原攜帶率復合表或組合表10/13/2022156第一章衛生統計學緒論3.統計表制作的基本要求(1)簡明扼要,重點突出,即一張表一般表達一個中心內容,不要包羅萬象。(2)合理按排主語和謂語的位置,主次分明,條理清楚統計表就如完整的一句話,包括描述對象/主語和內容/謂語。通常主語放在表的左邊,作為橫標目;謂語放在右邊,作為縱標目。由左向右讀,構成完整的一句話。(3)數據準確、可靠,這是統計工作的根本。10/13/2022157第一章衛生統計學緒論例:下表是復方豬膽膠囊治療兩型老年性慢性支氣管炎的療效比較,請對該表的繪制進行評價,并指出所存在的問題。4.不良統計表的修改舉例10/13/2022158第一章衛生統計學緒論表4-15復方豬膽膠囊治療兩型老年慢性支氣管炎患者的療效比較
10/13/2022159第一章衛生統計學緒論二、統計圖統計圖(statisticalchart或statisticalgraph)是用點、線、面等幾何圖形,直觀形象地表達、描述數據或結果。
(一)
統計圖的結構
(二)
常用統計圖繪制方法及注意事項
10/13/2022160第一章衛生統計學緒論(一)統計圖的結構標題:用于簡明扼要地說明資料的內容,一般位于圖的下方中央位置。圖域:即制圖空間,是整個統計圖的視覺中心。除圓圖外,一般都是存在于特定的坐標體系下。標目:分為縱標目和橫標目,表示坐標系下縱軸與橫軸的含義。圖例:用于識別比較的統計圖中各種圖形所代表的含義。刻度:即縱軸和橫軸上的坐標。刻度數值按從小到大的順序,縱軸由下向上,橫軸由左向右排列。10/13/2022161第一章衛生統計學緒論圖4-7某工廠職工1994年、1998年四項生理指標異常檢出率檢出率(%)標目圖例標題10/13/2022162第一章衛生統計學緒論(二
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 物理高二常考題及答案
- 吉林省長春市朝陽區2023-2024學年中考數學仿真試卷含解析
- 塔吊基坑施工方案
- 湖南環境生物職業技術學院《商業漫畫項目開發實踐》2023-2024學年第二學期期末試卷
- 2025屆云南省迪慶州香格里拉中學高三二模模擬考試數學試題含解析
- 泉州華光職業學院《樂理基礎(2)》2023-2024學年第一學期期末試卷
- 南京理工大學泰州科技學院《生物考古學》2023-2024學年第二學期期末試卷
- 榆林學院《運動項目理論與實踐》2023-2024學年第二學期期末試卷
- 2024-2025學年西藏自治區日喀則市南木林高級中學高三下期4月月考生物試題測試試題含解析
- 西安建筑科技大學華清學院《貝葉斯統計導論》2023-2024學年第二學期期末試卷
- 上海建工標準化文明施工
- 2022年鹽城市交通投資建設控股集團有限公司招聘筆試真題
- 招標工作管理制度
- 交通運輸概論全集課件
- 電氣接線工藝培訓
- 第7課《誰是最可愛的人》 統編版語文七年級下冊
- 2020北京各區中考一模分類匯編-10幾何壓軸(答案含解析)
- 盟史簡介12.10.18課件
- 控制性詳細規劃技術路線(圖文)
- 加臭機加臭作業風險點辨識及控制措施表JSA
- 雙新背景下小學英語單元整體作業設計與優化探索 論文
評論
0/150
提交評論