




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、衛生統計學教學輔導(一)第一章 緒論 一、 衛生統計學的定義隨機現象隨機現象是指在一次試驗或觀察時,其結果不確定,而在相同條件下,大量試驗或觀察其結果呈現某種規律性的現象。數理統計是研究隨機現象規律性的一門數學學科。衛生統計學(health statistics)是運用數理統計的基本原理和方法,通過數據的收集,整理和分析,研究預防醫學和衛生事業管理中隨機現象規律性的一門應用科學。二、 衛生統計資料類型計量資料、計數資料、等級資料(一)計量資料用度量衡的方法測定每個觀察單位的某項指標,表現為數值的大小,通常是有度量衡單位,屬于連續性資料。 (二)計數資料將全體觀察單位按照某種性質或類別進行分類,
2、然后分別清點各類別的例數,這樣得到的數據稱為計數資料,也稱分類資料。二分類資料:例如,對某醫院做人力資源調查。以每個工作人員作為一個觀察單位,按技術人員和非技術人員分為兩類。多分類資料:如,觀察人群的血型,以人為單位,結果分為A型、B型、AB型、O型,為互不相容的多個類別。(三)等級資料將全體觀察單位按照某種性質或類別分類,各類別之間有程度的差別,分別清點各類中觀察單位的個數,這種數據資料稱為等級資料。三、統計學基本概念(一)總體總體是根據研究目的確定的同質觀察單位的全體,更確切地說,是同質的所有觀察單位某種變量值的集合。 (二)樣本與隨機抽樣從總體中隨機抽取部分個體,其實測值的集合稱為樣本。
3、 隨機抽樣,就是按照隨機的原則獲得樣本,保證總體中每個個體都有同等機會被抽取,使樣本對總體有較好的代表性。 (三)抽樣研究從所研究的總體中隨機抽取一部分有代表性的樣本進行研究稱為抽樣研究。抽樣研究的目的是通過樣本信息推論總體特征。(四)誤差誤差通常指測量值與真值之差。包括系統誤差、隨機測量誤差和抽樣誤差。1系統誤差:又稱偏倚不是偶然機遇造成的,而是某種必然因素所致,具有一定的傾向性。觀察結果一慣性的往一邊偏,要高都高,偏低都低。系統誤差一旦發生,統計學是無能為力的,因此要盡可能避免。而大多數系統誤差可以通過周密的研究設計得到解決。2隨機測量誤差:這種誤差是偶然因素所致,故無方向性,如對同一樣品
4、多次測定,結果有高有低,不完全一致。隨機測量誤差是不可避免的。3抽樣誤差:抽樣研究所抽取的樣本,只包含總體中的部分個體,由于存在個體變異,樣本指標往往不等于總體參數,這種差異是由抽樣造成的,稱為抽樣誤差。(五)概率概率是描述隨機事件發生的可能性大小的指標,用P來表示。隨機事件的概率在0與1之間,常用小數或百分數表示。P越接近1,表明某事件發生的可能性越大,P越接近0,表明某事件發生的可能性越小。小概率事件:隨機事件P£0.05或 P£0.01,分別表示事件發生的可能性等于或小于0.05(5%)和可能性等于或小于0.01(1%),在一次試驗或觀察時發生的可能性很小,習慣上稱為
5、小概率事件。(六)頻率 若隨機事件在n次重復中出現m次,則n/m比值成為隨機事件出現的頻率。當n充分大時,隨機事件的頻率接近概率。四、統計工作的基本步驟(一)設計研究分析的總設想。包括專業設計和統計設計,也就是除了專業方面的研究目的技術路線外,還包括抽樣方法、樣本含量等。需要強調的是良好的設計是統計分析的基礎。(二)收集資料資料必須完整、正確和及時;要有足夠的數量;注意資料的代表性和可比性。(三)整理資料原始資料的檢查與核對資料的分組設計和歸納匯總(四)分析資料統計描述:用一些統計指標,統計圖表等方法對資料的數量特征和分布規律進行測定和描述。統計推斷:用樣本信息推斷總體特征,包括參數的估計和假
6、設檢驗。 本章要求學生從以下方面掌握知識:1 了解:知道衛生統計工作的基本步驟2.熟悉:理解以下基本概念:同質與變異、總體與樣本、抽樣研究與誤差、隨機事件與概率,描述小概率事件的含義。3掌握:熟悉變量的統計分類,掌握誤差的分類。能夠對不同類型的資料,運用不同的統計分析方法第二章 計量資料的統計描述 第一節 計量資料的頻數表一、頻數表計量資料需編制頻數分布表,頻數表編制的步驟參見實用衛生統計學第二章第一節中的內容,頻數表包括一些有序的組段及落在各或組段內的觀察值的個數即頻數。從而了解資料的特征和分布類型。二、頻數分布兩個特征:集中趨勢和離散趨勢。三、頻數分布類型1對稱分布:是指集中位置在正中,左
7、右兩側頻數分布大體對稱的分布。2偏態分布:偏態分布是指集中位置偏向一側,兩側頻數分布不對稱。如果集中位置偏向數值小的一側,稱為正偏態分布;若集中位置偏向數值大的一側,則稱為負偏態分布。3對數正態分布:有些偏態分布的資料,其原始數據經過對數轉換后(如用原始數據的對數值lgX代替X)服從正態分布,稱為對數正態分布。 第二節 描述集中趨勢的指標一.算術均數(arithmetic mean)簡稱均數。常用表示總體均數,用表示樣本均數。均數反映一組觀察值在數量上的平均水平。 (一)均數的適用條件適用于對稱分布尤其是正態分布資料。 (二)均數的計算 1直接法 (2.1)2加權法(weighting met
8、hod) (2.2) 對已繪制頻數表的資料,也可用加權法求均數。這時用各組段的組中值作X,組中值為本組段的下限與下一個組段的下限相加再除以2。 二、幾何均數(geometric mean)幾何均數用符號G表示。 (一)適用條件1 等比資料,如醫學上血清抗體滴度,人口幾何增長等資料。 2對數正態分布資料(有些偏態分布的資料,原始數據經過對數轉換后服從正態分布),如疾病的潛伏期等資料。 (二)幾何均數的計算 1直接法 當樣本量n較小時,常用直接法求幾何均數。其對數形式為 (2.4) 2加權法 當資料中相同觀察值個數較多時,或頻數表資料,可用下式計算 (2.5)公式中X為各組的效價或滴度的倒數(等比
9、資料時)或各組的組中值(對數正態分布資料時),f為各組的頻數。 三、中位數(median)用M表示,它是指一組由小到大順序排列的觀察值中位次居中的那個觀察值。 (一)中位數的適用條件1偏態分布資料。 2分布類型不明確的資料。 3資料的一端或兩端無確定數據不能求均數和幾何均數時,可求中位數。 (二)中位數的計算 1直接法 當觀察值個數n較小時,可直接由原始數據求中位數。先將觀察值由小到大順序排列,再按公式(2.6)或(2.7)計算。 n為奇數時, (2.6) n為偶數時, (2.7) 2頻數表法 當觀察值例數較多時,先將觀察值歸納成頻數表,按組段由小到大計算累計頻數和累計頻率,再按公式(2.8)
10、計算中位數。 (2.8)公式中L為包括中位數(即累計頻率為50%)的那個組段的下限,i為該組段的組距,fM為該組段的頻數,fL小于L的各組段的累計頻數,n為總例數。第三節 描述離散趨勢的指標 描述離散趨勢常用指標有極差、四分位數間距、方差、標準差和變異系數,其中以方差和標準差最為常用。 一、極差(range,R)極差=最大值-最小值。用極差描述變異度大小,簡單明了。缺點為:除最大值和最小值外,不能反映組內其它數據的變異度。易受個別特大值、特小值的影響,即不夠穩定。即使樣本例數不變,極差的抽樣誤差亦較大。 二、四分位數間距(quartile interval,Q) (2.10)它也可被看成是中間
11、一半觀察值的極差。它和極差類似,仍未考慮到每個觀察值的變異度。但它比極差穩定。它適用于任何分布資料,主要用于偏態分布資料,特別是末端無確定數據的資料。Q越大,數據分布的變異度越大。 三、方差(variance)和標準差(standard deviation) (一)方差 為克服極差的缺點,需全面考慮每個觀察值的離散情況,就總體而言,應考慮總體中每個觀察值(變量值)X與總體均數之差,稱為離均差X-。由于X-有正有負,相互抵消,這樣就不能反映變異度大小,故將離均差平方后再相加,即(X-)2,稱為離均差平方和。但(X-)2大小,除了與變異度有關外,還與觀察值的個數N的多少有關。即使兩總體變異度相同,
12、N大則(X-)2亦大。為消除這一影響,求其平均來描述離散趨勢,這就是總體方差,用符號2表示。 (2.11)實際工作中,很難得到總體均數和總例數N,常需根據樣本均數和樣本例數n,計算出樣本方差,用樣本方差估計總體方差。樣本方差用s2 表示。樣本方差s2的公式為 (2.12)公式中n-1,在統計學上稱為自由度(degree of freedom)。2或s2越大,觀察值的變異度越大,即離散程度越大。方差適用于描述對稱分布,尤其正態分布資料的離散趨勢。 (二)標準差 方差的單位是原來測量單位的平方,為了使用原測量單位,常將方差開平方,這就是標準差。總體標準差用符號表示,樣本標準差用符號s表示。總體標準
13、差 (2.13) 樣本標準差 (2.14) 1標準差適用條件:對稱分布資料,尤其正態分布資料。 2標準差的意義:標準差可反映全部個體觀察值的離散程度,標準差越大,觀察值的變異越大,數據越分散,均數的代表性越差。標準差越小,說明資料離散程度小,資料較集中,均數的代表性好。 3標準差的計算有直接法和加權法 (1)直接法 數學上可證明 ,在計算標準差時,可直接將原始數據代入公式(2.15),從而使得計算更為方便。 (2.15)(2)加權法 頻數表資料可用加權法計算標準差,公式如下 (2.16) 四、變異系數(coefficient of variation,CV)變異系數為標準差s與均數之比用百分數
14、表示,公式為 (2.17)變異系數常用于: 1.度量衡單位不同的多組資料的變異度的比較。例如,欲比較身高和體重何者變異度大,由于度量衡單位不同,不能直接用標準差來比較,而應用變異系數比較。2比較均數相差懸殊的多組資料的變異度。第四節 正態分布及其應用 一、正態分布的概念和特征 (一)標準正態變換和標準正態分布為應用方便,常將服從正態分布的原始變量XN(,)進行變量變換 (2.19) 這種變換叫標準正態變換(或u變換)。u 稱為標準正態變量,它服從均數為0,標準差為1的標準正態分布,即uN(0,1)。通過標準正態變換,可將正態分布變換為標準正態分布。標準正態分布的密度函數如下 -¥&l
15、t; u<+¥ (2.20)為標準正態分布的密度函數,即縱坐標高度。根據u 的不同取值,就可按公式(2.20),繪出標準正態分布的圖形。 二正態曲線下面積的分布規律 實際工作中,經常需要了解正態曲線下橫軸上的一定區域的面積占總面積的百分數,用以估計該區間的觀察例數占總例數的百分數,或變量值落在該區間的頻率或概率。 (一)正態分布及標準正態分布曲線下的面積 正態曲線下橫軸上一定區間的面積可以通過對公式(2.18)積分來求得,然而對該公式的積分有時是很困難的。標準正態曲線下的面積可通過對公式(2.20)積分求得,即 (2.22)可得到標準正態曲線下,橫軸上自-¥到u 的面
16、積,即下側的累計面積(概率)。統計學家已按公式(2.22)求積分,并編制出標準正態分布表(附表1),我們可以通過查表求出標準正態曲線下某個區間的面積。在實際應用中,對于服從正態分布的數據,只需通過變量變換把正態變量X變換為標準正態變量u,然后再查標準正態分布表,就可很容易地得到正態曲線下某個區間的面積。 (二)標準正態分布表(附表1) 1標準正態曲線下橫軸上的總面積為1或100%。2標準正態曲線以0為中心,左右完全對稱,所以曲線下對稱于0的區間面積相等,因而附表1只列出F (-u)值(即-¥到-u的面積值)。橫軸上從u = -1.96 到u = 1.96 的區間所對應的曲線下面積為9
17、5%;從u = -2.58 到u = 2.58的區間所對應的曲線下面積為99%;從u = -1.64 到u = 1.64 的區間所對應的曲線下面積為90%。 3對于服從正態分布的資料,若求曲線下任意(X1,X2)區間的面積,可先將已知變量X1和X2作標準化變換(u變換),然后借助標準正態分布表求得。當正態分布和已知時,再查表求出相應的面積。若和未知,但樣本量足夠大,常用樣本均數和標準差s分別代替和,進行u變換,再查表求出相應的面積。 三、正態分布的應用 多醫學現象服從正態分布或近似正態分布,如身高、體重,同性別健康成人的紅細胞、血紅蛋白含量、膽固醇含量等,以及實驗中的隨機誤差等均服從正態分布,
18、可按正態分布的規律來進行統計處理。對于一些對數正態分布資料,亦可接正態分布規律處理。 (一)醫學參考值的估計 參考值范圍又稱正常值范圍。醫學上常把包括絕大多數人某項指標的數值范圍稱為該指標的參考值范圍。制定考值范圍,應從以下幾個方面考慮:(1)首先需要確定一批樣本量足夠大的“正常人”。(2)根據研究目的,選擇適宜的百分界值,最常用的是95%。(3)根據指標的實際用途確定單側或雙側界值。(4)根據資料的分布特點,選用恰當的界值計算方法。可參閱表2.6。表2.6 醫學參考值范圍的制定%正態分布法百分位數法雙側單側雙側單側下限上限下限上限90P5-P95P10P9095P2.5-P97.5P5P95
19、99P0.5-P99.5P1P99 (二)質量控制。控制實驗誤差,常以作為上、下警戒值,以作為上、下控制值,這里的2S、3S分別是1.96S和2.58S的近似值。本章要求學生從以下方面掌握知識:1了解:知道正態分布的含義,描述正態分布曲線的特征,知道平均指標和離散指標的加權法的計算方法。 2熟悉:計量資料的統計描述的基本概念,平均指標、離散指標的直接法計算公式及各自適用條件,列舉均數和標準差指標,熟悉標準差的意義及應用。3掌握:掌握曲線下面積分布規律,應用特殊u界值,熟練掌握正態分布的有關應用,會編制頻數表。第三章 計數資料的統計描述 第一節 常用相對數一、構成比又稱構成指標,它表示事物內部各
20、組成部分所占的比重或分布。常用百分數表示構成比有兩個特點:(1)各部分構成比之和為100或1。(2)某一部分所占的比重增大,其它部分的比重會相應減少。二、率又稱頻率指標,說明某現象的發生頻率或強度。比例基數可依據使用習慣或保留位數來選擇。三、比又稱相對比。是A、B兩個有關聯指標之比,相對比中A、B兩指標可以是性質相同的,也可以是性質不同的。可以是絕對數,也可以是相對數或平均數。第二節 應用相對數時的注意事項一、構成比與率應用時不能相互混淆。構成比說明事物內部各組成部分所占的比重,而率則說明某事物或現象的發生頻率或強度。常見的錯誤之一是以構成比代替率來說明問題。二、樣本含量太小時,不宜計算相對數
21、一般來說觀察單位足夠多時,計算的相對數比較穩定,能夠正確反映實際情況。觀察單位少時,偶然性大。觀察例數少,最好用絕對數來表示。三、對各組觀察例數不等的幾個率,不能直接相加求其總率四、在比較相對數時應注意資料的可比性可比性是指對研究結果有影響的非處理因素在各處理組之間應盡可能相同或相近。因為影響結果的因素往往是多方面的,只有控制了其它方面因素的影響才能正確反映處理因素的效應。在實驗性研究中,設計和實施階段均應注意可比性。在觀察性研究中,在資料分析時應注意可比性。同樣需要考慮可比性問題。但在觀察性研究中由于研究者不能采取隨機分配的方法來平衡或消除非研究因素對研究結果的影響,同時也不能控制實驗條件。
22、因此,在比較研究結果時(如比較不同組的率時),應考慮影響率的其它因素在各組間構成是否相同。第三節 率標準化法率標準化法的基本思想就是采用統一的標準人口構成,以消除人口構成不同對人群總率的影響,使算得標準化率具有可比性。推而廣之,兩人群發病率、死亡率、出生率、病死率等的比較,常考慮人群性別、年齡等構成的影響,需對率進行標準化。二、標準化率的計算常用的計算方法有:直接法和間接法。應根據現有數據的條件選用直接法或間接法。(一)直接法計算標化率需要的條件1資料條件:已知實際人群的年齡別(組)率,且各年齡組率無明顯交叉。年齡組率的交叉是指低年齡組率甲人群高于乙人群,而高年齡組率則乙人群高于甲人群。2選擇標準人群:可選擇標準人群的年齡組人口數或構成比。理論上用同一標準人群的年齡組人口數和用其構成比算得的標化率結果應相同,但由于運算中四舍五入的影響可能結果稍有出入。標準人群的選擇(1)可根據研究目的選擇有代表性的、較穩定的、數量較大的人群。(2)選擇相互比較的人群合并數據作標準。(3)選擇相互比較的人群之一作標準。(二)應用標準化法的注意事項1標準化只能解決不同人群內部構成不同對其總率有影響的情況,標準化法不能解決所有可比性問題。2標化率,已經不再反映當時當地的實際水平,它只
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 【正版授權】 IEC 63169:2020+AMD1:2024 CSV EN Electrical household and similar cooling and freezing appliances - Food preservation
- 【正版授權】 IEC 60826:2003 EN-D Design criteria of overhead transmission lines
- 【正版授權】 IEC 60870-5-104:2006 EN-D Telecontrol equipment and systems - Part 5-104: Transmission protocols - Network access for IEC 60870-5-101 using standard transport profiles
- 護理導論與護理程序
- 醬香酒知識培訓課件
- 糖尿病及護理
- 心臟外科護理手術配合
- 妊娠期糖尿病護理
- 2025年慶八一建軍節主題活動方案策劃書
- 2025年精神文明建設工作方案
- 專題09 產業區位與產業發展【知識精研】高考地理二輪復習
- 2025年部門預算支出經濟分類科目說明表
- 《陸上風電場工程概算定額》NBT 31010-2019
- 2024年山東省事業單位歷年面試題目及答案解析50套
- YB-4001.1-2007鋼格柵板及配套件-第1部分:鋼格柵板(中文版)
- 維生素D教學講解課件
- 診所備案申請表格(衛健委備案)
- 案例收球器盲板傷人事故
- 《雷鋒叔叔_你在哪里》說課稿
- bim畢業設計--精選文檔
- 某紡織廠供配電系統設計(DOC25頁)
評論
0/150
提交評論