北醫專升本2009衛生統計學總結_第1頁
北醫專升本2009衛生統計學總結_第2頁
北醫專升本2009衛生統計學總結_第3頁
北醫專升本2009衛生統計學總結_第4頁
北醫專升本2009衛生統計學總結_第5頁
已閱讀5頁,還剩12頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、2009衛生統計學第一章 緒論1. 統計工作的步驟:設計、搜集資料、整理資料、分析資料。2. 統計資料的類型:計量資料、計數資料、等級資料。計量資料計數資料概念通過度量衡的方法,測定每一個觀察單位的某項研究指標的量的大小,而得到的一系列數據資料,就成為計量資料。將全體觀察單位,按照某種性質或特征分組,再分別清點各組中觀察單位的個數,這樣得到的資料,就是計數資料。特點有單位連續性資料沒有度量衡單位間斷性資料3. 總體和樣本總體:是根據研究目的而確定的同質研究對象的全體。總體是指性質相同的符合研究要求的所有觀察單位的該項變量值的全體。樣本:總體中隨機抽取的一部分。例如:1.總體:我班全體女生身高的

2、測量值 樣本:我班30個女生身高的測量值2.調查某地1999年正常成年男子的紅細胞數,則觀察對象是該地1999年正常成年男子,總體就是該地1999年正常成年男子的血紅細胞數。4. 常用的選擇樣本(抽樣)方法有:概率抽樣和非概率抽樣5. 常用的概率抽樣方法:簡單隨機抽樣(單純隨機抽樣)系統抽樣(機械抽樣)分層抽樣整群抽樣統計描述統計推斷應用計量資料頻數分布集中趨勢離散趨勢統計圖表抽樣誤差標準誤t u F檢驗秩和檢驗正常值范圍估計可信區間的估計計數資料相對數及其標準化統計圖表u 、c2檢驗秩和檢驗疾病統計人口統計相關與回歸r b統計圖表t 檢驗第二章 集中趨勢,離散趨勢,正態分布及其應用1. 頻數

3、分布的類型:對稱分布、偏態分布。2. 對計量資料進行分析時,經常用平均數來反映其離散程度。均數適用于對數分布資料,特別是正態分布資料。3. 平均數:表示一組性質相同的變量值的平均水平或集中位置。4. 常用的平均數有:算術均數,幾何均數,中位數。5. 集中位置的描述:算術均數,幾何均數,中位數,百分位數。注:幾何均數的應用條件:等比數列資料(觀察值呈倍數增長的資料)、對數正態分布或對數近似正態分布的資料。 幾何均數的用途:計算平均血清抗體滴度和血清凝集效價。中位數應用條件:偏態分布,數據一段或兩端沒有確切值,數據分布不清楚中位數:n 為奇數: 如:2,3,4,5,6 求中位數:M=X(5+1)/

4、2=4n 為偶數:百分位數: L:PX所在組段下限 fX:PX所在組段頻率 i:該組段的組距fL:小于L各組段的累計頻率中位數:例題:頻數表法計算中位數潛伏期(小時)頻數 f累計頻數f累計頻率(%)(1)(2)(3)(4)0252515.212588350.6721164100.06. 離散程度的描述:全距(R)、四分位間距(Q=P75-P25)、方差、標準差(SD)、變異系數(CV)7. 全距 (R) : R = 最大值 最小值 總體均數用 µ 表示樣本均數用表示。 方差:方差的平方根就是標準差。8. 標準差(SD)的意義:反映一組觀察值變異程度大小的指標。兩組在單位相同,均數相近

5、的前提下,標準差大說明這組觀察值變異大,即觀察值圍繞均數分布較分散,均數的代表性差;反之,說明各觀察值多集中在均數周圍,均數的代表性好。9. 總體標準差: 樣本標準差:直接法: 加權法:例如:1.計算 4, 5, 6, 7, 8 的標準差。n =5, X=4+5+6+7+8=30X2=42+52+62+72+82=190代入公式:10. 變異系數公式:例題1:18歲女性身高:均數為163.84 cm,標準差為3.79 cm體重:均數為48.50 kg, 標準差為3.80 kg比較身高與體重的變異程度?身高= 3.79 / 163.84 × 100% = 2.31%體重 = 3.80

6、/ 48.50 × 100% = 7.84%應用范圍:比較度量衡單位不同的多組資料的變異度(身高和體重的比較)比較均數相差懸殊的多組資料的變異度(3歲男孩和18歲男孩的身高)11. 正態分布的特征:均數處最高;以均數為中心左右對稱; 正態分布兩個特征位置參數和變異度參數,正態分布: N (, ) 標準正態分布:N ( 0 , 1 ) 均數決定位置,標準差決定形狀。圖形為倒扣鐘形正態分布轉換為標準正態分布的公式:12. 醫學參考值(正常值)范圍的估計(1)正態分布法 a:應用條件:正態分布或近似正態分布資料 b:計算(雙側)95% 正常值(醫學參考值)范圍公式:99% 正常值(醫學參考

7、值)范圍公式:(±2.58·S)例如:上例100名女大學生身高資料:估計女大學生身高參考值(正常值)范圍(163.84-1.96 × 3.79,163.84+1.96 × 3.79 )即(156.41 cm,171.27 cm )13. 百分位數法應用條件:偏態分布資料 雙側界值:P 2.5 P 97.5 單側上界: P 95 單側下界: P 5 習題:1.各觀察值加同“1”后:A.均數不變,標準差改變B.均數改變,標準差不變C.二者均不變 D.均改變2.用均數和標準差可全面描述:A.正偏態資料 B.負偏態資料 C.正態分布和近似正態分布 D.任何分布3

8、.正態分布曲線下,從均數u 到u +1.96s的面積為;A.95% B.45% C. 97.5% D.47.5%14. 正態分布指標:15. 偏態分布指標:全距和四分位間距,最好的是四分位間距第三章 計量資料的統計推斷1. 抽樣誤差:抽樣引起樣本統計量與總體參數之間的差異。2. 均數的抽樣誤差:抽樣引起的樣本均數與總體均數之差。3. 標準誤:標準誤是表示抽樣誤差大小的指標,是樣本均數的標準差。4. 總體標準誤計算公式:5. 樣本標準誤計算公式:舉例:對某地健康成年女性的血紅蛋白含量進行抽查。隨機抽取了225人,結果算出 X=117.6g/L,S=10.2g/L,求其標準誤的大小?6. 均數標準

9、誤的意義及與樣本量的關系:標準誤反映抽樣誤差的大小。標準誤越小,說明抽樣誤差越小, 用樣本均數估計總體均數的可靠性越大。從計算式中還可以看出:S一定時, n越大,也就是樣本量越大,標準誤越小。所以我們可以通過增加樣本量來減小抽樣誤差。7. 總體均數的估計指由樣本均數估計總體均數,包括點估計、區間估計。8. 區間估計:(1)(3)95%總體均數的可信區間:(4)99%總體均數的可信區間:9. 例:在某市成人中隨機抽取400人測每分鐘脈搏,測得=74.5次/分,S=6次/分。求該市成人平均脈搏的95%可信區間和99%可信區間。該市成人平均脈搏的95%可信區間: n = 400 , =74.5次/分

10、, S =6次/分,a=0.05(雙側) , ua=1.96,±ua·s =74.5±1.96´ = (73.9,75.1) 次/分成人平均脈搏的95%可信區間是73.975.1次/分。該市成人平均脈搏的99%可信區間: n = 400 , =74.5次/分, S =6次/分, a=0.01(雙側), ua=2.58 ±ua· =74.5 ±2.58´ = (73.7,75.3) 次/分成人平均脈搏的95%可信區間是73.7次/分75.3次/分。可信區間的意義:成人平均脈搏95%可信區間是指:成人平均脈搏有95%可

11、能性在73.9次/分75.1次/分這個區間;換句話說,做出該市成人平均脈搏為73.9次/分75.1次/分的結論,說對的概率是95%,說錯的概率是5%;2均數假設檢驗的注意事項1進行假設檢驗,在判斷結果時,可能發生兩類錯誤拒絕了實際成立的檢驗假設H0,這叫第類錯誤。 接受了實際上不成立的檢驗假設H0,這叫第類錯誤。 當樣本含量一定時,a 愈小,則 愈大;反之 a 愈大則愈小。 當a一定時,增加樣本含量,可以減少。2選用的假設檢驗方法應符合其應用條件。 3正確理解假設檢驗的結論。4.當不能拒絕H0 時,即差異無統計學意義,應考慮到兩方面的因素。一方面可能總體均數的確無差異,另一方面也應考慮到可能是由于觀察對象個體之間的差異大(即S大),而觀察對象數目又不夠多,因此差異沒有表現出統計學意義

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論