衛生統計學綜合復習匯總_第1頁
衛生統計學綜合復習匯總_第2頁
衛生統計學綜合復習匯總_第3頁
衛生統計學綜合復習匯總_第4頁
衛生統計學綜合復習匯總_第5頁
已閱讀5頁,還剩12頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

PAGEPAGE4統計學復習基本概念部分總體和樣本觀察單位隨機樣本和非隨機樣本的隨機化變量、隨機變量;變量的類型連續變量:有單位,理論上變量值可以充滿區間。分類變量:屬性。無序分類變量,雖可以用數值表示第幾類,但數值無意義,只是代號。有序分類變量,雖可以用數值量化,但數值的大小無意義,意義在于數值之間的間距和順序關系。計數變量:特點是離散、有序。某些情況下可以按連續變量處理。實際頻數分布觀察單位個數的分布。連續變量要按變量值分組段,總結各組段觀察單位的個數。計數變量要按觀察時間單位、面積單位總結計數變量值本身。分類變量要按類別總結觀察單位的個數。實際上,后面兩種變量在只有一次抽樣時無法完成實際頻數分布的刻畫。數據的集中趨勢和離散趨勢集中趨勢連續變量對稱分布:算術平均數(簡稱均數)+中位數。連續變量非對稱分布:中位數。分類變量:具有所關心特征(類別)的觀察單位的個數(頻數)。百分構成(比例)、率、比。計數變量:單位時間、單位面積內所關心事件的發生數。求和問題。離散趨勢:衡量距集中趨勢遠近的程度連續變量對稱分布:離均差平方和、方差、標準差。連續變量非對稱分布:百分位數間距。抽樣變異和抽樣分布抽樣變異:反復抽樣后,每個樣本都是不同的。反復抽樣指每次抽樣的樣本量相同。抽樣分布:反復抽樣后,樣本集中趨勢的分布。對于連續變量樣本標準差當然也是有分布的,但本處不考慮。連續變量:樣本均數的分布—按樣本均數值分組段,總結各組段樣本的個數。分類變量:具有所關心特征(類別)的觀察單位的個數(頻數)的分布—按觀察單位的個數總結樣本的個數。計數變量:單位時間、單位面積內所關心事件的發生數的分布—按發生數總結樣本的個數。抽樣分布的集中趨勢和離散趨勢連續變量:反復抽樣樣本均數的均數—集中趨勢;反復抽樣樣本均數的標準差(標準誤)—離散趨勢。分類變量:反復抽樣樣本具有所關心特征(類別)的觀察單位的個數(頻數)的均數—集中趨勢;具有所關心特征(類別)的觀察單位的個數(頻數)的標準差(標準誤)--離散趨勢。計數變量:反復抽樣樣本單位時間、單位面積內所關心事件的發生數的均數—集中趨勢;反復抽樣樣本單位時間、單位面積內所關心事件的發生數的標準差(標準誤)--離散趨勢。相對頻數分布和概率分布(請只考慮抽樣分布)各組段樣本數占總樣本數的比例的分布。當反復抽樣樣本的樣本量足夠大時,相對頻數分布逼近概率分布(理論分布)。各種各樣的理論分布原始數據分布正態分布、對數正態分布、二項分布、泊松分布等等。抽樣分布當樣本量足夠大時,任何原始數據分布的抽樣分布均逼近正態分布(中心極限定理)。標準正態分布正態分布數據的標準化。對于連續變量還涉及t分布。正態分布(含標準正態分布和t分布)的性質樣本信息對總體的統計推斷(請只考慮集中趨勢的推斷)所有的推斷均是基于抽樣分布的。要求隨機(大)樣本區間估計連續變量:樣本均數推斷總體均數;利用樣本均數的標準差(標準誤)構建總體均數的可信區間。分類變量:樣本百分構成(比例)、率、比推斷總體相應參數;利用標準誤構建相應總體參數的可信區間。計數變量:樣本單位時間、單位面積內所關心事件的發生數推斷總體相應參數;利用標準誤構建相應總體參數的可信區間。假設檢驗:評價樣本來自于某參照總體的可能性。無效假設:用來推翻的假設。如:假設樣本來自于某參照總體。備擇假設:用來接受的假設,是與無效假設的對立的假設。如:假設樣本不是來自于某參照總體。檢驗水準:評價上述可能性是大還是小的標準。如可能性小于檢驗水準則拒絕無效假設,接受備擇假設。反之,則說明尚無足夠證據推翻無效假設。檢驗水準有單側和雙側之分。界值:對應于檢驗水準的某分布上的百分位數。其他基本概念觀察性研究和實驗性研究、前瞻性研究和回顧性研究、縱向研究和橫斷面研究、定群研究和病例對照研究、對照、雙盲;小概率事件、P值、I型錯誤和II型錯誤、檢出力、多重檢驗問題;相關關系和因果關系、殘差。基本計算部分連續變量的均數、離均差平方和、方差(含均方)、標準差、標準誤、百分位數(含中位數)。二分類變量的百分構成及其標準誤、RelativeRisk(RR,相對危險度)、Odds(比數)及OddsRatio(OR,比數比) =143.07(cm),=0.82(cm)問是否可認為該市12歲男孩身高(=?)未達到全國的平均水準?解:在這里我們要考慮抽樣誤差,可用假設檢驗的方法來分析,其步驟和基本思想如下述。樣本差異樣本差異():143.07-145.28=-2.21cm 有本質差別(H1)?抽樣誤差引起(H0)? (未知規律)(有分布規律)步驟假設與分析判斷(概率意義下的反證法)1.建立無效假設H0:總體均數相等例:H0=0H1:總體均數不等H1≠0=0.05(水準)2.計算統計量例:選u檢驗當H0成立時,誤差服從u分布010123-1-2-3-1.961.96P=0.025u3.作出統計結論例:P<0.05,拒絕根據u分布規律判斷P值H0,接受H1uu1.96是(若P0.05,則拒絕H0,接收H1)4.寫出檢驗報告例:該市12歲男孩身高低于全國平均水平否(若P0.05,則不拒絕H0“接受”H0)圖3.3假設檢驗邏輯過程示意圖注意:上述檢驗過程是概率意義下的反證法,不論是否拒絕H0,都會犯錯誤,結論是相對的,千萬不要絕對化(詳見下節)。★單側雙側問題:單側與雙側可信區間:雙側:總體均數既可能在樣本均數的左側,又可能在右側總體均數一定在樣本均數的某一側(經驗判斷)或質量控制要求,不允許出現某一側事件單側與雙側檢驗:雙側:備擇假設H1為≠0總體均數一定落在右側(或左側)(經驗判斷)note:只有對總體有所了解或特殊要求時,才能用單側★資料的統計分析方法(系統過程):三大步驟1.描述樣本數據:圖表(可省)和統計描述指標①正態(如生理指標):②對數正態(如抗體滴度):G③偏態(如住院天數或潛伏期):M~Q2.估計總體參數:常可省略3.檢驗總體參數:注意對比類型、單側雙側以上內容是統計基礎(全面復習)。以上內容講述了定量資料統計分析系統,其它類型資料的統計分析也是上述三大步驟。方差分析3.34.14.44.23.65.0Xij3.64.24.44.74.45.54.33.33.44.25.14.7均數3.8004.2174.7174.244()★方差分析基本思想:1.離均差平方和分解(變異數分析),以及自由度分解2.求方差(均方):計算組間和組內的“平均”變異程度3.求F統計量:F=MS組間/MS誤差(H0成立則F=1)★方差分析基本步驟:1.作檢驗假設:H0:總體均數相等;H1:總體均數不全相等2.計算統計量F值:3.確定P值并作出結論:4.兩兩均數間比較(當P≤0.05時)分類資料的統計描述★分類資料的統計分析步驟:(一般用正態近似法)1.統計描述:p,(或X)2.參數估計:±1.96Sp,(或二項分布、Poisson分布直接計算)3.參數檢驗:u,2,(或二項分布、Poisson分布直接計算概率)★標準化法基本思想:按標準人口構成來折算合計率★應用相對數的注意事項:n大小、頻率與構成比的區別、內部構成是否一致等 二項分布與Poisson分布及其應用★這2個分布是分類資料統計分析的基礎2檢驗★四格表與配對四格表(要熟記結構)★2檢驗基本思想:H0成立時,可參照合計率計算理論數,其理論數與實際數的差別代表隨機誤差,一般不會很大。當2值大到一定程度,超過檢驗界值時,便可在水準下拒絕H0★2檢驗的條件:n與T要同時考慮秩和檢驗★秩和檢驗基本思想:1.數值變換為秩次(d→t):配對設計為例 差值d的變異度因分布不同而異,但秩次大小與分布無關2.秩和(T=∑t+)的分布的規律可從理論上推導,作假設檢驗表n=3時的秩和T及其分布秩次t(名次)組合情況定義秩和T=∑t+理論頻數f概率分布P=f/∑f0個正秩次:-1-2-3010.1251個正秩次:+1-2-3110.125-1+2-3210.125-1-2+320.2502個正秩次:+1+2-3+1-2+3410.125-1+2+3510.1253個正秩次:+1+2+3610.125合計8(∑f)1.000圖秩和圖秩和T的理論頻數分布及其正態擬合曲線03691215a.秩和(n=3,Σf=8)0123概率頻數.250.125.37503691215b.秩和(n=5,Σf=32)0123概率頻數.062.031.093★秩和T的分布沒有參數,唯一由例數n決定,故稱非參數法回歸與相關★兩個關聯變量資料的統計分析步驟:1.統計描述:①圖表:頻數表(大樣本)、散點圖(大或小樣本)②指標:回歸系數b反映由x估計的y的平均水平相關系數r反映散點關于回歸直線的離散程度(反面)2.參數估計:回歸直線的可信區間(雙弧線、略)3.參數檢驗:t檢驗、方差分析★note:要熟記散點圖(包括回歸直線)常用統計圖表總則:簡單明了、便于比較實驗設計要素、原則、對照、隨機分組調查設計4種常用的抽樣方法調查表設計項目(核對項目、分析項目)醫學人口統計與疾病統計常用指標人口金字塔、老年人口、總和生育率(現時年齡組生育率推算假象人群的生育水平)壽命表原理:現時年齡組死亡率推算假象人群的平均壽命人年生存分析生存分析的基本概念1.隨訪資料的記錄(數據結構):特點為(1)因變量有2個,即生存時間和結局(死亡與否);(2)生存時間存在觀察不完全的數據表17.15例肝癌隨訪記錄序號姓名協變量登記觀察記錄整理性別(男=1)處理組號開始日期終止日期生存天數結局(死=1)1馬勝利1098-07-1298-11-2914002李三立0198-07-0198-12-0816013張先進1198-07-1498-12-3117004吳有權0098-08-2298-11-299915王家聲1198-10-2098-11-253612.生存時間(完全數據、截尾數據)生存時間是指觀察到的存活時間(1)完全數據:即死者的存活時間(2)截尾數據:由于失訪等原因,使得部分病人不能隨訪到底,稱之為截尾。尚存者的存活時間稱為截尾數據4.生存率、生存曲線(1)生存率記為S(tk),是指病人經歷tk個單位時間之后仍存活的概率。若無截尾數據,則 (17.3)(3)生存曲線,各個時點的生存率連接在一起的曲線5.半數生存期又稱中數生存期,即壽命的中位數17.2生存率及其標準誤1.乘積極限法2.壽命表法圖17.圖17.3乘積極限法生存曲線圖17.4壽命表法生存曲線(折線)及其半數生存期(1.7年)表17.4兩組兒童橫紋肌肉瘤治療后復發時間(月數,"+"表示未復發)對照組:239101012+1515+1618+24+3036+40+45+處理組:912+161919+20+20+24+24+30+31+34+42+44+53+59+62+圖17.圖17.5兒童橫紋肌肉瘤加化療組(treat)與對照組(control)緩解曲線比較試題解答一、單選題 一找知識點——在文字提問中找,通常一題一個知識點 若提問的知識點較大,則一般每個備選答案是較小的知識點 二找明確答案——你認為顯然對的,或顯然錯的 三找可能答案——你認為有可能對,但不全面的 四選最佳答案——比較”明確答案”與”可能答案”,作最終抉擇 ★注意:(1).留神“錯誤的是____” (2).最后考慮“以上都不是,或以上都是”二、多選題 類似單選題,將“可能對但并不全面”的答案都當作是“對”三、簡答題 一是知識點要全——判卷按知識點計分 二是概念清楚——扼要講出定義、意義等要點 三是不必展開論述【例1】反映計量資料的平均水平的指標有哪些?答:1.算術均數:即觀察值的總和除以例數,它反映正態分布資料的平均水平;2.幾何均數:即觀察值的乘積開n(例數)次方,它反映對數正態分布的平均水平;3.中位數:將觀察值從小到大排隊,位于正中位置的觀察值稱為中位數,它反映偏態分布的平均水平。四、論述題 以簡答題的“一、二”點為基礎,展開論述,最好結合例題【例2】怎樣描述一組計量資料的平均水平?答:首先制作頻數表和頻數圖,以考察數據分布的形狀、對稱性等(圖形特征)。然后根據分布類型計算適當的平均數,以反映數據分布的平均水平(數字特征)。平均數類型選用原則為:1.若數據服從或近似正態分布,如兒童身高,可計算均數。均數即觀察值總和除以例數,它反映正態分布資料的平均水平。2.若數據服從或近似對數正態分布,如血清抗體滴度,可計算幾何均數。幾何均數即觀察值的乘積開n(例數)次方,它反映對數正態分布的平均水平。3.若數據呈偏態(不包括對數正態)分布,如住院天數,可計算中位數。將觀察值從小到大排隊,位于正中位置的觀察值稱為中位數,它反映偏態分布的平均水平。五、計算題(應用題) 首先分析: 1.數據類型——定量、分類或等級資料 2.對比類型——怎樣分組比較,如配對比較還是成組比較 3.分布類型——正態(如生理指標)、偏態(如住院天數或潛伏期)、對數正態(如抗體滴度) 然后計算: 1.統計描述——圖表(常可省)、指標(、M~Q、p、…) 2.區間估計——95%置信區間,用正態法或百分位數法(可省略) 3.假設檢驗——步驟要完整(按步驟計分)

《衛生統計學》期末復習提要

一、期末考試有關問題的說明<一>出題的指導思想、原則及題目類型出題的指導思想是:全面考核學生對本課程的基本概念、基本方法,基本技能的掌握情況,考核學生運用所學的知識和方法綜合分析與解決實際問題的能力。出題的原則是:不超過教學大綱的內容,難度適中但覆蓋面較廣,基本知識占80─90%,稍難或靈活的題目占10─20%。凡自學的章節不考。題目的類型有:名詞解釋(15分),填空題(20分),選擇題(20分),判斷題(10分),簡答題(10分),計算分析題(25分)。<二>答題要求名詞解釋:要求按統計術語準確敘述概念。填空題:要求按劃線的根數準確填寫內容,不得似是而非。選擇題:要求選擇無誤,每題只選一個最佳答案。判斷題:要求對敘述只判斷正確與否,不說明理由。問答題:根據問題的不同問法,一種是直接據問題所問進行敘述;另一種是據問題所問說明正確與否,若否,需說明錯誤所在及正確的解決辦法。注意答出要點及答題的邏輯性。計算分析題:要求完整地寫出計算步驟(包括計算公式)、用計算器計算出正確結果,并能對所得結果作出相應的分析結論。二、期末復習范圍和重點

緒言

<一>重點復習的名詞:計量資料、計數資料、總體、樣本、變異、抽樣誤差、概率。<二>重點復習的問題:1、根據計量、計數、等級資料的概念正確識別統計資料的類型。2、統計工作的步驟及搜集資料的來源和要求。3、抽樣研究的原因及目的,產生抽樣誤差的原因。<三>一般復習的名詞:等級資料、同質、參數、統計量、隨機化抽樣、樣本含量。<四>一般復習的問題:1、衛生統計學的內容及學習衛生統計學的意義。2、統計工作各個步驟的基本內容和關系。

集中趨勢與離散趨勢

<一>重點復習的名詞:頻數分布表、中位數。<二>重點復習的問題:1、對頻數分布特征的描述。2、平均指標:算術均數、幾何均數、中位數的意義及應用條件,算術均數的計算。3、變異指標:全距、標準差、變異系數的意義及應用條件,標準差和變異系數的計算。4、正態分布的兩個參數及正態曲線下面積的分布規律。<三>一般復習的問題:1、除<二>4外,正態分布的其余特點。2、u變換的形式和作用。3、查閱標準正態曲線下面積表的方法。

均數的抽樣誤差及標準誤

<一>重點復習的名詞:均數的抽樣誤差、標準誤、總體均數的可信區間。<二>重點復習的問題:1、標準誤的意義、計算及應用。2、標準差與標準誤的區別與聯系。3、總體均數可信區間的意義和計算。4、總體均數可信區間與正常值范圍的區別。<三>一般復習的問題:1、抽樣誤差的規律。2、提高對總體均數可信區間估計精度的辦法。

均數的假設檢驗

<一>重點復習的名詞:檢驗假設H0,檢驗水準α,假設檢驗中的P值,可比性,第Ⅰ類錯誤和第Ⅱ類錯誤。<二>重點復習的問題:1、t值;t分布與標準正態分布的關系。2、假設檢驗的基本思想和步驟。3、樣本均數與總體均數比較的t檢驗。4、兩大樣本均數比較的u檢驗。5、配對設計三種形式的特點及t檢驗的H。、H1。6、假設檢驗時需注意的問題。(重點是可比性和犯第Ⅰ類及第Ⅱ類錯誤的含義與概率)<三>一般復習的名詞:自由度、假設檢驗。<四>一般復習的問題:1、配對設計的t檢驗。2、兩小樣本均數比較的t檢驗。3、t檢驗的應用條件。

方差分析

一般復習的問題:1、方差分析的基本思想。2、完全隨機設計的特點和方差分析法。3、配伍組設計的特點和方差分析法。4、多個樣本均數的兩兩比較。

相對數

<一>重點復習的名詞:構成比、率、相對比、動態數列。<二>重點復習的問題:1、構成比、率、相對比、定基比、環比的計算。2、下述指標的意義及計算:死因構成,發病率,患病率,死亡率,病死率。3、動態數列的分析。4、應用相對數時需注意的問題。(重點是不能以比代率)<三>一般復習的名詞:時期動態數列、時點動態數列、標準化法。<四>一般復習的問題:1、動態數列的分類。2、標準化法的意義及基本思想。3、標準化率的直接法和間接法計算。4、應用標準化法的注意事項。

二項分布及其應用

<一>重點復習的問題:1、率的抽樣誤差概念。2、率的標準誤的意義及計算。3、總體率可信區間的意義及計算。<二>一般復習的名詞:二項分布<三>一般復習的問題:1、二項分布的概率函數與圖形。2、二項分布的特點。3、樣本率與總體率比較的u檢驗。4、兩個樣本率比較的u檢驗。

Poisson分布及其應用

<一>一般復習的名詞:Poisson分布<二>一般復習的問題:1、Poisson分布的概率函數及圖形。2、Poisson分布的特點。3、總體均數可信區間的意義及計算。4、樣本均數與總體均數比較的u檢驗。5、兩樣本均數比較的u檢驗。

χ2檢驗

<一>重點復習的名詞:理論頻數<二>重點復習的問題:1、χ2檢驗的基本思想。2、四格表資料χ2檢驗和校正χ2檢驗的應用條件及方法。3、計數資料相關分析的設計特點和推斷目的。4、行×列表資料χ2檢驗的注意事項。<三>一般復習的問題:行×列表資料所包括的設計類型及χ2檢驗法。

秩和檢驗

<一>重點復習的問題:等級資料的秩和檢驗<二>一般復習的名詞:非參數統計<三>一般復習的問題:1、配對比較的符號秩和檢驗

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論