課件::人群健康研究的統計學方法.ppt_第1頁
課件::人群健康研究的統計學方法.ppt_第2頁
課件::人群健康研究的統計學方法.ppt_第3頁
課件::人群健康研究的統計學方法.ppt_第4頁
課件::人群健康研究的統計學方法.ppt_第5頁
已閱讀5頁,還剩64頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

2019/4/13,1,第七章,人群健康研究的統計學方法,2019/4/13,2,“統計”一詞,對一般人來說并不陌生。 在報刊上常見用來說明我們工作、事業成 績的數字、表、圖,稱為統計數字、統計 表和統計圖。 在西方,統計學(statistics)一詞, 源出于state(國家、情況),專指有關“國 情”的學問,最初多用于文字記敘,后發展 為數量比較,隨著概率論思想與方法的引 入,逐漸形成今天在理論與應用方面都已相當完備的獨立學科。,1. 某年級甲班、乙班各有男生50人。從兩個班各抽取10人測量身高,如果甲班的平均身高大于乙班,能否推論甲班所有同學的平均身高也大于乙班?為什么? 2用A,B兩種藥物分別治療同病患者各50人,如果A藥的治愈率(60%)高于B藥(50%),證明A藥的療效優于B藥。這種說法對嗎?為什么?,思考題,2019/4/13,4,醫學統計學的主要研究內容,1、統計學設計(1)內容:臨床試驗設計、實驗室研究設計、調查研究設計等。 (2)目的:控制和縮小隨機誤差,消除系統誤差;節約樣本含量;盡可能多地獲取有關信息,達到高效低耗的目的。 2、統計分布 事物所表現的數量特征是千差萬別的,其所呈現的分布規律是進行統計學推斷的基礎和根據。 3、各種統計量(或稱統計指標)的性質、特點及其分布規律 4、統計分析方法(包括各種數學模型)尤其是隨著計算機的普及和發展,多因素分析方法發展很快。,2019/4/13,5,如何學習醫學統計學,1、掌握基本概念、基本原理和基本方法。培養統計思維能力。 2、掌握常用統計分析方法。對統計公式,要求了解其用途、適用條件和注意事項。切忌死記硬背,關鍵是靈活運用。 3、重視習題課。聯系實際,緊密結合專業知識,多做練習題。,2019/4/13,6,例:治療某病的新療法 新法:(100例) 有效20例,有效率20%; 舊法:(100例) 有效15例,有效率15%; 這兩個百分數就是統計描述指標,現在的問題是,這兩種療法的有效率會穩定不變嗎?如果說不會,是什么原因?那么,兩種療法的真實有效率會是多少?我們能根據統計描述( 20%與15%)就去正式采用還有較大副作用的新療法?對這樣的差異問題,你能再憑直覺去作“否定”?在作任何回答之前,必須判斷20%與15%之間的差別是真實的差異,或是僅僅由于“機遇”所致。這里,統計推斷可提供幫助。學過統計學,將會了解不僅可判斷新療法是否較好?而且,如果判斷它是較好,還能估計判斷是錯誤的可能性有多大。,2019/4/13,7,統計分析是科研工作中的一種有力工具。 它從科研的總體設計、資料采集、資料整理、 資料分析直到最后作出結論都有密切關系。 掌握了這個工具可以使用較少的人力、物力 和時間獲得比較可靠的結果。需要運用統計 方法的場合而不去運用它可能造成不應有的 缺陷或得出錯誤的結論。,2019/4/13,8,例: 北京某醫院某大夫使用“烏貝散” (烏賊骨3錢,白芨3錢,川貝3錢, 甘草3錢,共研細末過120目篩,沖服)治療胃潰瘍病出血107例,有效101例,有效率為94.4%。那么如果別的醫院,其它大夫使用“烏貝散”來治療胃潰瘍病出血,其有效率也一定是94.4%嗎?顯然,不一定恰為94.4%,那么是多少呢?比它高還是比它低?這就是一個求可信區間的問題。,2019/4/13,9,例:某雜志中一篇文章報導,用某種中草藥治療玫瑰糠疹,有效率為78,平均療程為三周左右。問此藥治療玫瑰糠疹的確有效嗎?由于玫瑰糠疹具有自然治愈的情況,一般不服藥,多喝水,到三周左右有些患者也會自愈。所以,此藥的78療效有待探討。 這就要求設立具有可比性的對照組。,2019/4/13,10,再譬如,用某藥治某病,治一例有效, 能說100有效嗎?治療二例有效,能說明 100有效嗎?治十例,其中九例有效,能 說90有效嗎?顯然,觀察的例數將是個重要因素,例數太少不足以說明問題。觀察例數太多,將費時,加重科研經濟負擔。那么觀察多少例能說明問題?這是一個樣本可靠性問題。,2019/4/13,11,一些現象既有規律性又有隨機性,肺癌患者中(主動或被動)吸煙的比例較大,這體現了規律性,而絕非每個吸煙的人都會患肺癌,這體現了隨機性; 再如,一般來說,白種人身材比黃種人要高些,這就是規律性,但對于具體的一個白人和一個黃種人,就很難說誰高誰矮了,這體現隨機性。,2019/4/13,12,第一節 統計學方法概述,一、統計學的意義 統計學是運用數理統計的原理和方法,研究數據資料的搜集、整理、分析與推斷的科學,是認識社會和自然現象客觀規律的數量特征的重要工具。 醫學統計學 是認識醫學現象數量特征的重要工具,是運用數理統計的原理和方法,結合醫學實際,來研究醫學科研的實驗設計和數據處理的一門科學。 “醫學統計學是處理醫學資料中的同質性(homogeneity)和變異性(variation)的科學與藝術”,2019/4/13,13,二、統計學中的幾個基本概念,(一) 同質與變異 (二) 總體與樣本 (三) 參數與統計量 (四) 誤差 (五) 概率,2019/4/13,14,(一)同質與變異 homogeneity and variation,同質:指觀察單位(研究個體)間被研究指標的影響因素相同。 個體:即觀察單位,是統計研究中的最基本單位。 變量:觀察單位的研究特征 變量值:變量的觀察結果 變異:指同質的個體之間的差異 。,2019/4/13,15,同質與變異的例子,例1 調查2008年淄博市7歲男童的身高和體重 同質:2008年、淄博市、7歲男童 變異:身高和體重各不相同 例2 研究某降壓藥的療效 同質:高血壓患者、用某藥治療 變異:療效各不相同,2019/4/13,16,120名正常成年男子紅細胞計數值(1012/L),最大值=6.18, 最小值=3.29, 極差=2.89 算術均數=4.72,標準差=0.57,2019/4/13,17,2019/4/13,18,(二) 總體與樣本 population and sample,總體:根據研究目的所確定的同質觀察單位某項變量值的集合(全體)。 分有限總體與無限總體,樣本:從總體中隨機抽取的部分觀察單位變量值的集合。,2019/4/13,19,隨機抽樣 random sampling,為了保證樣本的可靠性和代表性,需要采用隨機的抽樣方法(在總體中每個個體具有相同的機會被抽到)。,2019/4/13,20,(三) 參數與統計量 parameter and statistic,參數:總體的統計指標,如總體均數、標準差,采用希臘字母分別記為、。固定的常數,推斷inference,統計量:樣本的統計指標,如樣本均數、標準差,采用拉丁字母分別記為 。 參數附近波動的隨機變量 。,2019/4/13,21,(四) 誤差 error,誤差:泛指實驗數據的實測值與真實值之差,1 系統誤差 2 隨機測量誤差 3抽樣誤差,2019/4/13,22,系統誤差 systematic error,在實際觀測過程中,由受試對象、研究者、儀器設備、研究方法、非實驗因素影響等原因造成的有一定傾向性或規律性的誤差。流行病學稱之為偏倚(bias)。 特點:觀察值系統性、方向性、周期性的偏離真值。 可以通過嚴格的實驗設計和技術措施消除。,2019/4/13,23,2隨機測量誤差 (random error of measurement )或稱偶然誤差,是指排除了系統誤差后尚存的誤差。它受多種因素的影響,使觀察值不按方向性和系統性而隨機地變化。 隨機測量誤差服從正態分布,可以用概率統計方法處理。,2019/4/13,24,3抽樣誤差 ( sampling error) 我們從同一總體中隨機抽取若干個例數相同的樣本,其樣本統計量之間會有所不同。這種由于隨機抽樣所引起的樣本統計量與總體參數之間的差異以及各樣本統計量之間的差異,統計上稱為抽樣誤差。 抽樣誤差在醫學生物實驗中最主要的來源是個體的變異。所以這是一種難以控制的、不可避免的誤差。但抽樣誤差是有一定規律的。,2019/4/13,25,(五) 概率probability,確定性現象:在一定條件下,一定會發生或一定不會發生的現象。其表現結果為兩種事件:肯定發生某種結果的叫必然事件;肯定不發生某種結果的叫不可能事件。,隨機現象:在同樣條件下可能會出現兩種或多種結果,究竟會發生哪種結果,事先不能確定。其表現結果稱為隨機事件。 隨機事件的特征:隨機性;規律性:每次發生的可能性的大小是確定的。,概率:隨機事件發生的可能性大小,用大寫的P表示;取值0,1。,2019/4/13,26,必然事件 P = 1 不可能事件 P = 0 隨機事件 0 P 1 P 0.05(5)或P 0.01(1)稱為小概率事件(習慣),統計學上認為不大可能發生。,小概率事件,2019/4/13,27,樣本的實際發生率稱為頻率。設在相同條件下,獨立重復進行N次試驗,事件A出現n次,則事件A出現的頻率為f=n /N。 頻率與概率間的關系: 概率是參數,頻率是統計量; 頻率總是圍繞概率上下波動; 樣本含量n越大,波動幅度越小,頻率越接近概率。,頻率 frequency,2019/4/13,28,三 統計資料的類型,(一) 數值變量資料 (二) 分類變量資料 (三) 變量間轉化,2019/4/13,29,觀察單位observations 個體individuals,變量variables,numerical variable data 數值變量資料,Categorical variable data 分類變量資料,Units;elements,2019/4/13,30,(一)數值變量資料 numerical variable data,用定量 方法測定觀察單位(個體)某項指標數值的大小,所得的資料,稱數值變量資料。也叫定量資料Quantitative data或計量資料,特點:有計量單位,如患者的身高(cm)、體重(kg)、血壓(mmHg)、脈搏(次/分)、紅細胞計數(10/L);資料之間具連續性。,2019/4/13,31,(二)分類變量資料 categorical variable data,將觀察單位按某種屬性或類別分組,然后清點各組的觀察單位數,所得的資料稱分類變量資料也叫定性資料(Qualitative data),特點:無固有計量單位,如膚色(黑、白)、血型(ABO)、職業(工農兵)、性別(男女),2019/4/13,32,1、無序分類(unordered categories),各類別之間有性質上的不同,而無程度上的差別。 二項分類 如臨床某些檢驗結果用陽性或陰性反應表示,對一批某病患者檢驗完畢后,清點呈陽性或陰性反應的各有若干例。 多項分類 調查某人群的血型分布,按照、四型分組。清點所得該人群的各血型組的人數是計數資料;,2019/4/13,33,2、有序分類資料(ordinal category data),各類別之間有性質上的差別,且排列有序,給人以“半定量”的概念,所以也叫等級資料 Rank data。 癌癥分期:早、中、晚。 藥物療效:治愈、好轉、無效、死亡。 尿蛋白: ,+,+,2019/4/13,34,實例數據1,2019/4/13,35,實例數據2,2019/4/13,36,(三) 變量間的轉化,例:一組2040歲成年人的血壓,以12kPa為界分為正常與異常兩組,統計每組例數,8 低血壓 8 正常血壓 12 輕度高血壓 15 中度高血壓 17 重度高血壓,數值變量資料,等級資料,分類變量資料,2019/4/13,37,又如在計量診斷中,將某些陽性體征根據確診病人的概率賦予分數,分數的多少代表量的大小,這樣原來的計數資料就轉化為計量資料。 由于計量資料可以得到較多的信息,所以凡能計量的,盡量采用計量資料。,2019/4/13,38,統計資料的幾種類型:,2019/4/13,39,四、統計工作的基本步驟,(一) 統計設計:包括調查、實驗設計。 (二) 收集資料:取得準確可靠的原始資料 (三) 整理資料:對資料進行核查、改錯,系統化、條理化 (四) 分析資料:統計描述、統計推斷,2019/4/13,40,(一) 統計設計 statistical design,統計設計是影響研究能否成功的最關鍵環節,是提高觀察或實驗質量的重要保證。,1.調查設計:survey design 客觀描述研究總體,不對研究總體施加任何干預,目的在于摸清某一事物的水平和分布狀態。,2019/4/13,41,(1)實驗研究設計:以動物或生物材料為研究對象,在研究過程中對研究對象施加干預。 (2)臨床試驗設計:以人為研究對象,在研究過程中施加干預。,2.實驗設計:experiment design,2019/4/13,42,統計設計的內容:,1.研究目的和假說。 2.研究總體、研究對象、觀察單位。 3.是否施加干預,如何施加干預? 4.需搜集那些資料,如何搜集? 5.設置觀察指標。 6.資料的整理和匯總,計算有關統計量。 7.控制誤差。 8.預期結果。 9.時間和經費的安排等。,2019/4/13,43,研究設計的幾個關鍵問題:,1.如何進行抽樣?如何安排干預措施? 隨機化原則:隨機抽樣和隨機分配。,2.要達到研究目的應抽取多少觀察單位? 重復原則:確定樣本含量。,2019/4/13,44,3.如何在諸多影響因素中,分離出研 究因素對實驗結果的效應? 對照原則:在對比組中,除研究因素外,其它影響實驗結果的非研究因素都盡可能相同。,實驗設計,2019/4/13,49,(二)搜集資料(collection of data),根據設計的要求,獲取準確可靠的原始資料,是統計分析結果可靠的重要保證。,醫療衛生工作中的統計資料主要來自:,1.統計報表。 2.醫療衛生工作記錄。 3.專題調查或實驗研究。,2019/4/13,50,1、統計報表 如出生死亡報告、疫情報告、醫院工作報表等都是國家規定的,由醫療衛生機構定期逐級上報,提供居民健康和醫療衛生機構的各種數字,這些報表為各級衛生機構制定衛生工作計劃、評價衛生工作和預測今后的工作提供重要依據,也為衛生管理研究提供了大量的原始資料; 2、醫療衛生工作記錄 如病歷、醫學檢查記錄等,這些資料都是進行醫學研究的寶貴原始資料,必需很好開發利用,但許多醫療衛生機構忽視它,不認真填寫,漏填、誤填嚴重,以致不能很好利用,因此加強這方面的資料管理工作是很重要的; 3、專題調查或實驗 這是開展醫學科研的主要資料來源,比上述2種經常性資料容易控制,可以得到較好的原始資料。如糖尿病、高血壓的調查。,2019/4/13,51,統計資料的要求,1、資料完整、準確和及時 2、資料有足夠的數量 3、資料的代表性及可比性 代表性:是指在抽樣研究中樣本對總體的代表性 隨機化原則:總體中每個對象都有同等機會被抽取。 可比性:是指在進行統計比較時,對比的各組之間,除觀察問題或實驗因素不同外,其它一切條件都要求盡量一致。,2019/4/13,52,(三)整理資料sorting of data,將原始數據凈化、系統化和條理化,為下一步的計算和分析打好基礎的過程。,1. 審核:對原始數據的檢查、核對和糾正錯誤等。,2. 分組:根據研究目的將原始數據合理分組 質量分組 即按事物的性質或類型分組,適用于計數及等級資料。如按性別、職業分組 數量分組 即按變量值的大小來分組,適用于計量資料。,3.匯總 整理成統計表,可用計算機匯總,2019/4/13,53,(四)分析資料(analysis of data),是根據設計的要求,對整理后的數據進行統計學分析,結合專業知識,做出科學合理的解釋。,目的是在描述數據特征的基礎上,闡明事物的內在聯系和規律性。,2019/4/13,54,1.統計描述:statistical description 選用恰當的統計指標,合適的統計表 和統計圖,對資料的數量特征及其分布規律進行測定和描述。,2019/4/13,55,(1)參數估計:estimation of parameters 如何由樣本統計量推斷總體參數。,(2) 假設檢驗:test of hypothesis 如何由樣本差異來推斷總體之間是否存在差異。,2. 統計推斷:statistical inference 如何在一定的可信程度下由樣本信息 推斷總體特征。,2019/4/13,56,如何學習統計學,循序漸進 認真完成各部分習題,2019/4/13,57,復習思考題,總體 誤差分類 概率 統計資料的類型 統計工作的基本步驟,2019/4/13,58,統計中所說的樣本是指: A.隨意從總體中抽取出的部分個體 B.依照研究者要求從總體中抽取出有意義的部分個體 C.按照隨機原則抽取總體中有代表性的部分個體 D.依照研究者要求從總體中抽取的部分個體 E.按分布的順序抽取部分個體 統計中所說的總體是指: A.隨意想象的研究對象的全體 B.根據研究目的確定的研究對象某項觀察值的的全體 C.根據時間來劃分的研究對象的全體 D.根據地區來劃分的研究對象的全體 E.根據人群來劃分的研究對象的全體,C,B,2019/4/13,59,總體的要求是: A.大量的 B.同質的 C.隨機的 D.固定的 E.對稱的 樣本指標值與總體指標值之差主要是指: A.隨機測量誤差 B.關系誤差 C.容許誤差 D.抽樣誤差 E.系統誤差 由于各種偶然的因素影響,造成同一對象多次測定的結果不完全一致,往往是有的稍高,有的稍低,這種差異是: A.系統誤差 B.隨機測量誤差 C.抽樣誤差 D.偏倚誤差 E.標準誤差,B,D,B,2019/4/13,60,抽樣誤差是指: A.個體值和總體參數值之差 B.個體值和樣本統計量值之差 C.樣本統計量值和總體參數以及各樣本統計量之差 D.樣本統計量值和樣本統計量值之差 E.總體參數值和總體參數值之差 統計學上說的系統誤差、測量誤差和抽樣誤差三種誤差,在實際工作中有: A.三種誤差都不可避免 B.系統誤差和抽樣誤差不可避免 C.系統誤差和測量誤差不可避免 D.測量誤差和抽樣誤差不可避免 E.三種誤差都可避免,C,D,2019/4/13,61,抽樣誤差是由: A.計算引起 B.測量引起 C.抽樣引起 D.采樣結果不準確引起 E.試劑,儀器未經校正引起 某事件發生的概率為1,即意味著: A.某事件發生的可能性為1 B.某事件可能發生 C.某事件可能不發生 D.某事件必然不發生 E.某事件必然發生,C,E,2019/4/13,62,某事件發生概率為0,即意味著: A.某事件發生的可能性為100 B.某事件可能發生 C.某

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論