《醫學統計學》完整課件_第1頁
《醫學統計學》完整課件_第2頁
《醫學統計學》完整課件_第3頁
《醫學統計學》完整課件_第4頁
《醫學統計學》完整課件_第5頁
已閱讀5頁,還剩661頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第1章緒論第1頁共666頁醫學本科生用

醫學統計學主講程琮泰山醫學院預防醫學教研室zcheng@第1章緒論第1頁共666頁醫學本科生用

第1章緒論第2頁共666頁Theteachingplan

formedicalstudentsProfessorChengCongDept.ofPreventiveMedicineTaishanMedicalCollege第1章緒論第2頁共666頁Thetea第1章緒論第3頁共666頁

預防醫學教授,碩士生導師。男,1959年6月出生。漢族,無黨派。1982年12月,山東醫學院公共衛生專業五年本科畢業,獲醫學學士學位。1994年7月,上海醫科大學公共衛生學院研究生畢業,獲醫學碩士學位。2003年12月晉升教授。現任預防醫學教研室副主任。主要從事《醫學統計學》、《預防醫學》,《醫學人口統計學》等課程的教學及科研工作,每年聽課學生500-800人。自2000年起連續六年,為碩士研究生開設《醫學統計學》、《SPSS統計分析簡明教程》、《衛生經濟學》等課程,同時指導研究生的科研設計、開題報告及科研資料的統計處理與分析。發表醫學統計學及預防醫學的科研論文30多篇。代表作有“鋅對乳癌細胞生長、增殖與基因表達的影響”,,“行列相關的測度”等。主編、副主編各類教材及專著8部,代表作有《醫學統計學》、《SPSS統計分析簡明教程》獲得院級科研論文及科技進步獎8項,院第四屆教學能手比賽二等獎一項,院教學評建先進工作者一項。獲2004年泰山醫學院首屆十大教學名師獎。程琮教授簡介第1章緒論第3頁共666頁預防醫第1章緒論第4頁共666頁醫學統計學總目錄

第1章緒論

第2章定量資料統計描述

第3章總體均數的區間估計和假設檢驗

第4章方差分析

第5章定性資料的統計描述

第6章總體率的區間估計和假設檢驗

第7章二項分布與泊松分布

第8章秩和檢驗

第9章直線相關與回歸

第10章實驗設計

第11章調查設計

第12章統計表與統計圖第1章緒論第4頁共666頁醫學統計學總目第1章緒論第5頁共666頁第1章緒論目錄

第五節學習統計學應注意的幾個問題

第二節統計工作的基本步驟

第三節統計資料的類型

第四節統計學中的幾個基本概念

第一節醫學統計學的定義和內容第1章緒論第5頁共666頁第1章緒論第1章緒論第6頁共666頁第一章緒論

第一節醫學統計學的定義和內容醫學統計學(medicalstatistics)---是以醫學理論為指導,運用數理統計學的原理和方法研究醫學資料的搜集、整理與分析,從而掌握事物內在客觀規律的一門學科。第1章緒論第6頁共666頁第一章緒論第1章緒論第7頁共666頁醫學研究的對象----主要是人以及與其健康有關的各種影響因素。醫學統計學的主要內容

:1.統計設計包括實驗設計和調查設計,它可以合理地、科學地安排實驗和調查工作,使之能較少地花費人力、物力和時間,取得較滿意和可靠的結果。2.資料的統計描述和總體指標的估計通過計算各種統計指標和統計圖表來描述資料的集中趨勢、離散趨勢和分布特征況(如正態分布或偏態分布);利用樣本指標來估計總體指標的大小。

第1章緒論第7頁共666頁醫學研究的對象第1章緒論第8頁共666頁3.假設檢驗是通過統計檢驗方法(如t檢驗、u檢驗、F檢驗、卡方檢驗、秩和檢驗等)來推斷兩組或多組統計指標的差異是抽樣誤差造成的還是有本質的差別。4.相關與回歸醫學中存在許多相互聯系、相互制約的現象。如兒童的身高與體重、胸圍與肺活量、血糖與尿糖等,都需要利用相關與回歸來分析。第1章緒論第8頁共666頁3.假設檢驗第1章緒論第9頁共666頁5.多因素分析如多元回歸、判別分析、聚類分析、正交設計分析、主成分分析、因子分析、logistic回歸、Cox比例風險回歸等,都是分析醫學中多因素有效的方法(本書不涉及,請參考有關統計書籍)。這些方法計算復雜,大部分需借助計算機來完成。

6.健康統計研究人群健康的指標與統計方法,除了用上述的某些方法外,他還有其特有的方法,如壽命表、生存分析、死因分析、人口預測等方法第1章緒論第9頁共666頁5.多因素第1章緒論第10頁共666頁醫學統計工作可分為四個步驟:統計設計、搜集資料、整理資料和分析資料。這四個步驟密切聯系,缺一不可,任何一個步驟的缺陷和失誤,都會影響統計結果的正確性。第二節統計工作的基本步驟第1章緒論第10頁共666頁醫學統計工作第1章緒論第11頁共666頁設計(design)是統計工作的第一步,也是關鍵的一步,是對統計工作全過程的設想和計劃安排。統計設計---就是根據研究目的確定試驗因素、受試對象和觀察指標,并在現有的客觀條件下決定用什么方式和方法來獲取原始資料,并對原始資料如何進行整理,以及整理后的資料應該計算什么統計指標和統計分析的預期結果如何等。一、統計設計第1章緒論第11頁共666頁設計(des第1章緒論第12頁共666頁搜集資料(collectionofdate)——是根據設計的要求,獲取準確可靠的原始資料,是統計分析結果可靠的重要保證。醫學統計資料的來源主要有以下三個方面:1.統計報表統計報表是醫療衛生機構根據國家規定的報告制度,定期逐級上報的有關報表。如法定傳染病報表、出生死亡報表、醫院工作報表等,報表要完整、準確、及時。

二、搜集資料第1章緒論第12頁共666頁搜集資料(c第1章緒論第13頁共666頁2.醫療衛生工作記錄如病歷、醫學檢查記錄、衛生監測記錄等。3.專題調查或實驗研究它是根據研究目的選定的專題調查或實驗研究,搜集資料有明確的目的與針對性。它是醫學科研資料的主要來源。第1章緒論第13頁共666頁2.醫療衛生第1章緒論第14頁共666頁

整理資料(sortingdata)的目的就是將搜集到的原始資料進行反復核對和認真檢查,糾正錯誤,分類匯總,使其系統化、條理化,便于進一步的計算和分析。整理資料的過程如下:1.審核:認真檢查核對,保證資料的準確性和完整性。2.分組:歸納分組,分組方法有兩種:①質量分組,即將觀察單位按其類別或屬性分組,如按性別、職業、陽性和陰性等分組。②數量分組,即將觀察單位按其數值的大小分組,如按年齡的大小、藥物劑量的大小等分組。三、整理資料

第1章緒論第14頁共666頁整理資料第1章緒論第15頁共666頁3.匯總:分組后的資料要按照設計的要求進行匯總,整理成統計表。原始資料較少時用手工匯總,當原始資料較多時,可使用計算機匯總。四、分析資料

分析資料(analysisofdata)——是根據設計的要求,對整理后的數據進行統計學分析,結合專業知識,作出科學合理的解釋。第1章緒論第15頁共666頁3.匯總:第1章緒論第16頁共666頁1.統計描述(descriptivestatistics)

將計算出的統計指標與統計表、統計圖相結合,全面描述資料的數量特征及分布規律。

2.統計推斷(inferentialstatistics)

使用樣本信息推斷總體特征。通過樣本統計量進行總體參數的估計和假設檢驗,以達到了解總體的數量特征及其分布規律,才是最終的研究目的。統計分析包括以下兩大內容:第1章緒論第16頁共666頁1.統計描述第1章緒論第17頁共666頁醫學統計資料按研究指標的性質一般分為定量資料、定性資料和等級資料三大類。一、定量資料定量資料(quantitativedata)亦稱計量資料(measurementdata),是用定量的方法測定觀察單位(個體)某項指標數值的大小,所得的資料稱定量資料。如身高(㎝)、體重(㎏)、脈搏(次/分)、血壓(kPa)等為數值變量,其組成的資料為定量資料。第三節統計資料的類型第1章緒論第17頁共666頁醫學統計資料第1章緒論第18頁共666頁

定性資料(qualitativedata)亦稱計數資料(enumerationdata)或分類資料(categoricaldata),是將觀察單位按某種屬性或類別分組,清點各組的觀察單位數,所得的資料稱定性資料。定性資料的觀察指標為分類變量(categoricalvariable)。如人的性別按男、女分組;化驗結果按陽性、陰性分組;動物實驗按生存、死亡分組;調查某人群的血型按A、B、O、AB分組等,觀察單位出現的結果為分類變量,分類變量沒有量的差別,只有質的不同,其組成的資料為定性資料。二、定性資料第1章緒論第18頁共666頁定性資料第1章緒論第19頁共666頁三、等級資料等級資料(rankeddata)亦稱有序分類資料(ordinalcategoricaldata),是將觀察單位按屬性的等級分組,清點各組的觀察單位數,所得的資料為等級資料。如治療結果分為治愈、顯效、好轉、無效四個等級。

第1章緒論第19頁共666頁三、等級資料第1章緒論第20頁共666頁

根據需要,各類變量可以互相轉化。若按貧血的診斷標準將血紅蛋白分為四個等級:重度貧血、中度貧血、輕度貧血、正常,可按等級資料處理。有時亦可將定性資料或等級資料數量化,如將等級資料的治療結果賦以分值,分別用0、1、2…等表示,則可按定量資料處理。如調查某人群的尿糖的情況,以人為觀察單位,結果可分—、±、+、++、+++五個等級。第1章緒論第20頁共666頁根據需要第1章緒論第21頁共666頁同質(homogeneity)是指觀察單位或研究個體間被研究指標的主要影響因素相同或基本相同。如研究兒童的生長發育,同性別、同年齡、同地區、同民族、健康的兒童即為同質兒童。變異(variation)由于生物個體的各種指標所受影響因素極為復雜,同質的個體間各種指標存在差異,這種差異稱為變異。如同質的兒童身高、體重、血壓、脈搏等指標會有一定的差別。第四節統計學中的幾個基本概念

一、同質與變異第1章緒論第21頁共666頁同質(hom第1章緒論第22頁共666頁二、總體與樣本樣本(sample):是從總體中隨機抽取的部分觀察單位變量值的集合。樣本的例數稱為樣本含量(samplesize)。注意:1。總體是相對的,總體的大小是根據研究目的而確定的。2。樣本應有代表性,即應該隨機抽樣并有足夠的樣本含量。

第1章緒論第22頁共666頁二、總體與樣第1章緒論第23頁共666頁圖示:總體與樣本populationsample2sample1sample3sample4sample5第1章緒論第23頁共666頁圖示:總體與第1章緒論第24頁共666頁三、參數與統計量參數(parameter):由總體計算或得到的統計指標稱為參數。總體參數具有很重要的參考價值。如總體均數μ,總體標準差σ等。統計量(statistic):由樣本計算的指標稱為統計量。如樣本均數,樣本標準差s等。注意:一般不容易得到參數,而容易獲得樣本統計量。第1章緒論第24頁共666頁三、參數與統第1章緒論第25頁共666頁四、抽樣誤差抽樣誤差(sampleerror):由于隨機抽樣所引起的樣本統計量與總體參數之間的差異以及樣本統計量之間的差別稱為抽樣誤差。如樣本均數與總體均數之間的差別,樣本率與總體率的差別等。注意:抽樣誤差是不可避免的。無論抽樣抽得多么好,也會存在抽樣誤差。第1章緒論第25頁共666頁四、抽樣誤差第1章緒論第26頁共666頁五、概率概率(probability):是描述隨機事件發生可能性大小的量值。用英文大寫字母P來表示。概率的取值范圍在0~1之間。當P=0時,稱為不可能事件;當P=1時,稱為必然事件。小概率事件:統計學上一般把P≤0.05或P≤0.01的事件稱為小概率事件。小概率原理:小概率事件在一次試驗中幾乎不可能發生。利用該原理可對科研資料進行假設檢驗。第1章緒論第26頁共666頁五、概率概率第1章緒論第27頁共666頁第五節學習醫學統計學應注意的問題1.重點掌握醫學統計學的基本知識、基本技能、基本概念和基本方法,掌握使用范圍和注意事項。2.要培養科學的統計思維方法,提高分析問題、解決問題的能力。3.掌握調查設計和實驗設計的原則,培養搜集、整理、分析統計資料的系統工作能力。第1章緒論第27頁共666頁第五節學第1章緒論第28頁共666頁課后作業

列舉出計量資料、分類資料、等級資料各10個實例。列舉出可能事件、必然事件、不可能事件及小概率事件各10個。認真復習本章已學過的基本概念2-3遍。第1章緒論第28頁共666頁課后作業第1章緒論第29頁共666頁BestWishestoAllofYou!ThankYouforListening!THEEND第1章緒論第29頁共666頁Bes第2章定量資料統計描述第30頁醫學本科生用主講程琮泰山醫學院預防醫學教研室zcheng@醫學統計學第2章定量資料統計描述第30頁醫學本科生用主講程琮第2章定量資料統計描述第31頁Theteachingplan

formedicalstudentsProfessorChengCongDept.ofPreventiveMedicineTaishanMedicalCollege第2章定量資料統計描述第31頁Theteachingpl第2章定量資料統計描述第32頁第2章定量資料的統計描述目錄

第二節集中趨勢的描述

第三節離散趨勢的描述

第四節正態分布

第一節頻數分布表第2章定量資料統計描述第32頁第2章定量資料的統計描述目錄第2章定量資料統計描述第33頁統計描述:是用統計圖表、統計指標來描述資料的分布規律及其數量特征。頻數分布表(frequencydistributiontable):主要由組段和頻數兩部分組成表格。第一節頻數分布表第二章定量資料的統計描述第2章定量資料統計描述第33頁統計描述:是用統計圖表、統計指第2章定量資料統計描述第34頁二、頻數分布表的編制

編制步驟:1.計算全距(range):一組變量值最大值和最小值之差稱為全距(range),亦稱極差,常用R表示。2.確定組距(classinterval):組距用i表示;3.劃分組段:每個組段的起點稱組下限,終點稱組上限。一般分為8~15組。;4.統計頻數:將所有變量值通過劃記逐個歸入相應組段;5.頻率與累計頻率:將各組的頻數除以n所得的比值被稱為頻率。累計頻率等于累計頻數除以總例數。

第2章定量資料統計描述第34頁二、頻數分布表的編制編制步驟第2章定量資料統計描述第35頁表2-2某年某市120名12歲健康男孩身高(cm)的頻數分布

身高組段

(1)

頻數

(2)頻率(%)(3)累計頻數

(4)累計頻率(%)(5)125~10.8310.83129~43.3354.17133~108.341512.50…………………………合計120100.00第2章定量資料統計描述第35頁表2-2某年某市120名1第2章定量資料統計描述第36頁第2章定量資料統計描述第36頁第2章定量資料統計描述第37頁二、頻數分布表的用途1.揭示資料的分布類型2.觀察資料的集中趨勢和離散趨勢3.便于發現某些特大或特小的可疑值4.便于進一步計算統計指標和作統計處理第2章定量資料統計描述第37頁二、頻數分布表的用途1.揭示第2章定量資料統計描述第38頁第2章定量資料統計描述第38頁第2章定量資料統計描述第39頁第二節集中趨勢的描述集中趨勢:代表一組同質變量值的集中趨勢或平均水平。常用的平均數有算術均數、幾何均數和中位數。另外不常用的有:眾數,調和平均數和調整均數等。第2章定量資料統計描述第39頁第二節集中趨勢的描述集中趨第2章定量資料統計描述第40頁一、算術均數

算術均數(arithmeticmean):簡稱均數。適用條件:對稱分布或近似對稱分布的資料。習慣上以希臘字母μ表示總體均數(populationmean),以英文字母表示樣本均數(samplemean)第2章定量資料統計描述第40頁一、算術均數

算術均數(ar第2章定量資料統計描述第41頁1.直接法:用于觀察值個數不多時

計算方法第2章定量資料統計描述第41頁1.直接法:用于觀察值個數不第2章定量資料統計描述第42頁2.加權法(weightingmethod):用于變量值個數

較多時。注意:權數即頻數f,為權重權衡之意。第2章定量資料統計描述第42頁2.加權法(weighting第2章定量資料統計描述第43頁

身高

(1)

組中值X(2)

頻數f(3)fX(4)=(2)(3)fX2(5)=(2)(4)125~127112716129129~131452468644133~135101350182250…………………………合計120171682460040表2-4120名12歲健康男孩身高(cm)均數和標準差加權法計算表

第2章定量資料統計描述第43頁第2章定量資料統計描述第44頁第2章定量資料統計描述第44頁第2章定量資料統計描述第45頁120名12歲健康男孩身高均數為143.07cm。

計算結果第2章定量資料統計描述第45頁120名12歲健康男孩身高均數第2章定量資料統計描述第46頁幾何均數(geometricmean,簡記為G):表示其平均水平。適用條件:對于變量值呈倍數關系或呈對數正態分布(正偏態分布),如抗體效價及抗體滴度,某些傳染病的潛伏期,細菌計數等。計算公式:有直接法和加權法。

二、幾何均數第2章定量資料統計描述第46頁幾何均數(geometric第2章定量資料統計描述第47頁1.直接法:用于變量值的個數n較少時第2章定量資料統計描述第47頁1.直接法:用于變量值的個第2章定量資料統計描述第48頁直接法計算實例第2章定量資料統計描述第48頁直接法計算實例第2章定量資料統計描述第49頁2.加權法:用于資料中相同變量值的個數f(即頻數)較多時。第2章定量資料統計描述第49頁2.加權法:用于資料中相同第2章定量資料統計描述第50頁

抗體滴度(1)頻數f

(2)滴度倒數X

(3)lgX

(4)flgX(5)=(2)(4)1:4240.60201.20401:8680.90315.41861:167161.20418.4287…………………………合計50

--89.1045表2-550名兒童麻疹疫苗接種后血凝抑制抗體滴度幾何均數計算表第2章定量資料統計描述第50頁第2章定量資料統計描述第51頁第2章定量資料統計描述第51頁第2章定量資料統計描述第52頁50名兒童麻疹疫苗接種后平均血凝抑制抗體滴度為1:60.55。計算結果:將有關已知數據代入公式有第2章定量資料統計描述第52頁50名兒童麻疹疫苗接種后平均血第2章定量資料統計描述第53頁①變量值中不能有0;

②不能同時有正值和負值;

③若全是負值,計算時可先把負號去掉,得出結果后再加上負號。計算幾何均數注意事項:第2章定量資料統計描述第53頁①變量值中不能有0;

②不能同第2章定量資料統計描述第54頁㈠中位數

定義:將一組變量值從小到大按順序排列,位次居中的變量值稱為中位數(median,簡記為M)。適用條件:①變量值中出現個別特小或特大的數值;②資料的分布呈明顯偏態,即大部分的變量值偏向一側;③變量值分布一端或兩端無確定數值,只有小于或大于某個數值;④資料的分布不清。

三、中位數及百分位數第2章定量資料統計描述第54頁㈠中位數三、中位數及百分位數第2章定量資料統計描述第55頁定義:百分位數(percentile)是一種位置指標,以Px表示。百分位數是將頻數等分為一百的分位數。一組觀察值從小到大按順序排列,理論上有x%的變量值比Px小,有(100-x)%的變量值比Px大。故P50分位數也就是中位數,即P50=M

。㈡百分位數第2章定量資料統計描述第55頁定義:百分位數(percent第2章定量資料統計描述第56頁①描述一組資料在某百分位置上的水平;②用于確定正常值范圍;③計算四分位數間距。百分位數的應用條件:第2章定量資料統計描述第56頁①描述一組資料在某百分位置上的第2章定量資料統計描述第57頁計算方法:有直接法和加權法1.直接法:用于例數較少時n為奇數時n為偶數時

第2章定量資料統計描述第57頁計算方法:有直接法和加權法1.第2章定量資料統計描述第58頁2.頻數表法:用于例數較多時中位數百分位數第2章定量資料統計描述第58頁2.頻數表法:用于例數較多時第2章定量資料統計描述第59頁

潛伏期(小時)(1)頻數f

(2)累計頻數(3)累計頻率(%)(4)0~171711.76~466343.412~3810169.9……………………合計145

--表2-6145例食物中毒病人潛伏期分布表第2章定量資料統計描述第59頁第2章定量資料統計描述第60頁第2章定量資料統計描述第60頁第2章定量資料統計描述第61頁先找到包含Px的最小累計頻率;該累計頻率同行左邊的組段值為L;L同行右邊的頻數為fx(或fm);L前一行的累計頻數為∑fL;將上述已知條件代入公式計算Px或P50。計算中位數及百分位數的步驟:第2章定量資料統計描述第61頁先找到包含Px的最小累計頻率;第2章定量資料統計描述第62頁計算結果:第2章定量資料統計描述第62頁計算結果:第2章定量資料統計描述第63頁定義:用來說明變量值的離散程度或變異程度。注意:僅用集中趨勢尚不能完全反映一組數據的特征。故應將集中趨勢和離散趨勢結合起來才能更好地反映一組數據的特征。常用離散指標有:極差、四分位數間距、標準差、方差、變異系數。第三節離散趨勢的描述第2章定量資料統計描述第63頁定義:用來說明變量值的離散程度第2章定量資料統計描述第64頁甲組:184186188190192乙組:180184188192196兩組球員的平均身高都是188cm,但甲組球員身高比較集中,乙組球員身高比較分散。為了說明離散趨勢,就要用離散指標。實例分析第2章定量資料統計描述第64頁甲組:1841861第2章定量資料統計描述第65頁㈠極差

極差(range,簡記為R)亦稱全距,即一組變量值中最大值與最小值之差。特點:計算簡單,不穩定,不全面,易變化;可用于各種分布的資料。一、極差和四分位數間距第2章定量資料統計描述第65頁㈠極差一、極差和四分位數間距第2章定量資料統計描述第66頁㈡四分位數間距

公式:

Q=P75-P25

特點:比極差穩定,只反映中間兩端值的差異。計算不太方便。可用于各種分布的資料。第2章定量資料統計描述第66頁㈡四分位數間距第2章定量資料統計描述第67頁二、方差和標準差㈠方差(variance)總體方差樣本方差第2章定量資料統計描述第67頁二、方差和標準差㈠方差(va第2章定量資料統計描述第68頁自由度(degreeoffreedom)的概念n-1是自由度,用希臘小寫字母ν表示,讀作[nju:]。定義:在N維或N度空間中能夠自由選擇的維數或度數。例:A+B=C,共有n=3個元素,其中只能任選2個元素的值,故自由度ν=n-1=3-1=2。第2章定量資料統計描述第68頁自由度(degreeoff第2章定量資料統計描述第69頁方差的特點充分反映每個數據間的離散狀況,意義深刻;指標穩定,應用廣泛,但計算較為復雜,不易理解;方差的單位與原數據不同,有時使用時不太方便;在方差分析中應用甚廣而極為重要。第2章定量資料統計描述第69頁方差的特點充分反映每個數據間的第2章定量資料統計描述第70頁(二)標準差(standarddeviation)總體標準差樣本標準差第2章定量資料統計描述第70頁(二)標準差(standard第2章定量資料統計描述第71頁牢記:離均差平方和展開式:第2章定量資料統計描述第71頁牢記:離均差平方和展開式:第2章定量資料統計描述第72頁標準差的特點:意義同方差,是方差的開平方;標準差的單位與原數據相同,使用方便,意義深刻,應用廣泛;故一般已作為醫學生物學領域中反映變異的標準,故稱標準差。第2章定量資料統計描述第72頁標準差的特點:意義同方差,是方第2章定量資料統計描述第73頁標準差的計算方法:可分為直接法和加權法。

1.直接法

2.加權法第2章定量資料統計描述第73頁標準差的計算方法:可分為直接法第2章定量資料統計描述第74頁直接法:標準差計算實例:例2.12例2.2中7名正常男子紅細胞數(1012/L)如下:4.67,4.74,4.77,4.88,4.76,4.72,4.92,計算其標準差。∑x=4.67+4.74+4.77+4.88+4.76+4.72+4.92=33.46

∑x2=4.672+4.742+4.772+4.882+4.762+4.722+4.922=159.99

第2章定量資料統計描述第74頁直接法:標準差計算實例:例2.第2章定量資料統計描述第75頁計算結果:第2章定量資料統計描述第75頁計算結果:第2章定量資料統計描述第76頁例2.13對表2-4資料用加權法計算120名12歲健康男孩身高值的標準差。加權法:標準差計算實例:在表2-4中已算得∑fx=17168,∑fx2=2460040,代入公式第2章定量資料統計描述第76頁例2.13對表2-4資料用第2章定量資料統計描述第77頁變異系數(coefficientofvariation):

簡記為CV

;特征:①變異系數為無量綱單位,可以比較不同單位指標間的變異度;②變異系數消除了均數的大小對標準差的影響,所以可以比較兩均數相差較大時指標間的變異度。三、變異系數第2章定量資料統計描述第77頁變異系數(coefficien第2章定量資料統計描述第78頁例2.14某地20歲男子160人,身高均數為166.06cm,標準差為4.95cm;體重均數為53.72kg,

標準差為4.96kg。試比較身高與體重的變異程度。變異系數計算實例第2章定量資料統計描述第78頁例2.14某地20歲男子1第2章定量資料統計描述第79頁身高

體重變異系數計算結果第2章定量資料統計描述第79頁身高體重變異系數計算結第2章定量資料統計描述第80頁第四節正態分布一、正態分布的概念和特征

正態分布(normaldistribution):也稱高斯分布,是醫學和生物學最常見的連續性分布。如身高、體重、紅細胞數、血紅蛋白等。第2章定量資料統計描述第80頁第四節正態分布一、正態分第2章定量資料統計描述第81頁圖2-1120名12歲健康男孩身高的頻數分布第2章定量資料統計描述第81頁圖2-1120名12歲健康第2章定量資料統計描述第82頁㈠正態分布的函數和圖形正態分布的密度函數,即正態曲線的方程為:第2章定量資料統計描述第82頁㈠正態分布的函數和圖形正態第2章定量資料統計描述第83頁圖2-2頻數分布逐漸接近正態分布示意第2章定量資料統計描述第83頁圖2-2頻數分布逐漸接近正第2章定量資料統計描述第84頁為了應用方便,常按公式(2.19)作變量變換u值稱為標準正態變量或標準正態離差,有的參考書也將u值稱為z值。第2章定量資料統計描述第84頁為了應用方便,常按公式(2.1第2章定量資料統計描述第85頁這樣將正態分布變換為標準正態分布

(standardnormaldistribution)第2章定量資料統計描述第85頁這樣將正態分布變換為標準正態分第2章定量資料統計描述第86頁圖2-3正態分布的面積與縱高

第2章定量資料統計描述第86頁圖2-3正態分布的面積與縱第2章定量資料統計描述第87頁㈡正態分布的特征1.集中性正態曲線的高峰位于正中央,即均數所在的位置。對稱性正態曲線以均數為中心,左右對稱,3.正態分布有兩個參數,即均數和標準差。4.正態曲線下面積有一定的分布規律

第2章定量資料統計描述第87頁㈡正態分布的特征1.集中第2章定量資料統計描述第88頁圖2-4不同標準差的正態分布示意第2章定量資料統計描述第88頁圖2-4不同標準差的正態分第2章定量資料統計描述第89頁二、正態曲線下面積的分布規律第2章定量資料統計描述第89頁二、正態曲線下面積的分布規律第2章定量資料統計描述第90頁標準正態分布表(u值表)

標準正態分布曲線下的面積,由此表可查出曲線下某區間的面積。查表時應注意:①表中曲線下面積為-∞到u

的下側累計面積;②當已知μ、σ、和X時,先按公式(2.19)求得u值,再查表;當和未知時,并且樣本例數在100例以上,常用樣本均數和標準差S分別代替μ和σ,按公式(2.19)求得u值;③曲線下橫軸上的總面積為100%或1第2章定量資料統計描述第90頁標準正態分布表(u值表)標第2章定量資料統計描述第91頁

例2.16

前例2.1中,某年某市120名12歲健康男孩身高,已知均數=143.07cm,標準差S=5.70cm,①估計該地12歲健康男孩身高在135cm以下者占該地12歲男孩總數的百分數;②估計身高界于135cm~150cm范圍內12歲男孩的比例;③分別求出均數±1S、均數±1.96S、均數±2.58S范圍內12歲男孩人數占該120名男孩總數的實際百分數,說明與理論百分數是否接近。

第2章定量資料統計描述第91頁例2.16前例2.1中,第2章定量資料統計描述第92頁根據題意,按公式(2.19)作u變換第2章定量資料統計描述第92頁根據題意,按公式(2.19)作第2章定量資料統計描述第93頁身高范圍所占面積

故估計該地12男孩身高在135cm以下者約占7.78%;身高界于135cm~150cm范圍內者約占81.10%。

第2章定量資料統計描述第93頁身高范圍所占面積故估計第2章定量資料統計描述第94頁三、正態分布的應用㈠制定醫學參考值范圍參考值范圍也稱為正常值范圍。醫學上常把絕大數正常人的某指標范圍稱為該指標的正常值范圍。這里的“絕大多數”可以是90%、95%、99%,最常用的是95%。㈡質量控制

常以均數±2S作為上、下警戒值,以均數±3S作為上、下控制值。

㈢正態分布是很多統計方法的理論基礎第2章定量資料統計描述第94頁三、正態分布的應用㈠制定醫學第2章定量資料統計描述第95頁THEENDTHANKYOUFORLISTENING第2章定量資料統計描述第95頁THEENDTHANK第3章總體均數的區間估計和假設檢驗第96頁本科生用

醫學統計學教案主講程琮泰山醫學院預防醫學教研室Zcheng@第3章總體均數的區間估計和假設檢驗第96頁本科生用

醫學統計第3章總體均數的區間估計和假設檢驗第97頁Theteachingplan

formedicalstudentsProfessorChengCongDept.ofPreventiveMedicineTaishanMedicalCollege第3章總體均數的區間估計和假設檢驗第97頁Theteach第3章總體均數的區間估計和假設檢驗第98頁第3章總體均數的區間估計和假設檢驗目錄

第五節均數的u檢驗

第二節t分布

第三節總體均數的區間估計

第四節假設檢驗的意義和基本步驟

第一節均數的抽樣誤差與標準誤

第六節均數的t檢驗

第七節兩個方差的齊性檢驗和t’檢驗

第八節Ⅰ型錯誤和Ⅱ型錯誤

第九節應用假設檢驗應注意的問題第3章總體均數的區間估計和假設檢驗第98頁第3章總體均數的區第3章總體均數的區間估計和假設檢驗第99頁圖示:總體與樣本Populationμsample2sample1sample3sample4sample5第3章總體均數的區間估計和假設檢驗第99頁圖示:總體與樣本P第3章總體均數的區間估計和假設檢驗第100頁一、標準誤的意義及其計算統計推斷(statisticalinference)

:根據樣本信息來推論總體特征。均數的抽樣誤差:由抽樣引起的樣本均數與總體均數的差異稱為均數的抽樣誤差。標準誤(standarderror):反映均數抽樣誤差大小的指標。

第一節均數的抽樣誤差與標準誤第3章總體均數的區間估計和假設檢驗第100頁一、標準誤的意義第3章總體均數的區間估計和假設檢驗第101頁σ已知:標準誤計算公式σ未知:第3章總體均數的區間估計和假設檢驗第101頁σ已知:標準誤計第3章總體均數的區間估計和假設檢驗第102頁

實例:如某年某市120名12歲健康男孩,已求得均數為143.07cm,標準差為5.70cm,按公式計算,則標準誤為:第3章總體均數的區間估計和假設檢驗第102頁實例:如某年某第3章總體均數的區間估計和假設檢驗第103頁1.表示抽樣誤差的大小;2.進行總體均數的區間估計;

3.進行均數的假設檢驗等。二、標準誤的應用第3章總體均數的區間估計和假設檢驗第103頁1.表示抽樣誤差第3章總體均數的區間估計和假設檢驗第104頁正態變量X采用u=(X-μ)/σ變換,則一般的正態分布N(μ,σ)即變換為標準正態分布N(0,1)。又因從正態總體抽取的樣本均數服從正態分布

N(μ,),同樣可作正態變量的u變換,即第二節t分布

一、t分布的概念第3章總體均數的區間估計和假設檢驗第104頁正態變量X采用u第3章總體均數的區間估計和假設檢驗第105頁

實際工作中由于理論的標準誤往往未知,而用樣本的標準誤作為的估計值,此時就不是u變換而是t變換了,即下式:第3章總體均數的區間估計和假設檢驗第105頁實際工作中由于第3章總體均數的區間估計和假設檢驗第106頁t分布于1908年由英國統計學家W.S.Gosset以“Student”筆名發表,故又稱Studentt

分布(Students’

t-distribution)。第3章總體均數的區間估計和假設檢驗第106頁t分布于1908第3章總體均數的區間估計和假設檢驗第107頁二、t分布曲線的特征t分布曲線是單峰分布,以0為中心,左右兩側對稱,曲線的中間比標準正態曲線(u分布曲線)低,兩側翹得比標準正態曲線略高。t分布曲線隨自由度υ而變化,當樣本含量越小(嚴格地說是自由度υ=n-1越小),t分布與u分布差別越大;當逐漸增大時,t分布逐漸逼近于u分布,當υ=∞時,t分布就完全成正態分布。t分布曲線是一簇曲線,而不是一條曲線。t分布下面積分布規律:查t分布表。第3章總體均數的區間估計和假設檢驗第107頁二、t分布曲線的第3章總體均數的區間估計和假設檢驗第108頁t分布示意圖第3章總體均數的區間估計和假設檢驗第108頁t分布示意圖第3章總體均數的區間估計和假設檢驗第109頁t分布曲線下雙側或單側尾部合計面積我們常把自由度為υ的t分布曲線下雙側尾部合計面積或單側尾部面積為指定值α時,則橫軸上相應的t界值記為tα,υ。如當υ=20,α=0.05時,記為t0.05,20;當υ=22,α=0.01時,記為t0.01,22。對于tα,υ值,可根據α和υ值,查附表2,t界值表。第3章總體均數的區間估計和假設檢驗第109頁t分布曲線下雙側第3章總體均數的區間估計和假設檢驗第110頁t分布是t檢驗的理論基礎。由公式(3.4)可知,│t│值與樣本均數和總體均數之差成正比,與標準誤成反比。在t分布中│t│值越大,其兩側或單側以外的面積所占曲線下總面積的比重就越小,說明在抽樣中獲得此│t│值以及更大│t│值的機會就越小,這種機會的大小是用概率P來表示的。│t│值越大,則P值越小;反之,│t│值越小,P值越大。根據上述的意義,在同一自由度下,│t│≥tα

,則P≤α;反之,│t│<tα,則P>α。第3章總體均數的區間估計和假設檢驗第110頁t分布是t檢驗的第3章總體均數的區間估計和假設檢驗第111頁第三節總體均數的區間估計參數估計:用樣本指標(統計量)估計總體指標(參數)稱為參數估計。估計總體均數的方法有兩種,即:點值估計(pointestimation)區間估計(intervalestimation)。第3章總體均數的區間估計和假設檢驗第111頁第三節總體均第3章總體均數的區間估計和假設檢驗第112頁一、點值估計點值估計:是直接用樣本均數作為總體均數的估計值。此法計算簡便,但由于存在抽樣誤差,通過樣本均數不可能準確地估計出總體均數大小,也無法確知總體均數的可靠程度。第3章總體均數的區間估計和假設檢驗第112頁一、點值估計點第3章總體均數的區間估計和假設檢驗第113頁二、區間估計區間估計是按一定的概率(1-α)估計包含總體均數可能的范圍,該范圍亦稱總體均數的可信區間(confidenceinterval,縮寫為CI)。1-α稱為可信度,常取1-α為0.95和0.99,即總體均數的95%可信區間和99%可信區間。1-α(如95%)可信區間的含義是:總體均數被包含在該區間內的可能性是1-α,即(95%),沒有被包含的可能性為α,即(5%)。第3章總體均數的區間估計和假設檢驗第113頁二、區間估計區第3章總體均數的區間估計和假設檢驗第114頁總體均數的可信區間的計算1.未知σ且n較小(n<100)按t分布的原理2.已知σ或n較大(n≥100)按u分布的原理第3章總體均數的區間估計和假設檢驗第114頁總體均數的可信區第3章總體均數的區間估計和假設檢驗第115頁95%的可信區間為123.7±2.064×2.38,即(118.79,128.61)。故該地1歲嬰兒血紅蛋白平均值95%的可信區間為118.7~128.61(g/L)。例3.1

為了了解某地1歲嬰兒的血紅蛋白濃度,從該地隨機抽取了1歲嬰兒25人,測得其血紅蛋白的平均數為123.7g/L,標準差為11.9g/L。試求該地1歲嬰兒的血紅蛋白平均值95%的可信區間。第3章總體均數的區間估計和假設檢驗第115頁95%的可信區間第3章總體均數的區間估計和假設檢驗第116頁例3.2

上述某市120名12歲健康男孩身高均數為143.07cm,標準誤為0.52cm,試估計該市12歲康男孩身高均數95%和99%的可信區間。95%的可信區間為

143.07±1.96×0.52,即(142.05,144.09)。99%的可信區間為

143.07±2.58×0.52,即(141.73,144.41)。第3章總體均數的區間估計和假設檢驗第116頁例3.2上述第3章總體均數的區間估計和假設檢驗第117頁注意點標準誤愈小,估計總體均數可信區間的范圍也愈窄,說明樣本均數與總體均數愈接近,對總體均數的估計也愈精確;反之,標準誤愈大,估計總體均數可信區間的范圍也愈寬,說明樣本均數距總體均數愈遠,對總體均數的估計也愈差。第3章總體均數的區間估計和假設檢驗第117頁注意點標第3章總體均數的區間估計和假設檢驗第118頁表3-1標準差和標準誤的區別

第3章總體均數的區間估計和假設檢驗第118頁表3-1標準第3章總體均數的區間估計和假設檢驗第119頁第四節假設檢驗的意義和基本步驟假設檢驗(hypothesistest):亦稱顯著性檢驗(significancetest),是統計推斷的重要內容。它是指先對總體的參數或分布作出某種假設,再用適當的統計方法根據樣本對總體提供的信息,推斷此假設應當拒絕或不拒絕。第3章總體均數的區間估計和假設檢驗第119頁第四節假設檢第3章總體均數的區間估計和假設檢驗第120頁例3.3

根據大量調查,已知健康成年男子脈搏的均數為72次/分鐘,某醫生在一山區隨機測量了25名健康成年男子脈搏數,求得其均數為74.2次/分鐘,標準差為6.5次/分鐘,能否認為該山區成年男子的脈搏數與一般健康成年男子的脈搏數不同?

本例兩個均數不等有兩種可能性:①山區成年男子的脈搏總體均數與一般健康成年男子的脈搏總體均數是相同的,差別僅僅由于抽樣誤差所致;②受山區某些因素的影響,兩個總體的均數是不相同的。如何作出判斷呢?按照邏輯推理,如果第一種可能性較大時,可以接受它,統計上稱差異無統計學意義(nostatisticalsignificance);如果第一種可能性較小時,可以拒絕它而接受后者,統計上稱差異有統計學意義(statisticalsignificance)。

第3章總體均數的區間估計和假設檢驗第120頁例3.3根據第3章總體均數的區間估計和假設檢驗第121頁假設檢驗的一般步驟如下:1.建立檢驗假設一種是無效假設(nullhypothesis),符號為H0;一種是備擇假設(alternativehypothesis)符號為H1。H0:

H1:第3章總體均數的區間估計和假設檢驗第121頁假設檢驗的一般步第3章總體均數的區間估計和假設檢驗第122頁

表3-2樣本均數所代表的未知總體均數

與已知總體均數的比較第3章總體均數的區間估計和假設檢驗第122頁表3-2樣第3章總體均數的區間估計和假設檢驗第123頁表3-3兩樣本均數所代表的未知總體均數的比較第3章總體均數的區間估計和假設檢驗第123頁表3-3兩樣第3章總體均數的區間估計和假設檢驗第124頁2.確定檢驗水準

檢驗水準(sizeofatest)亦稱顯著性水準(significancelevel),符號為α

。它是判別差異有無統計意義的概率水準,其大小應根據分析的要求確定。通常取α

α=0.05。3.選定檢驗方法和計算統計量根據研究設計的類型和統計推斷的目的要求選用不同的檢驗方法。如完全隨機設計中,兩樣本均數的比較可用t檢驗,樣本含量較大時(n>100),可用u檢驗。不同的統計檢驗方法,可得到不同的統計量,如t值和u值。第3章總體均數的區間估計和假設檢驗第124頁2.確定檢驗水準第3章總體均數的區間估計和假設檢驗第125頁4.確定概率P值

P值是指在H0所規定的總體中作隨機抽樣,獲得等于及大于(或小于)現有統計量的概率。│t│≥tα,υ,則P≤α;│t│<tα,υ,則P>α。

第3章總體均數的區間估計和假設檢驗第125頁4.確定概率P值第3章總體均數的區間估計和假設檢驗第126頁5.作出推斷結論

①當P≤α時,表示在H0成立的條件下,出現等于及大于現有統計量的概率是小概率,根據小概率事件原理,現有樣本信息不支持H0,因而拒絕H0,結論為按所取檢驗水準拒絕H0,接受H1,即差異有統計學意義,如例3.3可認為兩總體脈搏均數有差別;②當P>α時,表示在H0成立的條件下,出現等于及大于現有統計量的概率不是小概率,現有樣本信息還不能拒絕H0,結論為按所取檢驗水準不拒絕H0,即差異無統計意義,如例3.3尚不能認為兩總體脈搏均數有差別。第3章總體均數的區間估計和假設檢驗第126頁5.作出推斷結論第3章總體均數的區間估計和假設檢驗第127頁下結論時的注意點:P≤α,拒絕H0,不能認為H0肯定不成立,因為雖然在H0成立的條件下出現等于及大于現有統計量的概率雖小,但仍有可能出現;同理,P>α,不拒絕H0,更不能認為H0肯定成立。由此可見,假設檢驗的結論是具有概率性的,無論拒絕H0或不拒絕H0,都有可能發生錯誤,即第一類錯誤或第二類錯誤第3章總體均數的區間估計和假設檢驗第127頁下結論時的注意點第3章總體均數的區間估計和假設檢驗第128頁第五節均數的u檢驗國外統計書籍及統計軟件亦稱為單樣本u檢驗(onesampleu-test)。樣本均數與總體均數比較的u檢驗適用于:①總體標準差σ已知的情況;②樣本含量較大時,比如n>100時。對于后者,是因為n較大,υ也較大,則t分布很接近u分布的緣故。一、樣本均數與總體均數比較的u檢驗第3章總體均數的區間估計和假設檢驗第128頁第五節均數的第3章總體均數的區間估計和假設檢驗第129頁u

值的計算公式為:總體標準差σ已知時,不管n的大小。總體標準差σ未知時,但n>100時。第3章總體均數的區間估計和假設檢驗第129頁u值的計算公式第3章總體均數的區間估計和假設檢驗第130頁例3.4

某托兒所三年來測得21~24月齡的47名男嬰平均體重11kg。查得近期全國九城市城區大量調查的同齡男嬰平均體重11.18kg,標準差為1.23kg。問該托兒所男嬰的體重發育狀況與全國九城市的同期水平有無不同?(全國九城市的調查結果可作為總體指標)實例第3章總體均數的區間估計和假設檢驗第130頁例3.4某托第3章總體均數的區間估計和假設檢驗第131頁(1)建立檢驗假設H0:μ=μ0

,即該托兒所男嬰的體重發育狀況與全國九城市的同期水平相同,α=0.05(雙側)H1:μ≠μ0

,即該托兒所男嬰的體重發育狀況與全國九城市的同期水平不同。(2)計算u值本例因總體標準差σ已知,故可用u檢驗。本例n=47,樣本均數=11,總體均數=11.18,總體標準差=1.23,代入公式(3.7)第3章總體均數的區間估計和假設檢驗第131頁(1)建立檢驗假第3章總體均數的區間估計和假設檢驗第132頁(3)確定P值,作出推斷結論查u界值表(附表2,t界值表中為∞一行),得u0.05=1.96,u=1.003<u0.05=1.96,故P>0.05。按α=0.05水準,不拒絕H0,差異無統計學意義。結論:可認為該托兒所男嬰的體重發育狀況與全國九城市的同期水平相同。第3章總體均數的區間估計和假設檢驗第132頁(3)確定P值,第3章總體均數的區間估計和假設檢驗第133頁二、兩樣本均數比較的u檢驗該檢驗也稱為獨立樣本u檢驗(independentsampleu-test),適用于兩樣本含量較大(如n1>50且n2>50)時,u值可按下式計算:第3章總體均數的區間估計和假設檢驗第133頁二、兩樣本均數比第3章總體均數的區間估計和假設檢驗第134頁

例3.5

測得某地20~24歲健康女子100人收縮壓均數為15.27kPa,標準差為1.16kPa;又測得該地20~24歲健康男子100人收縮壓均數為16.11kPa,標準差為1.41kPa。問該地20~24歲健康女子和男子之間收縮壓均數有無差別?實例第3章總體均數的區間估計和假設檢驗第134頁例3.5測第3章總體均數的區間估計和假設檢驗第135頁(1)建立檢驗假設

H0:μ1

=μ2

,即該地20~24歲健康女子和男子之間收縮壓均數相同;

H1:μ1≠μ2

,即該地20~24歲健康女子和男子之間收縮壓均數不同。

α=0.05(雙側)(2)計算u值

本例n1=100,均數1=15.27,S1=1.16

n2=100,均數2=16.11,S2=1.41第3章總體均數的區間估計和假設檢驗第135頁(1)建立檢驗假第3章總體均數的區間估計和假設檢驗第136頁(3)確定P值,作出推斷結論查u界值表(附表2,t界值表中為∞一行),得u0.05=1.96,現u>u0.05=1.96,故P<0.05。按水準α=0.05,拒絕H0,接受H1,差異有統計學意義。結論:可認為該地20~24歲健康人的收縮壓均數男性高于女性。第3章總體均數的區間估計和假設檢驗第136頁(3)確定P值,第3章總體均數的區間估計和假設檢驗第137頁第六節均數的t檢驗當樣本含量較小(如n<50)時,t分布和u分布有較大的出入,所以小樣本的樣本均數與總體均數的比較以及兩個樣本均數的比較要用t檢驗。t檢驗的適用條件:①樣本來自正態總體或近似正態總體;②兩樣本總體方差相等。第3章總體均數的區間估計和假設檢驗第137頁第六節均數的第3章總體均數的區間估計和假設檢驗第138頁一、樣本均數與總體均數比較的t檢驗亦稱為單樣本t檢驗(onesamplet-test)。即樣本均數代表的未知總體均數與已知的總體均數(一般為理論值、標準值或經過大量觀察所得的穩定值等)進行比較。這時檢驗統計量t值的計算在H0成立的前提條件下由公式(3.4)變為:第3章總體均數的區間估計和假設檢驗第138頁一、樣本均數與總第3章總體均數的區間估計和假設檢驗第139頁例3.6對例3.3資料進行t檢驗。(1)建立檢驗假設

H0:μ=μ0

,即該山區健康成年男子脈搏均數與一般健康成年男子脈搏均數相同;

H1:μ≠μ0

,即該山區健康成年男子脈搏均數與一般健康成年男子脈搏均數不同。α=0.05(雙側)

(2)計算t值本例n=25,s=6.5,樣本均數=74.2,總體均數=72,代入公式(3.10)第3章總體均數的區間估計和假設檢驗第139頁例3.6對例第3章總體均數的區間估計和假設檢驗第140頁(3)確定P值,作出推斷結論

本例υ=25-1=24,查附表2,t界值表,得t0.05,24=2.064,現t=1.692<t0.05,24=2.064,故P>0.05。按α=0.05的水準,不拒絕H0,差異無統計學意義。結論:即根據本資料還不能認為此山區健康成年男子脈搏數與一般健康成年男子不同。第3章總體均數的區間估計和假設檢驗第140頁(3)確定P值,第3章總體均數的區間估計和假設檢驗第141頁二、配對資料的t檢驗醫學科研中配對資料的三種主要類型:同一批受試對象治療前后某些生理、生化指標的比較;同一種樣品,采用兩種不同的方法進行測定,來比較兩種方法有無不同;配對動物試驗,各對動物試驗結果的比較等。配對實驗設計得到的資料稱為配對資料。第3章總體均數的區間估計和假設檢驗第141頁二、配對資料的t第3章總體均數的區間估計和假設檢驗第142頁

先求出各對子的差值d的均值,若兩種處理的效應無差別,理論上差值d的總體均數應為0。

所以這類資料的比較可看作是樣本均數與總體均數為0的比較。

要求差值的總體分布為正態分布。

t檢驗的公式為:配對資料的t檢驗(pairedsamplest-test)第3章總體均數的區間估計和假設檢驗第142頁先求出各對子第3章總體均數的區間估計和假設檢驗第143頁例3.7

設有12名志愿受試者服用某減肥藥,服藥前和服藥后一個療程各測量一次體重(kg),數據如表3-4所示。問此減肥藥是否有效?(1)建立檢驗假設

H0:μd=0,即該減肥藥無效;

H1:μd≠0,即該減肥藥有效。單側α=0.05第3章總體均數的區間估計和假設檢驗第143頁例3.7設有第3章總體均數的區間估計和假設檢驗第144頁表3-4某減肥藥研究的體重(kg)觀察值第3章總體均數的區間估計和假設檢驗第144頁表3-4某減第3章總體均數的區間估計和假設檢驗第145頁(2)計算t值本例n=12,Σd=-16,Σd2

=710,差值的均數=Σd/n=-16/12=-1.33(kg)第3章總體均數的區間估計和假設檢驗第145頁(2)計算t值第3章總體均數的區間估計和假設檢驗第146頁(3)確定P值,作出推斷結論自由度=n-1=12-1=11,查附表2,t界值表,得單側t0.05,11=2.201,現t=0.58<t0.05,11=2.201,故P>0.05。按α=0.05水準,不拒絕H0,差異無統計學意義。結論:故尚不能認為該減肥藥有減肥效果。第3章總體均數的區間估計和假設檢驗第146頁(3)確定P值,第3章總體均數的區間估計和假設檢驗第147頁例3.8

某單位研究飲食中缺乏維生素E與肝中維生素A含量的關系,將同種屬的大白鼠按性別相同,年齡、體重相近配成8對,并將每對中的兩頭動物隨機分到正常飼料組和維生素E缺乏組,然后定期將大白鼠殺死,測得其肝中維生素A的含量如表3-5。

問不同飼料組的大白鼠肝中維生素A含量有無差別?

(自學內容)第3章總體均數的區間估計和假設檢驗第147頁例3.8某單第3章總體均數的區間估計和假設檢驗第148頁三、兩樣本均數比較的t檢驗兩本均數比較的t檢驗亦稱為成組t檢驗,又稱為獨立樣本t檢驗(independentsamplest-test)。適用于比較按完全隨機設計而得到的兩組資料,比較的目的是推斷它們各自所代表的總體均數和是否相等。第3章總體均數的區間估計和假設檢驗第148頁三、兩樣本均數比第3章總體均數的區間估計和假設檢驗第149頁樣本估計值為:總體方差已知:標準誤的計算公式第3章總體均數的區間估計和假設檢驗第149頁樣本估計值為:第3章總體均數的區間估計和假設檢驗第150頁若n1=n2時:已知S1和S2時:第3章總體均數的區間估計和假設檢驗第150頁若n1=n2時:第3章總體均數的區間估計和假設檢驗第151頁例3.9

測得14名慢性支氣管炎病人與11名健康人的尿中17酮類固醇(mol/24h)排出量如下,試比較兩組人的尿中17酮類固醇的排出量有無不同。原始調查數據如下:病人X1:n=14;10.0518.7518.9915.9413.9617.6720.5117.2214.6915.109.428.217.2424.60健康人X2:n=11;17.9530.4610.8822.3812.8923.0113.891

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論