第03章總體均數的估計與假設檢驗(正式)_第1頁
第03章總體均數的估計與假設檢驗(正式)_第2頁
第03章總體均數的估計與假設檢驗(正式)_第3頁
第03章總體均數的估計與假設檢驗(正式)_第4頁
第03章總體均數的估計與假設檢驗(正式)_第5頁
已閱讀5頁,還剩82頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、1234u了解總體特征的最好方法是對總體的每一了解總體特征的最好方法是對總體的每一 個體進行觀察、試驗,但這在醫學研究實個體進行觀察、試驗,但這在醫學研究實 際中往往不可行。際中往往不可行。u對對無限總體無限總體不可能對所有個體逐一觀察,不可能對所有個體逐一觀察, 對對有限總體有限總體限于人力、財力、物力、時間限于人力、財力、物力、時間 或個體過多等原因,不可能也沒必要對所或個體過多等原因,不可能也沒必要對所 有個體逐一研究有個體逐一研究(如對一批罐頭質量檢查如對一批罐頭質量檢查)。u借助借助抽樣研究抽樣研究。 5u欲了解某地欲了解某地18歲男生身高值的平均水平,歲男生身高值的平均水平, 隨機

2、抽取該地隨機抽取該地10名男生身高值作為名男生身高值作為樣本樣本。u由于由于個體變異與抽樣個體變異與抽樣的影響,抽得的樣本的影響,抽得的樣本 均數不太可能等于總體均數,造成樣本均數不太可能等于總體均數,造成樣本統統 計量與總體參數間的差異計量與總體參數間的差異(表現為來自同一表現為來自同一 總體的若干樣本統計量間的差異總體的若干樣本統計量間的差異),稱為,稱為抽抽 樣誤差樣誤差。u抽樣誤差是不可避免的。抽樣誤差是不可避免的。u抽樣誤差是有規律的。抽樣誤差是有規律的。61999年某市年某市18歲男生身高值歲男生身高值 XiN(, 2) =167.7cm =5.3cm樣本號樣本號iXiS 1 16

3、7.41 2.74 2 165.56 6.57 3 168.20 5.36 99 169.40 5.57100 165.69 5.09ni = 107樣本均數抽樣分布具有如下特點:樣本均數抽樣分布具有如下特點: u各樣本均數未必等于總體均數各樣本均數未必等于總體均數u各樣本均數間存在差異各樣本均數間存在差異u樣本均數圍繞樣本均數圍繞 =167.69cm呈正態分布呈正態分布u樣本均數變異度樣本均數變異度( )較原總體個較原總體個 體值變異度體值變異度( = 5.3cm)大大縮小大大縮小cm69. 1SX X89nX 標準差為標準差為 10中心極限定理中心極限定理(central limit th

4、eorem) 若若 X i 服從正態分布服從正態分布 則則 服從正態分布服從正態分布 若若 X i 不服從正態分布不服從正態分布 n大大(n60):則:則 近似服從正態分布近似服從正態分布 n小小(n60) 按按u分布原理分布原理2. 兩總體均數之差的可信區間兩總體均數之差的可信區間 271.單一總體均數的單一總體均數的1可信區間可信區間StStX,2X,2X , X 雙側雙側(1) 未知未知單側單側StStX,X,X X 283.641.151110XS 0.05 2,92.262t故該地故該地18歲男生身高均數的歲男生身高均數的95%可信區間為可信區間為(164.35, 169.55)cm

5、。=167.7cm 雙尾雙尾例例 在例在例3-1中抽得第中抽得第15號樣本的號樣本的 =166.95(cm),S=3.64(cm), 求其總體均數的求其總體均數的95%可信區間。可信區間。 X166.952.2621.1511=164.35169.55(cm)291.單一總體均數的單一總體均數的1可信區間可信區間X,2X,2SX Xuu 或或雙側雙側單側單側SuuSuuX,X,X,X,X X X X 或或或或(2) 已知已知或或 未知但未知但n足夠大足夠大: 30例例 某地抽取正常成年人某地抽取正常成年人200名,測得其血名,測得其血清膽固醇均數為清膽固醇均數為3.64 mmol/L,標準差為

6、,標準差為1.20mmol/L,估計該地正常成年人血清膽,估計該地正常成年人血清膽固醇均數固醇均數95%可信區間。可信區間。 法,用近似正態分布的方60)/(81. 347. 30849. 096. 164. 320020. 196. 164. 3NLmmol312. 兩總體均數之差的兩總體均數之差的1可信區間可信區間 雙側雙側21XX,2/21S)XX(t 21XX,2121S)XX()(t 單側單側21XX,2121S)XX()(t 32三、可信區間的確切含義三、可信區間的確切含義u從從1999年某市年某市18歲男生身高值總體歲男生身高值總體N(=167.7cm, =5.3cm)中隨機抽取

7、中隨機抽取100個樣本個樣本計算了計算了100個估計個估計的的95%CIu其中有其中有95個個CI包含包含了了 有有5個不包含個不包含 =167.7cm20號號 161.00165.57 31號號 161.17167.3354號號 168.05171.00 76號號 167.71174.8482號號 167.98174.27 -2 -1 0 1 2 來自來自N(0,1)的的100個樣本所計算的個樣本所計算的95%可信區間示意可信區間示意 34u如果能夠進行重復抽樣試驗,平均有如果能夠進行重復抽樣試驗,平均有(1)的可信區間包含了總體參數,而不是的可信區間包含了總體參數,而不是總體參數落在該范圍

8、的可能性為總體參數落在該范圍的可能性為(1)。u在實際工作中,只能根據一次試驗結果計在實際工作中,只能根據一次試驗結果計算一個可信區間,算一個可信區間,就認為該區間包含了相應就認為該區間包含了相應總體參數,總體參數,該結論犯錯誤的概率該結論犯錯誤的概率 。u可信區間一旦形成,它要么包含總體參數,可信區間一旦形成,它要么包含總體參數,要么不包含總體參數,二者必居其一,無概要么不包含總體參數,二者必居其一,無概率可言。可信度是事前概率。率可言。可信度是事前概率。可信區間的確切含義可信區間的確切含義35u正確性正確性:可信度:可信度1,即區間包含總體參數,即區間包含總體參數 的理論概率大小,愈接近的

9、理論概率大小,愈接近1愈好。愈好。u精確性精確性:區間的寬度,區間愈窄愈好。區間的寬度,區間愈窄愈好。u當樣本含量為定值時,上述兩者互相矛盾。當樣本含量為定值時,上述兩者互相矛盾。 若只顧提高可信度,則可信區間會變寬。若只顧提高可信度,則可信區間會變寬。評價可信區間估計的優劣:評價可信區間估計的優劣:36四、可信區間與參考值范圍的區別四、可信區間與參考值范圍的區別u可信區間用于估計可信區間用于估計總體參數總體參數,總體參數只,總體參數只 有一個有一個 。u參考值范圍用于估計參考值范圍用于估計個體值個體值的分布范圍,的分布范圍, 個體值有很多個體值有很多 。u95%可信區間中的可信區間中的95%

10、是是可信度可信度,即所求可,即所求可 信區間包含總體參數的可信程度為信區間包含總體參數的可信程度為95%。u95%參考值范圍中的參考值范圍中的95%是一個是一個比例比例,即,即 所求參考值范圍包含了所求參考值范圍包含了95%的正常人。的正常人。3738例例 某醫生測量了某醫生測量了36名從事鉛作業男性工人的名從事鉛作業男性工人的血紅蛋白含量,算得其均數為血紅蛋白含量,算得其均數為130.83g/L,標,標準差為準差為25.74g/L。問從事鉛作業工人的血紅蛋。問從事鉛作業工人的血紅蛋白是否不同于正常成年男性平均值白是否不同于正常成年男性平均值140g/L?u樣本均數與總體均數間差異的原因:樣本

11、均數與總體均數間差異的原因: 1.總體均數不同總體均數不同? 2.總體均數相同,差異由抽樣誤差造成總體均數相同,差異由抽樣誤差造成?u統計推斷方法統計推斷方法 假設檢驗假設檢驗(hypothesis test)391.進行檢驗假設進行檢驗假設 假設樣本來自某一特定總體假設樣本來自某一特定總體2.確定檢驗水準確定檢驗水準 確定最大允許誤差確定最大允許誤差3.選定檢驗方法計算檢驗統計量選定檢驗方法計算檢驗統計量 計算樣本與總體的偏離程度計算樣本與總體的偏離程度4.計算與統計量對應的計算與統計量對應的P值值5.作出結論作出結論 根據小概率反證法思想作出推斷根據小概率反證法思想作出推斷假設檢驗一般步驟

12、假設檢驗一般步驟40 t 檢驗檢驗(Students t-test) 設計設計 完全隨機設計單樣本完全隨機設計單樣本 完全隨機設計兩樣本完全隨機設計兩樣本 配對設計配對設計 要求要求 1.n較小較小(單組單組60或兩組合計或兩組合計60) 2.樣本隨機地取自樣本隨機地取自正態總體正態總體 3.兩樣本均數比較時所對應兩總體兩樣本均數比較時所對應兩總體 方差相等方差相等(homogeneity of variance)41例例 某醫生測量了某醫生測量了36名從事鉛作業男性工人的名從事鉛作業男性工人的血紅蛋白含量,算得其均數為血紅蛋白含量,算得其均數為130.83g/L,標,標準差為準差為25.74

13、g/L。問從事鉛作業工人的血紅蛋。問從事鉛作業工人的血紅蛋白是否不同于正常成年男性平均值白是否不同于正常成年男性平均值140g/L?一、單樣本一、單樣本t 檢驗檢驗1.建立檢驗假設,確定檢驗水準建立檢驗假設,確定檢驗水準H0: = 0=140g/L 鉛作業男性工人的平均血紅蛋鉛作業男性工人的平均血紅蛋 白含量與正常成年男性的相等白含量與正常成年男性的相等H1: 0 =0.05 42351361n138. 23674.2514083.130nSXSXt0X0 2.計算檢驗統計量計算檢驗統計量3.確定確定P值,作出推斷結論值,作出推斷結論 |2.138| t0.05/2,35=2.030 P 2

14、或或 1 2 單側檢驗單側檢驗H0: 1= 2 H1: 1 2 雙側檢驗。雙側檢驗。單雙側檢驗主要根據專業知識預先確定。單雙側檢驗主要根據專業知識預先確定。雙側檢驗較保守和穩妥。雙側檢驗較保守和穩妥。u檢驗水準檢驗水準:預先規定的拒絕:預先規定的拒絕假設假設H0時的最時的最大允許誤差大允許誤差,它確定了小概率事件標準。,它確定了小概率事件標準。在實際工作中常取在實際工作中常取0.05,但并非一成不變。,但并非一成不變。63u應根據變量和資料類型、設計方案、統應根據變量和資料類型、設計方案、統 計推斷的目的、方法的適用條件等選擇計推斷的目的、方法的適用條件等選擇 檢驗統計量。檢驗統計量。u所有檢

15、驗統計量都是在所有檢驗統計量都是在H0成立的前提條成立的前提條 件下計算出來的。件下計算出來的。u檢驗統計量大小反映樣本與總體的偏離檢驗統計量大小反映樣本與總體的偏離 程度(如程度(如t值反映樣本均數與總體均數值反映樣本均數與總體均數 的偏離程度,以標準誤進行標準化)的偏離程度,以標準誤進行標準化)2.計算檢驗統計量計算檢驗統計量 64uP值是決策的依據值是決策的依據uP的含義是指從的含義是指從H0規定的總體中隨機抽樣,規定的總體中隨機抽樣,其檢驗統計量等于及大于現有樣本的檢驗其檢驗統計量等于及大于現有樣本的檢驗統計量的概率。即從統計量的概率。即從H0假設總體中隨機抽假設總體中隨機抽到差別至少

16、等于現有樣本差別的機會到差別至少等于現有樣本差別的機會。u根據獲得的事后概率根據獲得的事后概率P,與事先規定的,與事先規定的概率概率檢驗水準檢驗水準 進行比較,看其是否為進行比較,看其是否為小概率事件而得出結論。小概率事件而得出結論。3.確定確定P 值,作出推斷結論值,作出推斷結論65uP ,按按 檢驗水準,拒絕檢驗水準,拒絕H0,接受,接受H1有統計學意義有統計學意義(統計結論統計結論)statistical significance可認為可認為不同,不同,高于高于(專業結論專業結論)uP ,按,按 檢驗水準,不拒絕檢驗水準,不拒絕H0無統計學意義無統計學意義(統計結論統計結論)no sta

17、tistical significance還不能認為還不能認為不同不同(專業結論專業結論)不拒絕不拒絕H0不等于接受不等于接受H0,因此時證據不足,因此時證據不足66三、三、I型錯誤和型錯誤和II型錯誤型錯誤 健康人與肝病病人的肝大指數分布健康人與肝病病人的肝大指數分布(所擬合的兩個正態曲線各按所擬合的兩個正態曲線各按100%面積繪制)面積繪制)肝肝 大大 指指 數數健康人健康人H0肝病病人肝病病人H1第一類錯誤第一類錯誤誤診率誤診率 (假陽性率假陽性率)第二類錯誤第二類錯誤b漏診率漏診率 (假陰性率假陰性率) 6.1 7.0 8.456891011 4 大,大,b b小;小;b b大,大,

18、小。增加小。增加n可同時縮小可同時縮小 ,b b。 68u 可取單尾亦可取雙尾可取單尾亦可取雙尾。uII型錯誤的概率大小用型錯誤的概率大小用b b表示表示, b b只取單尾,只取單尾,b b值的大小一般未知,須在知道兩總體差值的大小一般未知,須在知道兩總體差值值 (如如 12等等)、 及及n 時,才能算出。時,才能算出。u1bb稱稱檢驗效能檢驗效能(power of a test),過去稱把,過去稱把握度。為當兩總體確有差異,按檢驗水準握度。為當兩總體確有差異,按檢驗水準 所能發現該差異的能力。所能發現該差異的能力。1bb只取單尾。只取單尾。u拒絕拒絕H0,只可能犯,只可能犯I型錯誤,不可能犯

19、型錯誤,不可能犯II型型錯誤;不拒絕錯誤;不拒絕H0,只可能犯,只可能犯II型錯誤,不型錯誤,不可能犯可能犯I型錯誤。型錯誤。 69四、假設檢驗應注意的問題四、假設檢驗應注意的問題1.要有嚴密的研究設計要有嚴密的研究設計組間應均衡,具有可比性,除對比的主要因組間應均衡,具有可比性,除對比的主要因素素(如臨床試驗用新藥和對照藥如臨床試驗用新藥和對照藥)外,其它可外,其它可能影響結果的因素能影響結果的因素(如年齡、性別、病程、如年齡、性別、病程、病情輕重等病情輕重等)在對比組間應相同或相近。在對比組間應相同或相近。70u配對設計計量資料:配對配對設計計量資料:配對t檢驗。檢驗。u完全隨機設計兩樣本

20、計量資料:完全隨機設計兩樣本計量資料:小樣本小樣本(任一任一ni60)且方差齊且方差齊: 兩樣本兩樣本t檢驗檢驗 方差不齊方差不齊: 近似近似t 檢驗檢驗大樣本大樣本(所有所有ni60): u檢驗。檢驗。2.不同資料應選用不同檢驗方法不同資料應選用不同檢驗方法713.正確理解正確理解“significance”一詞的含義一詞的含義u過去稱差別有或無過去稱差別有或無“顯著性顯著性”,易造成,易造成兩兩 樣本統計量之間比較相差很大的誤解。樣本統計量之間比較相差很大的誤解。u現在稱差別有或無現在稱差別有或無“統計學意義統計學意義”, 相應推斷為:可以認為或還不能認為兩相應推斷為:可以認為或還不能認為

21、兩 個或多個總體參數有差別。個或多個總體參數有差別。724.結論不能絕對化結論不能絕對化 u因統計結論具有概率性質,故因統計結論具有概率性質,故“肯定肯定”、 “一定一定”、“必定必定”等詞不要使用。等詞不要使用。u在報告結論時,最好列出檢驗統計量的在報告結論時,最好列出檢驗統計量的 值,盡量寫出具體值,盡量寫出具體P值,而不簡單寫成值,而不簡單寫成 P0.05,以便讀者與同類研究進行比,以便讀者與同類研究進行比 較或進行循證醫學時采用較或進行循證醫學時采用Meta分析。分析。735.統計統計“有意義有意義”與醫學與醫學“有意義有意義” u統計統計“有意義有意義”對應統計結論,醫學對應統計結論

22、,醫學“有有意意 義義”對應專業結論。對應專業結論。u統計結論有意義,專業結論無意義,最終統計結論有意義,專業結論無意義,最終 結論沒有意義,樣本含量過大或設計存在結論沒有意義,樣本含量過大或設計存在 問題。問題。u統計結論無意義,專業結論有意義,檢查統計結論無意義,專業結論有意義,檢查 設計是否合理、樣本含量是否足夠。設計是否合理、樣本含量是否足夠。746.可信區間與假設檢驗區別和聯系可信區間與假設檢驗區別和聯系u可信區間可回答假設檢驗問題可信區間可回答假設檢驗問題 H0: = 0=140g/L 鉛作業男性工人的平均血紅蛋鉛作業男性工人的平均血紅蛋 白含量與正常成年男性的相等白含量與正常成年

23、男性的相等 H1: 0 =0.05 鉛作業男性工人平均血紅蛋白含量鉛作業男性工人平均血紅蛋白含量總體總體 均數均數 的的95%CI為為(122.12,139.54) g/L, 未包括未包括 0=140g/L 按按 =0.05水準,拒絕水準,拒絕H0 ,接受,接受H1。 75u可信區間說明可信區間說明量的大小量的大小即推斷總體均數即推斷總體均數 所在范圍,假設檢驗推斷所在范圍,假設檢驗推斷質的不同質的不同即判即判 斷兩總體均數是否不等。斷兩總體均數是否不等。u可信區間不但能回答差別有無統計學意可信區間不但能回答差別有無統計學意 義,還能提示差別有無實際專業意義。義,還能提示差別有無實際專業意義。

24、u可信區間不能夠完全代替假設檢驗。可可信區間不能夠完全代替假設檢驗。可 信區間只能在預先規定概率信區間只能在預先規定概率 的前提下的前提下 進行計算,而假設檢驗能獲得一較為確進行計算,而假設檢驗能獲得一較為確 切的切的P值。值。76 有實際專業意義的值 H0 (2) (3) (4) (5) (1) 有實際 可能有實際 無實際 樣本例數 可接受 專業意義 專業意義 專業意義 太少 H0 有統計學意義 無統計學意義 圖圖 可信區間在統計推斷上提供的信息可信區間在統計推斷上提供的信息 7778兩小樣本兩小樣本t 檢驗前提條件:檢驗前提條件:相應的兩總體為正態總體相應的兩總體為正態總體兩總體方差相等,

25、即方差齊性兩總體方差相等,即方差齊性配對配對t 檢驗前提條件:檢驗前提條件:每對數據每對數據差值差值的總體為正態總體的總體為正態總體79一、正態性檢驗一、正態性檢驗(了解了解)1.圖示法圖示法u概率圖概率圖(probability-probability plot)以實際累積頻率以實際累積頻率(X)對正態分布理論累積頻率對正態分布理論累積頻率(Y)作散點圖作散點圖u分位數圖分位數圖(quantile-quantile plot)以實際分位數以實際分位數(X)對正態分布理論分位數對正態分布理論分位數 ( )作散點圖作散點圖u如果實際值與理論值吻合,圖中散點幾乎如果實際值與理論值吻合,圖中散點幾乎

26、都在一直線上,可認為該資料服從正態分布都在一直線上,可認為該資料服從正態分布 S/ )XX(Y 80Normal Q-Q Plot of 100個樣本均數(cm)Observed Value174172170168166164162Expected Normal3210-1-2-3(168-167.69)/1.69=0.18(164-167.69)/1.69=-2.18(172-167.69)/1.69=2.55812.計算法計算法u偏度偏度(skewness)指分布不對稱的程度和方向指分布不對稱的程度和方向,用偏度系數,用偏度系數(總體總體: 1 樣本樣本:g1)衡量。衡量。 1=0 對稱對

27、稱 10 正偏態正偏態 10 負偏態負偏態u峰度峰度(kurtosis)指分布與正態曲線相比的冒指分布與正態曲線相比的冒尖或扁平程度,用峰度系數尖或扁平程度,用峰度系數(總體總體: 2 樣本樣本:g2)衡量。衡量。 2=0 正態峰正態峰 20 尖峭峰尖峭峰 20 平闊平闊峰峰u當同時滿足對稱和正態峰兩個條件時,才能當同時滿足對稱和正態峰兩個條件時,才能認為該資料服從正態分布。認為該資料服從正態分布。82u對偏度和峰度各用一個指標評定,其中以對偏度和峰度各用一個指標評定,其中以矩法矩法(method of moment)效率最高效率最高Tests of N ormality.046100.200*.994100.9

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論