《區間檢驗統計學》word版_第1頁
《區間檢驗統計學》word版_第2頁
《區間檢驗統計學》word版_第3頁
《區間檢驗統計學》word版_第4頁
《區間檢驗統計學》word版_第5頁
已閱讀5頁,還剩2頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、.§9.3 數值變量資料的統計推斷衛生學(7)醫學統計與流行病學系 駱福添一、均數的抽樣誤差與標準誤【例】我們將某地14歲健康女生身高資料作為總體。m=155.40cm, s=5.30cm· 樣本1:120例,均數154.82· 樣本2:120例,均數155.41· 樣本均數與總體均數(或樣本均數之間)的差異稱為均數的抽樣誤差(sampling error of mean)· 由于生物間的個體差異是客觀存在的,因此抽樣誤差在抽樣研究中是不可避免的,但有一定的規律可循¨ 從此總體隨機抽取n10的100個樣本,可計算100個樣本的均數,得

2、頻數分布如下:組段151152153154155156157158159頻數1610182920862· 看出樣本均數的分布近似服從正態分布 樣本均數的均數為,¨ 統計學中把樣本均數的標準差稱為均數的標準誤,簡稱為標準誤(standard error,SE) 從正態總體中隨機抽取例數為n的樣本,樣本均數也服從正態分布;即使從偏態總體抽樣,當n足夠大時(如n30),也近似服從正態分布 從均數,標準差s的正態或偏態總體抽取例數為n的樣本,樣本均數的總體均數為,標準差為(9-18)· 與從100個樣本均數計算出的樣本均數的標準差(即標準誤)1.64cm相近·

3、s未知,樣本標準差S作為的估計值(9-19)Luo:稱為理論標準誤,稱為樣本標準誤 均數標準誤的用途: 衡量樣本均數的可靠性。均數標準誤越小,說明樣本均數與總體均數的差異程度越小,越可靠 估計總體均數的置信區間(見本節中的三) 用于均數的假設檢驗(見本章第四節)。二、t分布¨ 變換后,u叫作標準正態變量,u服從標準正態分布,簡寫為 N(0, 1) -3 -2 -1 0 1 2 3 圖B 標準正態分布圖P=0.025P=0.025u -1.96 m 1.96圖A 抽樣試驗的樣本均數分布圖¨ 用來估計,對采用的不是u變換而是t變換(9-20)標準t變量不服從u分布,而是t分布(

4、t-distribution) -4 -3 -2 -1 0 1 2 3 4 圖9-7 不同自由度下t分布圖n=5n=1n=¥ (標準正態分布)t¨ t分布主要用于總體均數的區間估計及t檢驗等。表9-9 t界值表自由度概率P雙側: 0.100.050.020.01單側: 0.050.0250.010.00516.31412.70631.82163.65722.9204.3036.9659.92532.3533.1824.5415.84142.1322.7763.7474.60452.0152.5713.3654.03261.9432.4473.1433.70771.8952.

5、3652.9983.49981.8602.3062.8963.35591.8332.2622.8213.250101.8122.2282.7643.169111.7962.2012.7183.106121.7822.1792.6813.055131.7712.1602.6503.012141.7612.1452.6242.977151.7532.1312.6022.947161.7462.1202.5832.921171.7402.1102.5672.898181.7342.1012.5522.878191.7292.0932.5392.861201.7252.0862.5282.845211

6、.7212.0802.5182.831221.7172.0742.5082.819231.7142.0692.5002.807241.7112.0642.4922.797251.7082.0602.4852.787261.7062.0562.4792.779271.7032.0522.4732.771281.7012.0482.4672.763291.6992.0452.4622.756301.6972.0422.4572.750401.6852.0212.4232.704501.6762.0092.4032.678601.6712.0002.3902.6605001.6481.9652.58

7、61.6451.9602.576三、總體均數的置信區間估計¨ 反映總體特征的統計指標稱為參數(parameter)¨ 反映樣本特征的統計指標稱為統計量(statistic)1點(值)估計(point estimation) 例如樣本均數、樣本標準差S是總體均數、總體標準差的點估計,即2區間估計(interval estimation)· 根據一定的置信度進行估計得到的區間,稱為置信區間或可信區間(confidence interval ,CI)· 可信度(confidence level)要預先確定,可用1-表示,常用的可信度為95%(1)已知時,按正態

8、分布原理(9-21)(2)未知、且樣本例數較小時,一般按t分布原理,95%置信區間為(9-22)(3)未知,但樣本例數n足夠大時(9-23)例9-13 隨機抽取某地健康男子20人,測得收縮壓均數=118.4mmHg,標準差S=10.8mmHg,試估計該地男子收縮壓總體均數的95%置信區間。本例自由度n -120 -119,0.05,查t界值表,得t0.05,192.093,代入公式9-22()=()=(113.3,123.5)· 這種估計方法犯錯誤的風險約5%Luo:正態分布指標的表達問題(1)118.4±10.8 ¬® 描述樣本數據特征,不必注釋(2)

9、118.4±2.41 ¬® 反映樣本均數的代表性,一定要注釋說明(SE即的英文符號)(3) ¬® 95%的(個體) x分布在此范圍(參考值)(4) ¬® 95%的(指標)分布在此范圍(5) ¬® 95%的置信度估計m在此區間 ¨“范圍”指分布范圍,“區間”指數軸上的一段四、假設檢驗的基本思想和步驟例9-14 某地抽樣調查了280名健康成年男性的血紅蛋白含量,其均數為136.0g/L,標準差為6.0g/L。已知正常成年男性血紅蛋白的均數為140.0g/L。試問能否認為該地抽樣調查的280名成年男性

10、的血紅蛋白含量與正常成年男性的血紅蛋白含量的均數不同?步驟:1. 建立檢驗假設H0和備擇假設H1 H0:0(=140.0),即該地成年男性血紅蛋白含量與全國的平均水平相同(相等) H1:0(本例雙側檢驗),即該地成年男性血紅蛋白含量與全國的平均水平不相同(不相等) 如果是單側檢驗,則H1:>0 (或<0)2. 確定檢驗水準 a=0.05 (小概率界限)3. 選定檢驗方法和計算檢驗統計量 按公式9-20計算檢驗統計量t值 本例為大樣本,也可以用近似u檢驗4. 確定P值和作出推斷結論。 本例t0.01,2002.601,結論表述為: t11.16,P0.01,拒絕H0,接受H1,認為該

11、地成年男性血紅蛋白含量與全國的平均水平不相同。 結合樣本信息,可認為該地男子血紅蛋白含量偏低。Luo:關于H1的表述 統計結論(H1):不分高低(差異有統計學意義差異有顯著性)實際推論(H1):決擇高低(結合樣本信息作出抉擇)結語一、均數的抽樣誤差與標準誤1. 均數的抽樣誤差是指樣本均數與總體均數的差別(抽樣.個體變異,不可避免.有規律) ·從抽樣實驗、理論上:樣本均數服從正態分布2. 標準誤是描述抽樣誤差大小的指標,等于標準差除以例數的平方根(從抽樣實驗、理論上看:標準誤樣本均數的標準差)3. 應用:反映樣本均數的代表性、估計置信區間、假設檢驗二、t分布1. 來源:X服從正態,以S代替s的標準化量,2. 特征(與標準正態u分布對比)(1)外觀:峰較低尾較高、對稱于0點(2)參數:比u分布多一個參數自由度(3)面積:同一統計量,t分布尾部面積較大相同P值(相同的尾部面積),t分布界值較大三、總體均數的置信區間估計(95%CI)· 它是均數誤差分布的逆推理,置信度95%不是概率(近似),一般不叫把握度1. 小樣本:2. 大樣本:四、假設檢驗的基本思想和步驟1.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論