




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
抽樣誤差與假設檢驗均數的抽樣誤差和總體均數的估計(一)、均數的抽樣誤差與標準誤統計推斷
用樣本的信息推論總體的特征。參數估計統計推斷假設檢驗健康女性體溫102人
均數的抽樣誤差----由于抽樣造成的樣本均數與總體均數、樣本均數之間的差異?!鏄颖?樣本2樣本k總體均數···根據中心極限定理:1.從正態總體中抽樣,抽取樣本含量為n的樣本,樣本均數服從正態分布。即使是從偏態總體中抽樣,在樣本含量足夠(n>50)大時,
也近似正態分布。2.從均數為,標準差為的正態或偏態總體中抽樣樣本例數為n的樣本,新樣本組成的數據中,樣本均數為,標準差標準誤:樣本均數的標準差反映各均數間的離散程度。標準誤的意義:
描述抽樣誤差的大小,越小,說明抽樣誤差越小,樣本均數越接近總體均數,用代表的可靠性越高。標準誤的計算均數的標準誤
以某地14歲健康女生身高的標準差σ=5.30cm及每個樣本包含的例數10代入公式,求得
均數標準誤的用途:①可用來衡量樣本均數的可靠性。②與樣本均數結合,可用于估計總體均數的可信區間;③可用于進行均數的假設檢驗。應用時,用樣本標準差來代替總體標準差,則標準誤的估計值為:???減少抽樣誤差的有效途徑(二)t分布u變換(將正態分布轉化為標準正態分布)t變換
全國14歲女生(身高)120人120人120人120人…………(t分布)(u分布)…………t分布特征:(1)單峰分布,以0為中心左右對稱。(2)t分布是一簇曲線,其形狀受ν的影響。t分布與標準正態分布(u
分布)區別:*
t分布曲線峰部較矮,尾部稍翹。*
n(自由度)越大,t
分布與u
分布越接近;當時,t
分布=u
分布。t分布的特征:t界值表:(附錄9-P261)t界值表的特征:
⑴自由度相同時越大,概率P越??;⑵雙側概率P為單側概率P的兩倍。
自由度為,概率為(檢驗水準)時,
t
的界值記為。t界值表的查法:
=?通常取0.05或0.01
(t
越大,概率P
越?。?.2623.2501.962.58當n≥50,為大樣本(t分布=u
分布),可用來代替
(三)總體均數的可信區間估計
統計描述統計分析參數估計---用樣本指標估統計推斷計總體指標假設檢驗點估計---用估計參數估計區間估計---按一定的概率估計總體均數落在某個范圍這個范圍稱之為:
總體均數的可信區間CI
,用區間()表示。如(37.02,37.10),說明總體均數在37.02~37.10之間,但不包含上限(37.10)及下限(37.02)兩個值??傮w均數可信區間的計算1)已知
95%置信區間
99%置信區間
未知時總體均數可信區間的計算2)大樣本----按u
分布
95%置信區間
99%置信區間例7-15102名健康女大學生口腔溫度總體均數為=37.06℃,標準差S=0.198℃,標準誤=0.0196℃,試估計該地健康女大學生口腔溫度總體均數95%可信區間和99%可信區間。95%可信區間為37.06±1.96×0.0196,(37.02,37.10)99%可信區間為37.06±2.58×0.0196,(37.01,37.11)某市2001年120名7歲男童的身高=123.62
(cm)S=4.75(cm),計算該市7歲男童總體均數90%的可信區間。
n=120>100,故可以用標準正態分布代替t分布,u0.01=1.645==
總體均數可信區間的計算3)小樣本或未知----按
t分布
95%置信區間
99%置信區間
例
隨機抽取某地健康男子20人,測得該樣本的收縮壓均數為118.4mmHg,標準差S為10.8mmHg,試估計該地男子收縮壓總體均數的95%置信區間。此為小樣本,應按
t
分布。收縮壓過高過低均為異常,故取雙側。95%置信區間:
代入數據
(
)
即(113.3,123.5)隨機抽查某地30名40-44歲哈薩克族成年男性的骨密度,測得骨密度均數資料,=187.11mg/cm2,試估計該地40-44歲哈薩克族成年男性的骨密度總體均數的95%可信區間N=30,則v=29,查附表2,t界值表,t0.05/2,29=2.045可信區間的兩個要素:1.準確度:反映在的大小上。2.精確度:反映在區間的長度上。在樣本含量一定的情況下二者是矛盾的。常用的95%置信區間。
均數可信區間與參考值范圍的區別
95%可信區間:從至范圍有95%的可能性包含了總體均數。95%正常值范圍:一組觀察值中,有95%個體(頻數)的觀察值在至范圍內。六、均數的假設檢驗(一)假設檢驗的基本思想—利用反證法的思想例
某地抽樣調查了25名健康成年男性的脈搏,,其均數為74.2次/分,標準差為6.5次/分。已知正常成年男性脈搏的均數為72次/分。試問能否認為該地抽樣調查的25名成年男性的脈搏與正常成年男性脈搏的均數不同?μ0=72次/分μn=25
=74.2次/分
S=6.5次/分已知總體未知總體差異的原因:
(1)由于抽樣誤差造成的.(實際上,但由于抽樣誤差不能很好代表)(2)該地成年男性的脈搏與正常成年男性脈搏均數不同()
假設檢驗的目的就是判斷差異的原因:
求出由抽樣誤差造成此差異的可能性(概率P)有多大
!若P
較大(P>0.05),認為是由于抽樣誤差造成的。原因(1),實際上若P
較小(P≤0.05),認為不是由于抽樣誤差造成的。原因(2),實際上>(二)假設檢驗的基本步驟1、建立假設,確定檢驗水準H0:(無效假設)μ=μ0H1:(備擇假設)μ>μ0檢驗水準的意義及確定2、選定檢驗方法,計算檢驗統計量3、確定P值,作出推斷結論
(推斷的結論=統計結論+專業結論)
P>0.05,按檢驗水準,不拒絕H0,差異無統計學意義(差異無顯著性),還不能認為……不同或不等。
P≤0.05
,按檢驗水準,拒絕H0,接受H1,
差異有統計學意義(差異有顯著性)
,可以認為……不同或不等。
P≤0.01,按檢驗水準,拒絕H0,接受H1,差異有高度統計學意義(差異有高度顯著性)
,可以認為……不同或不等。72次/分
單、雙側檢驗的選擇:
1、根據專業知識事先不知道會出現什么結果雙側事先知道只能出現某種結果單側*通常用雙側(除非有充足的理由選用單側之外,
一般選用保守的雙側較穩妥)
確定P值:(用求出的t值與查表查出的t
值比較)查t
值表:
(t
越大,P
越小)
(1)求出t=1.833,P>0.05
(2)求出t=4.18,
P<0.01
(3)求出t=2.96,
0.01<P<0.05(簡寫為P<0.05)
(4)求出t=3.25,P=0.01Pt0.050.013.2502.2621.833P>0.054.18P<0.01P<0.052.96
假設檢驗的思路是:首先對未知或不完全知道的總體提出一個假設,然后借助一定的分布,觀察實測樣本情況是否屬于小概率事件。一般把概率P≤0.05的事件稱為小概率事件,小概率事件在一次觀察中可以認為是不會發生的,如實測樣本情況屬于小概率事件,則不拒絕原來的假設;如實測樣本情況不屬于小概率事件,則拒絕原來的假設。當然,小概率事件在一次觀察中還是可能發生的,若我們恰好碰上,則假設檢驗的結論就是錯誤的,不過因為小概率事件發生的概率小,所以犯這種錯誤的概率也小。(1)建立假設、確定檢驗水準H0:μ=μ0即山區成年男子平均脈搏數與一般成年男子相等H1:μ>μ0
即山區成年男子平均脈搏數高于一般成年男子(2)選定檢驗方法,計算檢驗統計量(3)確定P值,作出推斷結論T界值表,得t0.1,24=1.711,t<t0.1,24,故P>0.1
t檢驗和u檢驗t檢驗應用條件:
①當n<100時,要求樣本取自正態分布的總體,總體標準差未知;②兩小樣本均數比較時,要求兩樣本總體方差相等(σ12=σ22)。一、樣本均數與總體均數比較的t檢驗(即:樣本均數代表的未知總體均數μ和已知總體均數μ0的比較)例9-15已知某小樣本中含CaCO3的真值是20.7mg/L。現用某法重復測定該小樣本15次,CaCO3含量(mg/L)分別為:20.99,20.41,20.62,20.75,20.10,20.00,20.80,20.91,22.60,22.30,20.99,20.41,20.50,23.00,22.60。問該法測得的均數與真值有無差別?(1)建立假設、確定檢驗水準H0:μ=μ0即該測量方法所得均數與真值相等H1:μ≠μ0
即該測量方法所得均數與真值不相等(2)選定檢驗方法,計算檢驗統計量n=25<100,故選用t檢驗。已知=21.13(3)確定P值,作出推斷結論
查t界值表
為單側檢驗Pt0.050.012.9772.145P>0.051.70P>0.05,按檢驗水準,不拒絕H0,無統計學意義。尚不能認為該法測得的均數與真值不同。二、配對設計的均數比較常見的配對設計主要有以下情形:①自身比較:同一受試對象處理前后。②同一受試對象分別接受兩種不同的處理。③將條件近似的觀察對象兩兩配成對子,對子中的兩個個體分別給予不同的處理。配對t檢驗的基本原理:
假設兩種處理的效應相同,即μ1=μ2
,則μ1-μ2=0,即可看成是差值的樣本均數所代表的未知總體均數μd與已知總體均數μ0=0的比較,此時,我們可套用前述t檢驗的公式。例9-16應用某藥治療8例高血壓患者,觀察患者治療前后舒張壓變化情況,如表9-10,問該藥是否對高血壓患者治療前后舒張壓變化有影響?表9-10用某藥治療高血壓患者前后舒張壓變化情況病人編號舒張壓(mmHg)差值dd2治療前治療后⑴⑵⑶⑷=⑵-⑶1
96
88
8642
112
108
4163
108
102
6364
102
98
4165
98
100
-246
100
96
4167
106
102
4168
100
92
864合計--36232
H0:
該藥對舒張壓無影響。
H1:
該藥對舒張壓有影響。Pt0.050.012.365P<0.014.023.499⑶確定P值,判斷結果
自由度ν=n-1=8-1=7,查表9-9t界值表,t0.05,7=2.365,今4.02>2.365,故P<0.05,故按α=0.05水準,拒絕H0,接受H1,認為差異有高度顯著性,可以認為該藥有降低舒張壓的作用。三、兩個樣本均數比較的t檢驗大樣本(n>50)----u檢驗小樣本---正態分布資料t檢驗偏態分布資料秩和檢驗1、兩個大樣本均數的比較
例9-17
某地隨機抽取正常男性新生兒175名,測得血中甘油三酯濃度的均數為0.425mmol/L,標準差為0.254mmol/L;隨機抽取正常女性新生兒167名,測得甘油三酯濃度的均數為0.438mmol/L,標準差為0.292mmol/L,問男、女新生兒的甘油三酯濃度有無差別?⑴建立假設,確定檢驗水準
H0:μ1=μ2
H1:μ1≠μ2
α=0.05⑵選擇檢驗方法,計算檢驗統計量u值
(3)查u界值表(t界值表中自由度為的一行),u=0.438<1.96,故P>0.05,按=0.05水準,不拒絕H0,差異無統計學意義;尚不能認為正常男女新生兒血中甘油三酯濃度均數不同。
單樣本均數的u檢驗適用于當n較大(如n>50)或已知時。檢驗統計量分別為P121例8-2
例1995年,已知某地20歲應征男青年的平均身高為168.5cm。2003年,在當地20歲應征男青年中隨機抽取85人,平均身高為171.2cm,標準差為5.3cm,問2003年當地20歲應征男青年的身高與1995年相比是否不同?
檢驗界值u0.05/2=1.96,u0.01/2=2.58,u>u0.01/2,得P<0.01,按α=0.05水準,拒絕H0,接受H1,2003年當地20歲應征男青年與1995年相比,差別有統計學意義。2、兩個小樣本均數的比較例9-18兩組雄性大鼠分別飼以高蛋白和低蛋白飼料,觀察每只大鼠在實驗第28天到84天之間所增加的體重,見表9-11。問用兩種不同飼料喂養大鼠后,體重的增加有無差別?表9-11用兩種不同蛋白質含量飼料喂養大鼠后體重增加的克數高蛋白組1341461041191241611078311312997123低蛋白組
70118101
85107132
94⑴建立假設,確定檢驗水準H0:μ1=μ2H1:μ1≠μ2α=0.05⑵選擇檢驗方法,計算檢驗統計量t值⑶確定P值,判斷結果查表9-9t界值表,t0.05,17=2.110,今1.891<2.110,故P>0.05,故按α=0.05水準,不拒絕H0,尚不能認為兩種飼料喂養大鼠后體重的增加是不同的。PP=?t=1.891P=0.05tP=0.01t=2.110t=2.898四兩獨立樣本方差的齊性檢驗
兩獨立小樣本均數的t檢驗,除要求兩組數據均應服從正態分布外,還要求兩組數據相應的兩總體方差相等,即方差齊性。但即使兩總體方差相等,兩個樣本方差也會有抽樣誤差,兩個樣本方差不等是否能用抽樣誤差解釋?可進行方差齊性檢驗
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 河南省三門峽市澠池縣2024-2025學年數學三下期末調研模擬試題含解析
- 小學音樂老師教學培訓課件
- 家用紡織品的品牌戰略與營銷策略考核試卷
- 寶石礦區勘探中的地球化學技術考核試卷
- 礦山開采對氣候變化的響應考核試卷
- 電子樂器與人工智能結合考核試卷
- 礦山排土場邊坡穩定性分析及安全評價考核試卷
- 電聲器件在港口物流自動化中的應用考核試卷
- 硅冶煉過程中的能源審計與優化考核試卷
- 現代森林經營管理考核試卷
- 2024-2025年人教版七下語文期中復習-專題01 基礎知識積累(考點串講)
- ?2025年華能慶陽煤電有限責任公司高校畢業生招聘152人筆試參考題庫附帶答案詳解
- 2025-2030中國汽車用鋁板行業市場現狀供需分析及重點企業投資評估規劃分析研究報告
- 譯林版六年級英語下冊期中試卷及答案【真題】
- 2025屆山東省青島市高三下學期一模讀后續寫+替補隊員+講義
- 藥物臨床試驗科普
- 2024年內江市事業單位醫療崗招聘筆試真題
- 深靜脈血栓的評估和預防
- 杭州浙江杭州市上城區行政審批服務管理辦公室編外人員招聘筆試歷年參考題庫附帶答案詳解
- DB37-T 4612-2023 化妝品生產企業批生產記錄常用管理規范
- 2025年湖南懷化市城市管理和綜合執法局局屬事業單位招聘歷年高頻重點提升(共500題)附帶答案詳解
評論
0/150
提交評論