第3章 區間估計和假設檢驗_第1頁
第3章 區間估計和假設檢驗_第2頁
第3章 區間估計和假設檢驗_第3頁
第3章 區間估計和假設檢驗_第4頁
第3章 區間估計和假設檢驗_第5頁
已閱讀5頁,還剩75頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、1第三章第三章 區間估計和假設檢驗目錄區間估計和假設檢驗目錄 n區間估計和假設檢驗區間估計和假設檢驗n3.1 正態總體的均值、方差的區間估計正態總體的均值、方差的區間估計n3.2 均值、方差的假設檢驗均值、方差的假設檢驗n3.3 正態性檢驗正態性檢驗n3.4 非參數秩和檢驗非參數秩和檢驗n3.4.1 配對的符號檢驗配對的符號檢驗n3.4.2 成組數據的秩和檢驗成組數據的秩和檢驗返回返回2區間估計和假設檢驗區間估計和假設檢驗 n利用樣本的信息對總體的特征進行統計推斷,是統利用樣本的信息對總體的特征進行統計推斷,是統計學要解決的主要問題之一。計學要解決的主要問題之一。n它通常包括兩類方面:一類是進

2、行估計,包括參數它通常包括兩類方面:一類是進行估計,包括參數估計、分布函數的估計以及密度函數的估計等;另估計、分布函數的估計以及密度函數的估計等;另一類是進行檢驗。一類是進行檢驗。n在這里,首先利用在這里,首先利用SAS提供的提供的MEANS、UNIVARIATE和和TTEST等過程對應用廣泛的正態總等過程對應用廣泛的正態總體參數進行區間估計和假設檢驗,其次再來介紹對體參數進行區間估計和假設檢驗,其次再來介紹對觀測數據的正態性進行檢驗,最后介紹一些常用的觀測數據的正態性進行檢驗,最后介紹一些常用的非參數檢驗方法。非參數檢驗方法。 本章目錄本章目錄3區間估計和假設檢驗區間估計和假設檢驗1 正態總

3、體的均值、方差的區間估計正態總體的均值、方差的區間估計 區間估計區間估計是通過構造兩個統計量是通過構造兩個統計量 ,能以,能以 的置信度使總體的參數落入的置信度使總體的參數落入 區間中,即區間中,即 。其中。其中 稱為顯著性稱為顯著性水平或檢驗水平,通常取水平或檢驗水平,通常取 或或 ; 分別稱為置信下限和置信上限分別稱為置信下限和置信上限 ,)%1 (100,1P05. 001. 0,本章目錄本章目錄4區間估計和假設檢驗區間估計和假設檢驗 1 正態總體的均值、方差的區間估計正態總體的均值、方差的區間估計 v對于單個子樣而言,設對于單個子樣而言,設 是取自是取自 的一個樣本;的一個樣本;v對兩

4、個子樣而言,設對兩個子樣而言,設 , 是分別取自是分別取自 和和 的樣本的樣本( 分別為二者的樣本方差),則有分別為二者的樣本方差),則有如下結論如下結論 ),(2N2,.,21nYYY),(121N),(222Nyxss22,nXXX,.,211,.,21nXXX5區間估計和假設檢驗區間估計和假設檢驗 1 正態總體的均值、方差的區間估計正態總體的均值、方差的區間估計 nuX/2nuX/22nstXn/)(21nstXn/)(2122)()(2212nniiX)1()(2212nniiX)()1(2122nsn)1()1(2122nsn 待估待估參數參數置信下限置信下限置信上限置信上限備注備注

5、單單個個子子樣樣 已知已知 未知未知 已知已知 未知未知本章目錄本章目錄6區間估計和假設檢驗區間估計和假設檢驗 1 正態總體的均值、方差的區間估計正態總體的均值、方差的區間估計 212221122)(nnuXY2221122)(nnuXY2212,212121222122/ ) 2()() 1()()(21nnnnnnsnsntXYyxnn212121222122/)2()() 1()()(21nnnnnnsnsntXYyxnn2212,2212)(21, 12221 nnyxFss)1 (21, 12221 nnyxFss2212, 待 估待 估參數參數置信下限置信下限置信上限置信上限 備注

6、備注兩兩個個子子樣樣 已知已知 未知未知 未知未知本章目錄本章目錄7區間估計和假設檢驗區間估計和假設檢驗1 正態總體的均值、方差的區間估計正態總體的均值、方差的區間估計 n1 正態總體的均值、方差的區間估計正態總體的均值、方差的區間估計注:注: , , , 分別表示標準正分別表示標準正態分布,態分布, (自由度為(自由度為 ),),-分布分布( 自 由 度 為( 自 由 度 為 ) , 分 布 ( 自 由 度) , 分 布 ( 自 由 度為為 )的上)的上 分位點。分位點。u)(1nt)(12n)(1, 121 nnF分布t1n21n1nF) 1, 1(21nn本章目錄本章目錄8區間估計和假設

7、檢驗區間估計和假設檢驗 1 正態總體的均值、方差的區間估計正態總體的均值、方差的區間估計 n例例1n設某廠一車床生產的鈕扣,其直徑據經設某廠一車床生產的鈕扣,其直徑據經驗服從正態驗服從正態 , 。為了判斷。為了判斷其均值的置信區間,現抽取容量其均值的置信區間,現抽取容量n=100的子樣,其子樣均值的子樣,其子樣均值=26.56,求其均值,求其均值的的95%的置信區間的置信區間.),(20N2 .50本章目錄本章目錄9區間估計和假設檢驗區間估計和假設檢驗 1 正態總體的均值、方差的區間估計正態總體的均值、方差的區間估計 SAS程序為程序為:data val1; xbar=26.56; sigma

8、=5.2;n=100; u=probit(0.975); delta=u*sigma/sqrt(n); l c l = x b a r - d e l t a ; ucl=xbar+delta;Run;proc print data=val1; var lcl xbar ucl;run;本章目錄本章目錄10區間估計和假設檢驗區間估計和假設檢驗 1 正態總體的均值、方差的區間估計正態總體的均值、方差的區間估計 SAS程序為程序為其輸出結果為其輸出結果為: LCL XBAR UCL 25.5408 26.56 27.5792即總體均值的即總體均值的95%的置信區間為的置信區間為25.5408,27

9、.5792;本章目錄本章目錄11區間估計和假設檢驗區間估計和假設檢驗 1 正態總體的均值、方差的區間估計正態總體的均值、方差的區間估計 n例例2n檢驗某種型號玻璃紙的橫向廷伸率。測得的數據如下檢驗某種型號玻璃紙的橫向廷伸率。測得的數據如下 橫向廷伸率橫向廷伸率% 35.5 37.5 39.5 41.5 43.5 45.5 47.5 49.5 51.5 53.5 55.5 57.5 59.5 61.5 63.5頻數頻數 7 8 11 9 9 12 17 14 5 3 2 0 2 0 1現在要檢驗假設現在要檢驗假設 ,并求出其并求出其95%的置信區間。的置信區間。 65:00H本章目錄本章目錄12

10、區間估計和假設檢驗區間估計和假設檢驗 1 正態總體的均值、方差的區間估計正態總體的均值、方差的區間估計 SAS程序為:程序為:data var22; input x fx; y=x-65;cards;35.5 7 37.5 8 39.5 11 41.5 9 43.5 9 45.5 12 47.5 17 49.5 1451.5 5 53.5 3 55.5 2 57.5 0 59.5 2 61.5 0 63.5 1;proc means data=var22 t prt clm; var y; freq fx;run;CLM表示要輸出表示要輸出95%95%置信區間置信區間 本章目錄本章目錄13區間

11、估計和假設檢驗區間估計和假設檢驗 1 正態總體的均值、方差的區間估計正態總體的均值、方差的區間估計 n輸出結果:輸出結果: 分析變量分析變量 : Y T- 統計量統計量 Prob|T| 95.0% 置信下界置信下界 95.0% 置信上界置信上界- -34.29 |t| fatpct Pooled Equal 21 -1.70 0.1031 fatpct Satterthwaite Unequal 20.5 -1.73 0.0980 Equality of Variances Variable Method Num DF Den DF F Value Pr Ffatpct Folded F 12

12、 9 1.29 0.7182本章目錄本章目錄其結論為其結論為:n所測不同性別的人的脂肪含量所測不同性別的人的脂肪含量沒有顯著差別。沒有顯著差別。17區間估計和假設檢驗區間估計和假設檢驗 1 正態總體的均值、方差的區間估計正態總體的均值、方差的區間估計 本章目錄本章目錄注:例注:例3的數據特點是的數據特點是獨立組樣本獨立組樣本,檢驗方法是,檢驗方法是T檢驗檢驗。n獨立組樣本獨立組樣本T檢驗要求數據符合以下檢驗要求數據符合以下3個條件:個條件:(1)觀察值之間是獨立的;)觀察值之間是獨立的;(2)每組觀察值是來自正態分布的總體;)每組觀察值是來自正態分布的總體;(3)兩個獨立組的方差相等。)兩個獨

13、立組的方差相等。18區間估計和假設檢驗區間估計和假設檢驗 1 正態總體的均值、方差的區間估計正態總體的均值、方差的區間估計 本章目錄本章目錄注:采用注:采用PROC CHART過程對獨立組樣本畫直方圖過程對獨立組樣本畫直方圖直方圖有兩種形態:垂直條形圖和水平條形圖,下面對例直方圖有兩種形態:垂直條形圖和水平條形圖,下面對例3畫水畫水平條形圖,平條形圖,SAS程序為:程序為:data bodyfat; input sex $ fatpct ; cards;男男 13.3 女女 22 男男 19 女女 26 男男 20 女女 16 男男 8 女女 12 男男 18 女女 21.7男男 22 女女

14、23.2 男男 20 女女 21 男男 31 女女 28 男男 21 女女 30 男男 12 女女 23男男 16 男男 12 男男 24;PROC CHART DATA=BODYFAT ; hbar fatpct/group=sex; title “兩組獨立樣本的水平條形圖兩組獨立樣本的水平條形圖”;RUN;19區間估計和假設檢驗區間估計和假設檢驗 1 正態總體的均值、方差的區間估計正態總體的均值、方差的區間估計 運行結果為:運行結果為:20區間估計和假設檢驗區間估計和假設檢驗 1 正態總體的均值、方差的區間估計正態總體的均值、方差的區間估計 n例例4 假定初生嬰兒(男孩)的體重服從正態分布

15、,隨機假定初生嬰兒(男孩)的體重服從正態分布,隨機抽取抽取12名新生嬰兒,測其體重為名新生嬰兒,測其體重為3100,2520,3000,3000,3600,3160,3560,3320,2880,2600,3400,2540。試給出新生嬰兒體。試給出新生嬰兒體重重方差方差的置信區間(置信度為的置信區間(置信度為95% )。)。 本章目錄本章目錄21區間估計和假設檢驗區間估計和假設檢驗 1 正態總體的均值、方差的區間估計正態總體的均值、方差的區間估計 n例例4 SAS程序為程序為data val2; input weight;cards;3100 2520 3000 3000 3600 3160

16、 3560 3320 2880 2600 3400 2540;proc means data=val2; output out=tval1 css=ss n=n;Run;data tval2; set tval1; df=n-1; xlchi=cinv(0.025,df); xuchi=cinv(0.975,df); lchi=ss/xuchi; uchi=ss/xlchi;Run;proc print data=tval2;var lchi uchi;run;本章目錄本章目錄niixx12)(22區間估計和假設檢驗區間估計和假設檢驗1 正態總體的均值、方差的區間估計正態總體的均值、方差的區間

17、估計 輸出結果如下:輸出結果如下: LCHI UCHI 70687.19 406071.51即方差的置信區間為:即方差的置信區間為:70687.19, 406071.51 本章目錄本章目錄23區間估計和假設檢驗區間估計和假設檢驗1 二項分布總體概率以及概率之差的區間估計二項分布總體概率以及概率之差的區間估計* 一、總體概率的置信區間一、總體概率的置信區間本章目錄本章目錄 從二項分布從二項分布B(,n)中隨機抽取一份樣本,若特定事件發生次數中隨機抽取一份樣本,若特定事件發生次數記為記為X,該事件的樣本頻率記為,該事件的樣本頻率記為P=X/n,則,則P因樣本而異。因樣本而異。小樣本時,可根據小樣本

18、時,可根據X的觀察值查表確定總體概率的觀察值查表確定總體概率的的95%或或99%的置信區間。的置信區間。大樣本時(大樣本時(n30),需利用),需利用P近似地服從正態分布的性質進行近似地服從正態分布的性質進行估計,即估計,即PNp,p(1-p)/n,其中,其中p為樣本頻率。此時,為樣本頻率。此時,總體概率總體概率的的(1-)置信區間為:置信區間為:/ )1 (,/ )1 (nppzpnppzp24區間估計和假設檢驗區間估計和假設檢驗1 二項分布總體概率以及概率之差的區間估計二項分布總體概率以及概率之差的區間估計* 二、二項分布總體概率之差的置信區間二、二項分布總體概率之差的置信區間本章目錄本章

19、目錄 設有兩個二項分布設有兩個二項分布B(1,n1)和和B(2,n2),當,當n1和和n2是大樣本時,是大樣本時,事件發生的頻率事件發生的頻率P1和和P2均近似地服從正態分布,兩者之差均近似地服從正態分布,兩者之差P1-P2也近似地服從正態分布,即也近似地服從正態分布,即其中其中p1和和p2為樣本頻率的觀察值。據此,總體概率之差為樣本頻率的觀察值。據此,總體概率之差1-2的的(1- )置信區間為:置信區間為:/ )1 (/ )1 ()(,/ )1 (/ )1 ()(2221112122211121nppnppzppnppnppzpp/ )1 (/ )1 (,2221112121nppnppNP

20、P25區間估計和假設檢驗區間估計和假設檢驗1 二項分布總體概率以及概率之差的區間估計二項分布總體概率以及概率之差的區間估計* 本章目錄本章目錄 例例5 某醫院將病情類似的病人隨機分成兩組。第一組某醫院將病情類似的病人隨機分成兩組。第一組48人,用人,用A藥治療,藥治療,30人治愈;第二組人治愈;第二組45人,用人,用B藥,藥,20人治愈。試分人治愈。試分別計算兩種藥總體治愈概率的別計算兩種藥總體治愈概率的95%置信區間以及兩種藥總體置信區間以及兩種藥總體治愈率之差的治愈率之差的95%置信區間。置信區間。Data ex5;n1=48;x1=30;n2=45;x2=20;p1=x1/n1;p2=x

21、2/n2;s1=sqrt(p1*(1-p1)/n1);s2=sqrt(p2*(1-p2)/n2);s12=sqrt(p1*(1-p1)/n1+p2*(1-p2)/n2);a=probit(0.975);/*標準正態分布分位數標準正態分布分位數X1-a/2*/lp1=p1-a*s1;up1=p1+a*s1;lp2=p2-a*s2;up2=p2+a*s2;lp12=(p1-p2)-a*s12;up12=(p1-p2)+a*s12;proc print data=ex5;run;26區間估計和假設檢驗區間估計和假設檢驗1 二項分布總體概率以及概率之差的區間估計二項分布總體概率以及概率之差的區間估計*

22、 本章目錄本章目錄 例例5 某醫院將病情類似的病人隨機分成兩組。第一組某醫院將病情類似的病人隨機分成兩組。第一組48人,用人,用A藥治療,藥治療,30人治愈;第二組人治愈;第二組45人,用人,用B藥,藥,20人治愈。試分人治愈。試分別計算兩種藥總體治愈概率的別計算兩種藥總體治愈概率的95%置信區間以及兩種藥總體置信區間以及兩種藥總體治愈率之差的治愈率之差的95%置信區間。置信區間。故故1的的95%置信區間為置信區間為(0.488,0.762),2的的95%置信置信區間為區間為(0.299,0.589), 1-2的的95%置信區間為置信區間為(-0.019,0.381)。27區間估計和假設檢驗區

23、間估計和假設檢驗1 二項分布總體概率以及概率之差的比較二項分布總體概率以及概率之差的比較 本章目錄本章目錄Data a; do b=1 to 48; /*第一組第一組*/ c=1; if b19 then x=1;else x=0; /*30人治愈為人治愈為X=0,18人未治愈為人未治愈為X=1*/ output; end; do b=1 to 45; /*第二組第二組*/ c=2; if b0H0: Md(d)=0H1: Md(d)50)正正態近似法態近似法若|Z|Za/2,則,則拒絕拒絕H0 若|Z|Za,則,則拒絕拒絕H0若|Z|Za,則,則拒絕拒絕H055區間估計和假設檢驗區間估計和假

24、設檢驗 3 3 非參數秩和檢驗非參數秩和檢驗 3.1配對配對(成對)(成對)的符號檢驗的符號檢驗 n例例9(配對符號檢驗配對符號檢驗): 用二乙胺化學法與氣相色用二乙胺化學法與氣相色譜法測定車間空氣中譜法測定車間空氣中CS2的含量的含量(mg/m3),其測其測量值見表量值見表,問兩法所得結果有無差別(檢驗水問兩法所得結果有無差別(檢驗水平平0.1)? 兩種方法測定車間空氣中兩種方法測定車間空氣中CS2的含量(的含量(mg/m3)樣品號樣品號 1 2 3 4 5 6 7 8 9 10化學法化學法 50.7 3.3 28.8 46.2 1.2 25.5 2.9 5.4 3.8 1.0色譜法色譜法

25、60.0 3.3 30.0 43.2 2.2 27.5 4.9 5.0 3.2 4.0本章目錄本章目錄56區間估計和假設檢驗區間估計和假設檢驗 3 3 非參數秩和檢驗非參數秩和檢驗 3.1配對(成對)的符號檢驗配對(成對)的符號檢驗 n例例9(配對符號檢驗配對符號檢驗)data cs2; input x y; diff=x-y;cards;50.7 60.0 3.3 3.3 28.8 30.0 46.2 43.2 1.2 2.2 25.5 27.5 2.9 4.9 5.4 5.0 3.8 3.2 1.0 4.0;proc univariate data=cs2 normal; var diff

26、; run;本章目錄本章目錄57區間估計和假設檢驗區間估計和假設檢驗 3 3 非參數秩和檢驗非參數秩和檢驗 3.1配對(成對)的符號檢驗配對(成對)的符號檢驗 n例例9(配對符號檢驗配對符號檢驗)n輸出結果為:輸出結果為: M(Sign) -1.5 Pr=|M| 0.5078W:Normal 0.854817 PrW 0.0638從正態性檢驗的結果來看,在從正態性檢驗的結果來看,在0.1顯著性水平下拒絕這兩顯著性水平下拒絕這兩種方法所測數據的差值服從正態分布種方法所測數據的差值服從正態分布(0.0638 |Z| = 0.0003,說,說明這兩組數據間有差別。明這兩組數據間有差別。63區間估計和

27、假設檢驗區間估計和假設檢驗 獨立組和成對組數據比較的總結獨立組和成對組數據比較的總結 1、兩組比較的方法、兩組比較的方法 本章目錄本章目錄檢驗法檢驗法獨立組獨立組成對組成對組參數檢驗參數檢驗兩樣本兩樣本T檢驗檢驗成對差值成對差值T檢驗檢驗非參數檢驗非參數檢驗Wilcoxon秩和檢驗秩和檢驗Wilcoxon符號秩檢驗符號秩檢驗64區間估計和假設檢驗區間估計和假設檢驗 獨立組和成對組數據比較的總結獨立組和成對組數據比較的總結 2、兩組比較的語句、兩組比較的語句 檢驗法檢驗法獨立組獨立組成對組成對組參數檢參數檢驗驗兩樣本兩樣本T檢驗采用:檢驗采用:PROC TTEST;CLASS 分組變量名分組變量

28、名;VAR 因變量名因變量名;(見例(見例3程序)程序)成對差值成對差值T檢驗采用:檢驗采用:Dif=m-f;Proc univariate; Var dif;或:或:proc means t prt; var dif;(見例(見例8程序)程序)其結果觀察其結果觀察Pr|T|的概率值的概率值非參數非參數檢驗檢驗Wilcoxon秩和檢驗采用:秩和檢驗采用:PROC NPAR1WAY WILCOXON;CLASS I;VAR y;(見例(見例10程序)程序)Wilcoxon符號秩檢驗采用:符號秩檢驗采用:Dif=m-f;Proc univariate; Var dif;或:或:proc means

29、 t prt; var dif;(見例(見例9程序)程序)其結果觀察其結果觀察Pr=|M| 或或Pr|T|的的概率值概率值65區間估計和假設檢驗區間估計和假設檢驗 4 4 正態性檢驗正態性檢驗 n判斷總體的分布是否為正態總體的假設檢驗稱為判斷總體的分布是否為正態總體的假設檢驗稱為正態正態性檢驗性檢驗。n從上面可以看出,許多統計結論是基于正態總體的,從上面可以看出,許多統計結論是基于正態總體的,因此如何來判斷某樣本是否來自正態總體就顯得非常因此如何來判斷某樣本是否來自正態總體就顯得非常重要。重要。n目前,正態性檢驗的方法很多,這里主要介紹目前,正態性檢驗的方法很多,這里主要介紹SAS中中常用的常用的分布擬合優度檢驗分布擬合優度檢驗,W檢驗檢驗和和偏度峰度檢驗偏度峰度檢驗,Q-Q圖檢驗圖檢驗等方法。等方法。本章目錄本章目錄66區間估計和假設檢驗區間估計和假設檢驗 4 4 正態性檢驗正態性檢驗 本章目錄本章目錄67區間估計和假設檢驗區間估計和假設檢驗 4 4 正態性檢驗正態性檢驗 本章目錄本章目錄68區間估計和假設檢驗區間估計和假設檢驗 4 4 正態性檢驗正態性檢驗 本章目錄本章目錄69區間估計和假設檢驗區間估計和假設檢驗 4 4 正態性檢驗正態性檢驗 n例例1111已知已知20名學生的各科平均

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論