




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、實用標準文案非參數統計-十道題09統計學王若曦32009121114一、 Wilcoxon符號秩檢驗下面是10個歐洲城鎮每人每年平均消費的酒類相當于純酒精數,數據已經按升序排列:4.12 5.81 7.63 9.74 10.39 11.92 12.32 12.89 13.54 14.45人們普遍認為歐洲各國人均年消費酒量的中位數相當于純酒精8升,試用上述數據檢驗這種看法。數據來源:非參數統計(第二版)吳喜之 手算:建立假設組:H0:M=8H1:M>8編p純酒精數xD=x-8|D|D|的秩D的符號14.12-3.883.885-25.81-2.192.193-37.63-0.370.371
2、-49.741.741.742+510.392.392.394+611.923.923.926+712.324.324.327+812.894.894.898+913.545.545.549+1014.456.456.4510+T =2 4 6 7 8 9 10=46T_=5 3 1=9n=10查表得P=0.032< a =0.05 ,因此拒絕原假設,即認為歐洲各國人均年消費酒量的中位數 多于8升。SPSS:操作: AnalyzeNonparametric Tests2-Related Sample TestRanksNMean RankSum of Ranksc - xNegative
3、 RanksPositive RanksTiesTotal7a3b0c106.573.0046.009.00a. c < x b. c > xc. c = xTest Statisticsc - xZ-1.886 aAsymp. Sig. (2-tailed).059Exact Sig. (2-tailed).064Exact Sig. (1-tailed).032Point Probability.008a. Based on positive ranks.b. Wilcoxon Signed Ranks Test由輸出結果可知,單側精確顯著性概率P=0.032<a =0.
4、05,因此拒絕原假設,即認為歐洲各國人均年消費酒量的中位數多于8升。與手算結果相同。R語言:> x=c(4.12,5.81,7.63,9.74,10.39,11.92,12.32,12.89,13.54,14.45)> wilcox.test(x-8,alt="greater")Wilcoxon signed rank testdata: x - 8V = 46, p-value = 0.03223alternative hypothesis: true location is greater than 0由輸出結果可知,P=0.03223<a =0.05
5、,因此拒絕原假設,即認為歐洲各國人均年消費 酒量的中位數多于 8升。與以上結果一致。二、 Mann-Whitney-Wilcoxon 檢驗下表為8個亞洲國家和8個歐美國家2005年的人均國民收入數據。檢驗亞洲國家和歐美國家的人均國民收入是否有顯著差異( a =0.05)。亞洲國家人均國民收入(美元)歐美國家人均國民收入(美元)中國1740美國43740日本38980加拿大32600印度尼西業1280德國34580馬來西亞4960英國37600泰國2750法國34810新加坡2749030010韓國15830墨西哥7310印度720巴西3460數據來源:統計學(第三版)賈俊平手算:設亞洲國家為X
6、,歐美國家為 Y建立假設組:Ho:Mx=MyH1:Mx - My數值秩組別數值秩組別7201X274909X12802X3001010Y17403X3260011Y27504X3458012Y34605Y3481013Y49606X3760014Y73107Y3898015X158308X4374016YTx =1 2 3 4 6 8 9 15 =48Ty -5 7 10 1112 13 14 16-88N=m n=16, m=n=8, U=Tx - m(m 1)/ 2 = 12查表得,Tx=48的右尾概率的2倍為0.019*2=0.038< a =0.05 ,因此拒絕原假設,即認 為亞
7、洲國家和歐美國家的人均國民收入有顯著差異。SPSS:操作:DataSort CasesAnalyzeNonparametric Tests2-Independent Samples分組NMean RankSum of Ranks亞洲國家86.0048.00歐美國家811.0088.00Total16Ranks收入Test Statistics b收入Mann-Whitney U12.000Wilcoxon W48.000Z-2.100Asymp. Sig. (2-tailed).036Exact Sig. 2*(1-tailed Sig.).038 aExact Sig. (2-tailed)
8、.038Exact Sig. (1-tailed).019Point Probability.005a. Not corrected for ties.b. Grouping Variable: 分組由輸出結果可知,精確雙尾概率P=0.038<a =0.05,因此拒絕原假設,即認為亞洲國家和歐美國家的人均國民收入有顯著差異。與手算結果一致。R語言:> x<-c(1740,38980,1280,4960,2750,27490,15830,720)> y<-c(43740,32600,34580,37600,34810,30010,7310,3460)> wil
9、cox.test(x,y,exact=F,cor=F)Wilcoxon rank sum testdata: x and yW = 12, p-value = 0.03569alternative hypothesis: true location shift is not equal to 0由輸出結果可知,P=0.03569V a =0.05,因此拒絕原假設,即認為亞洲國家和歐美國家 的人均國民收入有顯著差異。與以上結果一致。兩樣本的Kolmogorov-Smirnov檢驗卜面是13個非洲地區和13個歐洲地區的人均酒精年消費量,試分析這兩個地區的酒精人均年消費量是否分布相同。非洲歐洲5.3
10、86.674.3816.219.3311.933.669.853.7210.431.6613.540.232.40.0812.892.369.31.7111.922.015.740.914.451.541.99數據來源:非參數統計(第二版)吳喜之手算:建立假設組:Ho:Fi(x)=F2(x)Hi:Fi(x)= F2(x)x3f2Z f1£ f2S(x)S2 ( x )lDl0.0810100.07692300.0769230.2310200.15384600.1538460.9110P 300.230769010.2307691.5410400.30769200.3076921.66
11、10500.38461500.3846151,7110P 600.46153800.4615381.9901610.4615380.0769230.3846152.0110710.5384620.0769230.4615382.36 :10P 810.6153850.076923 10.5384622.401820.6153850.1538460.4615383.6610920.6923080.1538460.5384623.72:10P 1020.7692310.153846 10.6153854.38101120.8461540.15384610.6923085.38101220.9230
12、770.1538460.7692315.7401r 1230.9230770.2307690.6923086.67 011240.9230770.3076920.6153859.3011250.9230770.3846150.5384629.331013510.3846150.6153859.8510113610.46153810.53846210.430113710.5384620.46153811.9201r 13810.6153850.38461511.930113910.69230810.30769212.8901131010.7692310.23076913.5401131110.8
13、461540.15384614.45 ;01131210.923077 10.07692316.21011313110D=max ( D )=0.769231, mnD=130查表得,當mnD=130時,雙側檢驗的概率 P<0.01,所以P<o( =0,05 ,因此拒絕原假設, 即認為這兩個地區的酒精人均年消費量分布有顯著差異。SPSS:操作: AnalyzeNonparametric Tests2-Independent SamplesFrequencies分組N消費量非洲地區歐洲地區Total131326Test Statistics a消費量Most Extreme Diff
14、erencesAbsolute.769Positive.769Negative.000Kolmogorov-Smirnov Z1.961Asymp. Sig. (2-tailed).001Exact Sig. (2-tailed).000Point Probability.000a. Grouping Variable: 分組即認為這兩個由輸出結果可知, 雙側精確顯著性概率 P口 u =0.05,因此拒絕原假設, 地區的酒精人均年消費量分布有顯著差異。與手算結果一致。四、 Cochran Q檢驗下面是某村村民對四個候選人( A, B, C, D)的贊同與否的調查(“1”代表同意,“0” 代表不
15、同意);最后一列為行總和,最后一行為列總和,全部“ 1”的總和為42。試分析4 位候選人在村民眼中有沒有區別(& =0.05)。20個村民對A、B、C、D四個候選人的評價NA0110011111111111011116B1100011111011011000011C011110000100011010109D000011001000010110006L1321232233122333212142數據來源:非參數統計(第二版)吳喜之手算:建立假設組:H 0 :4位候選人在村民眼中沒有差異H 1:4位候選人在村民眼中有差異精彩文檔k(k-1)"一 j=j=1ni=1kx2- (&
16、#163; x)Ij=1n 2 y- V i=121_22_2_2_2_(4 1)4(162 +112 +92 +62)4224(42) -(5 12 8 22 7 32)=9.3529df =4 -1 =3查表得0.05= 7.82<Q =9.3529,因此在5%的顯著性水平上拒絕原假設,即認為位候選人在村民眼中有顯著差異。SPSS:操作: AnalyzeNonparametric TestsK Related SamplesFrequenciesValue01ABCD491114161196Test StatisticsNCochran's QdfAsymp. Sig.Exa
17、ct Sig.Point Probability209.353 a3.025.025.006a. 0 is treated as a success.由輸出結果可知,Q=9.353,精確的顯著性概率P=0.025< a =0.05,因此拒絕原假設,即認為4位候選人在村民眼中有顯著差異。與手算結果一致。R語言:> x=read.table("f:/CochranQ.txt")> n=apply(x,2,sum)> N=sum(n)> L=apply(x,1,sum)> k=dim(x)2> Q=(k*(k-1)*sum(n-mean(
18、n)A2)/(k*N-sum(LA2)> Q1 9.352941> pvalue=pchisq(Q,k-1,low=F)> pvalue1 0.02494840由輸出結果可知,Q=9.352941 , P=0.02494840V a =0.05 ,因此拒絕原假設,即認為 4位候選人在村民眼中有顯著差異。與以上結果一致。五、 Friedman檢驗一項關于銷售茶葉的研究報告說明銷售方式可能和售出率有關。三種方式為:在商店內等待,在門口銷售和當面表演炒制茶葉。 對一組商店在一段時間的調查結果列再下表中(單位為購買者人數)。試問三種不同的銷售方式是否有顯著差異( a =0.05)。銷
19、售方式購買率(衿商店內等待2025291817221820門口銷售2623153026322827表演炒制5347484352574956數據來源:非參數統計(第二版)吳喜之手算:建立假設組:H。:三種銷售方式無差異Hi:三種銷售方式有差異三種方式購買率等級銷售方式購買率合計商店內等待1221111110門口銷售2112222214表演炒制33333333241212999、R:-3n(k 1) =(102 142 242)-3 8(3 1)=13 nk(k 1)j=1 j8 3(3 1)df =3 -1 =2查表得?0.05 =5.99丁2 =13,因此在5%的顯著性水平上拒絕原假設,即認為
20、三種銷售方式有顯著差異。SPSS:操作: AnalyzeNonparametric TestsK Related SamplesRanksMean Rank商店內等待門口銷售表演炒制1.251.753.00aTest StatisticsN8Chi-Square13.000df2Asymp. Sig.002Exact Sig.000Point Probability.000a. Friedman Test由輸出結果可知,2.05 =5.99,精確的顯著性概率P<0.001,因此在5%的顯著性水平上拒絕原假設,即認為三種銷售方式有顯著差異。與手算結果一致。R語言:> d=read.t
21、able("f:/Friedman.txt")> friedman.test(as.matrix(d)Friedman rank sum testdata: as.matrix(d)Friedman chi-squared = 13, df = 2, p-value = 0.001503由輸出結果可知,?2=13, P=0.001503<a =0.05,因此拒絕原假設,即認為三種銷售方式有顯著差異。與以上結果一致。六、K個樣本的卡方檢驗在一個有三個主要百貨商場的商貿中心,調查者問479個不同年齡段的人首先去三個商場中的哪個,結果如下表,檢驗人們去這三個商場的概率
22、是否一樣。年齡段商場1商場2商場3總和<3083704519830 50918615192>5041381089總和21519470479數據來源:非參數統計 王星手算:建立假設組:H0:人們去三個商場的概率相同H1:人們去三個商場的概率不同分組f1f2f3fie1e2e3zr、2,(3-3) 6zr、2,色。)向zr、2,(f3-q) /q<3083704519888.87380.19228.9350.3881.2958.919305091861519286.18077.76228.0580.2700.8736.077>5041381089P 39.94836.046
23、113.0060.028P 0.106P 0.695合計21519470479215.000194.00070.0000.6852.27415.6912r k fij-0jq=" j j =0.685+2.274+15.691=18.651i=i j=10df=(k-1)(r-1)=4查表得,0.05=9.49,因為Q=18.651> 70q5=9.49,因此拒絕原假設,即認為人們去三個商場的概率不同。SPSS:操作:DataWeight CasesAnalyzeDescriptive StatisticsCrosstabsChi-Square TestsValuedfAsym
24、p. Sig. (2-sided)Exact Sig. (2-sided)Exact Sig. (1-sided)Point ProbabilityPearson Chi-Squarea18.6514.001b.Likelihood Ratio18.6914.001.001Fisher's Exact Test18.314.001_inear-by-Linear Association5.110c1.024.026.013.003N of Valid Cases479a. 0 cells (.0%) have expected count less than 5. The minimu
25、m expected count is 13.01.b. Cannot be computed because there is insufficient memory.c. The standardized statistic is -2.260.由輸出結果可知,卡方統計量為18.651,精確雙尾檢驗概率P=0.01<a =0.05,因此拒絕原假設,即認為人們去三個商場的概率不同。與手算結果一致。七、 Kruskal-Wallis 檢驗某制造商雇用了來自三個本地大學的雇員作為管理人員。最近,公司的人事部門已經收集信息并考核了年度工作成績。從三個大學來的雇員中隨機地抽取了三個獨立樣本。制
26、造商想知道是否來自這三個不同的大學的雇員在管理崗位上的表現有所不同。雇員力A力B力C12560502702070360306048515805954090690357078075數據來源:百度文庫 SAS講義手算:建立假設組:H。:三個總體的考核成績分布相同H1:三個總體的考核成績分布不同各雇員的成績等級雇員力A力B力C13972122123949417115.5520618.5618.5512715.514秩和9527888.9163KW統計量 H =12£ R-3(N+1)=2 1(95)-+(27)-+(88)-3(20 + 1)N(N+1) j=i nj20(21)1 767
27、 _因為出現同分的情況,應對 H 進行校正,校正系“ u3 uC =1 一3=1-N(N2+1)(33 -3 33 -3 23 -2 23 -2)20(202+1)=0.9925校正后的統計量 H =8.9163/0.9925 = 8.9839df=k -1 =2查表得,在o =0.05的顯著性水平上,容05 =5.99,由于H=8.9839>405 =5.99,因此拒絕原假設,即三個總體的考核成績分布不同。SPSS:操作: AnalyzeNonparametric TestsK Independent SamplesRanks分組NMean Rank成績大學A大學B大學CTotal76
28、72013.574.5012.57Test Statistics a,b成績Chi-Squaredf8.984Asymp. Sig.011Exact Sig.006Point Probability.000a. Kruskal Wallis Testb. Grouping Variable: 分組由輸出結果可知,KW統計量為8.984,精確概率為0.006,遠遠小于顯著性水平0.05,因此拒絕原假設,即三個總體的考核成績分布不同。與手算結果一致。八、列聯表卡方檢驗一種原料來自三個不同的地區,原料質量被分成三個不同等級。從這批原料中隨機抽取500件進行檢驗,得樣本數據如下表所示,要求檢驗地區與原
29、料質量之間有無依賴關系。一級二級三級合計地區2605952171地區3506574189 1合計162188150500數據來源:百度文庫 統計學教程PPT手算:建立假設組:H。:地區與原料質量無關H1:地區與原料質量相關地區等級fjej(fj-ej )2/ej115245.360.97126452.642.451324427.71216055.40.38225964.30.44213P 5251.30.01315061.242.06326571.060.52337456.75.28合計19.82£ 工。fj-ej) _9 82Q= =19.82i=1 j=
30、1Sjdf=(r-1)(c-1)=4查表得,70.05=9.49,由于q=19.82> ?0.05=9.49,因此拒絕原假設,即認為地區與原 料質量相關。SPSS:操作:DataWeight CasesAnalyzeDescriptive StatisticsCrosstabs地區 * 等級 Crosstabulation等級Total一級二級三級地區地區1 Count526424140Expected Count45.452.642.0140.0地區2 Count605952171Expected Count55.464.351.3171.0地區3 Count506574189Expe
31、cted Count61.271.156.7189.0TotalCount162188150500Expected Count162.0188.0150.0500.0Chi-Square TestsValuedfAsymp. Sig.(2-sided)Exact Sig. (2-sided)Exact Sig. (1-sided)Point ProbabilityPearson Chi-Square19.822 a4.001b.Likelihood Ratio20.7324.000.000Fisher's Exact Test20.510.000_inear-by-Linear Ass
32、ociationc13.9631.000.000.000.000N of Valid Cases500a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 42.00.b. Cannot be computed because there is insufficient memory.c. The standardized statistic is 3.737.由輸出結果可知,檢驗統計量為19.822,精確雙尾顯著性概率 P遠遠小于顯著性水平0.05,因此拒絕原假設,即認為地區與原料質量相
33、關。與手算結果一致。九、 Kendall秩相關某研究所對10對雙胞胎兒童的智力進行調查,結果如下表:兒童智力測試得分雙胞胎編號先出生兒童(X)后出生兒童(Y)197.81216.619.3316.220.1411.37.1516.21367.14.877.88.9847.4911.2101101.31.5數據來源:非參數統計:方法與應用 易丹輝 董寒青 手算:兒童智力測試得分評秩XYX的秩Y的秩D1.31.5P 11010147.424-247.14.832117.88.956-1197.8550011.21067-1P 1:11.37.17341616.220.18.510-1.52.251
34、6.213r 8.580.5r 0.25 116.619.310911U =9 6 7 4 4 3 3 01 =37V =0 2 0 21 101 0 0=7Kendall秩相關系數 T=2) =-)=0.6667n(n-1)10(10-1)由于同分,所以T=(37-7)=0.6742.(1/2)10(10-1)-(1/2)2(2-1)、(1/2)10(10-1)對T的顯著性進行檢驗,建立假設組:H0:不相關H + :正相關查表得,n=10, T=0.6667或T=0.6742相應的概率在 0.0002至0.0005之間,遠遠小于顯著性水平0.05,因此拒絕原假設,即認為雙胞胎兒童的智力之間存
35、在著正相關。SPSS:操作: AnalyzeCorrelateBivariateCorrelations先出生兒童后出生兒童Kendall's tau_b先出生 J L 童Correlation Coefficient1.000*.674Sig. (2-tailed).007N1010后出生J L 童Correlation Coefficient*.6741.000Sig. (2-tailed).007N1010*. Correlation is significant at the 0.01 level (2-tailed).由輸出結果可知,T=0.674,雙側檢驗的顯著性概率為0.
36、007,則單側的顯著性概率為0.0035,遠遠小于顯著性水平 0.05,因此拒絕原假設,即認為雙胞胎兒童的智力之間存在著 正相關。與手算結果一致。R語言:> x=c(9.0,16.6,16.2,11.3,16.2,7.1,7.8,4.0,11.2,1.3)> y=c(7.8,19.3,20.1,7.1,13.0,4.8,8.9,7.4,10.0,1.5)> cor.test(x,y,method="kendall")Kendall's rank correlation taudata: x and yz = 2.6941, p-value = 0.007058alternative hypothesis: true tau is not equal to 0sample estimates:tau0.6741999警告信息:In cor.test.default(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《高血壓病發病機制與治療策略》課件
- 《服務器機箱設計》課件
- 鐵路市場營銷市場營銷的解讀課件
- 水泥混凝土路面常見病害的維修路基路面養護江西交通胡鳳輝
- 水平角測量方向法課件
- 中醫課件教學課件
- 中亞飲食文化課件
- 版個人反擔保保證函合同樣本
- 2025版二手設備銷售合同模板
- 南昌影視傳播職業學院《圖形創意A》2023-2024學年第二學期期末試卷
- TOEIC托業詞匯匯總(完整版)
- 美術寫生基地可行性方案
- 2021痛風和高尿酸血癥病證結合診療指南
- 屈光參差(anisometropia)課件
- 醫務科依法執業自查表
- 機器學習-聚類分析
- 書香家庭申報表參考模板
- 組織供應,運輸,售后服務方案
- 安全閥管理臺賬
- 中國胃腸間質瘤診斷治療共識(完整版)
- 員工手冊(國企通用版員工手冊)
評論
0/150
提交評論