




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、從2009國賽B題 眼科病床的合理安排說起。從從1500到到1931年的年的432年間,每年爆發(fā)戰(zhàn)爭的年間,每年爆發(fā)戰(zhàn)爭的次數(shù)可以看作一個隨機變量,椐統(tǒng)計,這次數(shù)可以看作一個隨機變量,椐統(tǒng)計,這432年間共爆發(fā)了年間共爆發(fā)了299次戰(zhàn)爭,具體數(shù)據(jù)如下次戰(zhàn)爭,具體數(shù)據(jù)如下:戰(zhàn)爭次數(shù)戰(zhàn)爭次數(shù)X01234 22314248154 發(fā)生發(fā)生 X次戰(zhàn)爭的年數(shù)次戰(zhàn)爭的年數(shù) 在概率論中,大家對泊松分布產(chǎn)生的一在概率論中,大家對泊松分布產(chǎn)生的一般條件已有所了解,容易想到,每年爆發(fā)戰(zhàn)般條件已有所了解,容易想到,每年爆發(fā)戰(zhàn)爭的次數(shù),可以用一個泊松隨機變量來近似爭的次數(shù),可以用一個泊松隨機變量來近似描述描述 . 也
2、就是說,我們可以假設每年爆發(fā)戰(zhàn)也就是說,我們可以假設每年爆發(fā)戰(zhàn)爭次數(shù)分布爭次數(shù)分布X近似泊松分布近似泊松分布.現(xiàn)在的問題是:現(xiàn)在的問題是:上面的數(shù)據(jù)能否證實上面的數(shù)據(jù)能否證實X 具有具有泊松分布的假設是正確的?泊松分布的假設是正確的?又如,某鐘表廠對生產(chǎn)的鐘進行精確性檢又如,某鐘表廠對生產(chǎn)的鐘進行精確性檢查,抽取查,抽取100個鐘作試驗,撥準后隔個鐘作試驗,撥準后隔24小時小時以后進行檢查,將每個鐘的誤差(快或慢)以后進行檢查,將每個鐘的誤差(快或慢)按秒記錄下來按秒記錄下來.問該廠生產(chǎn)的鐘的誤差是否服從正態(tài)問該廠生產(chǎn)的鐘的誤差是否服從正態(tài)分布?分布?再如,某工廠制造一批骰子,再如,某工廠制造
3、一批骰子,聲稱它是均勻的聲稱它是均勻的. 為檢驗骰子是否均勻為檢驗骰子是否均勻, 要把骰子實地投擲要把骰子實地投擲若干次,統(tǒng)計各點出現(xiàn)的頻率與若干次,統(tǒng)計各點出現(xiàn)的頻率與1/6的差距的差距.也就是說,在投擲中,出也就是說,在投擲中,出現(xiàn)現(xiàn)1點,點,2點,點,6點的概點的概率都應是率都應是1/6.得到的數(shù)據(jù)能否說明得到的數(shù)據(jù)能否說明“骰子均勻骰子均勻”的假設是可信的?的假設是可信的?問題是:問題是:q 現(xiàn)實生活中的許多數(shù)據(jù)都是隨機產(chǎn)生的,如考試分數(shù)、月降雨量、燈泡壽命等。從數(shù)理統(tǒng)計角度來看,這些數(shù)據(jù)其實都是符合某種分布的,這種規(guī)律就是統(tǒng)計規(guī)律。q 本專題的主要目的是:熟悉本專題的主要目的是:熟悉
4、Matlab相關命令;熟悉相關命令;熟悉各種常見分布的概率密度函數(shù)及其曲線,會利用數(shù)據(jù)各種常見分布的概率密度函數(shù)及其曲線,會利用數(shù)據(jù)分布的形態(tài)猜測其分布類型;能夠?qū)γ芏群瘮?shù)進行參分布的形態(tài)猜測其分布類型;能夠?qū)γ芏群瘮?shù)進行參數(shù)估計;進行簡單的假設檢驗(以正態(tài)檢驗為主)。數(shù)估計;進行簡單的假設檢驗(以正態(tài)檢驗為主)。內(nèi)容提綱1.Matlab相關命令介紹2.常見概率分布3.頻數(shù)直方圖與頻數(shù)表4.參數(shù)估計5.假設檢驗Matlab相關命令 最值:最值:max(x), min(x) (1) max(X):返回向量返回向量X的最大值,如果的最大值,如果X中包含復數(shù)元素,中包含復數(shù)元素,則按模取最大值。則按
5、模取最大值。 (2) max(A):返回一個行向量,向量的第返回一個行向量,向量的第i個元素是矩陣個元素是矩陣A的第的第i列上的最大值。列上的最大值。 (3) Y,U=max(A):返回行向量返回行向量Y和和U,Y向量記錄向量記錄A的每列的每列的最大值,的最大值,U向量記錄每列最大值的行號。向量記錄每列最大值的行號。 (4) max(A,dim):dim取取1或或2。dim取取1時,該函數(shù)和時,該函數(shù)和max(A)完全相同;完全相同;dim取取2時,該函數(shù)返回一個列向量,其時,該函數(shù)返回一個列向量,其第第i個元素是個元素是A矩陣的第矩陣的第i行上的最大值。行上的最大值。q 數(shù)據(jù)統(tǒng)計處理基本命令
6、數(shù)據(jù)統(tǒng)計處理基本命令Matlab相關命令 求和:求和: (1) sum(X),返回向量返回向量X各元素的和。各元素的和。 (2) sum(A) ,返回一個行向量,其第返回一個行向量,其第i個元素是個元素是 A的第的第i列的元素和。列的元素和。 (3)sum(A,dim) ,當當dim為為1時,該函數(shù)等同于時,該函數(shù)等同于sum(A);當;當dim為為2時,返回一個列向量,其第時,返回一個列向量,其第i個元素是個元素是A的第的第i行的各元素之和。行的各元素之和。 乘積乘積: (1) prod(X) ,返回向量返回向量X各元素的乘積。各元素的乘積。 (2) prod (A) , 返回一個行向量,其
7、第返回一個行向量,其第i個元素是個元素是A的第的第i列元素的乘列元素的乘積。積。 (3) prod(A,dim) ,當當dim為為1時,該函數(shù)等同于時,該函數(shù)等同于prod(A);當;當dim為為2時,返回一個列向量,其第時,返回一個列向量,其第i個元素是個元素是A的第的第i行的各元素之乘積。行的各元素之乘積。q數(shù)據(jù)統(tǒng)計處理基本命令數(shù)據(jù)統(tǒng)計處理基本命令Matlab相關命令 累加和與累乘積累加和與累乘積 在在MATLABMATLAB中,使用中,使用cumsumcumsum和和cumprodcumprod函數(shù)能方便地求得向量和矩函數(shù)能方便地求得向量和矩陣元素的累加和與累乘積向量,函數(shù)的調(diào)用格式為:
8、陣元素的累加和與累乘積向量,函數(shù)的調(diào)用格式為: cumsum(X):返回向量:返回向量X累加和向量。累加和向量。 cumprod(X):返回向量:返回向量X累乘積向量。累乘積向量。 cumsum(A):返回一個矩陣,其第:返回一個矩陣,其第i列是列是A的第的第i列的累加和向量。列的累加和向量。 cumprod(A):返回一個矩陣,其第:返回一個矩陣,其第i列是列是A的第的第i列的累乘積向量。列的累乘積向量。 cumsum(A,dim):當:當dim為為1時,該函數(shù)等同于時,該函數(shù)等同于cumsum(A);當;當dim為為2時,返回一個矩陣,其第時,返回一個矩陣,其第i行是行是A的第的第i行的累
9、加和向量。行的累加和向量。 cumprod(A,dim):當:當dim為為1時,該函數(shù)等同于時,該函數(shù)等同于cumprod(A);當;當dim為為2時,返回一個向量,其第時,返回一個向量,其第i行是行是A的第的第i行的累乘積向量。行的累乘積向量。q數(shù)據(jù)統(tǒng)計處理基本命令數(shù)據(jù)統(tǒng)計處理基本命令Matlab相關命令 相關系數(shù)相關系數(shù) MATLABMATLAB提供了提供了corrcoefcorrcoef函數(shù),可以求出數(shù)據(jù)的相關系數(shù)矩陣。函數(shù),可以求出數(shù)據(jù)的相關系數(shù)矩陣。corrcoefcorrcoef函數(shù)的調(diào)用格式為:函數(shù)的調(diào)用格式為: corrcoef(X):返回從矩陣:返回從矩陣X形成的一個相關系數(shù)
10、矩陣。此相關系數(shù)矩形成的一個相關系數(shù)矩陣。此相關系數(shù)矩陣的大小與矩陣陣的大小與矩陣X一樣。它把矩陣一樣。它把矩陣X的每列作為一個變量,然后求它的每列作為一個變量,然后求它們的相關系數(shù)。們的相關系數(shù)。 corrcoef(X,Y):在這里,:在這里,X,Y是向量,它們與是向量,它們與corrcoef(X,Y)的作用一的作用一樣。樣。q數(shù)據(jù)統(tǒng)計處理基本命令數(shù)據(jù)統(tǒng)計處理基本命令Matlab相關命令 排序排序 MATLABMATLAB中對向量中對向量X X是排序函數(shù)是是排序函數(shù)是sort(X)sort(X),函數(shù)返回一個對,函數(shù)返回一個對X X中的元素中的元素按升序排列的新向量。按升序排列的新向量。 s
11、ort函數(shù)也可以對矩陣函數(shù)也可以對矩陣A的各列或各行重新排序,其調(diào)用的各列或各行重新排序,其調(diào)用格式為:格式為: Y,I=sort(A,dim) 其中其中dim指明對指明對A的列還是行進行排序。若的列還是行進行排序。若dim=1,則按列排;若,則按列排;若dim=2,則按行排。則按行排。Y是排序后的矩陣,而是排序后的矩陣,而I記錄記錄Y中的元素在中的元素在A中位置。中位置。 q數(shù)據(jù)統(tǒng)計處理基本命令數(shù)據(jù)統(tǒng)計處理基本命令Matlab相關命令類似的用法,請自己借助類似的用法,請自己借助matlab在線幫在線幫助功能自己了解:助功能自己了解: 中位數(shù):中位數(shù):median(x) 標準差:標準差:std
12、(x) 方差:方差:var(x) 偏度:偏度:skewness(x) 峰度:峰度:kurtosis(x)q數(shù)據(jù)統(tǒng)計處理基本命令數(shù)據(jù)統(tǒng)計處理基本命令偏度和峰度的說明Matlab相關命令 例 生成滿足正態(tài)分布的生成滿足正態(tài)分布的10000100005 5隨機矩陣,然后求各列元隨機矩陣,然后求各列元素的均值和標準方差,再求這素的均值和標準方差,再求這5 5列隨機數(shù)據(jù)的相關系數(shù)矩陣。列隨機數(shù)據(jù)的相關系數(shù)矩陣。命令如下:命令如下:X=sqrt(3)*randn(10000,5)+4;M=mean(X)D=std(X)R=corrcoef(X)q數(shù)據(jù)統(tǒng)計處理基本命令數(shù)據(jù)統(tǒng)計處理基本命令Matlab相關命令
13、介紹q pdf 概率密度函數(shù)概率密度函數(shù)y=pdf(name,x,A)y=pdf(name,x,A,B) 或或 y=pdf(name,x,A,B,C)l 返回由返回由 name 指定的單參數(shù)分布的概率密度,指定的單參數(shù)分布的概率密度,x為樣本數(shù)據(jù)為樣本數(shù)據(jù)n name 用來指定分布類型,其取值可以是:用來指定分布類型,其取值可以是: beta、bino、chi2、exp、ev、f 、 gam、gev、gp、geo、hyge、logn、 nbin、ncf、nct、ncx2、norm、 poiss、rayl、t、unif、unid、wbl。l 返回由返回由 name 指定的雙參數(shù)或三參數(shù)分布的概率
14、密度指定的雙參數(shù)或三參數(shù)分布的概率密度常見的概率分布二項式分布二項式分布Binomialbino卡方分布卡方分布Chisquarechi2指數(shù)分布指數(shù)分布ExponentialexpF分布分布Ff幾何分布幾何分布Geometricgeo正態(tài)分布正態(tài)分布Normalnorm泊松分布泊松分布PoissonpoissT分布分布Tt均勻分布均勻分布Uniformunif離散均勻分布離散均勻分布Discrete UniformunidMatlab相關命令介紹例:例:x=-8:0.1:8;y=pdf(norm,x,0,1);y1=pdf(norm,x,1,2);plot(x,y,x,y1,:)n 注:注:
15、 y=pdf(norm,x,0,1) y=normpdf(x,0,1)相類似地,相類似地, y=pdf(beta,x,A,B) y=betapdf(x,A,B) y=pdf(bino,x,N,p) y=binopdf(x,N,p) 概率密度函數(shù)【例】繪制卡方分布密度函數(shù)在自【例】繪制卡方分布密度函數(shù)在自由度分別為由度分別為1 1、5 5、1515的圖形的圖形x=0:0.1:30;x=0:0.1:30;y1=chi2pdf(x,1); y1=chi2pdf(x,1); plot(x,y1,:)plot(x,y1,:)hold on hold on 【例】【例】 繪制標準正態(tài)分布的概率繪制標準正態(tài)
16、分布的概率密度圖密度圖. .x=-4:0.1:4;x=-4:0.1:4;y=normpdf(x,0,1);y=normpdf(x,0,1);plot(x,y)plot(x,y)title(N(0,1)title(N(0,1)的概率密度曲線圖的概率密度曲線圖)累積分布函數(shù)(cdf)【例】【例】 求服從標準正態(tài)分布的隨機變量落在區(qū)間求服從標準正態(tài)分布的隨機變量落在區(qū)間 2, 22, 2上的概率上的概率. . P=normcdf (-2, 2) P=normcdf (-2, 2)ans = 0.0228 0.9772ans = 0.0228 0.9772 P(2)-P(1) P(2)-P(1)ans
17、 = 0.9545 ans = 0.9545 累積分布函數(shù)(cdf) u_alpha=norminv(0.9,0,1) u_alpha=norminv(0.9,0,1) u_alpha = 1.2816u_alpha = 1.2816 t_alpha=tinv(0.25,4) t_alpha=tinv(0.25,4) t_alpha = -0.7407t_alpha = -0.7407 F_alpha=finv(0.1,14,10) F_alpha=finv(0.1,14,10) F_alpha = 0.4772F_alpha = 0.4772 X2_alpha=chi2inv(0.025,5
18、0) X2_alpha=chi2inv(0.025,50) X2_alpha = 32.3574X2_alpha = 32.3574累積分布函數(shù)(cdf)連續(xù)分布:正態(tài)分布q 正態(tài)分布正態(tài)分布(連續(xù)分布)(連續(xù)分布)l 如果隨機變量如果隨機變量 X 的密度函數(shù)為:的密度函數(shù)為:22X 2e()2(1)f x 0,x 則稱則稱 X 服從正態(tài)分布。記做:服從正態(tài)分布。記做:2( ,)XN l 標準正態(tài)分布:標準正態(tài)分布:N (0, 1)l 正態(tài)分布也稱高斯分布,是概率論中最重要的一個分布。正態(tài)分布也稱高斯分布,是概率論中最重要的一個分布。l 如果如果一個變量是大量微小、獨立的隨機因素的疊加,那么一
19、個變量是大量微小、獨立的隨機因素的疊加,那么它一定滿足正態(tài)分布。如測量誤差、產(chǎn)品質(zhì)量、月降雨量等它一定滿足正態(tài)分布。如測量誤差、產(chǎn)品質(zhì)量、月降雨量等正態(tài)分布舉例x=-8:0.1:8;y=normpdf(x,0,1);y1=normpdf(x,1,2);plot(x,y,x,y1,:)例:例:標準正態(tài)分布和非標準正態(tài)分布密度函數(shù)圖形標準正態(tài)分布和非標準正態(tài)分布密度函數(shù)圖形-8-6-4-20246800.050.10.150.20.250.30.350.4連續(xù)分布:均勻分布q 均勻分布均勻分布(連續(xù)分布)(連續(xù)分布)l 如果隨機變量如果隨機變量 X 的密度函數(shù)為:的密度函數(shù)為:則稱則稱 X 服從均
20、勻分布。記做:服從均勻分布。記做: , XU a bl 均勻分布在實際中經(jīng)常使用,譬如一個半徑為均勻分布在實際中經(jīng)常使用,譬如一個半徑為 r 的汽車輪的汽車輪胎,因為輪胎上的任一點接觸地面的可能性是相同的,所以胎,因為輪胎上的任一點接觸地面的可能性是相同的,所以輪胎圓周接觸地面的位置輪胎圓周接觸地面的位置 X 是服從是服從 0,2 r 上的均勻分布。上的均勻分布。 1)0,(, axbf xba 其其他他連續(xù)分布:指數(shù)分布q 指數(shù)分布指數(shù)分布(連續(xù)分布)(連續(xù)分布)l 如果隨機變量如果隨機變量 X 的密度函數(shù)為:的密度函數(shù)為:則稱則稱 X 服從參數(shù)為服從參數(shù)為 的指數(shù)分布。記做:的指數(shù)分布。記
21、做: Exp( )X l 在實際應用問題中,等待某特定事物發(fā)生所需要的時間往在實際應用問題中,等待某特定事物發(fā)生所需要的時間往往服從指數(shù)分布。如某些元件的壽命;隨機服務系統(tǒng)中的服往服從指數(shù)分布。如某些元件的壽命;隨機服務系統(tǒng)中的服務時間;動物的壽命等都常常假定服從指數(shù)分布。務時間;動物的壽命等都常常假定服從指數(shù)分布。 ,00,0( )xf xexx 0 l 指數(shù)分布具有無記憶性:指數(shù)分布具有無記憶性:|P Xst XsP Xt 指數(shù)分布舉例x=0:0.1:30;y=exppdf(x,4);plot(x,y)例:例: =4 時的指數(shù)分布密度函數(shù)圖時的指數(shù)分布密度函數(shù)圖離散分布:幾何分布q 幾何分
22、布幾何分布是一種常見的是一種常見的離散分布離散分布l 在貝努里實驗中,每次試驗成功的概率為在貝努里實驗中,每次試驗成功的概率為 p,設試驗進行,設試驗進行到第到第 次才出現(xiàn)成功,則次才出現(xiàn)成功,則 的分布滿足:的分布滿足:其右端項是幾何級數(shù)其右端項是幾何級數(shù) 的一般項,于是人們稱它為的一般項,于是人們稱它為幾何分布。幾何分布。11kkpq 1()1,2,kpqPkk x=0:30; y=geopdf(x,0.5); plot(x,y)例:例: p=0.5 時的幾何分布密度函數(shù)圖時的幾何分布密度函數(shù)圖離散分布:二項式分布q 二項式分布二項式分布屬于離散分布屬于離散分布l 如果隨機變量如果隨機變量
23、 X 的分布列為:的分布列為:則稱這種分布為二項式分布。記做:則稱這種分布為二項式分布。記做: ( ,)Xb n p (1()0,1,)kn knppP Xkkkn x=0:50;y=binopdf(x,500,0.05);plot(x,y)例:例: n=500,p=0.05 時的二項式分布密度函數(shù)圖時的二項式分布密度函數(shù)圖離散分布: Poisson 分布q 泊松分布泊松分布也屬于離散分布,是也屬于離散分布,是1837年由發(fā)個數(shù)年由發(fā)個數(shù)學家學家 Poisson 首次提出,其概率分布列為:首次提出,其概率分布列為:記做:記做:( )XP !()0, 1, 2,0kPekkXk l 泊松分布是一
24、種常用的離散分布,它與單位時間(或單泊松分布是一種常用的離散分布,它與單位時間(或單位面積、單位產(chǎn)品等)上的計數(shù)過程相聯(lián)系。如:單位時位面積、單位產(chǎn)品等)上的計數(shù)過程相聯(lián)系。如:單位時間內(nèi),電話總機接到用戶呼喚次數(shù);間內(nèi),電話總機接到用戶呼喚次數(shù);1 平方米內(nèi),玻璃上的平方米內(nèi),玻璃上的氣泡數(shù)等。氣泡數(shù)等。Poisson 分布舉例x=0:50;y=poisspdf(x,25);plot(x,y)例:例: =25 時的泊松分布密度函數(shù)圖時的泊松分布密度函數(shù)圖離散分布:均勻分布q 如果隨機變量如果隨機變量 X 的分布列為:的分布列為: 2 1()1,P Xkknn則稱這種分布為則稱這種分布為離散均
25、勻分布離散均勻分布。記做:。記做: 1,2, XUnn=20;x=1:n;y=unidpdf(x,n);plot(x,y,o-)例:例: n=20 時的離散均勻分布密度函數(shù)圖時的離散均勻分布密度函數(shù)圖抽樣分布: 2分布q 設隨機變量設隨機變量 X1, X2, , Xn 相互獨立,且同服從正態(tài)相互獨立,且同服從正態(tài)分布分布 N(0,1),則稱隨機變量,則稱隨機變量 n2= X12+X22+ +Xn2服從服從自由度為自由度為 n 的的 2 分布,記作分布,記作 ,亦稱隨,亦稱隨機變量機變量 n2 為為 2 變量。變量。22( )nn x=0:0.1:20; y=chi2pdf(x,4); plot
26、(x,y)例:例: n=4 和和 n=10 時的時的 2 分布密度函數(shù)圖分布密度函數(shù)圖x=0:0.1:20; y=chi2pdf(x,10); plot(x,y)抽樣分布: F 分布q 設隨機變量設隨機變量 ,且,且 X 與與 Y 相相互獨立,則稱隨機變量互獨立,則稱隨機變量 22(),( )XmYnx=0.01:0.1:8.01;y=fpdf(x,4,10);plot(x,y)例:例: F(4,10) 的分布密度函數(shù)圖的分布密度函數(shù)圖/FX mY n 為服從自由度為服從自由度 (m, n) 的的 F 分布。記做:分布。記做:(, )FF m n抽樣分布: t 分布q 設隨機變量設隨機變量 ,
27、且,且 X 與與 Y 相相互獨立,則稱隨機變量互獨立,則稱隨機變量 2(0,1),( )XNYn x=-6:0.01:6;y=tpdf(x,4);plot(x,y)例:例: t (4) 的分布密度函數(shù)圖的分布密度函數(shù)圖/TXY n 為服從自由度為服從自由度 n 的的 t 分布。記做:分布。記做: ( )Tt n頻數(shù)直方圖或頻數(shù)表q 對于給定的數(shù)據(jù)集,假設它們滿足以上十種分布之對于給定的數(shù)據(jù)集,假設它們滿足以上十種分布之一,如何確定屬于哪種分布?一,如何確定屬于哪種分布?x=load(data1.txt); x=x(:);hist(x)例例 1:某次筆試的分數(shù)見某次筆試的分數(shù)見 data1.tx
28、t,試畫出頻數(shù)直方圖,試畫出頻數(shù)直方圖繪制頻數(shù)直方圖,或列出頻數(shù)表繪制頻數(shù)直方圖,或列出頻數(shù)表n 從圖形上看,筆試成績較為接近正態(tài)分布從圖形上看,筆試成績較為接近正態(tài)分布q hist 繪制給定數(shù)據(jù)的直方圖繪制給定數(shù)據(jù)的直方圖hist(x,m)xlsread(e:book1,sheet1)Textread(頻數(shù)直方圖或頻數(shù)表x=load(data2.txt); x=x(:);hist(x)例例 2:某次上機考試的分數(shù)見某次上機考試的分數(shù)見 data2.txt,試畫出頻數(shù)直方圖,試畫出頻數(shù)直方圖n 從圖形上看,上機考試成績較為接近離散均勻分布從圖形上看,上機考試成績較為接近離散均勻分布x=load
29、(data3.txt); x=x(:);hist(x)例例 3:上海上海1998年來的月降雨量的數(shù)據(jù)見年來的月降雨量的數(shù)據(jù)見 data3.txt , 試畫出頻數(shù)直方圖試畫出頻數(shù)直方圖n 從圖形上看,月降雨量較為接近從圖形上看,月降雨量較為接近 2 分布分布頻數(shù)直方圖或頻數(shù)表q 在重復數(shù)據(jù)較多的情況下,我們也可以利用在重復數(shù)據(jù)較多的情況下,我們也可以利用Matlab自帶的自帶的 tabulate 函數(shù)生成頻數(shù)表,并以頻數(shù)表的形函數(shù)生成頻數(shù)表,并以頻數(shù)表的形式來發(fā)掘數(shù)據(jù)分布的規(guī)律。式來發(fā)掘數(shù)據(jù)分布的規(guī)律。x=load(data4.txt); x=x(:);tabulate(x)hist(x)頻數(shù)直
30、方圖或頻數(shù)表面列出了面列出了84個伊特拉斯坎(個伊特拉斯坎(Etruscan)人男子的頭顱的最大寬度)人男子的頭顱的最大寬度(mm),試檢驗這些數(shù)據(jù)是否來自正態(tài)總體),試檢驗這些數(shù)據(jù)是否來自正態(tài)總體(取取=0.1). 141 148 132 138 154 142 150 146 155 158 150 140 147 148 144 150 149 145 149 158 143 141 144 144 126 140 144 142 141 140 145 135 147 146 141 136 140 146 142 137 148 154 137 139 143 140 131 143
31、 141 149 148 135 148 152 143 144 141 143 147 146 150 132 142 142 143 153 149 146 149 138 142 149 142 137 134 144 146 147 140 142140 137 152 145 x=load(data4.txt); x=x(:); tabulate(x) hist(x)頻數(shù)直方圖或頻數(shù)表學生的身高和體重:學校隨機抽取100名學生, 測量他們的身高和體重,所得數(shù)據(jù)如表身高體重 身高 體重 身高 體重 身高 體重 身高 體重172 75 169 55 169 64 171 65 167 4
32、7171 62 168 67 165 52 169 62 168 65166 62 168 65 164 59 170 58 165 64160 55 175 67 173 74 172 64 168 57155 57 176 64 172 69 169 58 176 57173 58 168 50 169 52 167 72 170 57166 55 161 49 173 57 175 76 158 51170 63 169 63 173 61 164 59 165 62167 53 171 61 166 70 166 63 172 53173 60 178 64 163 57 169 54
33、 169 66178 60 177 66 170 56 167 54 169 58173 73 170 58 160 65 179 62 172 50163 47 173 67 165 58 176 63 162 52165 66 172 59 177 66 182 69 175 75170 60 170 62 169 63 186 77 174 66163 50 172 59 176 60 166 76 167 63172 57 177 58 177 67 169 72 166 50182 63 176 68 172 56 173 59 174 64171 59 175 68 165 56
34、169 65 168 62177 64 184 70 166 49 171 71 170 59頻數(shù)直方圖或頻數(shù)表 一道工序用自動化車床連續(xù)加工某種零件,由于刀具損壞等會出現(xiàn)故障.故障是完全隨機的,并假定生產(chǎn)任一零件時出現(xiàn)故障機會均相同.工作人員是通過檢查零件來確定工序是否出現(xiàn)故障的.現(xiàn)積累有100次故障紀錄,故障出現(xiàn)時該刀具完成的零件數(shù)如下,試觀察該刀具出現(xiàn)故障時完成的零件數(shù)屬于哪種分布?459 362 624 542 509 584 433 748 815 505612 452 434 982 640 742 565 706 593 680926 653 164 487 734 608 42
35、8 1153 593 844527 552 513 781 474 388 824 538 862 659775 859 755 49 697 515 628 954 771 609402 960 885 610 292 837 473 677 358 638699 634 555 570 84 416 606 1062 484 120447 654 564 339 280 246 687 539 790 581621 724 531 512 577 496 468 499 544 645764 558 378 765 666 763 217 715 310 851頻數(shù)直方圖或頻數(shù)表x=loa
36、d(data5.txt); x=x(:);hist(x)fiugrehistfit(x) % 加入較接近的正態(tài)分布密度曲線加入較接近的正態(tài)分布密度曲線試畫出其直方圖。試畫出其直方圖。 n 從圖形上看,較為接近正態(tài)分布從圖形上看,較為接近正態(tài)分布頻數(shù)直方圖或頻數(shù)表q 也可以用也可以用 bar 函數(shù)。函數(shù)。qbar(x,y)繪制分別以繪制分別以x和和y為橫縱坐標的二維條形圖為橫縱坐標的二維條形圖qcdfplot(x) 繪制樣本繪制樣本x的經(jīng)驗分布函數(shù)圖的經(jīng)驗分布函數(shù)圖qFn,x0=ecdf(x) 得到樣本得到樣本x的經(jīng)驗分布函數(shù)值的經(jīng)驗分布函數(shù)值Fn, 當當x中有中有m個不個不同的數(shù)同的數(shù) (記為
37、向量記為向量x0) 時時, 則則Fn的個數(shù)為的個數(shù)為m+1個個 x = 6 4 5 3 6 8 6 7 3 4; Fn,x0=ecdf(x)Fn = 0 0.2000 0.4000 0.5000 0.8000 0.9000 1.0000 x0 = 3 3 4 5 6 7 8 cdfplot(x)例例 累積分布函數(shù)(cdf)參數(shù)估計q 當我們可以基本確定數(shù)據(jù)集當我們可以基本確定數(shù)據(jù)集 X 符合某種分布后,我符合某種分布后,我們還需要確定這個分布的參數(shù)。們還需要確定這個分布的參數(shù)。q 由于正態(tài)分布情況發(fā)生的比較多,故我們主要考由于正態(tài)分布情況發(fā)生的比較多,故我們主要考慮正態(tài)分布的情形。慮正態(tài)分布的
38、情形。q 對于未知參數(shù)的估計,可分兩種情況:對于未知參數(shù)的估計,可分兩種情況:l 點估計點估計l 區(qū)間估計區(qū)間估計參數(shù)估計:點估計q 構(gòu)造樣本構(gòu)造樣本 X 與某個統(tǒng)計量有關的一個函數(shù),作為與某個統(tǒng)計量有關的一個函數(shù),作為該統(tǒng)計量的一個估計,稱為該統(tǒng)計量的一個估計,稱為點估計點估計。q Matlab 統(tǒng)計工具箱中,一般采用最大似然估計法統(tǒng)計工具箱中,一般采用最大似然估計法給出參數(shù)的點估計。給出參數(shù)的點估計。n 泊松分布泊松分布 P ( ) 的的 最大似然估計是最大似然估計是X n 指數(shù)分布指數(shù)分布 Exp ( ) 的的 最大似然估計是最大似然估計是1X 點估計舉例n 正態(tài)分布正態(tài)分布 N ( ,
39、 2) 中,中, 最大似然估計是最大似然估計是 , 2 的最大似然估計是的最大似然估計是X 2211niiXXn x=load(data1.txt);x=x(:);mu,sigma=normfit(x)例例 6:已知例已知例 1 中的數(shù)據(jù)服從正態(tài)分布中的數(shù)據(jù)服從正態(tài)分布 N ( , 2) ,試求其參,試求其參數(shù)數(shù) 和和 的值。的值。使用使用 normfit 函數(shù)函數(shù)參數(shù)估計:區(qū)間估計q 構(gòu)造樣本構(gòu)造樣本 X 與某個統(tǒng)計量有關的兩個函數(shù),作為與某個統(tǒng)計量有關的兩個函數(shù),作為該統(tǒng)計量的下限估計與上限估計,下限與上限構(gòu)成該統(tǒng)計量的下限估計與上限估計,下限與上限構(gòu)成一個區(qū)間,這個區(qū)間作為該統(tǒng)計量的估計
40、,稱為一個區(qū)間,這個區(qū)間作為該統(tǒng)計量的估計,稱為區(qū)區(qū)間估計間估計。區(qū)間估計舉例x=load(data6.txt); x=x(:);mu,sigma,muci,sigmaci=normfit(x,0.01)例例 8:從自動機床加工的同類零件中抽取從自動機床加工的同類零件中抽取16件,測得長度值件,測得長度值見見 data6.txt,已知零件長度服從正態(tài)分布,已知零件長度服從正態(tài)分布 N ( , 2) ,試求零,試求零件長度均值件長度均值 和標準差和標準差 的置信度為的置信度為 99% 的置信區(qū)間。的置信區(qū)間。Matlab相關命令介紹q normfit 正態(tài)分布中的參數(shù)估計正態(tài)分布中的參數(shù)估計mu
41、hat,sigmahat,muci,sigmaci=normfit(x,alpha)l 對樣本數(shù)據(jù)對樣本數(shù)據(jù) x 進行參數(shù)估計,并計算置信度為進行參數(shù)估計,并計算置信度為 1-alpha 的置信區(qū)間的置信區(qū)間l alpha 可以省略,缺省值為可以省略,缺省值為 0.05,即置信度為,即置信度為 95%Matlab相關命令介紹q 其它其它分布中的參數(shù)估計分布中的參數(shù)估計Matlab相關命令介紹l說明說明: l(1) unifit和normfit的格式與其它函數(shù)均不同, 此二者要求左邊的輸出變量必須將參數(shù)或分別列出.l(2) binofit (x,n,alpha)根據(jù)試驗成功的次數(shù)x和總的試驗次數(shù)
42、n, 對中的p進行最大似然估計, 同時返回置信度為100(1-alpha)%的置信區(qū)間pci. phat,pci=binofit(4,100,0.05)phat = 0.0400pci = 0.0110 0.0993由于置信區(qū)間的上限超出了規(guī)定指標由于置信區(qū)間的上限超出了規(guī)定指標(不合格率在不合格率在5%以下以下), 因此不因此不能出廠能出廠 例例 對一批產(chǎn)品, 欲通過抽樣檢查其合格率. 若產(chǎn)品不合格率在5%以下, 則該批產(chǎn)品可出廠. 檢驗時要求結(jié)果具有0.95的置信水平. 今抽取產(chǎn)品100件, 發(fā)現(xiàn)不合格品有4件, 問這批產(chǎn)品能否出廠? 假設檢驗q 對總體的分布律或分布參數(shù)作某種假設,根據(jù)抽
43、取對總體的分布律或分布參數(shù)作某種假設,根據(jù)抽取的樣本觀察值,運用數(shù)理統(tǒng)計的分析方法,檢驗這種的樣本觀察值,運用數(shù)理統(tǒng)計的分析方法,檢驗這種假設是否正確,從而決定接受假設或拒絕假設,這就假設是否正確,從而決定接受假設或拒絕假設,這就是是假設檢驗假設檢驗問題。問題。q 以正態(tài)假設檢驗為例,來說明假設檢驗的基本過程。以正態(tài)假設檢驗為例,來說明假設檢驗的基本過程。正態(tài)假設檢驗q 正態(tài)假設檢驗的一般過程:正態(tài)假設檢驗的一般過程:l 假設檢驗:利用假設檢驗:利用 Matlab 統(tǒng)計工具箱給出的常用的假設檢驗統(tǒng)計工具箱給出的常用的假設檢驗方法的函數(shù)方法的函數(shù) ttest,進行顯著性水平為,進行顯著性水平為
44、alpha 的的 t 假設檢驗,假設檢驗,以檢驗正態(tài)分布樣本以檢驗正態(tài)分布樣本 x(標準差未知)的均值是否為(標準差未知)的均值是否為 m。運行。運行結(jié)果中,當結(jié)果中,當 h=1 時,表示拒絕零假設;當時,表示拒絕零假設;當 h=0 時,表示不能時,表示不能拒絕零假設。拒絕零假設。l 對比正態(tài)分布的概率密度函數(shù)分布圖,判斷某統(tǒng)計量的對比正態(tài)分布的概率密度函數(shù)分布圖,判斷某統(tǒng)計量的分布可能服從正態(tài)分布分布可能服從正態(tài)分布l 利用統(tǒng)計繪圖函數(shù)利用統(tǒng)計繪圖函數(shù) normplot 進行正態(tài)分布檢驗進行正態(tài)分布檢驗Matlab相關命令介紹normplot(x)l 統(tǒng)計繪圖函數(shù),進行正態(tài)分布檢驗。研究表明
45、:統(tǒng)計繪圖函數(shù),進行正態(tài)分布檢驗。研究表明:如果數(shù)據(jù)如果數(shù)據(jù)是來自一個正態(tài)分布,則該線為一直線形態(tài);如果它是來自是來自一個正態(tài)分布,則該線為一直線形態(tài);如果它是來自其他分布,則為曲線形態(tài)。其他分布,則為曲線形態(tài)。wblplot(x)l 統(tǒng)計繪圖函數(shù),進行統(tǒng)計繪圖函數(shù),進行 Weibull 分布檢驗。分布檢驗。正態(tài)假設檢驗舉例x=load(data5.txt); x=x(:);normplot(x)例例 9:試說明例試說明例 5 中的刀具使用壽命服從正態(tài)分布,并且說中的刀具使用壽命服從正態(tài)分布,并且說明在方差未知的情況下其均值明在方差未知的情況下其均值 m 取為取為 597 是否合理。是否合理。
46、 (1) 對比刀具使用壽命分布圖與正態(tài)分布的概率密度分對比刀具使用壽命分布圖與正態(tài)分布的概率密度分布函數(shù)圖,得初步結(jié)論:該批刀具的使用壽命可能服從正態(tài)布函數(shù)圖,得初步結(jié)論:該批刀具的使用壽命可能服從正態(tài)分布。分布。解:解:(2) 利用統(tǒng)計繪圖函數(shù)利用統(tǒng)計繪圖函數(shù) normplot 進行分布的正態(tài)性檢驗進行分布的正態(tài)性檢驗結(jié)果顯示:這結(jié)果顯示:這 100 個離散點非常靠近傾斜直線段,即圖形為線個離散點非??拷鼉A斜直線段,即圖形為線性的,因此可得結(jié)論:該批刀具的使用壽命近似服從正態(tài)分布。性的,因此可得結(jié)論:該批刀具的使用壽命近似服從正態(tài)分布??傮w方差總體方差sigma2未知時,總體均值的檢驗使用未
47、知時,總體均值的檢驗使用t-檢驗檢驗 h,sig,ci = ttest(x,m,alpha,tail)檢驗數(shù)據(jù) x 的關于均值的某一假設是否成立,其中alpha 為顯著性水平,究竟檢驗什么假設取決于 tail 的取值:tail = 0,檢驗假設“x 的均值等于 m ”tail = 1,檢驗假設“x 的均值大于 m ”tail =-1,檢驗假設“x 的均值小于 m ”tail的缺省值為 0, alpha的缺省值為 0.05. 返回值 h 為一個布爾值,h=1 表示可以拒絕假設,h=0 表示不可以拒絕假設,sig 為假設成立的概率,ci 為均值的 1-alpha 置信區(qū)間.ttest說明正態(tài)假設檢
48、驗舉例x=load(data5.txt); x=x(:);h=ttest(x,597,0.05)(3) 利用函數(shù)利用函數(shù) ttest 進行顯著性水平為進行顯著性水平為 alpha 的的 t 假設檢驗假設檢驗檢驗結(jié)果:檢驗結(jié)果:h=0。表示不拒絕零假設,說明所提出的假設。表示不拒絕零假設,說明所提出的假設 “壽命均值為壽命均值為 597” 是合理的是合理的 例例 Matlab統(tǒng)計工具箱中的數(shù)據(jù)文件gas.mat.中提供了美國1993年一月份和二月份的汽油平均價格(price1,price2分別是一,二月份的油價,單位為美分),它是容量為20的雙樣本.假設一月份油價的標準偏差未知,試檢驗一月份油價
49、的均值是否等于115.解解 作假設:m = 115.首先取出數(shù)據(jù),用以下命令: load gas然后用以下命令檢驗 h,sig,ci = ttest( price2 ,115)返回:h = 1,sig = 4.9517e-004,ci =116.8 120.2.檢驗結(jié)果: 1. 布爾變量h=1, 表示拒絕零假設. 說明提出的假設油價均值115是不合理的. 2. 95%的置信區(qū)間為116.8 120.2, 它不包括115, 故不能接受假設. 3. sig-值為4.9517e-004, 遠小于0.5, 不能接受零假設. ttest舉例Matlab中假設檢驗相關命令例例 由十臺電機組成的機組進行工作由十臺電機組成的機組進行工作, 在在2000小時中有五臺發(fā)生故障小時中有五臺發(fā)生故障, 其故障發(fā)生的時間其故障發(fā)生的時間為為1350, 965, 427, 1753, 665試問這些電機在試問
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025汽車特許經(jīng)營合同書模板
- 2025監(jiān)理工程師《合同管理》知識點合同法律效力
- 玩具廠上班合同協(xié)議
- 電子產(chǎn)品軟件合同協(xié)議
- 男女朋友買房協(xié)議合同協(xié)議
- 田間技術服務合同協(xié)議
- 電梯裝潢商務合同協(xié)議
- 電廠清洗服務合同協(xié)議
- 瑜伽館應聘老師合同協(xié)議
- 環(huán)境衛(wèi)生治理合同協(xié)議
- 沿街商鋪、合用場所消防安全培訓課件
- 靜脈炎的預防及處理-李媛
- 頸椎病針灸穴位治療
- 2025年中國汽車車燈行業(yè)市場現(xiàn)狀、前景分析研究報告(智研咨詢發(fā)布)
- 湯臣倍健營養(yǎng)品市場推廣方案
- 2024年湖北省中考語文真題(學生版+解析版)
- 告訴我地址 -從IPv4到IPv6的傳奇 課件 2024-2025學年清華大學版(2024)B版初中信息技術七年級上冊
- 2024旋翼無人機巡檢作業(yè)規(guī)范
- 醫(yī)學教程 《急性闌尾炎幻燈》
- 重型貨車整車運輸協(xié)議樣本
- 讀后續(xù)寫-期中真題匯編(原卷版)
評論
0/150
提交評論