




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、從2009國賽B題 眼科病床的合理安排說起。從從1500到到1931年的年的432年間,每年爆發(fā)戰(zhàn)爭的年間,每年爆發(fā)戰(zhàn)爭的次數(shù)可以看作一個隨機(jī)變量,椐統(tǒng)計,這次數(shù)可以看作一個隨機(jī)變量,椐統(tǒng)計,這432年間共爆發(fā)了年間共爆發(fā)了299次戰(zhàn)爭,具體數(shù)據(jù)如下次戰(zhàn)爭,具體數(shù)據(jù)如下:戰(zhàn)爭次數(shù)戰(zhàn)爭次數(shù)X01234 22314248154 發(fā)生發(fā)生 X次戰(zhàn)爭的年數(shù)次戰(zhàn)爭的年數(shù) 在概率論中,大家對泊松分布產(chǎn)生的一在概率論中,大家對泊松分布產(chǎn)生的一般條件已有所了解,容易想到,每年爆發(fā)戰(zhàn)般條件已有所了解,容易想到,每年爆發(fā)戰(zhàn)爭的次數(shù),可以用一個泊松隨機(jī)變量來近似爭的次數(shù),可以用一個泊松隨機(jī)變量來近似描述描述 . 也
2、就是說,我們可以假設(shè)每年爆發(fā)戰(zhàn)也就是說,我們可以假設(shè)每年爆發(fā)戰(zhàn)爭次數(shù)分布爭次數(shù)分布X近似泊松分布近似泊松分布.現(xiàn)在的問題是:上面的數(shù)據(jù)能否證實現(xiàn)在的問題是:上面的數(shù)據(jù)能否證實X 具有具有泊松分布的假設(shè)是正確的?泊松分布的假設(shè)是正確的?又如,某鐘表廠對生產(chǎn)的鐘進(jìn)行精確性檢又如,某鐘表廠對生產(chǎn)的鐘進(jìn)行精確性檢查,抽取查,抽取100個鐘作試驗,撥準(zhǔn)后隔個鐘作試驗,撥準(zhǔn)后隔24小時小時以后進(jìn)行檢查,將每個鐘的誤差快或慢以后進(jìn)行檢查,將每個鐘的誤差快或慢按秒記錄下來按秒記錄下來.問該廠生產(chǎn)的鐘的誤差是否服從正態(tài)問該廠生產(chǎn)的鐘的誤差是否服從正態(tài)分布?分布?再如,某工廠制造一批骰子,再如,某工廠制造一批骰子
3、,聲稱它是均勻的聲稱它是均勻的. 為檢驗骰子是否均勻為檢驗骰子是否均勻, 要把骰子實地投擲要把骰子實地投擲若干次,統(tǒng)計各點(diǎn)出現(xiàn)的頻率與若干次,統(tǒng)計各點(diǎn)出現(xiàn)的頻率與1/6的差距的差距.也就是說,在投擲中,出也就是說,在投擲中,出現(xiàn)現(xiàn)1點(diǎn),點(diǎn),2點(diǎn),點(diǎn),6點(diǎn)的概點(diǎn)的概率都應(yīng)是率都應(yīng)是1/6.得到的數(shù)據(jù)能否說明得到的數(shù)據(jù)能否說明“骰子均勻骰子均勻的假設(shè)是可信的?的假設(shè)是可信的?問題是:問題是:q 現(xiàn)實生活中的許多數(shù)據(jù)都是隨機(jī)產(chǎn)生的,如考試分?jǐn)?shù)、月降雨量、燈泡壽命等。從數(shù)理統(tǒng)計角度來看,這些數(shù)據(jù)其實都是符合某種分布的,這種規(guī)律就是統(tǒng)計規(guī)律。q 本專題的主要目的是:熟悉本專題的主要目的是:熟悉Matla
4、b相關(guān)命令;熟悉相關(guān)命令;熟悉各種常見分布的概率密度函數(shù)及其曲線,會利用數(shù)據(jù)各種常見分布的概率密度函數(shù)及其曲線,會利用數(shù)據(jù)分布的形態(tài)猜測其分布類型;能夠?qū)γ芏群瘮?shù)進(jìn)行參分布的形態(tài)猜測其分布類型;能夠?qū)γ芏群瘮?shù)進(jìn)行參數(shù)估計;進(jìn)行簡單的假設(shè)檢驗以正態(tài)檢驗為主)。數(shù)估計;進(jìn)行簡單的假設(shè)檢驗以正態(tài)檢驗為主)。內(nèi)容提綱1.Matlab相關(guān)命令介紹2.常見概率分布3.頻數(shù)直方圖與頻數(shù)表4.參數(shù)估計5.假設(shè)檢驗Matlab相關(guān)命令 最值:最值:max(x), min(x) (1) max(X):返回向量:返回向量X的最大值,如果的最大值,如果X中包含復(fù)中包含復(fù)數(shù)元素,則按模取最大值。數(shù)元素,則按模取最大值。
5、 (2) max(A):返回一個行向量,向量的第:返回一個行向量,向量的第i個元素是個元素是矩陣矩陣A的第的第i列上的最大值。列上的最大值。 (3) Y,U=max(A):返回行向量:返回行向量Y和和U,Y向量記錄向量記錄A的每列的最大值,的每列的最大值,U向量記錄每列最大值的行號。向量記錄每列最大值的行號。 (4) max(A,dim):dim取取1或或2。dim取取1時,該函時,該函數(shù)和數(shù)和max(A)完全相同;完全相同;dim取取2時,該函數(shù)返回一時,該函數(shù)返回一個列向量,其第個列向量,其第i個元素是個元素是A矩陣的第矩陣的第i行上的最大值。行上的最大值。q 數(shù)據(jù)統(tǒng)計處理基本命令數(shù)據(jù)統(tǒng)計
6、處理基本命令Matlab相關(guān)命令 求和:求和: (1) sum(X),返回向量,返回向量X各元素的和。各元素的和。 (2) sum(A) ,返回一個行向量,其第,返回一個行向量,其第i個元素是個元素是 A的第的第i列的元素和。列的元素和。 (3)sum(A,dim) ,當(dāng),當(dāng)dim為為1時,該函數(shù)等同于時,該函數(shù)等同于sum(A);當(dāng);當(dāng)dim為為2時,時,返回一個列向量,其第返回一個列向量,其第i個元素是個元素是A的第的第i行的各元素之和。行的各元素之和。 乘積:乘積: (1) prod(X) ,返回向量,返回向量X各元素的乘積。各元素的乘積。 (2) prod (A) , 返回一個行向量,
7、其第返回一個行向量,其第i個元素是個元素是A的第的第i列元素的乘積。列元素的乘積。 (3) prod(A,dim) ,當(dāng),當(dāng)dim為為1時,該函數(shù)等同于時,該函數(shù)等同于prod(A);當(dāng);當(dāng)dim為為2時,返回一個列向量,其第時,返回一個列向量,其第i個元素是個元素是A的第的第i行的各元素之乘積。行的各元素之乘積。q數(shù)據(jù)統(tǒng)計處理基本命令數(shù)據(jù)統(tǒng)計處理基本命令Matlab相關(guān)命令 累加和與累乘積累加和與累乘積 在在MATLAB中,使用中,使用cumsum和和cumprod函數(shù)能方便地求得向函數(shù)能方便地求得向量和矩陣元素的累加和與累乘積向量,函數(shù)的調(diào)用格式為:量和矩陣元素的累加和與累乘積向量,函數(shù)的
8、調(diào)用格式為: cumsum(X):返回向量:返回向量X累加和向量。累加和向量。 cumprod(X):返回向量:返回向量X累乘積向量。累乘積向量。 cumsum(A):返回一個矩陣,其第:返回一個矩陣,其第i列是列是A的第的第i列的累加和向量。列的累加和向量。 cumprod(A):返回一個矩陣,其第:返回一個矩陣,其第i列是列是A的第的第i列的累乘積向量。列的累乘積向量。 cumsum(A,dim):當(dāng):當(dāng)dim為為1時,該函數(shù)等同于時,該函數(shù)等同于cumsum(A);當(dāng);當(dāng)dim為為2時,返回一個矩陣,其第時,返回一個矩陣,其第i行是行是A的第的第i行的累加和向量。行的累加和向量。 cum
9、prod(A,dim):當(dāng):當(dāng)dim為為1時,該函數(shù)等同于時,該函數(shù)等同于cumprod(A);當(dāng);當(dāng)dim為為2時,返回一個向量,其第時,返回一個向量,其第i行是行是A的第的第i行的累乘積向量。行的累乘積向量。q數(shù)據(jù)統(tǒng)計處理基本命令數(shù)據(jù)統(tǒng)計處理基本命令Matlab相關(guān)命令 相關(guān)系數(shù)相關(guān)系數(shù) MATLAB提供了提供了corrcoef函數(shù),可以求出數(shù)據(jù)的相關(guān)函數(shù),可以求出數(shù)據(jù)的相關(guān)系數(shù)矩陣。系數(shù)矩陣。corrcoef函數(shù)的調(diào)用格式為:函數(shù)的調(diào)用格式為: corrcoef(X):返回從矩陣:返回從矩陣X形成的一個相關(guān)系數(shù)矩陣。此相形成的一個相關(guān)系數(shù)矩陣。此相關(guān)系數(shù)矩陣的大小與矩陣關(guān)系數(shù)矩陣的大小與
10、矩陣X一樣。它把矩陣一樣。它把矩陣X的每列作為一的每列作為一個變量,然后求它們的相關(guān)系數(shù)。個變量,然后求它們的相關(guān)系數(shù)。 corrcoef(X,Y):在這里,:在這里,X,Y是向量,它們與是向量,它們與corrcoef(X,Y)的作用一樣。的作用一樣。q數(shù)據(jù)統(tǒng)計處理基本命令數(shù)據(jù)統(tǒng)計處理基本命令Matlab相關(guān)命令 排序排序 MATLAB中對向量中對向量X是排序函數(shù)是是排序函數(shù)是sort(X),函數(shù)返回,函數(shù)返回一個對一個對X中的元素按升序排列的新向量。中的元素按升序排列的新向量。 sort函數(shù)也可以對矩陣函數(shù)也可以對矩陣A的各列或各行重新排序,的各列或各行重新排序,其調(diào)用格式為:其調(diào)用格式為:
11、 Y,I=sort(A,dim) 其中其中dim指明對指明對A的列還是行進(jìn)行排序。若的列還是行進(jìn)行排序。若dim=1,則按列,則按列排;若排;若dim=2,則按行排。,則按行排。Y是排序后的矩陣,而是排序后的矩陣,而I記錄記錄Y中中的元素在的元素在A中位置。中位置。 q數(shù)據(jù)統(tǒng)計處理基本命令數(shù)據(jù)統(tǒng)計處理基本命令Matlab相關(guān)命令類似的用法,請自己借助類似的用法,請自己借助matlab在線幫在線幫助功能自己了解:助功能自己了解:中位數(shù):中位數(shù):median(x)標(biāo)準(zhǔn)差:標(biāo)準(zhǔn)差:std(x) 方差:方差:var(x)偏度:偏度:skewness(x) 峰度:峰度:kurtosis(x)q數(shù)據(jù)統(tǒng)計處
12、理基本命令數(shù)據(jù)統(tǒng)計處理基本命令偏度和峰度的說明Matlab相關(guān)命令 例 生成滿足正態(tài)分布的100005隨機(jī)矩陣,然后求各列元素的均值和標(biāo)準(zhǔn)方差,再求這5列隨機(jī)數(shù)據(jù)的相關(guān)系數(shù)矩陣。 命令如下: X=sqrt(3)*randn(10000,5)+4; M=mean(X) D=std(X) R=corrcoef(X)q數(shù)據(jù)統(tǒng)計處理基本命令數(shù)據(jù)統(tǒng)計處理基本命令Matlab相關(guān)命令介紹q pdf 概率密度函數(shù)概率密度函數(shù)y=pdf(name,x,A)y=pdf(name,x,A,B) 或或 y=pdf(name,x,A,B,C)l 返回由返回由 name 指定的單參數(shù)分布的概率密度,指定的單參數(shù)分布的概
13、率密度,x為樣本數(shù)據(jù)為樣本數(shù)據(jù)n name 用來指定分布類型,其取值可以是:用來指定分布類型,其取值可以是: beta、bino、chi2、exp、ev、f 、 gam、gev、gp、geo、hyge、logn、 nbin、ncf、nct、ncx2、norm、 poiss、rayl、t、unif、unid、wbl。l 返回由返回由 name 指定的雙參數(shù)或三參數(shù)分布的概率密度指定的雙參數(shù)或三參數(shù)分布的概率密度常見的概率分布二項式分布二項式分布Binomialbino卡方分布卡方分布Chisquarechi2指數(shù)分布指數(shù)分布ExponentialexpF分布分布Ff幾何分布幾何分布Geometr
14、icgeo正態(tài)分布正態(tài)分布Normalnorm泊松分布泊松分布PoissonpoissT分布分布Tt均勻分布均勻分布Uniformunif離散均勻分布離散均勻分布Discrete UniformunidMatlab相關(guān)命令介紹例:例:x=-8:0.1:8;y=pdf(norm,x,0,1);y1=pdf(norm,x,1,2);plot(x,y,x,y1,:)n 注:注: y=pdf(norm,x,0,1) y=normpdf(x,0,1)相類似地,相類似地, y=pdf(beta,x,A,B) y=betapdf(x,A,B) y=pdf(bino,x,N,p) y=binopdf(x,N,
15、p) 概率密度函數(shù)【例】繪制卡方分布密度函數(shù)在自【例】繪制卡方分布密度函數(shù)在自由度分別為由度分別為1 1、5 5、1515的圖形的圖形x=0:0.1:30;x=0:0.1:30;y1=chi2pdf(x,1); y1=chi2pdf(x,1); plot(x,y1,:)plot(x,y1,:)hold on hold on 【例】【例】 繪制標(biāo)準(zhǔn)正態(tài)分布的概率繪制標(biāo)準(zhǔn)正態(tài)分布的概率密度圖密度圖. .x=-4:0.1:4;x=-4:0.1:4;y=normpdf(x,0,1);y=normpdf(x,0,1);plot(x,y)plot(x,y)title(N(0,1)title(N(0,1)的
16、概率密度曲線圖的概率密度曲線圖)累積分布函數(shù)(cdf)【例】【例】 求服從標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)變量落在區(qū)間求服從標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)變量落在區(qū)間 2, 22, 2上的概率上的概率. . P=normcdf (-2, 2) P=normcdf (-2, 2)ans = 0.0228 0.9772ans = 0.0228 0.9772 P(2)-P(1) P(2)-P(1)ans = 0.9545 ans = 0.9545 累積分布函數(shù)(cdf) u_alpha=norminv(0.9,0,1) u_alpha = 1.2816 u_alpha=norminv(0.9,0,1) u_alpha = 1
17、.2816 t_alpha=tinv(0.25,4) t_alpha = -0.7407 t_alpha=tinv(0.25,4) t_alpha = -0.7407 F_alpha=finv(0.1,14,10) F_alpha = 0.4772 F_alpha=finv(0.1,14,10) F_alpha = 0.4772 X2_alpha=chi2inv(0.025,50) X2_alpha = 32.3574 X2_alpha=chi2inv(0.025,50) X2_alpha = 32.3574累積分布函數(shù)(cdf)連續(xù)分布:正態(tài)分布q 正態(tài)分布連續(xù)分布)正態(tài)分布連續(xù)分布)l 如
18、果隨機(jī)變量如果隨機(jī)變量 X 的密度函數(shù)為:的密度函數(shù)為:22X 2e()2(1)f x 0,x 則稱則稱 X 服從正態(tài)分布。記做:服從正態(tài)分布。記做:2( ,)XN l 標(biāo)準(zhǔn)正態(tài)分布:標(biāo)準(zhǔn)正態(tài)分布:N (0, 1)l 正態(tài)分布也稱高斯分布,是概率論中最重要的一個分布。正態(tài)分布也稱高斯分布,是概率論中最重要的一個分布。l 如果一個變量是大量微小、獨(dú)立的隨機(jī)因素的疊加,那么如果一個變量是大量微小、獨(dú)立的隨機(jī)因素的疊加,那么它一定滿足正態(tài)分布。如測量誤差、產(chǎn)品質(zhì)量、月降雨量等它一定滿足正態(tài)分布。如測量誤差、產(chǎn)品質(zhì)量、月降雨量等正態(tài)分布舉例x=-8:0.1:8;y=normpdf(x,0,1);y1=
19、normpdf(x,1,2);plot(x,y,x,y1,:)例:標(biāo)準(zhǔn)正態(tài)分布和非標(biāo)準(zhǔn)正態(tài)分布密度函數(shù)圖形例:標(biāo)準(zhǔn)正態(tài)分布和非標(biāo)準(zhǔn)正態(tài)分布密度函數(shù)圖形-8-6-4-20246800.050.10.150.20.250.30.350.4連續(xù)分布:均勻分布q 均勻分布連續(xù)分布)均勻分布連續(xù)分布)l 如果隨機(jī)變量如果隨機(jī)變量 X 的密度函數(shù)為:的密度函數(shù)為:則稱則稱 X 服從均勻分布。記做:服從均勻分布。記做: , XU a bl 均勻分布在實際中經(jīng)常使用,譬如一個半徑為均勻分布在實際中經(jīng)常使用,譬如一個半徑為 r 的汽車輪的汽車輪胎,因為輪胎上的任一點(diǎn)接觸地面的可能性是相同的,所以胎,因為輪胎上的
20、任一點(diǎn)接觸地面的可能性是相同的,所以輪胎圓周接觸地面的位置輪胎圓周接觸地面的位置 X 是服從是服從 0,2r 上的均勻分布。上的均勻分布。 1)0,(, axbf xba 其其他他連續(xù)分布:指數(shù)分布q 指數(shù)分布連續(xù)分布)指數(shù)分布連續(xù)分布)l 如果隨機(jī)變量如果隨機(jī)變量 X 的密度函數(shù)為:的密度函數(shù)為:則稱則稱 X 服從參數(shù)為服從參數(shù)為 的指數(shù)分布。記做:的指數(shù)分布。記做: Exp( )X l 在實際應(yīng)用問題中,等待某特定事物發(fā)生所需要的時間往在實際應(yīng)用問題中,等待某特定事物發(fā)生所需要的時間往往服從指數(shù)分布。如某些元件的壽命;隨機(jī)服務(wù)系統(tǒng)中的服往服從指數(shù)分布。如某些元件的壽命;隨機(jī)服務(wù)系統(tǒng)中的服務(wù)
21、時間;動物的壽命等都常常假定服從指數(shù)分布。務(wù)時間;動物的壽命等都常常假定服從指數(shù)分布。 ,00,0( )xf xexx 0 l 指數(shù)分布具有無記憶性:指數(shù)分布具有無記憶性:|P Xst XsP Xt指數(shù)分布舉例x=0:0.1:30;y=exppdf(x,4);plot(x,y)例:例: =4 時的指數(shù)分布密度函數(shù)圖時的指數(shù)分布密度函數(shù)圖離散分布:幾何分布q 幾何分布是一種常見的離散分布幾何分布是一種常見的離散分布l 在貝努里實驗中,每次試驗成功的概率為在貝努里實驗中,每次試驗成功的概率為 p,設(shè)試驗進(jìn)行,設(shè)試驗進(jìn)行到第到第 次才出現(xiàn)成功,那么次才出現(xiàn)成功,那么 的分布滿足:的分布滿足:其右端項
22、是幾何級數(shù)其右端項是幾何級數(shù) 的一般項,于是人們稱它為的一般項,于是人們稱它為幾何分布。幾何分布。11kkpq 1()1,2,kpqPkk x=0:30; y=geopdf(x,0.5); plot(x,y)例:例: p=0.5 時的幾何分布密度函數(shù)圖時的幾何分布密度函數(shù)圖離散分布:二項式分布q 二項式分布屬于離散分布二項式分布屬于離散分布l 如果隨機(jī)變量如果隨機(jī)變量 X 的分布列為:的分布列為:則稱這種分布為二項式分布。記做:則稱這種分布為二項式分布。記做: ( ,)Xb n p (1()0,1,)kn knppP Xkkkn x=0:50;y=binopdf(x,500,0.05);plo
23、t(x,y)例:例: n=500,p=0.05 時的二項式分布密度函數(shù)圖時的二項式分布密度函數(shù)圖離散分布: Poisson 分布q 泊松分布也屬于離散分布,是泊松分布也屬于離散分布,是1837年由發(fā)個數(shù)年由發(fā)個數(shù)學(xué)家學(xué)家 Poisson 首次提出,其概率分布列為:首次提出,其概率分布列為:記做:記做:( )XP !()0, 1, 2,0kPekkXk l 泊松分布是一種常用的離散分布,它與單位時間或單泊松分布是一種常用的離散分布,它與單位時間或單位面積、單位產(chǎn)品等上的計數(shù)過程相聯(lián)系。如:單位時位面積、單位產(chǎn)品等上的計數(shù)過程相聯(lián)系。如:單位時間內(nèi),電話總機(jī)接到用戶呼喚次數(shù);間內(nèi),電話總機(jī)接到用戶
24、呼喚次數(shù);1 平方米內(nèi),玻璃上的平方米內(nèi),玻璃上的氣泡數(shù)等。氣泡數(shù)等。Poisson 分布舉例x=0:50;y=poisspdf(x,25);plot(x,y)例:例: =25 時的泊松分布密度函數(shù)圖時的泊松分布密度函數(shù)圖離散分布:均勻分布q 如果隨機(jī)變量如果隨機(jī)變量 X 的分布列為:的分布列為: 2 1()1,P Xkknn 則稱這種分布為離散均勻分布。記做:則稱這種分布為離散均勻分布。記做: 1,2, XUnn=20;x=1:n;y=unidpdf(x,n);plot(x,y,o-)例:例: n=20 時的離散均勻分布密度函數(shù)圖時的離散均勻分布密度函數(shù)圖抽樣分布: 2分布q 設(shè)隨機(jī)變量設(shè)隨
25、機(jī)變量 X1, X2, , Xn 相互獨(dú)立,且同服從正相互獨(dú)立,且同服從正態(tài)分布態(tài)分布 N(0,1),則稱隨機(jī)變量,則稱隨機(jī)變量 n2= X12+X22+ +Xn2服從自由度為服從自由度為 n 的的 2 分布,記分布,記作作 ,亦稱隨機(jī)變量,亦稱隨機(jī)變量 n2 為為 2 變量。變量。22( )nnx=0:0.1:20; y=chi2pdf(x,4); plot(x,y)例:例: n=4 和和 n=10 時的時的 2 分布密度函數(shù)圖分布密度函數(shù)圖x=0:0.1:20; y=chi2pdf(x,10); plot(x,y)抽樣分布: F 分布q 設(shè)隨機(jī)變量設(shè)隨機(jī)變量 ,且,且 X 與與 Y 相互獨(dú)
26、立,則稱隨機(jī)變量相互獨(dú)立,則稱隨機(jī)變量 22(),( )XmYnx=0.01:0.1:8.01;y=fpdf(x,4,10);plot(x,y)例:例: F(4,10) 的分布密度函數(shù)圖的分布密度函數(shù)圖/FX mY n 為服從自由度為服從自由度 (m, n) 的的 F 分布。記做:分布。記做:(, )FF m n抽樣分布: t 分布q 設(shè)隨機(jī)變量設(shè)隨機(jī)變量 ,且,且 X 與與 Y 相互獨(dú)立,則稱隨機(jī)變量相互獨(dú)立,則稱隨機(jī)變量 2(0,1),( )XNYn x=-6:0.01:6;y=tpdf(x,4);plot(x,y)例:例: t (4) 的分布密度函數(shù)圖的分布密度函數(shù)圖/TXY n 為服從
27、自由度為服從自由度 n 的的 t 分布。記做:分布。記做: ( )Tt n頻數(shù)直方圖或頻數(shù)表q 對于給定的數(shù)據(jù)集,假設(shè)它們滿足以上十種分布之對于給定的數(shù)據(jù)集,假設(shè)它們滿足以上十種分布之一,如何確定屬于哪種分布?一,如何確定屬于哪種分布?x=load(data1.txt); x=x(:);hist(x)例例 1:某次筆試的分?jǐn)?shù)見:某次筆試的分?jǐn)?shù)見 data1.txt,試畫出頻數(shù)直方,試畫出頻數(shù)直方圖圖繪制頻數(shù)直方圖,或列出頻數(shù)表繪制頻數(shù)直方圖,或列出頻數(shù)表n 從圖形上看,筆試成績較為接近正態(tài)分布從圖形上看,筆試成績較為接近正態(tài)分布q hist 繪制給定數(shù)據(jù)的直方圖繪制給定數(shù)據(jù)的直方圖hist(x
28、,m)xlsread(e:book1,sheet1)Textread(頻數(shù)直方圖或頻數(shù)表x=load(data2.txt); x=x(:);hist(x)例例 2:某次上機(jī)考試的分?jǐn)?shù)見:某次上機(jī)考試的分?jǐn)?shù)見 data2.txt,試畫出頻數(shù)直,試畫出頻數(shù)直方圖方圖n 從圖形上看,上機(jī)考試成績較為接近離散均勻分布從圖形上看,上機(jī)考試成績較為接近離散均勻分布x=load(data3.txt); x=x(:);hist(x)例例 3:上海:上海2019年來的月降雨量的數(shù)據(jù)見年來的月降雨量的數(shù)據(jù)見 data3.txt , 試畫出頻數(shù)直方圖試畫出頻數(shù)直方圖n 從圖形上看,月降雨量較為接近從圖形上看,月降雨
29、量較為接近 2 分布分布頻數(shù)直方圖或頻數(shù)表q 在重復(fù)數(shù)據(jù)較多的情況下,我們也可以利用在重復(fù)數(shù)據(jù)較多的情況下,我們也可以利用Matlab自帶的自帶的 tabulate 函數(shù)生成頻數(shù)表,并以頻數(shù)表的形式函數(shù)生成頻數(shù)表,并以頻數(shù)表的形式來發(fā)掘數(shù)據(jù)分布的規(guī)律。來發(fā)掘數(shù)據(jù)分布的規(guī)律。x=load(data4.txt); x=x(:);tabulate(x)hist(x)頻數(shù)直方圖或頻數(shù)表面列出了面列出了84個伊特拉斯坎個伊特拉斯坎Etruscan人男子的頭顱的最大寬度人男子的頭顱的最大寬度mm),試檢驗這些數(shù)據(jù)是否來自正態(tài)總體),試檢驗這些數(shù)據(jù)是否來自正態(tài)總體(取取=0.1). 141 148 132
30、138 154 142 150 146 155 158150 140 147 148 144 150 149 145 149 158143 141 144 144 126 140 144 142 141 140145 135 147 146 141 136 140 146 142 137148 154 137 139 143 140 131 143 141 149148 135 148 152 143 144 141 143 147 146150 132 142 142 143 153 149 146 149 138142 149 142 137 134 144 146 147 140 142
31、140 137 152 145x=load(data4.txt); x=x(:);tabulate(x)hist(x)頻數(shù)直方圖或頻數(shù)表學(xué)生的身高和體重:學(xué)校隨機(jī)抽取100名學(xué)生, 測量他們的身高和體重,所得數(shù)據(jù)如表身高體重 身高 體重 身高 體重 身高 體重 身高 體重172 75 169 55 169 64 171 65 167 47171 62 168 67 165 52 169 62 168 65166 62 168 65 164 59 170 58 165 64160 55 175 67 173 74 172 64 168 57155 57 176 64 172 69 169 58
32、176 57173 58 168 50 169 52 167 72 170 57166 55 161 49 173 57 175 76 158 51170 63 169 63 173 61 164 59 165 62167 53 171 61 166 70 166 63 172 53173 60 178 64 163 57 169 54 169 66178 60 177 66 170 56 167 54 169 58173 73 170 58 160 65 179 62 172 50163 47 173 67 165 58 176 63 162 52165 66 172 59 177 66 1
33、82 69 175 75170 60 170 62 169 63 186 77 174 66163 50 172 59 176 60 166 76 167 63172 57 177 58 177 67 169 72 166 50182 63 176 68 172 56 173 59 174 64171 59 175 68 165 56 169 65 168 62177 64 184 70 166 49 171 71 170 59頻數(shù)直方圖或頻數(shù)表 一道工序用自動化車床連續(xù)加工某種零件,由于刀具損壞等會出現(xiàn)故障.故障是完全隨機(jī)的,并假定生產(chǎn)任一零件時出現(xiàn)故障機(jī)會均相同.工作人員是通過檢查零件來確
34、定工序是否出現(xiàn)故障的.現(xiàn)積累有100次故障紀(jì)錄,故障出現(xiàn)時該刀具完成的零件數(shù)如下,試觀察該刀具出現(xiàn)故障時完成的零件數(shù)屬于哪種分布? 459 362 624 542 509 584 433 748 815 505612 452 434 982 640 742 565 706 593 680926 653 164 487 734 608 428 1153 593 844527 552 513 781 474 388 824 538 862 659775 859 755 49 697 515 628 954 771 609402 960 885 610 292 837 473 677 358 638
35、699 634 555 570 84 416 606 1062 484 120447 654 564 339 280 246 687 539 790 581621 724 531 512 577 496 468 499 544 645764 558 378 765 666 763 217 715 310 851頻數(shù)直方圖或頻數(shù)表x=load(data5.txt); x=x(:);hist(x)fiugrehistfit(x) % 加入較接近的正態(tài)分布密度曲線加入較接近的正態(tài)分布密度曲線試畫出其直方圖。試畫出其直方圖。 n 從圖形上看,較為接近正態(tài)分布從圖形上看,較為接近正態(tài)分布頻數(shù)直方圖或頻數(shù)
36、表q 也可以用也可以用 bar 函數(shù)。函數(shù)。qbar(x,y)繪制分別以繪制分別以x和和y為橫縱坐標(biāo)的二維條形為橫縱坐標(biāo)的二維條形圖圖qcdfplot(x) 繪制樣本繪制樣本x的經(jīng)驗分布函數(shù)圖的經(jīng)驗分布函數(shù)圖qFn,x0=ecdf(x) 得到樣本得到樣本x的經(jīng)驗分布函數(shù)值的經(jīng)驗分布函數(shù)值Fn, 當(dāng)當(dāng)x中有中有m個不同的數(shù)個不同的數(shù) (記為向量記為向量x0) 時時, 則則Fn的個的個數(shù)為數(shù)為m+1個個 x = 6 4 5 3 6 8 6 7 3 4; Fn,x0=ecdf(x)Fn = 0 0.2000 0.4000 0.5000 0.8000 0.9000 1.0000 x0 = 3 3 4
37、5 6 7 8 cdfplot(x)例例 累積分布函數(shù)(cdf)參數(shù)估計q 當(dāng)我們可以基本確定數(shù)據(jù)集當(dāng)我們可以基本確定數(shù)據(jù)集 X 符合某種分布后,我符合某種分布后,我們還需要確定這個分布的參數(shù)。們還需要確定這個分布的參數(shù)。q 由于正態(tài)分布情況發(fā)生的比較多,故我們主要考由于正態(tài)分布情況發(fā)生的比較多,故我們主要考慮正態(tài)分布的情形。慮正態(tài)分布的情形。q 對于未知參數(shù)的估計,可分兩種情況:對于未知參數(shù)的估計,可分兩種情況:l 點(diǎn)估計點(diǎn)估計l 區(qū)間估計區(qū)間估計參數(shù)估計:點(diǎn)估計q 構(gòu)造樣本構(gòu)造樣本 X 與某個統(tǒng)計量有關(guān)的一個函數(shù),作為與某個統(tǒng)計量有關(guān)的一個函數(shù),作為該統(tǒng)計量的一個估計,稱為點(diǎn)估計。該統(tǒng)計量
38、的一個估計,稱為點(diǎn)估計。q Matlab 統(tǒng)計工具箱中,一般采用最大似然估計法統(tǒng)計工具箱中,一般采用最大似然估計法給出參數(shù)的點(diǎn)估計。給出參數(shù)的點(diǎn)估計。n 泊松分布泊松分布 P () 的的 最大似然估計是最大似然估計是X n 指數(shù)分布指數(shù)分布 Exp () 的的 最大似然估計是最大似然估計是1X 點(diǎn)估計舉例n 正態(tài)分布正態(tài)分布 N (, 2) 中,中, 最大似然估計是最大似然估計是 , 2 的最大似然估計是的最大似然估計是X 2211niiXXn x=load(data1.txt);x=x(:);mu,sigma=normfit(x)例例 6:已知例:已知例 1 中的數(shù)據(jù)服從正態(tài)分布中的數(shù)據(jù)服從
39、正態(tài)分布 N (, 2) ,試求其參數(shù)試求其參數(shù) 和和 的值。的值。使用使用 normfit 函數(shù)函數(shù)參數(shù)估計:區(qū)間估計q 構(gòu)造樣本構(gòu)造樣本 X 與某個統(tǒng)計量有關(guān)的兩個函數(shù),作為與某個統(tǒng)計量有關(guān)的兩個函數(shù),作為該統(tǒng)計量的下限估計與上限估計,下限與上限構(gòu)成該統(tǒng)計量的下限估計與上限估計,下限與上限構(gòu)成一個區(qū)間,這個區(qū)間作為該統(tǒng)計量的估計,稱為區(qū)一個區(qū)間,這個區(qū)間作為該統(tǒng)計量的估計,稱為區(qū)間估計。間估計。區(qū)間估計舉例x=load(data6.txt); x=x(:);mu,sigma,muci,sigmaci=normfit(x,0.01)例例 8:從自動機(jī)床加工的同類零件中抽取:從自動機(jī)床加工的同
40、類零件中抽取16件,測得件,測得長度值見長度值見 data6.txt,已知零件長度服從正態(tài)分布,已知零件長度服從正態(tài)分布 N (, 2) ,試求零件長度均值,試求零件長度均值 和標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)差 的置信的置信度為度為 99% 的置信區(qū)間。的置信區(qū)間。Matlab相關(guān)命令介紹q normfit 正態(tài)分布中的參數(shù)估計正態(tài)分布中的參數(shù)估計muhat,sigmahat,muci,sigmaci=normfit(x,alpha)l 對樣本數(shù)據(jù)對樣本數(shù)據(jù) x 進(jìn)行參數(shù)估計,并計算置信度為進(jìn)行參數(shù)估計,并計算置信度為 1-alpha 的置信區(qū)間的置信區(qū)間l alpha 可以省略,缺省值為可以省略,缺省值為 0
41、.05,即置信度為,即置信度為 95%Matlab相關(guān)命令介紹q 其它分布中的參數(shù)估計其它分布中的參數(shù)估計Matlab相關(guān)命令介紹l說明說明: l(1) unifit和和normfit的格式與其它函數(shù)均不同的格式與其它函數(shù)均不同, 此二者要求左此二者要求左邊的輸出變量必須將參數(shù)或分別列出邊的輸出變量必須將參數(shù)或分別列出.l(2) binofit (x,n,alpha)根據(jù)試驗成功的次數(shù)根據(jù)試驗成功的次數(shù)x和總的試驗次數(shù)和總的試驗次數(shù)n, 對中的對中的p進(jìn)行最大似然估計進(jìn)行最大似然估計, 同時返回置信度為同時返回置信度為100(1-alpha)%的置信區(qū)間的置信區(qū)間pci. phat,pci=b
42、inofit(4,100,0.05)phat = 0.0400pci = 0.0110 0.0993由于置信區(qū)間的上限超出了規(guī)定指標(biāo)由于置信區(qū)間的上限超出了規(guī)定指標(biāo)(不合格率在不合格率在5%以以下下), 因此不能出廠因此不能出廠 例例 對一批產(chǎn)品對一批產(chǎn)品, 欲通過抽樣檢查其合格率欲通過抽樣檢查其合格率. 若產(chǎn)品不合若產(chǎn)品不合格率在格率在5%以下以下, 則該批產(chǎn)品可出廠則該批產(chǎn)品可出廠. 檢驗時要求結(jié)果檢驗時要求結(jié)果具有具有0.95的置信水平的置信水平. 今抽取產(chǎn)品今抽取產(chǎn)品100件件, 發(fā)現(xiàn)不合格品發(fā)現(xiàn)不合格品有有4件件, 問這批產(chǎn)品能否出廠問這批產(chǎn)品能否出廠? 假設(shè)檢驗q 對總體的分布律或
43、分布參數(shù)作某種假設(shè),根據(jù)抽取對總體的分布律或分布參數(shù)作某種假設(shè),根據(jù)抽取的樣本觀察值,運(yùn)用數(shù)理統(tǒng)計的分析方法,檢驗這種的樣本觀察值,運(yùn)用數(shù)理統(tǒng)計的分析方法,檢驗這種假設(shè)是否正確,從而決定接受假設(shè)或拒絕假設(shè),這就假設(shè)是否正確,從而決定接受假設(shè)或拒絕假設(shè),這就是假設(shè)檢驗問題。是假設(shè)檢驗問題。q 以正態(tài)假設(shè)檢驗為例,來說明假設(shè)檢驗的基本過程。以正態(tài)假設(shè)檢驗為例,來說明假設(shè)檢驗的基本過程。正態(tài)假設(shè)檢驗q 正態(tài)假設(shè)檢驗的一般過程:正態(tài)假設(shè)檢驗的一般過程:l 假設(shè)檢驗:利用假設(shè)檢驗:利用 Matlab 統(tǒng)計工具箱給出的常用的假設(shè)檢驗統(tǒng)計工具箱給出的常用的假設(shè)檢驗方法的函數(shù)方法的函數(shù) ttest,進(jìn)行顯著性
44、水平為,進(jìn)行顯著性水平為 alpha 的的 t 假設(shè)檢驗,以假設(shè)檢驗,以檢驗正態(tài)分布樣本檢驗正態(tài)分布樣本 x標(biāo)準(zhǔn)差未知的均值是否為標(biāo)準(zhǔn)差未知的均值是否為 m。運(yùn)行結(jié)。運(yùn)行結(jié)果中,當(dāng)果中,當(dāng) h=1 時,表示拒絕零假設(shè);當(dāng)時,表示拒絕零假設(shè);當(dāng) h=0 時,表示不能拒時,表示不能拒絕零假設(shè)。絕零假設(shè)。l 對比正態(tài)分布的概率密度函數(shù)分布圖,判斷某統(tǒng)計量的對比正態(tài)分布的概率密度函數(shù)分布圖,判斷某統(tǒng)計量的分布可能服從正態(tài)分布分布可能服從正態(tài)分布l 利用統(tǒng)計繪圖函數(shù)利用統(tǒng)計繪圖函數(shù) normplot 進(jìn)行正態(tài)分布檢驗進(jìn)行正態(tài)分布檢驗Matlab相關(guān)命令介紹normplot(x)l 統(tǒng)計繪圖函數(shù),進(jìn)行正態(tài)
45、分布檢驗。研究表明:如果數(shù)據(jù)統(tǒng)計繪圖函數(shù),進(jìn)行正態(tài)分布檢驗。研究表明:如果數(shù)據(jù)是來自一個正態(tài)分布,則該線為一直線形態(tài);如果它是來自是來自一個正態(tài)分布,則該線為一直線形態(tài);如果它是來自其他分布,則為曲線形態(tài)。其他分布,則為曲線形態(tài)。wblplot(x)l 統(tǒng)計繪圖函數(shù),進(jìn)展統(tǒng)計繪圖函數(shù),進(jìn)展 Weibull 分布檢驗。分布檢驗。正態(tài)假設(shè)檢驗舉例x=load(data5.txt); x=x(:);normplot(x)例例 9:試說明例:試說明例 5 中的刀具使用壽命服從正態(tài)分布,中的刀具使用壽命服從正態(tài)分布,并且說明在方差未知的情況下其均值并且說明在方差未知的情況下其均值 m 取為取為 597
46、是是否合理。否合理。 (1) 對比刀具使用壽命分布圖與正態(tài)分布的概率密度分對比刀具使用壽命分布圖與正態(tài)分布的概率密度分布函數(shù)圖,得初步結(jié)論:該批刀具的使用壽命可能服從正態(tài)布函數(shù)圖,得初步結(jié)論:該批刀具的使用壽命可能服從正態(tài)分布。分布。解:解:(2) 利用統(tǒng)計繪圖函數(shù)利用統(tǒng)計繪圖函數(shù) normplot 進(jìn)行分布的正態(tài)性檢驗進(jìn)行分布的正態(tài)性檢驗結(jié)果顯示:這結(jié)果顯示:這 100 個離散點(diǎn)非常靠近傾斜直線段,即圖形為線個離散點(diǎn)非常靠近傾斜直線段,即圖形為線性的,因此可得結(jié)論:該批刀具的使用壽命近似服從正態(tài)分布。性的,因此可得結(jié)論:該批刀具的使用壽命近似服從正態(tài)分布。總體方差總體方差sigma2未知時,
47、總體均值的檢驗使用未知時,總體均值的檢驗使用t-檢驗檢驗 h,sig,ci = ttest(x,m,alpha,tail)檢驗數(shù)據(jù) x 的關(guān)于均值的某一假設(shè)是否成立,其中alpha 為顯著性水平,究竟檢驗什么假設(shè)取決于 tail 的取值:tail = 0,檢驗假設(shè)“x 的均值等于 m ”tail = 1,檢驗假設(shè)“x 的均值大于 m ”tail =-1,檢驗假設(shè)“x 的均值小于 m ”tail的缺省值為 0, alpha的缺省值為 0.05. 返回值 h 為一個布爾值,h=1 表示可以拒絕假設(shè),h=0 表示不可以拒絕假設(shè),sig 為假設(shè)成立的概率,ci 為均值的 1-alpha 置信區(qū)間.tt
48、est說明正態(tài)假設(shè)檢驗舉例x=load(data5.txt); x=x(:);h=ttest(x,597,0.05)(3) 利用函數(shù)利用函數(shù) ttest 進(jìn)行顯著性水平為進(jìn)行顯著性水平為 alpha 的的 t 假設(shè)檢驗假設(shè)檢驗檢驗結(jié)果:檢驗結(jié)果:h=0。表示不拒絕零假設(shè),說明所提出的假設(shè)。表示不拒絕零假設(shè),說明所提出的假設(shè) “壽命均值為壽命均值為 597” 是合理的是合理的 例 Matlab統(tǒng)計工具箱中的數(shù)據(jù)文件gas.mat.中提供了美國1993年一月份和二月份的汽油平均價格price1,price2分別是一,二月份的油價,單位為美分),它是容量為20的雙樣本.假設(shè)一月份油價的標(biāo)準(zhǔn)偏差未知,
49、試檢驗一月份油價的均值是否等于115.解解 作假設(shè):作假設(shè):m = 115.首先取出數(shù)據(jù),用以下命令:首先取出數(shù)據(jù),用以下命令: load gas然后用以下命令檢驗然后用以下命令檢驗 h,sig,ci = ttest( price2 ,115)返回:h = 1,sig = 4.9517e-004,ci =116.8 120.2.檢驗結(jié)果: 1. 布爾變量h=1, 表示拒絕零假設(shè). 說明提出的假設(shè)油價均值115是不合理的. 2. 95%的置信區(qū)間為116.8 120.2, 它不包括115, 故不能接受假設(shè). 3. sig-值為4.9517e-004, 遠(yuǎn)小于0.5, 不能接受零假設(shè). ttest舉例Matlab中假設(shè)檢驗相關(guān)命令例例 由十臺電機(jī)組成的機(jī)組進(jìn)行工作由十臺電機(jī)組成的機(jī)組進(jìn)行工作, 在在2000小時中有五臺發(fā)生故障小時中有五臺發(fā)生故障, 其其故障發(fā)生的時間為故障發(fā)生的時間為1350, 965, 427, 1753, 665試問這些電機(jī)在試問這些電機(jī)在2000小時前發(fā)生小時前發(fā)生故障的時間故障的時間T是否服從平均壽命為是否服從平均壽命為1500小時的指數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基層公共衛(wèi)生考試模擬題(含答案)
- 2025屆廣東省汕頭市潮南實驗學(xué)校校高考沖刺模擬英語試題含答案
- 鉗工四級理論知識復(fù)習(xí)題(附參考答案)
- 車工高級工模擬習(xí)題(附參考答案)
- 職業(yè)技術(shù)學(xué)院2024級嬰幼兒托育服務(wù)與管理專業(yè)人才培養(yǎng)方案
- 助產(chǎn)技術(shù)-娠合并癥專項考核試題
- 眼鏡生產(chǎn)過程中的品質(zhì)監(jiān)控手段考核試卷
- 糖品包裝設(shè)計與可持續(xù)發(fā)展理念考核試卷
- 健康飲食食物中的銅與貧血的預(yù)防考核試卷
- 聚合纖維在能源儲存領(lǐng)域的應(yīng)用考核試卷
- 第3課《校園文化活動我參與》教案 海燕版綜合實踐活動 三年級下冊
- 2025年保密教育線上培訓(xùn)考試試題及答案
- 大學(xué)生職業(yè)規(guī)劃大賽《運(yùn)動康復(fù)專業(yè)》生涯發(fā)展展示
- 高樓遮光補(bǔ)償協(xié)議書范本
- 課題申報書:生成式人工智能賦能高職教學(xué)變革研究
- 2025-2030專用車產(chǎn)業(yè)規(guī)劃及發(fā)展研究報告
- 母乳喂養(yǎng)知識培訓(xùn)課件下載
- 《自由現(xiàn)金流折現(xiàn)法對東鵬特飲公司的財務(wù)估值實例分析》2000字
- 西安市曲江第三中學(xué)行政人員及教師招聘筆試真題2024
- 外研版(三起)(2024)三年級下冊英語Unit 2 單元測試卷(含答案)
- 國開(內(nèi)蒙古)2024年《創(chuàng)新創(chuàng)業(yè)教育基礎(chǔ)》形考任務(wù)1-3終考任務(wù)答案
評論
0/150
提交評論