




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、綜合實驗四數據的統計分析數學實驗數學實驗數學實驗q 現實生活中的許多數據都是隨機產生的,如考試現實生活中的許多數據都是隨機產生的,如考試分數、月降雨量、燈泡壽命等。分數、月降雨量、燈泡壽命等。q 從數理統計角度來看,這些數據其實都是符合某種從數理統計角度來看,這些數據其實都是符合某種分布的,這種規律就是統計規律。分布的,這種規律就是統計規律。q 本實驗主要通過對概率密度函數曲線的直觀認識和本實驗主要通過對概率密度函數曲線的直觀認識和數據分布的形態猜測,以及密度函數的參數估計,進數據分布的形態猜測,以及密度函數的參數估計,進行簡單的正態假設檢驗,揭示日常生活中隨機數據的行簡單的正態假設檢驗,揭示
2、日常生活中隨機數據的一些統計規律。一些統計規律。問題背景和實驗目的問題背景和實驗目的數學實驗數學實驗Matlab相關命令介紹相關命令介紹q pdf 概率密度函數概率密度函數y=pdf(name,x,A)y=pdf(name,x,A,B) 或或 y=pdf(name,x,A,B,C)l 返回由返回由 name 指定的單參數分布的概率密度,指定的單參數分布的概率密度,x為樣本數據為樣本數據n name 用來指定分布類型,其取值可以是:用來指定分布類型,其取值可以是: beta、bino、chi2、exp、ev、f 、 gam、gev、gp、geo、hyge、logn、 nbin、ncf、nct、n
3、cx2、norm、 poiss、rayl、t、unif、unid、wbl。l 返回由返回由 name 指定的雙參數或三參數分布的概率密度指定的雙參數或三參數分布的概率密度數學實驗數學實驗Matlab相關命令介紹相關命令介紹例:例:x=-8:0.1:8;y=pdf(norm,x,0,1);y1=pdf(norm,x,1,2);plot(x,y,x,y1,:)n 注:注: y=pdf(norm,x,0,1) y=normpdf(x,0,1)相類似地,相類似地, y=pdf(beta,x,A,B) y=betapdf(x,A,B) y=pdf(bino,x,N,p) y=binopdf(x,N,p)
4、 數學實驗數學實驗Matlab相關命令介紹相關命令介紹q normfit 正態分布中的參數估計正態分布中的參數估計muhat,sigmahat,muci,sigmaci=normfit(x,alpha)l 對樣本數據對樣本數據 x 進行參數估計,并計算置信度為進行參數估計,并計算置信度為 1-alpha 的置信區間的置信區間l alpha 可以省略,缺省值為可以省略,缺省值為 0.05,即置信度為,即置信度為 95%q load 從從matlab數據文件中載入數據數據文件中載入數據S=load(數據文件名數據文件名)q hist 繪制給定數據的直方圖繪制給定數據的直方圖hist(x,m)數學實
5、驗數學實驗Matlab相關命令介紹相關命令介紹table=tabulate(x)l 繪制頻數表,返回值繪制頻數表,返回值 table 中,第一列為中,第一列為x的值,第二列的值,第二列為該值出現的次數,最后一列包含每個值的百分比。為該值出現的次數,最后一列包含每個值的百分比。ttest(x,m,alpha)l 假設檢驗函數。此函數對樣本數據假設檢驗函數。此函數對樣本數據 x 進行顯著性水平為進行顯著性水平為 alpha 的的 t 假設檢驗,以檢驗正態分布樣本假設檢驗,以檢驗正態分布樣本 x(標準差未知)(標準差未知)的均值是否為的均值是否為 m。數學實驗數學實驗Matlab相關命令介紹相關命令
6、介紹normplot(x)l 統計繪圖函數,進行正態分布檢驗。研究表明:統計繪圖函數,進行正態分布檢驗。研究表明:如果數據如果數據是來自一個正態分布,則該線為一直線形態;如果它是來自是來自一個正態分布,則該線為一直線形態;如果它是來自其他分布,則為曲線形態。其他分布,則為曲線形態。wblplot(x)l 統計繪圖函數,進行統計繪圖函數,進行 Weibull 分布檢驗。分布檢驗。數學實驗數學實驗Matlab相關命令介紹相關命令介紹q 其它函數其它函數l cdf 系列函數:累積分布函數系列函數:累積分布函數l inv 系列函數:逆累積分布函數系列函數:逆累積分布函數l rnd 系列函數:隨機數發生
7、函數系列函數:隨機數發生函數l stat 系列函數:均值與方差函數系列函數:均值與方差函數例:例:p=normcdf(-2:2,0,1)x=norminv(0.025 0.975,0,1)n=normrnd(0,1,1 5)n=1:5; m,v=normstat(n*n,n*n)數學實驗數學實驗常見的概率分布常見的概率分布二項式分布Binomialbino卡方分布Chisquarechi2指數分布ExponentialexpF分布Ff幾何分布Geometricgeo正態分布Normalnorm泊松分布PoissonpoissT分布Tt均勻分布Uniformunif離散均勻分布Discrete
8、Uniformunid數學實驗數學實驗連續分布:正態分布連續分布:正態分布q 正態分布正態分布(連續分布)(連續分布)l 如果隨機變量如果隨機變量 X 的密度函數為:的密度函數為:22X 2e()2(1)f x 0,x 則稱則稱 X 服從正態分布。記做:服從正態分布。記做:2( ,)XN l 標準正態分布:標準正態分布:N (0, 1)l 正態分布也稱高斯分布,是概率論中最重要的一個分布。正態分布也稱高斯分布,是概率論中最重要的一個分布。l 如果如果一個變量一個變量是是大量微小、獨立的隨機因素大量微小、獨立的隨機因素的的疊加,那么疊加,那么它它一定一定滿足滿足正態正態分布。分布。如測量誤差、產
9、品質量、月降雨量等如測量誤差、產品質量、月降雨量等數學實驗數學實驗正態分布舉例正態分布舉例x=-8:0.1:8;y=normpdf(x,0,1);y1=normpdf(x,1,2);plot(x,y,x,y1,:)例:例:標準正態分布和非標準正態分布密度函數圖形標準正態分布和非標準正態分布密度函數圖形數學實驗數學實驗連續分布:均勻分布連續分布:均勻分布q 均勻分布均勻分布(連續分布)(連續分布)l 如果隨機變量如果隨機變量 X 的密度函數為:的密度函數為:則稱則稱 X 服從均勻分布。記做:服從均勻分布。記做: , XU a bl 均勻分布在實際中經常使用,譬如一個半徑為均勻分布在實際中經常使用
10、,譬如一個半徑為 r 的汽車輪的汽車輪胎,因為輪胎上的任一點接觸地面的可能性是相同的,所以胎,因為輪胎上的任一點接觸地面的可能性是相同的,所以輪胎圓周接觸地面的位置輪胎圓周接觸地面的位置 X 是服從是服從 0,2 r 上的均勻分布上的均勻分布。 1)0,(, axbf xba 其其他他數學實驗數學實驗均勻分布舉例均勻分布舉例x=-10:0.01:10;r=1;y=unifpdf(x,0,2*pi*r);plot(x,y);數學實驗數學實驗連續分布:指數分布連續分布:指數分布q 指數分布指數分布(連續分布)(連續分布)l 如果隨機變量如果隨機變量 X 的密度函數為:的密度函數為:則稱則稱 X 服
11、從參數為服從參數為 的指數分布。記做:的指數分布。記做: Exp( )X l 在實際應用問題中,等待某特定事物發生所需要的時間往在實際應用問題中,等待某特定事物發生所需要的時間往往服從指數分布往服從指數分布。如某些元件的壽命;隨機服務系統中的服如某些元件的壽命;隨機服務系統中的服務時間;動物的壽命等都常務時間;動物的壽命等都常常常假定服從指數分布假定服從指數分布。 ,00,0( )xf xexx 0 l 指數分布具有無記憶性:指數分布具有無記憶性:|P Xst XsP Xt 數學實驗數學實驗指數分布舉例指數分布舉例x=0:0.1:30;y=exppdf(x,4);plot(x,y)例:例: =
12、4 時的指數分布密度函數圖時的指數分布密度函數圖數學實驗數學實驗離散分布:幾何分布離散分布:幾何分布q 幾何分布幾何分布是一種常見的是一種常見的離散分布離散分布l 在貝努里實驗中,每次試驗成功的概率為在貝努里實驗中,每次試驗成功的概率為 p,設試驗進行,設試驗進行到第到第 次才出現成功,則次才出現成功,則 的分布滿足:的分布滿足:其右端項其右端項是幾何級數是幾何級數 的一般項,于是人們稱它為的一般項,于是人們稱它為幾何分布幾何分布。11kkpq 1()1,2,kpqPkk x=0:30; y=geopdf(x,0.5); plot(x,y)例:例: p=0.5 時的幾何分布密度函數圖時的幾何分
13、布密度函數圖數學實驗數學實驗離散分布:二項式分布離散分布:二項式分布q 二項式分布二項式分布屬于離散分布屬于離散分布l 如果隨機變量如果隨機變量 X 的分布列為:的分布列為:則稱這種分布為二項式分布。記做:則稱這種分布為二項式分布。記做: ( ,)Xb n p (1()0,1,)kn knppP Xkkkn x=0:50;y=binopdf(x,500,0.05);plot(x,y)例:例: n=500,p=0.05 時的二項式分布密度函數圖時的二項式分布密度函數圖數學實驗數學實驗離散分布:離散分布: Poisson 分布分布q 泊松分布泊松分布也屬于離散分布,是也屬于離散分布,是1837年由
14、發個數年由發個數學家學家 Poisson 首次提出,其概率分布列為:首次提出,其概率分布列為:記做:記做:( )XP !()0, 1, 2,0kPekkXk l 泊松分布是一種常用的離散分布,它與單位時間(或單泊松分布是一種常用的離散分布,它與單位時間(或單位面積、單位產品等)上的計數過程相聯系位面積、單位產品等)上的計數過程相聯系。如:單位時如:單位時間內,電話總機接到用戶呼喚次數;間內,電話總機接到用戶呼喚次數;1 平方米內,玻璃上的平方米內,玻璃上的氣泡數等氣泡數等。數學實驗數學實驗Poisson 分布舉例分布舉例x=0:50;y=poisspdf(x,25);plot(x,y)例:例:
15、 =25 時的泊松分布密度函數圖時的泊松分布密度函數圖數學實驗數學實驗離散分布:均勻分布離散分布:均勻分布q 如果隨機變量如果隨機變量 X 的分布列為:的分布列為: 2 1()1,P Xkknn則稱這種分布為則稱這種分布為離散均勻分布離散均勻分布。記做:。記做: 1,2, XUnn=20;x=1:n;y=unidpdf(x,n);plot(x,y,o-)例:例: n=20 時的離散均勻分布密度函數圖時的離散均勻分布密度函數圖數學實驗數學實驗抽樣分布:抽樣分布: 2分布分布q 設隨機變量設隨機變量 X1, X2, , Xn 相互獨立,且同服從正態相互獨立,且同服從正態分布分布 N(0,1),則稱
16、隨機變量,則稱隨機變量 n2= X12+X22+ +Xn2服從服從自由度為自由度為 n 的的 2 分布,記作分布,記作 ,亦稱隨,亦稱隨機變量機變量 n2 為為 2 變量。變量。22( )nnx=0:0.1:20; y=chi2pdf(x,4); plot(x,y)例:例: n=4 和和 n=10 時的時的 2 分布密度函數圖分布密度函數圖x=0:0.1:20; y=chi2pdf(x,10); plot(x,y)數學實驗數學實驗抽樣分布:抽樣分布: F 分布分布q 設隨機變量設隨機變量 ,且,且 X 與與 Y 相相互獨立,則稱隨機變量互獨立,則稱隨機變量 22(),( )XmYnx=0.01
17、:0.1:8.01;y=fpdf(x,4,10);plot(x,y)例:例: F(4,10) 的分布密度函數圖的分布密度函數圖/FX mY n 為服從自由度為服從自由度 (m, n) 的的 F 分布。記做:分布。記做:(, )FF m n數學實驗數學實驗抽樣分布:抽樣分布: t 分布分布q 設隨機變量設隨機變量 ,且,且 X 與與 Y 相相互獨立,則稱隨機變量互獨立,則稱隨機變量 2(0,1),( )XNYn x=-6:0.01:6;y=tpdf(x,4);plot(x,y)例:例: t (4) 的分布密度函數圖的分布密度函數圖/TXY n 為服從自由度為服從自由度 n 的的 t 分布。記做:
18、分布。記做: ( )Tt n數學實驗數學實驗頻數直方圖或頻數表頻數直方圖或頻數表q 對于給定的數據集,假設它們滿足以上十種分布之對于給定的數據集,假設它們滿足以上十種分布之一,如何確定屬于哪種分布?一,如何確定屬于哪種分布?x=load(data1.txt); x=x(:);hist(x)例例 1:某次某次筆試的分數見筆試的分數見 data1.txt,試畫出頻數直方圖,試畫出頻數直方圖繪制繪制頻數頻數直方圖,或列出頻數表直方圖,或列出頻數表n 從圖形上看,筆試成績較為接近正態分布從圖形上看,筆試成績較為接近正態分布數學實驗數學實驗頻數直方圖或頻數表頻數直方圖或頻數表x=load(data2.t
19、xt); x=x(:);hist(x)例例 2:某次某次上機考試的分數見上機考試的分數見 data2.txt,試畫出頻數直方圖,試畫出頻數直方圖n 從圖形上看,上機考試成績較為接近離散均勻分布從圖形上看,上機考試成績較為接近離散均勻分布x=load(data3.txt); x=x(:);hist(x)例例 3:上海上海1998年來的月降雨量的數據年來的月降雨量的數據見見 data3.txt , 試畫出頻數直方圖試畫出頻數直方圖n 從圖形上看,月降雨量較為接近從圖形上看,月降雨量較為接近 2 分布分布數學實驗數學實驗頻數直方圖或頻數表頻數直方圖或頻數表q 在重復數據較多的情況下,我們也可以利用在
20、重復數據較多的情況下,我們也可以利用Matlab自帶的自帶的 tabulate 函數生成頻數表,并以頻數表的形函數生成頻數表,并以頻數表的形式來發掘數據分布的規律。式來發掘數據分布的規律。x=load(data4.txt); x=x(:);tabulate(x)hist(x)例例 4:給出數據給出數據 data4.txt,試畫出其直方圖,并生成頻數表,試畫出其直方圖,并生成頻數表數學實驗數學實驗頻數直方圖或頻數表頻數直方圖或頻數表x=load(data5.txt); x=x(:);hist(x)fiugrehistfit(x) % 加入較接近的正態分布密度曲線加入較接近的正態分布密度曲線例例
21、5:現累積有現累積有100次刀具故障記錄,當故障出現時該批刀具完次刀具故障記錄,當故障出現時該批刀具完成的零件數成的零件數見見 data5.txt,試畫出其直方圖。,試畫出其直方圖。 n 從圖形上看,較為接近正態分布從圖形上看,較為接近正態分布數學實驗數學實驗參數估計參數估計q 當我們可以基本確定數據集當我們可以基本確定數據集 X 符合某種分布后,我符合某種分布后,我們還需要確定這個分布的參數。們還需要確定這個分布的參數。q 由于正態分布情況發生的比較多,故我們主要考由于正態分布情況發生的比較多,故我們主要考慮正態分布的情形。慮正態分布的情形。q 對于未知參數的估計,可分兩種情況:對于未知參數
22、的估計,可分兩種情況:l 點估計點估計l 區間估計區間估計數學實驗數學實驗參數估計:點估計參數估計:點估計q 構造樣本構造樣本 X 與某個統計量有關的一個函數,作為與某個統計量有關的一個函數,作為該統計量的一個估計,稱為該統計量的一個估計,稱為點估計點估計。q Matlab 統計工具箱中,一般采用最大似然估計法統計工具箱中,一般采用最大似然估計法給出參數的點估計。給出參數的點估計。n 泊松分布泊松分布 P ( ) 的的 最大似然估計是最大似然估計是X n 指數分布指數分布 Exp ( ) 的的 最大似然估計是最大似然估計是1X 數學實驗數學實驗點估計舉例點估計舉例n 正態分布正態分布 N (
23、, 2) 中,中, 最大似然估計是最大似然估計是 , 2 的最大似然估計是的最大似然估計是X 2211niiXXn x=load(data1.txt);x=x(:);mu,sigma=normfit(x)例例 6:已知例已知例 1 中的數據服從正態分布中的數據服從正態分布 N ( , 2) ,試求其參,試求其參數數 和和 的值。的值。使用使用 normfit 函數函數數學實驗數學實驗參數估計:區間估計參數估計:區間估計q 構造樣本構造樣本 X 與某個統計量有關的兩個函數,作為與某個統計量有關的兩個函數,作為該統計量的下限估計與上限估計,下限與上限構成該統計量的下限估計與上限估計,下限與上限構成
24、一個區間,這個區間作為該統計量的估計,稱為一個區間,這個區間作為該統計量的估計,稱為區區間估計間估計。q Matlab 統計工具箱中,一般也采用最大似然估計統計工具箱中,一般也采用最大似然估計法給出參數的區間估計。法給出參數的區間估計。數學實驗數學實驗區間估計舉例區間估計舉例x=load(data1.txt); x=x(:);mu,sigma,muci,sigmaci=normfit(x)例例 7:已知例已知例 1 中的數據服從正態分布中的數據服從正態分布 N ( , 2) ,試求出,試求出 和和 2 的置信度為的置信度為 95% 的區間估計。的區間估計。x=load(data6.txt);
25、x=x(:);mu,sigma,muci,sigmaci=normfit(x,0.01)例例 8:從自動機床加工的同類零件中抽取從自動機床加工的同類零件中抽取16件,測得長度值件,測得長度值見見 data6.txt,已知零件長度服從正態分布,已知零件長度服從正態分布 N ( , 2) ,試求零,試求零件長度均值件長度均值 和標準差和標準差 的置信度為的置信度為 99% 的置信區間。的置信區間。數學實驗數學實驗假設檢驗假設檢驗q 對總體的分布律或分布參數作某種假設,根據抽取對總體的分布律或分布參數作某種假設,根據抽取的樣本觀察值,運用數理統計的分析方法,檢驗這種的樣本觀察值,運用數理統計的分析方
26、法,檢驗這種假設是否正確,從而決定接受假設或拒絕假設,這就假設是否正確,從而決定接受假設或拒絕假設,這就是是假設檢驗假設檢驗問題。問題。q 以正態假設檢驗為例,來說明假設檢驗的基本過程以正態假設檢驗為例,來說明假設檢驗的基本過程。數學實驗數學實驗正態假設檢驗正態假設檢驗q 正態假設檢驗的一般過程:正態假設檢驗的一般過程:l 假設檢驗:利用假設檢驗:利用 Matlab 統計工具箱給出的常用的假設檢驗統計工具箱給出的常用的假設檢驗方法的函數方法的函數 ttest,進行顯著性水平為,進行顯著性水平為 alpha 的的 t 假設檢驗,假設檢驗,以檢驗正態分布樣本以檢驗正態分布樣本 x(標準差未知)的均值是否為(標準差未知)的均值是否
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 低鈣血癥治療
- 二零二五租房轉租協議書合同范例
- 最高額反擔保合同意思二零二五年
- 從案例看區塊鏈在版權保護中的運用
- 區塊鏈技術在商業領域的品牌傳播創新
- 二手房集資買賣合同1500字
- 加油站租賃合同書協議書范例
- 防水工程施工合同范例簡介二零二五年
- 旅行社脫團免責協議二零二五年
- 項目投資居間的合同書
- GB/T 13460-2025再生橡膠通用規范
- 2025年農村商業銀行招聘考試筆試試題(含答案)
- 電信運營商客戶流失管理手冊
- 上饒城投筆試試題及答案
- 2025-2030鱗狀非小細胞肺癌治療學行業市場現狀供需分析及重點企業投資評估規劃分析研究報告
- 陪診師考試2024年全真模擬試題及答案
- 2024年恒豐銀行招聘筆試真題
- 課程顧問電話銷售流程
- 陜西省關于低空經濟政策
- 產品三觀:打造用戶思維法則
- DB11-T 864-2020 園林綠化種植土壤技術要求
評論
0/150
提交評論