合金鋼的抗拉強度與鋼中含碳量的回歸分析_第1頁
合金鋼的抗拉強度與鋼中含碳量的回歸分析_第2頁
合金鋼的抗拉強度與鋼中含碳量的回歸分析_第3頁
合金鋼的抗拉強度與鋼中含碳量的回歸分析_第4頁
合金鋼的抗拉強度與鋼中含碳量的回歸分析_第5頁
已閱讀5頁,還剩16頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、僅供個人參考成績評定表學生姓名陳基政班級學號17專業信息與計算科學課程設計題目合金鋼的抗拉強度與鋼中含碳量的回歸分析評語組長簽字:成績日期20 年 月日課程設計任務書學院理學院專業信息與計算科學學生姓名陳基政班級學號17課程設計題目合金鋼的抗拉強度與鋼中含碳量的回歸分析實踐教學要求與任務:通過該課程設計,使學生進一步理解概率論與數理統計的基本概念、理論和方法;初步掌握Excel統計工作表在隨機模擬中是應用,MATLAB統計軟件包對數據進行統 計檢驗和統計分析;具備初步的運用計算機完成數據處理的技能,使課堂中學習到理 論得到應用。1 .數據整理:收集數據,錄入數據,畫出相應圖形;建立數學模型,數

2、據的輸入 與整理,各種數據的圖形顯示。2 .假設檢驗:MATLAB繪制出直力圖,做數據分布的推測;參數估計,假設檢 驗,繪制概率密度圖。3 .單因素、多因素方差分析:正態總體的方差分析問題;MATLAB統計軟件中關于方差分析的相關命令,做出方差分析表,box圖,能對結果進行簡單分析。4 . F、多元線性回歸模型:回歸系數的估計與檢驗,數據散點與回歸宜線的圖 示,殘差圖。運用MATLAB統計軟件,對給定的數據擬合回歸方程。工作計劃與進度安排:周三12節:選題,設計解決問題方法周三38節:調試程序周四14節:完成論文,答辯指導教師:2012年6月28日專業負責人:2012年7月8日學院教學副院長:

3、2012年7月19日數理統計是具有廣泛應用的數學分支,而區間估計和假設檢驗問題在其中占 有很重要的地位。對于正態總體期望和方差的區間估計和假設檢驗問題已有完備 的結論;對于非正態總體期望和方差的區間估計和假設檢驗問題,在大樣本的情況下,可利用中心極限定理轉化為正態總體來解決。但實際問題中常常碰到非正態總體,而且是小樣本的情況,因此對它的區間估計和假設檢驗是一個值得研究 的問題。本文利用概率綸與數理統計中的所學的回歸分析知識, 對小樣本常用小樣本 常用分布參數置信區間和線性相關的顯著性檢驗,相關系數的顯著性檢驗,預測與監控,進行了深入研究,提出了小樣本常用分布參數的置信區間與線性相關 的顯著性檢

4、驗,相關系數的顯著性檢驗,預測與監控,的解決方法。本文利用小樣本情形的統計量法解決離散型的 0-1分布、二項分布以及連續 型的指數分布參數的置信區間與線性相關的顯著性檢驗,相關系數的顯著性檢 驗,對于泊松分布的參數的置信區間與線性相關的顯著性檢驗,相關系數的顯著性檢驗則采用數學方法進行分析。 對于均勻分布,利用兩個參數的最大似然估計 求出聯合概率密度進行求解。關鍵詞:方差分析;置信區間;線性相關;預測與監控不得用于商業用途1設計目的 42設計問題 43設計原理 43.1 模型回歸系數的估計 53.2 回歸方程顯著性檢驗 63.3 回歸系數的置信區間 73.4 利用模型預測 74方法實現 84.

5、1 輸入數據,觀察線性關系 84.2 作回歸分析與檢驗 84.3 殘差分析 94.4 點預測及作圖 104.5 對含碳量X=0.15%1行預測 114.6 下面用Excel ”分析工具庫”提供的“回歸”工具,找出線性回歸方程,并檢驗其顯著性 115.設計總結 15參考文獻 15致 1 161設計目的了解一元回歸方程,回歸系數的檢驗方法及應用一元回歸方程進行預測的方 法;學會應用MATLA歆件進行一元回歸實驗的分析方法。同時更好的了解概率 論與數理統計的知識,熟練掌握概率論與數理統計在實際問題上的應用,并將所學的知識結合Excel對數據的處理解決實際問題。本設計是利用一元線性回歸理 論對合金鋼的

6、抗拉強度與鋼中的碳含量的關系建立數學模型,并用Excel分析工具庫中的回歸分析軟件進行解算。2設計問題某種合金鋼的抗拉強度 Y(N/mm 2)與鋼中含碳量X (%)有關,測得實驗數據如下:乙V、y、0.054080.134560.074170.144510.084190.164890.094280.185000.104020.205500.114360.225580.124480.246601.檢驗合金鋼的抗拉強度 Y(N/mm 2)與鋼中含碳量X (%)之間是否存在顯著的線性相關關系;如果存在,求 Y關于X的線性回歸方程。2.設含碳量X=0.15%,求抗拉強度Y的置信水平為0.95的預測區間

7、3設計原理在實際問題中,經常會出現兩個變量之間的相關關系不是線性的(即直線型),而是非線性的(即曲線型)。設其中有兩個變量x與y ,我們可以用一個確定函數關系式:y = u(x)大致的描述y與x之間的相關關系,函數u(x)稱為y關于x的回歸函數,方程y = u(x)成為y關于x的回歸方程。一元線性回歸處理的是兩個變量 x與y之間的線性關系,可以設想 y的值由兩部分構成:一部分由自變量 x的線性影響所致,表示 x的線性函數 a + bx ;另一部分則由眾多其他因素,包括隨機因素的影響所致,這一部 分可以視為隨機誤差項,記為8。可得一元線性回歸模型:y = a bx (i)式中,自變量x是可以控制

8、的隨機變量,成為回歸變量;固定的未知參數a,b成為回歸系數;y稱為響應變量或因變量。由于*是隨機誤差,根據中心極限2 -2定理,通常假定& N(0,。),仃 是未知參數。確定y與x之間的關系前,可根據專業知識或散點圖,選擇適當的曲線回歸方程,而這些方程往往可以化為線性方程或者就是線性方程,因此我們可以用線性方程:y = a * bx大致描述變量y與x之間的關系;3.1 模型回歸系數的估計為了估計回歸系數,假定試驗得到兩個變量x 與y 的n個數據對儀,yi )i =1,2,3n,我們將這n對觀測值代入式(1),得:yi 二 a bxi n,i = 1,2,3, n這里a,名2,加互獨立的

9、隨機變量,均服從正態分布,即N(0,二2), i = 1,2,3, n回歸系數估計的方法有多種,其中使用最廣泛的是最小二乘法,即要求選 取的a , b ,的值使得述隨機誤差&的平方和達到最小,即求使得函數2nn-2Qa, b)二1 i = yi - a - bxii已i W取得最小值的a , b。由于Q(a, b)是a , b的二元函數, 利用微積分中的函數存在極值的必要 條件,分別對Q(a, b)求a , b偏導數,并令其為0,構成二元一次方程組:n( £ (yi - a - bxi)= 0, i =0i =0J Z (yi - a - bxi )xi = 0 , i 1化

10、簡后得到如下正規方程組:na C Xi )b =、yx,i 1i 1na,i 1nXi )aci 12Xi )b=1";"n, Xi yi 一 " Xi % yi22n% Xi 一(" Xi )解方程組得到總體參數a, b估計量:這里,Xi和yi(i = 1,2n)均已有的觀測數據。由此得到回歸方程:y? = a bX帶入觀測Xi,得到值yi稱為回歸預測值。方程的直線稱為回歸直線。3.2 回歸方程顯著性檢驗建立一元線性回歸方程當且僅當變量之間存在線性相關關系時才是有意義的,因此必須對變量之間的線性相關的顯著性進行檢驗,即對建立的回歸模型進行顯著性檢驗。我

11、們首先引入幾個概念:n(1) S' = £ (yi -y)2,稱為S6總偏差平方和,它表示觀測值yi總的 i 1 分散程度;n(2) SSr =£(Wi -y)2,稱SSr為回歸平方和,它是由回歸變量 X的變 i 1化引起的,放映了回歸變量X對變量y線性關系的密切程度;n(3) SSE = £ (yi -胡)2 ,稱SSe為殘差(剩余)平方和,它是由觀測誤 i 1差等其他因素起誤差,它的值越小說明回歸方程與原數據擬合越好。可以證明下列關系成立SST = ss R ss ennn%(yi-y)2八(y?-y)2+ '、(yi-y?)2i 1i 1i

12、1我們主要考慮回歸平方和在總偏差和中所占的比重,記R2 = SSRo (0<=R<=1S1),稱R為復相關系數,用R的大小來評價模型的有效性,R越大,則反映回歸變 量與相應變量之間的線性函數關系越密切。引入F統計量。定義F = SS一 ,可知FF (1, n-2).對于給定的顯著水平a(一般這里 SSE(n - 2)取0.05或0.01),查表可得臨界值Fa (1,n-2 )如果F> Fa (1,n-2 ),則認為y與x之間的線性關系顯著;如果 F<= Fa (1,n-2 ),則認為y與x之間的線性關系不顯著,或者不存在線性關系,在實際 應用中也可以通過F對應的概率Ps

13、來說明y與x之間的線性相關性顯著。3.3 回歸系數的置信區間A A回歸方程(1)的回歸系統a, b是一個點估計值,給定置信水平1-0(后,可 得到他們對應的置信區間,并且回歸區間越短越好,如果摸個回歸系數的置信區 間包含0點,則說明該回歸變量的影響不顯著, 需要進一步地修改回歸方程,盡 量是每個回歸系數的置信區間都不包含 0點。3.4 利用模型預測在對所建立的回歸模型進行相關程度檢驗與分析之后, 如果預測變量y與相關變量x的每一個給定值x0 ,帶入回歸模型,就可以求得一個相對應的回歸預 A A測值y, ya稱為模型的點估計值。4方法實現4.1 輸入數據,觀察線性關系在命令窗口輸入:y=408

14、417 419 428 420 436 448 456 451 489 500 550 558 600 x=0.05 0.07 0.08 0.09 0.10 0.11 0.12 0.13 0.14 0.16 0.18 0.20 0.22 0.24 plot(x,y, '*')生成圖(1),可以看出x和y大體成線性關系。圖(1)散點圖(橫軸:X縱軸:Y)4.2 作回歸分析與檢驗在命令窗口輸入:n=length(y);x=ones(n,1),x'b,bint,r,rint,s=regress(y',x); b,bint,s輸出:b =1.0e+003 *0.3328

15、1.0165 bint =1.0e+003 *0.30950.35610.85681.17610.9413 192.47450.0000 234.8459這個結果可整理成如表(1)的形式。表(1) MATLAB回歸分析結果表回歸系數回歸系數估計值回歸系數置信區問B 0332.8309.5,356.1B 11.01650.8568,1.1761r2=0.9413 F=192.4745 p<234.8459一元回歸方程為:y =332.8 1.0165x從幾個方面都可以檢驗模型是有效的,所以X與Y的相關性顯著。4.3 殘差分析殘差及其置信區間作圖代碼輸入:rcoplot(r,rint)結果如

16、圖(2)所示:僅供個人參考圖(3)點預測不得用于商業用途Residual Case Order Plot468101214Case Number54m-21. 1-2-3-4-58-Enlp而2H圖(2)殘差圖(橫軸:鋼中含碳量縱軸:殘差分析值)所謂殘差是指實際觀察值與回歸估計值的差,殘差分析就是通過殘差所 提供的信息,分析出數據的可靠性、周期性或其它干擾。從殘差圖可以看出, 數據的殘差離零點較近,且殘差的置信區間均包含零點,這說明回歸模型 y = 332.8 +1.0165x能很好的符合原始數據4.4 點預測及作圖在命令窗口輸入:Z=b(1)+b(2)*xplot(x,y, 'k+&

17、#39; ,x,Z,'r')輸出:如圖(3)僅供個人參考4.5 對含碳量X=0.15%S行預測在命令窗口輸入:y=408 417 419 428 420 436 448 456 451 489 500 550 558 600;x=0.05 0.07 0.08 0.09 0.10 0.11 0.12 0.13 0.14 0.16 0.18 0.20 0.220.24;polytool(x,y,1,0.05)輸出:如圖(4)圖(4)散點圖及擬合曲線如圖所示,紅線表示為數據離合區間,藍色“+”表示為數據散點分布,綠色表示為擬合曲線。在含碳量 X=0.15%,抗拉強度Y的置信水平為0.

18、95的預測區間 514.763,445.5662。4.6 下面用Excel ”分析工具庫”提供的“回歸”工具,找出線性 回歸方程,并檢驗其顯著性具體步驟如下:1在【數據】菜單中選中【數據分析】,則會彈出【數據分析】對話框,然 后“分析工具”中選擇“回歸”選項,如圖(5)所示。單擊【確定】后,則彈 出【回歸】對話框,如圖(6)所示。2填寫【回歸】對話框。如圖(6)所示,該對話框的內容較多,可以根據 需要,選擇相關項目。在“ X值輸入區域”內輸入隊因變量數據區域的引用,該 區域必須有單列數據組成,如本題中組分 B;在“Y只輸入區域”輸入對自變量數據區域的引用,如本題中組分 A。“標志”:如果輸入區

19、域的第一行中包含標 志項,則選中此復選框,本題中的輸入區域包含標志項; 如果在輸入區域中沒有 標志項,則應清楚此復選框,Excel將在輸出表中生成合適的數據標志。“置信度”: 如果需要在匯總輸出表中包含附件的置信度信息,則選中此復選框,然后在右側的編輯框中,輸入所要使用的置信度。Excel默認的置信度為95%,相當于顯著性水平 a=0.05。“常數為 零”:如果要強制回歸線通過原點,則選中此復選框。“輸出選項”:選擇“輸 出區域”,在此輸出對輸出表左上角單元格的引用。3>“殘差”:如果需要以殘差輸出表形式查看殘差,則選中此復選框。“標準殘差”:如果需要在殘差輸出表中包含標準殘差, 則選中

20、此復選框。“殘差圖” 如果需要生成一張圖表,繪制每個自變量及其殘差,則選中此復選框。“線性擬合圖”:如果需要為預測值和觀察值生成和觀測值生車一個圖表,則選中此復 選框。“正態概率圖”:如果需要繪制正態概率圖,則選中此復選框。圖(5) Excel數據分析工具圖(6)回歸分析工具界面不得用于商業用途僅供個人參考不得用于商業用途回歸分析工具運行結果:表SUMMARY OUTPUT回歸統計 Multiple 0.944845 R Square 0.392733 Adjusted 0. 882981 標準誤差0. 01S729 觀海值13表中,“Multiple R”是線性回歸的系數“R Square&

21、#39;是擬合系數“AdjustedR Square調整后的擬合系數。表(3)方差分析.方差分析 _Idf £S MSF 犯F歸差計回殘總1 0.032111 0.032111 91.54752 1. 15E-0611 0.003858 0.00035112 0.035969表(4)回歸分析結果C-ffician-標彳隹誤差 t Stat F-valn Lty&t 95%U口口er限 95.8上限 95. 0%Intercept -0. 20282 0. 036363 -5. 57755 0. 000166 -0. 28285 -0. 12278 -0. 28285 -0.

22、1227S 408 0.000718 7. 51E-05 9. 568047 1. 15E-06 0. 000553 0. 0008S4 0. 000553 0. 0008S4表(5)回歸分析結果殘差與標準殘差RESIDUALOUTPUT觀測值預測0. 05殘差標準殘差10. 096726-0. 02673-1.4904720. 09S163-0. 01816-1.012930. 104627-0. 01463-0. 8157640. 0988810,0011190. 06241450.110374-0. 00037-0. 0208660.1189940.0010060. 05610270.

23、1247410.0052590. 29330880. 1211490,0188511.05129790, 1484450.0115550. 644383100.1563470. 0236531.319096110.1922630. 0077370. 431458120.198010. 021991.226352130. 2712790. 03128-1.74442408 Residual Pilot0 05 n-0.05408圖(7)用Excel處理數據得出的殘差分布圖圖(8)用Excel處理數據得出線性擬合圖根據運行結果分析:由表3所知,若保留四位有效數字,該回歸方程的截距是332.8,斜率

24、為1.0165,所以回歸方程白表達式為:y = 332.8+1.0165X ;根據回歸統計結果,知 決定系數x=0.9409,即相關系數r=0.970 ,說明自變量與因變量之間有較高的相 關性;根據方差分析的結果,F=91.5475,有效的F<0.01,所以建立的回歸方程 非常顯著。在表五中,除了列出了回歸系數,還有標準誤差等項目。其中“標準誤差” 表示的事對應回歸系數的標準誤差,其中偏回歸系數的標準誤差。"t Stat ”就是t檢驗時的統計量t;如果多元線性回歸,則可直接根據“ t Stat ”的大小, 判斷因素的主次順序。“P-value ”表示t檢驗偏回歸系數不顯著的概率,如果 P-value<0.01 ,則可認為該系數對應的變量對試驗結果影響非常顯著,如果 0.01< P-value <0.05,則可認為該系數對應的變量對試驗結果影響顯著;對于常 數項,P-value則表示常數項為零的幾率。5.設計總結通過對概率論與數理統計的這道實際問題的解決,不僅使我更加深刻的理解了概率論與數理統計的基礎知識,而且使我對這些知識在實際中的應用產生了濃 厚的興趣,同時對我學習好概率論與數理統計這門課有

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論