6回歸分析教程課件_第1頁
6回歸分析教程課件_第2頁
6回歸分析教程課件_第3頁
6回歸分析教程課件_第4頁
6回歸分析教程課件_第5頁
已閱讀5頁,還剩44頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第六章 回 歸 分 析 教學目的和要求: 通過本章內容的教學,使學生掌握一元線性回歸方程的求法、回歸方程的方差分析與顯著性檢驗方法;了解一元非線性回歸方程的求解思路及回歸曲線方程的效果與精度;了解多元線性回歸方程的求法和顯著性檢驗與精度。 主要內容: 1.回歸分析的基本概念:概念、回歸分析的主要內容。 2.一元線性回歸:一元線性回歸方程的求法、回歸方程的方差分析與顯著性檢驗、重復試驗情況、回歸直線的簡便求法。 3.一元非線性回歸:回歸曲線類型的選取和檢驗、化非線性回歸為線性回歸、回歸曲線方程的效果與精度。 4.多元線性回歸:二元線性回歸方程的求法、多元線性回歸、多元線性回歸的顯著性檢驗與精度。

2、 6.1基本概念 變量間的關系可分為函數關系和相關關系。 變量間的函數關系 1、是一一對應的確定關系2、設有兩個變量x和y,變量y隨變量x一起變化,并完全依賴于x,當變量x為某個數值時,y依確定的關系取相應的值,則稱y是x的函數,記為y=f(x,y),其中x稱為自變量,稱y為因變量如以速度v作勻速運動的物體,走過的距離s與時間t之間,有如下的函數關系 s=vt 變量間的相關關系 1、變量間關系不能用函數關系精確表達3、當變量x取某個數值時,變量y的值可能有幾個2、一個變量的取值不能由另一個變量唯一確定如人的身高( )與體重( )之間的關系 什么是回歸分析?3、因素分析,如從對共同影響一個變量的

3、許多變量(因素)中,找出重要因素和次要因素一種處理變量間相關關系的數理統計方法。它主要解決以下幾個問題1、從一組樣本數據出發,確定變量之間的數學關系式 2、對這些關系式的可信程度進行各種統計檢驗7 回歸模型的類型回歸模型一元回歸線性 回歸非線性 回歸線性 回歸非線性 回歸多元回歸一個自變量兩個及兩個以上自變量6.2 一元線性回歸6.2.1 一元線性回歸方程一元線性回歸模型概念1、當只涉及一個自變量時稱為一元回歸,若因變量y與自變量x之間為線性關系時稱為一元線性回歸3、描述因變量y如何依賴于自變量x和誤差項的方程稱為回歸模型。2、對于具有線性關系的兩個變量,可以用一個線性方程來表示它們之間的關系

4、由實驗獲得兩個變量x和y的一組樣本數據, ,構造如下一元線性回歸模型 一元線性回歸模型概念 模型中,y是x的線性函數部分加上誤差項線性部分反映了由于x的變化而引起y的變化 誤差項i是隨機變量 反映了除x和y之間的線性關系之外的隨機因素對y的影響0和稱為模型的參數1、誤差項i是一個期望值為的隨機變量,即。對于一個給定的值,的期望值為2、變量是可以精確測量或嚴格控制的變量3、誤差項是一個服從正態分布的隨機變量,且相互獨立。即獨立性意味著對于一個特定的值,它所對應的與其它值所對應的不相關對于一個特定的值,它所對應的值與其它值所對應的不相關一元線性回歸模型基本假定 b0和b是未知的,必須利用樣本數據去

5、估計它們 設b0和b分別是參數0和的最小二乘估計,于是就得到了一元線性回歸方程b0和b 回歸方程的回歸系數回歸方程回歸系數b0和b的求解假定測得值yt精度相等,則b0和b的計算公式計算式如 (6-7)(6-13)6.2.2 回歸方程的穩定性回歸方程的穩定性是指回歸值 的波動大小,用 的標準差 來表示最小二乘估計量的精度b0與b的協方差于是測量數據y的殘余標準差因此6.2.3 回歸方程的方差分析要解決的問題對N個觀測值與其算術平均值之差的平方和進行分解,將N個觀測值的影響因素從數量上區別開,以便能用F檢驗法對回歸方程進行顯著性檢驗。 測量值 之間的差異(變差)來源于兩個方面1.由于自變量x取值的

6、不同造成的 2.除x以外的其它因素(如x對y的非線性影響、測量誤差等)的影響 N個觀測值之間的變差,用觀測值與其均值的離差平方和來表示,稱為總的離差平方和。總的離差平方和第t個測量值測量值的平均值 自變量 x 取值不同造成因變量 y 的變化 除x以外的其它因素因素的影響等于0估計值U 回歸平方和Q 剩余平方和S(S的自由度)- N-1U(U的自由度)- 1Q(Q的自由度)- N-2測量點數- N:6.2.4 回歸方程顯著性檢驗要解決的問題所求的回歸方程是否基本上符合y與x之間的客觀規律。采用F檢驗法一個回歸方程是否顯著,也就是y與x的線性關系是否密切。顯著性 - (統計量) FF分布U大Q小(

7、比值大):F大 - y 與x 的線性關系密切 對于一元線性回歸隨機誤差的分布形式- Fa (U, vQ )F大于Fa ( v1, v2 )的概率為a顯著水平:a 0.01、 a 0.05、 a 0.1F =F0.01 (U, vQ )高度顯著F0.05 (U, vQ ) =F F0.01 (U, vQ )顯著(0.05水平上)F F0.1 (U, vQ )不顯著F0.1 (U, vQ ) =F F0.05 (U, vQ )顯著(0.1水平上)6.2.5 方差殘余方差當x固定時,衡量y隨機波動大小的一個估計量當回歸方程穩定性較好時,可作為應用回歸方程時的精度參數。方差分析表6.2.6 重復試驗情

8、況問題: 在上述意義下的回歸方程顯著,并不一定表明這個回歸方程擬合得很好原因: Q中除包含試驗誤差外,還包含了x和y線性關系以外得其它未加控制得因素得影響。辦法: 為了檢驗一個回歸方程擬合得好壞,需進行重復試驗。從而獲得誤差平方和QE和失擬平方和QL,然后進行F檢驗。N個試驗點,每個試驗點都重復m次試驗例63 結論如果F1檢驗結果不顯著,說明非線性誤差(相對于試驗誤差)很小。于是,把QL與QE合并,對U進行F檢驗,即如果F2檢驗結果顯著,說明一元回歸方程擬合很好如果F1檢驗結果顯著,說明非線性誤差(相對于試驗誤差)是不可忽略的。此時用QE對U進行F檢驗,即結果顯著,再用Q進行第二次F檢驗結果也

9、顯著。說明試驗誤差和殘差都很小。重復試驗的用途:可將誤差平方和與失擬平方和從殘差平方和中分離出來;進一步可將系統誤差與隨機誤差分離出來。6.2.7 回歸直線的簡便求法一、分組法(平均值法)二、圖解法(緊繩法)6.3 一元非線性回歸步驟確定函數類型;把曲線回歸轉為為直線回歸或多項式回歸,確定未知參數6.3.1 回歸曲線函數類型的選取1. 直接判斷法根據專業知識,從理論上推導或根據以往的經驗,確定出兩個變量之間的函數類型2. 觀察法將觀測數據作圖,將其與典型曲線比較,確定其屬于何種曲線類型6.3.2 回歸曲線函數類型的檢驗1. 直線檢驗法適用條件: 當函數類型中所含參數不多,如只有一個或兩個時步驟

10、:將所選的回歸曲線 f(x,y,a,b)0 寫成 Z1A十BZ2Z1和Z2是只含一個變量(x或y)的函數A和B是a和b的函數選幾對相距較遠的x、y值,求出相對應的Z1和Z2的值; 以Z1和Z2為變量畫圖,若所得圖形為一直線,則證明原先所選定的回歸曲線類型是合適的。2. 表差法適用條件: 若一組試驗數據可用一多項式表示,式中含有常數項多于兩個時,以決定多項式次數或檢驗次數。步驟: 用試驗數據畫圖 自圖上根據定差x,列出xi,yi各對應值 根據x和y的讀出值作出差值 根據表6-10確定的標準進行判斷例 檢驗表6-11所示觀測數據可用ya+bex表示。6.3.3 化曲線回歸為直線回歸問題條件 可用直線檢驗法或一階表差法檢驗的曲線回歸方程。 Z1A十BZ2將函數化為:例6.3.4 回歸曲線方程的效果與精度殘差為:相關指數6.4 多元線性回歸一、多元線性回歸方程假如因變量y與另外M個自變量xi的內在關系是線性的,測得N組觀測數據M+1個待估計參數N個獨立,服從正態分布N(0,)的隨機變量M個可精確測量或控制的變量設bi為i的最小二乘估計,則回歸方程為:相應的回歸方程為:二、多元線性回歸方程的顯著性與精度三、每個自變量在回歸方程中所起的作用偏回歸平方和:取消一個自變量xi后回歸平方和減小的數值Pi=U-U回歸系數C或L-1中的元素分析步驟:1) 凡是偏回歸平方和

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論