統計學相關與回歸分析法_第1頁
統計學相關與回歸分析法_第2頁
統計學相關與回歸分析法_第3頁
統計學相關與回歸分析法_第4頁
統計學相關與回歸分析法_第5頁
已閱讀5頁,還剩45頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第九章第九章 相關與回歸分析法相關與回歸分析法第九章第九章 相關與回歸分析相關與回歸分析法法第一節第一節 相關與回歸分析概述相關與回歸分析概述相關和回歸分析是研究事物的相互關系、相關和回歸分析是研究事物的相互關系、測定它們聯系的緊密程度、揭示其變化的測定它們聯系的緊密程度、揭示其變化的具體形式和規律性的統計方法,是構造各具體形式和規律性的統計方法,是構造各種經濟模型、進行結構分析、政策評價、種經濟模型、進行結構分析、政策評價、預測和控制的重要工具。預測和控制的重要工具。 一種商品的銷售收入與其銷售量:一種商品的銷售收入與其銷售量: 銷售收入銷售收入=銷售量銷售量 商品價格商品價格PQG 家庭收

2、入與恩格爾系數:家庭收入與恩格爾系數: 家庭收入高,則恩格爾系數低。家庭收入高,則恩格爾系數低。相關關系相關關系一、相關關系與相關分析現象之間的相互聯系,在許多情況下表現現象之間的相互聯系,在許多情況下表現為一定的因果關系,將這些現象數量化則為一定的因果關系,將這些現象數量化則成為變量:成為變量:自變量自變量X因因變量變量Y4.按涉及變量的多少分為按涉及變量的多少分為按相關的形式不同分為按相關的形式不同分為按相關的方向不同分為按相關的方向不同分為直線相關直線相關曲線相關曲線相關負相關負相關正相關正相關按相關的程度不同分為按相關的程度不同分為完全相關完全相關不完全相關不完全相關不相關不相關復相關

3、復相關單相關單相關相關分析相關分析回歸分析回歸分析二、回歸與回歸分析按回歸方程的形式分為按回歸方程的形式分為直線回歸直線回歸曲線回歸曲線回歸按自變量的個數分為按自變量的個數分為復回歸復回歸簡單回歸簡單回歸q有共同的研究對象:現象之間的相關關系;有共同的研究對象:現象之間的相關關系;q互相補充:互相補充:相關分析要依靠回歸分析表明現相關分析要依靠回歸分析表明現象數量相關的具體形式;而回歸分析要依靠相象數量相關的具體形式;而回歸分析要依靠相關分析來表明現象數量的相關程度。只有變量關分析來表明現象數量的相關程度。只有變量之間存在著高度相關時,進行回歸分析尋求其之間存在著高度相關時,進行回歸分析尋求其

4、相關的具體形式才有意義。相關的具體形式才有意義。三、相關分析與回歸分析的關系q相關分析不必確定自變量和因變量,所涉相關分析不必確定自變量和因變量,所涉及的都是隨機變量;回歸分析事先要確定自及的都是隨機變量;回歸分析事先要確定自變量和因變量,只有因變量為隨機變量。變量和因變量,只有因變量為隨機變量。q內容上:相關分析研究相關的方向和程度,內容上:相關分析研究相關的方向和程度,不能指出相關的具體形式,無法從一個變量不能指出相關的具體形式,無法從一個變量的變化推測另一個變量的變化;而回歸分析的變化推測另一個變量的變化;而回歸分析研究變量之間相互關系的具體形式,可根據研究變量之間相互關系的具體形式,可

5、根據回歸模型從已知量估計和預測未知量。回歸模型從已知量估計和預測未知量。q方法上:相關分析通過編制相關表、繪制方法上:相關分析通過編制相關表、繪制相關圖、計算相關系數;回歸分析通過建立相關圖、計算相關系數;回歸分析通過建立回歸模型。回歸模型。定性分析定性分析定量分析定量分析第二節第二節 簡單線性相關分析簡單線性相關分析企業編號企業編號月產量(千噸)月產量(千噸)X生產費用(萬元)生產費用(萬元)Y123456781.22.03.13.85.06.17.28.0628680110115132135160八個同類工業企業的月產量與生產費用八個同類工業企業的月產量與生產費用平均每晝平均每晝夜產量夜產

6、量 固定資產原值固定資產原值35404045455050555560606565706006501 15506001235005502134505001517400450224350400030035022223543120(百萬元)(百萬元)(噸)(噸)YfXf20個同類工業企業固定資產原值與平均每晝夜產量個同類工業企業固定資產原值與平均每晝夜產量正正 相相 關關負負 相相 關關曲線相關曲線相關不不 相相 關關xyxyxyxy又稱又稱,用直角坐標系的,用直角坐標系的x軸代表自變量,軸代表自變量,y軸代表因變量,將兩個變量間相對應的變量軸代表因變量,將兩個變量間相對應的變量值用坐標點的形式描繪

7、出來,用以表明相關值用坐標點的形式描繪出來,用以表明相關點分布狀況的圖形。點分布狀況的圖形。在在的條件下,用以反映的條件下,用以反映兩變量兩變量間間密切程度的統計指標,用密切程度的統計指標,用r表示表示)(22222積差法yyxxyyxxnyynxxnyyxxryxxy xyLyxnxyyyxx1)(令xxLxnxxx222)(1)(yyLynyyy222)(1)(yyxxxyLLLr:則 2222)()(yynxxnyxxynryxnynxnxyyxyxxy相關系數相關系數r r的取值范圍:的取值范圍:r0 為正相關,為正相關,r 0 為負相關為負相關;|r|=0 表示不存在表示不存在關系;

8、關系;|r|1 表示表示完全完全相關相關; |r| 0.3 為微弱相關為微弱相關(基本無關基本無關); 0.3 |r| 0.5為低度相關;為低度相關; 0.5 |r| 0.8為顯著相關為顯著相關(中度相關中度相關) ; 0.8 |r| 1.0為高度為高度相關相關(強相關強相關) 。相關系數的取值及其意義圖示序號序號能源消耗量能源消耗量(十萬噸(十萬噸)x工業總產值工業總產值(億元)(億元)yx2y2xy1234567891011121314151635384042495254596264656869717276242524283231374041404750495148581225144416

9、001764240127042916348138444096422546244761504151845776576625576784102496113691600168116002209250024012601230433648409509601176156816121998236025422560305534003381362134564408合計合計916625550862617537887能 源 消 耗 量807060504030工業總產值6050403020()9757. 0=625-2617516916-5508616625916-3788716=)(-=26175=,55086=,

10、37887=,625=,916=,16=22222222yynxxnyxxynryxxyyxn解:已知結論:結論:工業總產值與能源消耗量之間存工業總產值與能源消耗量之間存在高度的正相關關系。在高度的正相關關系。回歸分析回歸分析指根據變量之間相關關系的指根據變量之間相關關系的具體形態,建立一個數學方具體形態,建立一個數學方程(回歸方程)來描述變量程(回歸方程)來描述變量之間關系;對給定的之間關系;對給定的自變量自變量x x,揭示,揭示因變量因變量y y在數量上的在數量上的平均變化并求得因變量的預平均變化并求得因變量的預測值的統計分析方法。測值的統計分析方法。第三節第三節 簡單線性回歸分析簡單線性

11、回歸分析XY為隨機誤差項為模型參數,與式中:XYEY)(YEXXY截距截距斜率斜率一元線性回歸方程的可能形態一元線性回歸方程的可能形態 為正為正 為負為負 為為0XYEYbxay以樣本統計量估計總體參數以樣本統計量估計總體參數斜率(回歸系數)斜率(回歸系數)截距截距截距截距a 表示在自變量表示在自變量x為為0時,其它各種因素時,其它各種因素對因變量對因變量y的平均影響;的平均影響;回歸系數回歸系數b 表明自變表明自變量量x每變動一個單位,因變量每變動一個單位,因變量y平均變動平均變動b個個單位。單位。iiiiiybxayyyxbxay)(值應為的實際而變量之間的平均變動關系,變量與是理論模型,

12、表明10名學生的身高與體重散點圖10名學生的身高與體重散點圖40404545505055556060656570707575158158163163168168173173178178身高(X )身高(X )體重(Y )體重(Y )bxayxbay殘差:殘差:ebxay最小平方法最小平方法基本數學要求:基本數學要求:min)(02yyyy02012min,min) (22xbxaybxaybabxayyy,有求偏導數,并令其為零、分別對函數中,有由2xbxaxyxbnayxbynxbnyayxxyLLxxnyxxynbxxxxy222)(9757. 0=r,55086,37887,625,91

13、6,162xxyyxn由計算表知bxay5142. 6169167961. 0166257961. 091655086166259163788716222 xbyaxxnyxxynbxy7961.05142.60 xbxayyxxy7961.05142.6對于若若 x = 80(十萬噸),則:(十萬噸),則:億元1738.57807961. 05142. 6y r0 r0 r=0b0 b0 b=0 xyyxrbbr;10名學生的身高與體重散點圖10名學生的身高與體重散點圖40404545505055556060656570707575158158 160160 162162 164164 16

14、6166 168168 170170 172172 174174 176176 178178身高(X )身高(X )體重(Y )體重(Y )yy yy yyyy2)(yySST2) (yySSE2) (yySSR誤差平方和誤差平方和回歸回歸平方和平方和總離差平方和總離差平方和) ()(yyyyyy22) ()()(yyyyyy) )(2) ()(22yyyyyyyy0)() )(exbxebexbabxayyyy222) ()()(yyyyyyQyyUyyLyyyy222) (,)(,)(令QULyy:則總離差平方和的分解:總離差平方和的分解:222)/()(nynyyyLSSTyy xyyy

15、yybLLULbxayQSSE2)()()()()() ()(2222222xxnnyxxynbLLLLbxxbxbabxayyUSSRxyxxxxxy102 r判定系數取值范圍:判定系數取值范圍:222)()(yyyyLUryy判定系數是評價回歸方程擬合優度的指判定系數是評價回歸方程擬合優度的指標,可以說明回歸方程的代表性大小。標,可以說明回歸方程的代表性大小。判定系數與相關系數的關系判定系數與相關系數的關系2)(rbr的符號22)(yyxxxyyyxyxxxyyyxyyyLLLLLLLLbLLUr無方向性,無方向性,則有方向,則有方向,其方向與樣本回歸系數其方向與樣本回歸系數 b 相同;相

16、同;說明變量值的總離差平方和中說明變量值的總離差平方和中可以用回歸線來解釋的比例,主要用于評可以用回歸線來解釋的比例,主要用于評價回歸方程的擬合優度;價回歸方程的擬合優度;只說明只說明兩變量間關聯程度及方向,主要用于評價兩變量間關聯程度及方向,主要用于評價兩變量間線性關系的密切程度。兩變量間線性關系的密切程度。是因變量各實際值與其估計值之間的是因變量各實際值與其估計值之間的平均差異程度,表明其估計值對各實平均差異程度,表明其估計值對各實際值代表性的強弱;其值越小,回歸際值代表性的強弱;其值越小,回歸方程的代表性越強,用回歸方程估計方程的代表性越強,用回歸方程估計或預測的結果越準確。或預測的結果

17、越準確。22) (22nxybyaynyySe億元,且知解:已知457.227961.0,5142.626175,37887,625,1622nxybyaySbayxyynenxybyaynyySe22) (222)() (11yyyyLQLUryyyy2221yeSSr2) (2nyy1)(2nyy1、在因變量的總離差平方和中,如果回歸、在因變量的總離差平方和中,如果回歸平方和所占比重大,剩余平方和所占比平方和所占比重大,剩余平方和所占比重小,則兩變量之間(重小,則兩變量之間( )A. 相關程度高相關程度高B. 相關程度低相關程度低C. 完全相關完全相關D. 完全不相關完全不相關課堂練習題:1、某商業企業、某商業企業20002004年五年內商品銷售額的年五年內商

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論