第七章相關與回歸分析_第1頁
第七章相關與回歸分析_第2頁
第七章相關與回歸分析_第3頁
第七章相關與回歸分析_第4頁
第七章相關與回歸分析_第5頁
已閱讀5頁,還剩84頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

統計學第一章總論第二章統計調查與統計整理第三章綜合指標第四章參數估計第五章假設檢驗第六章方差分析第七章相關與回歸第八章時間序列第九章指數統計分析第七章相關與回歸分析

【主要內容】一、相關和回歸分析的基本概念二、一元線性回歸分析三、多元線性回歸分析四、非線性回歸分析1、什么是相關?

2、什么是相關分析?

3、相關分析主要解決什么問題?

第一節相關分析的意義和任務

一、相關關系的概念(注意相關關系與函數關系的區別)

(一)函數關系

它反映著現象之間存在著嚴格的依存關系,也就是具有確定性的對應關系,這種關系可用一個數學表達式反映出來。第一節相關分析的意義和任務

一、相關關系的概念(注意相關關系與函數關系的區別)

例如某種商品的銷售額和銷售量之間,由于價格因素,所以兩者可表現為嚴格的依存關系。銷售額=銷售量×價格例:圓的面積與半徑的關系;計件工資總額與零件數量;看書時間和學習成績。出租汽車費用與行駛里程:總費用=行駛里程每公里單價函數關系確定性關系(二)相關關系

它反映著現象之間的數量上不嚴格的依存關系,也就是說兩者之間不具有確定性的對應關系,這種關系有二個明顯特點:1.現象之間確實存在數量上的依存關系,即某一社會經濟現象變化要引起另一社會經濟現象的變化;2.現象之間的這種依存關系是不嚴格的,即無法用數學公式表示。家庭收入與恩格爾系數:家庭收入高,則恩格爾系數低。相關關系非確定性關系商品價格和商品銷售量之間,存在著一定的依存關系,即商品價格發生變動,商品的銷售量也會隨之發生變動。

在具有相互依存關系的兩個變量中,作為根據的變量稱自變量,一般用X表示;發生對應變化的變量稱因變量,一般用y表示。例二、相關關系的種類

1.按相關關系涉及的因素多少來分,可分為:

單相關和復相關。

在實際工作中,如存在多個自變量,可抓住其中主要的自變量,研究其相關關系,而保持另一些因素不變,這時復相關可轉化為偏相關。二因素之間的相關關系稱單相關,即只涉及一個自變量和一個因變量。三個或三個以上因素的相關關系稱復相關,或多元相關,即涉及二個或二個以上的自變量和因變量。2.按相關關系的性質來分,可分為:

正相關和負相關正相關是指兩相關現象變化的方向是一致的。

負相關是指兩相關現象變化的方向是相反的。3.按相關關系的形式來分,可分為:

直線相關和曲線相關

直線相關是指兩個相關現象之間,當自變量X的數值發生變動時,因變量y隨之發生近似于固定比例的變動,在相關圖上的散點近似地表現為直線形式,因此稱其為直線相關關系。

曲線相關是指兩個相關現象之間,當自變量X的數值發生變動時,因變量y也隨之發生變動,但這種變動在數值上不成固定比例,在相關圖上的散點可表現為拋物線、指數曲線、雙曲線等形式,因此稱其為曲線相關關系。4.

按相關程度分,可分為:

完全相關、不完全相關和不相關

完全相關就是相關現象之間的關系是完全確定的關系,因而完全相關關系就是函數關系。

不相關是指兩現象之間在數量上的變化上各自獨立,互不影響。

不完全相關就是介于完全相關和不相關之間的一種相關關系。相關分析的對象主要是不完全相關關系。三、相關分析的任務和內容

相關分析的主要任務,概括起來是兩個方面:一方面,研究現象之間關系的密切程度,即相關分析;另一方面,研究自變量與因變量之間的變動關系,即回歸分析。相關分析的主要內容包括以下五個方面:1.判斷社會經濟現象之間是否存在相互依存的關系,是直線相關,還是曲線相關,這是相關分析的出發點;2.確定相關關系的密切程度;3.測定兩個變量之間的一般關系值;4.測定因變量估計值和實際值之間的差異,用以反映因變量估計值的可靠程度;5.相關系數的顯著性檢驗。四、相關分析和回歸分析

研究現象之間相關關系的兩種基本方法:相關分析,用一個指標來表明現象間相互依存關系的密切程度回歸分析,就是根據相關關系的具體形態,選擇一個合適的數學模型,來近似地表達變量間的平均變化關系。相關分析和回歸分析的區別

1兩者在關心變量性質上的不同。在回歸分析中,必須將變量分為自變量和因變量,以便建立回歸方程;也必須將變量分為確定性變量和隨機變量,以便研究隨機變量的分布以及對其進行統計推斷。區分變量的性質是回歸分析的前提條件,是回歸分析中首先要解決的一個問題。

相關分析中兩變量是對等的,都是隨機變量,不區分自變量和因變量.

2兩者的任務和目的不同。回歸分析是根據現象之間關系的特點,運用一定的辦法,建立最適合于變量之間關系的回歸方程,而且隨著變量的變換,回歸方程也會隨之改變,回歸方程是用來反映變量之間數量的平均變動關系,進而對因變量進行估算或預測。相關分析是通過計算相關指標,用來反映回歸方程所表明變量之間依存關系的密切程度,是不能進行估算和預測的。

3兩者的使用范圍不同。回歸分析只限于研究數量標志之間或指標之間的數量關系,對于品質標志之間和等級之間的關系在沒有數量化之前是無法研究的。相關分析研究范圍比回歸分析研究的范圍要廣泛得多。從研究的范圍來看,可以說,凡是能夠進行回歸分析的,都能夠也必須進行相關分析,而能夠進行相關分析的,卻不一定能夠或不都需要進行回歸分析,回歸分析總需要相關分析的幫助,而相關分析卻不一定需要回歸分析的幫助,相關分析具有獨立性。相關分析和回歸分析的聯系

相關分析需要回歸分析來表明現象數量關系的具體形式,而回歸分析是建立在相關分析的基礎上,需要依靠相關分析來表明現象數量變化的程度,只有當變量之間存在高度相關時,回歸分析才有意義。第二節簡單線性相關分析

一、相關表和相關圖相關圖,也稱散布圖(或散點圖)。相關表的種類定性分析依據研究者的理論知識和實踐經驗,對客觀現象之間是否存在相關關系,以及何種關系作出判斷。定量分析在定性分析的基礎上,通過編制相關表、繪制相關圖、計算相關系數與判定系數等方法,來判斷現象之間相關的方向、形態及密切程度。相關表和相關圖的作用:相關關系的測定相關表的編制1、編制相關表前首先要通過實際調查取得一系列成對的標志值資料作為相關分析的原始數據。2、相關表的分類:簡單相關表是資料未經分組的相關表,它是把因素標志值按照從小到大的順序并配合結果標志值一一對應而平行排列起來的統計表。分組相關表是在簡單相關表的基礎上,將原始數據進行分組而編成的統計表。①、單變量分組相關表自變量分組并計算次數,而對應的因變量不分組,只計算其平均值。單變量分組相關表的特點:使冗長的資料簡化,能夠更清晰地反映出兩變量之間相關關系。②、雙變量分組相關表:自變量和因變量都進行分組而制成的相關表,這種表形似棋盤,故又稱棋盤式相關表。相關圖的編制1、相關圖:利用直角坐標系第一象限,把自變量置于橫軸上,因變量置于縱軸上,而將兩變量相對應的變量值用坐標點形式描繪出來,用以表明相關點分布狀況的圖形。2、相關圖被形象地稱為相關散點圖3、因素標志分了組,結果標志表現為組平均數,所繪制的相關圖就是一條折線,這種折線又叫相關曲線。正相關負相關曲線相關不相關xyxyxyxy又稱散點圖,用直角坐標系的x軸代表自變量,y軸代表因變量,將兩個變量間相對應的變量值用坐標點的形式描繪出來,用以表明相關點分布狀況的圖形。相關圖某市1996年—2003年的工資性現金支出與城鎮儲蓄存款余額的資料,說明簡單相關表和相關圖的編制方法。從表可看出,隨著工資性現金支出的增加,城鎮儲蓄存款余額有明顯的增長趨勢。所以,資料表明(如圖)有明顯的直線相關趨勢。序號年份工資性

現金支出(萬元)x城鎮儲蓄存款余額(萬元)y119965001202199754014031998620150419997302005200090028062001970350720021050450820031170510例1簡單相關表企業按銷售額分組(萬元)流通費用率(%)4以下9.654~87.688~127.2512~167.0016~206.8620~246.7324~286.6428~326.6032~366.58例2分組相關表二、相關系數

相關系數是在直線相關條件下,表明兩個現象之間相關關系的方向和密切程度的綜合性指標。一般用符號r表示。r的測定方法:仍以上例1資料計算:序號年份x(萬元)y(萬元)11996500120-310-15596100240254805021997540140-270-13572900182253645031998620150-190-12536100156252375041999730200-80-75640056256000520009002809058100254506200197035016075256005625120007200210504502401755760030625420008200311705103602351296005522584600合計64802200--432400155000253300經過計算,表明該市工資性現金支出與城鎮儲蓄存款余額之間存在著高度正相關。對r的解釋如下:(即r的特點)(1)r取正值或負值決定于分子協方差;(2)r的絕對值,在0與1之間;(3)r的絕對值大小,可說明現象之間相關關系的緊密程度。積差法公式進一步化簡如下:2.簡捷法

資料計算如下:序號年份x(萬元)y(萬元)x2y2xy119965001202500001440060000219975401402916001960075000319986201503844002250093000419997302005329004000014600052000900280810000784002520006200197035094090012250033950072002105045011025002025004725008200311705101368900260100596700合計64802200568120076000020353003.從單變量分組表計算相關系數

三、簡單線性相關分析的特點

通過對r的計算方法的討論,可看出二個明顯特點:2.相關關系中只能計算出一個相關系數r。1.相關關系中,兩個變量不必定出哪個是自變量,哪個是因變量,因此,相關的兩個變量都是隨機變量;3、相關系數與判定系數在直線相關的條件下,用以反映兩變量間線性相關密切程度的統計指標,用r表示相關系數

r2

越接近于1,表明x與y之間的相關性越強;r2

越接近于0,表明兩個變量之間幾乎沒有直線相關關系.相關系數與判定系數是相關系數的平方,用r2表示;用來衡量回歸方程對y的解釋程度。判定系數取值范圍:判定系數第三節回歸分析

一、回歸分析的概念和種類二、一元線性回歸分析三、多元線性回歸分析四、非線性回歸分析一、回歸分析的概念和種類什么是回歸?什么是回歸分析?回歸分析的種類

1、回歸分析按變量的多少可分為:簡單回歸復回歸2、回歸分析按回歸的形式可分為:線性回歸:一元線性回歸多元線性回歸非線性回歸

(一)標準的一元線性回歸模型(二)一元線性回歸模型的估計(三)一元線性回歸模型的擬合優度(四)一元線性回歸模型的檢驗(五)一元線性回歸模型預測二、一元線性回歸分析

(一)標準的一元線性回歸模型1、回歸函數總體回歸函數

Yt=β0+β1Xt+ut

ut是隨機誤差項,又稱隨機干擾項,它是一個特殊的隨機變量,反映未列入方程式的其他各種因素對Y的影響。樣本回歸函數:

t=1,2,...n

et稱為殘差,在概念上,et與總體誤差項ut相互對應;n是樣本的容量。E(Yt)=β0+β1XtXYtY。。。。。ut

樣本回歸函數與總體回歸函數區別總體回歸線是未知的,只有一條。樣本回歸線是根據樣本數據擬合的,每抽取一組樣本,便可以擬合一條樣本回歸線。總體回歸函數中的β1和β2是未知的參數,表現為常數。而樣本回歸函數中的是隨機變量,其具體數值隨所抽取的樣本觀測值不同而變動。總體回歸函數中的ut是Yt與未知的總體回歸線之間的縱向距離,它是不可直接觀測的。而樣本回歸函數中的et是Yt與樣本回歸線之間的縱向距離,當根據樣本觀測值擬合出樣本回歸線之后,可以計算出et的具體數值。誤差項的標準假定假定1:誤差項的期望值為零:E(ut)=0。假定2:誤差項的方差為常數:Var(ut)=。假定3:誤差項之間不存在序列相關,協方差為零:

Cov(utus)=0(t≠s)。假定4:自變量是給定變量,與誤差項線性無關。假定5:隨機誤差項服從正態分布。滿足以上標準假定的一元線性回歸模型,稱為標準的一元線性回歸模型。(二)一元線性回歸模型的估計一元線性回歸方程的幾何意義截距斜率一元線性回歸方程的可能形態

1為正

1為負

1為0總體一元線性回歸方程:以樣本統計量估計總體參數斜率(回歸系數)截距截距表示在沒有自變量x的影響時,其它各種因素對因變量y的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論