第四講簡單線性相關與回歸_第1頁
第四講簡單線性相關與回歸_第2頁
第四講簡單線性相關與回歸_第3頁
第四講簡單線性相關與回歸_第4頁
第四講簡單線性相關與回歸_第5頁
已閱讀5頁,還剩23頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第四講簡單線性回歸本講主題簡單線性回歸模型TheSimpleLinearRegressionModel最小二乘法TheLeastSquaresMethod確定性系數TheCoefficientofDetermination模型假設及顯著性檢驗ModelAssumptionsandTestingforSignificance用于估計和預測UsingforestimationandPrediction殘差分析ResidualAnalysis現象之間的關系變量之間的關系函數關系:變量之間存在著確定的相互依存關系。當自變量取定一個值,因變量就有一個完全確定的量與之相對應。相關關系:變量之間存在著的數量上的不確定的依存關系。相關關系包括因果關系例:居民收入提高與銀行存款上升;工資增長與價格增長;父母身高與子女身高;哥哥身高與弟弟身高;電話設備投資額與新建筑數量;產量與單位成本;受教育年限與工資;某種商品的價格與銷售量。家庭收入與食物支出額相關關系的種類

簡單相關與復相關正相關與負相關線性相關與非線性相關完全相關,不完全相關,不相關相關關系的表示法散點圖相關分析表相關變量的二元分布相關系數相關分析表

工齡與工資的聯合概率分布相關系數相關系數:是衡量變量之間線性相關密切程度的一個系數。式中:XY:X與Y的協方差;

X-----變量X的標準差;Y-----變量Y的標準差。相關系數是將協方差進行標準化處理的結果。相關系數的意義-1r1它是一個系數,不受變量值水平和計量單位的影響。r>0,正相關。散點較為密集地分布在第I和第III象限。r<0,負相關。散點較為密集地分布在第II和第IV象限。相關系數的值r的值越接近1,表示線性相關程度越高。0|r|0.3弱相關0.3|r|0.5低度相關0.5|r|0.8顯著相關0.8|r|1高度相關相關系數也與樣本容量有關相關系數的顯著性檢驗若從一個二元正態總體中隨機抽取一個樣本,由樣本數據算出的相關系數帶有隨機性。且樣本容量越小其隨機性越大。相關系數的顯著性檢驗就是通過樣本相關系數r對總體相關系數作出推斷。相關系數的檢驗H0:=0(總體相關系數為0)檢驗統計量服從t(n-2)分布,在顯著性水平和自由度n-2下,查表得t/2,若|t|t/2,表明r在統計上是顯著的,兩變量線性相關。回歸分析回歸的概念:回歸(Regression)一詞源于19世紀英國生物學家葛爾登對人體遺傳特征的實驗研究。他把人的身高趨向于平均高度的現象稱為“回歸”。相關系數測量變量之間關系的密切程度,如果已知兩變量顯著相關,我們就希望能從一個變量的取值來推算出另一個變量的取值范圍。這就是回歸分析。回歸的種類一元回歸與多元回歸線性回歸與非線性回歸回歸分析涉及的內容1)從一組數據出發,分析變量間存在什么樣的關系,建立這些變量的關系式(回歸方程),并對關系式的可信程度進行統計檢驗;2)利用回歸方程式,根據一個或幾個變量的值,預測或控制另一個變量的取值;回歸分析的內容(2)3)從影響某一個變量的許多變量中,判斷哪些變量的影響是顯著的,哪些是不顯著的,從而可建立更實用的回歸方程;4)根據預測和控制所提出的要求,選擇試驗點,對試驗進行設計。

一元線性回歸

一元線性回歸的數學模型為y=+x+ey是隨機變量,x是一般的自變量;和是兩個參數,其數值可根據樣本值來估計,e是隨機變量,一般假定e~N(0,2)基本假設:變量X與Y之間存在著真實的線性關系;變量X為非隨機變量,Y為隨機變量;隨機項ei

相互獨立。最小二乘法確定一條直線,令估計值與實際值的離差平方和為最小。即對上式的a和b求一階偏導并令其為0,就可解出最小值點a和b。

最小平方法配合得到的直線,是一條最適線,滿足

a和b的含義a為截距,當數據包括了X=0的范圍時,表示X=0時Y的估計值;當數據并不包含X=0時,沒有什么實際意義。b,斜率,回歸系數X每增加一個單位時Y的估計值增加b個單位。b>0,正相關b<0,負相關b=0,X與Y線性不相關一元線性回歸模型的檢驗1、擬合程度的測定總變差的分解總變差=回歸變差+剩余變差

SST=SSR+SSE

測定系數回歸變差占總變差的比例,表示因變量的總變動中,能用自變量的變動解釋的百分比。(相關系數的平方)

估計標準誤差變量Y的各實際觀測值Yi與回歸直線的估計值的絕對離差可用估計標準誤表示。回歸系數的顯著性檢驗由于回歸系數b是總體回歸系數的估計值,如果回歸系數b很小,與0沒有顯著性的差異,則意味著回歸模型中無X項,即Y并不隨X變化。現通過回歸系數b的t值檢驗,驗證Y與X之間有無“真實的”線性關系。檢驗b的步驟建立原假設H0:

=0計算b的t檢驗值

根據給定的顯著性水平和自由度(n-2),查t分布表,得臨界值t/2

,若|tb|>t/2,拒絕H0

,回歸系數等于0的概率小于,可得出回歸系數不等于0的結論。

4、回歸方程的顯著性檢驗由方差分析的原理我們知道,如果回歸變差顯著地大于剩余變差,則回歸方程的回歸效果是顯著的。可以用F檢驗,根據給定的顯著性水平,和兩個自由度,查F分布表,得到臨界值F,,若F>F,拒絕H0,回歸方程是顯著的。

5、Durbin-Watson檢驗檢驗殘差項是否相互獨立。若不獨立,則不滿足回歸模型的假設條件。橫截面的資料通常能滿足殘差獨立的條件,但經濟資料往往是周期性的,觀測值有成串或成批出現的趨勢,這種殘差之間具有相關的趨勢稱為自相關。D-W檢驗量:檢驗有無正自相關出現。

D-W檢驗規則查D-W表得到下限值dL

和上限值du,1)d<dL,拒絕無正自相關的零假設,斷定具有正的自相關。2)d>dU,接受無正自相關的零假設,斷定無正的自相關。3)dLddu,,檢驗不能作出結論。殘差不獨立的處理辦法采用應變量和自變量的變化額而不采用原來的數據,可能是一種使用最廣的方法。還可以將變量加以變換(例如,采用對數形式);加進另一個變量等。這些內容在計量經濟學書中有論述。

例:d的取值高低與正自相關的關系

例A:d取得低值

例B:d取得高值

時間序列ei

ei-ei-1(ei-ei-1)2ei2ei

ei-ei-1(ei-ei-1)2ei2

1111122114541625331193-24944111641116

5511252-2444552555

例A:d=4/55例B:d=25/55利用回歸方程進行預測所謂預測問題,就是在確定自變量的某一個X0值時求相應的因變量Y的估計值,其中又分為點預測和區間預測。點預測:區間預測:當X=X0時,推算Y的個別值的置信度為1-的預測區間為:回歸分析應注意的問題因果關系r2=0.8,并不能說明Y

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論