




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第七章相關與回歸分析問題:1、某研究人員調查了杭州在校大學生的每周平均自習時間,并收集了相應的期末考試成績,他想知道研究自習時間與學習成績是否有關系,如何判斷這種關系的表現形式,關系的密切程度以及它們之間如何作用?2、某企業想做廣告來宣傳某產品,如何了解和判斷廣告費用與銷售之間的關系,以選擇一個適當的廣告投入?相關與回歸分析概述簡單線性相關分析線性回歸分析非線性回歸分析第一節概述概念現象之間的關系表現為:函數關系:一種確定性、嚴格的依存關系,可以用數學表達式準確表示出來。相關關系:現象之間存在一定的數量依存關系,但不是固定的。現象之間客觀存在數量上的依存關系。這種依存關系不是確定的從某種角度說,函數關系是相關關系的特例。相關關系種類因素多少單相關:兩個因素復相關:三個以上因素相關形態直線相關(線性相關):表現近似直線曲線相關:表現近似曲線。正相關:同向變化負相關:反向變化相關程度完全相關:實質就是確定性的函數關系不完全相關:這個是要研究的相關分析。無相關:因素之間完全沒有關系。平均意義上的相關回歸分析的主要內容1、確定現象之間的相關性以及其相關關系的表現形式;2、確定相關關系的密切程度;3、選擇適當的數學模型;4、測定估計值的可靠程度。5、檢驗相關關系的顯著性。相關回歸分析是為了消除偶然因素影響,以找出現象之間的依存關系和程度以及變動規律。主要內容如下:相關分析:研究變量之間關系的密切程度回歸分析:研究變量變動之間的因果關系第二節簡單線性相關分析散點圖(scatterplot)兩種相關分析方法:定性分析(圖表法)和定量分析(相關系數)。定性分析一般只適用于兩個變量。·············支出收入散點圖相關系數的計算和應用相關系數定量說明現象之間的密切程度。積差法相關系數:用無量綱的系數形式表示變量之間的相關程度。協方差:用來表示變量關聯程度的絕對指標。顯然受標志大小的影響。簡捷計算方法(三個簡捷公式)已知平均值時,可采用:已知平均值和標準差時,可采用:相關系數的特點和相關程度的判斷標準特點判斷標準:一般地產量(公斤)生產費用(萬元)20042204.52504.72704.82805.2合計122023.2例某企業生產調查,資料如下:計算產量和生產費用的相關系數。19365763667612960.40960.01960.00360.02560.31360.772452028.163.360.364.1620.1656.2積差法:簡捷法:產量(公斤)生產費用(萬元)20042204.52504.72704.82805.2合計122023.21620.2522.0923.0427.044000048400625007290078400302200108.428009901175129614565717第三節線性回歸分析概述概念對具有相關關系的變量之間的數量變化的一般關系進行測定,確定一個相關的數學表達式,以進行估計或預測的統計方法。分類直線回歸(線性回歸)曲線回歸(非線性回歸)簡單直線回歸(一元線性回歸)多元線性回歸回歸分析要先確定因變量(結果),自變量(原因)。相關系數則不需要確定因果變量。簡單直線回歸(一元線性回歸)確定自變量x和因變量y。一般根據問題的性質、相關理論和常識確定。如果不能確定,或者兩個變量互為根據,則存在x為自變量,y為因變量(y倚x)的回歸方程和y為自變量,x為因變量(x倚y)的回歸方程。建立一元一次數學模型這里采用第一個模型。a稱為截距,b稱為斜率或回歸系數。a的經濟含義一般不作解釋,b的經濟含義是自變量變動一個單位,因變量平均變動b個單位。計算a和b參數a和b,是根據實際的觀測值(已知)計算出的。就是在模型中,x和y是已知的,a和b是未知的。一般采用最小平方法(最小二乘法)計算。推導如下:根據最小平方法原理,參數要使得理論值與實際值的離差平方和最小。假設Q是連續可微,最小值的必要條件是一階偏導數等于0,即:將帶入Q,分別求一階偏導得:移項等到二元一次方程:從中可以解出:這樣就得到了直線回歸方程。··········回歸系數b還可以寫成:判定系數R2用來測度回歸直線對實際值的擬合程度,或者說是回歸直線對實際值變動的解釋程度。總偏差剩余偏差(未被解釋)回歸偏差(被解釋)即判斷系數反映了因變量變動中由自變量所解釋的程度。例根據上例中的資料,配合生產費用倚產量的直線回歸方程,說明斜率的經濟含義,并預測當產量為300公斤時的生產費用。產量(公斤)生產費用(萬元)20042204.52504.72704.82805.2合計122023.21620.2522.0923.0427.044000048400625007290078400302200108.425717800990117512961456這樣得出生產費用倚產量的直線回歸方程:b(斜率)的經濟含義表示產量增加一公斤,生產費用平均增加0.0124萬元。當產量增加到300公斤時,則可以預測生產費用為:估計標準誤差回歸直線或曲線是一種平均線。用來代表變量之間關系的一般水平。根據回歸線推測的因變量顯然與實際值有差異。這種差異大小說明推算的準確性以及回歸線代表性的大小。估計標準誤差就是用來說明回歸方程推算結果的準確性或代表性高低的統計分析指標。·········yx回歸平均線一般的平均數········yx··簡單直線回歸估計標準誤差計算簡捷公式:相關系數和估計標準誤差的關系或相關系數與估計標準誤差表現為相反的關系。1、越大,越小。極端時,,此時,實際值與理論值完全相等,完全相關。2、越小,越大。極端時,,圖上表現為回歸線與數列的平均線重合,不相關。例計算上例回歸直線的估計標準誤差產量(公斤)生產費用(萬元)20042204.52504.72704.82805.2合計122023.2—1620.2522.0923.0427.044.09444.34244.71444.96245.0864108.4257178009901175129614560.0089110.0248380.0002070.0263730.0129050.073234根據回歸方程
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 胃潰瘍護理查房
- 工業機器人技術與應用試題+參考答案
- 食材供應合同協議書
- 計算機一級復習題+參考答案
- 植物學考試模擬題含答案
- 肺氣腫合并感染護理查房
- 裝修工程合作協議合同范本
- 跨國電子商務物流配送合同
- 船舶貨物儲存環境
- 能源建設項目勞務分包合同模板
- 拼音田字格(A4-word-打印版)
- 《畢業生登記表》填寫模板
- 風電場建設項目綠色施工方案
- 臨時操作平臺施工方案(33頁)
- TCMBA 013-2021 醫療機構管理嵌合抗原受體T細胞治療產品臨床應用的規范
- GIS軟件工程_01概述
- 湘少版級英語單詞表吐血整理
- SF36量表內容與計分方法附
- 第一單元到郊外去
- 食堂出入庫明細表(新)
- 澆注型聚氨酯彈性體生產技術標準_圖文
評論
0/150
提交評論