




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第八章相關分析l 第一節 相關分析概述l 第二節 直線相關關系的測定 l 第三節 回歸分析第一節相關分析概述l 一、 相關關系的概念l 現象相互之間的數量關系可以從形式上分為兩種類型:一類是嚴格的確定性的函數關系,另一類是不嚴格的不確定性的相關關系。l 相關關系是現象之間確實存在有數量上的依存關系,但這種數量上的關系是不確定的。 函數關系的例子§ 某種商品的銷售額(y)與銷售量(x)之間的關系可表示為y = px (p 為單價)§ 圓的面積(S)與半徑之間的關系可表示為S=pR2 § 企業的原材料消耗額(y)與產量(x1) 、單位產量消耗(x2) 、原材料價格(x
2、3)之間的關系可表示為y = x1 x2 x3函數關系1. 是一一對應的確定關系2. 設有兩個變量x 和y ,變量y 隨變量x 一起變化,并完全依賴于x,當變量x 取某個數值時,y 依確定的關系取相應的值,則稱y 是x 的函數,記為y = f (x),其中x 稱為自變量,y 稱為因變量3. 各觀測點落在一條線上 相關關系(幾個例子)相關關系的例子§ 父親身高(y)與子女身高(x)之間的關系§ 收入水平(y)與受教育程度(x)之間的關系§ 糧食畝產量(y)與施肥量(x1) 、降雨量(x2) 、溫度(x3)之間的關系§ 商品的消費量(y)與居民收入(x)之間
3、的關系§ 商品銷售額(y)與廣告費支出(x)之間的關系相關關系1. 變量間關系不能用函數關系精確表達2. 一個變量的取值不能由另一個變量唯一確定3. 當變量x 取某個值時,變量y 的取值可能有幾個4. 各觀測點分布在直線周圍 二、相關關系的種類(1)相關關系按涉及的變量的多少分為單相關、復相關和偏相關。單相關就是兩個變量之間的相關關系。是研究一個因變量與一個自變量的依存關系。復相關就是多個變量之間的相關關系。是研究一個因變量與兩個或兩個以上自變量的依存關系。偏相關就是在復相關研究中,如果假定其它變量不變,僅研究某一個變量對另一個變量的依存關系。(2)相關關系按方向不同分為正相關和負相
4、關。 正相關是指變量之間存在著同向變動的相關關系,即當一個變量的數值有小變大,另一個變量的數值也相應地由小變大 負相關是指變量之間存在著反向變動的相關關系,即當一個變量的數值有小變大,另一個變量的數值卻由大變小。(3)相關關系按表現的形式不同分為線性相關和非線性相關。 當一個變量變動時,另一個變量也隨之發生大致均等的變動,從圖形上看,二者對應點分布近似地在一條直線附近,這種相關關系就稱為線性相關關系。 當一個變量變動時,另一個變量也隨之發生變動,但從圖形上看,二者對應點分布近似地在一條曲線附近,這種相關關系就稱為非線性相關關系。(4)相關關系按相關程度不同分為完全相關、不完全相關和不相關。 完
5、全相關就是當一個變量的變動完全由另一個變量的變動所決定。(函數關系) 當兩個變量之間完全不存在任何依存關系,各自獨立變動,其相關程度為零,稱為不相關或零相關。 當變量之間的關系介于完全相關與不相關之間,稱為不完全相關。三、相關分析的內容l 1.確定現象之間是否存在相關關系,以及相關關系的表現形式l 2.測定相關關系的密切程度和方向l 3.確定現象之間相關關系的一般關系式l 4.測定變量估計值的可靠程度第二節直線相關關系的測定判斷現象之間有無相關關系,應先進行定性分析,即依據理論知識、實踐經驗對現象之間是否存在相關關系及相關關系的類型作出判斷。然后在此基礎上進行定量分析,即運用相關圖、相關表和相
6、關系數等方法對現象之間的相關關系進行描述與測度。 相關表 相關關系的圖示 相關系數一、 相關表相關表是指按照相關現象的數量對應關系以及一定的邏輯順序編制成的一種統計表。 通過相關表可以初步看出各變量之間的相關關系。 某企業2006年某種產品產量與總成本相關表月份 產量萬噸x 總成本萬元y1234562.43.14.35.24.46.1324351615378二、相關圖l 相關圖是指把相關表中原始的對應數值在平面直角坐標圖中用點描繪出來,用以反映其分布狀況的統計圖,也稱散點圖、散布圖。 l 從相關點的分布情況,就可以直觀地、近似地觀察出兩個變量之間有無相關關系、相關關系的形式
7、和相關關系的密切程度。 散點圖(例題分析)【例】一家大型商業銀行在多個地區設有分行,其業務主要是進行基礎設施建設、國家重點項目建設、固定資產投資等項目的貸款。近年來,該銀行的貸款額平穩增長,但不良貸款額也有較大比例的提高,這給銀行業務的發展帶來較大壓力。為弄清楚不良貸款形成的原因,希望利用銀行業務的有關數據做些定量分析,以便找出控制不良貸款的辦法。下面是該銀行所屬的25家分行2002年的有關業務數據三、相關系數1.相關系數的概念及其公式相關表與相關圖只能大致反映變量間的相關關系要準確反映變量之間的相關程度,就需要計算相關系數。相關系數是測量變量之間的密切程度的指標。測定兩個變量之間線性關系密切
8、程度的指標稱為單線性相關系數或線性單相關系數。通常用字母 表示。 積差法公式: (簡單式)2.相關關系的密切程度的判斷標準l 相關系數的取值范圍一定是在1+1,或01這一閉區間。l 當 =1時,表示與變量為完全相關,即確定性的函數關系。l 當 =0時,表明所有的相關點的分布都是雜亂無章的,說明變量與變量無關 。l 如果0 1,表示 xy 為正相關;l 當-1 0時,表示 xy 為負相關,。 3.直線相關分析的特點l 1)參與相關分析的兩個變量是對等關系,不分自變量和因變量,因此,相關系數只有一個。 l 2)相關系數有正負號,它們反映相關關系的方向,正號反映正相關,負號反映負相關。l 3)相關的
9、兩個變量必須是隨機的,這也是對等關系的反映。第三節回歸分析一、回歸分析的含義 什么是回歸回歸是由英國著名統計學家Francis Galton在19世紀末期研究孩子及其父母的身高時提出來的。Galton發現身材高的父母,他們的孩子也高。但這些孩子平均起來并不像他們父母那樣高。比較矮的父母情形也類似:他們的孩子比較矮,但這些孩子的平均身高要比他們父母的平均身高高。 Galton把這種孩子的身高向中間值靠近的趨勢稱之為一種回歸效應,而他發展的研究兩個數值變量之間數量關系的方法稱為回歸分析。什么是回歸分析?1. 從一組樣本數據出發,確定變量之間的數學關系式2. 對這些關系式的可信程度進行各種統計檢驗,
10、并從影響某一特定變量的諸多變量中找出哪些變量的影響顯著,哪些不顯著3. 利用所求的關系式,根據一個或幾個變量的取值來預測或控制另一個特定變量的取值,并給出這種預測或控制的精確程度回歸分析與相關分析的關系聯系 :二者都是對客觀事物數量依存關系的分析。一方面,相關分析是回歸分析的基礎和前提。另一方面,回歸分析是相關分析的深入和繼續。回歸分析與相關分析的區別1. 相關分析中,變量x變量y 處于平等的地位;回歸分析中,變量y 稱為因變量,處在被解釋的地位,x 稱為自變量,用于預測因變量的變化2. 相關分析中所涉及的變量x 和y 都是隨機變量;回歸分析中,因變量y 是隨機變量,自變量x可以是隨機變量,也
11、可以是非隨機的確定變量3. 相關分析主要是描述兩個變量之間線性關系的密切程度;回歸分析不僅可以揭示變量x 對變量y 的影響大小,還可以由回歸方程進行預測和控制二、簡單直線回歸方程的配合方法回歸方程式,其一般形式為:應用最小平方法原理有:三、估計標準誤差估計標準誤差是就是觀察值 對估計值 的平均離差,也叫回歸誤差,是衡量因變量的估計值與觀測值之間的平均誤差大小的指標。簡捷公式 :四、估計標準誤差和相關系數的關系回歸模型的類型一元線性回歸1. 涉及一個自變量的回歸2. 因變量y與自變量x之間為線性關系 被預測或被解釋的變量稱為因變量(dependent variable),用y表示 用來預測或用來
12、解釋因變量的一個或多個變量稱為自變量(independent variable),用x表示3. 因變量與自變量之間的關系用一條線性方程來表示回歸模型(regression model)1. 回答“變量之間是什么樣的關系?”2. 方程中運用 1 個數字的因變量(響應變量) 被預測的變量 1 個或多個數字的或分類的自變量 (解釋變量) 用于預測的變量l 3.主要用于預測和估計一元線性回歸模型1. 描述因變量 y 如何依賴于自變量x 和誤差項e 的方程稱為回歸模型2. 一元線性回歸模型可表示為Æ y = A + B x + e y 是x 的線性函數(部分)加上誤差項 線性部分反映了由于x
13、的變化而引起的y 的變化 誤差項e是隨機變量 反映了除x 和y 之間的線性關系之外的隨機因素對y 的影響 是不能由x 和y 之間的線性關系所解釋的變異性 A和 B稱為模型的參數一元線性回歸模型(基本假定) 1. 誤差項是一個期望值為0的隨機變量,即E()=0。對于一個給定的x 值,y 的期望值為2. Y =A+ B x3. 對于所有的x 值,的方差2 都相同4. 誤差項是一個服從正態分布的隨機變量,且相互獨立。即N( 0 ,2 ) 獨立性意味著對于一個特定的x 值,它所對應的與其他x 值所對應的不相關 對于一個特定的x 值,它所對應的y 值與其他x 所對應的y 值也不相關回歸方程 (regre
14、ssion equation)1. 描述y 的平均值或期望值如何依賴于x 的方程稱為回歸方程2. 一元線性回歸方程的形式如下3. Y = A+ Bx方程的圖示是一條直線,也稱為直線回歸方程A是回歸直線在y 軸上的截距,是當x=0 時y 的期望值B是直線的斜率,稱為回歸系數,表示當x 每變動一個單位時,y 的平均變動值估計的回歸方程(estimated regression equation)1. 總體回歸參數 A和 B是未知的,必需利用樣本數據去估計2. 用樣本統計量a和b代替回歸方程中的未知參數A和B,就得到了估計的回歸方程3.一元線性回歸中估計的回歸方程為Yc=a+bx其中: a是估計的回
15、歸直線在 y 軸上的截距, b是直線的斜率,它表示對于一個給定的 x 的值, Yc是 y 的估計值,也表示 x 每變動一個單位時, y 的平均變動值.參數的最小二乘估計1. 使因變量的觀察值與估計值之間的離差平方和達到最小來求得a和b的方法。即2. 用最小二乘法擬合的直線來代表x與y之間的關系與實際數據的誤差比其他任何直線都小根據最小二乘法的要求,可得求解a和b的公式如下已求得如下過程數據:由最小二乘法標準方程得回歸系數的計算值為:得出Y對X的直線回歸方程為:方程的意義回歸直線的擬合優度變差1. 因變量y 的取值是不同的,y 取值的這種波動稱為變差。變差來源于兩個方面 由于自變量x 的取值不同造成的 除x 以外的其他因素(如x對y的非線性影響、測量誤差等)的影響2. 對一個具體的觀測值來說,變差的大小可以通過該實際觀測值
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 江蘇省常熟市重點名校2024-2025學年初三一診模擬數學試題含解析
- 忻州市保德縣2025屆三年級數學第二學期期末調研試題含解析
- 西安財經大學《中國古代文學作品選與中學語文(三)》2023-2024學年第一學期期末試卷
- 湖南醫藥學院《檢測儀表與過程控制》2023-2024學年第二學期期末試卷
- 萬科物業保潔培訓計劃
- 湛江市高三測試題(一)文綜地理試卷
- 化學產品開發流程的8個關鍵步驟
- 化學實驗室原始記錄規范
- 2025版權轉讓協議合同范本
- 雙腎囊腫護理查房
- 幼兒園中班繪本《城市里最漂亮的巨人》課件
- 醫院廉潔行醫廉政教育專題課件
- 醫務人員職業健康安全健康-課件
- 安全組織機構圖
- 舊石器時代考古-基礎知識課件
- 江蘇省建設工程現場安全文明施工措施費計價管理辦法
- 病區藥品規范化管理與問題對策黃池桃
- 螺紋塞規操作規程
- 2023年北京天文館招聘筆試備考題庫及答案解析
- 應急救援隊伍單兵體能訓練項目要求
- 車輛辦理ETC委托書范文
評論
0/150
提交評論