第8章SPSS的相關和線性回歸_第1頁
第8章SPSS的相關和線性回歸_第2頁
第8章SPSS的相關和線性回歸_第3頁
第8章SPSS的相關和線性回歸_第4頁
第8章SPSS的相關和線性回歸_第5頁
已閱讀5頁,還剩65頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、相關分析相關分析線性回歸分析線性回歸分析提綱提綱相關分析相關分析偏相關分析偏相關分析回歸分析回歸分析曲線估計曲線估計4321一、相關分析一、相關分析 一一. 變量相關的概念變量相關的概念 二二. 相關系數及其計算相關系數及其計算變量間的關系變量間的關系函數關系函數關系1. 是一一對應的確定關系是一一對應的確定關系 設有兩個變量設有兩個變量 x 和和 y ,變量,變量 y 隨變量隨變量 x 一起變化,并完一起變化,并完全依賴于全依賴于 x ,當變量,當變量 x 取某取某個數值時,個數值時, y 依確定的關系依確定的關系取相應的值,則稱取相應的值,則稱 y 是是 x 的的函數,記為函數,記為 y

2、= f (x),其中,其中 x 稱為自變量,稱為自變量,y 稱為因變量稱為因變量2. 各觀測點落在一條線上各觀測點落在一條線上 函數關系的例子函數關系的例子某種商品的銷售額(y)與銷售量(x)之間的關系可表示為 y = p x (p 為單價)圓的面積(S)與半徑之間的關系可表示為 S = R2 企業的原材料消耗額(y)與產量(x1) 、單位產量消耗(x2) 、原材料價格(x3)之間的關系可表示為y = x1 x2 x3 相關關系的例子相關關系的例子商品的消費量(y)與居民收入(x)之間的關系商品銷售額(y)與廣告費支出(x)之間的關系糧食畝產量(y)與施肥量(x1) 、降雨量(x2) 、溫度(

3、x3)之間的關系收入水平(y)與受教育程度(x)之間的關系父親身高(y)與子女身高(x)之間的關系變量間的關系變量間的關系相關關系相關關系 1.變量間關系不能用函數關系變量間關系不能用函數關系精確表達精確表達 2.一個變量的取值不能由另一一個變量的取值不能由另一個變量唯一確定個變量唯一確定 3.當變量當變量 x 取某個值時,變量取某個值時,變量 y 的取值可能有幾個的取值可能有幾個4.各觀測點分布在直線周圍各觀測點分布在直線周圍 相關關系和函數關系的聯系相關關系和函數關系的聯系 函數關系在實際中往往通過相關關系表現出來函數關系在實際中往往通過相關關系表現出來 相關關系常常要使用函數關系的形式來

4、表現,以相關關系常常要使用函數關系的形式來表現,以便找到相關關系的一般數量表現形式便找到相關關系的一般數量表現形式相關關系的類型相關關系的類型相關關系相關關系非線性相關非線性相關線性相關線性相關正正相相關關正正相相關關負負相相關關負負相相關關完全相關完全相關不相關不相關相關關系的圖示相關關系的圖示相關關系的測度相關關系的測度相關系數相關系數1.對變量之間關系密切程度的度量對變量之間關系密切程度的度量2.對兩個變量之間線性相關程度的度量稱為簡單對兩個變量之間線性相關程度的度量稱為簡單相關系數相關系數3.若相關系數是根據總體全部數據計算的,稱為若相關系數是根據總體全部數據計算的,稱為總體相關系數,

5、記為總體相關系數,記為4.若是根據樣本數據計算的,則稱為樣本相關系若是根據樣本數據計算的,則稱為樣本相關系數,記為數,記為 r 相關系數的計算相關系數的計算 樣本相關系數的計算公式樣本相關系數的計算公式22)()()(yyxxyyxxr2222 yynxxnyxxynr相關系數取值及其意義相關系數取值及其意義1. r 的取值范圍是的取值范圍是 -1,12. |r|=1,為完全相關為完全相關r =1,為完全正相關,為完全正相關r =-1,為完全負正相關,為完全負正相關3. r = 0,不存在不存在線性相關線性相關關系關系4. -1 r0,為負相關為負相關5. 0t,拒絕,拒絕H0 若若tt,接受

6、,接受H0)2(122ntrnrt示例示例 對前例計算的相關系數進行顯著性檢對前例計算的相關系數進行顯著性檢(0.05)1. 提出假設:提出假設:H0: ;H1: 02. 計算檢驗的統計量計算檢驗的統計量9809.649987. 012139987. 02t相關分析相關分析SPSS操作操作案例案例為研究高等院校人文社會科學研究中立項課題數受為研究高等院校人文社會科學研究中立項課題數受哪些因素的影響,收集到某年哪些因素的影響,收集到某年31個省市自治區部分個省市自治區部分高校有關社科研究方面的數據,研究高校有關社科研究方面的數據,研究立項課題數立項課題數(當年)(當年)與與投入的具有高級職稱的人

7、年數(上年)投入的具有高級職稱的人年數(上年)、發表的論文數(上年)發表的論文數(上年)之間是否具有較強的線性關之間是否具有較強的線性關系。系。思路思路 1、繪制、繪制散點圖散點圖,直觀展現變量之間的統計關系,直觀展現變量之間的統計關系 圖形圖形舊對話框舊對話框散點散點矩陣分布矩陣分布 選取相應變量到選取相應變量到“矩陣變量矩陣變量”中中 2、計算、計算相關系數相關系數,以數值的方式反映變量間線,以數值的方式反映變量間線性相關的強弱程度性相關的強弱程度 分析分析相關相關雙變量雙變量 選擇參加相關系數的變量到選擇參加相關系數的變量到“變量變量”中中 選擇計算哪種相關系數選擇計算哪種相關系數練習練

8、習1 利用利用SPSS軟件完成軟件完成【例例8.1】二、偏相關分析二、偏相關分析 1、分析、分析相關相關偏相關偏相關 2、選擇參與分析的變量、選擇參與分析的變量 3、選擇一個或多個控制變量、選擇一個或多個控制變量偏相關分析也稱凈相關分析,在偏相關分析也稱凈相關分析,在控制其他變量控制其他變量的線性影響的線性影響的條件下的條件下分析兩變量間的線性相關分析兩變量間的線性相關,所采用的工具是偏相,所采用的工具是偏相關系數(凈相關系數)。關系數(凈相關系數)。三、回歸分析三、回歸分析 線性回歸模型線性回歸模型 回歸參數的最小二乘估計回歸參數的最小二乘估計 回歸方程的擬合優度檢驗回歸方程的擬合優度檢驗

9、回歸方程的顯著性檢驗回歸方程的顯著性檢驗 回歸系數的顯著性檢驗回歸系數的顯著性檢驗知識點回顧知識點回顧什么是回歸分析?什么是回歸分析?1. 從一組樣本數據出發,確定變量之間的數學從一組樣本數據出發,確定變量之間的數學關系式關系式2. 對這些關系式的可信程度進行各種統計檢驗,對這些關系式的可信程度進行各種統計檢驗,并從影響某一特定變量的諸多變量中找出哪并從影響某一特定變量的諸多變量中找出哪些變量的影響顯著,哪些不顯著些變量的影響顯著,哪些不顯著3. 利用所求的關系式,根據一個或幾個變量的利用所求的關系式,根據一個或幾個變量的取值來預測或控制另一個特定變量的取值,取值來預測或控制另一個特定變量的取

10、值,并給出這種預測或控制的精確程度并給出這種預測或控制的精確程度回歸分析與相關分析的區別回歸分析與相關分析的區別1. 相關分析中,變量相關分析中,變量 x 變量變量 y 處于平等的地位;回處于平等的地位;回歸分析中,變量歸分析中,變量 y 稱為因變量,處在被解釋的地稱為因變量,處在被解釋的地位,位,x 稱為自變量,用于預測因變量的變化稱為自變量,用于預測因變量的變化2. 相關分析中所涉及的變量相關分析中所涉及的變量 x 和和 y 都是隨機變量;都是隨機變量;回歸分析中,因變量回歸分析中,因變量 y 是隨機變量,自變量是隨機變量,自變量 x 可可以是隨機變量,也可以是非隨機的確定變量以是隨機變量

11、,也可以是非隨機的確定變量3. 相關分析主要是描述兩個變量之間線性關系的密相關分析主要是描述兩個變量之間線性關系的密切程度;回歸分析不僅可以揭示變量切程度;回歸分析不僅可以揭示變量 x 對變量對變量 y 的影響大小,還可以由回歸方程進行預測和控制的影響大小,還可以由回歸方程進行預測和控制 回歸模型與回歸方程回歸模型與回歸方程回歸模型回歸模型1. 回答回答“變量之間是什么樣的關系?變量之間是什么樣的關系?”2. 方程中運用方程中運用因變量因變量(響應變量響應變量)被預測的變量被預測的變量自變量自變量 (解釋變量解釋變量)用于預測的變量用于預測的變量3.主要用于預測和估計主要用于預測和估計回歸模型

12、的類型回歸模型的類型回歸模型回歸模型多元回歸多元回歸一元回歸一元回歸線性回線性回歸歸非線性非線性回歸回歸線性回線性回歸歸非線性非線性回歸回歸一元線性回歸模型一元線性回歸模型1. 當只涉及一個自變量時稱為當只涉及一個自變量時稱為一元回歸一元回歸,若因變,若因變量量 y 與自變量與自變量 x 之間為線性關系時稱為之間為線性關系時稱為一元線一元線性回歸性回歸2. 對于具有線性關系的兩個變量,可以用一個線對于具有線性關系的兩個變量,可以用一個線性方程來表示它們之間的關系性方程來表示它們之間的關系3. 描述因變量描述因變量 y 如何依賴于自變量如何依賴于自變量 x 和誤差項和誤差項 的方程稱為的方程稱為

13、回歸模型回歸模型一元線性回歸模型一元線性回歸模型 對于只涉及一個自變量的簡單線性回歸模型可對于只涉及一個自變量的簡單線性回歸模型可表示為表示為 y = b + b1 x + 模型中,模型中,y 是是 x 的線性函數加上誤差項的線性函數加上誤差項線性部分反映了由于線性部分反映了由于 x 的變化而引起的的變化而引起的 y 的變化的變化誤差項誤差項 是隨機變量是隨機變量反映了除反映了除 x 和和 y 之間的線性關系之外的隨機因素對之間的線性關系之外的隨機因素對 y 的影響的影響是不能由是不能由 x 和和 y 之間的線性關系所解釋的變異性之間的線性關系所解釋的變異性b b0 和和 b b1 稱為模型的

14、參數稱為模型的參數基本假定基本假定1. 誤差項誤差項是一個期望值為是一個期望值為0的隨機變量,即的隨機變量,即E()=0。對于一個給定的對于一個給定的 x 值,值,y 的期望值為的期望值為 E ( y ) =b 0+ b 1 x2. 對于所有的對于所有的 x 值,值,的方差的方差2 都相同都相同3. 誤差項誤差項是一個服從正態分布的隨機變量,且相互是一個服從正態分布的隨機變量,且相互獨立。即獨立。即N( 0 ,2 )獨立性意味著對于一個特定的獨立性意味著對于一個特定的 x 值,它所對應的值,它所對應的與與其他其他 x 值所對應的值所對應的不相關不相關對于一個特定的對于一個特定的 x 值,它所對

15、應的值,它所對應的 y 值與其他值與其他 x 所所對應的對應的 y 值也不相關值也不相關回歸方程回歸方程1. 描述描述 y 的平均值或期望值如何依賴于的平均值或期望值如何依賴于 x 的方的方程稱為程稱為回歸方程2. 簡單線性回歸方程的形式如下簡單線性回歸方程的形式如下 E( y ) = b0+ b1 x方程的圖示是一條直線,因此也稱為直線回歸方程方程的圖示是一條直線,因此也稱為直線回歸方程b b0是回歸直線在是回歸直線在 y 軸上的截距,是當軸上的截距,是當 x=0 時時 y 的期望值的期望值b b1是直線的斜率,稱為回歸系數,表示當是直線的斜率,稱為回歸系數,表示當 x 每變動一個單位每變動

16、一個單位時,時,y 的平均變動值的平均變動值估計估計(經驗經驗)的回歸方程的回歸方程0b1b0b1b0b1b0b1bxy10bb+參數參數 0 和和 1 的最小二乘估計的最小二乘估計最小二乘法最小二乘法圖例圖例xy10bb+最小二乘法最小二乘法最小niiniieyyQ121210) (),(bb0b1b 和和 的計算公式的計算公式0b1b根據最小二乘法的要求,可得求解 和 的標準方程如下 b b b b b b xyxxnyxyxn10n1i2n1ii2in1iin1iin1iii10b1b估計方程的求法估計方程的求法實例實例 【例】根據例根據例8.1中的數據,配合人均消中的數據,配合人均消費

17、金額對人均國民收入的回歸方程費金額對人均國民收入的回歸方程 根據根據 和和 的求解公式得的求解公式得2229.54526378. 073077.98652638. 061538.5735 .1282777.160733231374575 .1282799.91561731301021bbbb0b1b 人均消費金額對人均國民收入的回歸方程為人均消費金額對人均國民收入的回歸方程為020040060080010001200140005001000150020002500人均消費與人均國民收入的回歸人均消費與人均國民收入的回歸回歸方程的顯著性檢驗回歸方程的顯著性檢驗1、擬合優度的檢驗、擬合優度的檢驗2

18、、線性關系的檢驗、線性關系的檢驗3、回歸系數的檢驗、回歸系數的檢驗離差平方和的分解離差平方和的分解1. 因變量因變量 y 的取值是不同的,的取值是不同的,y 取值的這種波動稱取值的這種波動稱為為變差變差。變差來源于兩個方面。變差來源于兩個方面由于自變量由于自變量 x 的取值不同造成的的取值不同造成的除除 x 以外的其他因素以外的其他因素(如如x對對y的非線性影響、測量誤的非線性影響、測量誤差等差等)的影響的影響2. 對一個具體的觀測值來說,變差的大小可以通過對一個具體的觀測值來說,變差的大小可以通過該實際觀測值與其均值之差該實際觀測值與其均值之差 來表示來表示yy 圖示圖示yxy10bb+yy

19、 yyyy ),(iiyx三個平方和的關系三個平方和的關系2. 兩端平方后求和有 yyyyyy+niiniiniiyyyyyy121212三個平方和的意義三個平方和的意義1. 總平方和(SST)反映因變量的反映因變量的 n 個觀察值與其均值的總離差個觀察值與其均值的總離差2. 回歸平方和(SSR)反映自變量反映自變量 x 的變化對因變量的變化對因變量 y 取值變化的影取值變化的影響,或者說,是由于響,或者說,是由于 x 與與 y 之間的線性關系引之間的線性關系引起的起的 y 的取值變化,也稱為可解釋的平方和的取值變化,也稱為可解釋的平方和3. 殘差平方和(SSE)反映除反映除 x 以外的其他因

20、素對以外的其他因素對 y 取值的影響,也取值的影響,也稱為不可解釋的平方和或剩余平方和稱為不可解釋的平方和或剩余平方和圖示圖示yxy10bb+yy yyyy ),(iiyx擬合優度檢驗擬合優度檢驗判定系數判定系數 r2 1. 回歸平方和占總離差平方和的比例niiniiniiniiyyyyyyyySSTSSRr12121212212. 反映回歸直線的擬合程度反映回歸直線的擬合程度3. 取值范圍在取值范圍在 0 , 1 之間之間4. r2 1,說明回歸方程擬合的越好;,說明回歸方程擬合的越好;r20,說明回歸方程擬合的越差說明回歸方程擬合的越差5. 判定系數等于相關系數的平方,即判定系數等于相關系

21、數的平方,即r2(r)2擬合優度檢驗擬合優度檢驗估計標準誤差估計標準誤差 Sy1. 實際觀察值與回歸估計值離差平方和的均方根實際觀察值與回歸估計值離差平方和的均方根2. 反映實際觀察值在回歸直線周圍的分散狀況反映實際觀察值在回歸直線周圍的分散狀況3. 從另一個角度說明了回歸直線的擬合程度從另一個角度說明了回歸直線的擬合程度4. 計算公式為計算公式為22111212nyxbyaynyySniiiniiniiniiiy線性關系的檢驗線性關系的檢驗1. 檢驗自變量和因變量之間的線性關系是否顯著檢驗自變量和因變量之間的線性關系是否顯著2. 具體方法是將回歸離差平方和具體方法是將回歸離差平方和(SSR)

22、同剩余離差平同剩余離差平方和方和(SSE)加以比較,應用加以比較,應用F檢驗來分析二者之間檢驗來分析二者之間的差別是否顯著的差別是否顯著如果是顯著的,兩個變量之間存在線性關系如果是顯著的,兩個變量之間存在線性關系如果不顯著,兩個變量之間不存在線性關系如果不顯著,兩個變量之間不存在線性關系檢驗的步驟檢驗的步驟1. 提出假設H0:線性關系不顯著:線性關系不顯著)2,1 (21211212nFnyyyynSSESSRFniinii回歸系數的顯著性檢驗回歸系數的顯著性檢驗1b樣本統計量樣本統計量 的分布的分布1b1. 1. 是根據最小二乘法求出的樣本統計量,它有自己是根據最小二乘法求出的樣本統計量,它

23、有自己的分布的分布2. 2. 的分布具有如下性質的分布具有如下性質分布形式:正態分布分布形式:正態分布數學期望:數學期望:標準差:標準差:由于由于 未知,需用其估計量未知,需用其估計量S Sy y來代替得到來代替得到 的估計的標的估計的標準差準差21xxSSiyb21xxib11)(bbE1b1b1b樣本統計量樣本統計量 的分布的分布1b1b11)(bbE1b21xxSSiyb回歸系數的顯著性檢驗步驟回歸系數的顯著性檢驗步驟1. 提出假設提出假設H0: b b1 = 0 (沒有線性關系沒有線性關系) H1: b b1 0 (有線性關系有線性關系) 2. 計算檢驗的統計量計算檢驗的統計量) 2(

24、11ntStbb實例實例1. 提出假設提出假設H0:b b1 = 0 人均收入與人均消費之間無線性關系人均收入與人均消費之間無線性關系H1:b b1 0 人均收入與人均消費之間有線性關系人均收入與人均消費之間有線性關系2. 計算檢驗的統計量計算檢驗的統計量0758.65827.341603495.1452638. 02t1、一元線性回歸分析案例、一元線性回歸分析案例現有現有1997-2013年某地區全社會固定資產投資總額年某地區全社會固定資產投資總額NINV和國內生產總值和國內生產總值GDP兩個指標的年度數據。兩個指標的年度數據。試研究試研究NINV和和GDP的數量關系,并建立全社會的數量關系

25、,并建立全社會NINV和和GDP的線性回歸方程。的線性回歸方程。思路和主要步驟思路和主要步驟 繪制散點圖繪制散點圖 計算相關系數計算相關系數 線性回歸分析線性回歸分析 1、分析、分析回歸回歸線性線性 2、選擇被解釋變量(因變量)、選擇被解釋變量(因變量) 3、選擇解釋變量(自變量)、選擇解釋變量(自變量)練習練習1 完成上例,并對輸出結果進行解釋完成上例,并對輸出結果進行解釋2、多元線性回歸分析案例、多元線性回歸分析案例 利用利用“高校科研研究高校科研研究”數據,分析數據,分析立項課題數立項課題數(X5)與與投入人年數(投入人年數(X2)、投入高級職稱的人投入高級職稱的人年數(年數(X3)、投

26、入科研事業費(投入科研事業費(X4)、專著數專著數(X6)、論文數(論文數(X7)、獲獎數(獲獎數(X8)之間的之間的線性關系線性關系主要步驟主要步驟 1、分析、分析回歸回歸線性線性 2、選擇被解釋變量(因變量)、選擇被解釋變量(因變量) 3、選擇解釋變量(自變量)、選擇解釋變量(自變量) 4、選擇回歸分析中解釋變量的篩選策略、選擇回歸分析中解釋變量的篩選策略 5、練習練習2 完成上例,盡量解釋輸出結果完成上例,盡量解釋輸出結果四、曲線估計四、曲線估計1、SPSS中的本質線性模型中的本質線性模型0122012012110 10101(Quadratic):(Compound):()ln( )ln()(Growth)ln()ln(二二次次曲曲線線復復合合曲曲線線增增長長曲曲:)線線xbb xybb xb xybb xb xxxyb bybb xyeybb x+ +1、SPSS中

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論