




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、授課人:張授課人:張 星星 在數量分析中,經常會看到變量與變量之間在數量分析中,經常會看到變量與變量之間存在著一定的聯系。要了解變量之間如何發生相存在著一定的聯系。要了解變量之間如何發生相互影響的,就需要利用相關分析和回歸分析。在互影響的,就需要利用相關分析和回歸分析。在上一章講述了相關分析有關內容。本章介紹回歸上一章講述了相關分析有關內容。本章介紹回歸分析基本概念,回歸分析的主要類型:一元線性分析基本概念,回歸分析的主要類型:一元線性回歸分析、多元線性回歸分析、非線性回歸分析、回歸分析、多元線性回歸分析、非線性回歸分析、曲線估計、時間序列的曲線估計、含虛擬自變量曲線估計、時間序列的曲線估計、
2、含虛擬自變量的回歸分析以及邏輯回歸分析等。的回歸分析以及邏輯回歸分析等。 相關分析和回歸分析都是研究變量間關系的相關分析和回歸分析都是研究變量間關系的統計學課題。在應用中,兩種分析方法經常相互統計學課題。在應用中,兩種分析方法經常相互結合和滲透,但它們研究的側重點和應用面不同。結合和滲透,但它們研究的側重點和應用面不同。 在回歸分析中,變量在回歸分析中,變量y y稱為因變量,處于稱為因變量,處于被解釋的特殊地位;而在相關分析中,變量被解釋的特殊地位;而在相關分析中,變量y y與與變量變量x x處于平等的地位,研究變量處于平等的地位,研究變量y y與變量與變量x x的密的密切程度和研究變量切程度
3、和研究變量x x與變量與變量y y的密切程度是一樣的。的密切程度是一樣的。 在回歸分析中,因變量在回歸分析中,因變量y y是隨機變量,自是隨機變量,自變量變量x x可以是隨機變量,也可以是非隨機的確定可以是隨機變量,也可以是非隨機的確定變量;而在相關分析中,變量變量;而在相關分析中,變量x x和變量和變量y y都是隨機都是隨機變量。變量。 相關分析是測定變量之間的關系密切程相關分析是測定變量之間的關系密切程度,所使用的工具是相關系數;而回歸分析則是度,所使用的工具是相關系數;而回歸分析則是側重于考察變量之間的數量變化規律,并通過一側重于考察變量之間的數量變化規律,并通過一定的數學表達式來描述變
4、量之間的關系,進而確定的數學表達式來描述變量之間的關系,進而確定一個或者幾個變量的變化對另一個特定變量的定一個或者幾個變量的變化對另一個特定變量的影響程度。影響程度。 作為處理變量之間關系的一種統計方法和技作為處理變量之間關系的一種統計方法和技術,回歸分析的基本思想和方法以及術,回歸分析的基本思想和方法以及“回歸回歸(RegressionRegression)”名稱的由來都要歸功于英國統名稱的由來都要歸功于英國統計學家計學家F FGaltonGalton(1822182219111911)。)。 7.1 線性回歸分析7.1.1線性回歸分析概述線性回歸分析概述線性回歸分析的內容線性回歸分析的內容
5、n能否找到一個線性組合來說明一組自變量和因變量的關系n如果能的話,這種關系的強度有多大,也就是利用自變量的線性組合來預測因變量的能力有多強n整體解釋能力是否具有統計上的顯著性意義n在整體解釋能力顯著的情況下,哪些自變量有顯著意義回歸分析的一般步驟回歸分析的一般步驟n確定回歸方程中的解釋變量(自變量)和被解釋變量(因變量)n確定回歸方程n對回歸方程進行各種檢驗利用回歸方程進行預測7.1.2 線性回歸模型線性回歸模型 一元線性回歸模型的數學模型:一元線性回歸模型的數學模型: 其中x為自變量;y為因變量; 為截距,即常量; 為回歸系數,表明自變量對因變量的影響程度。xy1001 用最小二乘法求解方程
6、中的兩個參數,得到:用最小二乘法求解方程中的兩個參數,得到:21)()(xxyyxxiiixby 0多元線性回歸模型多元線性回歸方程:多元線性回歸方程: y=0+1x1+2x2+.+kxkn1、2、k為偏回歸系數。n1表示在其他自變量保持不變的情況下,自變量x1變動一個單位所引起的因變量y的平均變動。 7.1.3 線性回歸方程的統計檢驗線性回歸方程的統計檢驗l7.1.3.1回歸方程的擬合優度回歸方程的擬合優度 回歸直線與各觀測點的接近程度稱為回歸方程回歸直線與各觀測點的接近程度稱為回歸方程的擬合優度,的擬合優度,也就是樣本觀測值聚集在回歸線周圍的緊密程度,從而判斷回歸也就是樣本觀測值聚集在回歸
7、線周圍的緊密程度,從而判斷回歸方程對樣本數據的代表程度。方程對樣本數據的代表程度。 1、離差平方和的分解:、離差平方和的分解: 建立直線回歸方程可知:建立直線回歸方程可知:y的觀測值的總變動可由的觀測值的總變動可由 來反映,稱為總變差。引起總變差的原因有兩個:來反映,稱為總變差。引起總變差的原因有兩個:n由于由于x的取值不同,使得與的取值不同,使得與x有線性關系的有線性關系的y值不同;值不同;n隨機因素的影響。隨機因素的影響。2)( yy總離差平方和可分解為222yyyyyy 即:總離差平方和(即:總離差平方和(SST)=SST)=剩余離差平方和剩余離差平方和(SSE) +(SSE) +回歸回
8、歸離差平方和(離差平方和(SSR)SSR) 其中:其中:SSRSSR是由是由x x和和y y的直線回歸關系引起的,可以由回歸的直線回歸關系引起的,可以由回歸直線做出解釋;直線做出解釋;SSESSE是除了是除了x x對對y y的線性影響之外的隨機因素所的線性影響之外的隨機因素所引起的引起的Y Y的變動,是回歸直線所不能解釋的。的變動,是回歸直線所不能解釋的。2 2、可決系數(判定系數、決定系數)、可決系數(判定系數、決定系數) 回歸平方和在總離差平方和中所占的比例可以作為一個統回歸平方和在總離差平方和中所占的比例可以作為一個統計指標,用來衡量計指標,用來衡量X與與Y 的關系密切程度以及回歸直線的
9、代表的關系密切程度以及回歸直線的代表性好壞,稱為可決系數。性好壞,稱為可決系數。n對于一元線性回歸方程:對于一元線性回歸方程:22222211yyyyyyyyRSSTSSESSTSSESSTSSTSSRR 在多元線性回歸分析中,引起判定系數增加的原因有兩個:一個是方程中的解釋變量個數增多,另一個是方程中引入了對被解釋變量有重要影響的解釋變量。如果某個自變量引入方程后對因變量的線性解釋有重要貢獻,那么必然會使誤差平方和顯著減小,并使平均的誤差平方和也顯著減小,從而使調整的判定系數提高。所以在多元線性回歸分析中,調整的判定系數比判定系數更能準確的反映回歸方程的擬合優度。1/1/1122nSSTpn
10、SSERSSTSSER對于多元線性回歸方程:對于多元線性回歸方程:7.1.3.2回歸方程的顯著性檢驗(方差分析回歸方程的顯著性檢驗(方差分析F檢驗)檢驗) 回歸方程的顯著性檢驗是要檢驗被解釋變量與所有的解釋回歸方程的顯著性檢驗是要檢驗被解釋變量與所有的解釋變量之間的線性關系是否顯著。回歸方程的顯著性檢驗一般采變量之間的線性關系是否顯著。回歸方程的顯著性檢驗一般采用用F檢驗,利用方差分析的方法進行。檢驗,利用方差分析的方法進行。 n 對于一元線性回歸方程,檢驗統計量為:對于一元線性回歸方程,檢驗統計量為:n 對于多元線性回歸方程,檢驗統計量為:對于多元線性回歸方程,檢驗統計量為:),(21)2/
11、() (1/)()2/(1/22nFnyyyynSSESSRF),(1p) 1/() (/)() 1/(/22pnFpnyypyypnSSEpSSRF7.1.3.3回歸系數的顯著性檢驗(回歸系數的顯著性檢驗(t檢驗)檢驗) 回歸系數的顯著性檢驗是要檢驗回歸方程中被解釋變量與回歸系數的顯著性檢驗是要檢驗回歸方程中被解釋變量與每一個解釋變量之間的線性關系是否顯著。每一個解釋變量之間的線性關系是否顯著。 之所以對回歸系數進行顯著性檢驗,是因為回歸方程的顯之所以對回歸系數進行顯著性檢驗,是因為回歸方程的顯著性檢驗只能檢驗所有回歸系數是否同時與零有顯著性差異著性檢驗只能檢驗所有回歸系數是否同時與零有顯著
12、性差異,它不能保證回歸方程中不包含不能較好解釋說明因變量變,它不能保證回歸方程中不包含不能較好解釋說明因變量變化的自變量。因此,可以通過回歸系數顯著性檢驗對每個回化的自變量。因此,可以通過回歸系數顯著性檢驗對每個回歸系數進行考察。歸系數進行考察。 7.1.3.3回歸系數的顯著性檢驗(回歸系數的顯著性檢驗(t檢驗)檢驗)n 對于一元線性回歸方程,檢驗統計量為:對于一元線性回歸方程,檢驗統計量為: 2)()2()(221nyySntxxtiiyi其中,n對于多元線性回歸方程,檢驗統計量為:對于多元線性回歸方程,檢驗統計量為:1)() 1()(22pnyySpntxxtiiyiijii其中,7.1.
13、3.4殘差分析殘差分析 殘差是指由回歸方程計算得到的預測值與實際樣本值之間殘差是指由回歸方程計算得到的預測值與實際樣本值之間的差距,定義為:的差距,定義為: 對于線性回歸分析來講,如果方程能夠較好的反映被解釋對于線性回歸分析來講,如果方程能夠較好的反映被解釋變量的特征和規律性,那么殘差序列中應不包含明顯的規律變量的特征和規律性,那么殘差序列中應不包含明顯的規律性。殘差分析包括以下內容:殘差服從正態分布,其平均值性。殘差分析包括以下內容:殘差服從正態分布,其平均值等于等于0;殘差取值與;殘差取值與X的取值無關;殘差不存在自相關;殘差的取值無關;殘差不存在自相關;殘差方差相等。方差相等。 ).(2
14、2110ppiiiixxxyyye1、對于殘差均值和方差齊性檢驗可以利用殘差圖進行分析。如、對于殘差均值和方差齊性檢驗可以利用殘差圖進行分析。如果殘差均值為零,殘差圖的點應該在縱坐標為果殘差均值為零,殘差圖的點應該在縱坐標為0的中心的帶狀的中心的帶狀區域中隨機散落。如果殘差的方差隨著解釋變量值(或被解區域中隨機散落。如果殘差的方差隨著解釋變量值(或被解釋變量值)的增加呈有規律的變化趨勢,則出現了異方差現釋變量值)的增加呈有規律的變化趨勢,則出現了異方差現象。象。2、DW檢驗。檢驗。 DW檢驗用來檢驗殘差的自相關。檢驗統計量為檢驗用來檢驗殘差的自相關。檢驗統計量為: DW=2表示無自相關,在表示
15、無自相關,在0-2之間說明存在正自相關,之間說明存在正自相關,在在2-4之間說明存在負的自相關。一般情況下,之間說明存在負的自相關。一般情況下,DW值在值在1.5-2.5之間即可說明無自相關現象。之間即可說明無自相關現象。)1 (2)(22221nttnttteeeDW7.1.3.5多重共線性分析多重共線性分析 多重共線性是指解釋變量之間存在線性相關關系的現象多重共線性是指解釋變量之間存在線性相關關系的現象。測度多重共線性一般有以下方式:。測度多重共線性一般有以下方式:1、容忍度:、容忍度: 其中,其中, 是第是第i個解釋變量與方程中其他解釋變量間的復相個解釋變量與方程中其他解釋變量間的復相關
16、系數的平方,表示解釋變量之間的線性相關程度。容忍度關系數的平方,表示解釋變量之間的線性相關程度。容忍度的取值范圍在的取值范圍在0-1之間,越接近之間,越接近0表示多重共線性越強,越接表示多重共線性越強,越接近近1表示多重共線性越弱。表示多重共線性越弱。2、方差膨脹因子、方差膨脹因子VIF。方差膨脹因子是容忍度的倒數。方差膨脹因子是容忍度的倒數。VIF越越大多重共線性越強,當大多重共線性越強,當VIF大于等于大于等于10時,說明存在嚴重的時,說明存在嚴重的多重共線性。多重共線性。 21iiRTol2iR3、特征根和方差比。根據解釋變量的相關系數矩陣求得的特征、特征根和方差比。根據解釋變量的相關系
17、數矩陣求得的特征根中,如果最大的特征根遠遠大于其他特征根,則說明這些根中,如果最大的特征根遠遠大于其他特征根,則說明這些解釋變量間具有相當多的重復信息。如果某個特征根既能夠解釋變量間具有相當多的重復信息。如果某個特征根既能夠刻畫某解釋變量方差的較大部分比例(刻畫某解釋變量方差的較大部分比例(0.7以上),又能刻畫以上),又能刻畫另一解釋變量方差的較大部分比例,則表明這兩個解釋變量另一解釋變量方差的較大部分比例,則表明這兩個解釋變量間存在較強的線性相關關系。間存在較強的線性相關關系。4、條件指數。指最大特征根與第、條件指數。指最大特征根與第i個特征根比的平方根。通常,個特征根比的平方根。通常,當
18、條件指數在當條件指數在0-10之間時說明多重共線性較弱;當條件指數之間時說明多重共線性較弱;當條件指數在在10-100之間說明多重共線性較強;當條件指數大于之間說明多重共線性較強;當條件指數大于100時說明存在嚴重的多重共線性。時說明存在嚴重的多重共線性。 imik7.1.3 線性回歸分析的基本操作線性回歸分析的基本操作(1)選擇菜單)選擇菜單AnalyzeRegressionLinear,出現窗口:出現窗口:(2)選擇被解釋變量進入)選擇被解釋變量進入Dependent框。框。(3)選擇一個或多個解釋變量進入)選擇一個或多個解釋變量進入Independent(s)框。框。(4)在)在Meth
19、od框中選擇回歸分析中解釋變量的框中選擇回歸分析中解釋變量的篩選策略。其中篩選策略。其中Enter表示所選變量強行進入回表示所選變量強行進入回歸方程,是歸方程,是SPSS默認的策略,通常用在一元線默認的策略,通常用在一元線性回歸分析中;性回歸分析中;Remove表示從回歸方程中剔除表示從回歸方程中剔除所選變量;所選變量;Stepwise表示逐步篩選策略;表示逐步篩選策略;Backward表示向后篩選策略;表示向后篩選策略;Forward表示表示向前篩選策略。向前篩選策略。注:多元回歸分析中,變量的篩選一般有向前篩選、向后篩多元回歸分析中,變量的篩選一般有向前篩選、向后篩選、逐步篩選三種基本策略
20、。選、逐步篩選三種基本策略。向前篩選(向前篩選( Forward )策略:解釋變量不斷進入回歸方程)策略:解釋變量不斷進入回歸方程的過程。首先,選擇與被解釋變量具有最高線性相關系數的過程。首先,選擇與被解釋變量具有最高線性相關系數的變量進入方程,并進行回歸方程的各種檢驗;然后,在的變量進入方程,并進行回歸方程的各種檢驗;然后,在剩余的變量中尋找與被解釋變量偏相關系數最高且通過檢剩余的變量中尋找與被解釋變量偏相關系數最高且通過檢驗的變量進入回歸方程,并對新建立的回歸方程進行各種驗的變量進入回歸方程,并對新建立的回歸方程進行各種檢驗;這個過程一直重復,直到再也沒有可進入方程的變檢驗;這個過程一直重
21、復,直到再也沒有可進入方程的變量為止。量為止。向后篩選(向后篩選( Backward )策略:變量不斷剔除出回歸方程)策略:變量不斷剔除出回歸方程的過程。首先,所有變量全部引入回歸方程,并對回歸方的過程。首先,所有變量全部引入回歸方程,并對回歸方程進行各種檢驗;然后,在回歸系數顯著性檢驗不顯著的程進行各種檢驗;然后,在回歸系數顯著性檢驗不顯著的一個或多個變量中,剔除一個或多個變量中,剔除t檢驗值最小的變量,并重新建立檢驗值最小的變量,并重新建立 回歸方程和進行各種檢驗;如果新建回歸方程中所有變量回歸方程和進行各種檢驗;如果新建回歸方程中所有變量的回歸系數檢驗都顯著,則回歸方程建立結束。否則按上
22、的回歸系數檢驗都顯著,則回歸方程建立結束。否則按上述方法再一次剔除最不顯著的變量,直到再也沒有可剔除述方法再一次剔除最不顯著的變量,直到再也沒有可剔除的變量為止。的變量為止。逐步篩選(逐步篩選( Stepwise )策略:在向前篩選策略的基礎上)策略:在向前篩選策略的基礎上結合向后篩選策略,在每個變量進入方程后再次判斷是否結合向后篩選策略,在每個變量進入方程后再次判斷是否存在應該剔除出方程的變量。因此,逐步篩選策略在引入存在應該剔除出方程的變量。因此,逐步篩選策略在引入變量的每一個階段都提供了再剔除不顯著變量的機會。變量的每一個階段都提供了再剔除不顯著變量的機會。(5)第三和第四步中確定的解釋
23、變量及變量篩選策略可放)第三和第四步中確定的解釋變量及變量篩選策略可放置在不同的塊(置在不同的塊(Block)中。通常在回歸分析中不止一組)中。通常在回歸分析中不止一組待進入方程的解釋變量和相應的篩選策略,可以單擊待進入方程的解釋變量和相應的篩選策略,可以單擊Next和和Previous按鈕設置多組解釋變量和變量篩選策按鈕設置多組解釋變量和變量篩選策略并放置在不同的塊中。略并放置在不同的塊中。(6)選擇一個變量作為條件變量放到)選擇一個變量作為條件變量放到Selection Variable框中,并單擊框中,并單擊Rule按鈕給定一個判斷條件。只按鈕給定一個判斷條件。只有變量值滿足判定條件的樣
24、本才參與線性回歸分析。有變量值滿足判定條件的樣本才參與線性回歸分析。(7)在)在Case Labels框中指定哪個變量作為樣本數據點的框中指定哪個變量作為樣本數據點的標志變量,該變量的值將標在回歸分析的輸出圖形中。標志變量,該變量的值將標在回歸分析的輸出圖形中。7.1.5 線性回歸分析的其他操作線性回歸分析的其他操作1、Statistics按鈕,出現的窗口可供用戶選擇更多按鈕,出現的窗口可供用戶選擇更多的輸出統計量。的輸出統計量。(1)Estimates:SPSS默認輸出項,輸出與回歸默認輸出項,輸出與回歸系數相關的統計量。包括回歸系數(偏回歸系數系數相關的統計量。包括回歸系數(偏回歸系數)、
25、回歸系數標準誤差、標準化回歸系數、回歸)、回歸系數標準誤差、標準化回歸系數、回歸系數顯著性檢驗的系數顯著性檢驗的t統計量和概率統計量和概率p值,各解釋變值,各解釋變量的容忍度。量的容忍度。(2)Confidence Intervals:輸出每個非標準化:輸出每個非標準化回歸系數回歸系數95的置信區間。的置信區間。(3)Descriptive:輸出各解釋變量和被解釋變量:輸出各解釋變量和被解釋變量的均值、標準差、相關系數矩陣及單側檢驗概率的均值、標準差、相關系數矩陣及單側檢驗概率p值。值。(4)Model fit:SPSS默認輸出項,輸出判定系默認輸出項,輸出判定系數、調整的判定系數、回歸方程的
26、標準誤差、回數、調整的判定系數、回歸方程的標準誤差、回歸方程顯著歸方程顯著F檢驗的方程分析表。檢驗的方程分析表。(5)R squared change:輸出每個解釋變量進:輸出每個解釋變量進入方程后引起的判定系數的變化量和入方程后引起的判定系數的變化量和F值的變化值的變化量。量。(6)Part and partial correlation:輸出方程中:輸出方程中各解釋變量與被解釋變量之間的簡單相關、偏相各解釋變量與被解釋變量之間的簡單相關、偏相關系數。關系數。(7)Covariance matrix:輸出方程中各解釋變量:輸出方程中各解釋變量間的相關系數、協方差以及各回歸系數的方差。間的相關
27、系數、協方差以及各回歸系數的方差。(8)Collinearity Diagnostics:多重共線性分析:多重共線性分析,輸出各個解釋變量的容忍度、方差膨脹因子、特,輸出各個解釋變量的容忍度、方差膨脹因子、特征值、條件指標、方差比例等。征值、條件指標、方差比例等。(9)在)在Residual框中:框中:Durbin-waston表示輸出表示輸出DW檢驗值;檢驗值;Casewise Diagnostic表示輸出表示輸出標準化殘差絕對值大于等于標準化殘差絕對值大于等于3(SPSS默認值)的默認值)的樣本數據的相關信息,包括預測值、殘差、杠桿值樣本數據的相關信息,包括預測值、殘差、杠桿值等。等。2、
28、Options選項,出現的窗口可供用戶設置多元線選項,出現的窗口可供用戶設置多元線性回歸分析中解釋變量篩選的標準以及缺失值的性回歸分析中解釋變量篩選的標準以及缺失值的處理方式。處理方式。3、Plot選項,出現的窗口用于對殘差序列的分析。選項,出現的窗口用于對殘差序列的分析。(1)窗口左邊框中各變量名的含義是:)窗口左邊框中各變量名的含義是:DEPENDNT表示表示被解釋變量,被解釋變量,*ZPRED表示標準化預測值,表示標準化預測值,*ZRESID表示標準化殘差,表示標準化殘差,*DRESID表示剔除殘差,表示剔除殘差,*ADJPRED表示調整的預測值,表示調整的預測值,*SRESID表示學生
29、化表示學生化殘差,殘差,*SDRESID表示剔除學生化殘差。表示剔除學生化殘差。(2)繪制多對變量的散點圖,可根據需要在)繪制多對變量的散點圖,可根據需要在scatter框中框中定義散點圖的縱坐標和橫坐標變量。定義散點圖的縱坐標和橫坐標變量。(3)在)在Standardized Residual Plots框中選擇框中選擇Histogram選項繪制標準化殘差序列的直方圖;選擇選項繪制標準化殘差序列的直方圖;選擇Normal probability plot繪制標準化殘差序列的正態繪制標準化殘差序列的正態分布累計概率圖。選擇分布累計概率圖。選擇Produce all partial plots選
30、選項表示依次繪制被解釋變量和各個解釋變量的散點圖。項表示依次繪制被解釋變量和各個解釋變量的散點圖。4、Save選項,該窗口將回歸分析的某些結果以選項,該窗口將回歸分析的某些結果以SPSS變量變量的形式保存到數據編輯窗口中,并可同時生成的形式保存到數據編輯窗口中,并可同時生成XML格式的格式的文件,便于分析結果的網絡發布。文件,便于分析結果的網絡發布。(1)Predicted Values框中:保存非標準化預測值、標框中:保存非標準化預測值、標準化預測值、調整的預測值和預測值的均值標準誤差。準化預測值、調整的預測值和預測值的均值標準誤差。(2)Distance框中:保存均值或個體預測值框中:保存
31、均值或個體預測值95(默認)(默認)置信區間的下限值和上限值。置信區間的下限值和上限值。(3)Residual框中:保存非標準化殘差、標準化殘差等。框中:保存非標準化殘差、標準化殘差等。(4)Influence Statistics框中:保存剔除第框中:保存剔除第i個樣本后統個樣本后統計量的變化量。計量的變化量。5、WSL選項,采用加權最小二乘法替代普通最小二乘法估計選項,采用加權最小二乘法替代普通最小二乘法估計回歸參數,并指定一個變量作為權重變量。回歸參數,并指定一個變量作為權重變量。 以以“高校科研研究高校科研研究”數據為例,建立回歸方程研究數據為例,建立回歸方程研究 1、課題總數受論文數
32、的影響、課題總數受論文數的影響 2、以課題總數為被解釋變量,解釋變量為投入人年數(、以課題總數為被解釋變量,解釋變量為投入人年數(X2)、受投入高級職稱的人年數()、受投入高級職稱的人年數(X3)、投入科研事業費()、投入科研事業費(X4)、專著數()、專著數(X6)、論文數()、論文數(X7)、獲獎數()、獲獎數(X8)。)。 (1)解釋變量采用強制進入策略()解釋變量采用強制進入策略(Enter),并做多重共線),并做多重共線性檢測。性檢測。 (2)解釋變量采用向后篩選策略讓)解釋變量采用向后篩選策略讓SPSS自動完成解釋變量自動完成解釋變量的選擇。的選擇。 (3)解釋變量采用逐步篩選策略
33、讓)解釋變量采用逐步篩選策略讓SPSS自動完成解釋變量自動完成解釋變量的選擇。的選擇。 7.1.5 應用舉例應用舉例7.2 曲線估計7.2.1 曲線估計概述曲線估計概述 變量間的相關關系中,并不總是表現出線性變量間的相關關系中,并不總是表現出線性關系,非線性關系也是極為常見的。變量之間的關系,非線性關系也是極為常見的。變量之間的非線性關系可以劃分為本質線性關系和本質非線非線性關系可以劃分為本質線性關系和本質非線性關系。性關系。 本質線性關系本質線性關系是指變量關系形式上雖然呈非是指變量關系形式上雖然呈非線性關系,但可通過變量變換為線性關系,并最線性關系,但可通過變量變換為線性關系,并最終可通過
34、線性回歸分析建立線性模型。終可通過線性回歸分析建立線性模型。本質非線本質非線性關系性關系是指變量關系不僅形式上呈非線性關系,是指變量關系不僅形式上呈非線性關系,而且也無法變換為線性關系。本節的曲線估計是而且也無法變換為線性關系。本節的曲線估計是解決本質線性關系問題的。解決本質線性關系問題的。常見的本質線性模型有:常見的本質線性模型有:1、二次曲線(二次曲線(Quadratic),),方程為方程為 ,變量變換后的方程為,變量變換后的方程為2、復合曲線(復合曲線(Compound),),方程為方程為,變量變換后的方程為,變量變換后的方程為3、增長曲線(增長曲線(Growth),),方程為方程為,變
35、量變換后的方程為,變量變換后的方程為2012yxx2012 11()yxx xx01xy 01ln( )ln()ln()yx01xye01ln( )yx4、對數曲線(對數曲線(Logarithmic),),方程為方程為 ,變量變換后的線性方程,變量變換后的線性方程為為5、三次曲線(三次曲線(Cubic),),方程為方程為,變量變換后的方程為,變量變換后的方程為6、S曲線(曲線(S),),方程為方程為 ,變量變,變量變換后的方程為換后的方程為7、指數曲線(指數曲線(Exponential),),方程為方程為,變量變換后的線性方程為,變量變換后的線性方程為01ln( )yx01 1yx230123
36、yxxx012 132yxxx01/xye01 1ln( )yx10 xye01ln( )ln()yx8、逆函數(逆函數(Inverse),),方程為方程為變量變換后的方程為變量變換后的方程為9、冪函數(冪函數(Power),),方程為方程為變量變換后的方程為變量變換后的方程為10、邏輯函數(邏輯函數(Logistic),),方程為方程為 變量變換后的線性方程為變量變換后的線性方程為01/yx01 1yx10()yx01ln( )ln()ln( )yx0111/xy 0111ln()ln(ln() )xy SPSS曲線估計中,首先,在不能明確究竟曲線估計中,首先,在不能明確究竟哪種模型更接近樣
37、本數據時,可在多種可選擇的哪種模型更接近樣本數據時,可在多種可選擇的模型中選擇幾種模型;然后模型中選擇幾種模型;然后SPSS自動完成模型自動完成模型的參數估計,并輸出回歸方程顯著性檢驗的的參數估計,并輸出回歸方程顯著性檢驗的F值值和概率和概率p值、判定系數值、判定系數R2等統計量;最后,以判等統計量;最后,以判定系數為主要依據選擇其中的最優模型,并進行定系數為主要依據選擇其中的最優模型,并進行預測分析等。另外,預測分析等。另外,SPSS曲線估計還可以以時曲線估計還可以以時間為解釋變量實現時間序列的簡單回歸分析和趨間為解釋變量實現時間序列的簡單回歸分析和趨勢外推分析。勢外推分析。7.2.2 曲線
38、估計的基本操作曲線估計的基本操作 可通過繪制并觀察樣本數據的散點圖粗略確可通過繪制并觀察樣本數據的散點圖粗略確定被解釋變量和解釋變量之間的相關關系,為曲定被解釋變量和解釋變量之間的相關關系,為曲線擬合中的模型選擇提供依據。線擬合中的模型選擇提供依據。SPSS曲線估計曲線估計的基本操作步驟是:的基本操作步驟是:(1)選擇菜單)選擇菜單AnalyzeRegressionCurve Estimation,出現窗口如下頁所示。,出現窗口如下頁所示。(2)把被解釋變量選到)把被解釋變量選到Dependent框中。框中。(3)曲線估計中的解釋變量可以是相關因素變量也可是時)曲線估計中的解釋變量可以是相關因素變量也可是時間變量。如果解釋變量為相關因素變量,則選擇間變量。如果解釋變量為相關因素變量,則選擇Variable選項,并把一個解釋變量指定到選項,并把一個解釋變量指定到Independent框;如果框;如果選擇選擇Time參數則表示解釋變量為時間變量。參數則表示解釋變量為時間變量。(4)在)在Models中選擇幾種模型。中選擇幾種模型。(5)選擇)選擇Plot Models選項繪制回歸線;選擇選項繪制回歸線;選擇Display ANOVA table輸出各個模型的方差分析
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 了解國際畜牧業動態的試題及答案
- 2025年特許金融分析師考生備考指南試題及答案
- 畜牧師職稱考試成功之道試題及答案
- 2025年國際金融理財師考試中的財務分析技巧解讀試題及答案
- 畜牧師職稱考試重要知識點試題及答案
- 畜牧師職稱考試特色試題及答案
- 特許金融分析師考試怎樣進行知識補充試題及答案
- 如何提升自己的理財技能試題及答案
- 2024小語種能力提升試題及答案
- 銀行客戶投訴處理實務試題及答案
- 防洪工程施工組織設計+
- CAD培訓課件(基礎教程)
- 苯酚的分子組成和結構課件
- 大學生心理朋輩技能大賽考試題庫(含答案)
- DB32T 3544-2019 臨床級人體組織來源間充質干細胞 質量控制管理規范
- 國藥茶色素講稿30課件
- 魯科版五年級英語下How many ducks do you have?課件2
- 醫院藥品信息管理系統(DOC)
- isa-381g站用變接地保護測控裝置技術使用說明書南網版v3
- 計算機應用基礎(中等職業學校校本教材)
- 完整版健康管理師
評論
0/150
提交評論