多元統計分析實例剖析_第1頁
多元統計分析實例剖析_第2頁
多元統計分析實例剖析_第3頁
多元統計分析實例剖析_第4頁
多元統計分析實例剖析_第5頁
已閱讀5頁,還剩5頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、交通學院小組作業從2010年統計摘要上獲得了民航客運量和它的影響因素的數據。若以Y表示民航客運量(萬人),X1表示國民收入總值(億元),X2表示消費金額(億元),X3表示鐵路承載量(萬人)X4 表示民航航線距離(萬公里),X5表示境外旅客人數(萬人),則可以得到下表:年份YX1X2X3X4X5199527731622266977891821719963584020263410366719504199741244263037110645236841998481472933591143602693219995345110366511990628951200046956834030127253271

2、1372001665678246861324243115422002893842458551345323321402003119694316662130295392738200415721117676631349154732282005173014086964614717445380320061540158111080613656857294020071992172611159611485461329520082614198681316311409767400320093463242681558211963210039742010406029858191391265501154983參數估計通

3、過SPSS軟件的處理可以得到以下的結果CoefficientsaModelUnstandardized CoefficientsStandardized CoefficientstSig.BStd. ErrorBeta1(Constant)714.040213.3783.346.007x1.396.0972.7514.106.002x2-.618.141-2.735-4.391.001x3-.008.002-.094-4.028.002x419.7294.541.4854.345.001x5.429.054.5567.968.000a. Dependent Variable: y由以上的表格可

4、以行到各個參數的估計值,從而可以得到:回歸系數的解釋1、常系數表示,當時的值。2、回歸系數有兩種解釋。一種是,當變化一個單位而其他預測變量固定取常數時,的該變量,這個該變量與其他預測變量固定取什么常數無關。在實際中,預測變量間往往是有關聯的,可能無法做到固定某些預測變量的值而改變其他變量的值。這是這種解釋的弱點。另一種表示,經過其他預測變量的“調整”后,對響應變量的貢獻。現以回歸系數的估算為例來說明這種解釋。1)擬合對,的回歸模型。記此回歸的殘差為,擬合的回歸方程為2)擬合對,的回歸模型。記此回歸的殘差為,擬合的回歸方程為殘差和的值見下表。偏殘差表行號1-62.66337.2112316.50

5、660.955397.96117.3474-97.800-47.6435-167.50313.5896-2.95312.2297116.31214.7628101.26129.3469-212.794-102.43610-63.323-70.70711238.516171.78112-247.931-130.82213-205.675-157.6961435.24666.20615-18.57651.48616173.41634.3913)擬合殘差對的簡單回歸模型的回歸方程為在此回歸方程中的系數與全模型擬合的方程中的系數是一樣的,都是0.396。由上述計算過程可以看出這種解釋比第一種解釋統計意

6、義更深刻一些。中心化和規范化中心化:年份yX1X2X3X4X51995-1114-8343.94-5470.81-25002.31-28-2099.941996-1033-7485.94-5102.81-19124.31-27-1812.941997-979-7079.94-4699.81-12146.31-23-1632.941998-910-6776.94-4377.81-8431.31-20-1384.941999-857-6395.94-4071.81-2885.31-18-1365.942000-922-5822.94-3706.814461.69-19-1179.942001-72

7、6-4723.94-3050.819632.69-15-774.942002-498-3081.94-1881.8111740.69-13-176.942003-195-2074.94-1074.817503.69-7421.062004181-329.94-73.8112123.691911.0620053392580.061909.1924382.69-11486.0620061494305.063069.1913776.6911623.0620076015755.063859.19-7937.3115978.06200812238362.065426.19-8694.31211686.0

8、62009207212762.067845.19-3159.31541657.062010266918352.0611402.193758.69692666.06單位化:年份yX1X2X3X4X51995-0.2495-0.2692-0.2768-0.4886-0.2552-0.36321996-0.2314-0.2415-0.2582-0.3737-0.2461-0.31361997-0.2193-0.2284-0.2378-0.2374-0.2096-0.28241998-0.2038-0.2186-0.2215-0.1648-0.1823-0.23951999-0.1919-0.2064

9、-0.2060-0.0564-0.1641-0.23632000-0.2065-0.1879-0.18760.0872-0.1732-0.20412001-0.1626-0.1524-0.15440.1882-0.1367-0.13402002-0.1115-0.0994-0.09520.2294-0.1185-0.03062003-0.0437-0.0669-0.05440.1466-0.06380.072820040.0406-0.0107-0.00370.23700.00910.157620050.07590.08320.09660.4765-0.0090.257020060.03340

10、.13890.15530.26920.10030.107820070.13460.18570.19529-0.15510.13610.169120080.27390.26980.2746-0.16990.19140.291620090.46410.41180.3970-0.06170.49220.286620100.59780.59210.57700.07350.62890.4611對經過中心化和單位化后的數據進行回歸分析,得到下面的結果系數a模型非標準化系數標準系數tSig.B標準 誤差試用版1(常量)4.017E-5.003.012.991X12.736.6712.7364.075.002

11、X2-2.722.624-2.722-4.362.001X3-.094.023-.094-4.039.002X4.487.112.4874.360.001X5.556.070.5567.965.000a. 因變量: y復相關系數由SPSS運行數據得:ANOVAbModelSum of SquaresdfMean SquareFSig.1Regression19896989.91253979397.9821024.771.000aResidual38832.088103883.209Total19935822.00015a. Predictors: (Constant), x5, x3, x4,

12、 x2, x1b. Dependent Variable: yModel SummarybModelRR SquareAdjusted R SquareStd. Error of the Estimate1.999a.998.99762.315a. Predictors: (Constant), x5, x3, x4, x2, x1b. Dependent Variable: y則復相關系數:修正的:由以上結果可以看出,=0.998,表示民航客運量中的99.8%的變差可有5個變量解釋。同時可以看出的值接近,此時觀測值和預測值離得很近,模型較好地所合了數據。單個回歸系數的推斷(1)假設(自變量與

13、因變量沒有線性關系)備擇假設(自變量與因變量有線性關系)計算檢驗的統計量利用SPSS軟件對數據進行多元回歸分析,得到的結果如下:系數a模型非標準化系數標準系數tSig.B 的 95.0% 置信區間B標準誤差試用版下限上限1(常量)714.040213.3783.346.007238.6041189.477X1.396.0972.7514.106.002.181.611X2-.618.141-2.735-4.391.001-.931-.304X3-.008.002-.094-4.028.002-.013-.004X419.7294.541.4854.345.0019.61129.847X5.42

14、9.054.5567.968.000.309.550a. 因變量: y臨界值查表得我們知道當時,則表示在顯著性水平0.05下拒絕,接受。觀察t檢驗的統計表,發現(國民收入總值)、(消費金額)、(鐵路承載量)、(民航航線距離)、(境外旅客人數)的回歸系數是顯著不為0的(拒絕,接受),即說明、對經過其他預測變量調整后的響應變量y的預測效果在統計上是顯著的。(2)區間估計,其95% 的置信區間為,計算得到單個參數的置信區間:檢驗某些回歸系數相等(1)在假設的情況下檢驗假設根據單個系數的t檢驗,和是顯著的,因此原假設為因此全模型為:。根據軟件輸出結果為:系數表模型非標準化系數tB標準 誤差1(常量)-

15、253.0185.156-2.9710.979X10.140.0168.743X50.0130.0860.154a. 因變量: Y在原假設下,設,則簡化模型為:,令變量,則簡化模型為:根據軟件輸出結果為:系數表模型非標準化系數tB標準 誤差1(常量)-282.32383.569-3.3780.976W0.1210.00523.981a. 因變量: YF統計量為查表得;,易見F4.679.07,因此結果是不顯著的,所以不能拒絕原假設。 假設檢驗的結果告訴我們,方程與數據并未出現不一致。所以我們得出結論,在確定民航客運量時,有相同的正影響。預測查詢2011年全國統計年鑒可得到2011年國民生產總值

16、為471564億元,消費金額為37532億元,鐵路承載量為186000萬人,民航航線距離為339.06萬公里,境外旅客人數為13542萬人。(1)即給定在本文中取0.05,因為=0.05這個精度已經可以滿足本文的研究。,用Excel計算得到計算可得:(2) 即給定設其響應均值為,其估計值即為:,意義本文分析了國民生產總值、國民消費金額、鐵路承載量、民航航線距離、境外游客人數五個影響因素對民航客運量的影響。通過軟件分析可得=0.998,即民航客運量與幾個影響因素之間的線性關系非常強,通過分析每個影響因素與民航客運量的關系,可得以下結論:(1) 民航客運量與國民生產總值成正相關,隨著國民生產總值增加,民航客運量也隨之增加,因為隨著國民經濟能力的增強,出行、旅游的也增多了,而經濟能力的增強也使得人們出行更偏好選擇舒適快捷的飛機作為出行工具,(2) 民航客運量與鐵路承載量呈負相關,這是因為,鐵路與航空存在著競爭,尤其是近些年高鐵的發展,使得鐵路與航空在中長途旅客運輸方面的競爭更加激烈,因此

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論