回歸、判別分析_第1頁
回歸、判別分析_第2頁
回歸、判別分析_第3頁
回歸、判別分析_第4頁
回歸、判別分析_第5頁
已閱讀5頁,還剩6頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、精選優質文檔-傾情為你奉上天津理工大學實驗報告學院(系)名稱:計算機與通信工程學院姓名學號專業班級實驗項目回歸分析與判別分析課程名稱數據分析及其應用軟件課程代碼實驗時間2016年4月6號3、4節,中午實驗地點7號樓216批改意見成績教師簽字: 實驗內容:回歸分析: 1研究貨運總量(萬噸)與工業總值(億元)、農業總產值(億元)、居民非商品支出(億元)的關系。數據見下表編號貨運總量Y工業總產值x1農業總產值x2居民非商品支出x3116070351.0 226075402.4 321065402.0 426574423.0 524072381.2 622068451.5 727578424.0 81

2、6066362.0 927570443.2 1025065423.0 設變量x1表示工業總產值,變量x2表示農業總產值,變量x3表示居民非商品支出,y表示貨運總量。假設因變量y和自變量x1,x2,x3的線性回歸模型為 判別分析: 2.為研究某地區人口死亡狀況,已按某種方法將15個已知樣品分為3類,指標及原始數據如下表。利用費歇線性判別函數,判定另外4個待判樣品屬于哪一類?某地區人口死亡狀況指標及原始數據表組別序號X1=0歲組死亡概率X2=1歲組死亡概率X3=10歲組死亡概率X4=55歲組死亡概率X5=80歲組死亡概率X6=平均預期壽命第一組134.167.441.127.8795.1969.3

3、233.066.341.086.7794.0869.7336.269.241.048.9797.368.8440.1713.451.4313.88101.266.2550.0623.032.8323.74112.5263.3第二組133.246.241.1822.9160.0165.4232.224.221.0620.7124.768.7341.1510.082.3232.84172.0665.85453.0425.744.0634.87152.0363.5538.0311.26.0727.84146.3266.8第三組134.035.410.075.290.169.5232.113.020.

4、093.1485.1570.8344.1215.121.0815.15103.1264.8454.1725.032.1125.15110.1463.7528.072.010.073.0281.2268.3待判樣品150.226.661.0822.54170.665.2234.647.331.117.7895.1669.3333.426.221.1222.95160.3168.3444.0215.361.0716.45105.364.2實驗結果分析:回歸分析:(1)描述統計量的結果,顯示變量y和x1,x2,x3的均數、標準差和例數(N)。(2)相關分析的結果,貨運總量和農業總產值,貨運總量和居民

5、非商品住處的相關系數分別為0.731,0.724,單尾單側檢驗分別為P=0.008,P=0.009,相關程度高。(3)模型摘要,相關系數為R=0.898,判定系數為R Square=0.806,調整判定系數Adjusted R Square=0.708,估計值的標準誤差 Std. Error of the Estimate=1.391(4)方差分析結果,回歸的均方Regression Mean Square=4551.790,殘差的均方Residual Mean Square=549.522,F=8.283,P=0.015<0.05,所以線性回歸方程顯著。(5)偏回歸系數結果,常數項(C

6、onstant)=-348.280,工業總產值回歸系數=3.754,回歸系數的標準誤差=1.933,回歸系數的t檢驗值=0.385,P=0.100,農業總產值回歸系數=7.101,回歸系數的標準誤差=2.880,回歸系數的t檢驗值為2.465,P=0.049,居民非商品支出回歸系數=12.477,回歸系數的標準誤差=10.569,回歸系數的t檢驗值為1.178,P=0.284。故求的回歸方程為y=-348.280+3.754+7.101+12.447(6)殘差直方圖,正態曲線被加載到直方圖上,判斷標準化殘差呈正態分布。(7)save結果,增加新變量到正在使用的數據文件。 判別分析:(1) 將數

7、據導入SPSS,根據要求,采用系統聚類方法,在SPSS中選擇分析-分類-判別分析:(2) 進行判別分析,將X1到X6全部選入自變量中,分組變量為組別,如圖:(3) 在統計量選項中選擇均值,單變量,Boxs M等,如圖,分類選項中勾選個案、摘要: (4) 檢驗各組的描述統計量和對各組均值是否相等:表1反映的是有效樣本量為15,變量的缺失值為4。表2是對各組均值是否相等的檢驗,根據P值,我們可以在0.01的顯著性水平上拒絕X4與X5在三組的均值相等的假設,即認為變量X4、X5在三組的均值是有顯著差異的。(5) 典型判別函數: 由表3可以得出:第一判別函數解釋了98.8%的方差,第二判別函數解釋了1

8、.2%的方差,兩個判別函數解釋了全部的方差。表4是對兩個判別函數的顯著性檢驗,由Wilkins Lambd檢驗,在0.05的顯著性水平上,根據P值可以得到,第一個判別函數是顯著的,第二個判別函數是不顯著的。(6) 判別函數、判別載荷和各組的重心: 表5是標準化的判別函數,表示為: Y1=-17.046X1+14.757X2-1.306X3+6.381X4+1.332X5+4.315X6 Y2=-7.677X1+9.870X2-0.531X3-0.666X4+0.710X5+1.833X6 表6位結構矩陣,即判別載荷,表四是反映判別函數在各組的重心 表7是非標準化的判別函數,表示為: Y1=-7

9、8.896-1.950X1+1.748X2-0.930X3+0.825X4+0.102X5+1.662X6 Y2=-30.330-0.878X1+1.169X2-0.365X3-0.086X4+0.054X5+0.706X6 (7)分類的統計結果: 表8是每組的分類函數,也稱費歇線性判別函數,三組的分類函數表示為: Y1=-5628.382-159.015X1+168.068X2-98.413X3+58.217X4+11.702X5+202.770X6 Y2=-6584.377-181.479X1+187.715X2-109.195X3-68.296X4+12.862X5+221.972X6 Y3=-5266.780-149.370X1+158.749X2-93.908X3+54.948X4+11.185X5+194.625X6 可以根據計算每個觀測在各組的分類函數值,將觀測分類到較大的分類函數值中。 表9位分類矩陣表,通過判別函數的預測,根據原數據的所屬組關系,3組觀測全被判對,未分組的變量中有一個待判樣品判給第一組,有一個待判樣品判給第二組,有兩個待判樣品判給第三組。在交叉驗證中,第一組5個樣品全部被判為對,第二組5個樣品觀測有4個被判對,第三組5個樣品觀測中有3個被

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論