統(tǒng)計(jì)分析軟件應(yīng)用SPSS-主成分分析實(shí)驗(yàn)報(bào)告_第1頁
統(tǒng)計(jì)分析軟件應(yīng)用SPSS-主成分分析實(shí)驗(yàn)報(bào)告_第2頁
統(tǒng)計(jì)分析軟件應(yīng)用SPSS-主成分分析實(shí)驗(yàn)報(bào)告_第3頁
統(tǒng)計(jì)分析軟件應(yīng)用SPSS-主成分分析實(shí)驗(yàn)報(bào)告_第4頁
統(tǒng)計(jì)分析軟件應(yīng)用SPSS-主成分分析實(shí)驗(yàn)報(bào)告_第5頁
已閱讀5頁,還剩7頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

本科學(xué)生綜合性、設(shè)計(jì)性

實(shí)驗(yàn)報(bào)告實(shí)驗(yàn)課程名稱統(tǒng)計(jì)分析軟件應(yīng)用開課學(xué)期 2010至2011學(xué)年下學(xué)期上課時(shí)間2011年4月25日遼寧師范大學(xué)教務(wù)處編印、實(shí)驗(yàn)方案實(shí)驗(yàn)名稱:主成分分析實(shí)驗(yàn)時(shí)間:小組合作:是。 否?小組成員:1、實(shí)驗(yàn)?zāi)康模赫莆罩鞒煞址治龅乃枷牒途唧w步驟。掌握SPSS實(shí)現(xiàn)主成分分析的具體操作,并對處理結(jié)果做出解釋。2、 實(shí)驗(yàn)設(shè)備與材料:WindowsXP;SPSSfor等。3、 實(shí)驗(yàn)方法步驟及注意事項(xiàng)操作步驟:(1)打開SPSS軟件,新建一數(shù)據(jù)文件,定義變量:Company(公司名稱)、X1(賠付率)、X2(凈收入與總收入之比)、X3(投資收益率)、X4(再保險(xiǎn)率)、X5(總資產(chǎn)報(bào)酬率)、X6(兩年保費(fèi)收入收益率)、X7(保費(fèi)收入變化率)、X8(流動性比率),這些變量中除了Company為字符串型(String)變量外,其余變量均為數(shù)值型(Numeric)變量。(2)選擇菜單[Analyze]=>[DataReduction]=>[Factor]進(jìn)A[FactorAnalysis]主對話框。選定左邊列表中的變量X1、X2、X3、X4、X5、X6、X7、X8,單擊按鈕使之進(jìn)入[Variables]列表框。(3) 單擊主對話框中的[Descriptive...]按鈕,打開[FactorAnalysis:Descriptives]子對話框,在[Statistics]欄中選擇[Univariatedescriptives]項(xiàng)要求輸出各變量的均值與標(biāo)準(zhǔn)差,在[CorrelationMatrix]欄內(nèi)選擇[Coefficients]項(xiàng)要求計(jì)算相關(guān)系數(shù)矩陣,單擊[Continue]按鈕返回[FactorAnalysis]主對話框。(4) 單擊主對話框中的[Extraction.]按鈕,打開[FactorAnalysis:Extraction]子對話框。在[Method]列表中選擇默認(rèn)因子抽取方法[PrincipalComponents],在[Analyze]欄中選擇默認(rèn)的[CorrelationMatrix]項(xiàng)要求從相關(guān)系數(shù)矩陣出發(fā)求解主成分,在[Extract]欄中選擇默認(rèn)項(xiàng)[Eigenvaluesover:1],[Maximumiterationconvagence:]選擇25,在[Display]中選擇[Screeplot]單擊[Continue]按鈕返回[FactorAnalysis]主對話框。(5)[Rotation]和[Scores],均選擇默認(rèn)選項(xiàng),單擊主對話框[OK]按鈕,輸出結(jié)果。注意事項(xiàng):可以看出,主成分分析依賴于原始變量,也只能反映原始變量的信息。所以原始變量的選擇很重要。另外,如果原始變量都本質(zhì)上獨(dú)立,那么降維就可能失敗。這是因?yàn)楹茈y把很多獨(dú)立變量用少數(shù)綜合的變量概括。數(shù)據(jù)越相關(guān),降維效果就越好。在得到分析的結(jié)果時(shí),并不一定會都得到比較清楚的結(jié)果。這與問題的性質(zhì),選取的原始變量以及數(shù)據(jù)的質(zhì)量等都有關(guān)系。(1) 由協(xié)方差陣出發(fā)與由相關(guān)陣出發(fā)求解主成分所得結(jié)果不一致時(shí),要恰當(dāng)?shù)倪x取某一種方法;(2) 對于度量單位或是取值范圍在同量級的數(shù)據(jù),可直接求協(xié)方差陣;對于度量單位不同的指標(biāo)或是取值范圍彼此差異非常大的指標(biāo),應(yīng)考慮將數(shù)據(jù)標(biāo)準(zhǔn)化,再由協(xié)方差陣求主成分;(3) 主成分分析不要求數(shù)據(jù)來源于正態(tài)分布;(4) 在選取初始變量進(jìn)入分析時(shí)應(yīng)該特別注意原始變量是否存在多重共線性的問題(最小特征根接近于零,說明存在多重共線性問題);(5) 因子分析中各個(gè)公共因子之間不相關(guān),特殊因子之間不相關(guān),公共因子和特殊因子之間不相關(guān)。4、實(shí)驗(yàn)數(shù)據(jù)處理方法:選取了人保、平安、太平洋、大眾、華泰、永安、華安7個(gè)保險(xiǎn)公司的數(shù)據(jù),指標(biāo)都是正指標(biāo),無需歸一化,將自動對原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化處理,消除指標(biāo)量綱及數(shù)量級的影響。5、參考文獻(xiàn):[1] 盧紋岱.SPSSforWindows統(tǒng)計(jì)分析[M].電子工程出版社,2006[2] 郭顯光.如何用SPSS軟件進(jìn)行主成分分析[J].統(tǒng)計(jì)與信息論壇,1998,(2)[3] 何曉群.現(xiàn)代統(tǒng)計(jì)分析方法與應(yīng)用[M].中國人民大學(xué)出版社,1998⑷余建英、何旭宏.數(shù)據(jù)統(tǒng)計(jì)分析與SPSS應(yīng)用[M].人民郵電出版社,2003

1、實(shí)驗(yàn)?zāi)康摹⒃O(shè)備與材料、理論依據(jù)、實(shí)驗(yàn)方法步驟見實(shí)驗(yàn)設(shè)計(jì)方案2、實(shí)驗(yàn)現(xiàn)象、數(shù)據(jù)及結(jié)果表1表1描述性統(tǒng)計(jì)量表表2主成分因子荷載矩陣表DescriptiveStatisticsMeanStdDeviatif賠付率45.3357DescriptiveStatisticsMeanStdDeviatif賠付率45.335711.590783 7凈收入與總攵人之比.17007.5702(7投資|攵益率2.45572.601277再保僉率2.01573.696277總資產(chǎn)報(bào)酬率-.88147.708837兩年保費(fèi)收入收益率92.7071199.22480 7保費(fèi)攵入變牌61.647160.745033 7流動'生比率89.26868.84882: 7Component123垢IT率.B19-.159-.517部蚣.與總收入之比926271250投資收益牽733-218582再忻.略率-042.913.365資己很酬率.664249.331兩年1呆剽小牧工率.562.302-.602?糧吠3變化率-.886.330:砌TI牛I」,率-017819-456Cornp&n&ntMatriiifEitractionMethod:PrincipaltkirnponenlAnalysis,a.Scamponenlsextracted.表3相關(guān)系數(shù)矩陣表CorrelationMatriXHl曰T由凈收入與總ilH\+1-1/?fa凸咨ikrK志17△由總資產(chǎn)坨礎(chǔ)玄兩年保費(fèi)收保費(fèi)收入標(biāo)/lz由流動性比率Correlation貝賠付率—賠付■率一1.000—收入之比 .578J-X.JXHXxlll—I—.320再保險(xiǎn)率-.394報(bào)酬率-.544―入收益率—.564~變化率—-.922〃山I-LUj—f—.154凈收入與總收入之比.5781.000.768.300.940.502-.658.079投資收益率.320.7681.000-.034.714.134-.519-.455再保險(xiǎn)率-.394.300-.0341.000.294.128.418.526總資產(chǎn)報(bào)酬率.544.940.714.2941.000.235-.635.105兩年保費(fèi)收入收益率.564.502.134.128.2351.000-.474.292保費(fèi)收入變化率-.922-.658-.519.418-.635-.4741.000.169 流動生比率 454^ 09-1 455J .526-1 405-1 ;292-1 469-1 1.000a.Thismatrixisnotpositivedefinite.表4公因子方差表 圖1碎石圖

Communalities賠付率1.000.964凈收入與總收入之比1.000.993投資收益率1.000.923再保險(xiǎn)率1.000.968總資產(chǎn)報(bào)酬率1.000.919兩年保費(fèi)收入收益率1.000.659保費(fèi)收入變化率1.000.961流動性比率1.000.879ExtractionMethod:PrincipalComponentAnalysis.C^mpofientNumberExtractionMethod:PrincipalComponentAnalysis.表5總方差分解表TotalVarianceExplainedInitialEigenvaluesExtractionSumsofSquaredLoadingsComponentTn-tal%DfVarianceCumulative%Total%DfVarianceCumulative%13J141.-9121.439.579.144.Q126.13E-01S-4.2E-01648.92923.89817.9917.2381.797.1507.66E-017-5.25E-01548.92972.S2790.S1893.05399.850100.000100.G00100.0003.9141.9121.43948.92923.89817.99148.92972.S2790.S1SExtractionMethod:PrincipalComponentAnalysis.3、對實(shí)驗(yàn)現(xiàn)象、數(shù)據(jù)及觀察結(jié)果的分析與討論:表1是描述統(tǒng)計(jì)量表,主要列出了統(tǒng)計(jì)量的均值、方差和數(shù)據(jù)個(gè)數(shù)。表2是主成分因子荷載矩陣表,系數(shù)表示該因子對變量的影響程度。這里每一列代表一個(gè)主成分作為原來變量線性組合的系數(shù)(比例)。比如第一主成分作為賠付率、凈收入與總收入之比、投資收益率、再保險(xiǎn)率、總資產(chǎn)報(bào)酬率、兩年保費(fèi)收入收益率、保費(fèi)收入變化率、流動性比率,這八個(gè)原先變量的線性組合,系數(shù)(比例)為 如用x1、x2、x3、x4、x5、x6、x7、x8分別表示原先的十個(gè)變量,而用y1、y2、y3表示新的變量,那么原先8個(gè)變量與第一、第二和第三主成分y1、y2、y3的關(guān)系為:X1=X2=++X3=+X4=++X5=++X6=+X7=++X8=+相關(guān)系數(shù)(絕對值)越大,主成分對該變量的代表性也越大。表3是相關(guān)系數(shù)矩陣表。表4是公因子方差表。表5是總方差分解表,這里的InitialEigenvalues就是這里的八個(gè)主軸長度,又稱特征值(數(shù)據(jù)相關(guān)陣的特征值)。頭三個(gè)成分特征值累積占了總方差的%。后面的特征值的貢獻(xiàn)越來越少。依據(jù)原則:特征值>1,提取了3個(gè)公因子(主成分),每個(gè)原始變量都可以是8個(gè)因子的線性組合,提取3個(gè)因子,可以概括原始變量所包含信息的%。這3個(gè)公因子(主成分)包含了原指標(biāo)的絕大部分信息,可以代替原來8個(gè)變量對保險(xiǎn)公司的投資收益進(jìn)行衡量。圖1是碎石圖,特征值的貢獻(xiàn)還可以從碎石圖看出。表6因子與主成分a1a2a3b1b2b3X1X2X3

X4X5X6X7X8特征值貝獻(xiàn)率%%%累計(jì)貝獻(xiàn)率%%%主成分表達(dá)式:b1=*X1+*X2+**X4+*X5+***X8b2=*X1+**X3+***X6+*X7+*X8b3=*X1+*X2+*X3+***X6+**X8Y1Y2Y3Y1=*x1+*x2+**x4+*x5+***x8Y2=*x1+*x2-**x4+*x5+***x8Y3=*x1+*x2+*x3+*x4+**x6+**x8加權(quán):輸出結(jié)果,并從高到低進(jìn)行排序:1:人保2:平安3:太平洋4:大眾5:華泰6:永安7:華安Z主成分綜合得分Z主成分綜合得分Num1:人保Z主成分綜合得分Num華泰2:平安太平洋3:太平洋人保4:大眾平安5:華泰永安6:永安大眾7:華安華安可以如上所述計(jì)算主成分得分,還可以通過綜合評價(jià)函數(shù)計(jì)算綜合得分:綜合評價(jià)函數(shù):Z=%*Y1+%*Y2+%*Y34、結(jié)論:表8中,綜合得分出現(xiàn)負(fù)值,這只表明該保險(xiǎn)公司的綜合水平處于平均水平之下。由主成分分析的實(shí)證結(jié)果,不僅大部分保險(xiǎn)公司的排名存在差異,且綜合得分值上存在較大差異,其定量值差異較大,這對于后來的綜合定量定性分析,最終所提出的政策建議等都會產(chǎn)生較大影響。由表8可以看出:華安保險(xiǎn)的綜合水平最低,華泰保險(xiǎn)的綜合水平最高。由于前三個(gè)主成份的貢獻(xiàn)率高達(dá)%,用綜合得分值對各地區(qū)進(jìn)行排序,能從總體上反映各公司之間的差別。5、實(shí)驗(yàn)總結(jié):1) 、本次實(shí)驗(yàn)成敗之處及其原因分析:主成分分析是一種通過降維技術(shù)把原來眾多具有一定相關(guān)性的變量化為少數(shù)幾個(gè)主成分的統(tǒng)計(jì)方法。通常,只要變量之間存在一定的相關(guān)性,前幾個(gè)主成分往往就具有較高的累計(jì)貢獻(xiàn)率,從而這少數(shù)的幾個(gè)主成分就反映原始變量的絕大部分信息,從而達(dá)到較好的降維目的。通過SPSS可以容易進(jìn)行主成分分析,得到數(shù)據(jù)間的主成分,從而可以很好的分析數(shù)據(jù)。2) 、本實(shí)驗(yàn)的關(guān)鍵環(huán)節(jié)及改進(jìn)措施:做好本實(shí)驗(yàn)需要把握的關(guān)鍵環(huán)節(jié):通過總方差分析表得到貢獻(xiàn)率大的主成分的特征值,通過主因子荷載表,應(yīng)用compute計(jì)算主成分表達(dá)式的,然后加權(quán)計(jì)算綜合得分,最后進(jìn)行排序。進(jìn)行綜合得分時(shí),除SPSS軟件外,其他軟件都分別設(shè)有兩種方法的過程命令,使用者可以根據(jù)需要采用其中一種來分析問題,一般不會混淆。而正是因?yàn)镾PSS沒有直接進(jìn)行主成分分析的命令,才使得那些本身尚未清楚區(qū)分這兩種方法的使用者更

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論