SPSS數(shù)據(jù)的主成分分析報告課件_第1頁
SPSS數(shù)據(jù)的主成分分析報告課件_第2頁
SPSS數(shù)據(jù)的主成分分析報告課件_第3頁
SPSS數(shù)據(jù)的主成分分析報告課件_第4頁
SPSS數(shù)據(jù)的主成分分析報告課件_第5頁
已閱讀5頁,還剩65頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、zf主成分分析 (Principal Components Analysis)知識點(diǎn)什么是主成分和主成分分析?理解主成分分析的基本思想和幾何意義?理解并掌握基于協(xié)方差矩陣或相關(guān)系數(shù)矩陣求解主成分?如何確定主成分個數(shù)?如何解釋主成分?掌握運(yùn)用SPSS軟件求解主成分對軟件輸出結(jié)果進(jìn)行正確分析2022/7/232zf蔣亮,羅漢我國東西部城市經(jīng)濟(jì)實(shí)力比較的主成分分析,經(jīng)濟(jì)數(shù)學(xué),2003年3期 田波平等主成分分析在中國上市公司綜合評價中的作用,數(shù)學(xué)的實(shí)踐與認(rèn)識,2004年4期江冬明主成份分析在證券市場個股評析中的應(yīng)用,數(shù)理統(tǒng)計(jì)與管理,2001 年3期主成分分析在綜合評價中的應(yīng)用:2022/7/233zf

2、陳耀輝,景睿滬深股市市場收益率成因的主成份分析,南京航空航天大學(xué)學(xué)報,2000年2期。主成分用于成因分析:2022/7/234zf王冬:我國外匯儲備增長因素主成分分析,北京工商大學(xué)學(xué)報( 社會科學(xué)版), 2006年4期。主成分回歸分析:主成分用于判別分析等統(tǒng)計(jì)方法中2022/7/235zf多個指標(biāo)的問題:1、指標(biāo)與指標(biāo)可能存在相關(guān)關(guān)系 信息重疊,分析偏誤2、指標(biāo)太多,增加問題的復(fù)雜性和分析難度 如何避免?2022/7/236zf主成分分析的基本思想 一項(xiàng)十分著名的工作是美國的統(tǒng)計(jì)學(xué)家斯通(stone)在1947年關(guān)于國民經(jīng)濟(jì)的研究。他曾利用美國1929一1938年各年的數(shù)據(jù),得到了17個反映國

3、民收入與支出的變量要素,例如雇主補(bǔ)貼、消費(fèi)資料和生產(chǎn)資料、純公共支出、凈增庫存、股息、利息外貿(mào)平衡等等。在進(jìn)行主成分分析后,竟以97.4的精度,用三新變量就取代了原17個變量。根據(jù)經(jīng)濟(jì)學(xué)知識,斯通給這三個新變量分別命名為總收入F1、總收入變化率F2和經(jīng)濟(jì)發(fā)展或衰退的趨勢F3。2022/7/237zf更有意思的是,這三個變量其實(shí)都是可以直接測量的。斯通將他得到的主成分與實(shí)際測量的總收入I、總收入變化率I以及時間t因素做相關(guān)分析,得到下表:F1F2F3iitF11F201F3001i0.995-0.0410.057li-0.0560.948-0.124-0.102lt-0.369-0.282-0.

4、836-0.414-0.11212022/7/238zf主成分分析:將原來具有相關(guān)關(guān)系的多個指標(biāo)簡化為少數(shù)幾個新的綜合指標(biāo)的多元統(tǒng)計(jì)方法。主成分:由原始指標(biāo)綜合形成的幾個新指標(biāo)。依據(jù)主成分所含信息量的大小成為第一主成分,第二主成分等等。主成分與原始變量之間的關(guān)系: (1)主成分保留了原始變量絕大多數(shù)信息。 (2)主成分的個數(shù)大大少于原始變量的數(shù)目。 (3)各個主成分之間互不相關(guān)。 (4)每個主成分都是原始變量的線性組合。2022/7/239zf主成分分析通常的做法:尋求原指標(biāo)的線性組合Fi。數(shù)學(xué)模型主成分表達(dá)式2022/7/2310zf假設(shè)有n個樣品,每個樣品有兩個觀測變量xl和x2,在由變量

5、xl和x2 所確定的二維平面中,n個樣本點(diǎn)所散布的情況如橢圓狀。如圖所示:幾何解釋坐標(biāo)旋轉(zhuǎn)變換平移、旋轉(zhuǎn)坐標(biāo)軸2022/7/2311zf平移、旋轉(zhuǎn)坐標(biāo)軸2022/7/2312zf平移、旋轉(zhuǎn)坐標(biāo)軸2022/7/2313zf由圖可以看出這n個樣本點(diǎn)無論是沿著xl 軸方向或x2軸方向都具有較大的離散性,其離散的程度可以分別用觀測變量xl 的方差和x2 的方差定量地表示。顯然,如果只考慮xl和x2 中的任何一個,那么包含在原始數(shù)據(jù)中的經(jīng)濟(jì)信息將會有較大的損失。如果我們將xl 軸和x2軸先平移,再同時按逆時針方向旋轉(zhuǎn)角度,得到新坐標(biāo)軸Fl和F2。Fl和F2是兩個新變量。Fl軸方向上的離散程度最大,即Fl

6、的方差最大。說明變量Fl代表了原始數(shù)據(jù)的絕大部分信息,即使不考慮變量F2也無損大局。2022/7/2314zf旋轉(zhuǎn)變換的目的:將原始數(shù)據(jù)的大部分信息集中到Fl軸上,對數(shù)據(jù)中包含的信息起到了濃縮作用。主成分分析的幾何意義:主成分分析的過程也就是坐標(biāo)旋轉(zhuǎn)的過程,各主成分表達(dá)式就是新坐標(biāo)系與原坐標(biāo)系的轉(zhuǎn)換關(guān)系,新坐標(biāo)系中各坐標(biāo)軸的方向就是原始數(shù)據(jù)方差最大的方向。其優(yōu)點(diǎn):(1)可達(dá)到簡化數(shù)據(jù)結(jié)構(gòu)的目的。(2)新產(chǎn)生的綜合變量Fl,F(xiàn)2具有不相關(guān)的性質(zhì),從而避免了信息重疊所帶來的虛假性。2022/7/2315zf 了解了主成分分析的基本思想、數(shù)學(xué)和幾何意義后,問題的關(guān)鍵:1、如何求解主成分? 2、如何確

7、定主成分個數(shù)? 3、如何解釋主成分所包含的經(jīng)濟(jì)意義?2022/7/2316zf如何求解主成分? (1)基于協(xié)方差矩陣求解主成分假設(shè)有n個樣本,每個樣本有 p 個觀測變量。運(yùn)用主成分分析構(gòu)造以下 p 個主成分關(guān)于原始變量的線性組合模型:2022/7/2317zf假設(shè)p個原始變量的協(xié)方差陣為:對角線外的元素不為0意味著:原始變量之間有相關(guān)關(guān)系2022/7/2318zf如何運(yùn)用主成分分析將這些具有相關(guān)關(guān)系的變量轉(zhuǎn)化為沒有相關(guān)關(guān)系的新變量(主成分)呢?新變量(即主成分)之間沒有相關(guān)關(guān)系,其協(xié)方差陣為對角矩陣:對角線上的元素1、2p分別為第一、二第p個主成分方差;同時也是原始變量協(xié)方差陣的特征根主成分表

8、達(dá)式的系數(shù)項(xiàng)即是1、2p的特征向量2022/7/2319zf1、主成分的協(xié)方差陣為對角矩陣;2、3、 4、 第j個主成分的方差貢獻(xiàn)為: 主成分包含了原始變量的所有信息協(xié)方差矩陣求解中主成分的性質(zhì)該比率為第j個主成分方差與原始變量的總方差之比。2022/7/2320zf k 個主成分的累積方差貢獻(xiàn)率為: 累積方差貢獻(xiàn)率越接近1,表示k 個主成分包含原始變量的信息越多。5. 主成分載荷:6. 主成分Fj與原始變量Xi相關(guān)系數(shù)的平方: (1)可看作為第j 個主成分可解釋Xi多少比率的信息 (2)可看作為Xi在第j 個主成分中的相對重要性2022/7/2321zf主成分的求解 (2)基于相關(guān)系數(shù)矩陣求

9、解主成分假設(shè)p個原始變量的相關(guān)系數(shù)矩陣陣為:注意(1):相關(guān)系數(shù)矩陣可看作原始變量協(xié)方差陣的標(biāo)準(zhǔn)化形式,即:原始變量標(biāo)準(zhǔn)化的協(xié)方差矩陣。注意(2):運(yùn)用主成分分析法時,若原始變量量綱不一致時,需對變量進(jìn)行標(biāo)準(zhǔn)化處理基于協(xié)方差陣求解主成分;若不標(biāo)準(zhǔn)化則基于相關(guān)系數(shù)矩陣求解主成分。對角線外元素不全為0:原始變量間有相關(guān)關(guān)系2022/7/2322zf轉(zhuǎn)化形成的沒有相關(guān)關(guān)系的新變量(即主成分)的協(xié)方差陣為對角矩陣:對角線上的元素1、2p分別為第一、二第p個主成分方差;同時也是原始變量相關(guān)系數(shù)矩陣的特征根主成分表達(dá)式的系數(shù)項(xiàng)即是1、2p的特征向量2022/7/2323zf相關(guān)系數(shù)矩陣求解中主成分的性質(zhì)1

10、、主成分的協(xié)方差矩陣為對角陣.2.3、4、第k個主成分的方差貢獻(xiàn)率為: 前k個主成分的累積方差貢獻(xiàn)率為:5、主成分載荷: 6、主成分載荷的平方:在解釋第j個主成分的意義上起著重要作用 (1)可看作為第j 個主成分可解釋Xi多少比率的信息(或: Xi 的信息有多少可被第j個主成分解釋); (2)可看作為Xi在第j 個主成分中的相對重要性。2022/7/2324zf主成分個數(shù)的確定累積方差貢獻(xiàn)率( Cumulative variance explained by components ): 通常要求累積方差貢獻(xiàn)率達(dá)到85%以上來確定主成分個數(shù)。 特征根(eigenvalue):根據(jù)特征根來確定 ;

11、 數(shù)據(jù)標(biāo)準(zhǔn)化情況下: 碎石圖(Scree plot):依據(jù)特征值的變化來確定,即特征值變化趨勢圖由陡坡變?yōu)槠教沟霓D(zhuǎn)折點(diǎn)即為主成分選擇的最佳個數(shù)。2022/7/2325zf主成分的解釋運(yùn)用主成分載荷解釋主成分: 陳耀輝,景睿滬深股市市場收益率成因的主成份分析,南京航空航天大學(xué)學(xué)報,2000年2期。 蔣亮,羅漢我國東西部城市經(jīng)濟(jì)實(shí)力比較的主成分分析,經(jīng)濟(jì)數(shù)學(xué),2003年3期。運(yùn)用主成分得分系數(shù)矩陣解釋主成分: 王冬我國外匯儲備增長因素主成分分析,北京工商大學(xué)學(xué)報,2006年4期。 田波平等主成分分析在中國上市公司綜合評價中的作用,數(shù)學(xué)的實(shí)踐與認(rèn)識,2004年4期2022/7/2326zf基于相關(guān)系

12、數(shù)矩陣的主成分分析。對美國紐約上市的有關(guān)化學(xué)產(chǎn)業(yè)的三支股票(Allied Chemical, du Pont, Union Carbide)和石油產(chǎn)業(yè)的2支股票(Exxon and Texaco )做了100周的收益率調(diào)查(1975年1月1976年10月)。 1)利用相關(guān)系數(shù)矩陣做主成分分析。 2)決定要保留的主成分個數(shù),并解釋意義。主成分解釋的案例分析2022/7/2327zf(1) 相關(guān)系數(shù)矩陣:10.5770.5090.3870.4620.57710.5990.3890.3220.5090.59910.4360.4260.3870.3890.43610.5230.4620.3220.42

13、60.5231運(yùn)用主成分分析法進(jìn)行分析得到以下結(jié)果:2022/7/2328zf(2)相關(guān)系數(shù)矩陣的特征根: Eigenvalues of the Correlation Matrix Eigenvalue Difference Proportion Cumulative PRIN1 2.85671 2.04755 0.571342 0.57134 PRIN2 0.80916 0.26949 0.161833 0.73317 PRIN3 0.53968 0.08818 0.107935 0.84111 PRIN4 0.45150 0.10855 0.090300 0.93141 PRIN5 0.

14、34295 . 0.068590 1.00000(3)特征根所對應(yīng)的特征向量: Eigenvectors PRIN1 PRIN2 PRIN3 PRIN4 PRIN5 X1 0.463605 -.240339 -.611705 0.386635 -.451262 X2 0.457108 -.509305 0.178189 0.206474 0.676223 X3 0.470176 -.260448 0.335056 -.662445 -.400007 X4 0.421459 0.525665 0.540763 0.472006 -.175599 X5 0.421224 0.581970 -.43

15、5176 -.382439 0.3850242022/7/2329zf(4)前兩大主成分的累積方差貢獻(xiàn)率:(5)前兩大主成分的表達(dá)式:2022/7/2330zf (6)碎石圖:2022/7/2331zf主成分的解釋: 1、第一大主成分PRIN1幾乎是5只股票的等權(quán)平均;可將它看做股票收益率的“市場影響因素” (market component) 2、第二大主成分PRIN2 系數(shù)在AC, DP, UC (chemical stocks) 等3只股票上表現(xiàn)為負(fù),而在 EX, TE (oil stocks)等兩只股票的系數(shù)表現(xiàn)為正; 可將它看作為股票收益率的“行業(yè)影響因素”(industry com

16、ponent)2022/7/2332zf主成分分析步驟及框圖主成分分析步驟:1.根據(jù)研究問題選取初始分析變量;2.根據(jù)初始變量特性判斷由協(xié)方差陣求主成分還是由相關(guān)陣求主成分;3.求協(xié)差陣或相關(guān)陣的特征根與相應(yīng)標(biāo)準(zhǔn)特征向量;4.判斷是否存在明顯的多重共線性,若存在,則回到第一步;5.得到主成分的表達(dá)式并確定主成分個數(shù),選取主成分;6.結(jié)合主成分對研究問題進(jìn)行分析并深入研究。2022/7/2333zf主成分分析框圖:特征值標(biāo)準(zhǔn)正交特征向量是否有接近0的情況是其他處理否主成分對主成分進(jìn)行分析深入分析選擇初始變量 度量或取值范圍相同?是否(否)對比分析相關(guān)陣分析協(xié)方差陣 2022/7/2334zf主成

17、分分析的上機(jī)實(shí)現(xiàn)SPSS 操作1、analyze-description statistic-description-save standardized as variables (若需要數(shù)據(jù)標(biāo)準(zhǔn)化,則進(jìn)行該操作,一般在主成分分析過程中軟件已自動進(jìn)行了此操作)2、analyze-data reduction-Factor3、指定參與分析的變量4、運(yùn)行factor 過程2022/7/2335zf案例1:某分析師試圖對汽車銷量進(jìn)行預(yù)測,選擇了汽車品牌、汽車外觀、油耗等10個 變量作為影響變量(即自變量) (見數(shù)據(jù)car_sales.sav) 。但是,這些影響變量之間存在相關(guān)關(guān)系,分析師擔(dān)心直接進(jìn)行

18、回歸預(yù)測會引起分析結(jié)果偏誤。 分析師首先對10個影響變量進(jìn)行主成分分析,將其轉(zhuǎn)化少數(shù)幾個無相關(guān)關(guān)系的新變量。 (1)可用新變量與銷量進(jìn)行回歸預(yù)測 (2)依據(jù)新變量,對各品牌汽車進(jìn)行評價2022/7/2336zf(01)選擇分析變量 選SPSS 分析Analyze菜單中的(降維Data Reduction)(Factor),出現(xiàn)【因子分析 Factor Analysis】對話框;在【 因子Factor Analysis】對話框中左邊的原始變量中,選擇將進(jìn)行因子分析的變量選入(變量Variables)欄。2022/7/2337zf(02)設(shè)置描述性統(tǒng)計(jì)量在【 Factor Analysis】框中選

19、【 描述Descriptives】按鈕,出現(xiàn)【 描述統(tǒng)計(jì)Descriptives 】對話框;選擇原始分析結(jié)果 Initial solution 選項(xiàng)選擇系數(shù)Coefficients 選項(xiàng)點(diǎn)擊(繼續(xù)Contiue)按鈕確定。顯示相關(guān)系數(shù)矩陣:檢驗(yàn)原始變量有無相關(guān)關(guān)系顯示共同度表,反映每個原始變量的信息有多少被新變量提取了2022/7/2338zf2022/7/2339zf主成分分析前提條件相關(guān)性分析:分析方法主要有:1)計(jì)算相關(guān)系數(shù)矩陣(correlation coefficients matrix) 如果相關(guān)系數(shù)矩陣中的大部分相關(guān)系數(shù)值均小于0.3,即各變量間大多為弱相關(guān),原則上這些變量不適合

20、進(jìn)行因子分析。2)計(jì)算反映象相關(guān)矩陣(Anti-image correlation matrix) 如果其主對角線外的元素大多絕對值較小,對角線上的元素值較接近1,則說明這些變量的相關(guān)性較強(qiáng),適合進(jìn)行因子分析。2022/7/2340zf 其中主對角線上的元素為某變量的MSA(Measure of Sample Adequacy): 是變量 和變量 ( )間的簡單相關(guān)系數(shù); 是變量 和變量 ( )在控制了其他變量影響下的偏相關(guān)系數(shù),即凈相關(guān)系數(shù)。 取值在0和1之間,越接近1,意味著變量 與其他變量間的相關(guān)性越強(qiáng),越接近0則相關(guān)性越弱。2022/7/2341zf3)巴特利特球度檢驗(yàn)(Bartlet

21、t test of sphericity) 該檢驗(yàn)以原有變量的相關(guān)系數(shù)矩陣為出發(fā)點(diǎn),其零假設(shè)H0是:相關(guān)系數(shù)矩陣為單位矩陣,即相關(guān)系數(shù)矩陣主對角元素均為1,非主對角元素均為0。(即原始變量之間無相關(guān)關(guān)系)。 依據(jù)相關(guān)系數(shù)矩陣的行列式計(jì)算可得其近似服從卡方分布。如果統(tǒng)計(jì)量卡方值較大且對應(yīng)的sig值小于給定的顯著性水平a時,零假設(shè)不成立。即說明相關(guān)系數(shù)矩陣不太可能是單位矩陣,變量之間存在相關(guān)關(guān)系,適合做因子分析。2022/7/2342zf4)KMO(Kaiser-Meyer-Olkin)檢驗(yàn) KMO檢驗(yàn)的統(tǒng)計(jì)量是用于比較變量間簡單相關(guān)系數(shù)矩陣和偏相關(guān)系數(shù)的指標(biāo),數(shù)學(xué)定義為: KMO與MSA區(qū)別是它

22、將相關(guān)系數(shù)矩陣中的所有元素都加入到了平方和計(jì)算中。KMO值越接近1,意味著變量間的相關(guān)性越強(qiáng),原有變量適合做因子分析;越接近0,意味變量間的相關(guān)性越弱,越不適合作因子分析。 Kaiser給出的KMO度量標(biāo)準(zhǔn):0.9以上非常適合;0.8表示適合;0.7表示一般;0.6表示不太適合;0.5以下表示極不適合。2022/7/2343zf(03)設(shè)置對主成分或因子的提取選項(xiàng) 在【 因子分析Factor Analysis】框中點(diǎn)擊【抽取Extraction】按鈕,出現(xiàn)【 因子分析:抽取Factor Analysis:Extraction】對話框;在方法Method 欄中選擇(主成分Principal co

23、mponents)選項(xiàng);在分析Analyze 欄中選擇相關(guān)性矩陣Correlation matrix選項(xiàng)(基于相關(guān)系數(shù)求解主成分);在輸出Display 欄中選擇未旋轉(zhuǎn)的因子解Unrotated factor solution選項(xiàng)(主成分載荷矩陣);在抽取Extract 欄中選擇基于特征根Eigenvalues over 并填上 1 (依據(jù)特征根大于1的原則提取主成分);點(diǎn)擊(繼續(xù)Continue)按鈕確定,回到【 因子分析Factor Analysis】對話框中。2022/7/2344zf2022/7/2345zf(04)設(shè)置主成分得分(或因子得分) 在【因子分析 Factor Analys

24、is】對話框中,點(diǎn)擊【得分Scores】按鈕,出現(xiàn) 【 因子分析:因子得分Factor Analysis: Scores 對話框。 選擇保存為變量save as variable(將新變量得分值保存到數(shù)據(jù)文件)。 選擇display factor score coefficient matrix(顯示主成分表達(dá)式的系數(shù)矩陣) 點(diǎn)擊(繼續(xù)Contiue)按鈕確定,回到【因子分析 Factor Analysis】對話框。2022/7/2346zf2022/7/2347zf(05)設(shè)置主成分分析(或因子分析)的選項(xiàng)在【 因子分析Factor Analysis】對話框中,單擊【選項(xiàng)Options】按鈕

25、,出現(xiàn) 【因子分析:選項(xiàng) Factor Analysis:Options 對話框。缺失值Missing Values 欄中的Exclude cases listwise按列表排除個案Coefficient Display Format(系數(shù)顯示格式) 中的按大小排序Sorted by size表示依據(jù)主成分(因子)載荷量排序; “取消小系數(shù)Suppress absolute values less than”,默認(rèn)為0.1;表示列示所有載荷量大于0.1的載荷系數(shù)。2022/7/2348zf2022/7/2349zf分析結(jié)果:1.描述性統(tǒng)計(jì)均值、標(biāo)準(zhǔn)差等的描述Descriptive Statis

26、tics Vehicle type.26.442152Price in thousands27.3318214.418669152Engine size3.0491.0498152Horsepower184.8156.823152Wheelbase107.4147.7178152Width71.0893.4647152Length187.05913.4712152Curb weight3.37618.636593152Fuel capacity17.9593.9376152 MeanStd. DeviationAnalysis NFuel efficiency23.844.3051522022

27、/7/2350zf2.相關(guān)系數(shù)矩陣描述原始變量之間是否存在相關(guān)關(guān)系相關(guān)系數(shù)矩陣眾對角線外的元素不全為0,而且很多的相關(guān)系數(shù)大于0.5,這表明原始變量之間有相關(guān)關(guān)系,適合進(jìn)行主成分分析。2022/7/2351zf3.共同度表CommunalitiesVehicle type1.000.930Price in thousands1.000.876Engine size1.000.843Horsepower1.000.933Wheelbase1.000.881Width1.000.776Length1.000.919Curb weight1.000.891Fuel capacity1.000.861

28、 InitialExtractionFuel efficiency1.000.860Extraction Method: Principal Component Analysis. Communalities(共同度) :每個原始變量的變異(信息)有多少可被主成分解釋. Initial :每個原始變量的變異(信息)有多少可被所有的主成分解釋。基于相關(guān)系數(shù)進(jìn)行分析時,該值都為1。 Extraction:每個原始變量的信息有多少被提取的主成分給提取了。(提取的主成分包含了每個原始變量的信息多少)如果共同度中extraction值越高,這意味著提取的主成分能很好的代表原始變量。如果extractio

29、n值很低,我們則需要再提取一個或多個主成分0.930,0.876 分別代表原始變量vehicle type和price等有93%和87.6%被我們提取的主成分提取了。基于協(xié)方差進(jìn)行分析時, 每個變量的Initial 又是如何呢?2022/7/2352zf4.碎石圖(陡坡檢查)除去坡線平坦部分的主成分(因子)圖中第三個因子以后較為平坦,故保留3個因子 碎石圖有助于我們確定最優(yōu)的主成分個數(shù)。橫軸代表第幾主成分,縱軸代表相應(yīng)主成分的特征值(方差)。 通常,提取碎石圖較為陡峭部分的主成分; 斜坡處的主成分的方差貢獻(xiàn)較小,不考慮,原始變量的信息遺漏也較少。陡坡與斜坡的轉(zhuǎn)折點(diǎn)在第3和第4主成分之間,從第4

30、至第10主成分的方差很小且差別不大,所以該例提取3個主成分較為合適。 2022/7/2353zf5.方差貢獻(xiàn)率表 取特征值大于 1 的因子,共有3 個,分別(5.994)(1.654)(1.123); 方差貢獻(xiàn)率分別為(59.94%)(16.54%)(11.23%)Total variance explained Extraction Method: Principal Component Analysis. 15.99459.93859.9385.99459.93859.93821.65416.54576.4821.65416.54576.48231.12311.22787.7091.123

31、11.22787.7094.3393.38991.098 5.2542.54193.640 6.1991.99495.633 7.1551.54797.181 8.1301.29998.480 9.091.90599.385 ComponentInitial EigenvaluesExtraction Sums of Squared LoadingsTotal% of VarianceCumulative %Total% of VarianceCumulative %10.061.615100.000 Total這欄給出的是特征根,即每個主成分的方差(或者說,所有原始變量的信息有多少落到各個主

32、成分上去). % of Variance 這欄代表主成分的方差貢獻(xiàn)率,即每個主成分方差占原始變量總方差的比率. Cumulative %這欄代表累積方差貢獻(xiàn)率 ,即為前 n 個主成分的方差貢獻(xiàn)率之和。如累積貢獻(xiàn)率76.482%=第一主成分的方差貢獻(xiàn)59.938%+第二主成分的方差貢獻(xiàn)16.545. 原始變量有10個,提取了10個主成分,且10個主成分的方差之和 = 10個原始變量的方差之和;依據(jù)特征根大于1,我們提取了3個主成分。2022/7/2354zf6.主成分(因子載荷)矩陣表 Component Matrix(a)Vehicle type.471.533-.651Price in th

33、ousands.580-.729-.092Engine size.871-.290.018Horsepower.740-.618.058Wheelbase.732.480.340Width.821.114.298Length.719.304.556Curb weight.934.063-.121Fuel capacity.885.184-.210 Component123Fuel efficiency-.863.004.339Extraction Method: Principal Component Analysis.a 3 components extracted. 主成分載荷矩陣表主要反

34、映原始變量和主成分的相關(guān)關(guān)系,有助于我們進(jìn)行主成分的解釋。. 其中:第一主成分與Engine size, Horsepower , Wheelbase, width, length, curb weight, Fuel capacity ,Fuel efficiency等高度相關(guān). 第二主成分與 Price in thousands 高度相關(guān). 第三主成分與 Vehicle type高度相關(guān). 從該表我們也可看到原始變量的信息如何被各個主成分提取的。如:Var (Vehicle type*) = 0.4712 + 0.5332+ (-0.651)2 Var (Fuel efficiency*)

35、 = (-0.863)2 + 0.0042 + 0.3392根據(jù)該表我們可寫出因子分析模型: Vehicle type* =0.471f1+0.533f2-0.651f3 Fuel efficiency* =-0.863f1+0.004f2-0.339f3從該表也可得到每個主成分方差是如何從各原始變量中提取的 : Var (f1) = 0.4712 + 0.5802 + 0.8712 + .+(-0.863)2Var (f2) = 0.5332 + (-0.729)2 + (-0.290)2 + +(0.004)2Var (f3) = (-0.651)2+(-0.092)2+ 0.0182 +

36、 +(0.339)22022/7/2355zf7.主成分(因子)得分系數(shù)表 Component Score Coefficient MatrixVehicle type.079.322-.579Price in thousands.097-.440-.082Engine size.145-.175.016Horsepower.124-.373.052Wheelbase.122.290.302Width.137.069.266Length.120.184.495Curb weight.156.038-.108Fuel capacity.148.111-.187 Component123Fuel

37、efficiency-.144.002.302Extraction Method: Principal Component Analysis. 依據(jù)該表,我們可寫出主成分分析模型: f1*=0.079Vehicletype*+0.097Price*+ 0.145 Engine size* +-0.144 Fuel efficiency* .每個樣本的原始變量信息帶入以上模型,我們則可得到每個樣本: f1*, f2*, f3*的取值。依據(jù)該取值我們可評價哪些品牌汽車在外觀及油耗性能( f1*)上占優(yōu)或處于劣勢;哪些在f2*(汽車價位)上占優(yōu)或處于劣勢;,要提升各品牌汽車應(yīng)從何著手。綜合f1*,

38、f2*, f3*的信息對各種品牌汽車的進(jìn)行綜合評價,依據(jù)各主成分的方差貢獻(xiàn)產(chǎn)生新變量: f=0.5999 f1*+0.165f2*+0.112f3*2022/7/2356zf8.主成分(因子)得分協(xié)方差矩陣 Component Score Covariance Matrix11.000.000.0002.0001.000.000Component1233.000.0001.000Extraction Method: Principal Component Analysis.該矩陣為單位陣,意味著主成分之間互不相關(guān)。2022/7/2357zf以上例子是采用基于相關(guān)系數(shù)求解主成分,試用協(xié)方差矩陣求

39、解,結(jié)果如何?由協(xié)方差矩陣或相關(guān)系數(shù)矩陣求解主成分結(jié)果一致嗎?應(yīng)如何選擇?2022/7/2358zf主成分分析求解應(yīng)注意的問題:1、由協(xié)方差矩陣出發(fā)求解主成分所得的結(jié)果與由相關(guān)系數(shù)矩陣求解主成分所得結(jié)果有很大不同:所得的主成分的方差貢獻(xiàn)率與主成分表達(dá)式均有顯著差別。 (1)一般而言,對于度量單位不同的指標(biāo)或是取值范圍彼此差異非常大的指標(biāo),不直接由其協(xié)方差矩陣進(jìn)行主成分分析,而應(yīng)該考慮將數(shù)據(jù)標(biāo)準(zhǔn)化。(若不標(biāo)準(zhǔn)化,則基于相關(guān)系數(shù)矩陣進(jìn)行主成分分析) 例:對上市公司的財(cái)務(wù)狀況進(jìn)行分析時,常常涉及利潤總額、市盈率、每股凈利率等。其中利潤總額取值常在幾十萬到上百萬或千萬,市盈率一般取值在五到六七十之間,

40、而每股凈利率在1以下,不同指標(biāo)取值范圍相差很大,若直接用協(xié)方差矩陣進(jìn)行主成分分析,利潤總額的作用將起重要支配作用,而其他兩個指標(biāo)的作用很難在主成分中體現(xiàn)出來,此時應(yīng)該考慮對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。 2022/7/2359zf (2)對同度量或是取值范圍在同量級的數(shù)據(jù),還是直接從協(xié)方差矩陣求解主成分為宜。因?yàn)椋簩?shù)據(jù)標(biāo)準(zhǔn)化的過程實(shí)際上也就是抹殺原始變量離散程度差異的過程,標(biāo)準(zhǔn)化后的各變量方差相等均為1,而方差是數(shù)據(jù)信息的重要概括形式。數(shù)據(jù)標(biāo)準(zhǔn)化后抹殺了一部分重要信息,使得標(biāo)準(zhǔn)化后各變量在對主成分構(gòu)成中的作用趨于相等。對于采用何種方法求解主成分沒有定論。在實(shí)際研究中,從不同角度求解并研究其結(jié)果的差別以及產(chǎn)生差別的原因,以確定哪種結(jié)果更為可信。2022/7/2360zf2、主成分是有效剔除了原始變量中的重疊信息,還是按原來的模式將原始信息中的絕大部分用幾個不相關(guān)的新變量表示出來,還值得討論。 如果計(jì)算所得協(xié)方差陣(或相關(guān)系數(shù)矩陣)的最小特征值接近于0,則意味著中心化以后的原始變量之間存在著多重共線性問題,即原始變量存在著不可忽視的重疊信息。此時應(yīng)注意對主成分的解釋,或者考慮對最初納入分析

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論