方法:因子分析法_第1頁
方法:因子分析法_第2頁
方法:因子分析法_第3頁
已閱讀5頁,還剩2頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、1 概念因子分析 ( Factor analysis ):就是用少數(shù)幾個因子來描述許多指標(biāo)或因素之間的聯(lián)系, 以較少幾個因子來反映原資料的大部分信息的統(tǒng)計學(xué)分析方法。 從數(shù)學(xué)角度來看, 主成分分 析是一種化繁為簡的降維處理技術(shù)。主成分分析 ( Principal component analysis):是因子分析的一個特例,是使用最多的因子提取方法。它通過坐標(biāo)變換手段, 將原有的多個相關(guān)變量, 做線性變化,轉(zhuǎn)換為另外 一組不相關(guān)的變量。 選取前面幾個方差最大的主成分, 這樣達(dá)到了因子分析較少變量個數(shù)的 目的,同時又能與較少的變量反映原有變量的絕大部分的信息。兩者關(guān)系:主成分分析(PCA和因子分

2、析(FA)是兩種把變量維數(shù)降低以便于描述、 理解和分析的方法,而實際上主成分分析可以說是因子分析的一個特例。2 特點(1)因子變量的數(shù)量遠(yuǎn)少于原有的指標(biāo)變量的數(shù)量,因而對因子變量的分析能夠減少 分析中的工作量。(2)因子變量不是對原始變量的取舍,而是根據(jù)原始變量的信息進(jìn)行重新組構(gòu),它能 夠反映原有變量大部分的信息。(3)因子變量之間不存在顯著的線性相關(guān)關(guān)系,對變量的分析比較方便,但原始部分 變量之間多存在較顯著的相關(guān)關(guān)系。(4)因子變量具有命名解釋性,即該變量是對某些原始變量信息的綜合和反映。 在保證數(shù)據(jù)信息丟失最少的原則下, 對高維變量空間進(jìn)行降維處理 (即通過因子分析或主成分分析) 。顯然

3、,在一個低維空間解釋系統(tǒng)要比在高維系統(tǒng)容易的多。3 類型根據(jù)研究對象的不同,把因子分析分為R型和Q型兩種。當(dāng)研究對象是變量時,屬于 R型因子分析;當(dāng)研究對象是樣品時,屬于 Q型因子分析。但有的因子分析方法兼有 R型和Q型因子分析的一些特點,如因子分析中的對應(yīng)分析方 法,有的學(xué)者稱之為雙重型因子分析,以示與其他兩類的區(qū)別。4分析原理假定:有n個地理樣本,每個樣本共有 p個變量,構(gòu)成一個 nx p階的地理數(shù)據(jù)矩陣當(dāng)p較大時,在p維空間中考察問題比較麻煩。這就需要進(jìn)行降維處理,即用較少幾個綜合指標(biāo)代替原來指標(biāo), 而且使這些綜合指標(biāo)既能盡量多地反映原來指標(biāo)所反映的信息,同時它們之間又是彼此獨立的。線性

4、組合:記x1 , x2,,xp為原變量指標(biāo),z1 , z2,zm ( m< p)為新變量指標(biāo) (主成分),則其線性組合為 :Lij 是原變量在各主成分上的載荷無論是哪一種因子分析方法, 其相應(yīng)的因子解都不是唯一的, 主因子解僅僅是無數(shù)因子 解中之一。zi 與 zj 相互無關(guān);z1是x1 , x2,xp的一切線性組合中方差最大者,z2是與z1不相關(guān)的x1, x2 ,的所有線性組合中方差最大者。則,新變量指標(biāo) z1, z2, 分別稱為原變量指標(biāo)的第一, 第二,主成分。Z為因子變量或公共因子,可以理解為在高維空間中互相垂直的m個坐標(biāo)軸。主成分分析實質(zhì)就是確定原來變量 xj (j=1 , 2 ,

5、,p)在各主成分zi (i=1 , 2, m上的荷載iij 。從數(shù)學(xué)上容易知道,從數(shù)學(xué)上也可以證明,它們分別是相關(guān)矩陣的 m個較大的特征值所對應(yīng)的特征向量。5分析步驟確定待分析的原有若干變量是否適合進(jìn)行因子分析 (第一步 )因子分析是從眾多的原始變量中重構(gòu)少數(shù)幾個具有代表意義的因子變量的過程。其潛在的要求:原有變量之間要具有比較強(qiáng)的相關(guān)性。因此,因子分析需要先進(jìn)行相關(guān)分析,計算原始變量之間的相關(guān)系數(shù)矩陣。 如果相關(guān)系數(shù)矩陣在進(jìn)行統(tǒng)計檢驗時, 大部分相關(guān)系數(shù)均小 于且未通過檢驗,則這些原始變量就不太適合進(jìn)行因子分析。進(jìn)行原始變量的相關(guān)分析之前, 需要對輸入的原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化計算 (一般采用標(biāo)準(zhǔn)

6、 差標(biāo)準(zhǔn)化方法,標(biāo)準(zhǔn)化后的數(shù)據(jù)均值為 0,方差為 1)。SPSS在因子分析中還提供了幾種判定是否適合因子分析的檢驗方法。主要有以下3種:巴特利特球形檢驗( Bartiett Test of Sphericity)反映象相關(guān)矩陣檢驗( Anti-image correiation matrix )KMO( Kaiser-Meyer-Oikin)檢驗1 )巴特利特球形檢驗該檢驗以變量的相關(guān)系數(shù)矩陣作為出發(fā)點,它的零假設(shè)H0 為相關(guān)系數(shù)矩陣是一個單位陣,即相關(guān)系數(shù)矩陣對角線上的所有元素都為1,而所有非對角線上的元素都為0,也即原始變量兩兩之間不相關(guān)。巴特利特球形檢驗的統(tǒng)計量是根據(jù)相關(guān)系數(shù)矩陣的行列式

7、得到。 如果該值較大, 且其對 應(yīng)的相伴概率值小于用戶指定的顯著性水平,那么就應(yīng)拒絕零假設(shè)H0,認(rèn)為相關(guān)系數(shù)不可能是單位陣,也即原始變量間存在相關(guān)性。(2)反映象相關(guān)矩陣檢驗 該檢驗以變量的偏相關(guān)系數(shù)矩陣作為出發(fā)點, 將偏相關(guān)系數(shù)矩陣的每個元素取反, 得到 反映象相關(guān)矩陣。偏相關(guān)系數(shù)是在控制了其他變量影響的條件下計算出來的相關(guān)系數(shù),如果變量之間存在較多的重疊影響,那么偏相關(guān)系數(shù)就會較小,這些變量越適合進(jìn)行因子分析。( 3) KMO( Kaiser-Meyer-Olkin )檢驗 該檢驗的統(tǒng)計量用于比較變量之間的簡單相關(guān)和偏相關(guān)系數(shù)。KMO直介于0-1,越接近1,表明所有變量之間簡單相關(guān)系數(shù)平方

8、和遠(yuǎn)大于偏相關(guān)系數(shù) 平方和,越適合因子分析。其中,Kaiser給出一個KM®驗標(biāo)準(zhǔn):KMO非常適合;KMO適合;KMO 般; KMO, 不太適合; KMO, 不適合。構(gòu)造因子變量因子分析中有很多確定因子變量的方法, 如基于主成分模型的主成分分析和基于因子分 析模型的主軸因子法、極大似然法、最小二乘法等。前者應(yīng)用最為廣泛。主成分分析法( Principal component analysis ):該方法通過坐標(biāo)變換,將原有變量作線性變化,轉(zhuǎn)換為另外一組不相關(guān)的變量Zi (主成分)。求相關(guān)系數(shù)矩陣的特征根入i (入1,入2,入p0)和相應(yīng)的標(biāo)準(zhǔn)正交的特征向量 li ; 根據(jù)相關(guān)系數(shù)矩陣

9、的特征根,即公共因子 Zj的方差貢獻(xiàn)(等于因子載荷矩陣 L中第j列各元素的平方和) ,計算公共因子 Zj 的方差貢獻(xiàn)率與累積貢獻(xiàn)率。主成分分析是在一個多維坐標(biāo)軸中, 將原始變量組成的坐標(biāo)系進(jìn)行平移變換, 使得新的 坐標(biāo)原點和數(shù)據(jù)群點的重心重合。 新坐標(biāo)第一軸與數(shù)據(jù)變化最大方向?qū)?yīng)。 通過計算特征根 (方差貢獻(xiàn)) 和方差貢獻(xiàn)率與累積方差貢獻(xiàn)率等指標(biāo), 來判斷選取公共因子的數(shù)量和公共因 子(主成分)所能代表的原始變量信息。公共因子個數(shù)的確定準(zhǔn)則: 1)根據(jù)特征值的大小來確定,一般取大于 1 的特征值對應(yīng) 的幾個公共因子 / 主成分。 2 )根據(jù)因子的累積方差貢獻(xiàn)率來確定,一般取累計貢獻(xiàn)率達(dá) 85-

10、95%的特征值所對應(yīng)的第一、第二、第 m( m< p)個主成分。也有學(xué)者認(rèn)為累積方差 貢獻(xiàn)率應(yīng)在 80以上。因子變量的命名解釋因子變量的命名解釋是因子分析的另一個核心問題。經(jīng)過主成分分析得到的公共因子Z1,Z2, ,Zm 是對原有變量的綜合。在實際的應(yīng)用分析中,主要通過對載荷矩陣進(jìn)行分析, 得到因子變量和原有變量之間的關(guān)系, 從而對新的因子變量進(jìn)行命名。 利用因子旋轉(zhuǎn)方法能 使因子變量更具有可解釋性。計算主成分載荷,構(gòu)建載荷矩陣A。載荷矩陣A中某一行表示原有變量 Xi與公共因子的相關(guān)關(guān)系。載荷矩陣 A中某一列表示某一個公共因子能夠解釋的原有變量Xi的信息量。有時因子載荷矩陣的解釋性不太好

11、, 通常需要進(jìn)行因子旋轉(zhuǎn), 使原有因子變量更具有可解釋性。因子旋轉(zhuǎn)的主要方法:正交旋轉(zhuǎn)、斜交旋轉(zhuǎn)。正交旋轉(zhuǎn)和斜交旋轉(zhuǎn)是因子旋轉(zhuǎn)的兩類方法。 前者由于保持了坐標(biāo)軸的正交性, 因此使 用最多。正交旋轉(zhuǎn)的方法很多,其中以方差最大化法最為常用。方差最大正交旋轉(zhuǎn)( varimax orthogonal rotation)基本思想:使公共因子的相對負(fù)荷的方差之和最大, 且保持原公共因子的正交性和公共方差總和不變。 可使每個因子上 的具有最大載荷的變量數(shù)最小,因此可以簡化對因子的解釋。斜交旋轉(zhuǎn)( oblique rotation )因子斜交旋轉(zhuǎn)后,各因子負(fù)荷發(fā)生了變化,出現(xiàn)了 兩極分化。 各因子間不再相互獨立, 而是彼此相關(guān)。 各因子對各變量的貢獻(xiàn)的總和也發(fā)生了 改變。因子旋轉(zhuǎn)的目的是使因子負(fù)荷兩極分化,要么接近于 0,要么接近于 1。從而使原有因子變量更具有可解釋性。計算因子變量得分因子變量確定以后, 對于每一個樣本數(shù)據(jù), 我們希望得到它們在不同因子上的具體數(shù)據(jù) 值,即因子得分。估計因子得分的方法主要有:回歸法、 Bartlett

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論