




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
因子分析
(FactorAnalysis)知識點1、什么是因子分析?2、理解因子分析的基本思想3、因子分析的數(shù)學模型以及模型中公共因子、因子載荷變量共同度的統(tǒng)計意義4、因子旋轉的意義5、結合SPSS軟件進行案例分析zf案例1:
我們試圖對某快餐店的質量進行評估,選擇了就餐等待時間、清潔度等6個指標作為觀測變量:這些變量之間有高度的相關關系這些變量能否綜合成兩個或多個因子?這些彼此相關的變量會導致某些信息多次考慮,引起分析的偏誤······如何避免??因子分析的基本理論zf2除了主成分分析(PCA)外,還有用來實現(xiàn)‘降維’的其他方法嗎
??因子分析Factoranalysis1、什么是因子分析?2、因子分析的基本思想?3、因子分析與主成分分析的區(qū)別??zf3Spearman(1904)
發(fā)表的論文“Generationintelligenceobjectivelydeterminedandmeasured”,AmericanJournalPsychology15,201-293.被認為是因子分析研究的開端.這篇文章主要是針對中學生考試成績進行因子分析zf4當考慮該矩陣上三角中的相關元素會發(fā)現(xiàn):(1)每一行元素呈遞減的趨勢,且遞減的大小大致相當;(2)任意兩列元素大致成比例。
中學生各門課程考試成績的相關系數(shù)矩陣
classicsfrenchenglishmathdiscrmusicclassics10.830.780.70.660.63french0.8310.670.670.650.57english0.780.6710.640.540.51math0.70.670.6410.450.51discr0.660.650.540.4510.4music0.630.570.510.510.41究竟是什么因素在影響著學生的成績呢?zf5Spearman提出:標準化的每個原始變量可用以下的方程形式表示:每門課程的考試成績可用兩個因素做解釋:(1)總體智力水平因子generalintelligence
f
;(2)特殊潛能因子specifictalentsordeficienciesClassics*、French*等是標準化后的考試成績,均值為0,方差為1f為公共因子,對各門課程的考試成績均有影響,且其均值為0,方差為1;為特殊因子,僅對第i門課程考試成績有影響;其中f與相互獨立。每門課程的考試成績可看作為由一個公共因子和一個特殊因子之和zf6
案例2:假設我們有學生以下幾門課程的成績Supposewehavestudents’testscoresforMathematics(M),Physics(P),Chemistry(C),English(E),History(H),andFrench(F).
其相關系數(shù)矩陣如下:
MPCEHFM1
P0.621
C0.540.511
E0.320.380.361
H0.2840.3510.3360.6861
F0.370.430.4050.730.7351這6門課程成績可用兩個或多個能力因子做解釋嗎?在M,P,C這幾門課程之間有較高的相關關系;在E,H,F這幾門課程之間有較高的相關關系。zf7案例3:在企業(yè)形象或品牌形象的研究中,消費者可以通過一個有24個指標構成的評價體系,評價百貨商場的24個方面的優(yōu)劣。因子分析方法可以通過24個變量,找出反映商店環(huán)境、商店服務水平和商品價格的三個潛在的因子,對商店進行綜合評價。而每個原始變量可表示為:稱是不可觀測的潛在因子,稱為公共因子。24個變量共享這三個因子,但是每個變量又有自己的個性,不被包含的部分,稱為特殊因子。zf81、什么是因子分析?因子分析是主成分分析的推廣,也是利用降維的思想,由研究原始變量相關矩陣的內部依賴關系出發(fā),把一些具有錯綜復雜關系的多個變量歸結為少數(shù)幾個綜合因子的一種多元統(tǒng)計分析方法。zf92、因子分析的基本思想:根據(jù)相關性大小把原始變量分組,使得同組內的變量之間相關性較高,而不同組的變量之間的相關性較低。每組變量代表一個基本結構,并用一個不可觀測的綜合變量表示,這個基本結構就稱為公共因子。
因子分析將每個原始變量分解成兩部分因素,一部分是由所有變量共同具有的少數(shù)幾個公共因子組成的,另一部分是每個變量獨自具有的因素,即特殊因子。注意:原始變量是可觀測的,而公共因子是不可觀測的潛在變量。我們需要計算每個公共因子得分,從而替代原始變量。zf103、主成分分析分析與因子分析差異:(1)主成分分析模型是原始變量的線性組合,是將原始變量加以綜合、歸納;而因子分析是將原始變量加以分解。(2)主成分分析中,主成分載荷是唯一確定的;因子分析中因子載荷不是唯一的。(3)因子分析中因子載荷的不唯一性有利于對公因子進行有效解釋;而主成分分析對提取的主成分的解釋能力有限。zf11例:對美國洛杉磯12個人口調查區(qū)的5個經(jīng)濟學變量的數(shù)據(jù)進行因子分析(12個地區(qū)調查表.sav)zf12zf13每個因子的載荷系數(shù)沒有很明顯的差別,所以不好命名.為了對因子進行命名,可以進行旋轉,使系數(shù)向0和1兩極分化第一主因子對中等學校平均校齡,專業(yè)服務項目,中等房價有絕對值較大的載荷(代表福利條件因子);第二主因子對總人口和總雇員數(shù)有較大的載荷(代表人口因子).zf14因子分析的基本步驟(1)因子分析的前提條件鑒定考察原始變量之間是否存在較強的相關關系,是否適合進行因子分析。如果原有變量相互獨立,不存在相關關系,也就無需進行因子分析。(2)因子提取
研究如何在樣本數(shù)據(jù)的基礎上提取綜合因子。zf15(3)因子旋轉
通過正交旋轉或斜交旋轉使提取出的因子具有可解釋性。(4)計算因子得分求解各樣本在各因子上的得分,為進一步分析奠定基礎。zf16(1)計算相關系數(shù)矩陣(correlationcoefficientsmatrix)
如果相關系數(shù)矩陣中的大部分相關系數(shù)值均小于0.3,即各變量間大多為弱相關,原則上這些變量不適合進行因子分析。(2)巴特利特球度檢驗(Bartletttestofsphericity)
其零假設H0:相關系數(shù)矩陣為單位矩陣(即原始變量之間無相關關系)。如果統(tǒng)計量卡方值較大且對應的sig值小于給定的顯著性水平a時,零假設不成立。即說明相關系數(shù)矩陣不太可能是單位矩陣,變量之間存在相關關系,適合做因子分析。因子分析前提條件——相關性分析方法zf17(3)KMO(Kaiser-Meyer-Olkin)檢驗
KMO檢驗的統(tǒng)計量是用于比較變量間簡單相關系數(shù)矩陣和偏相關系數(shù)的指標,數(shù)學定義為:KMO值越接近1,意味著變量間的相關性越強,原有變量適合做因子分析;越接近0,意味變量間的相關性越弱,越不適合作因子分析。Kaiser給出的KMO度量標準:0.9以上非常適合;0.8表示適合;0.7表示一般;0.6表示不太適合;0.5以下表示極不適合。zf18因子分析不僅僅要找出公共因子以及對變量進行分組,更重要的要知道每個公共因子的意義,以便進行進一步的分析。如果每個公共因子的含義不清,則可對因子載荷陣進行旋轉。因子旋轉的目的:使每個變量在盡可能少的因子上有比較高的載荷,讓某個變量在某個因子上的載荷趨于1,而在其他因子上的載荷趨于0。即:使載荷矩陣每列或行的元素平方值向0和1兩極分化。因子旋轉的目的及方法zf19因子旋轉方法:(1)正交旋轉:在旋轉時始終保持公因子之間的相互獨立性。主要有以下方法:varimax方差最大旋轉;
quartmax四次最大正交旋轉;equamax等量正交旋轉(2)斜交旋轉:在旋轉時,放棄了因子之間彼此獨立的限制,旋轉后的新公因子更容易解釋。主要有以下的方法:directoblimin直接斜交旋轉;
promax斜交旋轉方法。zf20生育率受社會、經(jīng)濟、文化、計劃生育政策等很多因素影響,但這些因素對生育率的影響并不是完全獨立的,而是交織在一起,如果直接用選定的變量對生育率進行多元回歸分析,最終結果往往只能保留兩三個變量,其他變量的信息就損失了。因此,考慮用因子分析的方法,找出變量間的數(shù)據(jù)結構,在信息損失最少的情況下用新生成的因子對生育率進行分析。選擇的變量有:多子率、綜合節(jié)育率、初中以上文化程度比例、城鎮(zhèn)人口比例、人均國民收入。下表是1990年中國30個省、自治區(qū)、直轄市的數(shù)據(jù)。案例分析3:生育率的影響因素分析zf21zf22特征根與各因子的貢獻EigenvalueDifferenceProportionCumulative3.249175972.034642910.64980.64981.214533060.962968000.24290.89270.251565070.067433970.05030.94310.184131090.083536290.03680.97990.100594800.0201
1.0000zf23沒有旋轉的因子結構
Factor1Factor2x1-0.760620.55316x20.56898-0.76662x30.891840.25374x40.870660.34618x50.890760.36962zf24各旋轉后的共同度0.884540230.911439980.859770610.877894530.93006369Factor1可解釋方差Factor2可解釋方差2.99754292.1642615zf25
Factor1Factor2x1-0.35310-0.87170x20.077570.95154x30.891140.25621x40.922040.16655x50.951490.15728
Factor1Factor2x1-0.05897-0.49252x2-0.058050.58056x30.330420.03497x40.35108-0.02506x50.36366-0.03493方差最大旋轉后的因子結構標準化得分函數(shù)在這個例子中我們得到了兩個因子,第一個因子是社會經(jīng)濟發(fā)展水平因子,第二個是計劃生育因子。有了因子得分值后,則可以利用因子得分為變量,進行其他的統(tǒng)計分析。zf26因子分析的上機操作問題題項從未使用很少使用有時使用經(jīng)常使用總是使用12345A1電腦A2錄音磁帶A3錄像帶A4網(wǎng)上資料A5校園網(wǎng)或因特網(wǎng)A6電子郵件A7電子討論網(wǎng)A8CAI課件A9視頻會議A10視聽會議zf27題目編號A1A2A3A4A5A6A7A8A9A10011551111111022552221211034333431411044344442422054433441411064333342321074444332411081531111111094454442411105435543533115434442522125454443522133552221311145343332522154553332522164444351411175445554544185442341511195455553533205445552521zf28(01)建立數(shù)據(jù)文件zf29(02)選擇分析變量
——選SPSS[Analyze]菜單中的(DataReduction)→(Factor),出現(xiàn)【FactorAnalysis】對話框;——在【FactorAnalysis】對話框中左邊的原始變量中,選擇將進行因子分析的變量選入(Variables)欄。zf30(03)設置描述性統(tǒng)計量——在【
FactorAnalysis】框中選【
Descriptives】按鈕,出現(xiàn)【Descriptives】對話框;——選擇Initialsolution(未轉軸的統(tǒng)計量)選項——選擇KMO選項——點擊(Contiue)按鈕確定。zf31zf32(04)設置對因子的抽取選項
——在【FactorAnalysis】框中點擊【Extraction】按鈕,出現(xiàn)【FactorAnalysis:Extraction】對話框;——在Method欄中選擇(Principalcomponents)選項;——在Analyze欄中選擇Correlationmatrix選項;——在Display欄中選擇Unrotatedfactorsolution選項;——在Extract欄中選擇Eigenvaluesover并填上1;——點擊(Contiue)按鈕確定,回到【FactorAnalysis】對話框中。zf33zf34zf35(05)設置因子轉軸——在【FactorAnalysis】對話框中,點擊【Rotation】按鈕,出現(xiàn)【FactorAnalysis:Rotation】(因子分析:旋轉)對話框。——在Method欄中選擇Varimax(最大變異法)——在Display欄中選擇Rotatedsolution(轉軸后的解)——點擊(Contiue)按鈕確定,回到【FactorAnalysis】對話框中。zf36zf37(06)設置因素分數(shù)——在【FactorAnalysis】對話框中,點擊【Scores】按鈕,出現(xiàn)【FactorAnalysis:Scores】(因素分析:分數(shù))對話框。——一般取默認值。——點擊(Contiue)按鈕確定,回到【FactorAnalysis】對話框。zf38zf39(07)設置因子分析的選項——在【FactorAnalysis】對話框中,單擊【Options】按鈕,出現(xiàn)【FactorAnalysis:Options】(因素分析:選項)對話框。——在MissingValues欄中選擇Excludecaseslistwise(完全排除缺失值)——在CoefficientDisplayFormat(系數(shù)顯示格式)欄中選擇Sortedbysize(依據(jù)因素負荷量排序)項;——在CoefficientDisplayFormat(系數(shù)顯示格式)勾選“Suppressabsolutevalueslessthan”,其后空格內的數(shù)字不用修改,默認為0.1。——如果研究者要呈現(xiàn)所有因素負荷量,就不用選取“Suppressabsolutevalueslessthan”選項。在例題中為了讓研究者明白此項的意義,才勾選了此項,正式的研究中應呈現(xiàn)題項完整的因素負荷量較為適宜。——單擊“Continue”按鈕確定。zf40zf41zf42對SPSS因子分析結果的解釋取樣適當性(KMO)檢驗——KMO值越大,表示變量間的共同因素越多,越適合進行因素分析,要求KMO>0.5——要求Barlett’s的卡方值達到顯著程度zf432.共同度檢查zf443.因子陡坡檢查,除去坡線平坦部分的因子圖中第三個因子以后較為平坦,故保留3個因子zf454.方差貢獻率檢驗——取特征值大于1的因子,共有3個,分別(6.358)(1.547)(1.032);——變異量分別為(63.58%)(15.467%)(10.32%)zf465.顯示未轉軸的因子矩陣zf476.分析轉軸后的因子矩陣----根據(jù)因子負荷量形成3個公共因子zf487.形成綜合分析結果題項貢獻率(解釋變異量)累積貢獻率(累積解釋變異量)Component(抽取的因子)因子1負荷量因子2負荷量因子3負荷量共同性A1電腦A8CAI課件A6電子郵件A5校園網(wǎng)或因特網(wǎng)A4網(wǎng)上資料43.885%43.885%0.9150.9120.8840.8240.7890.9280.9070.8670.9010.872A10視聽會議A9視頻會議A7電子討論網(wǎng)31.372%75.257%0.9390.9240.8580.9390.9650.919A3錄像帶A2錄音磁帶14.108%89.366%0.9480.6520.9000.738特征值4.3893.1371.411zf49生育率受社會、經(jīng)濟、文化、計劃生育政策等很多因素影響,但這些因素對生育率的影響并不是完全獨立的,而是交織在一起,如果直接用選定的變量對生育率進行多元回歸分析,最終結果往往只能保留兩三個變量,其他變量的信息就損失了。因此,考慮用因子分析的方法,找出變量間的數(shù)據(jù)結構,在信息損失最少的情況下用新生成的因子對生育率進行分析。選擇的變量有:多子率、綜合節(jié)育率、初中以上文化程度比例、城鎮(zhèn)人口比例、人均國民收入。下表是1990年中國30個省、自治區(qū)、直轄市的數(shù)據(jù)。案例分析:生育率的影響因素分析zf50zf51特征根與各因子的貢獻EigenvalueDifferenceProportionCumulative3.249175972.034642910.64980.64981.214533060.962968000.24290.89270.251565070.067433970.05030.94310.184131090.083536290.03680.97990.100594800.0201
1.0000zf52沒有旋轉的因子載荷
Factor1Factor2x1-0.760620.55316x20.56898-0.76662x30
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 人教版小學四年級上冊數(shù)學口算練習試題 5x
- 美容減肥培訓課件
- 辦公樓改造施工協(xié)議
- 港口集裝箱運輸合同模板
- 2024漣源鋼鐵集團有限公司技工學校工作人員招聘考試及答案
- 2024河南省廣播電視中等專業(yè)學校工作人員招聘考試及答案
- 磚廠股權轉讓合同:磚廠轉讓合同書
- 第四季度儲氣罐租賃合同書
- 職業(yè)教育培訓合作辦學合同書
- 度植樹造林合作協(xié)議
- 國開電大可編程控制器應用課程實驗參考答案
- ST語言編程手冊
- 醫(yī)院HIS信息管理系統(tǒng)故障應急預案
- 司法案例研究方法與技巧
- 足球運球課件
- (7)-2.3 理想信念是精神之鈣
- 高中音樂-學堂樂歌
- MSA-測量系統(tǒng)分析模板
- 工業(yè)交換機內部培訓
- 《中國特色社會主義進入新時代》PPT課件下載
- 深靜脈血栓形成干預策略
評論
0/150
提交評論