多元統計分析實驗教學指導書_第1頁
多元統計分析實驗教學指導書_第2頁
多元統計分析實驗教學指導書_第3頁
多元統計分析實驗教學指導書_第4頁
多元統計分析實驗教學指導書_第5頁
已閱讀5頁,還剩39頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

前言多元統計分析是統計學的一個重要分支。隨著計算機的普及和發展,了解和使用它的人迅速增加,它的作用也越來越大,幾乎在國民經濟許多領域中都有著廣泛的應用,并已取得很多具有卓越成效的成果。實踐證明,多元分析方法是處理多維數據不可缺少的重要工具,并日益顯示出無比的魅力。為了適應經濟管理問題研究中定量分析的需要以及當前教學改革不斷深入的需要,國內很多理工和財經院校相繼給MBA、研究生和本科生開始了該課程和實驗。作者在多年開設多元統計分析課程和科研工作的基礎上,在原編著使用的《多元統計分析實驗指導書》基礎上,對原書進行修改和充實,力爭寫出一本適合財經、統計、管理等專業用的實驗指導書,同時也想給對此方法感興趣的科研人員、教師、經濟方面的讀者,提供一個較系統掌握這一方法和計算機計算的良好參考書。本實驗指導書特點:注重分析和解決實際問題的完整性,寫入了有關專家和作者研究的最新成果,給出了分析解決問題的具體步驟,附有通用計算機程序的例子。學習本實驗書應具備以下三方面的知識:1.線性代數;2.數理統計;3.會調用國內外通用SAS軟件包上機操作即可。并不要求自編程序去實現各種方法的計算.本書適用范圍:可作為高等院校統計、財經、管理等專業的本科生實驗指導教材,也可作為非數學專業的研究生和科技工作者的計算機實驗參考書,所需講授學時約18左右。本書的實例,一部份是作者科研成果,一部份是學生完成的作業,在此一并向他們表示衷心感謝。希望這本書的使用,為多元分析的普及和發展起到一定的促進作用,也為統計實驗教材的改革,做些有意義的工作,使這一有效的數學工具更好地為社會主義市場經濟服務。由于水平有限,書中難免有不足之處,歡迎讀者批評指正。目錄(宋體三號加粗)(空一行)實驗項目一實驗項目二實驗項目三檢驗統計量:F==_____(實驗程序見后附)(3)給出檢驗水平或0.05,_________,拒絕域不等式為:F(≤、≥)_______;(4)判斷:因為F=____________,所以_____,即認為_____________________________(5)實驗程序。七、布置多元假設檢驗實驗作業(按規定格式一星期內交)數據:為了研究美國、日本兩國在華投資企業對中國經營環境的評價是否存在差異,今從兩國在華投資企業中各抽出10家,讓其對中國的政治環境(x1)、經濟環境(x2)、法律環境(x3)、文化環境(x4)等進行打分,其結果如下:序x1x2x3x4165352560275502055360453565475404070570303050655403565760453060865402560960503070105555357511555540651250604570134545357514505050701555503075166040456017655545751850603580194045306520455045701-10號為美國在華投資企業的代號,11-20號為日本在華投資企業的代號。檢驗美國、日本兩國在華投資企業對中國經營環境的評價是否存在差異。實驗項目二:多元方差分析實驗一、實驗目的:通過多元方差分析的實驗,熟悉多元方差分析問題的提出、解決問題的思路、方法和技能,會調用SAS軟件多元方差分析過程命令,根據計算機計算的結果,訓練學生分析和解決多元方差分析問題的能力。二、預備知識:解決多元方差分析問題的思路、理論和方法。三、實驗內容:多元方差分析問題的數據。四、實驗儀器與材料:計算機與SAS軟件。五、(一)1.多元方差分析實驗例(k=3):例為了研究某種疾病,對一批人同時測量了四個指標:β脂蛋白(x1),甘油三酯(x2)、α脂蛋白(x3)、前脂蛋白(x4),按不同性別、不同年齡將它們分為三組,1組是20—25歲女性,2組是20—25歲男性,3組是35—50歲男性,試問三組之間是否有顯著差異?組x1x2x3x41260754018120072341712408745181170653917127011039241205130342311906927151200464515125011721201200107282012251303611121012526171170643114127076331311906034161280812018131011925151270573181250673114126013539292310122302123106035182190402715222565341621706537162210823117228067371822103836172280653023組x1x2x3x4220076401722007639202280942611219060331722955530162270125242122801203218224062322022806929202370703020228040371733206439173260593711336088282632951003612327065322133801143621324055421032605534203260110292032957333213240114381833101033218333011221113345127242032506222163260592119322510034303345120361833601072523325011736162.實驗步驟:調用多元方差分析過程命令輸入數據求得:統計量∧、F,自由度、,檢驗的p值。3.結果的分析與應用:(1)建立假設:H0:H1:;ij.(2)檢驗統計量F==_3.09_0.66212289_,t1=8_,t2=_108,p=0.0035(實驗程序見后附)(3)判斷:給定顯著水平=0.01,0.05,因為p=0.0035<,所以拒絕HO,即認為三組之間是有顯著差異。(4)顯著差異是哪些指標引起的?_x1_。(5)不引起顯著差異的指標聯合引起總體差異嗎?不引起。(6)實驗程序與結果。多元方差分析過程命令datatrial;inputg$x1x2x3x4@@;cards;1260754018(樣品數據)32501173616;procanova;classg;modelx1-x4=g;manovah=g;run;語句解釋:g$-字符型;x1x2x3x4-數值型;@@-是SAS軟件中規定的指針控制符,不能省略,否則因input語句中只有一個變量……,將只能從每一行上讀取一個數據;anova–方差分析;class-總體數(因素);manova–作多元方差分析;h=g表示要分析的因素為g,若model語句中沒有“nouni”,則先對單變量進行方差分析,后對多變量進行方差分析。其它語句參見文獻[1]。刷黑該塊過程命令程序,提交便計算出:每個變量方差分析的統計量F、檢驗的p值;多變量方差分析的統計量、F、第一自由度t1、第二自由度t2、檢驗的p值。DependentVariable:x1SourceDFSumofSquaresMeanSquareFValuePr>FModel239065.833319532.91678.880.0004DependentVariable:x2SourceDFSumofSquaresMeanSquareFValuePr>FModel24017.233332008.616672.830.0674DependentVariable:x3SourceDFSumofSquaresMeanSquareFValuePr>FModel213.4333336.7166670.180.8326DependentVariable:x4SourceDFSumofSquaresMeanSquareFValuePr>FModel217.2000008.6000000.480.6222TheANOVAProcedureMultivariateAnalysisofVarianceStatisticValueFValueNumDFDenDFPr>FWilks'Lambda0.662122893.0981080.0035(二).實驗步驟:調用多元方差分析過程命令輸入數據求得:統計量∧、F,自由度、,檢驗的p值。(三).結果的分析與應用:(1)建立假設:H0:H1:;ij.(2)檢驗統計量F==___,t1=,t2=_,p=(實驗程序見后附)(3)判斷:給定顯著水平=0.01,0.05,因為p=,所以HO,即認為。(4)顯著差異是哪些指標引起的?__。(5)不引起顯著差異的指標聯合引起總體差異嗎?。(6)實驗程序。六、布置多元方差分析實驗作業(一星期內交)。實驗項目2作業數據:現抽樣10戶居民,調查每月人平均支出的部分內容情況,它們是x1-總支出(單位:元),x2-食品支出(單位:元),x3-儲蓄率(%)。連續四個月的調查為下述數據,檢驗該地區四個月的總支出,食品支出,儲蓄率有無顯著變化。月x1x2x3月x1x2x3PAGEPAGE341397181.58.7315022337.2813811815.131415189.58.781463212.58.2514592098.961399184.57.541515237.57.891433196.59.1118503898.4124361979.5725312419.22379176.56.762407185.58.9124592098.812461208.59.522400184825202398.082447202.59.5628533859.763462207.510.1835352419.193380177.56.5534011878.033463211.58.93346920910.534011858.0435272428.533435198.59.323794379.59.8544051849.174523241.58.3543771795.194409186.58.644572098.5344622099.443981847.5945155378.2644341969.644840383.58.75實驗項目三:聚類分析實驗一、實驗目的:通過聚類分析的實驗,熟悉聚類分析問題的提出、解決問題的思路、方法和技能,會調用SAS軟件聚類分析過程命令,根據計算機計算的結果,分析和解決聚類分析問題的能力。二、預備知識:解決聚類分析問題的思路、理論和方法。三、實驗內容:聚類分析問題的數據。四、實驗儀器與材料:計算機與SAS軟件。五、1.聚類分析實驗程序例:聚類分析過程命令Datapgm33b;Inputx1-x3;cards;9.3030.558.7(樣品數據)1.8520.6612.75;Procclusterstandardmethod=averagenonormnosquarecccpseudoout=tree;Proctreedata=treehorizontalspaces=1;run;Datapgm33b;Inputx1-x4;cards;9.3030.558.7(樣品數據)1.8520.6612.75;Procclusterstandardmethod=completenonormnosquarecccpseudoout=tree;Proctreedata=treehorizontalspaces=1;run;刷黑該塊過程命令程序,提交便計算出相應聚類結果。語句解釋:聚類指定的方法是在“method=”后面填入一個相應的選擇項,它們是:single(最短距離法),complete(最長距離法),average(類平均法),centroid(重心法),median(中位數法),ward(離差平方和法),flexible(可變類平均法),density(非參數概率密度估計法),eml(最大似然法),twostage(兩階段密度法)。cluster–進行樣品聚類分析;standard-對變量實施標準化;“method=”后為選用的聚類方法;nonorm–阻止距離被正態化;當method=ward時,nonorm阻止類間平方和被總平方和正態化而產生半偏相關平方和;當method=density、eml或twostage時,選擇項nonorm無效;當method=centroid、median或ward時,nosquare阻止距離被平方.選擇項CCC、pseudo都是為了計算一些統計量用以判別全部樣品究竟聚成幾類合適。CCC要求打印出聚類判別據的立方(即判別資料聚成幾類合適的一種統計量)及在一致無效假設下近似期望值R2。Pseudo要求打印偽F(標志PSF)和t2(標志PST2)統計量。當分類數目不同時,它們就有不同的取值,CCC和PSF出現峰值所對應的分類較合適、PST2出現峰值的前一行所對應的分類數較合適。out=tree產生一個名為tree的輸出數據集,它可被tree過程用來輸出聚類結果的樹狀圖。Horizontal要求將樹狀圖水平放置,spaces=1要求置各樣品之間的間隔為1.其它語句參見文獻[1]。2.實驗步驟:調用聚類分析過程命令輸入數據得到聚類過程表和聚類圖,距離選用歐氏距離,方法選用最短距離法和類平均法。六、結果的分析與應用(有關表圖要有序號、中英文名、表的上下線為粗線、表的內線為細線、表的左右邊不封口、表圖不能跨頁、表圖旁不能留空塊,引用結論要注明參考文獻):1.對最短距離法得到的聚類過程表和聚類圖進行初步的定量分析;2.對類平均法得到的聚類過程表和聚類圖進行初步的定量分析;3.結合相關的經驗、事實與原始數據進行兩類方法的定量、定性分析總結,找出研究對象的優勢、問題、原因、結論,給出決策相關性的建議,并由此檢驗方法與模型的正確性。4.實驗程序。七、布置聚類分析實驗作業(一星期內交)。實驗項目四:判別分析實驗一、實驗目的:通過判別分析的實驗教學,使學生熟悉判別分析問題的提出、解決問題的思路、方法和技能,會調用SAS軟件判別分析過程命令,根據計算機計算的結果,訓練學生分析和解決判別分析問題的能力。二、預備知識:解決判別分析問題的思路、方法。三、實驗內容:判別分析問題的數據。四、實驗儀器與材料:計算機與SAS軟件。五、1.判別分析實驗程序例:判別分析過程命令datadiscdatl;inputnox1x2x3type;labelx1='A'x2='B'x3='C';cards;1769953741(已分類樣品數據)1062.980.637992;run;datadiscdat2;inputnox1x2x3;labelx1='A'x2='B'x3='C';cards;168.579.31950(待判樣品數據)469.390.35158;run;procdiscrimdata=discdatltestdata=discdat2crosslisterrtestlist;classtype;varx1-x3;run;2.實驗步驟:調用判別分析過程命令輸入數據求得判別函數、回判結果及分析、判別新樣品類別(方法:貝葉斯判別法)。六、結果的分析與應用(有關表圖要有序號、中英文名、表的上下線為粗線、表的內線為細線、表的左右邊不封口、表圖不能跨頁、表圖旁不能留空塊,引用結論要注明參考文獻):1、給出判別函數系數表1、判別函數;2、給出回判結果分析表2、相應回判結果分析的文字說明;3、給出新樣品具體判別結果的表3、相應新樣品具體判別結果的文字說明;4.實驗程序。七、布置判別分析實驗作業(一星期內交)。實驗項目五:主成分分析實驗一、實驗目的:通過主成分分析的實驗教學,使學生熟悉主成分分析問題的提出、解決問題的思路、方法和技能,會調用SAS軟件主成分分析過程命令,根據計算機計算的結果,訓練學生分析和解決主成分分析問題的能力。二、預備知識:解決主成分分析問題的思路、方法。三、實驗內容:主成分分析問題的數據。四、實驗儀器與材料:計算機與SAS軟件。五、1.主成分分析實驗程序例:主成分分析過程命令datasocecon;inputx1-x6;cards;163693504887660472397739198.46104395513379566257474445610076.962026379707397183130388703418.8810594810572414932175375198427.671282611228487666718269101566960.0933270097386049355822130790830.5422279916970778830243863001476.64272203100066174361354386601358.5922279410217636760996799691234.5516102520946138078116406526527150.1542693711469720416714185377843.41157274141651504005294131025363149.17568899127959661881158072327845.13165319127625846961358334310765.3116645412008501780498627831015.04865751120898136713364129518979.833794712719716491444840879615.6899949;procprincompout=aaaprefix=z;varx1-x6;run;dataa2;setaaa;procprint;varz1-z2;run;2.實驗步驟:原始數據正向化(正向化公式見后),1.調用主成分分析過程命令輸入正向化數據求得相關系數陣R、R的特征值、信息累計貢獻率及相應的單位特征向量、給出主成分函數Fi、主成分的樣品值;2.調用iml過程命令編程計算變量X與主成分F1、F2、F3、F4、…的相關系數矩陣、、、、后略)、綜合主成分F綜的樣品值;3.用主成分函數F1、F2、…、Fm的樣品值做聚類分析(類平均法,調用聚類分析過程命令)等;4.進行相應綜合評價,找出新產品開發的方向。六、結果的分析與應用(有關表圖要有序號、中英文名、表的上下線為粗線、表的內線為細線、表的左右邊不封口、表圖不能跨頁、表圖旁不能留空塊,引用結論要注明參考文獻):1.指標的正向化(單獨計算),正向化公式:反向指標正向化公式:-;強度逆向指標xj正向化公式[3]:適度指標xj正向化公式[3]:E為理想值。這里為第i個樣品第j個指標的觀測值。2.指標數據標準化(SAS軟件自動執行);3.指標之間的相關性判定:用SAS軟件的Correlations(相關系數矩陣R)判定,若變量間有相關性,主成分分析繼續,否則,直接進行逐個指標分析,用進行綜合分析(是正向化、標準化的);4.給出表2:相關系數矩陣R的特征值和主成分方差貢獻(EigenvaluesoftheCorrelationMatrix)的前m+1個(后略);給出表3:相應的單位正交特征向量前m+1列(后略);給出表4:變量與主成分的相關系數陣、、、、后略)(初始因子載荷陣,可調用iml過程命令編程計算,或為SAS軟件因子分析過程命令中的FactorPattern);5.若中每行的系數絕對值往0、1靠近較多,則用主成分分析法;6.確定主成分個數m:以每行至少有一個系數絕對值≥0.5的最小列數確定;7.主成分fi的命名及其正向化:將的第i列絕對值大(≥0.5)的對應變量歸為fi一類,由這些變量與主成分fi的相關關系對主成分fi進行命名,由這些變量的實際意義對主成分fi進行正向化;8.前m個主成分函數:fi==,i=1,…,m(主成分X的系數平方和是1、無旋轉、無回歸);9.設主成分f1,…,fm(不相關)已經正向化,綜合主成分函數F綜=∑mi=1(λi/p)fi;10.給出表5:主成分值、綜合主成分F綜的樣品值并分別排序,綜合主成分F綜的樣品值調用iml過程命令編程計算;11、用主成分函數F1、F2、…、Fm的樣品值(表5的m列)做聚類分析圖1(類平均法,調用聚類分析過程命令),按綜合主成分值相應順序給出分類結果;12.結合前m個主成分樣品值的聚類分析結果,主成分、綜合主成分樣品值和排序,主成分、綜合主成分與原始變量的對應關系,進行優勢、劣勢、潛力、差距狀況和原因等的綜合評價,給出決策相關性建議。13.將綜合主成分值排名與25名顧客對各種車型打分值排名進行比較,結果有何異同(必要時用判別分析解決樣品爭議)。14.相應實驗程序。七、布置主成分分析實驗作業(一星期內交)。案例(取自:統計與決策2007年第8期理論版):對主成分分析法運用中十個問題的解析林海明(廣東商學院經濟貿易與統計學院廣州510320)摘要:主成分分析的應用十分廣泛,但由于有關文獻沒有完整、系統地闡述主成分分析的綜合評價步驟,以至應用主成分分析法進行綜合評價時出現一些問題和困難。據歸納,有10個問題經常出現,本文對其進行了逐一解析,提出了主成分分析法使用中的建議與一個綜合評價步驟,并以實例說明它的有效性。該綜合評價步驟的特點是:給出的評價、結論、建議具有可靠的決策相關性,分析深入,對指標體系選取的代表性具有可驗證性。關鍵詞:主成分分析;綜合評價;步驟;問題;解析中圖文分類號:O212文獻標識碼:A一、主成分分析法綜合評價中出現的10個問題在社會經濟、管理、自然科學等眾多領域的多指標體系中,如節約型社會指標體系、生態環境可持續型指標體系、和諧社會指標體系、投資環境指標體系等,主成分分析法[1]常被應用于綜合評價與監控。主成分分析法的理論與計算是較成熟的,但解決實際問題中,主成分分析法的應用并沒有達到較成熟狀態。據歸納,一些使用者在應用主成分分析法進行綜合評價中,出現以下10個問題不明確:=1\*GB3①原始數據沒有正向化,有何影響?如何正向化?②原始變量表示主成分的系數平方和不是1對嗎?③主成分分析法的主成分正交旋轉后怎樣?④主成分分析法的主成分有必要回歸計算嗎?⑤主成分分析法與正交因子分析法[1]的計量值能混合使用嗎?⑥何時使用主成分分析法?⑦主成分分析法有時會丟失一些原始變量的原因是什么?⑧主成分如何命名、正向化,能保持原始變量與多個主成分的內在關系?⑨前m個主成分仍然是多因素,僅用綜合主成分進行綜合分析客觀嗎?⑩綜合評價結果,如何能深入到決策相關性程度?有關文獻并沒有清楚地闡述上述問題,以至應用主成分分析法進行綜合評價時,不易把握。本文除了清楚地逐一解析上述問題外,給出了主成分分析法使用中的建議與一個綜合評價步驟,并以實例說明它的有效性。該綜合評價步驟的特點是:給出的評價、結論、建議具有可靠的決策相關性意義,分析深入,對指標體系選取的代表性具有可驗證性。如本文檢驗出文獻[2]的指標體系代表性不夠,不利于進一步的協調性分析。二、主成分分析法綜合評價中10個問題的解析問題=1\*GB3①解析:主成分分析法是一種綜合評價方法,是通過樣品的相對位置,比較找出樣品的優勢、不足、差距狀況及其原因,如果指標體系方向不是正向化的,便得不出有效結論。因此,分析中必須對指標體系中的強度逆向指標、適度指標、反向指標進行正向化。強度逆向指標xj正向化公式[3]:適度指標xj正向化公式[3]:E為理想值。這里為第i個樣品第j個指標的觀測值。反向指標正向化公式:-;設=(x1,…,xP)T(T為轉置符號)為正向化、標準化隨機變量向量(p≥2),R為相關系數矩陣,秩(R)=r(R的非零特征根個數),R的特征值為、、…、、0,≥≥…≥>0,前m個單位正交特征向量矩陣=(…,)=,主成分向量=(f1,…,fm)T。性質[1]變量與主成分fi的相關系數=,即變量與主成分的相關系數陣(初始因子載荷陣):=(…,)=(,…,)。主成分解(Hotelling,1933):fi=,Varfi=λi,i=1,…,m。問題②解析:主成分fi中變量的系數向量是(R的特征值的相應)單位正交特征向量,即主成分中變量的系數平方和全部是1,,如果不符合這個條件就是錯的,同時有:結論1fi=,i=1,…,m。問題③解析:主成分解的公式對主成分是無旋轉的,即主成分分析法中對主成分沒有旋轉。如果對主成分進行正交旋轉,原始變量的線性組合會發生改變,該線性組合不能達到方差的最大化,這已不是主成分分析的結果了。問題④解析:主成分解的公式是直接的表達式,主成分分析法中的主成分解是完全沒有必要進行回歸計算的。問題⑤解析:主成分fi與正交因子zi[1]有,Varfi=λi,Varzi=1,主成分分析法中沒有旋轉,即主成分fi與正交因子zi的取值范圍、旋轉方向不同,故樣品計量值不相等、兩種方法應用條件不相同,混淆在一起是樣品計量值、旋轉方向交替錯誤(具體異同見文獻[4]),故不論何條件,有:結論2主成分分析法與正交因子分析法的計量值不能混淆使用。問題⑥解析:主成分分析法的優點是,對原始變量具有綜合性的降維能力;如果中每行的系數絕對值往0或1靠近得較多(與旋轉后因子載荷陣[1]比較),即主成分命名、解釋原始變量清晰,同時主成分解釋原始變量X的信息誤差()達到最小,使用主成分分析法最好。結論3當原始變量之間有相關性,中每行的系數絕對值往0或1靠近得較多(與旋轉后因子載荷陣比較),則使用主成分分析法。問題⑦解析:m按某個累積貢獻率確定,當、第m+1個單位特征向量的第t個元素時,則中不能解釋原始變量xt,這是主成分分析法有時會丟失一些原始變量解釋的主要原因。因為初始因子載荷陣是變量與主成分的相關系數陣,如果每行中至少有一個系數絕對值足夠大(≥0.5),則主成分不會丟失原始變量的解釋,故:結論4如果每行中至少有一個系數絕對值足夠大(≥0.5),m便是主成分的確定個數,此時主成分不會丟失原始變量、能達到最大限度降維的目的;問題⑧解析:的第i列是原始變量X與主成分fi的相關系數,絕對值大(≥0.5)的對應變量與fi相關性高,而以fi中X的系數向量對主成分fi進行命名不能判斷出原始變量X與主成分fi的相關性,這樣主成分分析法有時會失去一些原始變量與多個主成分的內在關系,因此有:結論5的第i列絕對值大(≥0.5)的對應原始變量歸為主成分fi一類,并由這些變量與主成分fi的相關關系對主成分fi進行命名,由這些變量的實際意義對主成分fi進行正向化,這樣主成分分析法不會失去一些原始變量與多個主成分的內在關系。問題⑨解析:前m個主成分的樣品值反映的是n個樣品在m個主成分中的相對位置,表現出樣品的優勢、劣勢、差距狀況等,且沒有相關性,分析問題可靠性高,僅用綜合主成分進行綜合分析失去的就是這些內在因素,以致不客觀,因此,應將前m個主成分、綜合主成分的樣品值結合起來分析才是客觀的、可靠的,但樣品數量較多,逐個分析看不出共性規律,為此,對無相關性的前m個主成分樣品值進行聚類分析,并按綜合主成分值相應順序給出分類,便找出了樣品之間具有可靠性的共性規律,故有:結論6對無相關性的前m個主成分樣品值進行聚類分析,按綜合主成分值相應順序給出分類,能可靠地反映樣品之間的共性規律,便于客觀、可靠地進行樣品共性的分析。問題⑩解析:主成分分析、聚類分析給出了樣品客觀、可靠的個性與共性特征,但主成分有綜合性,決策相關性有待與原始指標結合起來。注意到主成分是按相關性高的原始變量進行歸類命名的,故將相應原始變量對應替換為相應主成分進行分析,便得出了可靠的決策相關性分析,達到了數據分析的目的。結論7將主成分對應替換為相應原始變量進行數據分析,得出的就是客觀、可靠的決策相關性分析。三、主成分分析法應用中的建議與一個綜合評價步驟(一)模型、理論和應用中不能混淆主成分分析法與因子分析法(結論2)。(二)主成分分析與SAS軟件對應的一個綜合評價步驟:1.指標的正向化(單獨計算);2.指標數據標準化(SAS軟件自動執行);3.指標之間的相關性判定:用SAS軟件的Correlations(相關系數矩陣R)判定,若變量間有相關性,主成分析繼續,否則,直接進行逐個指標分析,用進行綜合分析(是正向化、標準化的);4.求相關系數矩陣R的特征值、單位正交特征向量矩陣,變量與主成分的相關系數陣(初始因子載荷陣,SAS軟件因子分析過程命令中的FactorPattern);5.與旋轉后因子載荷陣(SAS軟件因子分析過程命令中的RotatedFactorPattern)比較,若中每行的系數絕對值往0、1在足夠靠近得多,則用主成分分析法(結論3);6.確定主成分個數m:以前m列每行中至少有一個系數絕對值足夠大(≥0.5)的最小列數確定(結論4);7.前m個主成分函數:fi==,i=1,…,m(主成分X的系數平方和是1、無旋轉、無回歸,結論1);8.主成分fi的命名及其正向化:將的第i列絕對值大(≥0.5)的對應變量歸為fi一類,由這些變量與主成分fi的相關關系對主成分fi進行命名,由這些變量的實際意義對主成分fi進行正向化(結論5);9.設主成分f1,…,fm(不相關)已經正向化,綜合主成分函數F綜=∑mi=1(λi/p)fi;10.前m個主成分的樣品值排序、用SAS軟件iml模塊計算綜合主成分F綜的樣品值并排序;11、用前m個主成分的樣品值做聚類分析(類平均法),按綜合主成分值相應順序給出分類結果(結論5);12.結合前m個主成分樣品值的聚類分析結果,主成分、綜合主成分樣品值和排序,主成分、綜合主成分與原始變量的對應關系,進行優勢、劣勢、潛力、差距狀況和原因等的綜合評價,給出決策相關性建議(結論5、結論6)。四、實證:安徽省各地市經濟發展綜合評價與建議現以文獻[2]數據為例,指標選取為:X1-城鎮單位在崗職工平均工資(元),X2-各市固定資產投資(萬元),X3-各市進口總額(萬美元),X4-社會消費品零售總額(萬元),X5-各市工業增加值(億元),X6-財政收入(億元);城市為17個:合肥市、淮北市、亳州市、宿州市、蚌埠市、阜陽市、淮南市、滁州市、六安市、馬鞍山市、巢湖市、蕪湖市、宣城市、銅陵市、池州市、安慶市和黃山市。原始數據見表1。1.指標是正向的,直接使用;2.調用SAS軟件的主成分分析過程命令,輸入原始數據,數據標準化自動執行;表1:安徽省各市2004年度主要社會經濟指標編號城市X1X2X3X4X5X61合肥市163693504887660472397739198.4610439552淮北市13379566257474445610076.962026373亳州市9707397183130388703418.881059484宿州市10572414932175375198427.671282615蚌埠市1228487666718269101566960.093327006阜陽市97386049355822130790830.542227997淮南市16970778830243863001476.642722038滁州市100066174361354386601358.592227949六安市10217636760996799691234.5516102510馬鞍山20946138078116406526527150.1542693711巢湖市11469720416714185377843.4115727412蕪湖市141651504005294131025363149.1756889913宣城市127959661881158072327845.1316531914銅陵市127625846961358334310765.3116645415池州市12008501780498627831015.048657516安慶市1120898136713364129518979.833794717黃山市12719716491444840879615.68999493.變量有相關性(相關系數矩陣R略),繼續;4.相關系數矩陣R的特征值:λ1=4.641、λ2=1.1006631、…,相應單位正交特征向量矩陣(見第8步f1、f2、…表達式中X的系數),變量與主成分的相關系數陣(初始因子載荷矩陣,取前2行)為表2;表2:變量與主成分的相關系數陣(初始因子載荷陣)FactorPatternFactor1Factor2x1表2:變量與主成分的相關系數陣(初始因子載荷陣)FactorPatternFactor1Factor2x10.579940.79515x20.98026-0.04923x30.95613-0.16804x40.76168-0.60047x50.929080.27340x60.99320-0.049196.前2列每行中至少有一個系數絕對值足夠大(≥0.5),所以m=2,前兩個主成分的累計方差貢獻率已達到95.7%;7.主成分函數(xi為Xi的標準化變量):f1=0.269x1+0.455x2+0.444x3+0.354x4+0.431x5+0.461x6f2=0.758x1-0.047x2-0.16x3-0.572x4+0.26x5-0.047x6;8.第一個主成分f1與X2-各市固定資產投資,X3-各市進口總額,X4-社會消費品零售總額,X5-各市工業增加值,X6-財政收入十分顯著的正相關,故稱f1為生產總量成分,正向化f1為正號;第二個主成分f2與X1-城鎮單位在崗職工平均工資十分顯著的正相關,注意到它受X4-社會消費品零售總額的負影響也很大,故稱f2為工資與消費成分。X1-城鎮單位在崗職工平均工資是社會生產發展的動因之一,社會消費總體上為量入為出,故正向化f2為正號。內在關系:社會消費品零售總額X4對生產總量成分f1有較大的促進作用、對工資與消費成分f2中的工資有較大的負影響,城鎮單位在崗職工平均工資X1對生產總量成分f1有正常的促進作用、對工資與消費成分f2是直接的正的影響;9.綜合主成分函數:F綜=(4.6412321f1+1.1006631f10.主成分、綜合主成分樣品值及排序見表3(綜合主成分值SAS軟件iml模塊計算)。11.調用SAS軟件的聚類分析過程命令,選用歐氏距離和類平均法,通過表3兩個主成分f1、f2的樣品值對17個城市進行聚類。取分類閾值為1.5時,分成五類,聚類結果如下:第一類:合肥市;第二類:馬鞍山市;第三類:蕪湖市;第四類:淮南市,淮北市,宣城市,銅陵市,黃山市和池州市;第五類:蚌埠市,安慶市,滁州市,巢湖市,六安市,阜陽市,宿州市和亳州市。12.結合前2個主成分樣品值的聚類分析結果,主成分、綜合主成分樣品值和排序,主成分、綜合主成分與原始變量的對應關系,進行優勢、劣勢、潛力、差距狀況和原因等的綜合評價,給出決策相關性建議。評價中注意:主成分函數f1、f2表明了X4-社會消費品零售總額一方面對總量成分f1有促進作用(影響系數為0.354),另一方面對工資與消費成分f2有負影響作用(影響系數為-0.572)。第一類的合肥市綜合主成分F綜值排第1(5.307)。其生產總量成分f1得分值排第1(7.113),優勢相當明顯,可生活成分f2排在倒數第2(-1.058)。原因及問題:生產總量成分f1中X4-社會消費品零售總額為2397739萬元列第1,生活成分f2中X1-城鎮單位在崗職工平均工資為162369元列第3,即合肥市是生產總量、消費高但平均工資不是太高的城市。綜合函數值中,生產總量成分f1綜合值為5.502,而工資與消費成分f2有綜合抵減值0.194(抵減率3.526%),帶來了不良影響。表3:主成分值、綜合主成分值及排序城市f1序f2序F綜序合肥市7.112761-1.05753165.30711馬鞍山1.8438432.7853911.9372442蕪湖市表3:主成分值、綜合主成分值及排序城市f1序f2序F綜序合肥市7.112761-1.05753165.30711馬鞍山1.8438432.7853911.9372442蕪湖市2.3061720.3139571.8415043淮南市-0.1261661.5056920.178624安慶市0.420014-0.84506130.169875蚌埠市0.223085-0.39238100.1005816宣城市-0.5256670.095398-0.389127淮北市-0.7730190.797393-0.451688銅陵市-0.80935110.626344-0.511179滁州市-0.613618-0.7196812-0.6066710巢湖市-0.8636612-0.336229-0.7297511阜陽市-0.7857010-1.3524817-0.8558712六安市-0.9115213-0.8872315-0.8678513黃山市-1.48609140.393345-1.0773914宿州市-1.5481915-0.4443611-1.279115池州市-1.79223170.369836-1.3185216亳州市-1.6706716-0.8523814-1.4486917第二類的馬鞍山市、第三類的蕪湖市綜合評價、建議方法與第一類的合肥市類似,此略。第四類城市淮南市、宣城市、淮北市、銅陵市、黃山市和池州市綜合主成分F綜值排名依次是4、7、8、9、14和16。它們的生產總量成分f1排名依次是6、7、9、11、14、17,均低于平均水平,工資與消費成分f2排名依次是2、8、3、4、5、6,均高于平均水平。共性原因為該類城市工資與消費成分f2中X1-城鎮單位在崗職工平均工資列前10名、生產總量成分f1中X4-社會消費品零售總額列第10之后,即該類城市是工資較高、生產總量水平低、消費不足的城市。個性原因及問題:如淮北市工資與消費成分f2中X1-城鎮單位在崗職工平均工資(第4:13379元)、X4-社會消費品零售總額(第14:456100萬元),生產總量成分f1排名差異大(第9),其中X2-各市固定資產投資為(第14:566257萬元)、X3-各市進口總額為(第13:4744萬美元)、X6-財政收入為(第9:202637億元)等。建議:共性方面,淮南市,宣城市,淮北市,銅陵市,黃山市和池州市應根據工資較高情況適度促進生產總量與社會消費;個性方面,如淮北市在保持生產總量成分f1中X5-各市工業增加值第5、工資與消費成分f2中X1-城鎮單位在崗職工平均工資第4已有優勢的同時,如果能夠進一步協調生產總量成分f1中X2-各市固定資產投資、X3-各市進口總額、X6-財政收入與X4-社會消費品零售總額的良性增長,必將對經濟有很大的促進作用。第五類城市綜合評價、建議方法與第四類城市類似,此略。以上分析及結論,找到了研究對象的優勢、不足、差距狀況和原因等,用具有可控性的原始指標給出了可靠的決策相關性建議,對指標體系選取的代表性具有可驗證性,使主成分分析法的應用得到深入。參考文獻:[1]于秀林、任雪松編著,多元統計分析[M],中國統計出版社,1999年5月。[2]宋馬林,安徽省各地市經濟發展評價[J],統計教育,2006年第4期。[3]陳迪紅、李華中、楊湘豫,行業景氣指數建立的方法選擇及實證分析[J],系統工程,2003年第4期,p74。[4]林海明、張文霖,主成分分析與因子分析的異同和SPSS軟件[J],統計研究,2005年第3期,p65-69。程序:1.主成分分析過程命令::程序同實驗項目五第五項的例。2.變量與主成分的相關系數陣程序(初始因子載荷陣)prociml;A={0.2691960.7579180.385122,0.455014-.046924-.114200,0.443814-.160175-.624674,0.353554-.5723550.666742,0.4312570.260601-.054952,0.461022-.0468900.029279};B={2.15400,01.0490,000.362};C=A*B;printC;3.樣品綜合主成分值計算程序prociml;x={7.11276-1.05753,-0.773010.79739,-1.67067-0.85238,-1.54819-0.44436,0.22308-0.39238,-0.78570-1.35248,-0.126161.50569,-0.61361-0.71968,-0.91152-0.88723,1.843842.78539,-0.86366-0.33622,2.306170.31395,-0.525660.09539,-0.809350.62634,-1.792230.36983,0.42001-0.84506,-1.486090.39334};f=x*{4.64123211.1006631}`/6;printf;4.聚類分析過程命令Datapgm33b;Inputno$x1-x2;cards;17.11276-1.057532-0.773010.797393-1.67067-0.852384-1.54819-0.4443650.22308-0.392386-0.78570-1.352487-0.126161.505698-0.61361-0.719689-0.91152-0.88723101.843842.7853911-0.86366-0.33622122.306170.3139513-0.525660.0953914-0.809350.6263415-1.792230.36983160.42001-0.8450617-1.486090.39334;Procclusterstandardmethod=averagenonormnosquarecccpseudoout=tree;Proctreedata=treehorizontalspaces=1;run;實驗項目六:因子分析實驗一、實驗目的:通過因子分析的實驗教學,使學生熟悉因子分析問題的提出、解決問題的思路、方法和技能,會調用SAS軟件因子分析過程命令,根據計算機計算的結果,訓練學生分析和解決因子分析問題的能力。二、預備知識:解決因子分析問題的思路、方法。三、實驗內容:因子分析問題的數據。四、實驗儀器與材料:計算機與SAS軟件。五、(一)因子分析實驗程序例(該程序n>p時正確,n≤p時因子得分函數錯,需要另外計算):因子分析過程命令datasocecon;inputx1-x8;cards;1394.892505519.018144373.90.85250.8881843.43920.112720345.466501342.80.86810.9042582.512849.521258704.8748392033.30.86810.86361234.851092.481250290.94721717.30.85540.8651697.25832.881387250.234134781.70.85110.8562419.392793.372397387.9949111371.10.86130.87721840.551129.21872320.454430497.40.86810.8757762.472014.532334435.734145824.80.86130.87491240.372462.575343996.489279207.40.84250.8851642.955155.2519261434.9559431025.50.86360.87492026.643524.7922491006.396619754.40.85760.8811916.592003.5812544744609908.30.87110.8873824.142160.522320553.975857609.30.86810.8741433.671205.111182282.844211411.70.85540.8628571.845002.3415271229.5551451196.60.85030.87572207.693002.741034670.3543441574.40.85840.87031367.922391.421527571.6846858490.83330.85761220.722195.71408422.6147971011.80.84030.8658843.835381.7226991639.838250656.50.87720.89611396.351606.151314382.5951055560.84460.8591554.97364.171814198.355340232.10.88110.898564.3335341261822.544645902.30.84390.85471431.81630.07942150.844475301.10.82370.8532324.721206.6812613345149310.40.82440.8467716.6555.98111017.8773824.20.85250.87035.571000.031208300.274396500.90.84030.8547600.98553.351007114.8154935070.83470.8584468.79165.31144547.76575361.60.84750.8598105.8169.75135561.985079121.80.8540.8673114.4834.571469376.9553483390.83540.8569428.76;procfactordata=soceconsimplecorr;run;procfactorM=prinpriors=oneR=Vscore;run;procfactordata=soceconn=4rotate=varimaxout=out831;varx1-x8;run;(二)實驗步驟:對原始數據正向化,1.調用因子分析過程命令輸入正向化數據求得相關系數陣R、初始因子方差貢獻。給出初始因子載荷陣、方差最大化正交旋轉矩陣,方差最大化正交旋轉后的因子載荷矩陣,旋轉因子方差貢獻。因子得分函數(n>p時因子分析過程命令中有直接結果,n≤p時調用iml過程命令按下述公式另行編程計算因子得分函數:),綜合因子得分函數:Z綜=(是的第i列數的平方和,在Rotatedfactorpattern下方);3.調用iml過程命令,用Standard編程計算標準化數據,用標準化數據代入計算單因子得分與綜合因子得分值。六、結果的分析與應用(有關表圖要有序號、中英文名、表的上下線為粗線、表的內線為細線、表的左右邊不封口、表圖不能跨頁、表圖旁不能留空塊,引用結論要注明參考文獻):1.寫出因子分析模型L;2.指標的正向化(單獨計算),給出正向化原始數據表1[強度逆向指標xj正向化公式:適度指標xj正向化公式:1/(||+1),E為理想值。反向指標xj正向化公式:-xj];3.指標數據標準化(SAS軟件自動執行);4.指標之間的相關性判定:根據表2:相關系數陣R(CorrelationMatrix)判定,有相關性繼續。原始變量之間相關度很低或無關時,直接進行逐個指標分析,用作綜合分析(是正向化、標準化的)是適合的;5.給出表3:特征值和初始因子方差貢獻(EigenvaluesoftheCorrelat-ionMatrix),表4:初始因子載荷陣(FactorPattern),表5:旋轉因子載荷陣(RotatedFactorPattern),旋轉后方差貢獻(在SAS軟件中RotatedFactorPattern的下方);6.若旋轉后因子載荷陣中每行系數絕對值往0、1靠近得較多(與初始因子載荷陣比較),則用因子分析法旋轉后因子解=(規則2)。7.確定因子個數m:以每行中至少有一個系數絕對值≥0.6的最小列數確定(規則1),旋轉后因子得分函數=解釋原始變量X的信息為達到最大、信息誤差為達到最小,結論可靠;8.因子的命名與正向化:將旋轉后因子載荷陣第i列絕對值大的對應原始變量歸為一類,由這些變量與因子的相關關系對因子進行命名,由這些變量的實際意義對因子進行正向化;9.寫出正向化的旋轉后因子得分函數=(n>p時因子分析過程命令中有直接結果,n≤p時調用iml過程命令按下述公式另行編程計算因子得分函數:,具體計算見[4]);10.旋轉后綜合因子得分函數Z綜=(在RotatedFactorPattern的下方),注意:≠(R的特征值);11.計算表6:m個旋轉后因子得分、綜合因子得分樣品值并排名(調用iml過程命令編程計算)及其排名;12.給出聚類分析圖1:用m個旋轉后因子得分的樣品值(表6的m列)做聚類分析(類平均法,調用聚類分析過程命令),按綜合因子得分樣品值排名順序給出相應共性分類的結果;13.結合前m個旋轉后因子得分樣品值的聚類分析結果,旋轉后因子得分、綜合因子得分樣品值和排序,旋轉后因子得分、綜合因子得分函數與命名的原始變量的對應關系,進行優勢、劣勢、潛力、差距狀況和原因等的綜合評價,給出客觀、可靠的決策相關性建議。14.相關實驗程序。七、布置因子分析實驗作業(一星期內交)。案例:因子分析綜合評價中的10個問題解析林海明(廣東商學院經濟貿易與統計學院廣州510320)摘要:因子分析法的應用十分廣泛,但綜合評價應用中并沒有達到較好的狀態,據歸納,有10個問題和困難經常出現,本文應用因子分析模型L及其解的理論等,對這10個問題和困難進行了解析,提出了因子分析法的一個綜合評價步驟,并以實例說明它的有效性。該綜合評價步驟的特點是:給出的評價、結論、建議具有可靠的決策相關性,使因子分析法的應用趨向深入。關鍵詞:因子分析;綜合評價;問題;解析中圖文分類號:O212文獻標識碼:A一、因子分析法綜合評價中出現的10個問題在社會經濟、管理、自然科學等眾多領域的多指標體系中,如節約型社會指標體系、生態環境可持續型指標體系、和諧社會指標體系、投資環境指標體系等,因子分析法常被應用于綜合評價與監控。但因子分析法的應用并沒有達到較好的狀態。據歸納,一些使用者在應用因子分析法進行綜合評價中,出現了以下10個問題和困難:=1\*GB3①原始數據沒有正向化,有何影響?如何正向化?②現行軟件SAS、SPSS計算的因子分析主成分解(>)是何模型的解?③因子分析法如何求小樣本(≤)解?④因子分析法與主成分分析法的計量值能混淆嗎?⑤因子分析法有時會丟失一些原始變量的原因是什么?⑥因子分析法旋轉后因子解、未旋轉因子解何時使用?⑦因子得分函數是何作用?⑧旋轉后綜合因子得分函數權數如何確定?⑨前m個因子得分仍然是多因素,僅用綜合因子得分進行綜合分析客觀嗎?⑩綜合評價結果,如何能深入到決策相關性程度?上述問題有關文獻并沒有清楚地闡述,以至應用因子分析法進行綜合評價時,不易把握。文獻[3]應用因子分析模型L及其解,求出了因子分析模型的解,指出其不是因子分析法現行使用的解。而理論和實證上,因子分析模型L及其解是因子分析法現行使用的模型及其解,是更好的,其與因子分析法理論和常規相符,其為因子分析正確模型、理論和方法的使用,為因子分析法的發展建立了精確解的理論基礎。同時得出了:公因子載荷陣的主因子估計、極大似然估計,公因子的巴特萊特因子得分,特殊因子單列,理論和實際上都失去了作用、意義;基于文獻[3]的結論,本文僅就因子分析模型L及其解的理論等,解析上述問題,并給出因子分析法使用中的一個綜合評價步驟,以實例說明了它的有效性。該綜合評價步驟的特點是:給出的評價、建議、結論具有可靠的決策相關性意義,使因子分析法的應用趨向深入。二、因子分析法綜合評價中10個問題的解析設=(x1,…,xp為正向化、標準化隨機向量(p≥2),R為相關系數矩陣,R的特征值為、、…、、0,≥≥…≥>0(特征值達到降序排列最大化),=(aij)=(…,)、這里,,k=r+1,…,p,。設主成分=(f1,…,fp,則主成分分析(Hotelling,1933)的解[2]:=,Vardiag(…,,0,…,0)。記=(f1,…,fm,=(fm+1,…,fr,=(…,),=(…,)。記=(z1,…,zm)T,=(zm+1,…,zr,,,,i=1,…,r。因子分析模型L[3]設r=秩(R)≤p,求、(m≤r)、、,使:a.e,,達到最大。稱為降維因子,稱為降維因子載荷陣,稱為誤差因子,稱為誤差因子載荷陣,稱為因子對的方差貢獻。記初始因子載荷陣=(…,、=(…,、主成分的標準化(為未旋轉因子)=(f1,…,fm,=(fm+1,…,fr。設為的方差最大化正交旋轉矩陣[2],有:定理1[3]因子分析模型L旋轉后因子、旋轉后因子載荷陣的精確解:=…=(f1,…,fm,=,=,vi≠λi(R的特征值)、i≤m,誤差因子、誤差因子載荷陣的精確解:=,=,==,且=diag(…,,vi=λi,i=m+1,…,r,即誤差項描述X的信息誤差為達到最小,誤差項隨m取值的不同產生變異。問題=1\*GB3①解析:因子分析法是一種綜合評價方法,是通過樣品的相對位置,比較找出樣品的優勢、不足、差距狀況及其原因,如果指標體系方向不是正向化的,便得不出有效結論。因此,分析中必須對指標體系中的強度逆向指標、適度指標、反向指標進行正向化[1]。強度逆向指標xj正向化公式:適度指標xj正向化公式:1/(||+1),E為理想值。反向指標xj正向化公式:-xj。問題②解析:通過理論與計算驗證,現行軟件SAS、SPSS計算的因子分析主成分解(>)是因子分析模型L的解。問題③解析:=…=(f1,…,fm,同時是小樣本解。注意:SAS軟件過程命令小樣本時的計算結果是錯的,必須用iml模塊另算,具體計算見[4]。問題④解析:因子分析法中因子的解是標準化主成分(有旋轉)[3],故因子分析法與主成分分析法的計量值肯定不等,混淆在一起是計量值、旋轉方向的錯誤。問題⑤解析:規則1[3]m的選取以每行至少有一個元素絕對值≥0.6的最小列數確定,此時因子不會丟失原始變量的解釋、能達到最大限度降維的目的。問題⑥解析:規則2[3]與初始因子載荷陣比較,如果旋轉后因子載荷陣每行的系數絕對值往0或1靠近得多(旋轉后因子命名清晰),則使用旋轉后因子解的因子分析法。若初始因子載荷陣中每行系數絕對值往0、1靠近得較多(與比較),則用因子分析法未旋轉因子解。問題⑦解析:除了能精確反映變量X與降維因子的相關性外,因子得分函數=…是因子與變量X的精確關系,它能進一步分析出變量X對因子的影響程度。問題⑧解析:與未旋轉因子比較,因子旋轉后,變量X在因子中的分布發生了改變,故旋轉后綜合因子中的權數相應為旋轉后方差貢獻率,不是旋轉前的。即旋轉后綜合因子:。問題⑨解析:前m個因子的樣品值反映的是n個樣品在m個因子中的相對位置,表現出樣品的優勢、劣勢,能比較出樣品之間的相對差距,且沒有相關性,分析問題可靠性高,僅用綜合因子進行綜合分析失去的就是這些內在因素,以致不客觀,因此,應將前m個因子、綜合因子的樣品值結合起來分析才是客觀的,但樣品數量較多,逐個分析看不出共性規律,為此,對無相關性的前m個因子樣品值進行聚類分析,并按綜合因子值相應順序給出分類,便找出了樣品之間具有可靠性的共性規律,故有:結論1對無相關性的前m個因子樣品值進行聚類分析,按綜合因子值相應順序給出分類,能可靠地反映樣品之間的共性規律,又保留了樣品的優勢、劣勢、差距狀況等個性,便于客觀、可靠地進行分析。問題⑩解析:因子分析、聚類分析給出了樣品客觀、可靠的個性與共性特征,但因子有綜合性,決策相關性有待與原始指標結合起來。注意到因子是按相關性高的原始變量進行歸類命名的,故將命名變量對應替換為相應因子進行分析,便得出了可靠的決策相關性分析,達到了數據分析的目的。結論2將因子對應替換為命名的對應原始變量進行數據分析,得出的就是客觀、可靠的決策相關性分析。三、因子分析法應用中的建議與一個綜合評價步驟(一)模型、理論和應用中不能混淆因子分析法與主成分分析法。(二)現行軟件SAS、SPSS計算的因子分析主成分解(>)是因子分析模型L的解,建議使用與理論和常規相符的因子分析模型L及其解。≤時,因子分析模型L解的計算見[4]。(三)因子分析法旋轉后因子解與SAS軟件對應的一個綜合評價步驟:1.寫出因子分析模型L;2.指標的正向化(單獨計算);3.指標數據標準化(SAS軟件自動執行);4.指標之間的相關性判定:用SAS軟件的CorrelationMatrix(相關系數矩陣R)判定,有相關性繼續。原始變量之間相關度很低或無關時,直接進行逐個指標分析,用作綜合分析(是正向化、標準化的)是適合的;5.求相關系數矩陣R的特征值,初始因子載荷陣(SAS軟件中的FactorPattern),旋轉后因子載荷陣(SAS軟件中的RotatedFactorPattern)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論