




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、PAGE PAGE II 學科分類號 110 黑龍江科技大學本科學生畢業論文學 號院 (系)指導教師 20摘 要經濟是指一個國家國民經濟的總稱。我們要提高某地方人民的生活水平,要更好更快地發展某個地區,就必須充分了解這個地區現有的經濟發展狀況。因此,現有的經濟發展狀況研究對將來的發展有著非常重要的指導意義。主成分分析也稱主分量分析,就是設法將原來指標重新組合成一組新的互相無關的幾個綜合指標來代替原來指標。因子分析是主成分分析的推廣和發展,它也是將具有錯綜復雜關系的變量綜合為數量較少的幾個因子,以再現原始變量與因子的相互關系,同時根據不同因子還可以對變量進行分類。主成分分析與因子分析都是多元分析
2、中處理降維的一種統計方法。本文通過學習與查閱相關資料找到黑龍江省個地級市的個具有代表性指標,運用統計分析軟件對這些指標進行主成分分析和因子分析得到特征值、方差貢獻率及公共因子等相關數據。并利用這些數據對個市經濟水平劃分等級。關鍵詞 主成分分析 因子分析 經濟 統計分析軟件 Abstract Economy refers to the floorboard of the national economy of a country. We will improve the level of a local peoples life, to somewhere better and faster d
3、evelopment, we must fully understand the current situation of economic development. Therefore, the existing research on the development of future economic development has a very important guiding significance.Principal component analysis (also called principal component analysis, is to try the origi
4、nal index combined into a new set of several comprehensive index instead of the original index has nothing to do with each other, at the same time, according to the actual need to recommend a few less comprehensive response as much as possible the original information of indicators. Is a generalizat
5、ion of the principal component analysis and factor analysis, it is also will have the intricate relationship between variables comprehensive to a small number of several factors, and to recreate the relationship of the original variables and factor, at the same time according to different factors ca
6、n also categorize variables,. Principal component analysis and factor analysis is a multivariate analysis of a statistical method of dealing with the dimension reduction. In this article, through learning and access to relevant data found nine representative indexes of 12 cities in heilongjiang prov
7、ince, using the SPSS statistical analysis software to the indicators of principal component analysis and factor analysis of the characteristic value, the variance contribution rate and public factor and related data. And using the data of 13 cities economic grade level.Key words Principal component
8、analysis Factor analysis Economic SPSS statistical analysis softwarPAGE VI目 錄 TOC o 1-3 h z u HYPERLINK l _Toc390087295 摘 要 PAGEREF _Toc390087295 h I HYPERLINK l _Toc390087296 Abstract PAGEREF _Toc390087296 h II HYPERLINK l _Toc390087297 第1章 緒 論 PAGEREF _Toc390087297 h 1 HYPERLINK l _Toc390087298 1.
9、1 選題的背景和提出 PAGEREF _Toc390087298 h 1 HYPERLINK l _Toc390087299 1.1.1 選題的背景 PAGEREF _Toc390087299 h 1 HYPERLINK l _Toc390087300 1.1.2 選題的提出 PAGEREF _Toc390087300 h 2 HYPERLINK l _Toc390087301 1.2 選題的意義和目的 PAGEREF _Toc390087301 h 3 HYPERLINK l _Toc390087302 1.2.1 選題的意義 PAGEREF _Toc390087302 h 3 HYPERL
10、INK l _Toc390087303 1.2.2 選題的目的 PAGEREF _Toc390087303 h 3 HYPERLINK l _Toc390087304 1.3 主成分分析和因子分析的發展及應用 PAGEREF _Toc390087304 h 4 HYPERLINK l _Toc390087305 1.3.1 主成分分析的發展及應用 PAGEREF _Toc390087305 h 4 HYPERLINK l _Toc390087306 1.3.2 因子分析的發展及應用 PAGEREF _Toc390087306 h 4 HYPERLINK l _Toc390087307 1.4
11、本文主要研究內容 PAGEREF _Toc390087307 h 5 HYPERLINK l _Toc390087308 第2章 主成分與因子分析 PAGEREF _Toc390087308 h 6 HYPERLINK l _Toc390087309 2.1 主成分分析的內容 PAGEREF _Toc390087309 h 6 HYPERLINK l _Toc390087310 2.1.1 主成分分析原理和基本思想 PAGEREF _Toc390087310 h 6 HYPERLINK l _Toc390087311 2.1.2 主成分的幾何意義 PAGEREF _Toc390087311 h
12、 6 HYPERLINK l _Toc390087312 2.1.3 主成分分析的性質 PAGEREF _Toc390087312 h 8 HYPERLINK l _Toc390087313 2.2 主成分分析的求解方法和數學模型 PAGEREF _Toc390087313 h 8 HYPERLINK l _Toc390087314 2.3 主成分分析的基本步驟 PAGEREF _Toc390087314 h 11 HYPERLINK l _Toc390087315 2.4 因子分析的內容 PAGEREF _Toc390087315 h 12 HYPERLINK l _Toc390087316
13、 2.4.1 因子分析原理和基本思想 PAGEREF _Toc390087316 h 12 HYPERLINK l _Toc390087317 2.4.2 因子分析的性質 PAGEREF _Toc390087317 h 13 HYPERLINK l _Toc390087318 2.5 因子分析的求解方法和數學模型 PAGEREF _Toc390087318 h 13 HYPERLINK l _Toc390087319 2.5.1 數學模型(正交因子模型) PAGEREF _Toc390087319 h 13 HYPERLINK l _Toc390087320 2.5.2 因子模型中公共因子,因
14、子載荷量的統計意義 PAGEREF _Toc390087320 h 14 HYPERLINK l _Toc390087321 2.5.3 因子旋轉與因子得分 PAGEREF _Toc390087321 h 15 HYPERLINK l _Toc390087322 2.6 計算步驟 PAGEREF _Toc390087322 h 16 HYPERLINK l _Toc390087323 第3章 主成分與因子分析在黑龍江省城市經濟水平研究中的應用 PAGEREF _Toc390087323 h 17 HYPERLINK l _Toc390087324 3.1主成分分析法 PAGEREF _Toc3
15、90087324 h 18 HYPERLINK l _Toc390087325 3.2 因子分析法 PAGEREF _Toc390087325 h 21 HYPERLINK l _Toc390087326 3.3 綜合評價結果分析 PAGEREF _Toc390087326 h 25 HYPERLINK l _Toc390087327 結 論 PAGEREF _Toc390087327 h 27 HYPERLINK l _Toc390087328 致 謝 PAGEREF _Toc390087328 h 28 HYPERLINK l _Toc390087329 參考文獻 PAGEREF _Toc
16、390087329 h 29Contents TOC o 1-3 h z u HYPERLINK l _Toc390088799 Abstract PAGEREF _Toc390088799 h I HYPERLINK l _Toc390088800 Abstract PAGEREF _Toc390088800 h II HYPERLINK l _Toc390088801 Chapter 1 Introduction PAGEREF _Toc390088801 h 1 HYPERLINK l _Toc390088802 1.1 The background of the selected to
17、pic and put forward PAGEREF _Toc390088802 h 1 HYPERLINK l _Toc390088803 1.1.1 The background of the selected topic PAGEREF _Toc390088803 h 1 HYPERLINK l _Toc390088804 1.1.2 Topic selection is put forward PAGEREF _Toc390088804 h 2 HYPERLINK l _Toc390088805 1.2 Subject of meaning and purpose PAGEREF _
18、Toc390088805 h 3 HYPERLINK l _Toc390088806 1.2.1 The significance of topic selection PAGEREF _Toc390088806 h 3 HYPERLINK l _Toc390088807 1.1.2 The purpose of the topic PAGEREF _Toc390088807 h 3 HYPERLINK l _Toc390088808 1.3 The principal component analysis and factor analysis of the development and
19、application PAGEREF _Toc390088808 h 4 HYPERLINK l _Toc390088809 1.3.1 Principal component analysis of the development and application PAGEREF _Toc390088809 h 4 HYPERLINK l _Toc390088810 1.3.2 The development and application of factor analysis PAGEREF _Toc390088810 h 4 HYPERLINK l _Toc390088811 1.4 T
20、he main research contents in this paper PAGEREF _Toc390088811 h 5 HYPERLINK l _Toc390088812 Chapter 2 principal components and factor analysis PAGEREF _Toc390088812 h 6 HYPERLINK l _Toc390088813 2.1 The content of the principal component analysis PAGEREF _Toc390088813 h 6 HYPERLINK l _Toc390088814 2
21、.1.1 Principle of principal component analysis and basic ideas PAGEREF _Toc390088814 h 6 HYPERLINK l _Toc390088815 2.1.2 The geometric meaning of the principal component PAGEREF _Toc390088815 h 6 HYPERLINK l _Toc390088816 2.1.3 The nature of the principal component analysis PAGEREF _Toc390088816 h 8
22、 HYPERLINK l _Toc390088817 2.2 The principal component analysis method and mathematical model PAGEREF _Toc390088817 h 8 HYPERLINK l _Toc390088818 2.3 The basic steps of principal component analysis PAGEREF _Toc390088818 h 11 HYPERLINK l _Toc390088819 2.4 The content of the factor analysis PAGEREF _T
23、oc390088819 h 12 HYPERLINK l _Toc390088820 2.4.1 Factor analysis principle and basic ideas PAGEREF _Toc390088820 h 12 HYPERLINK l _Toc390088821 2.4.2 The nature of the factor analysis PAGEREF _Toc390088821 h 13 HYPERLINK l _Toc390088822 2.5 The method of calculating the factor analysis and mathemati
24、cal model PAGEREF _Toc390088822 h 13 HYPERLINK l _Toc390088823 2.5.1 Mathematical model (orthogonal factor model) PAGEREF _Toc390088823 h 13 HYPERLINK l _Toc390088824 2.5.2 Factor model of public factor, factor loading amount of statistical significance PAGEREF _Toc390088824 h 14 HYPERLINK l _Toc390
25、088825 2.5.3 Factor rotation and factor score PAGEREF _Toc390088825 h 15 HYPERLINK l _Toc390088826 2.6 Calculation steps PAGEREF _Toc390088826 h 16 HYPERLINK l _Toc390088827 Chapter 3 Principal component analysis and factor analysis in the application of urban economy in heilongjiang province PAGERE
26、F _Toc390088827 h 17 HYPERLINK l _Toc390088828 3.1 Principal component analysis PAGEREF _Toc390088828 h 18 HYPERLINK l _Toc390088829 3.2 The factor analysis method PAGEREF _Toc390088829 h 21 HYPERLINK l _Toc390088830 3.3 Comprehensive evaluation results PAGEREF _Toc390088830 h 25 HYPERLINK l _Toc390
27、088831 Conclusions PAGEREF _Toc390088831 h 27 HYPERLINK l _Toc390088832 Acknowledgements PAGEREF _Toc390088832 h 28 HYPERLINK l _Toc390088833 References PAGEREF _Toc390088833 h 29PAGE PAGE 31第1章 緒 論1.1 選題的背景和提出1.1.1 選題的背景經濟的發展不僅僅意味著 HYPERLINK /view/338341.htm t _blank 國民經濟規模的擴大,更意味著經濟和 HYPERLINK /vi
28、ew/517282.htm t _blank 社會生活素質的提高。所以,經濟發展涉及的內容比單純的 HYPERLINK /view/73375.htm t _blank 經濟增長更為廣泛。 就現代經濟而言,發展的含義十分豐富復雜。發展總是與發達、 HYPERLINK /view/143403.htm t _blank 工業化、 HYPERLINK /view/124658.htm t _blank 現代化、增長之間交替使用。 一般來說,經濟發展包括三種含義1:第一種,經濟量的增長,即一個 HYPERLINK /view/8426.htm t _blank 國家或地區產品和 HYPERLINK
29、/view/148928.htm t _blank 勞務的增加,它是經濟發展的物質基礎;第二種, HYPERLINK /view/187174.htm t _blank 經濟結構的改善,即一個 HYPERLINK /view/8426.htm t _blank 國家或地區的技術、 HYPERLINK /view/61661.htm t _blank 產業結構、收入分配、 HYPERLINK /view/245611.htm t _blank 消費結構及 HYPERLINK /view/522382.htm t _blank 人口結構等經濟結構的變化;第三種,經濟質量的完善和提升,即一個 HYP
30、ERLINK /view/8426.htm t _blank 國家或地區 HYPERLINK /view/188272.htm t _blank 經濟效益的提升、 HYPERLINK /view/629948.htm t _blank 經濟穩定程度、衛生健康狀況的完善、自然環境和 HYPERLINK /view/30800.htm t _blank 生態平衡以及政治、文化和人的現代化進程。在近10年加快改革開放的步伐中,我國地區之間的發展不平衡呈現了不斷的加劇局面。有調查顯示,目前中國城市與農村發展差異化比較嚴重,在第九個五年計劃期間所統計到的數據顯示,中國農業從業者的收入一直在下降,糧食產品
31、的價格也在下降,雖然收成增產了,但收入卻不見增加,地方政府對城市經濟發展的重視程度要遠遠大于農業。除了造成了農村經濟發展失衡外,也促使了城市經濟發展過程中貧富差距問題的深化,也使社會分配不公平現象得到劇增,更令社會當中不穩定的因素有所增加。除去城鄉發展不平衡,我國東中西部發展差距也較大,主要表現在以下兩方面:一是在資本存量方面:沿海地區由于開放得比較早,以鄉鎮企業為代表的民營經濟迅速增長,資本大量累積;同時因為改革開放一系列優惠政策的實施,成功地吸引了大量國外資本的輸入,這為沿海地區快速的經濟增長提供了充足的資本投入。但是由于中西部地理位置和政策的影響資本存量都不及東部,而而還有愈演愈烈的趨勢
32、。二是科技投入方面:東部是優勢地區,據調查顯示1990年東部地區從事科技活動人數是中部地區的2倍,西部地區的3倍;迄今,東部此類人才數量增加到中部的2.5倍,西部的4倍。尤其是在2000年東部從事科技活動人員比上年激增48%,但中西部地區同期分別只增長了19%、32%。東部地區20世紀90年代以來加大了研發經費投入力度,2000年東部研發經費支出比上年增長了87%,到2010這一年經費開支增加到2000年的2.4倍,而中西部地區研發經費支出基本保持1.31的態勢,在1990到1999年增長較慢,2000年開始逐年穩步增長,但從絕對數量來看遠低于東部地區。經濟發展不能以危害環境為代價,可持續發展
33、的要求是一個 HYPERLINK /view/8426.htm t _blank 國家或地區的發展不能影響其他國家或地區的發展,可持續性則意味著維持全人類福利的 HYPERLINK /view/9306.htm t _blank 自然資源基礎,使 HYPERLINK /view/30803.htm t _blank 生態環境和經濟社會 HYPERLINK /view/1646035.htm t _blank 協調全面地發展。了解我國各省市經濟發展情況對推動我國經濟發展有著重要作用,所以對各省經濟的研究是很必要的。1.1.2 選題的提出黑龍江省位于中國東北部,是我國著名的老工業基地,2008年全
34、年實現地區生產總值(GDP)8310.0億元,在各省自治區中排名17位,按可比價格計算比上年增長11.8%,連續五年保持11.6%以上的增幅,整體經濟繼續在較高的增長平臺運行。其中,第一產業增加了1089.1億元,增長8.2%;第二產業增加了4365.9億元,增長12.1%;第三產業增加了2855億元,增長12.4%。三次產業構成為13.1:52.5:34.4。第一、二、三產業對GDP的增長貢獻率分別為7.8%、55.7%和36.5%。人均地區生產總值為21727元,增長11.7%。經濟發展布局進一步優化。全年哈大齊工業走廊項目區實現工業總產值296.4億元,比上年增長37.6%;創造利稅46
35、.5億元,增長92.1%。全年完成固定資產投資投資117.8億元,增加241項新開工項目,新增入251戶區企業,新增了182戶的投產企業。東部煤電化基地建設區充分挖掘和發揮電力、煤化工、冶金、建材原料、生物工程等產業的優勢,堅持走新型工業化道路。東北亞經濟貿易開發區積極主動推進區域的經濟貿易合作,打造了面向東北亞、亞歐大陸的經濟貿易開發區。加快大小興安嶺生態功能保護區發展特色產業、生態產業等替代產業,優化產業結構,加快基礎設施建設,努力形成以生態經濟為主的產業格局。兩大平原農業綜合開發試驗區主要抓好農業基礎建設、農業結構調整,做大做強畜牧產業,以大力推進農業標準化、規?;彤a業化經營,致力于打
36、造銷售收入千億元以上龍頭企業集群,創出一批知名品牌。北國風光特色旅游開發區積極開發具有國際性、地域性和市場競爭力較強的旅游精品和品牌。哈牡綏東對俄貿易加工區的對內對外開放戰略升級逐步加快。增強了高新科技產業集中開發區發揮高新技術集聚效應,發展取得積極進展的有服務外包產業、動漫基地。黑龍江省主要有12個地級市,這些城市的綜合發展是帶動周邊地區經濟發展的重要動力。這些城市的發展狀況直接關系到城市自身和周邊地區(尤其是小城鎮)的進步,對這些城市進行分析評價,從而有效的根據城市的實際情況,采取促進經濟和社會發展的有效措施。對黑龍江省的經濟研究的現況是沒有把這12個城市放在一起進行多指標綜合評價。而目前
37、國內外關于多指標綜合評價的方法很多,根據權重確定方法的不同,這些方法可大致分為兩類;一類是主觀賦權法,如層次分析法,德爾菲法等,多是采用綜合咨詢評分的定向方法,這類方法因受到人為因素的影響,往往會夸大或降低了某些指標的作用,致使排序的結果不能完全真實地反應事物間真實關系;另一類是客觀賦權法,即根據各指標間的相關關系或各指標值的變異程度來確定權數,避免了人為因素帶來的偏差,如主成分分析法和因子分析法。1.2 選題的意義和目的1.2.1 選題的意義經濟是指一個國家國民經濟的總稱2。區域經濟是在一定區域內經濟發展的內部因素與外部條件相互影響而形成的綜合性經濟概念,它受到該區域的自然條件、資源開發和利
38、用狀況、社會經濟條件以及經濟政策等各種因素的制約和影響。經濟發展為一個國家擺脫貧困落后狀態,走向經濟和社會生活現代化的過程。區域經濟發展不僅意味著該區域國民經濟規模的擴大,更意味著經濟和社會生活素質的提高。我們要提高某地方人民的生活水平,要更好更快地發展某個地方,就必須充分了解這個地方現有的經濟發展狀況。因此,現有的經濟發展狀況研究對將來的發展有著非常重要的指導意義。1.2.2 選題的目的本文利用主成分分析和因子分析的方法對經濟發展水平進行綜合分析,按照城市的經濟實力評價各城市的發展層次,認識到城市之間競爭力的差異,城市經濟發展的優勢和劣勢,從而促進各省經濟全面、協調、共同發展。1.3 主成分
39、分析和因子分析的發展及應用1.3.1 主成分分析的發展及應用主成分分析也稱主分量分析,旨在利用降維的思想,把多指標轉化為少數幾個綜合指標。首先是由K皮爾森對非隨機變量引入的3,而后H霍特林將此方法推廣到隨機變量的情形。信息的大小通常用離差平方和或方差來衡量。在實際課題中,為了全面分析問題,往往提出很多與此有關的變量(或因素)因為每個變量都在不同程度上反映這個課題的客觀信息。在實際問題研究中,為了全面、系統地分析問題,我們必須考慮眾多影響因素。在用統計方法研究多變量問題時,變量太多會增加計算量和增加分析問題的復雜性,人們希望在進行定量分析的過程中,涉及的變量較少,得到的信息量較多。主成分分析正是
40、適應這一要求產生的,是解決這類題的理想工具。主成分分析往往會在大型研究中成為一個中間環節,用于解決數據信息濃縮等問題,這就可能產生各種各樣的組合方法。主成分所關心的問題,是通過一組變量的幾個線性組合來解釋這組變量的方差-協方差結構,它的一般目的是數據的壓縮以及數據的解釋。在一些歐美國家用核主成分分析的方法也就是主成分分析的改進方法,其采用非線性方法提取主成分,把核主成分分析應用到人臉識別中。在國外運用主成分分析的方法對肝素鈉、肝素鈣等低分子肝素相關產品的銷售額數據進行處理,形成新的指標體系,而后應用BP神經網絡的方法建立模型,評價模型的擬合能力。在日本運用主成分分析的方法對地質行分析,從而來預
41、測地震避免不必要的損失。同時,主成分作為一種優秀的降維提取主要信息的手段,先后在海洋學、地質學、地球物理學、資源科學等中都得到了一定程度的應用。我國經過近幾十年來的發展,運用主成分分析的方法對高光譜遙感礦物信息特征提取已經取得了很大進展。在國內運用主成分分析的方法對人口、教育、地區的經濟發展等方面研究,都取得了一定的成果。1.3.2 因子分析的發展及應用在對某一個問題進行論證分析時,采集大量多變量的數據能為我們的研究分析提供更為豐富的信息和增加分析的精確度。然而,這種方法不僅需要巨大的工作量,并且可能會因為變量之間存在相關性而增加了我們研究問題的復雜性。因而分析法就是從研究變量內部相關的依賴關
42、系出發把一些具有錯綜復雜關系的變量歸結為少數幾個綜合因子的一種多變量統計分析方法。這樣我們就對原始的數據進行分類歸并,將相關比較密切的變量分別歸類,歸結多個綜合指標,這些綜合指標互不相關,即它們所綜合的信息互相不重疊。這些綜合指標就稱為因子或公共子因子。因子分析法是兩種分析形式的 HYPERLINK /view/7841327.htm t _blank 統一體,即驗證性分析和純粹的探索性分析。因子分析最早是由英國的 HYPERLINK /view/4268.htm t _blank 心理學家CharlesSpearman在1904年的時候,提出單一化的智能因子(ASingleIntellect
43、ualFactor)開始。隨著試驗的深入,大量個體樣本被分析研究,證明了Spearman的單一智能因子理論是不充分的。同時,人們漸漸認識到有必要考慮多元因子。20世紀30年代,瑞典心理學家Thurstone打破了流行的單因子理論假設,經長期實踐研究,他大膽提出了多元因子分析(MultipleFactorAnalysis)理論。Thurstone在他的心智向量(VectorsofMind,1935)一書中,闡述了多元因子分析理論的數學和邏輯基礎。因子分析的基本目的就是用少數幾個因子去描述許多指標或因素之間的聯系,即將相關比較密切的幾個變量歸在同一類中,每一類變量就成為一個因子(之所以稱其為因子,
44、是因為它是不可觀測的,即不是具體的變量),以較少的幾個因子反映原資料的大部分信息。因子分析法(FactorAnalysis)就是尋找這些公共因子的模型分析方法,它是在主成分的基礎上構筑若干意義較為明確的公因子,以它們為框架分解原變量,以此考察原變量間的聯系與區別4。因子分析在市場調研中有著廣泛的應用,主要包括:經濟發展的研究、評價指標結構、消費者習慣和態度研究(U&A)、品牌形象和特性研究、服務質量調查、個性測試、形象調查、市場劃分識別、顧客、產品和行為分類。1.4 本文主要研究內容本文首先是了解了國內外經濟發展的基礎及黑龍江省經濟發展的現狀,接著學習研究主成分分析和因子分析的基本思路和步驟,
45、并將其理論與本文所研究的內容結合,其目的在于找到目前影響黑龍江省經濟發展指標的主要因素,并根據得到的數學模型對黑龍江省經濟發展情況進行綜合分析。然后通過學習與查閱相關資料找到黑龍江省12個地級市的10個具有代表性指標,運用spss統計分析軟件對這些指標進行主成分分析和因子分析得到特征值、方差貢獻率及公共因子等相關數據。并利用這些數據對12個市經濟水平劃分等級。最后對論文進行總體的評價,指出本文的不足,以期待改進的新方案。第2章 主成分與因子分析2.1 主成分分析的內容2.1.1 主成分分析原理和基本思想Karl parson在1901年最先引進了主成分的概念5,但是當時只是對非隨機變量討論的。
46、Hotelling在1933年將這個概念推廣到隨機變量。主成分分析的思想是降維,在損失很少信息的前提下把多個指標轉化為較少的幾個綜合指標。通常情況下將轉化生成的綜合指標稱為主成分,原始變量的線性組合就是每個主成分,且各個主成分之間是各不相關的,這就使得主成分比原始變量具有更優越的性能3。通常數學上的處理就是將原來個指標作線性組合,作為新的綜合指標,但是這種現行組合,如果不加以限制,則可以有很多,我們應該選取方差最大的作為第一主成分,較大的作為第二主成分,一次類推可以構造出第三、四,等個主成分。不難想像這些主成分之間不僅不相關,而且他們的方差一次遞減。因此在實際問題中,就挑選前幾個最大成分,雖然
47、這樣會損失一些信息,但是由于它使我們抓住了主要矛盾,并從原始數據中進一步提取了某些新信息,因為在某次額實際工作中的研究中得益較多,這種不僅減少了變量的數目還抓住了主要矛盾的做法更有利于問題的分析和處理。2.1.2 主成分的幾何意義從代數學的點看,成分就是個變量的一些特殊的線性組合6,在幾何上這些線性組合正是把構成的坐標系旋轉產生的新坐標系,新坐標軸使之通過樣品變差最大方向(或說具有最大的樣品方差)。下面以最簡單的二元正態變量來說明主成分的幾何意義6。設有個樣品,每個樣品有個變量記為,它們的綜合變量記為。當時,原變量是設它們有圖3-1的相關關系: 圖3-1 相關關系圖對于二元正態分布變量,個點的
48、散步大致為一個橢圓,若在橢圓長軸方向取坐標軸,在短軸方向取,這相當于在平面上作一個坐標變換,即按逆時針方向旋轉角度,根據旋軸變換公式新老坐標之間有關系: 我們看到,是原變量和的線性組合,用矩陣表示是顯然。從上圖還容易看出二維平面上的個點的波動(可用方差表示)大部分可以歸結為在軸上的波動,而在軸上的波動是較小的。如果上圖的橢圓是相當扁平的,那么我們可以只考慮方向上的波動,忽略方向的波動。這樣一來,二維可以降為一維了,只取第一個綜合變量即可。而是橢圓的長軸。一般情況,個變量組成維空間,個樣品就是維空間的個點,對元正態分布變量來說,找主成分的問題就是找維空間中橢球體的主軸問題。2.1.3 主成分分析
49、的性質(1) 各主成分之間互不相關,若原變量服從正態,則各主成分之間互相獨立7;(2) 全部個主成分所反映的例樣品的總信息,等于個原變量的總信息。信息量的多少,用變量的方差來度量。若將個原變量標準化后,每個變量的方差都為,故方差之和為,此時,求得主成分的方差之和也為;(3) 各主成分的作用大小是:(4) 第個主成分的貢獻率是()100,為貢獻率之和;(5) 前個主成分的累計貢獻率是()100。在應用時,一般取累計貢獻率為7085或以上所對應的前個主成分即可。在資料所含的變量個數、樣品數及累計貢獻率固定的前提下,的比值越小,則說明此資料用主成分分析越合適。2.2 主成分分析的求解方法和數學模型求
50、解主成分的方法主要有兩種,一是從原始變量的協方差矩陣結構入手,二是從原始變量的相關性矩陣結構入手。(1) 從協方差矩陣出發求解主成分為8:設矩陣,將的特征值依大小順序排列,不妨設為矩陣各特征值對應的標準正交特征向量,則對任意向量有 所以我們把的協方差矩陣的非零特征值,對應的標準化特征像量,分別作為系數向量分別稱為隨機向量的第一主成分,第二主成分,,第主成分。于是隨機與隨機向量之間存在關系: (2-1)(2) 從相關系數矩陣出發求解主成分為:首先數據矩陣元素進行標準化 (2-2)式中,和分別表示變量的期望與方差,于是有 (2-3)于是對原始變量進行如下標準化: (2-4)顯然有 (2-5)因此,
51、原始變量的相關矩陣實際是對原始變量標準化后的協方差陣。由相關陣求主成分的過程與主成分個數的確定準則實際上是與由協方差陣出發求主成分的過程與主成分個數的確定準則是一致的。求得的主成分與原始變量表示為:。 數學模型設有個樣品,每個樣品觀測項指標(變量):,得到原始數據資料庫: (2-6)其中, 。用數據矩陣的個向量(即個指標向量)作線性組合(即綜合指標向量)為9: (2-7)上述方程要求:且系數由下列原則決定: (1) 與不相關;(2) 是與的一切線性組合(系數滿足上述方程組)中方差最大的,與是不相關的的一切線性相關中方差最大的,是與都不相關的的所有線性組合的最大者。這里要說明兩點:一個是數學模型
52、中為什么作線性組合?基于兩種原因: = 1 * GB3 數學上比較容易處理 = 2 * GB3 在實踐中效果很好。另一個要說明的是每次選取的主成分要使Var()最大,如果不加限制就可使Var(),這樣就沒什么意義了,常用的限制是要求,。2.3 主成分分析的基本步驟設原始資料矩陣為:(1) 將原始數據進行標準化處理:進行標準化的目的在于消除原始數據各指標的量綱不同,公式如下: (2-8)其中為每一列指標的標準值;為每一列指標的均方差。標準化處理后,得到新的矩陣(2) 建立變量的相關系數陣:根據公式建立樣本的相關系數矩陣;(3) 求特征根和特征向量:根據公式求出其前個特征值根據公式解出與特征值對應
53、的單位正交化特征向量。4. 寫出主成分將原變量轉換成主成分的線性組合,且具有正交特征,綜合成為相應,而基本信息量保持不變。這樣確定的綜合變量分別稱作原變量的第一、第二、第個主成分,且應在總方差中所占比例依次遞減。2.4 因子分析的內容2.4.1 因子分析原理和基本思想1904年,Charles Spearman發表一篇著名論文對智力檢驗得分進行統計分析視為因子分析的起點10。因子分析的形成和發展有相當長的歷史,最早用以研究解決心理學和教育學方面的問題,由于計算量大,又缺少高速計算的設備使因子分析的應用和發展受到很大的限制,甚至停滯了很長的時間。后來,由于電子計算機的出現,才使因子分析的理論研究
54、和計算問題,有了很大的進展。目前這一方法的應用范圍已十分廣泛,在經濟學、社會學、考古學、生物學、醫學、地質學以及體育科學等各個領域都取得了顯著的成績。因子分析是主成分分析的推廣和發展,它也是將具有錯綜復雜關系的變量(或樣品)綜合為數量較少的幾個因子,以再現原始變量與因子的相互關系,同時根據不同因子還可以對變量進行分類,它也是屬于多元分析中處理降維的一種統計方法。因子分析的基本思想是通過變量(或樣品)的相關系數矩陣(對樣品是相似系數矩陣)內部結構的研究,找出能控制所有變量(或樣品)的少數幾個隨機變量去描述多個變量(或樣品)之間的相關(相似)關系,但在這里,這少數幾個隨機變量是不可觀測的,通常稱為
55、因子。然后根據相關性的大小把變量分組,使得同組內的變量之間相關性較高,但不同的變量相關性較低。因為因子分析的內容很豐富,本文僅介紹因子分析常用的兩種類型:型因子分析(對變量作因子分析)和型因子分析(對樣品作因子分析)。2.4.2 因子分析的性質因子分析是主成分分析的推廣,也是一種把多個變量化為少數幾個綜合變量的多變量分析方法,其目的是用有限個不可觀測的隱變量解釋原始變量之間的相關關系11。因子性質主要表現變量之間關聯度上,根據關聯度可以劃分為特殊因子和公共因子,利用因子分析,減少分析變量個數,通過對變量的相關關系探測,將原始變量進行分類。其中共同度表明的第個分量對于的每一分量共同依賴程度。如果
56、它的值越大,依賴程度就越大.方差貢獻是衡量公共因子相對重要性的指標。越大,表明公共因子對的貢獻越大,或者說對的影響和作用就越大12。2.5 因子分析的求解方法和數學模型2.5.1 型因子分析數學模型13簡記為且滿足:i) ;ii) 即和是不相關的;iii) 即不相關且方差皆為1. 即不相關,且方差不同。其中是可實測的個指標所構成的維隨機向量,是不可觀測的向量,稱為的公共因子或潛因子,即前面所說的綜合變量,可以把它們理解為高維空間中相互垂直的個坐標軸;稱為因子載荷是第個變量在第個公共因子上的負荷,如果把變量看成維因子空間中的一個向量,則表示在坐標軸上的投影,矩陣稱為因子載荷矩陣;稱為的特殊因子,
57、通常理論上要求的協方差陣是對角陣,包括隨機誤差14。因子分析的目的就是通過模型以代替,由于,從而達到簡化變量維數的愿望。2.5.2 因子模型中公共因子,因子載荷量的統計意義為了便于對因子分析計算結果做解釋,將因子分析數學模型中各個量的統計意義加以說明是十分必要的。假定因子模型中,各個變量以及公共因子、特殊因子都已經是標準化(均值為0,方差為1)的變量15。(1) 因子載荷的統計意義已知模型:由于在標準化下有:因此,公式中F同一所以上式可寫成: (因為各因子不相關,所以相關系數為0)故因子載荷的統計意義就是第個變量與第個公共因子的相關系數即表示依賴的分量(比重)。因此用統計學的術語應該叫做權,但
58、由于歷史的原因,心理學家將它叫做載荷,即表示第個變量在第個公共因子上的負荷,它反映了第個變量在第個公共因子上的相對重要性。(2) 公因子的方差貢獻率的統計意義將因子載荷矩陣中各列元素的平方和記為 稱為公共因子對的貢獻,即表示同一公共因子對諸變量所提供的方差貢獻之總和,它是衡量公共因子相對重要性指標。 2.5.3 因子旋轉與因子得分建立因子分析數學模型的目的不僅要找出公共因子以及對變量進行分組,更重要的是要知道每個因子的意義,以便對實際問題作出科學的分析,如果每個公共因子的涵義不清,不便于進行實際背景的解釋,這時根據因子載荷陣的不唯一性,可對因子載荷陣實行旋轉即用一個正交陣右乘使旋轉后的因子載荷
59、陣結構簡化,便于對公共因子進行解釋。所謂結構簡化就是使每個變量僅在一個公共因子上有較大的載荷,而在其余公共因子上的載荷比較小,至多是中等大小。這種變換因子載荷的方法稱為因子軸的旋轉,而旋轉的方法有很多。如正交旋轉,斜交旋轉等。因子分析的最后一步是計算因子得分。因子變量確定后,便可計算各因子得分即每個樣本上的具體數值,新變量形成了因子變量,它和原變量的得分是相對應的。想要在以后分析中用因子變量代替原有變量進行數據建模,就要有因子得分,或利用因子變量對樣本進行分類或評價等研究,進而實現降維和簡化的目標16。2.6 計算步驟因子分析法的步驟入下:(1) 將原始數據標準化,為書寫方便記為;(2) 建立
60、變量的相系數陣;(3) 求的特征根及相應的單位特征向量,分別記為和;(4) 對施行方差最大正交旋轉;(5) 計算因子得分。第3章 主成分與因子分析在黑龍江省 城市經濟水平研究中的應用對黑龍江省12個地級市選取10個主要經濟指標17(見表3-1),-國內生產總值(億元)、-工業總產值(億元)、-人均GDP(元)、-工業企業單位數(個)、-固定資產投資(億元)、-社會消費品零售總額(億元)、-財政收入(萬元)、-金融機構存款年底余額(億元)、-年末人口數(萬人)、-財政支出(萬元)。運用spss軟件進行主成分和因子分析。表3-1 經濟指標城市哈爾濱4550.22503.74581011424127
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 郵政快遞賠償標準調整補充協議
- 長期承租設備協議書
- 贍養問題調解協議書
- 隧道支護承包協議書
- 鄰居快遞賠償協議書
- 車廂買賣合同協議書
- 酒店雙方諒解協議書
- 資產收購居間協議書
- 道路清洗保潔協議書
- 寫字樓合同解除協議書
- 密封條范文模板(A4打印版)
- 西方文明史導論智慧樹知到期末考試答案2024年
- JBT 11699-2013 高處作業吊籃安裝、拆卸、使用技術規程
- IATF16949質量管理體系過程風險和機遇評估分析表
- 知識星球行業報告
- 【課件】第15課+權力與理性-17、18世紀西方美術+課件-高中美術人教版(2019)美術鑒賞
- 光電技術(第5版) 習題解答 王慶有
- 倉庫貨物先進先出管理培訓教程培訓課件
- 什么是數學:對思想和方法的基本研究
- 家長會課件:初三迎接中考家長會課件
- 金屬非金屬地下礦山安全避險“六大系統”課件
評論
0/150
提交評論