




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、主成分分析計算方法和步驟:在對某一事物或現象進行實證研究時,為了充分反映被研究對象個體之間的差異, 研究者往往要考慮 增加測量指標,這樣就會增加研究問題的負載程度。但由于各指標都 是對同一問題的反映,會造成信息的重疊,引起變量之間的共線性,因此,在多指標的數 據分析中,如何壓縮指標個數、壓縮后的指標能否充分 反映個體之間的差異,成為研究 者關心的問題。而主成分分析法可以很好地解決這一問題。主成分分析的應用目 的可以簡單地歸結為: 數據的壓縮、數據的解釋。它常被用來尋 找和判斷某種事物或現象的綜合指標,并 且對綜合指標所包含的信息給予適當的解釋, 從而更加深刻地揭示事物的內在規律。主成分分析的基
2、本步驟分為: 對原始指標進行標準化,以消除變量在數量極或量 綱上的影響;根據標準化后的數據矩陣求出相關系數矩陣 R; 求出 R 矩陣的特征 根和特征向量; 確定主成分,結合專 業知識對各主成分所蘊含的信息給予適當的解 釋;合成主成分,得到綜合評價值。結合數據進行分析本題分析的是全國各個省市高校績效評價,利用全國2014年的相關統計數據(見附錄),從相關的指標數據我們無法直接評價我國各省市的高等教育績效,而通過表5-6的相關系數矩陣,可以看到許多的變量之間的相關性很高。如:招生人數與教職工人數之間具有較強的相關性,教育投入經費和招生人數也具有較強的相關性,教工人數與本科院校數之間的相關系數最高,
3、到達了0.963,而各組成成分之間的相關性都很高,這也充分說明了主成分分析的必要性。表5-6 相關系數矩陣本科院校數招生人數教育經費投入相關性師生比0.2790.3290.252重點高校數0.3450.2040.310教工人數0.9630.9540.896本科院校數1.0000.9380.881招生人數0.9381.0000.8931 / 6教育經費投入0.8810.8931.000師生比重點高校數教工人數相關性師生比1.000-0.2180.208重點高校數-0.2181.0000.433教工人數0.2080.4331.000本科院校數0.2790.3450.963招生人數0.3290.20
4、40.954教育經費投入(元)0.2520.3100.896表5-7給出的是各主成分的方差貢獻率和累計貢獻率,我們選取主成分的標準有兩個:第一,特征根大于1,因為,如果特征根小于1,說明該主成分的解釋力度太弱,還比不上直接引入一個原始變量的平均解釋力度大;第二,方差貢獻率大于85%,如果這兩個標準不能同時符合要求,則往往是因為選擇的指標不合理或者樣本容量太小,應繼續調整。表5-7還顯示,只有前2個特征根大于1,因此SPSS只提取了前兩個主成分,而這兩個主成分的方差貢獻率達到了87.081%,因此選取前兩個主成分已經能夠很好地描述我國高等教育地區現狀。表5-7 方差貢獻率以及累計貢獻率元件起始特
5、征值提取平方和載入合計方差的貢獻率 %累加貢獻率 %合計方差的貢獻率 %累加貢獻率 %13.98366.39066.3903.98366.39066.39021.24120.69187.0811.24120.69187.08130.5719.50896.589.5719.50896.58940.1402.33598.925.1402.33598.92550.0520.86999.794.0520.86999.79460.0120.206100.000.0120.206100.000表5-8為輸出的主成分系數矩陣,可以說明各主成分在各變量上的載荷。由表5-8可以看出,標準化后的第一主成分( 簡稱
6、) 對所有變量都有載荷,且載荷絕對值幾乎都在0.7以上, 因此可以說第一主成分是對人口結構的度量,代表了一個地區人口結構狀況,可以稱之為“綜合因子”。在綜合因子中,平均每戶人口,農業與非農業人口比例, 人口的自然增長率比重即 人口自然增長各指標具有較強的作用,人與經濟等其他指標所起的作用次之,男女比例也起一定作用。第二主成分( 簡稱 ) 對重點高校數和教工人數具有負載荷,其他變量具有正載荷,并且除 師生比和重點高校數載荷絕對值均小于0.2,有的甚至 接近于 0.1。因此,第二個主成分只是匯集了第一主成分遺漏的部分信息,我們稱之為“輔助 因子”。表5-8主成分矩陣成分師生比0.3170.799重
7、點高校數0.396-0.759教工人數0.984-0.095本科院校數0.9730.005招生人數0.9640.131教育經費投入0.9390.011表5-9 主成分評分系數矩陣成分師生比.079.643重點高校數.099-.612教工人數.247-.077本科院校數.244.004招生人數.242.106教育經費投入.236.009根據表5-9可以得到各主成分的表達式把變量分別代入以上表達式,可以得出和兩個主成分得分,但單獨一個主成分不能很好地評價十個地區人口結構的情況,因此需要按照各主成分對應的方差貢獻率為權數計算綜合統計F,()主成分分析法的優點: 1、 可消除評價指標之間的相關影響 因
8、為主成分分析在對原指標變量進行變換后形成了彼此相互獨立的主成分,而且實踐證明指標之間相關程度越高,主成分分析效果越好。 2、 可減少指標選擇的工作量 對于其它評價方法,由于難以消除評價指標間的相關影響,所以選擇指標時要花費不少精力,而主成分分析由于可以消除這種相關影響,所以在指標選擇上相對容易些。 3、 當評級指標較多時還可以在保留絕大部分信息的情況下用少數幾個綜合指標代替原指 標進行分析 主成分分析中各主成分是按方差大小依次排列順序的,在分析問題時,可以舍棄一部分主成分,只取前后方差較大的幾個主成分來代表原變量,從而減少了計算工作量。 4、 在綜合評價函數中,各主成分的權數為其貢獻率,它反映了該主成分包含原始數據的信 息量占全部信息量的比重,這樣確定權數是客觀的、合理的,它克服了某些評價方法中認為確定權數的缺陷。 5、 這種方法的計算比較規范,便于在計算機上實現,還可以利用專門的軟件主成分分析法的缺點:1、在主成分分析中,我們首先應保證所提取的前幾個主成分的累計貢獻率達到一個較高的水平(即變量降維后的信息量須保持在一個較高水平上),其次對這些被提取的主成分必須都能夠給出符合實際背景和意義的解釋(否則主成分將空有
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年普通高等學校招生全國統一考試數學模擬試題(五)(含答案)
- 鐵路旅客運輸服務鐵路客運列車服務工作課件
- 投資房購房合同
- 鐵路超限超重貨物運輸電報鐵路超限超重貨物確認電報的識讀
- 提速道岔轉轍機調整信號工程施工課件
- 瀝青防水改色施工方案
- 中國書法文化課件
- 中華傳統文化課件教學
- 餐飲投資合同
- 東南大學基礎工程課件
- 引水隧洞回填固結灌漿施工方案
- 《安全人機工程學》試題及答案
- 【七年級下冊地理人教版】七下地理期中測試卷01
- 2025年華僑港澳臺生聯招考試高考化學試卷試題(含答案解析)
- 2025年度人工智能教育培訓合同(AI應用培訓版)2篇
- 水電安裝合同范本6篇
- 2024年03月徽商銀行社會招考筆試歷年參考題庫附帶答案詳解
- 開曼群島公司法2024版中文譯本(含2024年修訂主要內容)
- 大學物理(二)知到智慧樹章節測試課后答案2024年秋湖南大學
- 2022年安徽省二級消防工程師《消防技術綜合能力》考試題庫(含真題、典型題)
- 大學體育與健康 教案全套 武術散打 第1-16周
評論
0/150
提交評論