




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、一、主成分分析的基本原理 v假定有n個樣本,每個樣本共有p個變量,構成一個np階的數據矩陣npnnppxxxxxxxxxX212222111211(1) v降維處理!當p較大時,在p維空間中考察問題比較麻煩。降維是用較少的幾個綜合指標代替原來較多的變量指標,而且使這些較少的綜合指標既能盡量多地反映原來較多變量指標所反映的信息,同時它們之間又是彼此獨立的。定義:記x1,x2,xP為原變量指標,z1,z2,zm(mp)為新變量指標pmpmmmppppxlxlxlzxlxlxlzxlxlxlz22112222121212121111(2) v系數lij的確定原則: zi與zj( ij;i,j=1,2
2、,m )相互無關; z1是x1,x2,xP的一切線性組合中方差最大者,z2是與z1不相關的x1,x2,xP的所有線性組合中方差最大者; zm是與z1,z2,zm1都不相關的x1,x2,xP, 的所有線性組合中方差最大者。 則新變量指標z1,z2,zm分別稱為原變量指標x1,x2,xP的第一,第二,第m主成分。 從以上的分析可以看出,主成分分析的實質就是確定原來變量xj(j=1,2 , p)在諸主成分zi(i=1,2,m)上的載荷 lij( i=1,2,m; j=1,2 ,p)。 從數學上可以證明,載荷lij分別是相關矩陣的m個較大的特征值所對應的特征向量。 二、計算步驟 (一)計算相關系數矩陣
3、(一)計算相關系數矩陣 rij(i,j=1,2,p)為原變量xi與xj的相關系數, rij=rji,其計算公式為:pppppprrrrrrrrrR212222111211(3) nknkjkjikinkjkjikiijxxxxxxxxr11221)()()((4) (二)計算特征值與特征向量:(二)計算特征值與特征向量: 解特征方程,求出特征值,并使其按大小順序排列 ; 0RI0,21p 分別求出對應于特征值的特征向量 ,要求 =1,即,其中表示向量 的第j個分量。i), 2 , 1(piliil112pjijlijlil 計算主成分貢獻率及累計貢獻率 貢獻率:),2, 1(1pipkki累計
4、貢獻率: ),2, 1(11pipkkikk一般取累計貢獻率達8595%的特征值所對應的第一、第二、第m(mp)個主成分。 m,21pnpnnppxxxlllllllllZ.21212222111211(6) 各主成分的得分三、 主成分分析方法應用實例表表1 1 某農業生態經濟系統各區域單元的有關數據某農業生態經濟系統各區域單元的有關數據 668.3372.03276.2041540.29216.398.1284.0650.0114.861795.4160.80171.106926.35291.528.1354.0630.0124.862862.9011.65273.3071501.24225
5、.2518.3522.6450.0343.201986.6240.84168.904897.36196.3716.8615.1760.0556.1671091.3940.81266.502911.24226.5118.2795.6430.0764.4771176.9120.85850.302103.52217.0919.7934.8810.0016.1651251.2741.04164.609968.33181.384.0054.0660.0155.4021368.8310.83662.804957.14194.049.114.4840.0025.791477.3010.62360.10282
6、4.37188.0919.4095.7215.0558.4131576.9481.02268.0011255.42211.5511.1023.1330.013.4251699.2650.65460.7021251.03220.914.3834.6150.0115.59317118.5050.66163.3041246.47242.1610.7066.0530.1548.70118141.4730.73754.206814.21193.4611.4196.4420.01212.94519137.7610.59855.9011124.05228.449.5217.8810.06912.654201
7、17.6121.24554.503805.67175.2318.1065.7890.0488.46121122.7810.73149.1021313.11236.2926.7247.1620.09210.078步驟如下:(1)將表1中的數據作標準差標準化處理,然后將它們代入公式(4)計算相關系數矩陣(見表2)。x1x2x3x4x5x6x7x8x9x11-0.327 -0.714 -0.3360.3090.4080.790.1560.744x2-0.331-0.0350.6440.420.2550.009-0.0780.094x3-0.71-0.03510.07-0.74-0.755-0.93-
8、0.109-0.924x4-0.340.6440.0710.3830.069-0.05-0.0310.073x50.3090.42-0.740.38310.7340.6720.0980.747x60.4080.255-0.7550.0690.73410.6580.2220.707x70.790.009-0.93-0.0460.6720.6581-0.030.89x80.156-0.078 -0.109 -0.0310.0980.222-0.0310.29x90.7440.094-0.9240.0730.7470.7070.890.291表表2 2相關系數矩陣相關系數矩陣 (2)由相關系數矩陣計
9、算特征值,以及各個主成分的貢獻率與累計貢獻率(見表3)。由表3可知,第一,第二,第三主成分的累計貢獻率已高達86.596%(大于85%),故只需要求出第一、第二、第三主成分z1,z2,z3即可。 表表3 3特征值及主成分貢獻率特征值及主成分貢獻率 (3)對于特征值=4.6610,=2.0890,=1.0430分別求出其特征向量l1,l2,l3。表表4 4 主成分載荷主成分載荷 z1z2z3占方差的百分數(%)x10.739-0.532-0.006182.918x20.1230.887-0.002880.191x3-0.9640.00960.009592.948x40.00420.8680.003775.346x50.8130.444-0.001185.811x60.8190.1790.12571.843x70.933-0.133-0.25195.118x80.197-0.10.9798.971x90.964-0.00250.009292.939 第一主成分z1與x1,x5,x6,x7,x9呈顯出較強的正相關,與x3呈顯出較強的負相關,而這幾個變量則綜合反映了生態經濟結構狀況,因此可以認為第一主成分z1是生態經濟結構的代表。 第二主成分z2與x2,x4,x5呈顯出較強的正相關,與x1呈顯出較強的負相關,其中,除了x1為人口總數外,x2,x4,x5都反映了人均占有資源量的情況
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030年中國果奶生產成套設備行業投資前景及策略咨詢報告
- 2025至2030年中國木皮包覆機行業投資前景及策略咨詢研究報告
- 2025至2030年中國服務管理軟件行業投資前景及策略咨詢報告
- 2025至2030年中國智能型柴油機水泵市場現狀分析及前景預測報告
- 2025至2030年中國時鐘五金配件市場分析及競爭策略研究報告001
- 2025至2030年中國旋翼式黃銅數字水表行業發展研究報告
- 2025至2030年中國斗塵油封行業發展研究報告
- 2025至2030年中國數顯氧彈式熱量計市場調查研究報告
- 血液科發熱的護理措施
- 西柏坡的故事與紅色教育
- 國開電大《工程數學(本)》形成性考核作業5答案
- 13、試生產開停工方案
- JJG 109-2004百分表式卡規
- 12YJ6 外裝修標準圖集
- 新教材人教版高中物理選擇性必修第一冊全冊教學課件
- 初中數學北師大八年級下冊綜合與實踐-生活中的一次模型PPT
- 煤化工概述-課件
- 2021初中生命科學學業考試參考答案
- 心理治療師心理治療師中級
- 《作文吹泡泡》-完整版課件
- 資源環境信息系統(GIS)課件
評論
0/150
提交評論