吳偉主成分分析課件PPT_第1頁
吳偉主成分分析課件PPT_第2頁
吳偉主成分分析課件PPT_第3頁
吳偉主成分分析課件PPT_第4頁
吳偉主成分分析課件PPT_第5頁
已閱讀5頁,還剩13頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、主成分分析法(MATLAB應用)第一組:吳偉、李璇、朱璇1應用matlab進行主成分分析pca步驟簡介1相關函數簡介2案例分析3數據分析42主成分分析簡介主成分分析(principal component analysis,簡稱PCA) 是在處理數據時,在保留絕大多數信息的條件下將多個變量綜合為幾個主要變量,進而在新的綜合變量基礎上,對數據進一步的分析解釋及推斷的一種方法。3pca步驟第一步:對原始數據進行標準化處理;第二步:計算標準化后數據數組協方差矩陣或相關矩陣;第三步:求協方差矩陣的特征值和相應的特征向量;第四步:計算主成份貢獻率及累計貢獻率;第五步:依據方差貢獻率選取主成份;第六步:計

2、算主成份得分;第七步:結論解釋與推斷。4相關函數簡介std(x) %求矩陣x的標準差;zscore(x) %對矩陣x進行標準化;cov(x) %求矩陣x的協方差矩陣;corrcoef(x) %求矩陣x的相關系數矩陣; coeff,latent,explained=pcacov(x) %對x進行主成分分析;sum(x) %對向量x求和;cumsum(x) %表示x向量不同維數的累加和,x向量中第m行的元素是A中第1行到第m行的所有元素累加和。5相關函數介紹pcacov函數介紹:格式 : coeff,latent,explained=pcacov(x) coeff表示各個主成分的系數; laten

3、t表示矩陣特征值; explained:每個特征向量表征在觀測量總方差中所占的百分數也就是各個主成分的貢獻率。6一:標準化數據 stddata=zscore(x);二:求協方差矩陣或相關系數矩陣 covtrix=cov(stddata)或 cortrix=corrcoef(stddata)三:求矩陣特征值和相應的特征向量 coeff,latent,explained=pcacov(covtrix)或coeff,latent,explained=pcacov(cortrix)matlab主成分分析步驟7四:計算主成份貢獻率及累計貢獻率步驟三中pcacov函數中返回的explained即主成分貢獻

4、率; 累積貢獻率: per=100*cumsum(latent)./sum(latent)五:選取主成分六:計算各主成份得分 score=stddata*coeff七:結論解釋與推斷8案例分析 我們對江蘇省十個城市的生態環境狀況進行了調查,得到生態環境指標的指數值,見表1。現對生態環境水平分析和評價。9案例分析 在matlab中輸入觀察數據:x = 0.7883 0.7633 0.4745 0.8246 0.8791 0.9538 0.8785 0.6305 0.8928 0.7391 0.7287 0.5126 0.7603 0.8736 0.9257 0.8542 0.6187 0.783

5、1 0.8111 0.7629 0.8810 0.6888 0.8183 0.9285 0.8537 0.6313 0.5608 0.6587 0.8552 0.8903 0.8977 0.9446 0.9434 0.9027 0.7415 0.8419 0.6543 0.7564 0.8288 0.7926 0.9202 0.9154 0.8729 0.6398 0.8464 0.8259 0.7455 0.7850 0.7856 0.9263 0.8871 0.8485 0.6142 0.7616 0.8486 0.7800 0.8032 0.6509 0.9185 0.9357 0.84

6、73 0.5734 0.8234 0.6834 0.9490 0.8862 0.8902 0.9505 0.8760 0.9044 0.8980 0.6384 0.8495 0.8918 0.3987 0.6799 0.8620 0.9579 0.8866 0.6186 0.9604 0.7846 0.8954 0.3970 0.9877 0.8873 0.9741 0.9035 0.7382 0.851410案例分析 一:標準化數據 stddata=zscore(x);標準化后數據11案例分析 二:求協方差矩陣或相關系數矩陣 covtrix=cov(stddata);協方差矩陣12案例分析

7、三:求矩陣特征值和相應的特征向量 coeff,latent,explained=pcacov(covtrix)各特征向量即各主成分荷載系數13案例分析四:計算主成份累計貢獻率per=100*cumsum(latent)./sum(latent)五:選取主成分六:計算各主成份得分 score=stddata*coeff累計貢獻率個主成分得分14數據分析 七:結論解釋與推斷 第一主成分貢獻率為43.12,第二主成分貢獻率為29.34,第三主成分貢獻率為11.97,前三個主成分累計貢獻率達84.24。如果按80 以上的信息量選取新因子,則可以選取前三個新因子。第一新因子z1 包含的信息量最大為43.12,它的主要代表變量為X8(0.4815城市文明)、X7(0.4236生產效率)、X4 (0.4048城市綠化),這三個變量與生態環境水平密切相關,第一主成分是人為因素的影響。 15數據分析 第二新因子Z2包含的信息量次之為29.34,它的主要代表變量為X3(-0.5299地理結構)、X6(0.5273資源配置)、X9(0.4589可持續性),第二主成分是自然因素的影響。 第三新因子Z3包含的信息量為11.97,代表變量為 X9(0.5933可持續性)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論