




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、主成分分析在系統(tǒng)評價中的應用principal component analysis基本數(shù)學思想設(shè)原始數(shù)據(jù)表中的變量為 。主成分分析過程實質(zhì)上是對原坐標系進行平移和旋轉(zhuǎn)變換,使得新坐標的原點與數(shù)據(jù)群點的重心重合,新坐標系的第一軸與數(shù)據(jù)變異的最大方向?qū)?,新坐標系的第二軸與第一軸標準正交,并且對應于數(shù)據(jù)變異的第二大方向依此類推。這些新軸分別被稱為第一主軸 ,第二主軸 。若經(jīng)舍棄少量變量信息后,主軸變量集合能夠十分有效地表示原數(shù)據(jù)的變異情況,則原來的p維空間就被降至m維。生成的空間被稱為m維主超平面。主成分分析的本意是簡化!系統(tǒng)評價學-劉新建2主成分分析的算法準則對于一個高維變量空間系統(tǒng),要討論對
2、它進行簡化的方法,首先要回答的問題是:簡化的標準是什么?設(shè)原變量空間是新變量空間是主成分分析就是尋找合適的矩陣A,使得,m p那么,什么是合適的呢?系統(tǒng)評價學-劉新建31.數(shù)據(jù)變異最大方向之原則由主成分分析的數(shù)學思想得知:主成分集合是解釋原數(shù)據(jù)集合差異性最好的變量集合。若以一個變量y1代表原變量集合,則應使得:若以 代表原變量集合,則應使得:系統(tǒng)評價學-劉新建42.最小二乘原則設(shè)有一個原樣本點ei,其在新空間中的映像是當原像與映像的距離最小時,我們認為兩個點最相似,對于一個樣本,共有n個樣本店,則最小二乘原則即是要求:式中pi是第i個點的權(quán)重。(可以認為是同點的個數(shù)比例)從幾何的觀點看最小二乘
3、原則:由于原樣本點與其在主超平面上投影的距離平方總和達到最小,因此,可以說,m維主超平面是最接近原樣本群點的m維超平面。系統(tǒng)評價學-劉新建54.對原變量系統(tǒng)的最佳綜合表現(xiàn)力原則還可以證明,對于原數(shù)據(jù)表p個變量,如果想以一個綜合變量來代表原來所有的原始變量,則第一主成分就是最好的選擇,用統(tǒng)計語言描述就是,第一主成分與所有的原始變量相關(guān)性最強,即如果以m個主成分代表原變量空間,則 系統(tǒng)評價學-劉新建7主成分分析的算法步驟假定原變量的數(shù)據(jù)都經(jīng)過了標準化處理.1.求協(xié)方差陣R2.求矩陣V的前m個特征值以及對應的特征向量,這些特征向量是標準正交的。m個特征值滿足: 設(shè)對應的m個主特征向量是:系統(tǒng)評價學-
4、劉新建8主成分定義系統(tǒng)評價學-劉新建10系統(tǒng)評價學-劉新建11系統(tǒng)評價學-劉新建127.6主成分分析在系統(tǒng)評價中應用問題本節(jié)將分析主成分分析的評價準則信息量概念,進一步討論主成分變量空間與原變量空間的關(guān)系、權(quán)重與多重相關(guān)的關(guān)系等問題,并重新考慮了綜合指標的合成模式。為了下面討論方便,這里首先給出主成分分析基本模型:對于一組標準化變量 ,R是它們的相關(guān)系數(shù)矩陣, (從大到小排列) 是R的特征根, 是對應的列特征向量,令 (1)稱 是 的第 k 主成分,且 (2)首先,信息量的概念來源于不確定性,不確定性的大小是用概率來衡量的,而方差的大小與概率分布沒有直接關(guān)系。其次,信息的含義有多種,比如有語義
5、信息和不確定性信息。再次,在主成分分析方程的推導中使用了約束條件(2),其中 是協(xié)方差陣或相關(guān)系數(shù)陣的特征向量。這個約束條件實際上具有任意性,比如可以令 ,實質(zhì)上,對于一個總體,個體間在某些變量上存在差異確實表現(xiàn)出了某種信息,但是,沒有差異同樣也是信息,只不過是另一種信息。從評價的功效角度看,增大方差有助于顯著區(qū)分各樣本點,所以是有意義的。但方差大小絕不等同于信息量大小。7.6.1方差大小不等于信息量大小7.6.2主成分變量空間是對原變量空間的重構(gòu)如果在 之間不存在完全相關(guān),那么 是個互異特征根,而 是一組正交向量,從而由(1),x 與 y 之間是可逆的。若在 之間存在完全相關(guān)的變量組,那么一
6、些變量可以用其它變量完全表示,把這些變量剔除以后,可以在剩余變量組和新的主成分之間建立可逆變換。所以,我們認為,變量組 y 可以完全代替變量組 x ,y 的空間是 x 的空間的重構(gòu)。7.6.3加權(quán)與多重相關(guān)性問題通過上面的分析我們知道,雖然主成分分析中似乎沒有因變量,但真要達到建立該方法時的初衷降低維度,還是需要一個隱藏的因變量G,這時才能談信息量的大小即自變量 對 G 的變異性的解釋能力大小。綜合評價問題正好能滿足這一要求。一個比較好的評價方案通常要求指標體系應具有獨立性和全面性 。如果原指標之間不存在完全相關(guān)性,那么,變換后的主成分要全面反映原指標體系就必須與原空間是同維的。對于綜合評價,進行主成分分析的最根本收獲就是獲得了一組相互獨立的評價指標。對于新獲得的評價指標集,合成處理的模式依賴于評價的目的和指標本身的含義,即:要具體考慮 與 G 的相關(guān)狀態(tài)。為了消除多重相關(guān)性對權(quán)重的干擾,可以將每個 的方差都規(guī)范成1或其它相同常數(shù),然后再實行加權(quán),其中的權(quán)在 G 非直接可測的情況下,只能是主觀權(quán)。這時,方差最大化不再是一個準則,而僅僅成為我們求取一組相互獨立評價指標的手段,其實可直接應用 R 的特征方程。系統(tǒng)評價學-劉新建19通過以上分析,我們所獲得的基本結(jié)論是:1.方差大小不反映信息量的大小,要應用信息量概念,宜考慮一個因變量。2.主成分分
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 北京市通州區(qū)2024-2025學年高一(下)學期期中考試歷史試題(含答案)
- 2024年項目管理資格考題全解試題及答案
- 農(nóng)作物種子市場營銷試題及答案
- 2024年農(nóng)作物繁育員的法律法規(guī)解讀試題及答案
- 專業(yè)級別的2024年裁判員考試技能 試題及答案
- 電光培訓課件下載
- 2024足球裁判員考試的創(chuàng)新方法與試題與答案
- 植保員文化知識考試試題及答案
- 2024年種子繁育員的考試準備策略試題及答案
- 2024年農(nóng)作物種子繁育員面試常見問題試題及答案
- 醫(yī)保飛行檢查培訓
- 2025年中考英語押題預測卷(蘇州專用)(原卷版)
- 初級出版專業(yè)技術(shù)人員職業(yè)資格真題答案解析2024
- 遼寧省部分示范性高中2025屆高三下學期4月模擬聯(lián)合調(diào)研數(shù)學試題(無答案)
- 二零二五協(xié)警聘用合同范文
- CT引導下經(jīng)皮胃造瘺術(shù)專家共識(2025版)解讀課件
- 防雷安全知識培訓課件
- 醫(yī)療設(shè)備租賃服務及安全措施
- 2024年美容師考試相關(guān)法律法規(guī)解讀試題及答案
- 2024年山東司法警官職業(yè)學院招聘考試真題
- 產(chǎn)房護理人文關(guān)懷課件
評論
0/150
提交評論