偏最小二乘法matlab編程_第1頁
偏最小二乘法matlab編程_第2頁
偏最小二乘法matlab編程_第3頁
偏最小二乘法matlab編程_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、一、起源與發展偏最小二乘法(partialleastsquaresmethodPLS)是一種新型的多元統計數據分析方法,它于 1983 年由伍德(S.Wold)和阿巴諾(C.Albano)等人首次提出。其實在早在 70 年代伍德(S.Wold)的父親 HWold 便在經濟學研究中引入了偏最小二乘法進行路徑分析, 創建了非線性迭代偏最小二乘算法(NonlinearIterativePartialLeastSquaresalgorithmNIPALS),至今仍然是 PLS 中最常用和核心的算法。PLS 在 20 世紀 90 年代引入中國,在經濟學、機械控制技術、藥物設計及計量化學等方面有所應用,但

2、是在生物醫學上偏最小二乘法涉及相對較少。對該方法的各種算法和在實際應用中的介紹也不系統,國內已有學者在這方面做了一些努力,但作為一種新興的多元統計方法,還不為人所熟知。PLS 是一種數學優化技術, 它通過最小化誤差的平方和找到一組數據的最佳函數匹配。用最簡的方法求得一些絕對不可知的真值,而令誤差平方之和為最小。通常用于曲線擬合。有人用下式來形容 PLS:偏最小二乘回歸 Q 多元線性回歸分析+典型相關分析+主成分分析二、特點:與傳統多元線性回歸模型相比,偏最小二乘回歸的特點是:(1)能夠在自變量存在嚴重多重相關性的條件下進行回歸建模;(2)允許在樣本點個數少于變量個數的條件下進行回歸建模;(3)

3、偏最小二乘回歸在最終模型中將包含原有的所有自變量;(4)偏最小二乘回歸模型更易于辨識系統信息與噪聲(甚至一些非隨機性的噪聲);(5)在偏最小二乘回歸模型中,每一個自變量的回歸系數將更容易解釋。偏最小二乘法的 Matlab 源碼(2008-09-2109:31:21)所謂偏最小二乘法,就是指在做基于最小二乘法的線性回歸分析之前,對數據集進行主成分分析降維,下面的源碼是沒有刪減的http:/ 校正集光譜矩陣,nxk 的矩陣,n 個樣本,k 個波長%Y 校正集濃度矩陣,nXm 的矩陣,n 個樣本,m 個組分%x 驗證集光譜矩陣%y 驗證集濃度矩陣%pX 的主成分的個數,最佳取值需由其它方法確定%qY

4、 的主成分的個數,最佳取值需由其它方法確定%輸出參數列表%y5x 對應的預測值(y 為真實值)%e1 預測絕對誤差,定義為 e1=y5-y%e2 預測相對誤差,定義為 e2=|(y5-y)/y|%第一步:對 X,x,Y,y 進行歸一化處理n,k=size(X);m=size(Y2);Xx=X;x;Yy=Y;y;xmin=zeros(1,k);xmax=zeros(1,k);forj=1:kxmin(j)=min(Xx(:,j);xmax(j)=max(Xx(:,j);Xx(:,j)=(Xx(:,j)-xmin(j)/(xmax(j)-xmin(j);endymin=zeros(1,m);yma

5、x=zeros(1,m);forj=1:mymin(j)=min(Yy(:,j);ymax(j)=max(Yy(:,j);Yy(:,j)=(Yy(:,j)-ymin(j)/(ymax(j)-ymin(j);endX1=Xx(1:n,:);x1=Xx(n+1):end,:);Y1=Yy(1:n,:);y1=Yy(n+1):end,:);%第二步:分別提取 X1 和 Y1 的 p 和 q 個主成分,并將 X1,x1,Y1,y1 映射到主成分空間CX,SX,LX=princomp(X1);CY,SY,LY=princomp(Y1);CX=CX(:,1:p);CY=CY(:,1:q);X2=X1*CX

6、;Y2=Y1*CY;x2=x1*CX;y2=y1*CY;%第三步:對 X2 和 Y2 進行線性回歸B=regress(Y2,X2,0.05);%第三個輸入參數是顯著水平,可以調整%第四步:將 x2 帶入模型得到預測值 y3y3=x2*B;%第五步:將 y3 進行“反主成分變換”得到 y4y4=y3*pinv(CY);%第六步:將 y4 反歸一化得到 y5forj=1:my5(:,j)=(ymax(j)-ymin(j)*y4(:,j)+ymin(j);end%第七步:計算誤差e1=y5-y;e2=abs(y5-y)./y);functionMD,ERROR,PRESS,SECV;SEC=Extr

7、aSim1(X,Y)%基于 PLS 方法的進一步仿真分析%功能一:計算 MD 值,以便于發現奇異樣本%功能二:計算各種 p 取值情況下的 ERROR,PRESS,SECSEC 值,以確定最佳輸入變量個數n,k=size(X);m=size(Y2);pmax=n-1;q=m;ERROR=zeros(1,pmax);PRESS=zeros(1,pmax);SECV=zeros(1,pmax);SEC=zeros(1,pmax);XX=X;YY=Y;N=size(XX,1);forp=1:pmaxdisp(p);Err1=zeros(1,N);%絕對誤差Err2=zeros(1,N);附目對誤差fo

8、ri=1:Ndisp(i);ifi=1x=XX(1,:);y=YY(1,:);X=XX(2:N,:);Y=YY(2:N,:);elseifi=Nx=XX(N,:);y=YY(N,:);X=XX(1:(N-1),:);Y=YY(1:(N-1),:);elsex=XX(i,:);y=YY(i,:);X=XX(1:(i-1),:);XX(i+1):N,:);Y=YY(1:(i-1),:);YY(i+1):N,:);endy5,e1,e2=PLS(X,Y,x,y,p,q);Err1(i)=e1;Err2(i)=e2;endERROR(p)=sum(Err2)/N;PRESS(p)=sum(Err1A2);SECV(p)=sqrt(PRESS(p

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論