基于特征臉和BP神經網絡的人臉識別_第1頁
基于特征臉和BP神經網絡的人臉識別_第2頁
基于特征臉和BP神經網絡的人臉識別_第3頁
基于特征臉和BP神經網絡的人臉識別_第4頁
基于特征臉和BP神經網絡的人臉識別_第5頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、基于特征臉和BP神經網絡的人臉識別摘要: 利用類間的散布矩陣, 尋找特征臉子空間, 讓每一類在子空間中散布得更開; 然后結合BP 神經網絡學習能力強、分類能力強的優(yōu)點, 利用它實現(xiàn)分類器。具體是將所有的樣本投影到特征臉子空間中, 并將每一個樣本得到的特征系數(shù)作為BP 神經網絡的輸入。實驗證明, 這種方法是有效的。關鍵詞: 圖像預處理; 人臉識別; 人臉檢測; BP神經網絡近十年來, 在計算機視覺和模式識別領域中人臉自動識別系統(tǒng)研究變得非常活躍。總的來說, 它可以分成兩部分: 人臉檢測。它指判斷在一幅圖像中是否有人臉; 如果有, 定位每張人臉具體位置。人臉識別。它是指根據(jù)數(shù)據(jù)庫中已有的人臉樣本確

2、認或驗證在一場景中每一張人臉的身份。但是影響人臉識別性能的因素很多, 表現(xiàn)在人臉是非剛體, 存在表情、姿態(tài)的變化, 隨著年齡也會變化; 其次是受到光照、附屬物和成像質量的影響。根據(jù)R.Bmnelli 和T.Poggio 人臉識別技術主要分成兩大類, 即基于幾何特征的人臉識別和基于模板匹配的人臉識別方法1 。早期的研究工作主要集中在基于幾何特征的方法上2 , 但是這類方法人為地指定特征, 丟失了大量判別信息,所以識別率不高。目前在模板的整體匹配方法上做了大量的工作, 最具有代表意義的是基于特征臉的方法3 5 。它從整體上提取人臉的代數(shù)特征進行識別, 推動了人臉識別技術的發(fā)展。就是利用特征臉方法,

3、 提取人臉特征, 然后將提取出來的特征輸入到BP 神經網絡進行訓練, 得到人臉的類間判別信息, 然后進行人臉識別。證明了這種識別方法的實質是最大后驗概率判別分類。基于ORL 人臉數(shù)據(jù)庫的實驗, 說明這種基于概率統(tǒng)計的方法比最近鄰判別分類的識別結果要好。1 基于特征臉和BP 神經網絡的人臉識別方法1. 1 預處理在訓練和識別以前,我們都對圖像進行歸一化預處理。由于幾何位置的歸一化和人臉及組成部分的精確定位有關,目前仍然是一個解決得不好的問題。文獻6, 7 在對姿態(tài)提供了一種新穎的解決辦法, 但卻需要大量的樣本。本文避開這個問題, 在所有圖像大小歸一化時, 主要是對圖像光照的歸一化處理。為了消除面

4、部光照對識別的影響, 我們讓每一幅圖灰度值的均值和方差都相等。從物理意義上說, 就是讓每一幅圖的直流能量和交流能量都相等。基于這種思想, 假設期望的均值和方差分別為mc , c , 那么對高為h, 寬為w 的灰度圖I( i, j) 均值為mean, 方差為delta, 其中I( i, j) 0, 1 。這樣由式( 3) , 將樣本集和測試中的人臉圖像灰度全部歸一化圖J( i, j) 。實驗中, 取mc =0.5, c =0.25。1. 2 特征臉分析這種方法是根據(jù)圖像的統(tǒng)計特征進行正交變換( K-L 變換) 3 , 以去除樣本間的相關性, 然后根據(jù)特征值的大小選擇特征向量( 主分量) , 由于

5、這些特征向量的圖像類似人臉, 所以稱為特征臉4, 5 。下面就這種方法作簡要介紹。XRN 為表示一幅圖像的隨機向量, 這里N是圖像的大小, X 由圖像的行或列連接而成的向量。假設有p 個人, 每個人有r1 ( 1iP) 個人臉樣本圖像, 樣本集為 Xji , Xji表示第j個人的第i個樣本。那么每個人樣本均值向量為mi ( 1 ip) ; 總體樣本均值向量為m; 類間散布矩陣為Sb 是N×N的大矩陣, 一般由奇異值分解定理 8 得到其特征向量矩陣U 及樣本集的特征系數(shù)向量矩陣C。其中U 的秩總是小于p 的, 它的每一列就是一特征臉( 向量) ,一般有p - 1個。每一張人臉都可以投影

6、到這p - 1個特征臉張成的子空間中, 得到一個特征系數(shù)向量, C 就是樣本在子空間中投影得到的系數(shù), 每一列ci 就代表mi 在特征臉空間投影的特征系數(shù)向量, 它有p - 1 行, 即投影得到的p - 1 特征系數(shù)。如圖1是本文實驗一張人臉的具體展開, 第一項為平均臉, 其他是按特征值大小排序的特征臉, 常稱為主元。在最近鄰識別中, 將輸入的人臉圖像連接成一維向量, 向特征臉張成的子空間投影, 然后在子空間中, 如果與ci 的距離最近, 就判別為第i 類。1. 3 神經網絡實現(xiàn)分類器基于BP算法的前向多層神經網絡以其算法、概念及基本理論都很簡單, 但有很強的學習能力, 已經在實際問題中有了大

7、量成功的應用 10 , 簡稱其為BP 神經網絡。本文用最小均方誤差小于0.0001的學習, 這樣神經網絡學習的實質就是進行后驗概率估計; 分類時實質就是采用最大后驗概率分類方法10, 12 。下面簡要對它們的關系作推導。神經網絡實現(xiàn)的映射F: Rd RM, 這樣期望最小均方誤差E y - F( x) 2 最小, 這里F( x) = E( y/x) , y 是期望的輸出yj =( 0, ,0, 1, 0, , 0) T, 如果x( 第j 類) 。F( x) = E( y/x) , 這樣對給定第j 類的輸入x, 對應的輸出為Fj( x) = E yj /x = 1 ×P( ( yj =

8、1) /x) + 0 ×P( ( y = 0) /x) =P( ( yj = 1 ) /x) = P( j /x)本文中, 神經網絡的輸入是特征臉分析得到的39 個特征,輸出是40 個人的每個人的后驗概率。訓練時, 如果是第j 個人, 讓輸出的向量的第j 元素為1, 其他全為0。換句話說, 讓第j 類的概率為1。分類識別時, 取最大的輸出作為結果, 即最大后驗概率作為輸出。此外, 由于Sigmoid 激勵函數(shù)在0 附近一個小的范圍內變化較快, 而兩端變化很小。所以很多學者在數(shù)據(jù)訓練前, 都要標準化到0 附近的一個小范圍內。但是這也帶來一個問題, 當個別輸入很大時, 會將大多數(shù)的輸入標

9、準化到一個很小的范圍內。在本文中, 由于光照的歸一化, 投影的特征系數(shù)都在0 附近, 只有個別系數(shù)偏離0 遠一些, 這樣利用Sigmoid 激勵函數(shù)正好抑制這些較大的輸入而保護較小的輸入。2 實驗及結果分析本文的實驗是在ORL 人臉數(shù)據(jù)庫上進行的, 有40 人, 每人有10 張人臉樣本。實驗中, 每人隨機選擇五張圖片作為樣本集, 剩下的作為測試集, 然后交叉實驗, 讓第一次的測試集作為樣本集, 第一次的樣本集用來測試。特征臉識別用最近鄰判別方法, 為了較客觀的反映它的識別率, 選擇了四種常用的相似性度量方式 9 。對于識別率本文采取人臉識別中常用的累積識別率的辦法。由于神經網絡結構的不同, 會

10、帶來識別率較大的差別; 并且由于網絡權值初始化的隨機性, 每一次的結果不會完全一樣。所以統(tǒng)計了幾種不同隱層神經元數(shù)目的平均識別率。在實驗中, 發(fā)現(xiàn)多于三層的網絡結構無益于識別率的提高, 所以采用常見的三層結構,39個輸入層, 40個輸出層。而隱層的數(shù)目不能少于20個, 當少于20個時, 識別率將會變得很差; 當多于100個時, 識別率增加不明顯, 有時反而會下降。從表1, 表2 可以看到, 在最近鄰識別的幾種方法中, 馬氏距離取得了較好的效果。BP網絡的隱層神經元數(shù)目在一個較大的范圍內, 都取得了令人滿意的識別率, 比最近鄰的識別率要好。當隱層神經元數(shù)目是樣本的一半左右時, 取得了更高的識別率

11、。在交叉實驗的比較中, 發(fā)現(xiàn)第二組的識別率明顯好于第一組, 這是因為人臉識別問題可以看作回歸問題, 而回歸問題中, 樣本顯得特別重要, 樣本只是一定程度上反映問題的真實模型, 好的樣本能較好地逼近真實模型。在實際問題中, 當樣本沒有選擇余地時, 就會出現(xiàn)偏差和方差兩難問題 10 12 。表1 識別率比較表2 樣本集和測試集交換后識別率比較3 結論人臉識別是一個困難的研究課題, 目前還處于探索階段。本文利用特征臉的方法提取特征, 利用BP 神經網絡學習能力強、分類能力強的優(yōu)點, 實現(xiàn)分類器。為了與經典的最近鄰分類器更好地比較, 選擇了四種相似度測量方法。用神經網絡實現(xiàn)分類器時, 較多地研究了網絡

12、結構的構造。實驗結果表明,如果網絡的結構合理, 識別率比最近鄰分類器有較大的提高。參考文獻:1 Bmnelli, T Poggio. Face Recognition: Features vs Templates J .IEEE Transactions on Pattern Analysis and Machine Intelligence,1993 , 15 ( 10) : 1042- 1052.2 Bledsoe W W. The Model Method in Facial Recognition R . Tech.Rep. PRI: 15, Panoramic Research Inc. , Palo Alto, CA. 1964.3 M Kirby, L Sirovich. Application of the Karhunen-Loeve Procedure for the Characterization of Human Faces J . IEEE Trans. Pattern Analysis and Machine Intelligence, 1990, 12 ( 1) : 103- 108.4 Turk M, Pentland A. Eigenfaces for Recognition J . Cogn. Neuros

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論