




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、目錄1 緒論11.1 課題背景11.1.1 課題來源11.1.2 人臉識(shí)別技術(shù)11.1.3 人臉識(shí)別技術(shù)的研究意義21.2 人臉識(shí)別發(fā)展歷史與概況31.3 人臉識(shí)別的難點(diǎn)42 人臉識(shí)別的相關(guān)理論12.1 人臉特征12.1.1 膚色特征12.1.2 灰度特征12.2 PCA的基本概念12.2.1 PCA算法的原理22.2.2 PCA算法33 人臉識(shí)別算法設(shè)計(jì)13.1 人臉檢測(cè)與定位13.2 基于PCA的人臉特征提取23.3 人臉識(shí)別方法33.3.1 幾何特征法33.3.2 特征臉法43.3.3 彈性圖匹配法53.3.4 神經(jīng)網(wǎng)絡(luò)法64 基于PCA的人臉識(shí)別系統(tǒng)設(shè)計(jì)14.1 引言14.2 具體算法
2、14.3 ORL人臉庫實(shí)驗(yàn)分析24.3.1實(shí)驗(yàn)1:算法的比較34.3.2 實(shí)驗(yàn)2:樣本數(shù)目的選擇44.3.3 實(shí)驗(yàn)3:采樣因子的確定44.4 YALE人臉庫實(shí)驗(yàn)55 小結(jié)15.1 總結(jié)15.2 展望1致謝語1參考文獻(xiàn)1附件1摘要:人臉識(shí)別技術(shù)是一種新型的身份識(shí)別技術(shù),它是生物識(shí)別技術(shù)的一種,人臉識(shí)別技術(shù)也是一個(gè)非常活躍的研究領(lǐng)域,它覆蓋了數(shù)字圖像處理等諸多領(lǐng)域。隨著人們應(yīng)用需求的不斷深入,人臉識(shí)別技術(shù)將呈現(xiàn)出主流化、芯片化、標(biāo)準(zhǔn)化發(fā)展趨勢(shì)。人臉識(shí)別系統(tǒng)主要由檢測(cè)與定位、特征提取與識(shí)別兩部分組成,在這兩部分的基礎(chǔ)上還包括預(yù)處理等步驟,對(duì)于一個(gè)全自動(dòng)的人臉識(shí)別系統(tǒng),整個(gè)的識(shí)別過程可歸納為人臉檢測(cè)與
3、定位、特征提取和識(shí)別。實(shí)現(xiàn)流程如下:首先是預(yù)處理,對(duì)圖像進(jìn)行光照處理等以改善圖像質(zhì)量;檢測(cè)與定位,從不同場(chǎng)景中檢測(cè)出人臉并將其從背景中分割出來;對(duì)人臉庫中所有圖像大小和各器官位置歸一化;最后對(duì)歸一化的人臉圖像進(jìn)行特征提取與識(shí)別。由于動(dòng)態(tài)識(shí)別研究處于起步階段,該技術(shù)相對(duì)較欠缺,因此本文只研究基于靜態(tài)人臉圖像的識(shí)別方法。關(guān)鍵詞:人臉識(shí)別;數(shù)字圖像處理;檢測(cè)方法Abstract: Face recognition technology is a new identity, it is a kind of biometric technology, face recognition technolog
4、y is also a very active research area, which covers digital image processing and many other fields. With the deepening of people's application requirements, the face recognition technology will appear in the mainstream, chip, standardization, development trends. Face recognition system mainly by
5、 the detection and location, feature extraction and recognition of two parts, including the pretreatment steps in these two parts on the basis of a fully automatic face recognition system, the whole recognition process can be summarized as the human face detection and location, feature extraction an
6、d recognition. The process is as follows: First, pretreatment, light processing to improve image quality; detection and location on the image to detect a person's face from different scenes and split out from the background; face database image size and each organ location normalization; Finally
7、, the normalized face image feature extraction and recognition. Dynamic discrimination in its infancy, the technology is relatively lacking This article only study identification method based on the static face images. Keywords: face recognition; digital image processing; detection method1 緒論1.1 課題背
8、景1.1.1 課題來源隨著安全入口控制和金融貿(mào)易方面應(yīng)用需要的快速增長,生物統(tǒng)計(jì)識(shí)別技術(shù)得到了新的重視。目前,微電子和視覺系統(tǒng)方面取得的新進(jìn)展,使該領(lǐng)域中高性能自動(dòng)識(shí)別技術(shù)的實(shí)現(xiàn)代價(jià)降低到了可以接受的程度。而人臉識(shí)別是所有的生物識(shí)別方法中應(yīng)用最廣泛的技術(shù)之一,人臉識(shí)別技術(shù)是一項(xiàng)近年來興起的一種新型的身份識(shí)別技術(shù),它是生物識(shí)別技術(shù)的一種。隨著人們應(yīng)用需求的不斷深入,人臉識(shí)別技術(shù)將呈現(xiàn)出主流化、芯片化、標(biāo)準(zhǔn)化發(fā)展趨勢(shì)。近年來受到了各國研究人員的普遍關(guān)注,主要用于安全保密等領(lǐng)域。人們更多的是在電影中看到這種技術(shù)的神奇應(yīng)用:警察將偷拍到的嫌疑犯的臉部照片,輸入到電腦中,與警方數(shù)據(jù)庫中的資料進(jìn)行比對(duì),并
9、找出該嫌犯的詳細(xì)資料和犯罪記錄。這并非虛構(gòu)的情節(jié)。在國外,人臉識(shí)別技術(shù)早已被大量使用在國家重要部門以及軍警等安防部門。在國內(nèi),對(duì)于人臉識(shí)別技術(shù)的研究始于上世紀(jì)90年代,目前主要應(yīng)用在公安、金 融、網(wǎng)絡(luò)安全、物業(yè)管理以及考勤等領(lǐng)域。人臉識(shí)別按照信息來源可分為兩類:基于靜態(tài)人臉圖像的識(shí)別和基于動(dòng)態(tài)信息的識(shí)別。由于動(dòng)態(tài)識(shí)別研究處于起步階段,該技術(shù)相對(duì)較欠缺,因此本文只研究基于靜態(tài)人臉圖像的識(shí)別方法。1.1.2 人臉識(shí)別技術(shù)所謂人臉識(shí)別,是指對(duì)輸入的人臉圖像或者視頻,判斷其中是否存在人臉,如果存在人臉,則進(jìn)一步給出每張人臉的位置、大小和各個(gè)面部主要器官的位置信息,并且依據(jù)這些信息,進(jìn)一步提取每張人臉蘊(yùn)
10、含的身份特征,并將其與已知人臉庫中的人臉進(jìn)行對(duì)比,從而識(shí)別每張人臉的身份。其研究內(nèi)容包括以下五個(gè)方面:(1)人臉檢測(cè) 從不同的背景中檢測(cè)是否存在人臉,并確定其位置、大小、形狀、姿態(tài)等信息的過程。它關(guān)系到后續(xù)識(shí)別工作能否正確進(jìn)行,并保障最終識(shí)別結(jié)果的可靠性。(2)人臉表征 確定表示檢測(cè)出的人臉和數(shù)據(jù)庫中的已知人臉的描述方式。通常的表示方式包括幾何特征(如歐氏距離、曲率、角度等)、代數(shù)特征(如矩陣的特征矢量)和固定特征模板等。(3)人臉鑒別 即狹義的人臉識(shí)別,就是通常所指的將待識(shí)別的人臉與數(shù)據(jù)庫中的已知人臉進(jìn)行比較,得出相關(guān)信息。這一過程的核心是選擇適當(dāng)?shù)娜四槺硎痉绞胶推ヅ洳呗裕到y(tǒng)地構(gòu)造與人臉的
11、表征方式密切相關(guān)。(4)表情/姿態(tài)分析 即對(duì)待識(shí)別人臉的表情或姿態(tài)進(jìn)行分析,并對(duì)其加以歸類。(5)生理分類 對(duì)待識(shí)別人臉的物理特征進(jìn)行分類,得出其年齡、性別、種族等相關(guān)信息,或從幾幅相關(guān)的圖像中推導(dǎo)出希望得到的人臉圖像,如從父母的臉推導(dǎo)出孩子的臉像等。本論文中的人臉識(shí)別主要是指狹義的人臉識(shí)別,指將待識(shí)別的人臉與數(shù)據(jù)庫中的已知人臉之間進(jìn)行匹配的人臉鑒別。人臉識(shí)別的目的是讓計(jì)算機(jī)具有通過人臉的特征來鑒別身份的功能。基于人臉特征的身份識(shí)別主要設(shè)計(jì)到復(fù)雜場(chǎng)景中的人臉檢測(cè)及識(shí)別技術(shù),是一種依托于圖像理解、模式識(shí)別及計(jì)算機(jī)視覺、統(tǒng)計(jì)學(xué)和人工智能等高技術(shù)的研究方向。1.1.3 人臉識(shí)別技術(shù)的研究意義(1)富
12、有挑戰(zhàn)性的課題人臉識(shí)別是機(jī)器視覺和模式識(shí)別領(lǐng)域最富有挑戰(zhàn)性的課題之一,同時(shí)也具有較為廣泛的應(yīng)用意義。人臉識(shí)別技術(shù)是一個(gè)非常活躍的研究領(lǐng)域,它覆蓋了數(shù)字圖像處理、模式識(shí)別、計(jì)算機(jī)視覺、神經(jīng)網(wǎng)絡(luò)、心理學(xué)、生理學(xué)、數(shù)學(xué)等諸多學(xué)科的內(nèi)容。如今,雖然在這方面的研究已取得了一些可喜的成果,但是FRT在實(shí)用應(yīng)用中仍面臨著很嚴(yán)峻的問題,因?yàn)槿四樜骞俚姆植际欠浅O嗨频模胰四槺旧碛质且粋€(gè)柔性物體,表情、姿態(tài)或發(fā)型、化妝的千變?nèi)f化都給正確識(shí)別帶來了相當(dāng)大的麻煩。如何能正確識(shí)別大量的人并滿足實(shí)時(shí)性要求是迫切需要解決的問題。 (2)面部感知系統(tǒng)的重要內(nèi)容 基于視覺通道信息的面部感知系統(tǒng),包括人臉檢測(cè)和跟蹤、面部特征
13、定位、面部識(shí)別、人臉歸類(年齡、種族、性別等的判別)、表情識(shí)別、唇讀等分系統(tǒng),如圖1所式,可以看出,繼人臉檢測(cè)和跟追之后,面部特征定位通常是面部感知的一個(gè)必備環(huán)節(jié),是后續(xù)工作的基礎(chǔ),具有重要的意義。盡管人臉識(shí)別不能說是其他面部感知模塊的必備功能,但是,可以肯定的是,利用已知的身份信息,結(jié)合特定人的先驗(yàn)知識(shí),可以提高表情分析、唇讀和語音識(shí)別、手勢(shì)識(shí)別乃至手寫體識(shí)別的可靠性。而計(jì)算機(jī)對(duì)使用者身份確認(rèn)的最直接的應(yīng)用就是基于特定使用者的環(huán)境設(shè)置:如使用者的個(gè)性化工作環(huán)境,信息的共享和隱私保護(hù)等等。(3)實(shí)際應(yīng)用廣泛人臉識(shí)別研究已經(jīng)有40多年的歷史,作為生物識(shí)別的一種,廣泛應(yīng)用在身份識(shí)別、海關(guān)監(jiān)控等領(lǐng)域
14、。目前,人臉識(shí)別技術(shù)也逐漸走向了商用,如Eyematic公司研發(fā)的人臉識(shí)別系統(tǒng)等。目前研究較多的是靜態(tài)人臉識(shí)別技術(shù),計(jì)算機(jī)靜態(tài)人臉識(shí)別是一個(gè)經(jīng)典的模式識(shí)別問題。人臉識(shí)別的傳統(tǒng)方法主要分為:整體匹配方法,其中最具代表性的是主元分析法,其他混合型的算法。這些人臉識(shí)別系統(tǒng)多數(shù)都要依賴于面部特征(比如眼睛中心位置)的嚴(yán)格特征匹配來歸一化人臉以便提取人臉描述特征。靜態(tài)人臉識(shí)別系統(tǒng)主要由檢測(cè)與定位、特征提取與識(shí)別兩部分組成,在這兩部分的基礎(chǔ)上海包括預(yù)處理等步驟。常用的人臉識(shí)別試驗(yàn)庫以美國軍方的FERET庫最為權(quán)威,它包括多人種、多年齡段、各種表情變化、光照變化、姿態(tài)變化的圖象,圖像的數(shù)量和實(shí)驗(yàn)的人數(shù)也非常
15、多,可以充分地驗(yàn)證人臉識(shí)別算法。目前尚沒有專門測(cè)試人臉檢測(cè)和定位算法的圖像庫。視頻輸入人臉檢測(cè)和跟蹤面部特征定位人臉識(shí)別表情分析性別判斷種族判斷年齡判別唇 讀身份信息情感狀態(tài)性別信息種族信息年齡信息唇形類別圖1.1 面部感知系統(tǒng)結(jié)構(gòu)圖11.2 人臉識(shí)別發(fā)展歷史與概況20世紀(jì)60年代末至70年代初,人臉識(shí)研究剛剛起步。最早的研究者是 Bledsoe,他建立了一個(gè)半自動(dòng)的人臉識(shí)別系統(tǒng),主要是以人臉特征點(diǎn)的間距、比率等參數(shù)為特征。 20世紀(jì)90年代以來,對(duì)著計(jì)算機(jī)軟硬件性能的迅速提高,以及對(duì)人臉識(shí)別能力的高要求,是發(fā)展更具魯棒性2的人臉識(shí)別方法稱為時(shí)代的必然。于是基于整體的識(shí)別方法營運(yùn)而生,并且很快
16、成了研究的重點(diǎn),如特征臉方法和彈性圖匹配方法。90年代中期以來,人臉識(shí)別方法想著整體識(shí)別和部件分析相結(jié)合的趨勢(shì)發(fā)展。研究人員開始逐漸認(rèn)識(shí)到人臉識(shí)別算法必須能充分地利用人臉的各種特征信息,融合人臉的形狀拓?fù)浣Y(jié)構(gòu)特征、局部灰度特征和全局灰度分布特征等多種特征。因此,出現(xiàn)了很多新的算法,這些算法是將原先單一的算法結(jié)合起來,共同完成人臉的識(shí)別。灰度和形狀分離的可變形模型方法就是其中之一。90年代后期,一些商業(yè)性的人臉識(shí)別系統(tǒng)開始逐漸進(jìn)入市場(chǎng),人臉識(shí)別技術(shù)成為當(dāng)今國際安全防范最重要的手段之一。但是,這些技術(shù)和系統(tǒng)離實(shí)用化還有一定的距離,性能和準(zhǔn)確率有待提高。2000年前后至今,人臉識(shí)別方法的性能雖然有了
17、一定的提高,但仍與人們的要求還有一定的差距,現(xiàn)有方法對(duì)光照、年齡、表情、姿態(tài)、距離等條件的變化比較敏感,當(dāng)某些條件發(fā)生變化時(shí),識(shí)別效果很不理想。目前,人臉識(shí)別技術(shù)仍只能用于某些對(duì)識(shí)別準(zhǔn)確率要求不高的場(chǎng)合。1.3 人臉識(shí)別的難點(diǎn)目前人臉識(shí)別的難點(diǎn)主要存在于以下幾個(gè)方面:(1)光照變化是影響人臉識(shí)別性能的最關(guān)鍵因素,對(duì)該問題的解決程度關(guān)系著人臉識(shí)別實(shí)用化進(jìn)程的成敗,在人臉圖像預(yù)處理或者歸一化階段,盡可能地補(bǔ)償乃至消除其對(duì)識(shí)別性能的影響。(2)成像角度及成像距離等因素的影響,即人臉的姿態(tài)的變化,會(huì)垂直于圖像平面的兩個(gè)方向的深度旋轉(zhuǎn),會(huì)造成面部信息的部分缺失。(3)不同年齡的人臉有著較大的差別。身份證
18、是以前照的,在逃犯的照片也是以前的,因此在公安部門的實(shí)際應(yīng)用中,年齡問題是一個(gè)最突出的問題。(4)采集圖像的設(shè)備較多,主要有掃描儀、數(shù)碼相機(jī)、攝像機(jī)等。由于成像的機(jī)理不同,形成了同類人臉圖像的識(shí)別率較高,而不同類間人臉圖像識(shí)別率較低的情況。隨著人臉識(shí)別技術(shù)的發(fā)展,這一問題也將逐步得到解決。(5)人臉圖像的數(shù)據(jù)量巨大。目前由于計(jì)算量的考慮,人臉定位和識(shí)別算法研究大多使用尺寸很小的灰度圖像。一張64*64像素的256級(jí)灰度圖像就有4096個(gè)數(shù)據(jù),每個(gè)數(shù)據(jù)有256種可能的取值。定位和識(shí)別算法一般都很復(fù)雜,在人臉庫較大的情況下,計(jì)算量十分大,很多情況下速度令人難以忍受。而灰度數(shù)據(jù)事實(shí)上是喪失了色彩、運(yùn)
19、動(dòng)等有用信息的。如果使用全部的有用信息,計(jì)算量就更大了。2 人臉識(shí)別的相關(guān)理論特征提取是人臉識(shí)別中的核心步驟,直接影響識(shí)別精度。由于人臉是多維彈性體,易受表情、光照等因素影響,提取特征的困難較大。特征提取的任務(wù)就是針對(duì)這些干擾因素,提取出具有穩(wěn)定性、有效性的信息用于識(shí)別。2.1 人臉特征人臉特征3是識(shí)別的重要依據(jù)之一,檢測(cè)定位過程中也會(huì)用到人臉特征,其中膚色特征和灰度特征是兩類常用特征。2.1.1 膚色特征膚色特征由膚色模型描述,即用統(tǒng)計(jì)的方法對(duì)目標(biāo)對(duì)象的膚色建模。基于膚色特征的識(shí)別方法簡單且能夠快速定位人臉。人臉膚色不依賴于細(xì)節(jié)特征且和大多背景色相區(qū)別,但該方法對(duì)光照和圖像采集設(shè)備特性較敏感
20、。膚色在色彩空間中具有聚合性,而臉部色彩復(fù)雜,這給統(tǒng)一建模造成了一定難度。該方法通常作為其他統(tǒng)計(jì)模型的輔 助方法使用,適于粗定位或?qū)\(yùn)行時(shí)間有較高要求的應(yīng)用。2.1.2 灰度特征灰度特征包括輪廓特征、灰度分布特征( 直方圖特征、鑲嵌圖特征等 )、結(jié)構(gòu)特征、模板特征等。由于人臉五官位置相對(duì)固定,灰度分布呈一定規(guī)律性,因此 ,可利用灰度特征來進(jìn)行人臉識(shí)別。通常采用統(tǒng)計(jì)的方法或特征空間變換的方法進(jìn)行灰度特征的提取,如利用變換法4(是由卡爾胡寧(Karhumen)與勒夫(Loeve)分別提出的一種圖像變換方法)得到的特征臉,利用小波變換得到的小波特征等。2.2 PCA的基本概念主成分分析法(PCA)是
21、廣泛使用的特征提取方法之一,最早被Ttirk和Pentland提出。它的基本思想是首先將人臉矩陣轉(zhuǎn)化為一個(gè)向量,然后提取向量特征。PCA方法是模式識(shí)別領(lǐng)域一種有效的方法,在最近幾年也得到了一定發(fā)展。與傳統(tǒng)的pCA方法相比,2004年提出的ZDpCA方法是處理ZD矩陣更有效的方法之一,它不需要將圖像轉(zhuǎn)化為向量,而是直接利用原圖像矩陣來重建圖像協(xié)方差矩陣,與PCA方法的協(xié)方差矩陣相比,ZDPCA的圖像協(xié)方差矩陣的大小更小,如:假設(shè)一張圖像的大小為 128X128,ZDPCA協(xié)方差矩陣大小為128x128,因此,ZDPCA在計(jì)算方面有顯著的優(yōu)越性。最近許多研究表明ZDPcA方法在模式識(shí)別,特別是人臉
22、識(shí)別領(lǐng)域是非常流行的提出了基于子模式雙向二維主成分分析的人臉識(shí)別,該方法通過對(duì)原圖像進(jìn)行分塊處理,能有效地抽取原圖像的局特征,同時(shí),通過采用雙向2維主成分法對(duì)分與會(huì)得到的子圖像矩陣直接進(jìn)行特征抽取,避免了矩陣向量的轉(zhuǎn)化,能精確地計(jì)算協(xié)方差矩陣的特征向量,并能有效地降低特征維數(shù),該方法在姿態(tài)、表情和光照條件變化情況下,都具有較好的識(shí)別性能;文章l17提出了改進(jìn)的模塊ZDPcA人臉識(shí)別方法,該方法對(duì)每一類訓(xùn)練樣本中每個(gè)訓(xùn)練樣本的每一子塊求類內(nèi)適應(yīng)加權(quán)平均值,并用類內(nèi)自適應(yīng)加權(quán)平均值對(duì)訓(xùn)練樣本類內(nèi)的相應(yīng)子塊進(jìn)行規(guī)范化處理,然后由所有規(guī)范化后的子塊構(gòu)成總體離散度矩陣,從而得到最優(yōu)投影矩陣;由訓(xùn)練集的全
23、體子塊的加權(quán)平均值對(duì)訓(xùn)練樣本的子塊和測(cè)試樣本的子塊進(jìn)行規(guī)范化后投影到最優(yōu)投影矩陣,得到識(shí)別特征,該方法能更好地提取到反映圖像之間差異的局部特征,便于提高識(shí)別率;文章118提出了一種模塊化ZDPcA和csLDA相結(jié)合的人臉驗(yàn)證算法,該方法是從原始數(shù)據(jù)出發(fā),對(duì)二維數(shù)據(jù)進(jìn)行分塊后采用ZDPCA進(jìn)行特征抽取,能有效提取圖像的局部特征,得到替代原始圖像的低維的新模式,然后對(duì)新模式施行CSLDA(基于客戶相關(guān)子空間的線性判別分析方法),不僅考慮到類內(nèi)、類間的差異,彌補(bǔ)了PCA的缺陷;而且客戶相關(guān)子空間可以較好地描述不同個(gè)體人臉之間的差異性,比傳統(tǒng)的個(gè)體特征臉具有更好的判別能力。該方法能更好地描述人臉特征,
24、降低維數(shù),計(jì)算簡便。PCA方法需要將一個(gè)圖像矩陣轉(zhuǎn)化為一個(gè)高維的向量,由于協(xié)方差矩陣的維數(shù)高而訓(xùn)練樣本少,導(dǎo)致了計(jì)算的復(fù)雜性和難度增加。ZDPCA方法是直接利用二維圖像來計(jì)算其協(xié)方差矩陣,由于其協(xié)方差矩陣小且訓(xùn)練樣本相對(duì)足夠,ZDPCA方法計(jì)算其協(xié)方差的特征向量更準(zhǔn)確、速度會(huì)更快。盡管在文章里已經(jīng)表明ZDPCA方法比傳統(tǒng)的PCA方法有很多的優(yōu)勢(shì),但它也有不足之處:第一,它需要更多的系數(shù)來表示一幅圖像,提出了基于ZDPCA的雙邊投影,首先同時(shí)求出ZD矩陣的行、列方向的最優(yōu)投影子空間,然后將ZD人臉矩陣的行向量和列向量各自投射到兩個(gè)不同子空間,這種兩邊投影方法的最大優(yōu)點(diǎn)是用最少的系數(shù)表示一張人臉圖
25、像,從而達(dá)到最高的壓縮率;第二,筆者在文章已經(jīng)證明ZDPCA方法丟失了一些協(xié)方差信息,這些信息包含了一些對(duì)識(shí)別是很重要的人臉局部幾何結(jié)構(gòu)變化信息,但PCA方法卻能保留這些信息。如果ZDPCA方法能利用更多的協(xié)方差信息,則該方法的識(shí)別率能得到提高。因此,本章節(jié)對(duì)ZDPCA方法如何利用更多的協(xié)方差信息進(jìn)行研究。2.2.1 PCA算法的原理令為表示環(huán)境的維隨機(jī)變量。假設(shè)均值為零,即: 令w表示維單位向量,在其上投影。這個(gè)投影被定義為向量和w的內(nèi)積,表示為: 滿足約束 而主成分分析的目的就是尋找一個(gè)權(quán)值向量w使得表達(dá)式Ey2的值最大化: 根據(jù)線性代數(shù)的理論,可以知道滿足式子值最大化的w應(yīng)該滿足下式:
26、即使得上述式子最大化的w是矩陣Cx的最大特征值所對(duì)應(yīng)的特征向量。2.2.2 PCA算法 從本質(zhì)上來說,主成分分析法是一種線性映射算法,它的算法步驟如下: 設(shè)原始觀測(cè)數(shù)據(jù)樣本集合為一組(個(gè))零均值(如果不是的話,則先做去均值預(yù)處理,相當(dāng)于對(duì)全體向量作一次平移變換)的n維隨機(jī)向量:,以樣本集合的協(xié)方差矩陣(總體散度矩陣)為產(chǎn)生矩陣。即 或 其中為觀測(cè)樣本的均值向量,由于是零值向量,所以為零值向量。顯然,是一個(gè)對(duì)稱、半正定的n×n矩陣,對(duì)它進(jìn)行特征值分解得到: 其中U是正交矩陣,是的特征值,且,各特征值對(duì)應(yīng)的特征向量就是矩陣U的各列(從左到右),它是一組正交基。 作線性變換y =UTx,原
27、始的各觀測(cè)數(shù)據(jù)向量變換成一組特征向量,其協(xié)方差矩陣為: 新特征向量組的稱為第個(gè)主成分。 顯然,的第個(gè)特征值等于的方差,第個(gè)主成分的方差貢獻(xiàn)率為: 那么前m個(gè)主成分的累計(jì)方差貢獻(xiàn)率為: 當(dāng)前m個(gè)主成分的累計(jì)方差貢獻(xiàn)率足夠大時(shí),就可以只取前m個(gè)主成分作為新特征,而將其余的n-m個(gè)新的特征舍去,從而實(shí)現(xiàn)了觀測(cè)數(shù)據(jù)樣本集合的特征提取。此時(shí)重構(gòu)誤差的極小值為: 重構(gòu)誤差的極小值為:3 人臉識(shí)別算法設(shè)計(jì)當(dāng)人臉圖象的來源是一幅靜態(tài)圖象時(shí)進(jìn)行的人臉識(shí)別屬于靜態(tài)人臉識(shí)別。人臉識(shí)別算法包含2部分:人臉定位和歸一化(如圖2),對(duì)于一個(gè)全自動(dòng)的人臉識(shí)別系統(tǒng),整個(gè)的識(shí)別過程可歸納為人臉檢測(cè)與定位、特征提取和識(shí)別,(如圖
28、3)所示,這兩個(gè)環(huán)節(jié)獨(dú)立性很強(qiáng),而在許多特定情況下,人臉檢測(cè)與定位工作比較簡單,而“特征提取與識(shí)別”環(huán)節(jié)得到了更為廣泛和深入研究。圖3.1 人臉定位和歸一化3.1 人臉檢測(cè)與定位目前人臉檢測(cè)還是一個(gè)相當(dāng)困難的工作,其中所面臨的問題可以歸結(jié)如下:圖像中是否存在人臉:這是人臉檢測(cè)不同于其它有關(guān)人臉研究工作的地方,即如何判斷圖像中是否存在人臉,如何區(qū)別人臉和類似人臉的非人臉圖像。檢測(cè)不同表現(xiàn)形式的人臉:人臉可能以不同視角出現(xiàn)在圖像中,也可能被某些物體遮擋,造成某些用于檢測(cè)而需提取的人臉特征不可見。圖像中存在著噪聲:由于成像時(shí)亮度、對(duì)比度等因素的影響使圖像不清晰,人臉與背景區(qū)別不大,給檢測(cè)帶來一定的難
29、度。人臉自身的因素:由于人臉結(jié)構(gòu)復(fù)雜,某些局部特征具有隨機(jī)性(如眼鏡、胡須、發(fā)型等),而且還存在著不同表情的人臉,這些都給人臉檢測(cè)帶來難度。由此可見,人臉檢測(cè)是一個(gè)復(fù)雜而具有挑戰(zhàn)性的問題。任意給定一個(gè)圖像或者一組圖像序列,人臉檢測(cè)的目的就在于判定該圖像或圖像序列中是否存在人臉。如果存在,則返回其位置和空間分布,將所有人臉從背景圖象中分割出來,并確定每個(gè)人臉在圖象中的大小和位置,人臉檢測(cè)系統(tǒng)的輸入是可能包含人臉的圖象,輸出是關(guān)于圖象中是否存在人臉以及人臉的數(shù)目、位置、尺度等信息的參數(shù)化描述。根據(jù)這個(gè)定義可知,人臉檢測(cè)可分為兩類:第一類是在靜止圖像中判斷是否存在人臉,若存在,則定位人臉的位置;第二
30、類是在視頻圖像序列中判斷是否存在人臉,若存在,則動(dòng)態(tài)地跟蹤人臉。顯然,后一種所采用的人臉檢測(cè)方法要比前一種困難。人臉檢測(cè)的基本思想是用知識(shí)或統(tǒng)計(jì)的方法對(duì)人臉建模,比較所有可能的待檢測(cè)區(qū)域與人臉模型的匹配度,從而得到可能存在人臉的區(qū)域。3.2 基于PCA的人臉特征提取 通常由圖像直接獲得的數(shù)據(jù)量是很大的,為了有效地進(jìn)行分類識(shí)別,就要對(duì)原始數(shù)據(jù)進(jìn)行變換,得到最能反映分類本質(zhì)的特征,這就是特征的提取和選擇的過程。我們把原始數(shù)據(jù)組成的空間叫測(cè)量空間,把分類識(shí)別賴以進(jìn)行的空間叫特征空間。通過變換,可以把維數(shù)較高的測(cè)量空間中表示模式變?yōu)樵诰S數(shù)較低的特征空間的表示模式。在特征空間中的一個(gè)表示模式也叫做一個(gè)樣
31、本,它往往表示成一個(gè)向量,即特征空間中的一個(gè)點(diǎn)。人臉圖像可以看作是一個(gè)矢量(如圖4所示),如果圖像的高度和寬度分別為h和w,則對(duì)應(yīng)的矢量維數(shù)為w*h,人臉矢量屬于一個(gè)空間,稱為是圖像空間。圖3.2 人臉矢量示意圖7由于每個(gè)人臉都非常類似,在相同的位置都有兩只眼睛,一個(gè)嘴巴,一個(gè)鼻子等等,所以在圖像空間里所有的人臉矢量都聚集在一個(gè)狹窄的區(qū)域內(nèi)(如圖3.3所示),所以整個(gè)圖像空間不是人臉描述的一個(gè)優(yōu)化空間,PCA主元分析法的任務(wù)就是構(gòu)造一個(gè)能更好描述人臉的人臉空間,降低空間維數(shù),使新的人臉空間的基向量(又叫主元)能更好地描述典型的人臉模式。圖3.3 人臉空間示意圖8PCA主元分析法又稱Karhun
32、en-Loece(KL)變換,它的目的是降維,人臉空間是典型的高維空間,一個(gè)128*128像素的人臉若視為向量,就有16384維,運(yùn)算極不方便。若將人臉看作是平穩(wěn)的高斯過程,就可以利用KL變換提取主兀,達(dá)到降維的目的。KL變換是圖像壓縮的一種最優(yōu)化變換,高維的圖像空間經(jīng)過KL變換后得到一組新的正交基(主元),保留其中最重要的正交基,由這些正交基可以組成低維線性空間。如果假設(shè)人臉在這些低維線性空間的投影具有可分性,那么就可以把這些投影用作識(shí)別的特征向量。這就是PCA的主要思想。PCA最早是由統(tǒng)計(jì)學(xué)發(fā)展過來的,然后就被用在人工神經(jīng)網(wǎng)絡(luò)理論中,所以對(duì)PCA的理論描述可以從兩方面進(jìn)行,一種是從人工神經(jīng)
33、網(wǎng)絡(luò)理論這個(gè)角度來理解,這樣相對(duì)來講比較直觀。另一種就是從統(tǒng)計(jì)學(xué)角度來理解,這就比較嚴(yán)格,比較難懂,因?yàn)檫@是嚴(yán)格的按照數(shù)學(xué)的理論來推導(dǎo)出來的。3.3 人臉識(shí)別方法高水平的識(shí)別工作一般需要復(fù)雜的處理過程,如將圖象映射到表面,恢復(fù)為三維模型,進(jìn)行模型匹配等,但基于二維的圖象處理也可進(jìn)行人臉識(shí)別,下面介紹常用的幾種方法。3.3.1 幾何特征法許多人也將幾何特征法用于人臉識(shí)別中。例如:常用的幾何特征有人臉的五官如眼睛、鼻子、嘴巴等的局部形狀特征,臉型特征以及五官在臉上分布的幾何特征。提取特征時(shí)往往通過人臉面部拓?fù)浣Y(jié)構(gòu)幾何關(guān)系的先驗(yàn)知識(shí)。在這種基于幾何特征的識(shí)別中,識(shí)別總歸為特征矢量之間的匹配,基于歐式
34、距離的判決是最常用的識(shí)別方法。人臉由眼睛、鼻子、嘴巴、下巴等部件構(gòu)成,正因?yàn)檫@些部件的形狀、大小和結(jié)構(gòu)上的各種差異才使得世界上每個(gè)人臉千差萬別,因此對(duì)這些部件的形狀和結(jié)構(gòu)關(guān)系的幾何描述,可以作為人臉識(shí)別的重要特征。采用幾何特征進(jìn)行正面人臉識(shí)別 一般是通過提取人眼、口、鼻等重要特征點(diǎn)的位置和眼睛等重要器官的幾何形狀作為分類特征。基于幾何特征的識(shí)別方法具有存儲(chǔ)量小、對(duì)光照不敏感、簡單且容易理解等優(yōu)點(diǎn)。這種方法同樣存在一些問題: 從圖像中抽取穩(wěn)定的特征比較困難;對(duì)強(qiáng)烈表情變化和姿態(tài)變化魯棒性較差;造成部分信息丟失,適合于粗分類。可變形模板方法可以視為幾何特征方法的一種改進(jìn),它是一種經(jīng)典的模式識(shí)別方法
35、,這種方法大多是用歸一化互相關(guān),直接計(jì)算兩幅圖象之間的匹配程度。最簡單的人臉模板是將人臉看成一個(gè)橢圓,檢測(cè)人臉也就是檢測(cè)圖像中的橢圓。另一種辦法是將人臉用一組獨(dú)立的小模板表示,如眼睛模板、嘴巴模板、鼻子模板、眉毛模板和下巴模板等。而這些模板的獲得必須利用各個(gè)特征的輪廓,而傳統(tǒng)的基于邊緣提取的方法很難獲得較高的連續(xù)邊緣。即使獲得了可靠度高的邊緣,也很難從中自動(dòng)提取所需的特征量。為此,用彈性模板方法提取特征顯示出其獨(dú)到的優(yōu)越性。彈性模板有一組根據(jù)特征形狀的先驗(yàn)知識(shí)設(shè)計(jì)的可調(diào)參數(shù)所定義。為了求出這組參數(shù),需要利用圖像的邊緣、峰值、谷值和強(qiáng)度信息及特征形狀的先驗(yàn)知識(shí)設(shè)計(jì)合適的能量函數(shù)。參數(shù)向能量減小方
36、向調(diào)整,當(dāng)能量達(dá)到最小時(shí),這組參數(shù)對(duì)應(yīng)的模板形狀最符合特征形狀。其基本思想是:設(shè)計(jì)一個(gè)參數(shù)可調(diào)的器官模型(即可變形模板,如圖6所示),定義一個(gè)能量函數(shù),通過調(diào)整模型參數(shù)使能量函數(shù)最小化,此時(shí)的模型參數(shù)即作為該器官的幾何特征。圖3.4 可變形模板方法的眼模型93.3.2 特征臉法這種方法的原理是PCA(Principal Component Analysis 主分量分析法)PCA用于特征選擇和降低圖象維數(shù)的一種通用方法,因此可以用K-L變換獲取其正交K-L基底,對(duì)應(yīng)其中較大特征值的基底具有與人臉相似的形狀,因此,又稱之為特征臉,得到人臉重要特征之后,要對(duì)其進(jìn)行主成份分析(PCA),其具體的算法思
37、想如下: 若抽樣參加訓(xùn)練的人臉圖像有M張,每張圖像的維數(shù)是N*N,則可以分別表示為:x1、x2、x3、x M ,那么平均臉可以表示為:F=1/Mxi (i=1、2M) (3.1)每張人臉和平均人臉的距離可以表示為:di=xi-F (3.2)假設(shè)矩陣A=d1,d2,d2,d M,特征臉需要做的就是找出矩陣 AAT的前Z個(gè)較大特征值的特征向量,但AAT是一個(gè)N2*N2維的大矩陣,求這樣一個(gè)矩陣的特征值計(jì)算量是非常大的。為此我們可以先求出 AAT的特征值與特征向量,然后求出ui Ui=Aujn1/2j(j=0,1,2,z-1) (3.3)uj表示AAT的特征向量,uj表示ATA的特征向量,ni是AT
38、A的特征值,uj就是所指的特征臉。求出特征臉以后,所剩下的工作就是要對(duì)庫中的人臉進(jìn)行降維,由uj可以組成一個(gè)投影矩陣,表示為W=u1u2,,u Z-1,并進(jìn)行降維: qi=WTdi(i=0,1,2,N-1) (3.4)由式子(3.4)得出所有人臉向量的降維向量。基于特征臉的識(shí)別方法優(yōu)點(diǎn):它大大降低了原始空間的維數(shù),在這個(gè)低維空間中可進(jìn)行人臉檢測(cè)和識(shí)別。Pentland等人在人臉檢測(cè)中使用了特征臉方法,得到的特征臉如圖7所示:圖3.5 特征臉10缺點(diǎn):這種方法對(duì)光照條件的改變較敏感。如果提供了在光照條件變化下的人臉圖象,則投影矩陣保留的主要元素會(huì)因光照而改變。于是,投影矩陣中的點(diǎn)便不能被很好的分
39、類,甚至?xí)兊幂喞:W鳛樘卣髂樇夹g(shù)的改進(jìn),可以將Fisher線性判斷準(zhǔn)則(Fisher Linear Discriminant,簡寫為FLD)應(yīng)用于人臉識(shí)別。并對(duì)PCA和FLD進(jìn)行了比較,結(jié)論是特征臉不能區(qū)分類內(nèi)和類間變化的不同角色,而是將他們一視同仁;FLD克服了PCA的一個(gè)缺點(diǎn);它可區(qū)分類內(nèi)和類間的散布矩陣。 線性判斷準(zhǔn)則分析并不總是優(yōu)于PCA。當(dāng)每一類的樣本數(shù)較小時(shí),PCA的效果比FLD好。在很多領(lǐng)域,尤其是人臉識(shí)別領(lǐng)域,人們根本不知道不同分類的基本分布。所以,實(shí)際上是很難弄清楚已有的訓(xùn)練數(shù)據(jù)是否適用。他們的實(shí)驗(yàn)表明這種考慮是正確的,在一些實(shí)驗(yàn)中,PCA的效果比FLD好,而在另一些試
40、驗(yàn)中則是FLD的效果比PCA好。3.3.3 彈性圖匹配法彈性圖匹配法11(Elastic Graph Matching)是一種基于動(dòng)態(tài)鏈接結(jié)構(gòu)(Dynamic Link Architecture,DLA)的方法。該方法在二維空間中為人臉建立屬性拓?fù)鋱D ,把拓?fù)鋱D放置在人臉上,每一節(jié)點(diǎn)包含一特征向量,它記錄了人臉在該頂點(diǎn)附近的分布信息,節(jié)點(diǎn)間的拓?fù)溥B接關(guān)系用幾何距離來標(biāo)記,從而構(gòu)成基于二維拓?fù)鋱D的人臉描述。利用該方法進(jìn)行人臉識(shí)別時(shí),可同時(shí)考慮節(jié)點(diǎn)特征向量匹配和相對(duì)幾何位置匹配。在待識(shí)別人臉圖像上掃描拓?fù)鋱D結(jié)構(gòu)并提取相應(yīng)節(jié)點(diǎn)特征向量,把不同位置的拓?fù)鋱D和庫中人臉模式的拓?fù)鋱D之間的距離作為相似性度量
41、。此外,可用一個(gè)能量函數(shù)來評(píng)價(jià)待識(shí)別人臉圖像向量場(chǎng)和庫中已知人臉向量場(chǎng)間的匹配度,即最小能量函數(shù)時(shí)的匹配 。 該方法使得幾何特征描述越來越充分,保留了人臉的拓?fù)浣Y(jié)構(gòu)和局部特征,通過局部節(jié)點(diǎn)調(diào)節(jié)和彈性圖變形,以及局部特征的多級(jí)Gabor變換描述,使得該方法對(duì)光照、姿態(tài)變化等具有較好的適應(yīng)性。該方法的主要缺點(diǎn)是計(jì)算量較大,必須對(duì)每個(gè)存儲(chǔ)的人臉計(jì)算其模型圖,占用很大存儲(chǔ)空間。3.3.4 神經(jīng)網(wǎng)絡(luò)法基于神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別方法是近幾年比較活躍的一個(gè)研究方向,已被應(yīng)用于人臉檢測(cè)、人臉識(shí)別、表情分析等問題,并取得了較好的效果。該類方法將人臉用灰度圖表征,利用神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)和分類能力進(jìn)行識(shí)別。通常需考慮兩方面
42、的因素:選擇圖像哪些參數(shù)作為輸入;選擇何種神經(jīng)網(wǎng)絡(luò)。目前主要有兩種輸入策略,第一種是將提取的特征向量作為輸入向量;第二種是將圖像像素直接輸入神經(jīng)網(wǎng)絡(luò)。第一種輸入策略可有效控制神經(jīng)網(wǎng)絡(luò)規(guī)模,但對(duì)提取特征的要求較高;第二種對(duì)于提取要求降低,并可根據(jù)樣本集自身的方差特征來進(jìn)行特征選擇,但網(wǎng)絡(luò)規(guī)模擴(kuò)大而造成收斂緩慢。用于人臉識(shí)別的神經(jīng)網(wǎng)絡(luò)有很多,如基于反向傳播(Back Propogation,BP)算法的BP神經(jīng)網(wǎng)絡(luò),該方法基本理論簡單且有很強(qiáng)的學(xué)習(xí)能力,運(yùn)算量較小;Cottrell等人提出使用級(jí)聯(lián)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行識(shí)別,對(duì)受損人臉的識(shí)別能力較好;LinSH等人提出基于概率決策的神經(jīng)網(wǎng)絡(luò)(Probab
43、ilistic Decision-Based Neural Network,PDBNN)方法,采用虛擬樣本進(jìn)行強(qiáng)化和反強(qiáng)化學(xué)習(xí),從而得到較理想的概率估計(jì)結(jié)果,并采用模塊化網(wǎng)絡(luò)結(jié)構(gòu)加快學(xué)習(xí)。徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)(Radial Basis Function Network,RBFN)因具有逼近性好、空間描述緊湊、訓(xùn)練速度快等特點(diǎn)也被用于人臉識(shí)別。神經(jīng)網(wǎng)絡(luò)用以解決復(fù)雜模式識(shí)別與行為控制問題,其特色在于信息分布式存儲(chǔ),具有良好的容錯(cuò)性、聯(lián)想記憶功能以及通過學(xué)習(xí)獲取知識(shí)并解決問題的能力。但該類方法要求訓(xùn)練集中包含較多的人臉圖像,只能適合于小型人臉庫。由于原始灰度圖像數(shù)據(jù)量龐大,神經(jīng)元數(shù)目多,該方法運(yùn)算量較
44、大。4 基于PCA的人臉識(shí)別系統(tǒng)設(shè)計(jì)4.1 引言Gabor小波提供了多精度、多通道表現(xiàn)圖像空間動(dòng)頻率域特性的機(jī)制,較好地反映了生物視覺神經(jīng)元的感受野。與其它方法相比,Gabor小波方法是一種多分辨率的描述,并且能夠較好地解決由于環(huán)境變化而引起的圖像變化問題,對(duì)此已有充分的理論依據(jù)并且能夠有效地實(shí)現(xiàn),所以采用它來進(jìn)行人臉的識(shí)別可以獲得較好的結(jié)果。生物學(xué)實(shí)驗(yàn)表明,生物視覺神經(jīng)細(xì)胞對(duì)于空間信息輸入的響應(yīng)具有頻率選擇性,而且有一定的帶寬范圍,貓的細(xì)胞感受野的空頻域帶寬為0.5-2.5個(gè)倍頻程,猴的帶寬為0.4-2.6個(gè)倍頻程,而人的帶寬范圍為1.5-2.0個(gè)倍頻程,因此利用生物學(xué)的研究成果來指導(dǎo)Gab
45、or函數(shù)的參數(shù)選擇可以使其特性更能與人類的視覺系統(tǒng)響應(yīng)機(jī)理相吻合。Gabor小波是一組帶通濾波器,通過參數(shù)的選擇,每一組濾波器具有各自的頻率選擇性和方向選擇性,這樣不同方向和尺度的濾波器覆蓋整個(gè)頻域,從而一幅人臉圖像的Gabor特征表示就是該圖像和一族Gabor小波卷積的結(jié)果。這部分內(nèi)容在第二章已經(jīng)有詳細(xì)說明,這里不再贅述。4.2 具體算法根據(jù)前面第二,三章所述,我們知道經(jīng)過Gabor小波變換后,維數(shù)將會(huì)變得很高,不利于人臉識(shí)別。很多研究成果表明,PCA在多數(shù)人臉識(shí)別方法中都起到重要的作用,因此降維選擇了這種方法。但是,子空間的維數(shù)要慎重考慮,通過降維并慎重選擇降維后的維數(shù),可以解決人臉識(shí)別中
46、的學(xué)習(xí)問題。圖4.1描述了這個(gè)人臉識(shí)別系統(tǒng)的構(gòu)成。Gabor變換(特征提取)pca映射(降維)分類尺度(歐式距離)識(shí)別率測(cè)試圖像訓(xùn)練圖像圖4.1 人臉識(shí)別系統(tǒng)總體結(jié)構(gòu) 具體的訓(xùn)練和識(shí)別過程如下: 將c個(gè)人臉圖像通過gabor小波變換后組成訓(xùn)練樣本集,其中,那么全部人臉圖像均值為:,對(duì)每幅人臉圖像求與均值的差值,其協(xié)方差矩陣為,根據(jù)第三章所提到的計(jì)算方法,求出協(xié)方差矩陣的特征值和特征向量,從而獲得映射矩陣,其中,m是與前m個(gè)最大特征值對(duì)應(yīng)的特征向量,選擇,將訓(xùn)練樣本集全部投影到m維特征空間。同樣,建立測(cè)試人臉庫,經(jīng)過gabor小波變換后,再投影到m維特征空間中,然后根據(jù)歐氏距離,通過求出訓(xùn)練圖像
47、與測(cè)試圖像特征點(diǎn)的距離來分類。最后確定類別。4.3 ORL人臉庫實(shí)驗(yàn)分析本文在進(jìn)行人臉識(shí)別實(shí)驗(yàn)所采用的ORL人臉數(shù)據(jù)庫,該數(shù)據(jù)庫是劍橋大學(xué)貝爾實(shí)驗(yàn)室在1994年制作的,用于測(cè)試人臉識(shí)別算法的人臉圖像數(shù)據(jù)庫。該數(shù)據(jù)庫包括40個(gè)人在不同時(shí)間拍攝的每人10幅圖像,共400幅256灰度級(jí)的圖像,大小為92 x 112.ORL數(shù)據(jù)庫中的人臉圖像的背景光線有一定變化,人臉的表情也不一樣(包括睜眼和閉眼,微笑和不笑),一些人還有戴眼鏡和不戴眼鏡時(shí)的圖像。圖4.2為ORL中的一部分人臉圖像:圖4.2 orl人臉庫4.3.1實(shí)驗(yàn)1:算法的比較在本實(shí)驗(yàn)中,將對(duì)PCA,Gabor+PCA人臉識(shí)別算法進(jìn)行比較。為了能
48、進(jìn)行比較,本文將選擇相同的訓(xùn)練樣本和測(cè)試樣本,將1,3,5,6,8五幅作為作為訓(xùn)練樣本,而把剩余的五幅人臉圖像作為測(cè)試樣本,并且在測(cè)試樣本和訓(xùn)練樣本之間不存在重疊,在試驗(yàn)中,在沒對(duì)圖像作任何處理前,先把圖像縮小為30*24。并取不同的主元數(shù)目進(jìn)行試驗(yàn),結(jié)果如圖43所示:圖43 pca及gaborpca算法比較坐標(biāo)圖其中上圖實(shí)線表示的是gabor+pca,虛線表示的是pca。由圖可知,gabor+pca算法的識(shí)別率一般比pca算法好,gabor小波變換能很好地表征人臉特征。并且還可以看出,隨著主元數(shù)目的增加,識(shí)別率一開始升高很快,但到了一定程度,識(shí)別率不變,再增加,反而變小了一點(diǎn),但基本不會(huì)再降
49、得很低。因此選擇合適的主元數(shù)目對(duì)提高識(shí)別率是很重要的。主元數(shù)目一般選在50到80之間,如果大于80,雖然識(shí)別率也變化不大,但pca處理的時(shí)間卻變長很多,不利于人臉識(shí)別。4.3.2 實(shí)驗(yàn)2:樣本數(shù)目的選擇 在本實(shí)驗(yàn)中,將會(huì)討論樣本數(shù)目對(duì)識(shí)別率的影響。在試驗(yàn)中,主元數(shù)取值為80不變,唯一改變的是訓(xùn)練樣本的數(shù)目,結(jié)果如下圖44所示。圖44 訓(xùn)練樣本數(shù)與識(shí)別率 由上圖可發(fā)現(xiàn),當(dāng)樣本數(shù)為280的時(shí)候,識(shí)別率是最高的,達(dá)到96.6。并且訓(xùn)練樣本數(shù)越少,識(shí)別率越低,當(dāng)訓(xùn)練樣本數(shù)大于280的時(shí)候,識(shí)別率也有所下降。4.3.3 實(shí)驗(yàn)3:采樣因子的確定為了識(shí)別人臉,我們自然需要尋找代表人臉的最本質(zhì)特征。因?yàn)榻?jīng)過g
50、abor變換,原始圖像和gabor核函數(shù)卷積后,維數(shù)變?yōu)?0200*200,數(shù)據(jù)相當(dāng)大,必須尋找最能代表人臉的最本質(zhì)特征,本文將進(jìn)行下采樣處理,采樣因子的大小對(duì)識(shí)別率和PCA處理時(shí)間的關(guān)系如下表所示。其中訓(xùn)練樣本數(shù)為5,主元特征數(shù)為80。表4-1 采樣因子關(guān)系采樣因子采樣后一張圖片的特征維數(shù)識(shí)別率PCA處理時(shí)間(s)20351096.6%75.350140496.5%23.177890095.5%6.2010070295%3.1420035194.5%0.422圖45 特征維數(shù)與PCA處理時(shí)間由上表可以看出,采樣因子的大小對(duì)識(shí)別率的影響不大,表明經(jīng)過變換后,把人臉的最主要特征提取出來了。由圖5
51、5可看出,采樣后,當(dāng)每張的圖片的維數(shù)超過103的時(shí)候,PCA處理消耗的時(shí)間迅速上升,可見隨著圖片特征維數(shù)的增加PCA消耗的時(shí)間增長很快,PCA對(duì)數(shù)據(jù)的處理復(fù)雜度是很高的。所以有必要尋找一個(gè)識(shí)別率比較好,而處理時(shí)間很少的采樣因子。在本論文中,采樣因子改為100是比較適合的。否則,若改變訓(xùn)練樣本,人臉識(shí)別系統(tǒng)需要很長的時(shí)間重新訓(xùn)練。4.4 YALE人臉庫實(shí)驗(yàn)Yale人臉庫(/projects/yalefaces/yalefaces.html)。本數(shù)據(jù)庫是耶魯大學(xué)提供的。庫中包括15個(gè)人的165幅GIF圖像。每人有11幅圖像,每幅圖像都具有不同的表情和外貌的變化:
52、前向光照、戴眼鏡、不戴眼鏡、高興、左側(cè)光照、中性臉、右側(cè)光照、悲哀、假寐、驚奇、眨眼等。圖像的大小為320×243,圖像示例如圖46所示。圖46 yale人臉庫示例本設(shè)計(jì)在此數(shù)據(jù)庫中,主要尋求識(shí)別率最高時(shí),所取的樣本及樣本數(shù),本文采取ORL人臉庫實(shí)驗(yàn)的經(jīng)驗(yàn),主元數(shù)取為80,為了提高速度而又保障識(shí)別率,采樣因子取50。經(jīng)過多次試驗(yàn),如表52所示:可以看出樣本數(shù)為120時(shí),識(shí)別率比樣本數(shù)為90和105時(shí)高,而且當(dāng)選取前八幅人臉圖像作為訓(xùn)練樣本時(shí),識(shí)別率是最高的,達(dá)到97.7,比orl人臉數(shù)據(jù)庫試驗(yàn)的識(shí)別率高。表52 訓(xùn)練樣本的選擇訓(xùn)練樣本測(cè)試樣本識(shí)別率01,03,05,06,08,110
53、2,04,07,09,1077.301,02,03,04,05,0806,07,09,10,1182601,02,03,04,08,09,1005,06,07,1186601,02,03,04,05,08,09,1006,07,1189301,02,03,04,05,06,07,0809,10,119775 小結(jié)5.1 總結(jié)人臉識(shí)別技術(shù)(Face Recognition Technology)就是利用計(jì)算機(jī)分析人臉圖像,從中提取有用的識(shí)別信息,用來辨認(rèn)身份的一門技術(shù)。由于人的行動(dòng)和人臉的裝飾表情都具有復(fù)雜的模式變化,加之存在人臉的圖像背景的復(fù)雜性,使得人臉的檢測(cè)成為一個(gè)極具挑戰(zhàn)的課題,具有很高
54、的學(xué)術(shù)價(jià)值和應(yīng)用前景。本文主要介紹了靜態(tài)人臉識(shí)別的技術(shù),對(duì)其進(jìn)行了分類總結(jié),同時(shí),詳細(xì)介紹了其中的關(guān)鍵技術(shù)和研究成果。本文綜述了靜態(tài)人臉識(shí)別技術(shù)國內(nèi)外研究的現(xiàn)狀、以及發(fā)展趨勢(shì),分析了存在的問題,提出了一些研究思路和技術(shù)方案。5.2 展望人類對(duì)人臉識(shí)別的研究已經(jīng)有40多年的時(shí)間,并取得了相當(dāng)?shù)某删停嚯x實(shí)際可用行還有一定的距離,存在的問題也不少。從目前的研究成果來看,成功的人臉識(shí)別至少需要考慮以下幾個(gè)方面: (1)人臉是具有一定可變形部分的三維固體的表面,目前仍存在爭議的是在選用人臉模型時(shí),是用二維表面還是三維模型基哪一個(gè)更好點(diǎn)。 (2)由于外部干擾不可避免,預(yù)處理的效果將會(huì)影響到識(shí)別結(jié)果,好
55、的人臉模型應(yīng)能夠在識(shí)別的同時(shí),抑制分離外在干擾的影響。 (3)對(duì)于表達(dá)人臉的各種特征需要進(jìn)行比較和選擇,以找出人臉最活躍的特征。這可以通過如下兩種途徑:一是比較同一個(gè)人的多張圖片,以得到穩(wěn)定的特征;另一種方法就是比較不同人的圖片,以得出該人最“與眾不同”之處。 (4)人臉識(shí)別是人類視覺的獨(dú)特過程,因此人臉識(shí)別必須結(jié)合生理學(xué)和心理學(xué)的研究成果。致謝語在論文完成之際,我的心情無法平靜,從選題、資料收集到論文的撰寫整個(gè)過程中,老師、同學(xué)、朋友給了我熱情的幫助,在這里請(qǐng)接受我誠摯的謝意! 我首先要感謝周錦榮老師,在選題以及實(shí)驗(yàn)過程中給予我指導(dǎo)。周老師多次詢問實(shí)驗(yàn)進(jìn)程,并為我指點(diǎn)迷津,幫助我開拓思路。周老師花費(fèi)很多的精力一遍又一遍指出每稿中的具體問題,嚴(yán)格把關(guān),在此我表示衷心的感謝。同時(shí),我還要感謝在我大學(xué)四年悉心教導(dǎo)我,給予我極大關(guān)心和支持的各位老師,是你們教會(huì)了我很多有用的知識(shí),特別是教會(huì)了我思考問題、解決問題的方式。在此,我想向所有關(guān)心我的老師以及同學(xué)表示最誠摯的謝意。最后,感謝各位評(píng)審老師在百忙之中抽出時(shí)間對(duì)論文進(jìn)行審稿、參加答辯,并對(duì)參加答辯會(huì)的老師、同學(xué)表示謝意。參考文獻(xiàn)1 Chellappa R, W ilson C L, Sirohey S Human and
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- Unit 8 Reading1 教學(xué)設(shè)計(jì) 2024-2025學(xué)年譯林版(2024)七年級(jí)英語上冊(cè)
- 13我能行(教學(xué)設(shè)計(jì))-2023-2024學(xué)年道德與法治二年級(jí)下冊(cè)統(tǒng)編版
- 2023四年級(jí)數(shù)學(xué)下冊(cè) 數(shù)學(xué)好玩第2課時(shí) 奧運(yùn)中的數(shù)學(xué)教學(xué)設(shè)計(jì) 北師大版
- 復(fù)發(fā)性流產(chǎn)病人的護(hù)理
- 2024-2025學(xué)年高中歷史 第三單元 近代中國經(jīng)濟(jì)結(jié)構(gòu)的變動(dòng)與資本主義的曲折發(fā)展 第9課 近代中國經(jīng)濟(jì)結(jié)構(gòu)的變動(dòng)新課教學(xué)設(shè)計(jì)2 新人教版必修2
- 2024-2025學(xué)年高中化學(xué) 第三章 第二節(jié) 分子晶體與原子晶體 第2課時(shí) 原子晶體教學(xué)設(shè)計(jì) 新人教版選修3
- 2023七年級(jí)歷史下冊(cè) 第三單元 明清時(shí)期:統(tǒng)一多民族國家的鞏固與發(fā)展第18課 統(tǒng)一多民族國家的鞏固和發(fā)展教學(xué)設(shè)計(jì) 新人教版
- 2《不一樣的 你我他》(教學(xué)設(shè)計(jì))-2023-2024學(xué)年道德與法治三年級(jí)下冊(cè)統(tǒng)編版
- Unit 2 Good Morning,Miss Wang (教學(xué)設(shè)計(jì))-2024-2025學(xué)年新世紀(jì)英語一年級(jí)上冊(cè)
- Unit 1 What's the matter Section A 4a-4c 教案 2024-2025學(xué)年人教版八年級(jí)英語下冊(cè)
- 暖通工程設(shè)備吊裝施工方案
- JJG 109-2004百分表式卡規(guī)
- 12YJ6 外裝修標(biāo)準(zhǔn)圖集
- 新教材人教版高中物理選擇性必修第一冊(cè)全冊(cè)教學(xué)課件
- 初中數(shù)學(xué)北師大八年級(jí)下冊(cè)綜合與實(shí)踐-生活中的一次模型PPT
- 煤化工概述-課件
- 2021初中生命科學(xué)學(xué)業(yè)考試參考答案
- DB32 3709-2019 防災(zāi)避難場(chǎng)所建設(shè)技術(shù)標(biāo)準(zhǔn)
- 心理治療師心理治療師中級(jí)
- 《作文吹泡泡》-完整版課件
- 資源環(huán)境信息系統(tǒng)(GIS)課件
評(píng)論
0/150
提交評(píng)論