




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、摘 要人臉識別技術是模式識別與人工智能的研究熱點之一。在生物特征識別中,人臉識別占有極為重要的地位。它在訪問控制、司法應用、電子商務和視頻監(jiān)控等領域都有廣泛的應用。人臉特征提取是人臉識別過程的核心,特征提取的有效性直接影響到分類的速度和識別的性能。本文的主要研究內容包括以下方面:(1) 基于Gabor變換的人臉特征提取算法。通過對人臉傅里葉變換和Gabor變換的實驗比較,證明了Gabor變換在提取人臉特征方面具有很大的優(yōu)越性。接著,介紹了Gabor小波變換的快速算法。(2) 從基于圖像整體代數(shù)特征PCA算法著手,主要介紹了“特征臉”算法的原理和實現(xiàn)過程,對組成特征投影空間的特征值選擇問題,距離
2、度量方法問題及訓練樣本的選擇等進行了一定的研究。(3) 研究了基于Gabor小波變換的人臉識別算法。本文研究的算法首先對人臉進行Gabor小波變換,然后應用PCA方法降低Gabor特征向量的維數(shù),來實現(xiàn)對人臉的識別。實驗表明,采用該方法得到的識別率要遠優(yōu)于單純采用PCA方法的結果。關鍵詞 人臉識別;Gabor小波變換;PCA AbstractFace Recognition Technology(FRT)is emerging as an active research area in the field of pattern recognition and artificial intell
3、igence.As a biometric technology,FRT has numerous applications such as access control,law enforcement,e-commerce,video surveillance and so on. Face feature extraction is the core of recognition task,which directly impact on classification velocity and face recognition ability.The main contributions
4、of this work are listed as follows:(1) Face feature extraction algorithm based on Gabor transform is introduced.Compared with Fourier transform,Gabor transform is proved to be better in face feature extraction.And then,A fast algorithm of Gabor Transform is introduced.(2) Based on algebraic features
5、 of the images,this paper first introduced the PCA-Based face recognition algorithm.Some research has done on the selection of the eigenvector which used to create the eigen-space,the distance measure methods and the selection of the training set.(3) A face recognition algorithm base on Gabor wavele
6、t transform is studied The algorithm studied in this paper consists of three steps:Gabor wavelet is first applied to face images,and then reduce the dimensionality of Gabor eigenvector via PCA. The improved performance of this new algorithm over pure PCA algorithm is demonstrated by the experiments.
7、Key words face recognition Gabor wavelet transform PCA目 錄摘要IAbstractII第1章 緒論11.1研究的背景和意義11.2 人臉識別的研究現(xiàn)狀21.3如何進行人臉識別-人臉識別的步驟及方法31.3.1人臉的圖像表示31.3.2人臉的檢測與定位31.3.3圖像預處理31.3.4特征提取31.3.5分類器41.4 本文研究的主要內容4第2章 Gabor小波變換62.1引言62.2 Gabor小波變換的定義72.3 Gabor變換在人臉識別中的應用82.4 Gabor濾波器92.4.1 Gabor濾波器參數(shù)的選擇112.4.2 Gabor
8、濾波器的性質和計算方法122.4.3 Gabor變換的人臉特征提取122.5 Gabor快速算法圖132.5.1快速傅里葉變換(FFT)152.5.2Gabor變換的快速算法162.6 本章小結17第3章 主成分分析(PCA)183.1引言183.2 PCA的基本概念183.2.1 PCA原理183.2.2 主成分分析的具體算法193.3 用PCA進行特征提取的經(jīng)典算法Eigenface算法203.3.1 特征臉空間203.3.2通過特征臉空間來識別人臉203.3.3 特征向量的選取223.3.4 距離測量223.4 程序的調試233.5 本章小結25第4章 基于Gabor+PCA的人臉識別2
9、64.1 引言264.2 使用PCA降維的方法264.3 ORL人臉庫實驗分析274.3.1實驗1:算法的比較274.3.2 實驗2:樣本數(shù)目的選擇284.3.3 實驗3:采樣因子的確定294.4 YALE人臉庫實驗304.5本章小結31結論32參考文獻33致謝34第1章 緒論1.1研究的背景和意義現(xiàn)代社會中,身份鑒定技術具有非常重要的應用價值,隨著網(wǎng)絡技術的發(fā)展,信息安全也顯示出前所未有的重要性。在金融、保安、司法、網(wǎng)絡傳輸?shù)雀鱾€應用領域,都需要精確的身份鑒定1。但是現(xiàn)今的身份鑒別主要依靠ID卡(如身份證、工作證、智能卡、存儲卡等)和密碼手段。但這些手段攜帶不方便、容易遺失,或者由于使用過多
10、或不當而損壞、不可讀和密碼易被破解等。尤其是近年來電子商務的飛速發(fā)展,制假偽造的手段也越來越高明,傳統(tǒng)的身份確認方法面臨著嚴峻的挑戰(zhàn),并顯得越來越不適應科技的發(fā)展和社會的進步。作為模式識別中的熱門技術,生物特征識別(Biometrics)由于提供了對唯一的,高可靠性和穩(wěn)定性的人體生物特征的鑒別方法,成為身份鑒別的一個熱門發(fā)展方向1。所謂生物特征識別1,就是根據(jù)不同人之間的身體(physical)的或者行為(behavioral)的特征的獨特性,來唯一地把未知身份識別出來。身體特征包括:指紋、視網(wǎng)膜、虹膜、人臉等;行為特征包括簽名、聲音、步態(tài)等。有的識別是幾種特征的結合,如身份識別可以結合人臉和
11、指紋兩個特征。日常生活中,人類每時每刻都通過感官自然而然地從外界獲取想要的信息。這些信息中有大約80%是通過視覺得到的,因此,視覺信息處理在現(xiàn)代人工智能技術中占有極為重要的地位。而人臉數(shù)據(jù)的提取方式多種多樣,既可取靜態(tài)圖像,也可取視頻序列,背景還可以變化。人臉數(shù)據(jù)的提取對設備也沒有特殊要求,既可對真人拍照或攝像,也可從照片掃描。更為重要的是人臉識別和人類通常的識別相一致,更易被接受。因此,人臉識別及其相關技術的應用前景是生物特征識別諸多技術中最被看好的。生物特征識別在國外發(fā)展很快2,我國截止2002年也已舉行了三屆生物特征識別研討會3。1992年,Samal總結了早期的人臉識別方法。后來,Va
12、lentin討論了人臉識別的神經(jīng)網(wǎng)絡模型。Chellappa主要從工程應用方面對人臉識別進行了評述。而從不同角度出發(fā)的綜述文章還有。兩個有關人臉識別的國際會議AFGR和AVBPA的出現(xiàn),充分說明了人臉識別的重要性。IEEE模式分析與機器智能(PAMI)協(xié)會在1997年7月出版了有關人臉和手勢識別的專刊,Daugman這樣寫道“在未來的機器智能領域,我們將發(fā)現(xiàn)一個有趣的現(xiàn)象,即為建立具有類似人類外貌、表情、手勢等特征的人機界面所做出的努力,將最終導致我們可以和機器隨心所欲地交流”4。人臉識別在模式識別領域的發(fā)展和應用方面都有著重要意義:一是可以推進對人類視覺系統(tǒng)本身的認識;二是可以滿足人工智能應
13、用的需要。采用人臉識別技術,建立自動人臉識別系統(tǒng),用計算機實現(xiàn)對人臉圖像的自動識別有著廣闊的應用領域和誘人的應用前景。人臉識別在社會交往中扮演著十分重要的角色,是人類在確定一個人身份時所采用的最普通的生物特征。相對于其它的生物特征識別技術來說,人臉識別具有以下技術優(yōu)勢:(1)直觀、友好、方便。人臉識別不會對使用者造成心理上的障礙,并且比較符合人們的習慣,很容易被大多數(shù)用戶所接受;(2)對用戶的非干擾性。人臉識別不需要和設備直接接觸,不需要被測試者的配合,在這一點上是其它識別方式難以取代的;(3)對硬件無特殊要求,可以借助于現(xiàn)有的硬件進行識別。數(shù)碼攝像頭、數(shù)碼相機、數(shù)碼攝像機等已經(jīng)走進人們的日常
14、生活,這為人臉識別的應用提供了有力的保障;(4)通過對人臉表情的識別,可以獲得其它的生物特征識別技術難以得到的信息。1.2 人臉識別的研究現(xiàn)狀 人臉識別的輸入圖像通常有3種情況:正面、傾斜、側面。由于實際情況的要求,對人臉正面圖像識別的研究最多,它的發(fā)展大致可分為3個階段5:第一階段以Bertillon、Allen和Parke為代表,主要研究人臉識別所需要的面部特征。1893年,Bertillon用一個簡單的語句與數(shù)據(jù)庫中某一張臉相聯(lián)系,同時與指紋分析相結合,提供了一個較強的識別系統(tǒng)。為了提高臉部識別率,Allen為待識別人臉設計了一種有效和逼真的摹寫,Parke則用計算機實現(xiàn)了這一想法,并產
15、生了較高質量的人臉灰度圖模型。這一階段的工作特點是識別過程完全依賴于操作人員。顯然這不是一種可以完成自動識別的系統(tǒng)。第二階段是人機交互式識別階段。20世紀70年代,美、英等發(fā)達國家開始重視人臉識別的研究工作并取得一定進展。1972年,Goldstion,Harmon和Lesk用幾何特征來表示人臉正面圖像。他們采用21維的特征矢量表示人臉面部特征,并設計了基于這一特征表示法的識別系統(tǒng)。Kaya和Kobayashi則采用了統(tǒng)計識別方法,用歐氏距離來表征人臉的特征,如嘴唇與鼻子之間的距離,嘴唇的高度等。更進一步地,T.Kanad(M.Nagao)設計了一個高速且有一定知識導引的半自動回溯識別系統(tǒng),創(chuàng)
16、造性地運用積分投影法從單幅圖像上計算出一組臉部特征參數(shù),再利用模式分類技術與標準人臉相匹配。Kanad的系統(tǒng)實現(xiàn)了快速、實時的處理,是一個很大的進步。相比之下,Baron所做的工作較少為人所知:他先將圖像灰度歸一化,再用4個掩模(眼、鼻、嘴及眉毛以下的整個臉部)表示人臉,然后分別計算這4個掩模與數(shù)據(jù)庫中每幅標準圖像的相應掩模之間的互相關系數(shù),第一章緒論以此作為判別依據(jù)??偟膩碚f,這類方法需要利用操作員的某些先驗知識,仍然擺脫不了人的干預。第三階段是真正的機器自動識別階段。從1990年代起,由于計算機、數(shù)字圖像處理、模式識別等技術的發(fā)展,加上人們對人臉圖像自動識別的迫切需求,人臉模式識別方法有了
17、較大的突破,提出了多種機器全自動識別系統(tǒng)。1996年美國軍方組織了人臉自動識別系統(tǒng)大賽,勒克菲勒大學的Face1t系統(tǒng)獲得冠軍。最近,美國的LAU公司研制的人臉圖像自動識別系統(tǒng),是以人眼辨別人臉的原理,基于生物測量學、人像復原技術開發(fā)的裝置。用人臉1242個特征點,對人群中尋找的人進行定量定性識別,已經(jīng)用在機場、火車站、公共場所、重點控制地區(qū)6。在人臉識別技術誕生至今的二三十年中,人們已提出了很多成熟、高效的識別算法,為工程應用提供了強有力的后盾。自從“911”事件以來,世界上對人臉識別系統(tǒng)的需求有了明顯增長。對人臉識別的研究也是理論界的一個熱點。目前世界上最有名的識別系統(tǒng)為Visionics
18、公司的“FaceIt”系統(tǒng),在活動場景(人和照相機都是活動的)下,該系統(tǒng)的識別率僅為50%;而可控條件下,識別率可達80%以上。在中國,中科院計算所高文教授主持的863項目“面像檢測與識別核心技術”通過鑒定。該系統(tǒng)會自動在人臉上選取103個點,然后通過分析面部皮膚反射屬性、三維結構等特征進行識別,靜態(tài)場景下識別準確率達到96.5。中科院自動化所和微軟亞洲研究院也在進行這方面的研究。1.3人臉識別的步驟及方法Chellappa給出的人臉識別定義是,給出靜態(tài)或者視頻圖像,將其中的一個或多個人臉和存儲于數(shù)據(jù)庫中的人臉相比較,確定出圖像或視頻中各個臉的身份。一般要在輸入之前對圖像進行預處理,若有人臉存
19、在,則將其從背景中分割出來。一般來說,一個完整的人臉識別系統(tǒng)包括。圖像輸入、人臉檢測/定位、預處理、特征提取、分類器5部分。1.3.1人臉的圖像表示計算機處理的圖像是以數(shù)字形式表示的。如果僅從識別的角度出發(fā),我們希望數(shù)字圖像能夠盡可能地保留原圖像的信息,但在實踐中,由于場合的不同,輸入圖像保留的信息是不一樣的。灰度圖像失去了顏色信息;二維圖像則失去了深度等三維信息;紅外圖像僅和熱輻射有關,分辨率太低;Sketch圖像則失去了紋理信息;上述幾種圖像都沒有運動信息。除了圖像形態(tài),輸入設備也不盡相同,有的圖像是由CCD攝像頭拍攝的,有的則是照片掃描或報紙掃描,還有可能是在web上下載的壓縮圖像,等等
20、。由于應用環(huán)境的不同,所得圖像的性質也是不同的,這實際上會影響到以后提取的特征也有所不同。本論文主要是在二維灰度(2D intensity)靜態(tài)圖像上進行人臉識別的研究。1.3.2人臉的檢測與定位檢測圖像中是否有人臉,若有,將其從背景中分割出來,并確定其在圖像中的位置。在某些可以控制拍攝條件的場合,如警察拍罪犯照片時將人臉限定在標尺內,此時人臉的定位很簡單。證件照背景簡單,定位也比較容易。在另一些情況下,人臉在圖像中的位置是未知的,比如在復雜背景下拍攝的照片,這時人臉的檢測與定位將受以下因素的影響:(1)人臉在圖像中的位置、角度和不固定尺度以及光照的影響;(2)發(fā)型、眼鏡、胡須以及人臉的表情變
21、化等;(3)圖像中的噪聲。人臉檢測的基本思想是用統(tǒng)計或知識的方法對人臉建模,比較所有可能的待檢測區(qū)域與人臉模型的匹配程度,從而得到可能存在人臉的區(qū)域。其方法大致可分為基于統(tǒng)計和基于知識兩類。前者將圖像看作一個高維向量,從而將人臉檢測問題轉化為高維空間中分布信號的檢測問題;后者則利用對人臉的認知知識建立若干規(guī)則,從而將人臉檢測問題轉化為假設/驗證問題。1.3.3圖像預處理圖像特征提取之前一般需要做預處理。一般改善的方法有直方圖均衡、圖像銳化等。如果需要提取不同的頻帶信息,則進行相應的低通、帶通或高通濾波。圖像的邊緣、梯度信息的提取,消除照相機位置、方向的影響和相機抖動,某些背景的去除等也屬于預處
22、理操作。背景的去除是必要的,否則人臉識別將不是“pure”人臉識別。還有幾何歸一化和灰度歸一化。前者是指根據(jù)人臉定位結果將圖像中的人臉轉換到同一位置和大??;后者是指對圖像進行補償?shù)忍幚?,以克服光照變化的影響?.3.4特征提取特征提取就是采用某種表示方法表示檢測出的人臉與數(shù)據(jù)庫中的人臉,表示方法不同,代表了人臉不同方面的信息。在特征提取之前,一個重要的問題是消除姿態(tài)、光照變化的影響。通常采用的人臉表示方法包括幾何特征(如歐式距離、曲率、角度)、代數(shù)特征(如矩陣特征向量)和固定模板特征。識別人臉主要依據(jù)那些在不同個體之間存在較大差異而對于同一個人則比較穩(wěn)定的特征,具體的特征形式隨識別方法的不同而
23、不同。常用的人臉表征方法有:幾何特征,主分量分析,線性判別分析,獨立分量分析,Gabor小波變換、離散余弦變換等;早期研究較多的靜態(tài)人臉識別方法有基于幾何特征的人臉識別方法和基于相關匹配的人臉識別方法。目前,靜止圖像的人臉識別方法主要有3個研究方向:基于統(tǒng)計的識別,包括特征臉(Eigenface)方法和隱馬爾科夫模型(Hidden Markov Model)方法;基于連接機制的識別,包括一般的神經(jīng)網(wǎng)絡方法和彈性圖匹配(Elastic Graph Matching)方法;其它一些綜合方法或處理非二維灰度圖像的方法。1.3.5分類器分類器的設計是模式識別的難點。在人臉識別中,常用的分類器有以下幾種
24、:最小距離分類器(NC)相似度量是以檢測樣本到類中心的距離大小為判據(jù)。最近鄰分類器(1-NN,K-NN)相似度量以檢測樣本到模板的距離為判據(jù)。當模板庫中每類只有一個模板時,NN就退化為NC。距離的測度主要有L1范數(shù)、L2范數(shù),馬氏距離,Hausdorff距離等。貝葉斯分類器如果知道各類的先驗分布和條件分布,就可以采用最大后驗估計(MAP)的方法進行分類。在人臉識別中,有時假定人臉服從高斯分布,能夠得到不錯的結果7。支撐向量機(SVM)是基于結構風險最小化得出的。尤其在小樣本情況下,既降低了訓練集的錯分風險,又降低了未知人臉(如檢測集)的錯分風險。在人臉識別中已逐漸得到應用。神經(jīng)網(wǎng)絡分類器(NN
25、C)。采用神經(jīng)網(wǎng)絡作為分類器是很自然的。一般一個3層網(wǎng)絡對應模式識別中圖像輸入、特征提取、分類3部分。通常的NNC有多層感知機(MLP)模型、BP網(wǎng)絡、徑向基函數(shù)網(wǎng)絡等。SVM也借鑒了神經(jīng)網(wǎng)絡的思想。1.4 本文研究的主要內容基于人臉識別技術在當今社會的重大意義,本文主要研究了Gabor小波變換和PCA算法在人臉識別的應用。人臉識別的核心問題,就是如何將人臉的特征抽取出來,并得到對應于不同分類方法進行分類。因此算法的好壞就直接影響了最終的正確識別結果。算法的好壞主要體現(xiàn)在提取特征的效率和準確率。本論文主要探討Gabor小波變換和PCA算法的優(yōu)點。其中,仿真實驗是基于ORL人臉庫和yale人臉庫
26、上進行測試的。首先,本文將研究Gabor小波變換的性質及其在圖像處理上的優(yōu)點。用Gabor小波變換研究人臉識別,事實上就是Gabor濾波器的設計,Gabor濾波器在圖像處理中的特征提取、紋理分析和立體視差估計等方面有許多應用。Gabor濾波能夠體現(xiàn)出不同的方向性和尺度性。Gabor函數(shù)從實質上來說是一個Gauss函數(shù)窗所限制的濾波函數(shù)。通過定義不同的Gabor函數(shù)核,就可以得到一組Gabor濾波器。通常將灰度人臉圖像記為I(x,y),再分別各個Gabor濾波器進行卷積,即可得到人臉圖像的Gabor小波表示。然后,再探討PCA算法的原理,PCA算法是一種經(jīng)典的算法,由于PCA變換基函數(shù)的個數(shù)往往
27、遠小于信號的維數(shù),因此PCA變換能夠大大降低數(shù)據(jù)的表示維數(shù)。這對圖像識別中的特征提取非常有利。PCA算法是根據(jù)樣本點在多模式空間的位置分布,以樣本點在空間中變化最大方向,即方差最大的方向,作為判別變量來實現(xiàn)特征的提取。因此比較適合用于gabor變換后的降維。最后分別在ORL和YALE兩個人臉庫進行實驗,不斷改進算法模型,不斷向識別率高,識別效率高改進。第2章 Gabor小波變換2.1引言Gabor展開是一種同時用時間和頻率表示一個時間函數(shù)的方法,而求解Gabor展開系數(shù)的公式被稱為Gabor變換。傳統(tǒng)的Gabor變換的缺點是窗口尺寸一經(jīng)確定就無法更改,因此不具有變焦特性,無法對信號進行多分辨率
28、分析。為解決這一問題人們將Gabor理論同小波理論相結合,提出了Gabor小波。Gabor小波具有小波變換的多分辨率特性,同時具有Gabor函數(shù)本身所具有的局域性和方向性。 標準傅立葉變換是數(shù)字信號處理的有利工具,然而它只能反映信號在整個實軸的整體性質,而不能反映信號在局部時間范圍中的特征。對于圖像,我們關心的往往是局部的特征,如圖像邊緣,由于標準傅立葉變換不能同時在時域和頻域具有對信號的局部分析能力,Dennis Gabor于1946年在他的論文中,為了提取信號傅立葉變換的局部信息,引入了一個時間局部化“窗函數(shù)”,其中參數(shù)用于平移動窗以便覆蓋整個時域。實際上,Gabor使用了一個Gaussi
29、an函數(shù)作為窗函數(shù)。因為一個Gaussian函數(shù)的傅立葉變換還是一個Gaussian函數(shù),所以傅立葉逆變換也是局部的。Gabor變換是唯一能夠達到時頻測不準的下界的函數(shù),是圖像表示中一種較好的模式,它的最大優(yōu)點在于它能夠達到交叉熵的最低邊緣,能夠最好地兼顧信號在時域和頻域的分辨率,而且人類的視覺系統(tǒng)對于這種函數(shù)有非常好的匹配特性。Gabor函數(shù)的這些特性,使得它在信號處理中獲得廣泛的應用,特別應用于低級視覺如紋理分割、光流估計、數(shù)據(jù)壓縮和邊緣檢測等。Gabor變換雖然在一定程度上克服了標準傅立葉變換不具有局部分析能力的缺陷,且能最好地兼顧信號在時城和頻域地分辨率,但它同時也存在著自身不可克服的
30、局限,即當窗函數(shù)確定后,窗口的形狀就確定了,因此Gabor變換是一種單一分辨率的分析8。 目前Gabor變換和Gabor展開已被公認是信號與圖像表示的最好的方法之一。Gabor變換中要解決的最基本問題是:在給定綜合窗下如何求解分析窗及Gabor變換系數(shù)。Gabor變換廣泛應用的困難也就是在于找不到一種簡單的計算變換系數(shù)的方法,因為Gabor基本函數(shù)彼此之間互不正交。近十幾年來,圍繞這一問題國內外相繼提出了很多解決方法,最主要的有以Bastiaans、Wexler和Qian等人為代表的解析法,Daugman等人提出的神經(jīng)網(wǎng)絡方法以及Ibrahim等人提出的自適應學習算法等等。但不論上述哪一種方法
31、,均為復數(shù)形式的Gabor變換。Gabor基本函數(shù)、Gabor展開系數(shù)、雙正分析窗函數(shù)求解的約束條件式及Gabor展開式都是復數(shù)形式,計算量很大。為了簡化Gabor變換的計算,提出了一種實數(shù)形式的離散Gabor變換(RDGT)方法,這種方法類似于復數(shù)形式的離散Gabor變換的解析理論體系,并可采用快速的離散Hartley變換算法計算Gabor變換系數(shù),尤其是實數(shù)形式的離散Gabor變換系數(shù)與復數(shù)形式的離散Gabor變換系數(shù)的實部和虛部有著非常簡單的加減關系,因此前者的計算完全可以替代后者的計算,從而達到大大減小Gabor復變換系數(shù)計算量的目的;同樣,在信號的重建方面,實數(shù)形式的離散Gabor逆
32、變換也比復數(shù)形式的離散Gabor逆變換快得多,并且在實際應用中,實值Gabor變換更方便于軟件和硬件的實現(xiàn)910。2.2 Gabor小波變換的定義由于Fourier變換存在著不能同時進行時間和頻率局部分析的缺點,1946年Gabor提出了一種加窗的Fourier變換方法,它在非平穩(wěn)信號分析中起到了很好的作用。在Fourier變換中,把非平穩(wěn)信號過程看作是一系列短時平穩(wěn)信號的疊加,而短時性是通過時間上加窗來實現(xiàn)的。整個時域的覆蓋是由參數(shù)的平移達到的。換句話說,該變換是用一個窗函數(shù)與信號相乘實現(xiàn)在附近開窗和平移,然后施以Fourier變換,這就是Gabor變換也稱短時Fourier變換或加窗Fou
33、rier變換。Gabor變換的定義由下式給出:對于, (2-1) 其中是積分核。該變換在點附近局部測量了頻率為的正弦分量的幅度。通常選擇能量集中在低頻處的實偶函數(shù);Gabor采用高斯(Gauss)函數(shù)作窗的函數(shù),相應的Fourier變換以后仍舊是Gauss函數(shù),從而保證窗口Fourier變換在時域和頻域內均有局部化功能。令窗口函數(shù)為,則有 (2-2)式中a決定了窗口的寬度,的Fourier變換用表示,則有 (2-3)由以上可以得到 (2-4)顯然,信號經(jīng)過Gabor變換按窗口寬度分解了的頻譜,提取出它的局部信息。當在整個時間軸上平移時,就給出了Fourier的完整變換。相應的重構公式為: (2
34、-5)窗口Fourier變換是能量守恒變換,即 (2-6) 這里應注意,積分核對所有和都有相同的支撐區(qū),但周期數(shù)隨而變化。支撐區(qū)是指一個函數(shù)或信號的自變量的定義域,當在定義域內取值時的值域不為零,在支撐區(qū)之外信號或過程下降為零。 為了研究窗口Fourier變換的時頻局部化特性就要研究和的特性。這里是的Fourier變換。由于Fourier變換是能量守恒的,所以有Parseval定理存在。即: (2-7)這里的和分別是和的復共軛函數(shù),當為實數(shù)時,兩種表示是相等的。如果把上述函數(shù)乘積的積分運算用內積符號表示,則有 (2-8)其中和都是在實數(shù)域的平方可積函數(shù)。由此: (2-9)當時有: 其中叫做的范
35、數(shù)。這一表達式的物理意義是Fourier變換的時域和頻域的一對共扼變量具有對易關系,從而使Fourier變換與加窗口的Fourier變換具有對稱性。如果用角頻率變量代替時間變量,用頻域窗口函數(shù)代替時域窗口函數(shù)則可得到: (2-10) 這里是時域窗口函數(shù)的Fourier變換。該式的意義在于頻域中的信號通過窗口函數(shù)的加窗作用獲得了在頻域附近的局部信息即: (2-11)如果選用窗口函數(shù)在時域和頻域均有良好的局部性質,那么可以說Fourier變換給出了信號的局部時一頻分析。這樣就有利于同時在頻域和時域提取信號的精確信息。2.3 Gabor變換在人臉識別中的應用 Campben和Robson提出并在心理
36、學實驗中證實,人類的視覺具有多通道和多分辨率的特征,因此,近年來基于多通道、多分辨率分析的算法受到廣泛重視11。在諸如信號檢測、圖象壓縮、紋理分析、圖象分割和識別等領域,Gabor小波得到了非常廣泛的應用。大量基于簡單細胞接受場的實驗表明,圖像在視覺皮層的表示存在空域和空頻域分量,并且可以將一幅圖像分解為局部對稱和反對稱的基函數(shù)表示,Gabor函數(shù)正是這種基信號的良好近似。Lee.T.S用ZD一Gabor小波來表征圖像,將Daubeehies的一維框架理論拓展到二維,并證明在一定條件下,ZD一Gabor小波是緊框架,原圖像能從小波系數(shù)重建,因此用小波變換的系數(shù)幅值作為特征來匹配有著良好的視覺特
37、性和生物學背景,Gabor小波的這些特性使得其對于亮度和人臉表情的變化不敏感,在人臉識別和圖像處理中有著廣泛的應用。Lades等首先提出用基于Gabor變換的彈性圖匹配算法進行人臉識別。節(jié)點上的Gabor濾波響應作為人臉特征,通過特征匹配和節(jié)點幾何位置的匹配實現(xiàn)人臉識別。2.4 Gabor濾波器 在實驗室中我們用的最多的是Gabor濾波器。根據(jù)Gabor變換的原理和實際需要,可構造不同的Gabor濾波器。Gabor濾波器在圖像處理中的特征提取、紋理分析和立體視差估計等方面有許多應用。有研究表明神經(jīng)細胞的感受也可以用Gabor函數(shù)來表示。Gabor濾波能夠體現(xiàn)出不同的方向性和尺度性。Gabor函
38、數(shù)從實質上來說是一個Gauss函數(shù)窗所限制的濾波函數(shù)。通過定義不同的Gabor函數(shù)核,就可以得到一組Gabor濾波器。Gabor核函數(shù)的定義: (2-12)Gabor濾波可以定義為: (2-13)下面我們對式(4-12)中的各項參數(shù)作一個說明:是一個振蕩函數(shù),實部為余弦函數(shù),虛部為正弦函數(shù)。是Gauss函數(shù),這實際上是通過加窗限制了函數(shù)的范圍,使其在局部有效。由Gauss函數(shù)的局部性可知,這個濾波器實際上抽取x附近的特征,因此可以看作是一種Gabor小波。是直流分量,這樣濾波器就可以不受直流分量大小的影響。 向量描述了濾波器對不同方向和不同尺度的響應,通過選取一系列的,就得到了一族Gabor濾
39、波器,是一個常量,和一起刻畫了Gauss窗的波長。這里取=/2,可以表示為: 這里 (2-14)選取不同的下標可以描述不同的Gauss窗波長,從而控制采樣的尺度。選取不同的下標可以描述振蕩函數(shù)不同的振蕩方向,從而控制采樣的方向。我們這里選取=0 ,.,4這樣可以在5個不同的尺度上采樣。選取=0 ,.,7這樣就可以在8個不同的方向上采樣13。各個濾波器窗口的大小為32×32,確定濾波器的所有參數(shù)(可自己決定)后,當采取上述的參數(shù)后,可得如下圖2-1的40個濾波器。圖2-1 Gabor 5個尺度8個方向的濾波器族的實部2.4.1 Gabor濾波器參數(shù)的選擇 由于不同,u代表了不同的采樣方
40、式,因此需要保證在不同的尺度和不同方向上的采樣盡量均勻。一些研究表明0, 區(qū)間可以描述所有的方向,因此只需對區(qū)間0, 進行采樣。也就是說:+方向上的濾波完全可以由?方向的結果確定。由于的變化是連續(xù)的,不可能取無窮多個,必須對其進行離散均勻采樣。因此這里我們選取作為采樣間隔,反映了空間尺度上采樣。由于尺度的大小實際上決定于Gauss窗的大小,而其窗長正比于,由于是在二維上的采樣,因此其面積正比于。為了反映尺度上的合理采樣,實驗表明每次采樣的面積成倍的方式遞減比較合理,是一個常量,這就要求。Gabor濾波器利用公式定義的卷積,就可以在圖像每個不同的處得到個不同復值的濾波結果12。2.4.2 Gab
41、or濾波器的性質和計算方法 (1)Gabor濾波器的性質1 Gabor濾波器具有生物學的意義。Gabor核函數(shù)與脊椎動物大腦視覺區(qū)域皮層細胞的感受行狀十分類似。2 Gabor濾波器能充分描述圖像的紋理信息。Gabor濾波特性說明了Gabor濾波結果是描述圖像局部灰度分布的有力工具。因此,圖像的紋理信息可以用Gabor濾波作為特征抽取的方法。3 對二維Gabor濾波的研究表明,通過恰當選擇若干個Gabor核函數(shù)可以重構出原圖像。4 Gabor核函數(shù)由于去掉了直流分量,對局部光照影響不敏感。這和直接將圖像的灰度特征作為模板相比,優(yōu)勢是很明顯的。5 Gabor濾波結果可以描述不同方向上灰度的分布信息
42、。6 Gabor濾波結果可以描述不同尺度上灰度的分布信息。一般來說,大尺度濾波可以描述全局性較強的信息,同時可以掩蓋掉圖像中噪聲的影響,而小尺度濾波可以描述比較精細的局部結構,受噪聲影響也大。7 核函數(shù)有良好的頻域特性。Gabor核函數(shù)在頻域內的形狀和空域內的形狀完全相同。8 Gabor濾波可以容忍圖像有一定的平移、旋轉、深度上的轉動、尺度變化等情況。 (2)Gabor核函數(shù)的計算方法由于輸入的圖像為灰度圖像,這就是直接的離散化表示。從Gabor核函數(shù)的定義公式可以看出,由于Gauss窗函數(shù)的限制,Gabor核函數(shù)只在一個局部非零,因此我們只需要對其局部進行離散抽樣即可。抽樣范圍的大小由Gau
43、ss窗的大小所確定,這里我們取作為抽樣半徑。2.4.3 Gabor變換的人臉特征提取 根據(jù)以上分析,我們知道Gabor變換在人臉特征提取方面具有很多優(yōu)點,前面定義的Gabor小波是一組帶通濾波器,通過參數(shù)的選擇,每一組濾波器具有各自的頻率選擇性和方向選擇性,這樣不同方向和尺度的濾波器覆蓋整個頻域,從而一幅人臉圖像的Gabor特征表示就是該圖像和一族Gabor小波卷積的結果。 假設表示一幅圖像的灰度分布,則其Gabor特征表示為: (2-15) 其中,是Gabor核函數(shù),是尺度,方向的Gabor小波卷積結果。在這里,我們選用5個尺度8個方向的Gabor小波,即0 ,.,4,0,.,7,其于參數(shù)設
44、為以及為了包含不同的空間尺度和方向的Gabor濾波特征,一般將一幅圖像的所有尺度方向Gabor濾波變換表示成一個級聯(lián)的特征矢量。由于一般圖像的維數(shù)比較高,直接將所有尺度、方向的Gabor小波變換特征級聯(lián)會導致維數(shù)大而難于處理,因此有必要對圖像的各個Gabor小波表示進行下采樣處理,假設下采樣因子為,則一幅圖像的特征矢量為: (2-16) 從特征提取的角度出發(fā),對人臉圖像的不同尺度不同方向的Gabor濾波可以認為是提取了人臉圖像具有不同性質的特征,因此對于一般所采用的5尺度8方向的Gabor小波,可以認為其對人臉圖像的濾波得到了40組具有不同性質的特征矢量,一般都將這40組特征矢量簡單級聯(lián)成一個
45、長特征矢量,然后在對該特征矢量進行學習和識別分類,而不考慮各組特征矢量的有效性問題,即哪些尺度和方向的Gabor濾波特征更能反應人臉之間互相區(qū)別的本質特征。以下是Gabor變換人臉提取特征的流程圖: 下采樣特征提取FFT變換Gabor核函數(shù)乘法器FFT變換圖像輸入 圖2-2 Gabor變換人臉提取特征流程圖 從以上流程圖可以得出一幅人臉圖像(如圖2-3)經(jīng)Gabor小波變換后的結果,如圖2-4所示:圖2-3原始圖像截取圖2.5 Gabor快速算法圖 前面我們通過實驗分析了Gabor變換在人臉特征提取中的重要作用,在這一章中,我們就著重介紹Gabor的快速算法。由于我們所說的Gabor變換的快速
46、算法是基于傅里葉快速算法而來的,所以我們先介紹傅里葉快速算法。離散傅里葉變換(DFT)在信號的頻譜分圖2-4 Gabor小波變換后的圖像析、系統(tǒng)的分析、設計和實現(xiàn)中得到了廣泛的應用,原因之一就是計算DFT有很多的快速算法,快速傅里葉變換(FFT)算法就是其中之一。在使用數(shù)字信號處理技術的各種各樣的應用領域里,F(xiàn)FT算法都起著極為重要的作用。設為N點的有限長序列,則其正變換DFT為: (2-17) 逆變換OFT為: (2-18) 通常我們用算法所需的乘法和加法運算次數(shù),來衡量各種算法的復雜性和效率。這里的通常都是復數(shù),于是整個DFT運算就需要N2次復數(shù)乘法和N(N-1)次復數(shù)加法。因此,直接計算
47、DFT,乘法和加法的次數(shù)都與N2成正比。 當N較大時,計算量太大,無法得到實際的應用。2.5.1快速傅里葉變換(FFT) 自從1965年圖基(J.W.Tuky)和庫利(T.W.Coody)在計算機數(shù)學(Math.Computer,Vol.19,1965)雜志上發(fā)表了著名的機器計算傅里葉級數(shù)的一種算法論文之后桑德(G.Sand)、圖基等快速算法相繼出現(xiàn),又經(jīng)人們進行改進,很快的形成一套高效運算方法,這就是現(xiàn)在的快速傅立葉變換,簡稱FFT,這種算法使DFT運算效率提高1-2個數(shù)量級,為數(shù)字信號處理技術應用于各種信號的實時處理創(chuàng)造了良好的條件,大大推動了數(shù)字信號處理技術的發(fā)展。 快速傅里葉變換的算法
48、有很多,主要的算法有: 時間抽取(DIT)基-2FFT算法。這種算法是將輸入序列在時域上的次序按偶數(shù)和奇數(shù)來抽取,對于任意一個N =2M點長序列的DFT運算,可以采用M次分解,最后分解成2點的DFT運算的組合,從而降低了運算量。DIT的運算量為: 復數(shù)乘法次數(shù):Mp=(N/2)M=(N/2)log2N 復數(shù)加法次數(shù):ap=Nlog2N (1)頻域抽取(DIF)基2FFT算法。與DIT算法相對應,DIF算法是把頻域輸出X(k)按k是偶數(shù)或是奇數(shù),逐級分解成2點的DFT運算,其原理與DIT算法相對偶,運算量也與DIT算法的相同,這里不再贅述。 (2)N為復合數(shù)的FFT算法。這是統(tǒng)一的FFT算法,而
49、前面的DIT算法、DIF算法不過是在輸入序列的列長為N=2的統(tǒng)一FFT算法的特例而已。這種算法是把DFT的運算通過分解成很多短長度的DFT來完成的.如果能分解成4點或2點的DFT,因不需要乘法,可減少旋轉因子的數(shù)量,運算量更少。N為復合數(shù)時的FFT算法,采用下標映射是個關鍵,然后再分別對列(或行)和行(或列)求小點數(shù)長度的DFT,并用旋轉因子做各小點數(shù)DFT間運算的媒介,但這同時也帶來了運算量的增加。 若復合數(shù)N=LM,則其FFT的運算量大致為: 復數(shù)乘法次數(shù):N(M+L+1) 復數(shù)加法次數(shù):N(M+L-2) 分裂基FFT算法(SRFFT)。這是一種利用將基-2和基-4于變換的不同部位,進一步
50、改善固定一基和混合一基的算法,其基本思路是對偶序號輸出使用基-2算法,對奇序列輸出使用基-4算法,將大點數(shù)的DFT逐級分解成小點數(shù)的DFT運算。由于分解的不對稱性,算法結構比固定-基算法稍微復雜一些,是目前針對N =2M的算法中具有最少乘法和加法次數(shù)的,又允許以同址計算和蝶形方式實現(xiàn),所以被認為是最好的快速傅里葉變換算法。其運算量為: 實數(shù)乘法次數(shù):Nlog2N-3N+4 實數(shù)加法次數(shù):Nlog2N-3N+4(3)素因子算法(PFA)。當復合數(shù)N可以按照Good映射分解為幾個互素因子的乘積時,其FFT變換就可以避免旋轉因子的影響。PFA算法就是采用了Good映射,將長度為N=N1*N2的一維D
51、FT轉換成尺寸為N=N1×N2的二維DFT,然后以行列方式沿每一維采用最有效的算法計算這個二維的DFT。該算法的運算量為:乘法次數(shù):m(N)=N2m(N1)+N+N1*m(N2)其中m(N)表示計算N點DFT需要的總乘法次數(shù)。 (4)Winograd傅里葉變換算法(WFTA)。該算法利用了Good映射將長度為“大N”因子的DFT分解成若干“小N”因子的連乘,再利用“小N”因子的DFT,就可以得到“大N”因子的DFT?!靶”因子的DFT是指2,3,4,5,7,8,9和16點的DFT。WFTA算法結構比FFT復雜的多,程序編譯的時間也長,但運算速度比較快。WFTA算法被證實為具有最少的
52、乘法和加法次數(shù)的算法,該算法除了用到下標映射外,還涉及到數(shù)論和近代數(shù)的知識。 (5)實序列的FFT。對于輸入為實數(shù)序列的FFT沒有必要專門編寫實數(shù)據(jù)的FFT,而是直接利用復數(shù)據(jù)FFT進行計算。利用DFT奇偶對稱性質,可以用一個N點的FFT同時運算兩個N點實序列,或者是用一個N點的FFT運算一個2N點的實序列。前者是把一個實序列作為實部,同時另一個實序列作為虛部,計算FFT后再把輸出按奇、偶、虛、實特性加以分離,后者是將2N長的實序列的偶序號置為實部,奇序號置為奇部,同樣在計算FFT后再加以分離。用一個N點的FFT運算一個2N點的實序列的運算量為: 乘法次數(shù):m2f=N/2(4+log2N) 加
53、法次數(shù):a2f=N(4+log2N)主要有4類計算二維FFT的方法。即行一列算法、矢量一基算法(VR)、嵌套算法、多項式變換算法。行一列算法實現(xiàn)最容易,僅要求有效的一維FFT算法即可。而多項式變換因為具有最低的算術復雜性,同址計算的可能性和實現(xiàn)工作量不大的優(yōu)點,受到人們的普遍重視。二維FFT的一個重要參數(shù)是考慮存儲器的存取次數(shù)。更高維的FFT變換可以類似得到,但在實際應用中采用的不多。2.5.2Gabor變換的快速算法 我們只要把Gabor變換轉換成傅立葉形式,根據(jù)FFT快速算法將乘法轉換成加法就可以了。下面我們對其做具體的介紹。DFT的卷積公式定義如下: 若,DFT=X(),DFT=H(),
54、則 =IDFTX()H(),但是,我們需要注意的是:進行的是循環(huán)卷積,循環(huán)卷積的定義如下:其中: 表示的圓周移位序列, 其實質上與的含義類似。從直觀上說,就是對兩個卷積的函數(shù)重疊部分以外都用周期延拓的方式填充。 線性卷積的定義如下:從直觀上說,就是當兩個卷積的函數(shù)重疊部分以外都用零填充。在實際中我們提取特征需要的是線卷積的結果。如果將序列和都適當?shù)难a零,設長度為I,長度為M,則當我們將和都補零到長度為時,圓卷積和線卷積結果相同。在實際實驗中,我們將濾波器組和圖像都補零到256,這樣可以滿足上面的補零要求。在這種情況下,對于一幅圖像,如果我們的濾波器組是事先計算好的,則只需要進行1個FFT(對圖像),40個乘法(圖像FFT的結果與濾波器相乘),40個工FFT(對相乘結果進行)。同時256是2的8次冪,2D-FFT的計算復雜度為N2log2N。由此,復雜度大大減少。2.6 本章小結 本章主要介紹了Gabor小波變換的具體原理和實際應用,及用于人臉識別的具體算法,事實上,Gabor小波變換最主要就是一個濾波器設計的問題,通過采取不同的方向和尺度,不同的波長和頻率,就可以得到不同的濾波器,本文是采用了一般所采用的5尺度,8方向的Gabor小波,同時取,可以認為其對人臉圖像的濾波得到了40組具有不同性質的特征矢量,一般都將這40組特征
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 紡織品及針織品市場營銷策劃考核試卷
- 2024年的微生物研究新方向試題及答案
- 2025年【保育員(高級)】模擬考試題及答案
- 玉米種植農業(yè)產業(yè)鏈現(xiàn)代化推進考核試卷
- 磨制谷物在農業(yè)與食品安全產業(yè)協(xié)同發(fā)展的社會效益考核試卷
- 工業(yè)自動化與智能港口運營考核試卷
- 2023年中國電信寧波分公司杭州灣新區(qū)分局招聘筆試參考題庫附帶答案詳解
- 全部土方外運 施工方案
- 稀有金屬加工中的企業(yè)社會責任與環(huán)境保護措施實施考核試卷
- 生物質能發(fā)電與氣候變化適應性考核試卷
- 2023年中考語文一輪復習考點梳理+對點訓練(原卷版+解析版)(打包7套)
- 幼兒繪本故事:如果不洗澡
- 2022年《趣味接力跑》教案
- 農業(yè)機械使用與維護課程標準
- 汽輪機上缸吊出及翻缸風險分析及管控措施
- 普通高中學生綜合素質檔案填寫樣表
- 管道機器人畢業(yè)設計正文
- 國電南自PSL 641U線路保護測控裝置技術說明書V1.1
- 2022年國網(wǎng)輸變電工程質量通病防治工作要求及技術措施[1]
- 出口退運貨物追溯調查情況說明表
- 49.5MW風電場變電所電氣部分設計
評論
0/150
提交評論