一種改進(jìn)的ldp人臉描述方法_第1頁
一種改進(jìn)的ldp人臉描述方法_第2頁
一種改進(jìn)的ldp人臉描述方法_第3頁
一種改進(jìn)的ldp人臉描述方法_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

一種改進(jìn)的ldp人臉描述方法

1局部二元模式人臉描述方法人臉識別廣泛應(yīng)用于門禁系統(tǒng)、攝像頭監(jiān)控系統(tǒng)、身份識別、網(wǎng)絡(luò)支付、信息安全、刑事司法等領(lǐng)域。隨著軟硬件技術(shù)的發(fā)展,人臉識別領(lǐng)域在最近幾十年獲得了長足的發(fā)展。人臉描述是人臉識別系統(tǒng)的核心技術(shù),這一問題受到了普遍關(guān)注,涌現(xiàn)出了大量的人臉描述方法。根據(jù)人臉表示數(shù)據(jù)的空域特性,可將人臉描述方法分為基于全局特征[1,2,3,4,5,6,7,8,9,10,11]和基于局部外觀特征兩大類。其中,局部二元模式(LBP,localbinarypatters)人臉描述方法由于其簡單的原理和卓越的人臉識別性能受到了廣泛的關(guān)注,文獻(xiàn)和對原始LBP算子和擴(kuò)展算子LBPu2P,R作了詳盡的論述。但是,LBP具有對非單一光照的變化和隨機(jī)噪聲比較敏感的缺點(diǎn)。為此,Jabid等人提出了一種對噪聲更具魯棒性的局部方向模式(LDP)人臉描述方法。LDP充分利用局部邊緣梯度信息進(jìn)行人臉特征的表達(dá),但是LDP僅僅參照了局部3×3鄰域的梯度信息而忽視了更大范圍的梯度信息。從對噪聲信號進(jìn)行平滑操作的角度,小范圍采樣受到噪聲干擾的程度要大于大范圍采樣。本文針對LDP的不足提出了一種改進(jìn)的LDP(ILDP)方案,利用局部井型鄰域的邊緣梯度值進(jìn)行人臉特征提取。實(shí)驗結(jié)果表明,無論是復(fù)雜面部的狀態(tài)變化情況,還是在無人眼定位等圖像預(yù)處理情況,ILDP比同類基于局部紋理的單一人臉描述器更具魯棒性。2il審判2.1局部作用下的ldp模式人臉圖像的每個像素點(diǎn)都有一個局部3×3鄰域,該像素點(diǎn)處于鄰域的中心。鄰域中心像素點(diǎn)的四周8個點(diǎn)處于不同的方向,從正東、東北、正北、西北、正西、西南、正南、直到東南。將該局部3×3鄰域的灰度值與8個Kirsch模板(參見圖1)卷積得到8個邊緣梯度值mi(i=0,1,…,7),這些梯度值分別位于上述8個不同的方向。一個LDP模式表示為一個八位二進(jìn)制數(shù)——LDP碼,該數(shù)的每一位分別代表這8個方向。將邊緣梯度值的絕對值|mi|進(jìn)行排序,求出第k大的值|mk|,并將大于等于|mk|的|mi|對應(yīng)的第i位二進(jìn)制數(shù)設(shè)置為1,剩余8-i位設(shè)置為0。圖2給出了LDP碼的計算過程,圖3給出了k=3時計算LDP碼的一個實(shí)例。2.2ildp碼的計算為考察局部更大范圍的梯度信息,設(shè)計了局部井型鄰域,如人臉圖像某中心像素點(diǎn)(i,j)的井型鄰域參見圖4。井型鄰域與傳統(tǒng)的3×3鄰域相比采樣范圍更廣,包含采樣半徑R=1和R=2;而與傳統(tǒng)的5×5鄰域相比采樣點(diǎn)更少,只有16個像素。同時,以(i,j)點(diǎn)為中心,井型鄰域的16個采樣點(diǎn)所在徑線不重疊,這保證了在采樣充分的前提下而避免了信息的冗余。ILDP將局部中心像素的井型鄰域16個像素根據(jù)采樣半徑(R=1或2)分成兩組{Pi}和{Qi}(i=0,1,…,7)并排列成兩個3×3子鄰域,將{Pi}和{Qi}分別與8個Kirsch模板卷積,得到兩組邊緣梯度值{pi}和{qi}。邊緣梯度值pi和qi的正負(fù)號代表兩個相對立的梯度變化趨勢,正號表示梯度上升,而負(fù)號表示梯度下降。再加上人臉圖像局部像素灰度值在空域存在相關(guān)性,因此ILDP不對邊緣梯度求絕對值,而直接利用{pi}和{qi}中各自的最大值的方向作為局部特征信息,同時用pi或qi的下標(biāo)i代表pi或qi所在的方向。設(shè)pa是{pi}的最大值,qb是{qi}的最大值,中心像素的ILDP模式可用一個兩位的八進(jìn)制數(shù)(ab)8表示,稱該數(shù)為ILDP碼,可由ILDPcode=a×81+b×80(1)轉(zhuǎn)換為十進(jìn)制數(shù)。a和b均可取8個值,所以ILDP模式共有82=64種。圖5描述了ILDP碼的完整計算過程。一張人臉圖像的所有像素分別以己為中心獲取井型鄰域并轉(zhuǎn)換成ILDP碼,所有像素的ILDP碼根據(jù)原圖坐標(biāo)排列而形成對應(yīng)的ILDP圖,該人臉圖像就可用對應(yīng)的ILDP圖代表。圖6給出了一張來自YALE人臉庫的人臉圖像和對應(yīng)的ILDP圖。2.3子塊直方圖的形成通過對人臉圖像的ILDP圖進(jìn)行直方圖統(tǒng)計提取人臉的鑒別特征,直方圖包含了局部邊緣梯度值的分布信息。為了獲取空域的信息可將人臉圖像劃分成一定數(shù)量的子塊B1,B2…Bm,分別提取每一個子塊的直方圖HRi=(hi,0,…,hi,63)。直方圖為hi?j=∑x?yJ((x?y)∈Ri)J(C(x?y)=Cj)?1≤i≤m;0≤j≤63(2)其中:C(x,y)是像素(x,y)的ILDP碼,J(A)是一個布爾函數(shù),當(dāng)A為真時函數(shù)值為1,反之為0。將各子塊的直方圖連接形成連接直方圖,該連接直方圖作為人臉的特征表達(dá),圖7給出了連接直方圖的形成過程。最終,提取的人臉特征由一個64×m維向量(即連接直方圖)所描述。2.4log相似性統(tǒng)計在人臉識別階段,可用直方圖正交、Log相似性統(tǒng)計和卡方統(tǒng)計等非相似性度量工具計算提取的人臉連接直方圖間的距離。Log相似性統(tǒng)計在小窗口尺寸上性能較差,卡方統(tǒng)計的性能比直方圖正交更好,故本文采用卡方統(tǒng)計非相似性度量。卡方非相似性度量定義為χ2(Η1?Η2)=∑i(h1i-h2i)2h1i+h2i(3)另外,為簡便,采用最近鄰分類器進(jìn)行分類,這并不影響對同類描述器的性能對比結(jié)果。3溫度和圖像域變換操作通過實(shí)驗對幾種性能最佳的基于局部紋理特征的單一人臉描述器的性能進(jìn)行評估,包括CS-LBP、LDP、LBPu28,1和本文提出的ILDP。所謂單一人臉描述器是指該方法沒有采用圖像域變換和圖像濾波等復(fù)雜操作,這些操作不僅大大增加了時間開銷,而且破壞了實(shí)驗對比的公平環(huán)境。比如Gabor小波變換對CS-LBP、LBP、LDP、ILDP的鑒別性能都有所提高,但是性能提高有限而時間開銷大幅上升。實(shí)驗分為兩個類型,第1類是常規(guī)的無人為添加噪聲的實(shí)驗,第2類是人為添加噪聲的實(shí)驗。所有的實(shí)驗均在IntelT2350+RAM1G+WindowsXP平臺上進(jìn)行,使用Matlab7.9得出實(shí)驗數(shù)據(jù)。3.1對orl人臉庫的選擇為驗證在既包含光照變化又包含表情和小飾物變化的情況下識別性能的對比,選擇YALE人臉數(shù)據(jù)庫。YALE庫包含15個人,每個人11張共計165張圖片。每個人的圖片包含光照(左、中、右),表情(正常、高興、悲傷等)和小飾物(戴眼鏡、不戴眼鏡)的變化。所有圖片根據(jù)人的兩眼坐標(biāo)進(jìn)行校準(zhǔn),然后裁剪并調(diào)整分辨率為100pixel×100pixel,圖8(a)給出了一個人經(jīng)過預(yù)處理后的11張人臉圖像。為了驗證在沒有人眼標(biāo)定、坐標(biāo)重定位、分辨率調(diào)整并進(jìn)行裁剪等有利于識別的預(yù)處理情況下的識別性能,ORL人臉庫被選作第2個實(shí)驗數(shù)據(jù)庫。ORL人臉庫包含40個人的400張圖片,每個人10張。每個人的圖片包含表情(閉眼和睜眼、笑和不笑)、面部有無眼鏡以及10%以內(nèi)的尺度變化,同時部分人的部分圖片是在不同的時間采集的。所有圖片背景都是黑色,分辨率是92pixel×112pixel,部分圖片有20°以內(nèi)的角度變化。對該庫的圖片不做任何的預(yù)處理,圖8(b)給出了其中一個人的10張圖片。另外,以上兩個個實(shí)驗庫的圖片格式都為BMP。3.2實(shí)驗結(jié)果和討論共進(jìn)行兩組實(shí)驗,分別在上述的兩個實(shí)驗數(shù)據(jù)庫中進(jìn)行。YALE庫和ORL庫中圖片都劃分成5×5個子塊。同時,為比較不同大小訓(xùn)練集情況下的識別性能,隨機(jī)選擇每個人的k(k=2,3,4,5,6)張樣本圖像構(gòu)成訓(xùn)練集,剩余的樣本圖像形成測試集。每一種情況重復(fù)10次實(shí)驗,記錄實(shí)驗中的正確識別率,并計算平均識別率和標(biāo)準(zhǔn)偏差。表1給出了在YALE人臉庫上的實(shí)驗結(jié)果,表2給出了ORL庫上的實(shí)驗結(jié)果。表1的數(shù)據(jù)表明,ILDP在有光照、表情和小飾物變化下的人臉識別性能優(yōu)于LDP和CS-LBP,跟LBPu28,1的性能互有高低。表2的數(shù)據(jù)表明,在無進(jìn)一步圖像預(yù)處理的ORL人臉庫中,ILDP的性能要稍優(yōu)于其它幾種方法。3.3實(shí)驗結(jié)果和討論分別在YALE人臉庫和ORL人臉庫上進(jìn)行兩組實(shí)驗,同樣將圖像劃分為5×5個子塊。這里不再考察訓(xùn)練樣本數(shù)對識別率的影響,故將每個人的前5張圖像作為訓(xùn)練樣本,剩余的圖像作為測試樣本。由于現(xiàn)實(shí)中噪聲來源復(fù)雜,并且每張圖像受噪聲污染的程度也千差萬別,因此試驗中很難準(zhǔn)確模擬噪聲污染的各種參數(shù)。采用人臉識別仿真實(shí)驗中常規(guī)的添加噪聲方式。首先,只對測試樣本圖像人為添加噪聲,而訓(xùn)練樣本沒有故意添加的噪聲;其次,噪聲模型選擇高斯白噪聲,其均值設(shè)為0,歸一化方差分別設(shè)置為0.0001,0.0002,0.0003,0.0004,0.0005。在每一個實(shí)驗庫中一個特定設(shè)置的噪聲參數(shù)下進(jìn)行10次實(shí)驗,記錄每次實(shí)驗的正確識別率并計算每一種情形下的平均正確識別率。在兩個實(shí)驗庫中的結(jié)果分別通過折線圖表示,一條折線是某種算法在一個實(shí)驗庫中的平均正確識別率與高斯白噪聲歸一化方差的二維對照。圖9是在YALE人臉庫中的實(shí)驗結(jié)果,圖10是在ORL人臉庫中的實(shí)驗結(jié)果。實(shí)驗結(jié)果表明,ILDP抗噪聲的能力明顯優(yōu)于其它幾種基于局部紋理特征的人臉描述方法。4人臉描述階段針對基于LDP的人臉描述方法的不足,通過進(jìn)一步挖掘更大范圍的梯度信息改善人臉特征的鑒別性,從而提出了一種ILDP人臉描述方法。ILDP將中心像素的井型鄰域根據(jù)采樣半徑分成兩組,每組按照原來的相對位置排列在8個不同的方向;然后將兩組像素的灰度值與Kirsch模板卷積,分別得到兩組邊緣梯度值;最后對兩組梯度值中各自最大值的方向信息編碼成一個二位八進(jìn)制數(shù),形成ILDP碼。在人臉描述階段,首先對人臉圖像進(jìn)行分塊,把每塊轉(zhuǎn)換成ILDP圖,然后對ILDP圖進(jìn)行直方圖統(tǒng)計,將所有子塊的直方圖連接生成人臉特征。最后根據(jù)產(chǎn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論