




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、不變矩在人形識別中的應(yīng)用吳冬梅李俊威(西安科技大學(xué) 通信與信息工程學(xué)院,西安 710054) 摘 要:人形識別的一個重要方法是利用目標(biāo)的不變矩特征。本文綜述了使用Hu矩和Zernike矩進(jìn)行人形識別的方法,并采用最小距離分類器對一些運(yùn)動目標(biāo) 進(jìn)行分類。通過比較它們在具體應(yīng)用中的特點(diǎn),為人形識別算法中不變矩的選擇 提供了一定的依據(jù)。關(guān)鍵詞:Hu矩;Zernike矩;人形識別the Application of the Moment in the Human RecognitionWu Dongmei Li Junwei(Xi' an university of science and t
2、echnology Communication and information engineering college , Xi' an 710054) Abstract: The important method of the human recognition is to use the moment of the target. This paper is mainly dedicated to the method of human recognition use for Hu moment and Zernike moment, and separates some spor
3、ts target using the minimum distance classifier. Comparing characteristic of these moments in specific application, have provided the certain basis for the choice of the invariant moments in the human recognition algorithm.Key words: Hu moment; Zernike moment; human recognition1 .引言人形識別是動態(tài)視頻目標(biāo)檢測技術(shù)的重
4、要內(nèi)容,在模式識別中它屬于圖像識別的范疇。它是根據(jù)從圖像中的運(yùn)動目標(biāo)抽取到的特征,將運(yùn)動目標(biāo)進(jìn)行分類。 不變矩就是一種具有平移、旋轉(zhuǎn)和縮放不變性的圖像特征。進(jìn)行人形識別常用的 不變矩主要由Hu矩、Zernike矩等。Hu矩1首先由M.K.Hu于1962年提出,并 給出了 Hu矩的定義、基本性質(zhì)和具有平移、旋轉(zhuǎn)、縮放不變性的7個不變矩表達(dá)式。Zernike矩是一組正交矩,它源自Teague2提出的正交矩思想。與Hu矩相 比它的優(yōu)點(diǎn)在于:具有良好的旋轉(zhuǎn)不變性;作為正交矩能夠構(gòu)造任意的高階矩; 其運(yùn)算是積分運(yùn)算,對噪聲不敏感。2 . Hu不變矩假設(shè)目標(biāo)區(qū)域D中的灰度分布為f(x,y), (x,y)W
5、D,為描述目標(biāo),將區(qū)域D 以外的區(qū)域D的灰度分布視為0,于是目標(biāo)的p+q階區(qū)域原點(diǎn)矩和區(qū)域中心矩 就分別變?yōu)閙pq = xpyqf (x, y)dxdyp,q = 0,1:2(1)D口pq = (x-x)p(y -y)q f (x,y)dxdy p,q = 0,1 丁2(2)D中心矩和原點(diǎn)矩存在換算關(guān)系p q r V )p qdk-l-k l -(k +)鼠=工工 L (T) mp*,q-m10moim00 )(3)k=0 l=e K 人l J規(guī)格化的中心矩定義為pqpqp,q,2其中 r =, p +q =2,3,2利用上面的關(guān)系,可導(dǎo)出下面七個不變距函數(shù)式:1 = 2002(5)222 =
6、( 20 一 02)4 ii(6)3 =( 303 12)2( 033 21)24 =( 30 . 12)2 - ( 21 - 03)2(8)5 二(30 -3 12)( 30 - 12)( 3012)2 一3( 2103)1(9)(3 21 - 03 )( 21 - 03)3( 30 - 12)2 -( 21 6 =( 20 一 02)( 3012 )2 -( 2103)24( 3012)( 2103)(10)7 =(3 21 - 03)( 30 ' 12)( 30 ' 12) _ 3( 2103 ) (11)(3 12 - 30)( 21 - 。3)網(wǎng) 3012)2 -(
7、21 腦二上面的七個由不高于三階的中心矩構(gòu)造的矩函數(shù)式對于平移、旋轉(zhuǎn)、尺度縮放都具有不變性網(wǎng)。為簡便又不失一般性,假設(shè)圖像經(jīng)過邊緣提取后化為一幅二值圖像,即目標(biāo)區(qū)域的邊界像素灰度值為1,其他像素灰度值為00因此,我們可以定義邊界矩mpq=xpyqdsp,q= 0,1-2(12)式中,口表示沿目標(biāo)邊界曲線C積分,ds=J(dx)2+(dy)2。C中心化邊界矩,q =(x-X)p(y-9)qdsp,q= 0,1-2(13)C式中 x =m10/m00, y =m01/m00。對于數(shù)字圖像,相應(yīng)有mpq = >, xpyq(14)(x,y) C = (x-x)p(y-y)q(15)(x,y)C
8、Npq對于平移、旋轉(zhuǎn)、尺度縮放都具有不變性。規(guī)格化的邊界矩定義為pq =pq/00q1 p q=2, 3;(16)假設(shè)目標(biāo)區(qū)域邊界C為光滑的平面曲線,x,y坐標(biāo)縮放同一個因子r>0,在 新的坐標(biāo)系中曲線C成為曲線C',于是pq =1x(s)py(s)qds =CQrx(s)pry(s)qdrs =Crp q1x(s)py(s)qds = rpq %(17)C由于%0 ="ds=|C |=C的長度(18)ds =|C |= rC所以對任意的r>0,有“ pq(0。)rP q 1 J r pq-p,q 1 c出,q 1r |C|pqii p q 1-00(19)那么用
9、二口代替'q帶入之前的七個矩不變函數(shù)式,所得的七個規(guī)格化的邊界 中心矩式對平移,旋轉(zhuǎn)及尺度縮放是不變的。由于7個Hu不變矩函數(shù)式的變化范圍較大常常出現(xiàn)負(fù)值,因此在實(shí)際應(yīng)用 中采用的是取不變矩絕對值的常用對數(shù)的方法。3. Zernike不變矩Zernike矩是圖像函數(shù) f(x, y)在正交多項(xiàng)式Vnm(x,y )上的投影。其中 Vnm(X, y)在單位圓內(nèi)是正交的,具表達(dá)式為Vnm(x, y)=Vnm(P,e) = Rnmexp(jmB), 式中n為正整數(shù)或零,m為正整數(shù)或負(fù)整數(shù),且必須滿足n |m|=even(偶數(shù)),|m|<n , P為原點(diǎn)到(x,y)點(diǎn)長度的矢量,8為矢量P和
10、x軸的夾角,Rnm( P)為徑 向多項(xiàng)式。n階Zernike矩定義為n 1* 一.Anm =- x2 .y2/f (x,y)Vnm(:9)dxdy(20)對于實(shí)二維圖像,其Zernike矩Anm為復(fù)數(shù),對數(shù)字圖像,積分用求和代替n h 1*-o oZZ f(x,y)Vnm(P,9), x + y <1& x y(21)極坐標(biāo)下Zernike矩的定義為n 1Anm 一 JI2二 1- - _ _ * _ _ _.f(: 3)Vnm(-)d dF =0 02 二 1! ! f ( P, u)Rnm(P)exp( -jmu) Pd0 0(22)在計(jì)算一幅圖像中目標(biāo)區(qū)域的 Zernike
11、矩時,首先將目標(biāo)從圖像中分割出來, 具體方法是:對于圖像f(x,y)中任一點(diǎn)(x,y),如果該點(diǎn)處于目標(biāo)區(qū)域內(nèi)時,則 取f(x,y)=1,否則f(x,y)=0,即將圖像二值化,這樣,所有f(x,y)為1的點(diǎn) 所組成的集合就構(gòu)成了要表示的目標(biāo)區(qū)域。之后將目標(biāo)圖像轉(zhuǎn)換到極坐標(biāo)下的單位圓內(nèi),即將目標(biāo)的重心作為極坐標(biāo)的圓心,以圓心到目標(biāo)區(qū)域內(nèi)最外像素點(diǎn)的距離為半徑(取最遠(yuǎn)距離作為半徑,使得區(qū)域中所有像素都落在單位圓內(nèi),避免 像素信息的丟失),將目標(biāo)區(qū)域內(nèi)的像素重新采樣到單位圓內(nèi)。直角坐標(biāo)到極坐 標(biāo)的轉(zhuǎn)換為:(23)y = "sin 二(24)其中 P = x2+y2 , 8 = arctan
12、乂 x計(jì)算時要注意直角坐標(biāo)系中像素點(diǎn)所在象限,因?yàn)?日=arctan(y/x)定義在區(qū) 問冗/2,冗/2內(nèi)。最后計(jì)算出各階Zernike矩,取其幅值作為圖像的描述子。實(shí)際問題中的圖像通常為數(shù)字圖像,因而需要將Zernike矩的實(shí)數(shù)部分和虛數(shù)部分離散化,又由于Zernike多項(xiàng)式在單位圓內(nèi)正交,因此需要將所考慮的圖 像轉(zhuǎn)換為單位圓內(nèi)的極坐標(biāo)形式,為此,Mukundan和Ramakrishnan1出了如下形式的變換:對于任一 N mN的圖像f(x, y),不失一般性,令坐標(biāo)原點(diǎn)位于圖像 的中心,則-N/2 Ex, y E N/24。對于任一像素(x, y)引入2個參數(shù)P和仃,它們 惟一地對應(yīng)該像素
13、,其定義為:=max(|x|,| y|)(25)若以| =則仃=2( P-x) y/ y + xy / P(26)若| y | 二則二=2 y-xy / P(27)容易看出,P取值從1到N/2,。取值從1到8P。由參數(shù)P,??啥x相應(yīng)的 極坐標(biāo):(28)5:(29)(30)(31)r =2P/N , e=(no)/(4P)據(jù)此轉(zhuǎn)換之后得到Zernike矩Anm (復(fù)數(shù))的實(shí)數(shù)和虛數(shù)部分的表達(dá)式2n +2 N/2 門:Pn meCnm= V Rm(2:/N)' COS f(二)N 力E4:2n+2上23Pnm。Snm=-n-v Rnm(2: /N廠 Sin f (:,二)N h七 4 :
14、其中實(shí)半徑多項(xiàng)式 Rm(r)定義為(n 4m|)/2Rm(r尸's =0(_1)S(n _ s)!rn Nss!號my!上”Zernike矩是基于圖像區(qū)域的形狀描述子,且它的基是正交徑向多項(xiàng)式,因 此具有旋轉(zhuǎn)不變性,并且易構(gòu)造高階矩,而且冗余性小。止匕外,利用幾何矩的平 移和比例不變性原理進(jìn)行變換,Zernike矩也可具備平移和比例不變性。具體步 驟如下:(1)把目標(biāo)圖像從原圖像中分割出來,找出該目標(biāo)所在區(qū)域的最小外接矩 形,設(shè)矩形長a,寬b,把圖像重心平移至原點(diǎn),再將圖像縮放 2/Ja2 + b2倍, 放入單位圓中。(2)計(jì)算出圖像中目標(biāo)的面積,即目標(biāo)圖像的零階幾何矩:(32)m00
15、! f (x, y)dxdy 在單位圓中,計(jì)算各階Zernike矩: n 1* .Am =-“、 f(x,y)Vnm(:-)(33)x y 歸一化Zernike矩,取Zernike矩的,g值| Anm |'作為圖像檢索的特征向量:| Anm |' = &(34)m004.最小距離分類器最小距離分類器6是最為簡單的一種線性分類方法:對于待分類模式x ,計(jì)算x到各模式類均值mi的歐氏距離平方|x-m|2,然后把x分到距離最小的那類 中。最小距離分類器的速度優(yōu)勢很明顯,經(jīng)常被選擇應(yīng)用在有實(shí)時要求的系統(tǒng)中。設(shè)有c類已知類別的模式樣本,其均值為 mi,m2,m定義判別函數(shù)為2一d
16、i(x)=|x 2(i=1,2,c)(35)按最小距離分類原理,決策規(guī)則為:若 di(x)<dj(x)(j = 1,2, c,另 i,則 xw 颯。式(35)可改寫為di(x) = (x -mi )T(x -mi) = xTx -2mTx mTm(36)將其中與i無關(guān)的項(xiàng)去掉,上式可改寫為一 . T 1 Tdi (x) = mi xmi mi(37)2這樣,決策規(guī)則為:若di(x)dj(x)(j = 1,2, c,j; i,則 xwcoi。由式(37)可以看出,這個判別函數(shù)是線性判別函數(shù),可寫成di(x)ffiTX(38)一中 式中,颯=1T ; X=I 一二甲甲 1215.人形識別過程
17、及結(jié)果人形識別過程包括視頻幀圖像提取、幀圖像預(yù)處理、運(yùn)動目標(biāo)不變矩提取和 分類識別。(1)視頻幀圖像提取采用基于采樣的方法,采樣間隔視具體情況而定。這里 針對本文所用視頻對采樣間隔做分析有以下結(jié)論: 以運(yùn)動目標(biāo)速度為參考,采樣間隔應(yīng)盡量小,避免漏報。本文所用視頻 時長約30秒,幀速率為18幀/秒,其中運(yùn)動目標(biāo)為人,出現(xiàn)時長約 10秒左右。該 視頻環(huán)境為室內(nèi)樓梯口, 一般而言,人在該環(huán)境中的運(yùn)動方式為正常行走,速度為1.11.4米/秒,也就是說人完成一個完整的邁步動作所需要的時間是秒級的。 因此,從人的行走速度考慮,當(dāng)采樣間隔小于 1秒時,基本可以避免漏報。 為了避免幀冗余,采樣間隔應(yīng)大于后續(xù)幀
18、處理用時。經(jīng)過試驗(yàn)得出本文 所用視頻的幀圖像后續(xù)處理所用時間在 423497msi問。因此,采樣間隔應(yīng)大于 497ms,才能避免幀冗余。綜上所述,為了避免漏報和幀冗余,取采樣間隔為 500ms。就本文18幀/秒的 視頻而言,即每秒取兩幀作為關(guān)鍵幀。(2)幀圖像預(yù)處理包括去除背景、圖像分割、去噪、輪廓提取等幾個步驟。本文采用基于背景差分去除背景。含有運(yùn)動目標(biāo)的幀圖像與背景圖像背 景作差分后得到圖像的運(yùn)動目標(biāo),如圖1所示。(a)含有運(yùn)動目標(biāo)的圖像(b)背景圖像差分后圖像圖1背景差分 最大類間方差法是由日本學(xué)者大津于 1979年提出的,是一種自適應(yīng)的閾 值確定的方法,又叫大津法,簡稱 OTSU。經(jīng)過
19、背景差分得到運(yùn)動目標(biāo)圖像通過 大津法閾值分割得到運(yùn)動目標(biāo)的二值化前景圖像,如圖 2所示。圖2大津法閾值分割后運(yùn)動目標(biāo)前景圖像 考慮到經(jīng)大津法閾值分割得到的前景圖像的噪聲分布,本文采用中值濾 波法時選用了 5父5的中值濾波窗口,處理結(jié)果如圖3所示。圖3采用中值濾波法處理得到的圖像Roberts邊緣算子利用局部差分算子尋找邊緣,邊緣定位精度較高,對具有邊緣陡峭的低噪聲圖像響應(yīng)最好。采用Roberts邊緣算子對去噪后圖像進(jìn)行輪廓提取結(jié)果如圖4所示。圖4 Roberts算子輪廓提取(3)針對所要提取的不變矩不同,選用的預(yù)處理過后的圖像也不同。 本文所要提取的圖像中的運(yùn)動目標(biāo)的 Hu不變矩是邊界矩,因此
20、輸入的 圖像是預(yù)處理后得到的運(yùn)動目標(biāo)輪廓圖像。盡管構(gòu)造Hu不變矩并不復(fù)雜,但是構(gòu)造Hu不變矩的中心距階數(shù)越高,Hu不變矩的抗干擾性就越差,而且運(yùn)算的 復(fù)雜度也顯著增加。因此本文的7個Hu不變矩均由三階以下的中心距構(gòu)造而成。圖5是提取Hu不變矩的流程圖圖5提取Hu不變矩流程圖 根據(jù)Zernike不變矩的定義很容易得到目標(biāo)圖像的Zernike不變矩,在此基礎(chǔ)上對其進(jìn)行相應(yīng)的變換,使其既保持原有良好的旋轉(zhuǎn)不變性,又具有可縮放和平移不變性。另外需要注意的是 Zernike不變矩是區(qū)域矩,因此輸入的圖像是 經(jīng)過預(yù)處理后得到的運(yùn)動目標(biāo)的區(qū)域圖像。圖6是提取Zernike不變矩流程圖。圖6提取Zernike
21、不變矩流程圖(4)采用最小距離分類器對一個樣本分類,假設(shè)該樣車"以分為m類,那么計(jì)算第k類中元素的的第i個屬性為與該屬性的中心量Xj勺最小距離dj,就是 設(shè)計(jì)最小距離分類器的關(guān)鍵步驟。本文選之歐氏距離模型,則對于第k類中元素的的第i個屬性為與該屬性的中心量 子的最小距離d;距離計(jì)算公式為公式 (39)。. 2 ,一、2dki =(X - Xki)(39)假設(shè),有數(shù)據(jù)元組X,其元素屬性為Xi(i=1,2,n), k表示類別,各類的 中心量為xki。訓(xùn)練步驟:(1)將訓(xùn)練集中的所有數(shù)據(jù)元組按照類別分為m個集合0_(2)為m個集合分別生成代表各類的各個屬性的中心量X; o(3)計(jì)算每類各屬
22、性的方差 ”i(k =1,2,m;i =1,2,1n),即d:。分類步驟:(1)對于每一個待分類數(shù)據(jù)元組X ,計(jì)算其與Xki (i =1,2,n )之間的距離,2dk(k =1,2,m)。(2)判定X屬于與之最近的類。具體計(jì)算:本文數(shù)據(jù)元組中的各類屬性均為數(shù)字型,則有:(1) Xki的計(jì)算第k類的第i個屬性的均值取該類該屬性的算術(shù)平均值。(2) d的計(jì)算n.2 -. 2dk = (X - Xki)(40)1 1本文所涉及的樣本個數(shù)為268,其中人形樣本數(shù)為201,動物樣本數(shù)為67。 人形樣本中包括了人的站立、彎腰、下蹲三種姿勢的圖像各 67幅,動物樣本為 日常生活中最常見的兩種動物貓和狗,共
23、67幅。提取所有樣本的Hu不變矩和Zernike不變矩,采用最小距離分類器進(jìn)行分類的結(jié)果見表1和表2。表1最小分類器對樣本 Hu不變矩分類結(jié)果人(站立)676597%人(彎腰)676089.6%人(下蹲)675683.6%動物676089.6%表2最小分類器對樣本Zernike /、變矩分類結(jié)果類別實(shí)際數(shù)識別正確數(shù)正確率人(站立)676698.5%人(彎腰)676292.5%人(下蹲)676089.6%動物676597%通過對樣本測試可以看出,基于 Zernike不變矩的人形識別效果要優(yōu)于基于Hu不變矩的人形識別。可見對于人形圖像而言Zernike不變矩的聚類效果要優(yōu)于 Hu不變矩。6.結(jié)論本文對 Hu 矩和 Zernike 矩進(jìn)行了比較分析,并采用最小距離分類器對運(yùn)動目標(biāo)的這兩種矩進(jìn)行分類識別。它們都具有平移、旋轉(zhuǎn)和縮放不變性,但是又各有特點(diǎn)。 Hu 矩所包含的目標(biāo)信息不是很全面,含有較多的冗余信息;Zernike 矩是正交矩,能構(gòu)造任意的高階矩,包含信息全面,對噪聲不敏感。本文為人形識別算法中
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 注冊會計(jì)師考試基礎(chǔ)大綱試題及答案
- 微生物檢驗(yàn)重要法規(guī)與試題及答案
- 2025注冊會計(jì)師自我考核方法試題及答案
- 寧夏銀川市本年度(2025)小學(xué)一年級數(shù)學(xué)統(tǒng)編版期中考試(上學(xué)期)試卷及答案
- 試題對比注冊會計(jì)師備考指南及答案
- 注冊會計(jì)師交流和學(xué)習(xí)試題及答案
- 項(xiàng)目管理的有效工具考題及答案
- 課題申報書編碼
- 項(xiàng)目管理實(shí)踐中團(tuán)隊(duì)協(xié)作的方式試題及答案
- 2025年銀行資格考試的信貸政策試題及答案
- 半導(dǎo)體物理與器件物理
- 200句話搞定上海中考單詞(精華版)
- 船舶輔鍋爐的自動控制系統(tǒng)分析
- 新員工培訓(xùn)考試【圖書專員】
- 防偽包裝技術(shù)
- 49000DWT江海直達(dá)成品油船設(shè)計(jì)
- 建設(shè)工程監(jiān)理費(fèi)計(jì)算器
- X互聯(lián)網(wǎng)公司W(wǎng)LAN無線網(wǎng)絡(luò)優(yōu)化方案全解
- 裝配及檢驗(yàn)規(guī)范(修訂版)【新版】
- 合成寶石特征x
- 英文譯稿《藥品注冊管理辦法》
評論
0/150
提交評論