一種多級分類的車牌漢字識別方法_第1頁
一種多級分類的車牌漢字識別方法_第2頁
一種多級分類的車牌漢字識別方法_第3頁
一種多級分類的車牌漢字識別方法_第4頁
一種多級分類的車牌漢字識別方法_第5頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

一種多級分類的車牌漢字識別方法

0車牌識別系統的現狀該車牌的自動識別技術在公共服務、交通管理、海關、軍事和其他部門具有重要的應用價值。汽車牌照識別技術也是近年來智能交通系統(ITS)中的核心技術之一。目前國外對這方面的研究已經取得一些進展,并進入了實用化階段,如香港Aisavisiontechnology公司的VECON系統,新加坡Optasia公司推出的IMPS系統等,在應用中取得了比較理想的效果。但我國車牌系統具有自身的特殊性,國外的車牌識別系統一般都不能直接應用:我國的車牌中不僅有英文字母和阿拉伯數字,還包含筆劃繁雜的漢字,導致其識別難度比僅對字母、數字的識別大的多,加上國內部分道路條件差,車牌污染比較嚴重,而且實際運行的車輛號牌會受到泥、油、漆等影響,車牌字符往往會有斷裂現象,同時號牌制作工藝的不規范也會出現字符變淺、變模糊,使車牌漢字識別的難度比普通的漢字識別也大的多。這也是國內現有的車牌識別系統識別效率不夠高的主要原因。因此準確識別車牌中的漢字字符,成為國內車牌識別系統的難點。隨著私有汽車擁有量的大量增加和高速公路、省際間交通流量的增加,對車牌識別系統的需求越來越迫切,現有車牌識別系統必須對漢字識別有一個更高的識別率才能滿足實際需求。而且車牌識別系統還必須具有較高的采集和處理速度,才能滿足實時處理的要求,本文利用多級分析技術,結合漢字圖像像素的空間結構特征對車牌漢字特點進行分析,實現車牌漢字的準確識別。1圖像部分的處理一個完整的車牌自動識別系統(如圖1所示)包括圖像采集、車牌定位、字符切分和字符識別4個部分,各部分相輔相成,前一步的處理結果直接影響到下一步的處理。(1)車牌定位利用顏色特征、灰度特征、邊緣特征、幾何特征和頻譜特征等將車牌部分從背景圖像中提取出來。(2)字段將車牌中含有的漢字、英文字母和阿拉伯數字等字符從車牌圖像中分割出來,便于字符識別。(3)字符識別對提取出的字符進行識別。車牌漢字識別技術是車牌識別的關鍵,也是國內車牌的特殊性所在,目前對車牌漢字的識別還沒有較為成熟的技術和產品。2識別過程設計利用多級分類方法,把尋找一種性能優良的分類方法的問題轉化為設計多個性能較優的分類器,將高維特征空間的判決轉化到低維空間進行判決,可有效解決多類或多峰分布問題。基于車牌漢字識別的多級特征模型可用式(1)表示(Ai表示漢字圖像的某個特征),具體識別過程可用圖2表示。對于不同的特征來選擇合適的決策規則,若在每個特征區域空間中,待識別字符都占優勢,即可進行有效的識別。針對一個具體的工程實現,必須設計為一個多特征逐級分析判決過程。具體可用式(2)表示。O(A)=O1(A1)∩O2(A2/A1)∩O3(A3/A2,A1)∩O4(A4/A3,A2,A1)∩O5(A5/A4,A3,A2,A1)(2)識別可用如下定理描述:待識別字符圖像的統計和結構特征同時滿足A字符的所有特征集合{A1,A2,A3,A4,A5},則該字符就可以判決為字符A。3識別車牌中的漢字車牌漢字識別過程分為漢字圖像預處理、漢字特征提取、字符識別三部分,具體過程在后面進一步分析。3.1圖像對比調整原則由于光照強度和圖像采集的角度不同,分割出的車牌漢字圖像可能出現大小不一致,灰度相差很大等情況。通過圖像預處理,可以使得在不同環境下得到的字符灰度和大小都比較統一,從而提高特征提取的質量和漢字識別的精度。在圖像亮度范圍不足或對比度不甚理想的情況下,采用(3)式對原圖像進行直方圖修正,改善圖像的對比度。其中,f(i,j)為原圖像點的灰度值,F(i,j)修正后的灰度值,I1,I2為自適應得到的原圖像直方圖灰度級門限值,O1,O2為調整后的圖像灰度范圍。對于大小歸一化,為了盡可能防止圖像失真,提高后續處理的精度,可采用雙線性插值(bilinearinterpolation)將車牌漢字大小歸一化為48×24,最終轉化為可供識別的二值圖像。3.2車牌漢字分類根據我國現有的車牌標準,車牌中常見的漢字約為60個。在車牌用漢字的識別中,利用車牌的顏色特征(藍底白字、黃底黑字、黑底白字和白底黑字),漢字字符可能出現在車牌中的位置特征(如藍底白字車牌的第一個位置字符,警用車牌最后一個位置字符等)可以將車牌用漢字分為以下三類:民用車牌漢字(省市區等漢字簡稱);軍用車牌漢字;特種車牌用漢字。圖3是部分車牌漢字的樣圖。要得到高性能的識別系統,需要提取出具有類間可分性和類內聚類性的有效特征。由于車牌用漢字都是印刷體,結構固定,筆劃規范。綜合統計特征和結構特征,才能對車牌漢字的字符結構進行全局和局部的完整描述,提高識別率。3.2.1維漢字特征模型統計分析方法是通過對字型統計特征的刻畫和描述來完成對整個字型的形態分析。統計特征可分為整體和局部兩類,包括像素取值、線元梯度、方向段強度、方向筆劃數、方向密度、周邊形狀、一維投影和二維變換等等。在粗分類時常用投影和變換的方法來對漢字字形作整體描述。本文將二維漢字圖像像素數的累計個數按照行和列的方向投影到水平軸和垂直軸上(如圖4所示),得到字符圖像的像素密度。漢字的基本筆劃有六種,即橫、豎、撇、捺、提、點,而撇與提,捺與點難以區分。可利用漢字的筆劃投影,對像素密度投影值進行峰值檢測,快速提取出漢字的橫、豎筆劃數目,作為字符的粗分類特征庫:特征筆劃數。相關匹配也是一種統計模式識別的常用方法,它通過在特征空間上計算輸入模式特征矢量在各模板矢量之間的距離或相似度來進行分類判決。相關函數是描述信號相似性的重要統計量(如式4)。I1,I2為兩幅相關圖像,顯然,0≤γ≤1,當且僅當I1=I2時,γ=1。在字庫中,以歐式距離作為判定標準,直接選取相似度高的字符作為基本分類集合,可以減少后續的計算量。3.2.2漢字的體性分析僅統計分析的方法沒有考慮到漢字形體更為內在的結構性質,不及結構分析更能反映漢字的形體規律。車牌漢字的標準字庫固定,字體規范,而且數量不太大,可以將通用漢字的結構特征加以簡化,提高識別效率。(1)漢字分類及分類根據漢字能不能分解為偏旁這一性質,可以將漢字分成兩大類,即獨體字和合體字。由于漢字結構復雜,筆劃多,為便于識別,本文將合體字僅分為兩大類:上下式和左右式,將包圍式、半陷式等都歸入獨體字類。結合統計特征中的像素密度投影,進行雙峰檢測,可以直接識別出待識別字符所在的結構字類,也作為粗分類的基本特征。(2)特征字段的長度和特征字段的位置拓撲關系對歸一化后的二值圖像分別求取特征筆段的連續長度和對應的行列坐標值,作為細分類特征。(3)特征筆段長度的搜索步驟一:讀入待識別的二值字符圖像。步驟二:從像素密度投影中搜索一個投影值大于某域值(T1)的行/列,即特征筆段的可能初定位L。步驟三:對L所在的圖像進行連續性檢測。將連續檢測得到的最大連續值作為連續筆段長度。步驟四:若連續筆段長度小于特征筆段的判定長度(T2),跳轉到步驟二繼續搜索。步驟五:若連續筆段長度大于特征筆段的判定長度(T2),則將L精確定位為特征筆段位置,且L所在筆段的最大連續值作為特征筆段長度。跳轉到步驟二繼續搜索。步驟六:搜索完畢,返回特征筆段的長度及位置。對形似字,需要通過筆段長度及位置人工建造附加特征集,即特征筆段的拓撲關系。3.3字母表的特征(1)粗分類識別編碼結果由于車牌字庫較小,結合統計特征的粗分類特征庫和結構特征的細分類特征庫可以識別車牌漢字中的單字類。利用相關系數,可以從字庫中選取一定的相關字符,并按相關系數大小排序,排除與待識別字符圖像相似性極小的庫中字符。得到第一粗分類集Y1。對待識別字符作組合分析,得到字符所在的基本結構類Y2,從而得到粗分類結果Y1∪Y2。再結合筆段數特征集Y3,若Y1∪Y2∪Y3結果唯一,則字庫中滿足特征集的字符為單字類,整個漢字的單字識別就告完成。車牌漢字中容易識別錯誤的字,如“湘”和“浙”,在特征筆段數的分類中就可直接區分,降低識別錯誤率。(2)采取“申”和“甲”的結合若Y1∪Y2∪Y3結果不唯一,即出現難以區分的形似字。需將特征筆段的拓撲關系作為附加特征集進行形似字的識別。如軍用車牌中出現的形似字“甲”和“申”,二者有很強的相關性,且特征筆段數均相同。利用筆段位置拓撲關系:最長豎筆段頂點在第一橫之上,即為“申”,否則為“甲”。形似字“子”,“未”,“午”,利用豎筆段的頂點與第一橫筆劃的位置關系,即可識別。4車牌漢字的識別測試結果為檢測本文方法的有效性,根據圖1和式(2)模型,設計出具體的識別流程如圖6所示。首先建立車牌字符樣本字庫,存放所有車牌漢字字符圖像。圖像均從車流視頻中直接提取(如圖3)。針對樣本庫中的樣本逐個提取出穩定且具有代表性的漢字字符結構特征,形成粗分類特征集(相關統計特征集、組合結構特征集、特征筆段數特征集)和細分類特征集(特征筆段長度特征集、特征筆段位置特征集),與標準字庫中的字符特征進行匹配,若細分類后結果為單字類,則單字識別完成,若細分類后結果為非單字類,則需人工建造的附加拓撲結構特征集進行形似字識別。利用本識別方法,對920幅不同地點不同環境下采集的958個車牌漢字字符圖像進行了識別測試。在車牌較干凈的情況下,識別率可達98%(結果見表1)。本文提出的方法具有以下特點:(1)由于漢字有一定的筆段厚度,在整體像素密度投影中,部分傾斜并不影響對特征筆段的識別和結構特征值的選取,因此本方法對傾斜的漢字圖像有很強的辨識能力,尤其對傾斜大于5°的字符仍然具有較強的識別能力。(2)對其他車牌漢字識別方法中容易誤識別的漢字,如“浙”、“湘”等,有較強的識別能力。對筆劃較簡的漢字

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論