




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、 . I / 47西南科技大學(xué)畢業(yè)設(shè)計(jì)(論文)畢業(yè)設(shè)計(jì)(論文)題目名稱:車輛牌照?qǐng)D像識(shí)別算法研究與實(shí)現(xiàn) . I / 47車輛牌照?qǐng)D像識(shí)別算法研究與實(shí)現(xiàn)摘要:近年來隨著國民經(jīng)濟(jì)的蓬勃發(fā)展,國高速公路、城市道路、停車場建設(shè)越來越多,對(duì)交通控制、安全管理的要求也日益提高。因此,汽車牌照識(shí)別技術(shù)在公共安全與交通管理中具有特別重要的實(shí)際應(yīng)用意義。本文對(duì)車牌識(shí)別系統(tǒng)中的車牌定位、字符分割和字符識(shí)別進(jìn)行了初步研究。對(duì)車牌定位,本文采用投影法對(duì)車牌進(jìn)行定位;在字符分割方面,本文使用閾值規(guī)則進(jìn)行字符分割;針對(duì)車牌圖像中數(shù)字字符識(shí)別的問題,本文采用了基于 BP 神經(jīng)網(wǎng)絡(luò)的識(shí)別方法。在學(xué)習(xí)并掌握了數(shù)字圖像處理和模式
2、識(shí)別的一些基本原理后,使用 VC+6.0 軟件利用以上原理針對(duì)車牌識(shí)別任務(wù)進(jìn)行編程。實(shí)現(xiàn)了對(duì)車牌的定位和車牌中數(shù)字字符的識(shí)別。關(guān)鍵詞:車牌定位;字符分割;BP神經(jīng)網(wǎng)絡(luò);車牌識(shí)別;VC+ . II / 47ResearchResearch andand RealizationRealization ofof LicenseLicense PlatePlate RecognitionRecognition AlgorithmAlgorithmAbstractAbstract: :In recent years, with the vigorous development of the nation
3、al economy,there are more and more construct in the domestic expressway, urban road, and parking area. The requisition on the traffic control, safety management improves day by day. Therefore, license plate recognition technology has the particularly important practical application value in the publ
4、ic security and the traffic control. In the paper, a preliminary research was made on the license location, characters segment and characters recognition of the license plate recognition. On the license location,the projection was used to locate the license plate; On the characters segmentation, the
5、 liminal rule was used to divide the characters; In order to solve the problem of the digital characters recognition in the plate, BP nerve network was used to recognize the digital characters. After studying and mastering some basic principles of the digital image processing and pattern recognition
6、, the task of license plate recognition was programmed with VC+ 6.0 using above principles. The license location and the digital characters recognition in the license plate were implemented.Keywords:Keywords: license location, characters segmentation, BP nerve network, license plate recognition, VC+
7、 . III / 47 . IV / 47目 錄第 1 章 緒論11.1 課題研究背景 11.2 車輛牌照識(shí)別系統(tǒng)原理 11.3 車輛牌照識(shí)別在國外研究現(xiàn)狀 21.4 本文主要工作與容安排 3第 2 章 車輛牌照的定位方法42.1 車輛牌照?qǐng)D像的預(yù)處理 42.1.1 256 色位圖灰度化 42.1.2 灰度圖像二值化 52.1.3 消除背景干擾去除噪聲 62.2 車輛牌照的定位方法簡介 62.3 系統(tǒng)采用的定位方法 72.3.1 車輛牌照的水平定位 72.3.2 車輛牌照的垂直定位 72.3.3 定位的算法實(shí)現(xiàn) 102.4 實(shí)驗(yàn)結(jié)果分析 12第 3 章 車輛牌照的字符分割133.1 車牌預(yù)處理
8、 133.1.1 去邊框處理 133.1.2 去噪聲處理 133.1.3 梯度銳化 153.1.4 傾斜調(diào)整 163.2 字符分割方法簡介 173.3 系統(tǒng)采用的分割方法 193.3.1 算法介紹 193.3.2 算法的實(shí)現(xiàn) 203.4 字符分割實(shí)驗(yàn)結(jié)果 21 . V / 47第 4 章 特征提取與字符識(shí)別224.1 字符的特征提取 224.2 字符的識(shí)別方法簡介 234.3 系統(tǒng)采用的識(shí)別方法 244.3.1 人工神經(jīng)網(wǎng)絡(luò)簡介 244.3.2 BP 神經(jīng)網(wǎng)絡(luò)識(shí)別車牌 254.3.3 BP 神經(jīng)網(wǎng)絡(luò)識(shí)別算法實(shí)現(xiàn) 284.4 實(shí)驗(yàn)結(jié)果分析 29總結(jié)32致33參考文獻(xiàn)34 . 1 / 47第 1
9、章 緒論1.1 課題研究背景現(xiàn)代社會(huì)已經(jīng)進(jìn)入信息時(shí)代,計(jì)算機(jī)技術(shù)、通信技術(shù)和計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,自動(dòng)化信息處理能力的不斷提高,在人們社會(huì)活動(dòng)和生活的各個(gè)領(lǐng)域得到了廣泛的應(yīng)用,在這種情況下,作為信息來源的自動(dòng)檢測、圖像識(shí)別技術(shù)越來越受到人們的重視。 隨著汽車數(shù)量的急劇增加,車牌自動(dòng)識(shí)別(license plate recognition, LPR)技術(shù)日益成為交通管理自動(dòng)化的重要手段1。車牌自動(dòng)識(shí)別技術(shù)是計(jì)算機(jī)視覺、圖像處理技術(shù)與模式識(shí)別等技術(shù)的融合,是智能交通系統(tǒng)中一項(xiàng)非常重要的技術(shù)。通過車輛牌照自動(dòng)識(shí)別,就可以對(duì)運(yùn)動(dòng)車輛查詢相關(guān)的數(shù)據(jù)庫,根據(jù)提取的車輛信息,實(shí)現(xiàn)有針對(duì)性的車輛檢查,極大
10、的提高工作人員的效率,降低工作強(qiáng)度,同時(shí)也減少了國家財(cái)政收入的流失,減少交通事故的發(fā)生以與加強(qiáng)社會(huì)治安。因此對(duì)車牌識(shí)別技術(shù)研究有巨大的經(jīng)濟(jì)價(jià)值和現(xiàn)實(shí)意義。由于車牌自動(dòng)識(shí)別技術(shù)在智能化交通控制管理中發(fā)揮的重要作用,吸引了各國的科研工作者對(duì)其進(jìn)行廣泛的研究,目前已有眾多的算法,有些已應(yīng)用于交叉路口、車庫管理、路口收費(fèi)、高速公路等場合。由于需適應(yīng)各種復(fù)雜背景,加之要識(shí)別的車輛種類繁多,顏色變化多端,以與檢測時(shí)要適應(yīng)不同天氣變化導(dǎo)致的不同光照條件,因此,目前的系統(tǒng)都或多或少地存在一些問題。但隨著計(jì)算機(jī)性能的提高和計(jì)算機(jī)視覺理論與技術(shù)的發(fā)展,這種技術(shù)必將日趨成熟。車牌的定位與識(shí)別技術(shù),總體來說是圖像處理
11、技術(shù)與車牌本身特點(diǎn)的有機(jī)結(jié)合,當(dāng)然也包括小波分析、神經(jīng)網(wǎng)絡(luò)、數(shù)學(xué)形態(tài)學(xué)、模糊理論等數(shù)學(xué)知識(shí)的有效運(yùn)用2。本課題是對(duì)汽車圖像進(jìn)行分析,從算法角度來研究車牌的定位與識(shí)別。1.2 車輛牌照識(shí)別系統(tǒng)原理一個(gè)典型的車輛牌照識(shí)別系統(tǒng)(LPR)是由圖像采集系統(tǒng)和圖像識(shí)別系統(tǒng)組成的,如圖 1-13。當(dāng)系統(tǒng)發(fā)現(xiàn)有車時(shí),圖像采集系統(tǒng)便開始采集車輛牌照信息,得到的信息是圖像識(shí)別系統(tǒng)的輸入。通過識(shí)別系統(tǒng)的預(yù)處理,為目標(biāo)搜索提供一個(gè)良好的定位環(huán)境。在預(yù)處理的基礎(chǔ)上把圖像中的車牌從背景中分割出來。對(duì)車牌中的字符 . 2 / 47做字符分割,最后把分割后的字符進(jìn)行識(shí)別,便得到了汽車牌照的。整套系統(tǒng)實(shí)際是一種硬件和軟件的集成
12、。在硬件上,它需要集成可控照明燈、鏡頭、圖像采集模塊、數(shù)字信號(hào)處理器、存儲(chǔ)器、通信模塊、溫控模塊、單片機(jī)等;在軟件上,它包括車牌定位、車牌字符切割、車牌字符識(shí)別等算法。這樣一體化的結(jié)構(gòu)形式能在現(xiàn)實(shí)中降低對(duì)環(huán)境的要求。CCD攝像機(jī)圖像輸入接口預(yù)處理字符識(shí)別顯示字符分割牌照與背景分割 圖圖 1-11-1 車輛牌照識(shí)別系統(tǒng)原理框圖車輛牌照識(shí)別系統(tǒng)原理框圖1.3 車輛牌照識(shí)別在國外研究現(xiàn)狀自 1988 年以來,人們就對(duì)車輛牌照識(shí)別系統(tǒng)進(jìn)行了廣泛的研究,目前國外已經(jīng)有眾多的算法,一些實(shí)用的 LPR 技術(shù)也開始用于車流監(jiān)控、出入控制、電子收費(fèi)等場合。然而無論是 LPR 算法還是 LPR 產(chǎn)品都存在一定的局
13、限性,都需要適應(yīng)新的要求而不斷完善。如以色列 Hi-Tech 公司的 See/Car System 系列,它需要多種變形的產(chǎn)品來分別適應(yīng)某一個(gè)國家的車牌;新加坡 Optasia 公司的 VLPRS 系列,只適合于新加坡的車牌;See/Car Chinese 系統(tǒng)可以對(duì)中國大陸的車牌進(jìn)行識(shí)別,但都存在一定的缺陷,而且不能識(shí)別車牌中的漢字。我國在 90 年代初期開始了車輛牌照識(shí)別技術(shù)的研究。但由于以下幾個(gè)原因使我國的車輛牌照識(shí)別技術(shù)在研究和應(yīng)用方面都有一定難度,且落后于其它國家:我國的標(biāo)準(zhǔn)汽車牌照是由漢字、英文字母和阿拉伯?dāng)?shù)字組成,漢字的識(shí)別與字母和數(shù)字的識(shí)別有很大的不同,從而增加了識(shí)別的難度。國
14、外許多國家汽車牌照的底色和字符顏色通常只有對(duì)比度較強(qiáng)的兩種顏色,而我國汽車牌照僅底色就有藍(lán)、黃、黑、白等多種顏色,字符顏色也有黑、紅、白等幾種顏色。其他國家的汽車牌照格式通常只有一種,而我國則根據(jù)不同車輛、車型、用途,規(guī)定了多種牌照格式。我國汽車牌照的規(guī)懸掛位置并不唯一,而且由于環(huán)境、道路或人為因素造成汽車 . 3 / 47牌照污染的情況比較嚴(yán)重,這都給車牌識(shí)別造成了一定的難度。因此,我國車輛牌照識(shí)別技術(shù)的提高和廣泛應(yīng)用還需廣大科研工作者和相關(guān)交通部門的共同努力。1.4 本文主要工作與容安排本文主要研究車輛牌照識(shí)別系統(tǒng)中的數(shù)字識(shí)別技術(shù),將數(shù)字圖像處理技術(shù)與模式識(shí)別技術(shù)緊密結(jié)合,針對(duì)汽車牌照字符
15、識(shí)別的特點(diǎn),分析了車牌定位與分割、字符分割、特征提取、BP神經(jīng)網(wǎng)絡(luò)等算法。在車牌定位、字符分割和特征提取的基礎(chǔ)上,詳細(xì)研究了車牌數(shù)字字符的識(shí)別。文章在接下來的第二章介紹了車輛牌照的定位方法;第三章介紹了車輛牌照的字符分割算法;第四章介紹了車輛牌照數(shù)字字符的識(shí)別。其中車輛牌照數(shù)字字符的識(shí)別是本課題的重點(diǎn)。文章在每一步處理后給出了實(shí)驗(yàn)結(jié)果,并給出了最后的識(shí)別結(jié)果。 . 4 / 47 . 5 / 47第 2 章 車輛牌照的定位方法車輛牌照的定位方法是基于圖像處理的基礎(chǔ)上,對(duì)圖像進(jìn)行分析、總結(jié)并經(jīng)過大量的試驗(yàn)所獲得的。定位方法的研究與車牌特征和圖像處理技術(shù)是分不開的。從自然背景中準(zhǔn)確可靠地分割出車牌區(qū)
16、域是提高系統(tǒng)識(shí)別率的關(guān)鍵,但是由于車牌圖像攝于背景復(fù)雜且光照不均勻的自然場景,因而會(huì)出現(xiàn)顏色失真或低對(duì)比度的圖像,這給車輛牌照的定位帶來了很大的困難。為此人們進(jìn)行了大量的研究,并取得了一定的成果。本課題中,根據(jù)車牌的二值圖像在水平和垂直方向的投影特性提出了基于二值化圖像投影法和數(shù)學(xué)形態(tài)學(xué)相結(jié)合的車牌定位算法,該算法具有快速、簡潔實(shí)用和與背景相關(guān)性小的特點(diǎn)。車牌的定位算法分為預(yù)處理、水平定位、垂直定位。其流程圖如圖 2-1 所示。圖圖 2-12-1 車輛車輛圖像輸入牌照區(qū)域定位中值濾波削弱背景干擾灰度圖像二值化彩色圖像灰度化裁減車牌子圖像牌照定位原理牌照定位原理2.1 車輛牌照?qǐng)D像的預(yù)處理為了使
17、車牌能夠被精確定位,在定位搜索以前,要對(duì)車牌圖像進(jìn)行預(yù)處理。為了能夠方便的進(jìn)行后期的數(shù)字圖像處理,需要將彩色圖像轉(zhuǎn)化成 256 色的灰度圖后進(jìn)行處理,然后對(duì)圖像做二值化處理,削弱背景干擾,消除噪聲。經(jīng)過以上的預(yù)處理,就可以對(duì)車牌進(jìn)行定位和分割處理。 . 6 / 472.1.1 256 色位圖灰度化由于 256 色的位圖的調(diào)色板容比較復(fù)雜,使得圖像處理的許多算法都沒有辦法展開,因此有必要對(duì)它進(jìn)行灰度處理。所謂灰度圖像就是圖像的每一個(gè)象素的 RGB分量的值是相等的。彩色圖像的每個(gè)象素的 RGB 值是不同的,所以顯示出紅綠藍(lán)等各種顏色。灰度圖像沒有這些顏色差異,有的只是亮度上的不同。灰度值大的象素比
18、較亮,反之比較暗。圖像灰度化有各種不同的算法,比較直接的一種是給象素的RGB 值各自一個(gè)加權(quán)系數(shù),然后求和。經(jīng)常用到的灰度化公式由式(2-1)完成: (2-1)BGRI*114. 0587. 0*229. 0式(2-1)中為灰度值。I加權(quán)系數(shù)的取值是建立在人眼的視覺模型之上的,對(duì)于人眼較為敏感的綠色取較大的權(quán)值,對(duì)人眼較為不敏感的藍(lán)色則取較小的權(quán)值。這樣可以使得到的灰度圖像在視覺上更接近人的主觀感覺。應(yīng)該注意的是最后得到結(jié)果一定要?dú)w一到 0255之。2.1.2 灰度圖像二值化在進(jìn)行了灰度化處理以后,圖像中的每個(gè)象素只有一個(gè)值,即象素的灰度值。它的大小決定了象素的亮暗程度。為了更加便利的開展下面
19、的圖像處理操作,還需要對(duì)已經(jīng)得到的灰度圖像做一個(gè)二值化處理。圖像的二值化就是把圖像中的象素的灰度值根據(jù)一定的標(biāo)準(zhǔn)分化成兩種顏色。在系統(tǒng)中是根據(jù)象素的灰度值將圖像處理成黑白兩種顏色。圖像的二值化有很多成熟的方法:可以采用閾值分割法,也可以采用給定閾值法。閾值分割法可以分為全局閾值法和局部閾值分割法。所謂局部閾值分割法是將原始圖像劃分成較小的圖像,并對(duì)每個(gè)子圖像選取相應(yīng)的閾值。在閾值分割后,相鄰子圖像之間的邊界處可能產(chǎn)生灰度級(jí)的不連續(xù),因此需用平滑技術(shù)進(jìn)行排除。局部閾值法常用的方法有灰度差直方圖法、微分直方圖法。全局閾值分割方法在圖像處理中應(yīng)用比較多,它在整幅圖像采用固定的閾值分割圖像。根據(jù)閾值選
20、擇方法的不同,可以分為模態(tài)方法、迭代式閾值選擇等方法。這些方法都是以圖像的灰度直方圖為研究對(duì)象來確定閾值的。另外還有類間方差閾值分割法、二維最大熵分割法、模糊閾值分割法、共生矩陣分割法、區(qū)域生長法等等。在本系統(tǒng)中考慮到所要進(jìn)行處理的圖像大多是噪聲比較少的灰度車牌,系統(tǒng)中采用全局閾值分割的方法進(jìn)行處理,初始閾值的確定方法是由式(2-2)完成:T . 7 / 47 (2-2)3/minmaxmaxGGGT和分別是最高和最低灰度值。該閾值對(duì)不同牌照有一定的適應(yīng)性,能夠保maxGminG證背景基本被置為 0,以突出牌照區(qū)域。經(jīng)過二值化,可以進(jìn)行下一步處理。 . 8 / 472.1.3 消除背景干擾去除
21、噪聲對(duì)二值化后的圖像進(jìn)行相鄰象素灰度值相減,得到新的圖像,左邊緣可以直接賦值,不會(huì)影響整體效果。考慮到圖像中的文字是由短的橫豎線組成,而背景噪聲有一大部分是孤立噪聲,所以用模板(1,1,1,1) T 對(duì)圖像進(jìn)行中值濾波,得到去除大部分干擾的圖像。2.2 車輛牌照的定位方法簡介經(jīng)過以上的預(yù)處理,我們就可以對(duì)圖像進(jìn)行車牌的定位和分割。為了快速、準(zhǔn)確地定位車牌,目前已有很多學(xué)者提出許多定位算法。其中,眾多算法都是利用了車牌自身異于背景區(qū)域的特征來進(jìn)行車牌定位的。這些特征包括車牌的顏色特征、幾何特征、紋理特征和經(jīng)過處理運(yùn)算后得到的車牌區(qū)域固有的特征(異于背景區(qū)域特征)等。車牌定位的算法基本上可以分為兩
22、大類:第 1 類是通過一個(gè)步驟將車牌定位出來;第 2 類是通過兩個(gè)步驟將車牌定位出來4。第 1 類:這類算法的主要特點(diǎn)是通過一個(gè)步驟就可以將車牌區(qū)域定位出來。其主要的算法介紹如下:(1)基于神經(jīng)網(wǎng)絡(luò)的車牌定位方法:該方法首先是用神經(jīng)網(wǎng)絡(luò)對(duì)大量的樣本圖像進(jìn)行訓(xùn)練,然后再進(jìn)行圖像預(yù)處理,最后用訓(xùn)練的神經(jīng)網(wǎng)絡(luò)提取真正的車牌區(qū)域。該算法要求把圖像中每一個(gè)像素所提取特征輸入神經(jīng)網(wǎng)絡(luò)來進(jìn)行學(xué)習(xí),計(jì)算量很大,同時(shí)需處理好網(wǎng)絡(luò)局部收斂的問題,且車牌定位時(shí)間長5。(2)基于模板匹配的車牌定位方法:該算法主要是設(shè)立一個(gè)滑動(dòng)窗口,該窗口有若干向量值,利用該窗口在汽車圖像上滑動(dòng),并計(jì)算該窗口所覆蓋的那塊車牌圖像的向量
23、值,找出最佳的向量值,認(rèn)為是車牌區(qū)域。(3)直線邊緣檢測:這種方法主要利用 Hough 變化檢測車牌周圍邊框直線。這種方法的缺點(diǎn)是 Hough 變換計(jì)算量大,對(duì)于邊框不連續(xù)的實(shí)際車牌,需附加大量的運(yùn)算6。(4)統(tǒng)計(jì)直方圖與投影方法:該方法通過對(duì)圖像的水平和垂直兩個(gè)方向灰度投影直方圖來分析推斷出牌照的位置。該方法的缺點(diǎn)是對(duì)噪聲敏感,且牌照?qǐng)D像存在傾斜時(shí),不能達(dá)到預(yù)期的效果。第 2 類:即先對(duì)車輛圖像進(jìn)行車牌的粗定位,然后再進(jìn)行精定位。所謂粗定位 . 9 / 47有兩種含義:第 1 種粗定位的含義就是從車輛圖像中找出車牌的大致位置,它并不要求非常精確的定位出車牌的位置,只需要給出包含車牌的相對(duì)較小
24、或較大的一塊區(qū)域就達(dá)到目的;第 2 種粗定位的含義就是利用粗分割,即給出包含車牌區(qū)域在的若干候選區(qū)域,再從這些區(qū)域中提取車牌區(qū)域7。這里不再作詳細(xì)的論述。2.3 系統(tǒng)采用的定位方法在系統(tǒng)中,采用投影法來實(shí)現(xiàn)車輛牌照的定位。利用水平投影來檢測車牌的水平位置,利用垂直投影和形態(tài)學(xué)的方法檢測車牌的垂直位置8。2.3.1 車輛牌照的水平定位得到二值化圖像以后,首先把二值圖像投影到 y 軸。根據(jù)車牌特征,車牌區(qū)域中的垂直邊緣較密集,而且車牌一般懸掛在車身較低的位置其下方?jīng)]有很多的邊緣密集區(qū)域。因此在車牌對(duì)應(yīng)的水平位置上會(huì)出現(xiàn)一個(gè)峰值,如圖 2-2 所示。峰值的兩個(gè)低谷點(diǎn)就是車牌的垂直位置,這樣就得到了包
25、含了車牌的帶狀區(qū)域。所以問題轉(zhuǎn)成確定低谷點(diǎn)的位置。但是從圖中可以發(fā)現(xiàn)投影圖不是十分的光滑,會(huì)給精確定位帶來一些困難,所以對(duì)投影圖進(jìn)行平滑。窗口尺寸比較關(guān)鍵,選小了不足以平滑,選大了則會(huì)改變投影圖原有的基本變化特性。對(duì)于實(shí)際的投影曲線可以通過找差分曲線的過零點(diǎn)來確定低谷點(diǎn),所以對(duì)平滑以后的投影圖求一階差分:)(nh (2-3) 1()()(nhnhnh找出其由正至負(fù)的點(diǎn),也就是局部最小值。但是并不是所有的局部最小值之間都能稱為峰的,它可能附屬鄰近的一個(gè)峰,因而要確定哪一個(gè)局部最小值是峰谷,哪一個(gè)是毛刺。如何判決峰的獨(dú)立性呢?本文采取了 3 個(gè)判決依據(jù):1. 獨(dú)立峰具有一定峰頂和峰谷的落差,當(dāng)局部
26、最大值和鄰近的局部最小值的差大于閾值,則該局部最小值為谷底,反之則為毛刺。2獨(dú)立峰具有一定的寬度,這是由車牌的寬度信息決定的。3獨(dú)立峰具有一定的面積,這是因?yàn)樵诮?jīng)過邊緣提取,二值化后,在車牌區(qū)域具有明顯的紋理特征。在光照均勻和背景不是很復(fù)雜的圖像中,車牌的峰值特性十分明顯,很容易就可以定位出車牌區(qū)域的水平位置。但在光照不均勻或背景復(fù)雜的圖像中峰值特性就不是很明顯了。如何準(zhǔn)確地確定局部最小值是否為谷底,關(guān)鍵在于閾值的選取。2.3.2 車輛牌照的垂直定位 . 10 / 47根據(jù)車牌的特征可以知道,車牌在垂直方向的投影呈現(xiàn)有規(guī)律的“峰、谷、峰”的分布。字符與字符之間的間隔是近似相等的,而且字符的寬度
27、是近似相等的,而車 (a a)二值化圖像)二值化圖像 (b b)水平投影圖)水平投影圖圖圖 2-22-2 水平投影水平投影牌具有 7 個(gè)字符,所以車牌區(qū)域在垂直方向上的投影應(yīng)該存在 6 個(gè)低谷點(diǎn),而且相鄰低谷點(diǎn)之間的距離是近似相等的,第二和第三字符之間的距離略大于其他字符間的距離。但在現(xiàn)實(shí)中得到二值圖像的“峰、谷、峰”的特點(diǎn)并不十分明顯,采用這種方法對(duì)車牌的垂直位置進(jìn)行定位效果不是很好,本文考慮使用形態(tài)學(xué)與投影法相結(jié)合的方法來對(duì)車牌進(jìn)行垂直定位,下面簡單介紹圖像形態(tài)學(xué)9。最初形態(tài)學(xué)是生物學(xué)中研究動(dòng)物和植物的一個(gè)分支,后來也用數(shù)學(xué)形態(tài)學(xué)來表示以形態(tài)學(xué)為基礎(chǔ)的圖像分析數(shù)學(xué)工具。形態(tài)學(xué)的基本思想是使
28、用具有一定形態(tài)的結(jié)構(gòu)元素來度量和提取圖像中的對(duì)應(yīng)形狀,從而達(dá)到對(duì)圖像進(jìn)行分析和識(shí)別的目的。數(shù)學(xué)形態(tài)學(xué)可以用來簡化圖像數(shù)據(jù),保持圖像的基本形狀特性,同時(shí)去掉圖像中與研究目的無關(guān)的部分。使用形態(tài)學(xué)操作可以實(shí)現(xiàn)增強(qiáng)對(duì)比度、消除噪聲、細(xì)化、填充和分割等常用的圖像處理任務(wù)。數(shù)學(xué)形態(tài)學(xué)的數(shù)學(xué)基礎(chǔ)和使用的語言是集合論,其基本運(yùn)算有四種:膨脹(Dilation ) 、腐蝕(Erosion )、開啟(Open)和閉合(Close )。基于這些基本運(yùn)算還可以推導(dǎo)和組成各種數(shù)學(xué)形態(tài)學(xué)運(yùn)算方法。其運(yùn)算對(duì)象是集合,通常給出一個(gè)圖像集合和一個(gè)結(jié)構(gòu)元素集合,利用結(jié)構(gòu)元素對(duì)圖像進(jìn)行操作。結(jié)構(gòu)元素是一個(gè)用來定義形態(tài)操作中所用到
29、的鄰域的形狀和大小的矩陣,可以具有任意的大小和維數(shù)。下面簡單介紹一下以上 4 種運(yùn)算。1、膨脹膨脹的運(yùn)算符為“”,圖像集合用結(jié)構(gòu)元素來膨脹,記作,其定ABBA義見式(2-4),其中表示的映像,即與關(guān)于原點(diǎn)對(duì)稱的集合。式(2-4)表BBB . 11 / 47明,用對(duì)進(jìn)行膨脹的過程是這樣的:首先對(duì)作關(guān)于原點(diǎn)的映射,再將其映像BAB平移,當(dāng)與映像的交集不為空集時(shí),的原點(diǎn)就是膨脹集合的像素。也就是xABB說,用來膨脹得到的集合是的位移與至少有一個(gè)非零元素相交時(shí)的原點(diǎn)BABAB的位置的集合。(2-4)ABxBAx|膨脹的作用效果如圖 2-3 所示。其中白色表示目標(biāo),背景為黑色,結(jié)構(gòu)元素為一 33 正方形
30、對(duì)象。(a a)膨脹前)膨脹前 (b b)膨脹后)膨脹后圖圖 2-32-3 圖像膨脹前后的顯示效果對(duì)比圖像膨脹前后的顯示效果對(duì)比2、腐蝕腐蝕的運(yùn)算符是,圖像集合用結(jié)構(gòu)元素來腐蝕記作,其定義為:ABBA (2-ABxBAx)( |5)式(2-5)表明,用來腐蝕的結(jié)果是所有滿足將平移后,仍全部包含在ABBxB中的的集合,從直觀上看就是經(jīng)過平移后全部包含在中的原點(diǎn)組成的集合。AxBA腐蝕的操作效果如圖 2-4 所示,其中白色為目標(biāo),黑色為背景,結(jié)構(gòu)元素為一33 正方形對(duì)象。(a a)腐蝕前)腐蝕前 (b b)腐蝕后)腐蝕后圖圖 2-42-4 圖像腐蝕前后的顯示效果對(duì)比圖像腐蝕前后的顯示效果對(duì)比 .
31、12 / 473、開啟開啟的運(yùn)算符為“ ”, 用來開啟記為,其定義如下:ABBA (2-6)BBABA)(4、閉合閉合的運(yùn)算符為“ ”,用來閉合記為,其定義見式(2-7):ABBA (2-7)BBABA)(開啟和閉合運(yùn)算不受原點(diǎn)位置的影響,無論原點(diǎn)是否包含在結(jié)構(gòu)元素中,開啟和閉合的結(jié)果都是一樣的。開啟和閉合操作的效果如圖 2-5 所示,其中白色為目標(biāo),黑色為背景。對(duì)形態(tài)學(xué)了解后,我們用形態(tài)學(xué)來進(jìn)行定位,具體算法為:1、對(duì)得到的帶狀區(qū)域用結(jié)構(gòu)算子先進(jìn)行一次腐蝕運(yùn)算,消除一些獨(dú)立的亮點(diǎn),但使用的結(jié)構(gòu)算子不能太大,否則會(huì)失去一部分車牌的信息。(a a)原圖)原圖 (b b)對(duì)原圖開啟操作后)對(duì)原圖開
32、啟操作后 (c c)對(duì)原圖閉合操作后)對(duì)原圖閉合操作后 圖圖 2-52-5 圖像的開啟、閉合操作的顯示效果圖像的開啟、閉合操作的顯示效果2、再進(jìn)行二次膨脹運(yùn)算,由于膨脹的目的是要把車牌區(qū)域連通,因此使用的結(jié)構(gòu)算子和腐蝕的結(jié)構(gòu)算子不一樣,要略大一些。3、最后進(jìn)行一次開運(yùn)算,將車牌區(qū)域平滑一下。可以發(fā)現(xiàn)車牌在圖像中形成了一個(gè)塊狀區(qū)域。如圖 2-6 所示。將得到的圖像再投影到垂直方向,再根據(jù)車牌的寬度信息,設(shè)定一個(gè)圍,可以把這個(gè)圍設(shè)置大些,這是因?yàn)榻?jīng)過形態(tài)學(xué)變化后,車牌的長度會(huì)變大,而且有可能把附近的一些雜點(diǎn)連在一起了,從而增大了車牌連通區(qū)域的長度,如果圍定的太小,就有可能檢測不到車牌區(qū)域10。2.
33、3.3 定位的算法實(shí)現(xiàn)利用投影法,在 Visual C+中用 C+語言對(duì)以上算法進(jìn)行編程,對(duì)車輛牌照進(jìn) . 13 / 47行定位。實(shí)驗(yàn)中水平方向上的定位函數(shù)為 HprojectDIB();垂直方向上的定位函數(shù)為 VprojectDIB();定位以后分割過程所用的函數(shù)為 TempSubert();iTop 和iBottom 分別是車牌的上下邊緣,iLeft 和 iRight 為車牌的左右邊緣。定出車牌的四個(gè)邊緣以后,就可以通過分割函數(shù) TempSubert()將車牌從源圖像中裁減出來,為了使裁減的準(zhǔn)確,可以設(shè)置邊緣的微量調(diào)整。圖像定位算法流程圖如圖 2-7 所示。(a)(a) 水平投影分割得到的
34、圖像水平投影分割得到的圖像 (b)(b) 腐蝕運(yùn)算得到的圖像腐蝕運(yùn)算得到的圖像 (c)(c) 第一次膨脹運(yùn)算得到的圖像第一次膨脹運(yùn)算得到的圖像 (d)(d) 第二次膨脹運(yùn)算得到的圖像第二次膨脹運(yùn)算得到的圖像圖圖 2-62-6 形態(tài)學(xué)變化得到的圖像形態(tài)學(xué)變化得到的圖像 . 14 / 47圖圖 2-72-7 定位流程圖定位流程圖 . 15 / 472.4 實(shí)驗(yàn)結(jié)果分析經(jīng)實(shí)驗(yàn),大部分圖片中的牌照能夠被正確的定位出來如圖 2-8,極少部分牌照不能正確定位。實(shí)驗(yàn)表明,投影法基本上實(shí)現(xiàn)了車輛牌照的定位,但同時(shí)不難看出被定位的車牌還包括車牌邊框,與理想要求還有很大差距,如果在這些車牌上進(jìn)行字符分割,將會(huì)有很
35、大的困難。另外在實(shí)驗(yàn)中還發(fā)現(xiàn)該算法對(duì)車牌背景環(huán)境要求比較嚴(yán)格,車牌如果比較傾斜或者車牌顏色與汽車顏色相近或者車牌背景中的噪聲較大,則定位起來比較困難,不能實(shí)現(xiàn)車牌的精確定位,以后需要進(jìn)一步改進(jìn)。圖圖 2-82-8 定位前后的圖像定位前后的圖像 . 16 / 47第 3 章 車輛牌照的字符分割在做字符分割以前,必須對(duì)定位出來的圖像做進(jìn)一步的處理,要對(duì)車牌做去邊框處理、去噪聲處理、梯度銳化、傾斜度調(diào)整等預(yù)處理才能進(jìn)行字符分割。3.1 車牌預(yù)處理3.1.1 去邊框處理一般藍(lán)底白字的車牌都有白色邊框,與字符的顏色一樣,它的存在將對(duì)后繼的字符識(shí)別造成影響,因此它的濾除十分必要。1、濾除上下邊框?qū)z測到的
36、二值牌照?qǐng)D像進(jìn)行水平投影,在 0IHeight 的圍,計(jì)算各 sumI,( sumI為從 0 到 Width 的圍,二值化牌照?qǐng)D像的白像素點(diǎn)數(shù))然后,將所有的sumI累加起來,記為一值,然后將該值除以 2*Height-(2/3)*Height,如果 sumI小于該商,就令該 sumI為 0。這樣直方圖中必有連零塊和非連零塊,測試每個(gè)非連零塊的寬度,如果它不在車牌高度的圍,就置其為零,那么就將邊框?yàn)V除了(其中Height,Width 為牌照?qǐng)D像的高度和寬度)。2、濾除左右邊框?yàn)V除左右邊框的方法與濾除上下邊框的方法類似,只是閾值有些不同,不再贅述。3.1.2 去噪聲處理圖像在掃描或者傳輸過程中夾
37、帶了噪聲,去噪聲是圖像處理中常用的手法。通常去噪聲用濾波的方法,比如空間域?yàn)V波和同態(tài)濾波。采用合適的濾波方法不但可以濾除噪聲還可以對(duì)圖像進(jìn)行銳化,增強(qiáng)圖像的邊緣信息。下面介紹幾種常用的濾波方法。1、鄰域平均法為了消除圖像中的噪聲,可以直接在空間域上對(duì)圖像進(jìn)行平滑濾波。它的作用有兩種:一種是模糊;另一種是消除噪聲。空間域的平滑濾波一般采用簡單平均法進(jìn)行,就是求鄰近像素點(diǎn)的平均亮度值,稱為鄰域平均法。鄰域的大小與平滑的效果直接相關(guān),鄰域越大平滑的效果越好,但鄰域過大,平滑會(huì)使邊緣信息損失的越大,從而使輸出的圖像變得模糊,因此需要合理選擇鄰域的大小。典型的鄰域有兩 . 17 / 47種:四鄰域和八鄰
38、域,其模板見式(3-1)。如果圖像中的噪聲是隨機(jī)不相關(guān)的加性噪聲,窗口各點(diǎn)噪聲是獨(dú)立分布的,經(jīng)過上述模板平滑后,信號(hào)與噪聲的方差比可提高許多倍。這種算法簡單,處理速度快,但它的主要缺點(diǎn)是在降低噪聲的同時(shí)使圖像產(chǎn)生模糊,特別在邊緣和細(xì)節(jié)處。而且,(3-1)010101010414M111101111818M隨著鄰域的增大,雖然增強(qiáng)了去噪聲的能力,但同時(shí)模糊程度也更嚴(yán)重。2、高通濾波在進(jìn)行圖像處理時(shí),我們經(jīng)常要對(duì)圖像進(jìn)行銳化以便突出圖像的邊緣。同樣的,可以采用在空間域?qū)D像進(jìn)行濾波的方法,只不過這時(shí)采用的沖激響應(yīng)陣列與空間域低通濾波時(shí)所采用的完全不同。采用高通濾波器讓高頻分量順利通過,而對(duì)低頻分量
39、則充分限制,使圖像的邊緣變得清晰,實(shí)現(xiàn)圖像的銳化。但是,對(duì)圖像進(jìn)行空間域的高通濾波,在增強(qiáng)圖像邊緣的同時(shí),孤立的噪聲點(diǎn)也得到了增強(qiáng)。常用于空間域高通濾波的沖激響應(yīng)陣列有以下幾種: (3-2)0101510101H1111911112H1212521213H3、中值濾波中值濾波是一種非線性濾波,它也是一種鄰域運(yùn)算,類似于卷積。但中值濾波的計(jì)算不是加權(quán)求和,而是把它鄰域的所有像素按灰度值進(jìn)行排序,然后取該組的中間值作為鄰域中心像素點(diǎn)的輸出值。中值濾波的突出優(yōu)點(diǎn)是在消除噪聲的同時(shí),還能防止邊緣模糊。如果圖像的噪聲多是孤立的點(diǎn),這些點(diǎn)對(duì)應(yīng)的像素又很少,而圖像則是由像素較多、面積較大的塊構(gòu)成,中值濾波效
40、果很好。4、同態(tài)濾波同態(tài)濾波器的思想就是用一系列方法把乘性信號(hào)變換成加性組合信號(hào),經(jīng)過處理后再反變換回乘性信號(hào)。同態(tài)濾波以圖像的照明反射模型作為頻域處理的基礎(chǔ),它在數(shù)字圖像處理中有著十分重要的應(yīng)用。這里不再詳細(xì)論述。去除噪聲處理要根據(jù)不同的噪聲特點(diǎn)選取合適的方法。本系統(tǒng)采用的是去除雜點(diǎn)的方法來進(jìn)行去噪聲處理。具體的算法如下:掃描整個(gè)圖像,當(dāng)發(fā)現(xiàn)一個(gè)黑色點(diǎn) . 18 / 47的時(shí)候就考察和該點(diǎn)直接或間接相連接的黑色點(diǎn)的個(gè)數(shù)有多少,如果大于一定的值,就說明該點(diǎn)不是離散點(diǎn),否則就是離散點(diǎn),把它去除掉。在考察相連的黑色點(diǎn)的時(shí)候用的是遞歸的方法。 . 19 / 473.1.3 梯度銳化我們所得到的二值化
41、圖像的字體一般是比較模糊的,對(duì)識(shí)別造成了一定的困難,所以有時(shí)要對(duì)圖像進(jìn)行銳化處理使模糊的圖像變得清晰,同時(shí)可以對(duì)噪聲起到一定的抑制和去除作用。圖像的銳化有很多方法,一種是微分法,一種是高通濾波法,梯度銳化的方法就是微分法的一種。梯度對(duì)應(yīng)一階導(dǎo)數(shù),梯度算子是一階導(dǎo)數(shù)算子。對(duì)一個(gè)連續(xù)函數(shù)它在位),(yxf置的梯度可以表示為一個(gè)矢量:),(yx (3-3)TTyxyfxfGGyxf),(這個(gè)矢量的幅度(也常直接簡稱為梯度)和方向角分別為: (3-2122)(yxGGfmag4) (3-)arctan(),(xyGGyx5) 以上三式中的偏導(dǎo)數(shù)需要對(duì)每個(gè)象素位置計(jì)算。在實(shí)際中常用小區(qū)域模板卷積來近似計(jì)
42、算。對(duì)和各用一個(gè)模板,所以需要兩個(gè)模板組合起來構(gòu)成一個(gè)梯度xGyG算子。根據(jù)模板的大小,其中元素值的不同,人們提出了許多種不同的算子如圖 3-1。在這三個(gè)算子中,最簡單的算子是 Roberts 算子,Roberts 算子是效果比較好的一種,我們采用的就是這個(gè)算子,效果如圖 3-2 所示。算子運(yùn)算時(shí)是采用類似卷積的方式,將模板在圖像上移動(dòng)并在每個(gè)位置計(jì)算中心象素的梯度值。在邊緣灰度值過渡比較尖銳且圖像中噪聲比較小時(shí),梯度算子的工作效果較好。-1-11-11-111-11-111121-1-2-1-1-2-121(a a)RobertsRoberts (b)(b) PrewittPrewitt (
43、c)(c) SobelSobel圖圖 3-13-1 幾種常見的梯度模板算子幾種常見的梯度模板算子通過圖 3-2 可以看出梯度銳化可以讓模糊的邊緣變的清楚,同時(shí)選擇合適的閾值還可以減弱和消除一些細(xì)小的噪聲。實(shí)驗(yàn)證明梯度銳化具備一定的去噪聲能力,但同時(shí)也會(huì)對(duì)字符的邊緣有所損傷。 . 20 / 47從處理結(jié)果可以看出圖像的邊緣變得清晰而且少了很多細(xì)小的雜點(diǎn),但梯度銳化有其自身的缺陷,當(dāng)處理的圖像邊緣很細(xì)的時(shí)候可能造成邊緣信息的損失。在實(shí)驗(yàn)中,如果圖像中的字符較為細(xì)小,則不使用梯度銳化。 (a a)原始圖像)原始圖像 (b b)利用)利用 RobertsRoberts 算子檢測到的邊緣算子檢測到的邊緣
44、 (c c)利用)利用 PrewittPrewitt 算子檢測到的邊緣算子檢測到的邊緣 (d d)利用)利用 SobelSobel 算子檢測到的邊緣算子檢測到的邊緣圖圖 3-23-2 梯度算子的檢測效果比較梯度算子的檢測效果比較3.1.4 傾斜調(diào)整雖然在拍攝車輛車牌時(shí),可以調(diào)整 CCD 攝像機(jī)的俯仰角度、攝取方向和水平度,以保持車牌的橫向邊緣的傾斜度盡可能小,并且讓車牌在整幅圖像中處于相對(duì)居中的位置,即圖像的視覺中心上。但是,實(shí)際上 CCD 攝像機(jī)通常安裝在路邊或頂部,這將造成車輛車牌與 CCD 攝像頭成像平面不平行,產(chǎn)生不同程度的車牌圖像的傾斜與變形,影響車牌的檢測和分割。就圖像的旋轉(zhuǎn)傾斜的
45、問題,更多的情況下,圖像的水平校正是放在車牌的二值化和分割,甚至是在車牌字符切分之后再進(jìn)行,這樣圖像的運(yùn)算量大大減少。然而,傾斜的車牌圖像本身就極不利于車牌字符的切分,因此,將圖像水平校正放在圖像預(yù)處理過程中是切實(shí)可行的11。一般情況下,可將傾斜的車牌圖像近似看成一個(gè)平行四邊形,它有三種傾斜模式:水平傾斜見圖 3-3,垂直傾斜見圖 3-4 和水平垂直傾斜見圖 3-5,分別如下所示。水平傾斜時(shí),字符基本上無傾斜,車牌的水平軸與圖像坐標(biāo)系的水平軸有xx一個(gè)傾斜角度,只要求取,將圖像繞軸旋轉(zhuǎn)即可。垂直傾斜時(shí),傾斜實(shí)際x上是同一行間像素的錯(cuò)位偏移,只要檢測到垂直傾斜角度進(jìn)行錯(cuò)位偏移校正即可。水平垂直傾
46、斜時(shí),既存在水平傾斜又存在垂直傾斜,是最一般的情況。可先檢測水平傾斜角度,進(jìn)行水平傾斜校正,然后再求取垂直傾斜角度進(jìn)行垂直傾斜校正。對(duì)車輛牌照做預(yù)處理以后就可以進(jìn)行字符分割的步驟。 . 21 / 47xyx/y/x/xy/y(a) 水平傾斜水平傾斜() (b) 水平傾斜水平傾斜(0)0 圖圖 3-33-3 水平傾斜水平傾斜ijij(a) 垂直傾斜垂直傾斜() (b) 垂直傾斜垂直傾斜()00 圖圖 3-43-4 垂直傾斜垂直傾斜xx/yy/xy/yx(a) 水平垂直傾斜水平垂直傾斜() (b) 水平垂直傾斜水平垂直傾斜(0)0 圖圖 3-53-5 水平垂直傾斜水平垂直傾斜3.2 字符分割方法簡
47、介 . 22 / 47圖像分割是一種基本的計(jì)算機(jī)視覺技術(shù),是由圖像處理進(jìn)行到圖像分析的關(guān)鍵步驟,這是因?yàn)閳D像的分割、目標(biāo)的分離、特征的提取和參數(shù)的測量將原始圖像轉(zhuǎn)化為更抽象更緊湊的形式,使得更高層的分析和理解成為可能。圖像分割多年來一直得到人們的高度重視,至今已提出各種類型的分割算法12。字符分割的算法很多,通常根據(jù)處理對(duì)象的不同有許多相應(yīng)的方法。為了實(shí)現(xiàn)更好的分割,有關(guān)景物的總體知識(shí)和先驗(yàn)信息是很有用的,根據(jù)包含在圖像中的信息,可以定制相應(yīng)的判決準(zhǔn)則和控制策略,使其完成自動(dòng)分割,比如對(duì)多行文本的處理,郵政部門對(duì)郵政編碼和地址的識(shí)別,金融等部門對(duì)支票簽名手寫字跡的分割識(shí)別等等,都是針對(duì)具體的不
48、同研究對(duì)象而采用不同的算法。傳統(tǒng)的字符分割算法可以歸納為以下三類:直接的分割法,基于識(shí)別基礎(chǔ)上的分割法,自適應(yīng)分割線聚類法13。直接的分割法簡單,但它的局限是分割點(diǎn)的確定需要較高的準(zhǔn)確性;基于識(shí)別結(jié)果的分割是把識(shí)別和分割結(jié)合起來,但是需要識(shí)別的高準(zhǔn)確性,它根據(jù)分割和識(shí)別的耦合程度又有不同的劃分;自適應(yīng)分割線聚類法是要建立一個(gè)分類器,用它來判斷圖像的每一列是否是分割線,但是對(duì)于粘連的字符是很難訓(xùn)練的。因?yàn)榉指畈豢赡茏龅酵耆_,現(xiàn)在有的算法已經(jīng)把字符的分割作為不必要的步驟,而是直接把字符組成的單詞當(dāng)作一個(gè)整體來識(shí)別。利用諸如馬爾可夫數(shù)學(xué)模型等方法進(jìn)行處理,這主要是應(yīng)用于文本識(shí)別。以上的字符分割算
49、法均是基于二值圖像進(jìn)行的。考慮到二值圖像丟失掉了很多信息,而且可能會(huì)造成字符粘連、模糊或斷裂的缺陷,對(duì)灰度圖像的直接處理已經(jīng)有人開始研究。在一般的字符識(shí)別系統(tǒng)中,字符識(shí)別之前要經(jīng)過閾值化過程和行字切分過程,以分割出一個(gè)具體的二值表示的字符圖像點(diǎn)陣,作為單字符識(shí)別的輸入數(shù)據(jù)。其中,識(shí)別字符過程中的第一步就是要將獲得的數(shù)字灰度圖像轉(zhuǎn)變?yōu)閿?shù)字二值圖像,這個(gè)過程稱為二值化過程,采用的技術(shù),通常稱為閾值化技術(shù)。由于獲得的文本圖像不但包含了組成文本的一個(gè)個(gè)字符,而且包含了字符行間與字間的空白,甚至還會(huì)帶有各種標(biāo)點(diǎn)符號(hào),這就需要采用一定的處理技術(shù),將文本中的一個(gè)個(gè)字符切分出來,形成單個(gè)字符的圖像陣列,以進(jìn)行
50、單字識(shí)別處理。這就是字符文本的行字切分問題,分為行切分和字切分兩個(gè)主要步驟,首先由行切分得到一行行文本字行,然后在文本字行中進(jìn)行列切分得到一個(gè)個(gè)單獨(dú)的字符點(diǎn)陣。車牌的字符切分是在車牌定位的基礎(chǔ)上,對(duì)取出的牌照?qǐng)D像區(qū)域進(jìn)行下一步處理,定出牌照上每一個(gè)字符的上下左右邊界,從而將牌照上的字符完整準(zhǔn)確地切割 . 23 / 47下來,作為下一步字符識(shí)別的數(shù)據(jù)源。牌照切分是在二值圖上進(jìn)行的。字符切分分為兩步進(jìn)行,先進(jìn)行字符的垂直切分,定出每個(gè)字符的左右邊界,然后進(jìn)行字符的水平切分,定出每個(gè)字符的上下邊界。字符切割過程往往容易被人忽視,但是它對(duì)于字符識(shí)別的重要性是不言而喻的,因?yàn)榍懈铄e(cuò)誤的字符被正確識(shí)別的概
51、率基本上等于零。3.3 系統(tǒng)采用的分割方法根據(jù)以上介紹的算法,本文采用了一種比較實(shí)用的方法,通過對(duì)圖像的掃描,得到分割的字符。3.3.1 算法介紹經(jīng)過處理后的車牌可以進(jìn)行字符分割,本文的分割算法如下:1、先自上而下對(duì)圖像進(jìn)行逐行掃描直至遇到第一個(gè)黑色象素點(diǎn)。記錄下來。然后在自下而上對(duì)圖像進(jìn)行逐行掃描直至找到第一個(gè)黑色象素,記錄下來。這樣就可以找到圖像的大致高度圍。2、在上面得到的高度圍對(duì)圖像進(jìn)行自左向右逐列進(jìn)行掃描,遇到第一個(gè)黑色象素時(shí)認(rèn)為是字符分割的起始位置,然后繼續(xù)掃描,直至遇到有一列中沒有黑色象素,則認(rèn)為是第一個(gè)字符分割結(jié)束,然后繼續(xù)掃描,按照上面的方法一直掃描到圖像的最右端。這樣就得到
52、了每個(gè)字符比較精確的寬度圍。3、在已知的每個(gè)字符的比較精確的寬度圍,按照第一步的方法,分別進(jìn)行自上而下和自下而上的逐行掃描來獲取每個(gè)字符精確的高度圍。經(jīng)過以上 3 個(gè)步驟的循環(huán),就可以實(shí)現(xiàn)字符的分割。字符分割以后要做歸一化和緊縮排列,以便做特征提取14。因?yàn)閽呙柽M(jìn)來的圖像字符大小存在差異,而相對(duì)來說,統(tǒng)一尺寸的字符識(shí)別的標(biāo)準(zhǔn)性更強(qiáng)準(zhǔn)確率自然也更高,標(biāo)準(zhǔn)化圖像就是要把原來各不一樣的字符統(tǒng)一到同一尺寸,在本系統(tǒng)中是統(tǒng)一到同一高度然后根據(jù)高度來調(diào)整字符的寬度。具體算法為:先得到原來字符的高度,并與系統(tǒng)要求的高度作比較,得出要變換的系數(shù),然后根據(jù)得到的系數(shù)求變換后應(yīng)有的寬度。在得到寬度高度之后,把新圖
53、像里面的點(diǎn)按照插值的方法映射到原圖像中。圖像標(biāo)準(zhǔn)歸一化的高度和寬度信息可以通過一個(gè)對(duì)話框輸入,但為了以后特征提取的時(shí)候處理方便。建議歸一化的寬度為 8,高度為 16。 . 24 / 47經(jīng)過標(biāo)準(zhǔn)歸一化處理后的各字符在圖像中的位置不定,要對(duì)它進(jìn)行特征提取處理起來比較麻煩,所以要把歸一化處理后的字符進(jìn)行緊縮排列,以形成新的位圖句柄,以方便下一步的提取工作至此已經(jīng)基本上完成圖像中字符的分割工作。此外還可以采用其他方法以達(dá)到更好的效果。3.3.2 算法的實(shí)現(xiàn)根據(jù)以上算法在 VC+中用 C+語言編程,可以實(shí)現(xiàn)字符分割,并實(shí)現(xiàn)字符的歸一化和緊縮排列。實(shí)驗(yàn)中的字符分割函數(shù)為 CharSegment();Dr
54、awFrame()函數(shù)用來給分割后的字符周圍畫邊框;StdDIBbyRec()函數(shù)用來實(shí)現(xiàn)歸一化處理;緊縮排列由函數(shù) AutoAlign()完成。下面圖 3-6 顯示了分割算法實(shí)現(xiàn)流程: . 25 / 47圖圖 3-63-6 分割算法的實(shí)現(xiàn)流程分割算法的實(shí)現(xiàn)流程 . 26 / 473.4 字符分割實(shí)驗(yàn)結(jié)果實(shí)驗(yàn)結(jié)果如下面幾幅圖所示,為了便于觀察分割結(jié)果,每個(gè)被分割后的字符都用方框分割開來。從實(shí)驗(yàn)可以得出,該字符分割模塊基本上可以完成大部分的數(shù)字字符分割。圖 3-12 中“川”字被分割成了三份,這說明分割算法的正確性,但它對(duì)漢字的分割卻是錯(cuò)誤的。圖 3-13 中為了可以清楚的觀察字符的緊縮排列,歸
55、一化的字符寬度為 12,高度為 24(圖 3-11 中的字符寬度為 8,高度為 16)。由于漢字結(jié)構(gòu)比較復(fù)雜,所以該算法不能對(duì)漢字作字符的分割。在實(shí)驗(yàn)時(shí),圖中如果含有漢字,則系統(tǒng)就會(huì)出現(xiàn)錯(cuò)誤而拒絕作字符分割,實(shí)現(xiàn)漢字分割還需要作進(jìn)一步改進(jìn)。圖圖 3-73-7 字符分割的結(jié)果字符分割的結(jié)果 圖圖 3-83-8 緊縮排列的結(jié)果緊縮排列的結(jié)果 圖圖 3-93-9 車牌的字符分割結(jié)果車牌的字符分割結(jié)果 圖圖 3-103-10 車牌的字符緊縮排列結(jié)果車牌的字符緊縮排列結(jié)果 . 27 / 47第 4 章 特征提取與字符識(shí)別經(jīng)過上面的一系列變換,車牌中的字符被分割提取出來。下面就要從被分割歸一化處理完畢的字
56、符中提取最能體現(xiàn)這個(gè)字符特點(diǎn)的特征向量。將提取出的訓(xùn)練樣本中的特征向量代入 BP 網(wǎng)絡(luò)之中就可以對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,提取出待識(shí)別樣本的特征向量代入到訓(xùn)練好的 BP 網(wǎng)絡(luò)中,就可以對(duì)字符進(jìn)行識(shí)別。4.1 字符的特征提取特征提取的方法多種多樣,有逐象素特征提取法,骨架特征提取法,垂直方向數(shù)據(jù)統(tǒng)計(jì)特征提取法,13 點(diǎn)特征點(diǎn)提取法,弧度梯度特征提取法等很多種方法,根據(jù)具體情況的不同我們可以選擇不同的方法。1、逐象素特征提取法這是一種最簡單的特征提取方法,對(duì)圖像進(jìn)行逐行逐列的掃描,當(dāng)遇到黑色象素時(shí)取其特征值為 1,遇到白色象素時(shí)取其特征值為 0,這樣當(dāng)掃描結(jié)束以后就形成了一個(gè)維數(shù)與圖像中象素點(diǎn)的個(gè)數(shù)一樣的特
57、征向量矩陣。2、骨架特征提取法兩幅圖像由于它們的線條的粗細(xì)不同,使得兩幅圖像的差別很大,但將它們的線條細(xì)化后,統(tǒng)一到一樣的高度,這時(shí)兩幅圖像的差距就不那么明顯。利用圖形的骨架作為特征來進(jìn)行數(shù)碼識(shí)別,就使得識(shí)別有了一定的適應(yīng)性。一般使用細(xì)化的方法來提取骨架,細(xì)化的算法很多如 Hilditch 算法、Rosenfeld 算法等。對(duì)經(jīng)過細(xì)化的圖像利用 EveryPixel 函數(shù)進(jìn)行處理就可以得到細(xì)化后圖像的特征向量矩陣。骨架特征提取的方法對(duì)于線條粗細(xì)不同的圖像有一定的適應(yīng)性,但圖像一旦出現(xiàn)偏移就難以識(shí)別。3、垂直方向數(shù)據(jù)統(tǒng)計(jì)特征提取法這種算法就是自左向右對(duì)圖像進(jìn)行逐列的掃描,統(tǒng)計(jì)每列黑色象素的個(gè)數(shù),
58、然后自上向下逐行進(jìn)行掃描,統(tǒng)計(jì)每行的黑色象素的個(gè)數(shù),將統(tǒng)計(jì)結(jié)果作為字符的特征向量,如果字符的寬度 w,長度為 h,則特征向量的維數(shù)是 w+h。該提取方法的缺點(diǎn)是適應(yīng)性不強(qiáng),當(dāng)字符存在傾斜和偏移時(shí)都會(huì)對(duì)識(shí)別產(chǎn)生誤差。4、13 點(diǎn)特征點(diǎn)提取法 . 28 / 47首先把字符平均分成 8 份,統(tǒng)計(jì)每一份黑色象素點(diǎn)的個(gè)數(shù)作為 8 個(gè)特征,分別統(tǒng)計(jì)這 8 個(gè)區(qū)域黑色象素的數(shù)目,可以得到 8 個(gè)特征。然后統(tǒng)計(jì)水平方向中間兩列和豎直方向中間兩列的黑色象素點(diǎn)的個(gè)數(shù)作為 4 個(gè)特征,最后統(tǒng)計(jì)所有黑色象素點(diǎn)的個(gè)數(shù)作為第 13 個(gè)特征。也就是說,畫 4 道線,統(tǒng)計(jì)線穿過的黑色象素的數(shù)目。可以得到 4 個(gè)特征示意圖,最
59、后將字符圖像的全部黑色象素的數(shù)目的總和作為一個(gè)特征總共即得到 13 個(gè)特征。13 特征提取法有著極好的適應(yīng)性,但是由于特征點(diǎn)的數(shù)目太少所以樣本訓(xùn)練的時(shí)候比較難收斂。系統(tǒng)采用了第一種方法即逐象素特征提取法做特征提取。因?yàn)檫@種方法算法簡單,運(yùn)算速度快,可以用 BP 網(wǎng)絡(luò)很快的收斂,訓(xùn)練效果好。4.2 字符的識(shí)別方法簡介同模式識(shí)別中的其它問題一樣,字符識(shí)別方法基本上也分成統(tǒng)計(jì)決策識(shí)別和句法結(jié)構(gòu)識(shí)別兩大類,而每一類中又包含有許多具體的方法。然而無論采取何種識(shí)別方法,其中的關(guān)鍵都是特征的選取與提取以與相應(yīng)的分類算法。與兩種識(shí)別方法相對(duì)應(yīng),特征也大體上分為統(tǒng)計(jì)特征和結(jié)構(gòu)特征兩類。1、結(jié)構(gòu)法結(jié)構(gòu)方法是發(fā)展最
60、早的一種方法,它的基本思想是把字符圖像分割化為若干的基元,例如筆劃、拓?fù)潼c(diǎn)、結(jié)構(gòu)突變點(diǎn)等,然后和模板比較進(jìn)行判別。由這些結(jié)構(gòu)基元與其相互關(guān)系完全可以精確地對(duì)字符加以描述。主要的方法有基于輪廓、骨架和字符鏈碼的方法。其主要優(yōu)點(diǎn)在于對(duì)字符變化的適應(yīng)性強(qiáng),區(qū)分相似字符能力強(qiáng)。但是在實(shí)際應(yīng)用中,面臨的主要問題是抗干擾能力差,因?yàn)樵趯?shí)際得到的字符圖像中存在著各種干擾如傾斜、扭曲、斷裂、粘連和對(duì)比度差等。這些因素直接影響到結(jié)構(gòu)基元的提取,此外結(jié)構(gòu)方法的描述比較復(fù)雜,匹配過程的復(fù)雜度因而也較高。2、統(tǒng)計(jì)法統(tǒng)計(jì)法依賴于大量的原始樣本和數(shù)值計(jì)算,它是從車牌字符原始數(shù)據(jù)中提取與分類最相關(guān)的信息,使得類差距極小化,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 碳素?fù)诫s劑在鐵合金冶煉中的應(yīng)用考核試卷
- 森林公園生態(tài)旅游市場細(xì)分與定位考核試卷
- 農(nóng)業(yè)農(nóng)業(yè)機(jī)械產(chǎn)業(yè)節(jié)能減排配合服務(wù)批發(fā)考核試卷
- 礦物加工廠職業(yè)衛(wèi)生與員工健康考核試卷
- 漁業(yè)資源保護(hù)與海洋資源長期可持續(xù)發(fā)展戰(zhàn)略全面實(shí)施考核試卷
- 電信行業(yè)區(qū)塊鏈技術(shù)探索與應(yīng)用考核試卷
- 紅富士蘋果病蟲害防治考核試卷
- 武漢民政職業(yè)學(xué)院《描述統(tǒng)計(jì)學(xué)和概率》2023-2024學(xué)年第一學(xué)期期末試卷
- 石家莊工程職業(yè)學(xué)院《環(huán)境學(xué)導(dǎo)論》2023-2024學(xué)年第二學(xué)期期末試卷
- 山西體育職業(yè)學(xué)院《高級(jí)應(yīng)用氣象統(tǒng)計(jì)》2023-2024學(xué)年第二學(xué)期期末試卷
- 病理性近視怎治療
- 兒科護(hù)理一科一品
- GB/T 44804-2024聲學(xué)自由場條件下18歲至25歲耳科正常人聽力閾值的統(tǒng)計(jì)分布
- 醫(yī)院感染課件教學(xué)課件
- 幼兒園孩子食物中毒培訓(xùn)
- 影響健康因素多 課件 2024-2025學(xué)年人教版(2024)初中體育與健康七年級(jí)全一冊(cè)
- 【核心素養(yǎng)目標(biāo)】9.1壓強(qiáng) 教學(xué)設(shè)計(jì) 2023-2024學(xué)年教科版八年級(jí)下冊(cè)物理
- 人美版高中美術(shù)必修《美術(shù)鑒賞》 第十三課 新藝術(shù)的實(shí)驗(yàn)-西方現(xiàn)代藝術(shù) (教案)
- 宗親聯(lián)誼修譜會(huì)活動(dòng)方案及流程
- 2025屆江蘇省南京市六區(qū)初三第二學(xué)期期中考試英語試題試卷含答案
- 加裝電梯投標(biāo)方案(技術(shù)方案)
評(píng)論
0/150
提交評(píng)論