【基于神經網絡的交通標志識別算法的設計10000字(論文)】_第1頁
【基于神經網絡的交通標志識別算法的設計10000字(論文)】_第2頁
【基于神經網絡的交通標志識別算法的設計10000字(論文)】_第3頁
【基于神經網絡的交通標志識別算法的設計10000字(論文)】_第4頁
【基于神經網絡的交通標志識別算法的設計10000字(論文)】_第5頁
已閱讀5頁,還剩15頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

基于神經網絡的交通標志識別算法的設計摘要隨著社會經濟的迅速發展和人們生活水平的提高,汽車的產量逐年增加,道路交通擁堵和交通事故頻頻發生,智能交通系統應用而生。交通標志識別系統作為智能交通系統的重要組成部分,受到國內外學者廣泛關注。然而實際道路環境多變且復雜,給交通標志的檢測和識別帶來了挑戰,準確率高、實時性能好的交通標志識別亟待解決,交通標志的檢測與識別研究具有一定的理論價值和實際意義。本文針對GTSRB數據集中的交通標志,利用計算機圖像識別的最新進展,為交通標志圖像識別提供了一種新的方法,提出了一種能夠學習圖像顏色和空間變化的深度學習模型。結果表明,該模型在不進行數據預處理(除裁剪外)和擴充的情況下比人工模型具有更高的性能。關鍵詞:交通標志識別;深度學習;交通標志檢測;卷積神經網絡目錄TOC\o"1-3"\h\u第一章緒言 31.1研究背景 31.2研究意義 31.3研究現狀 41.3.1道路交通標志檢測研究現狀 41.3.2道路交通標志識別研究現狀 51.4論文內容與結構 61.5本章小結 7第二章深度學習相關理論 72.1神經網絡模型 82.2反向傳播 92.3激活函數 102.4損失函數 132.3本章小結 14第三章基于神經網絡的交通標志識別 143.1數據集選擇 143.2算法設計 143.2.1批量歸一化層 153.2.2顏色轉換網絡 153.2.3空間轉換網絡 163.2.4卷積神經網絡 163.3本章小結 184.實驗測試與結果分析 184.1數據采集及處理 184.1.1數據采集 184.1.2數據處理 194.2實驗結果與分析 204.2.1網絡調參 204.2.2結果 215.總結 24參考文獻 24緒言1.1研究背景近年來我國經濟飛速發展,人們生活水平日益提高,汽車走進了千家萬戶,有車有房現在也成為了每個人的標配。汽車在方便了人們生活的同時,道路交通擁堵、交通事故頻發等問題也越發嚴重。現在汽車數量增多,當上下班高峰期間,大量的汽車在交通樞紐道路上行駛容易造成交通堵塞,這會給人們帶來了時間上的浪費。同時駕駛員在交通道路上行駛時,如果分散注意力或者疲勞駕駛,很容易發生交通事故,這會給人們帶來人身傷害和財產損失。為了減少交通擁堵和避免交通事故的發生,智能交通系統應用而生。智能交通系統是將信息、檢測、傳感、控制等技術集合的綜合系統,實現人、車和道路之間的交互協同,從而減少交通擁堵、降低交通事故發生率、提高人們出行的時間效率。而交通標志識別系統正是智能交通系統的重要組成部分。道路上的交通標志信息豐富,包括許多重要的交通信息,能夠提供給駕駛員前方的道路信息。如果駕駛員能夠知道交通標志的信息,預測前方道路信息,就會降低安全事故發生的幾率。所以交通標志識別系統逐漸受到人們的關注,成為熱門的研究問題。1.2研究意義交通標志識別系統在人們道路行駛過程中發揮了重要的作用,如何設計一個準確率高、實時性能好的交通標志識別系統對于車輛安全行駛至關重要。一個準確率低的交通標志識別系統會錯誤檢測識別出交通標志,這會給駕駛員造成誤導,容易引發安全事故,所以交通標志識別系統需要有較高的準確率。且車輛在道路上高速行駛,需要交通標志識別系統能夠實時地識別出交通標志,使駕駛員能夠及時地做出判斷。所以交通標志識別系統的實時性決定了交通標志識別系統是否能夠應用到實際場景中。1.3研究現狀交通標志識別系統主要包括兩個部分,首先從實際場景中檢測出交通標志,然后再對其識別分類。從上世紀七十年代交通標志識別系統開始受到研究者的關注,經過幾十年的深入研究,現如今已經取得了許多的研究成果。1.3.1道路交通標志檢測研究現狀道路交通標志檢測是在圖像采集系統獲得的道路環境圖像中查找到交通標志的部分,并進行圖像處理,只保留交通標志圖像,去除其它部分,為后續步驟做準備。道路交通標志檢測是典型的目標檢測問題,符合感興趣區域提取的過程,因此常用感興趣區域提取相關方法進行交通標志圖像檢測。根據感興趣區域理論,常用于目標檢測的方法有基于顏色特征的檢測方法、基于形狀特征的檢測方法、基于視覺模型的檢測方法以及基于深度學習的檢測方法,這些方法的基本概念如下。(1)基于顏色特征的檢測方法根據目標具有的顏色特征,在圖像中找到符合特征的部分,進行圖像分割,將分割后的結果作為檢測到的目標物,即完成了目標檢測。常用方法有RGB顏色空間法HSV顏色空間法、YUV顏色空間法、LAB顏色空間法等;另外還有一些改進形式,例如熱力圖、顏色概率、最大穩定極值等方法,以及這些方法之間的組合使用。文獻[3]使用LAB顏色空間方法實現了對圖像中陰影的檢測。基于形狀特征的檢測方法根據目標圖像具備的形狀特征,在圖像中搜索特征匹配的圖像,即可完成圖像目標檢測,常用方法有霍夫變換、快速徑向對稱變換、頂角變換等方法。文獻[4]使用形狀特征檢測方法完成了對泄露氣體的檢測。(3)基于視覺模型的方法根據動物視覺產生的原理,構建視覺模型,使用這些視覺模型方法,對圖像進行分析和處理,獲得圖像對應的顯著圖,根據顯著圖也可以實現圖像目標檢測。文獻[5]使用視覺模型方法完成了對路面裂縫的檢測。(4)基于深度學習的檢測方法針對圖像目標檢測問題,常應用深度學習中的SSD、R-CNN、FastR-CNN、FasterR-CNN、RetinaNet等網絡模型方法,通過使用圖像數據進行充分的模型訓練,也可以獲得較好的檢測結果。文獻[6]使用深度學習方法完成了對遙感圖像中目標的檢測;文獻[7]使用深度學習方法完成了對銷釘故障的檢測。1.3.2道路交通標志識別研究現狀道路交通標志識別是典型的圖像識別問題,圖像識別常用的方法有模板匹配方法、機器學習方法、深度學習方法等,這些方法的原理和特點如下。(1)模板匹配法道路交通標志有其固定的類別和對應的特征,因此可以使用模板匹配法完成交通標志圖像識別。模板匹配法根據目標圖像,在模板庫中建立對應的標準模板,利用滑動窗口的方法,根據待識別目標與模板圖像的匹配程度完成類別劃分。模板匹配是一種最簡單的圖像識別方法,它是圖像處理中最常用的匹配方法。文獻[8]通過使用模板匹配法完成了對車牌的識別。模板匹配方法具有的局限性主要表現在它只能進行平行窗口移動,若原圖像中的目標發生旋轉、縮放、扭轉等變換,就需要在對圖像處理前進行額外的預處理操作。(2)機器學習法傳統的機器學習方法通過對圖像特征進行提取,并將這些特征輸入分類器中,來進行圖像識別,常用算法有支持向量機(SupportVectorMachine,SVM)、AdaBoost迭代算法、BP神經網絡,分類樹(TreeClassifier)、K-D樹、隨機森林(RandomForest,RF)等。在這些方法的基礎上,還提出了一些改進方法,例如基于高斯核的SVM檢測分類方法、一對多的SVM分類器、AdaBoost的改進--SimBoost、多層神經網絡、嵌套Adaboost、距離變換等。文獻[9]使用機器學習方法實現了對圖像中藏文的識別。傳統機器學習分類器能夠實現圖像識別,其核心在特征的設計上,常用特征有HOG、Haar、SIFT等,這些特征由人手動設計,對特定類別直接使用這些特征進行圖像識別,識別結果必然不夠精確,重新設計有類別針對性的特征,又需要大量時間和實驗測試,并且特征設計難度會隨著圖像數據量的增大而成倍增加,因此該方法不適合道路交通標志識別問題。(3)神經網絡方法深度學習方法使用卷積神經網絡結構進行圖像特征提取,與傳統機器學習方法相比,其最大不同是不再需要通過人工設計和選擇特征,圖像識別所需要的特征信息由卷積神經網絡結構在訓練時自動學習產生,并在訓練過程中不斷通過學習過程進行修正。在2006年深度學習理論被提出后,卷積神經網絡的表征學習能力受到了廣泛關注,隨著數值計算設備的不斷升級,卷積神經網絡迅速發展。自2012年的AlexNet開始,得到GPU計算集群支持的復雜卷積神經網絡多次成為ImageNet大規模視覺識別競賽的優勝算法,包括2013年的ZFNet、2014年的VGGNet、GoogLeNet和2015年的ResNe等。文獻[10]使用深度學習方法對農作物病蟲害圖像識別進行了分析;文獻[11]使用深度學習方法實現了驗證碼圖像識別。由于深度學習方法對圖像識別問題具有更高的識別準確率,在學習數據充足時,能夠實現準確可靠的圖像識別,因此其逐漸成為目前圖像識別研究領域使用的核心算法之一。對于一般的大規模圖像分類問題,深度學習網絡模型可用于構建階層分類器,也可以在精細分類識別中用于提取圖像的判別特征以供其它分類器進行學習,對于后者,特征提取可以人為地將圖像的不同部分分別輸入深度學習網絡,也可以由深度學習網絡結構通過非監督學習自行提取。1.4論文內容與結構在調研國內外交通標志檢測與識別文獻的基礎上,從交通標志檢測與交通標志識別兩個方面展開研究。章節結構內容安排如下:第一章為緒論。首先分析交通標志識別系統在實際生活場景中的研究背景與意義,然后介紹國內外交通標志檢測與識別的研究現狀,最后給出論文的內容以及結構安排。第二章為交通標志識別相關理論介紹。神經網絡主要由激活函數、損失函數和梯度下降三個關鍵知識點構成。本文從上面三個方面對神經網絡進行了詳細的介紹。第三章主要介紹了交通標志識別所采用的數據集和算法。數據集采用GTSRB數據集,算法采用神經網絡算法。神經網絡算法主要由批量歸一化層、顏色轉換網絡、空間轉換網絡和卷積神經網絡構成。第四章主要介紹GTSRB數據集的處理和使用,在GTSRB數據庫上訓練測試驗證所提算法的準確性,對上一章提出的網絡進行了訓練和測試,并對實驗結果進行了分析。第五章對全文進行了總結。1.5本章小結本章首先分析交通標志識別系統在實際生活場景中的研究背景與意義,然后介紹國內外交通標志檢測與識別的研究現狀,最后給出論文的內容以及結構安排。深度學習相關理論近幾年,人工智能隨著深度學習的發展在人類生活中得到了實現。神經網絡可以模擬人類的大腦對事物進行分析,也可以對神經網絡進行學習。它主要是模擬人類大腦學習事物的內在規律,對聲音和圖像等數據進行學習,目標是使得機器如同人類一樣能夠識別數據中的信息,對人生活中各種各樣的事情進行擬合。神經網絡習的應用十分廣泛,尤其是在目標識別與分類方面。2.1神經網絡模型神經元網絡是由大量類似于神經元的處理單元相互連結而成的非線性復雜網絡系統,單個神經元的網絡模型如圖2-1所示。神經網絡的本質就是一個非線性的較為復雜的網絡系統,由大量和神經元結構類似的處理單元之間連接構成,圖2-1為單個神經元網絡的模型。圖2-SEQ圖2-\*ARABIC1單個神經元網絡模型其計算公式如(2-1)所示:z=i=1在式(2-1)中,z為網絡的輸出;x為網絡的輸入;ω為網絡的權重;b為網絡的偏置值。ω和x為兩個變量。對模型進行訓練的目的是為了更新參數ω和x,尋找參數最優解。神經網絡模型就是參數ω和x與運算法則之間所構成的邏輯。神經細胞與神經網絡十分的相似,通過仿生學的原理可以獲得神經網絡模型,人體大腦中神經突出的圖像如圖2-2所示。圖2-SEQ圖2-\*ARABIC2神經細胞神經網絡里經過模型的具體的數值可以看成是神經細胞中通過生物電來傳遞的信號。神經網絡中的權重ω會因為與輸入相乘,實現輸出的放大縮小的功能,這就像神經細胞中的樹突結構,粗細不一,進而會對通過粗細不同的樹突所連接的生物信號產生不同的影響。輸入信號經過ω變換之后,再增加一個偏置量b,進而求和。然后再選擇一個模擬細胞的函數來對這個過程進行仿真,模擬細胞的這個函數也就是激活函數。當ω和b有一個合適的值時,再配合一個合適的激活函數,那神經網絡就會有一個比較好的擬合效果。上述所講的過程也就是正向傳播的過程,正向傳播的方向也就是輸入到輸出的方向。如果想要實現對環境正確的擬合,就要有合適的權重ω和偏置值b。但是在現實世界中,我們是沒辦法去確定權重ω和偏置值b的。于是,就有了訓練網絡的過程,我們可以通過反向傳播誤差來對網絡的參數進行自動的更新,誤差越小,代表參數越接近合適值,最終會產生一個合適的權重。2.2反向傳播梯度下降需要明確的誤差才可以對權重進行更新,減小誤差使誤差接近于0是反向傳播的目的,而神經網絡的權重就是誤差最小時的權重的取值[33]。損失函數可以用來描述誤差,例如式(2-2)所示的MSE(均方誤差函數):Loss=∥yx?label(x)∥其中,Loss為代價函數值;y(x)為網絡的預測值;label(x)為真實值。從公式可以看出,Loss是關于權重矩陣的多元函數,當Loss最小時權重的取值,便是神經網絡權重矩陣最終值。反向傳播的核心算法是梯度下降算法,既然反向傳播是為了使Loss值最小,也就是使得loss收斂的最快。根據場論的知識,函數增長速度最快的方向即為梯度增長的方向。同理,函數減少最快的方向即為梯度下降的方向,梯度下降法就是由此而來的。這里可以用下山的過程來描述梯度下降的基本思想。以當前所在的位置為起始點,沿著最陡峭的方向,朝著山底走。同理,如果我們的目標是上山,也就是爬到山頂,那么此時應該是朝著最陡峭的方向往上走。采用同一個方法,每走一段距離,都尋找最陡峭的方向,直到到達最低點的山谷(最優解),如圖2-3所示:圖2-SEQ圖2-\*ARABIC3梯度下降示意圖由圖2-3可知,梯度下降是一個循環或遞歸的過程,每走一段距離都要執行相同的算法,每次走的距離在梯度下降法稱之為學習率(learningrate),學習率的數值如果過大,即下降的步長太大,就會錯過全局最優解(最低點);相反,如果學習率過小,那么到達最低點的時間會很長,即函數收斂時間較慢梯度下降算法的公式如(2-3)所示:xnew=x?αd其中,x是當前的權重值;α為學習率;Loss為代價函數;xnew是經過梯度下降更新后的x2.3激活函數激勵函數的使用是為了解決神經網絡每一層的輸出都是上一層輸入的線性函數的問題。如果神經網絡的輸出始終是輸入的線性組合,那么增加神經網絡隱藏層的層數并沒有效果,這與最開始所學的感知機的原理是一樣的,網絡的訓練結果接近真實值的水平是有限的。使用激勵函數就是引入非線性函數,這會加強深層網絡的表達能力。最開始,一般會采用輸出有界的Sigmoid函數和Tanh函數作為神經網絡的激活函數。目前,神經網絡中激活函數用的最多的是ReLu函數及其改進的函數。(1)Sigmoid函數最常用的激活函數為Sigmoid函數[34]。Sigmoid函數的公式如(2-4)所示。Sigmoidx=11+e圖2-4是Sigmoid函數的圖像。Sigmoid函數的定義域為全體實數,值域為輸出值在[0,1]之間。當輸入是負無窮時,輸出為0;當輸入為正無窮時,輸出為1。圖2-SEQ圖2-\*ARABIC4Sigmoid函數(左)及其導函數(右)sigmoid函數曾經被使用的很多,不過近年來,用它的人越來越少了。主要是因為它固有的一些缺點。梯度爆炸[35]和梯度消失{36}是在神經網絡反向傳播時產生的,一般正常情況下很少會發生梯度爆炸,但是發生梯度消失的可能性比較大。反向傳播計算梯度時,假設神經網絡的參數ω是個分數,每反向傳播一層,梯度都會變得比原來小。如果神經網絡的層數足夠深時,即神經網絡的隱藏層足夠多時,梯度值無限接近于0。即出現梯度消失現象;當神經網絡的參數ω的初始值為(1,+∞)范圍內時,則會出現梯度爆炸情況。Sigmoid函數的值域并不是關于0對稱的,即非zero-centered。如果神經網絡的輸入值都是正的,反向傳播時參數ω的梯度有可能全是正的,也有可能全是負的,如此做的后果是梯度下降進行參數更新時,梯度以“Z”字型下降。除此之外,因為Sigmoid函數中包含“e?x(2)Tanh函數Tanh的函數又叫雙曲正切函數,它的解析式如式(2-5)所示。Tan?x=ex?eTanh的函數圖像如圖2-5所示,Tanh函數能夠把連續的輸入值轉換為[-1,1]之間的輸出值。圖2-SEQ圖2-\*ARABIC5Tanh函數(左)及其導函數(右)兩個Sigmoid函數的圖像拼接在一起就變得和Tanh函數的圖像一樣,但是它的性能遠比sigmoid函數要高。雖然Tanh函數的值域是關于0對稱的,解決了zero-centered的問題,但是Tanh函數依然存在梯度消失的問題。而且Tanh函數依然存在冪函數,計算量并沒有比Sigmoid函數少。從導函數方面來看,Tanh函數的導數的值域位于[0,1]區間內,而Sigmoid函數的導數的值域位于[0,0.25]區間內,因為Sigmoid函數的導函數的值更小,即采用Sigmoid函數作為激活函數的神經網絡的梯度值更小,在反向傳播過程中更容易發生梯度消失的現象。綜上所述,在函數的收斂速度方面,Tanh函數遠遠比Sigmoid函數快的多。(3)ReLU函數除了ReLU函數和Tanh函數外,ReLU函數是應用最廣泛的函數。ReLU函數的公式如(2-6)所示:Relux=max?(0,x)ReLU函數及其導數的圖像如圖2-6所示。圖2-SEQ圖2-\*ARABIC6ReLU函數(左)及其導函數(右)由ReLU函數及其導數圖像可以看出,當x<0時,ReLu(x)'=0;當x>0時,但是ReLU函數也存在很多的缺點。ReLU函數的輸出不是函數的輸出不是zero-centered的;ReLU函數會產生DeadReLU問題,這個問題會導致部分神經元不會被激活,進而使得無法對參數進行更新;由于x<0時,輸出值為0,如果某個神經元的輸出總是滿足小于0的話,那么它將無法進入計算。不適合的參數初始化和過高的學習率都會使網絡進入DeadReLU狀態。(3)ELU函數ELU函數的數學表達式如(2-7)所示:ELUx=αexELU函數的圖像如圖2-10所示。ELU函數不僅僅解決了ReLu函數存在的DeadReLU問題,而且ELU函數的值域是關于0對稱,還具有ReLU函數的所有優點。但是因為ELU函數中存在“ex圖2-SEQ圖2-\*ARABIC7ELU函數(α=0.4)2.4損失函數神經網絡訓練的關鍵之處在于損失函數的選取。如果需要訓練出最真實的神經網絡,就需要選擇一個正確且合適的函數作為損失函數。目前,均方誤差函數( MSE)和交叉熵函數(CrossEntry)是應用比較廣泛的損失函數。(1)均方誤差均方誤差是指網絡的輸出值與真實值之差的平方的均值。均方差的數學表達式如(2-8)所示。MSE=1Ni=1N(其中,yx為網絡的輸出值,label(2)交叉熵函數在分類問題中,特別是使用神經網絡做分類時,多采用交叉熵函數作為損失函數。交叉熵函數主要是用來計算每一個類別的概率,它總是和Sigmoid函數成對出現。式(2-9)為交叉熵函數的數學表達式。Crossentry=?1Nx[ylna+1?y其中,Crossentry為交叉熵的值,N為樣本的數量,y為真實值的類別(0或1)。Crossentry的值越小,代表預測結果越好,即神經網絡模型擬合性越好。2.3本章小結神經網絡主要由激活函數、損失函數和梯度下降三個關鍵知識點構成。本文從上面三個方面對神經網絡進行了詳細的介紹。基于神經網絡的交通標志識別針對交通標志識別這一多類分類問題,本文建立了一個交通標志自動識別的算法模型,對各種交通標志圖像進行分類。3.1數據集選擇道路交通標志識別系統的實現需要使用大量道路環境圖像數據進行算法設計、訓練及測試,因此選用GTSDB、GTSRB兩個國際上認可度很高的交通標志識別圖像數據集作為主要圖像數據來源。本文選擇GTSRB數據集。德國交通標志識別基準(TheGermanTrafficSignRecognitionBenchmark,GTSRB)數據集是針對交通標志識別系統設計的數據集,該數據集包含40余個類別,超過50000張交通標志牌的圖像數據,采集于真實道路環境,交通標志牌實例在數據集中具有唯一性(即每個實際交通標志牌僅出現一次),GTSRB數據集中的圖像如圖3-1所示。圖3-1GTSRB數據集中圖像示例3.2算法設計針對GTSRB數據集中各種交通標志圖像,利用深度卷積神經網絡訓練,可以提高交通標志識別的準確率,為自主車輛提供可靠的決策支持。神經網絡算法跨框架的不同層之間夾隔著批量歸一化層,其目的是為了加快學習速度并提高整體準確性。為了使網絡能夠學習顏色和空間變化,神經網絡算法中又引入兩個可學習的模塊,分別為空間變化和顏色變換網絡。在算法的最后增加了卷積神經網來實現交通標志的分類。具體算法結構如圖3-1所示。圖3-1神經網絡算法模型3.2.1批量歸一化層神經網絡算法模型的第一層為批量歸一化層。對于深度網絡的訓練是一個復雜的過程,只要網絡的前面幾層發生微小的改變,那么后面幾層就會被累積放大下去。一旦網絡某一層的輸入數據的分布發生改變,那么這一層網絡就需要去適應學習這個新的數據分布,所以如果訓練過程中,訓練數據的分布一直在發生變化,那么將會影響網絡的訓練速度。批量歸一化可以解決在訓練過程中,中間層數據分布發生改變的問題,以防止梯度消失或爆炸、加快訓練速度。3.2.2顏色轉換網絡顏色轉換網絡由兩層卷積神經網絡和兩層批量歸一化層構成。卷積層采用1*1的卷積核,用于學習色彩的轉換。卷積層和批量歸一化層之間使用了ReLu激活函數。相比于其它激活函數來講,ReLU有如下優點:對于線性函數而言,ReLU的表達能力更強,尤為體如今深度網絡中;而對于非線性函數而言,ReLU因為非負區間的梯度為常數,所以不存在梯度消失問題,使得模型的收斂速度維持在一個穩定狀態。這里稍微描述一下什么是梯度消失問題:當梯度小于1時,預測值與真實值之間的偏差每傳播一層會衰減一次,若是在深層模型中使用Sigmoid做為激活函數,這種現象尤其明顯,將致使模型收斂停滯不前。3.2.3空間轉換網絡卷積神經網絡定義了一個異常強大的模型類,但在計算和參數有效的方式下仍然受限于對輸入數據的空間不變性。本文所采用的神經網絡算法引入了一個新的可學模塊,即空間變換網絡,它顯式地允許在網絡中對數據進行空間變換操作。這個可微的模塊可以插入到現有的卷積架構中,使神經網絡能夠主動地在空間上轉換特征映射,在特征映射本身上有條件,而不需要對優化過程進行額外的訓練監督或修改。空間轉換網絡的運作機制可以分為三個部分,分別為本地網絡、網格生成器和采樣器。具體如圖3-2所示。圖3-2空間轉換網絡3.2.4卷積神經網絡卷積神經網絡由特征提取網絡和分類器網絡。特征提取網絡主要由7層卷積層和2層池化層構成。卷積層采用5*5的卷積核,輸入以及輸出的圖像大小為32*32,卷積核的個數分別為16、32、64、96、128、192。池化層采取最大池化法,選圖像區域的最大值作為該區域池化后的值,避免了較多的冗余信息的介入。具體的參數如表3-1所示。表3-1特征提取網絡參數類型卷積核大小特征映射大小卷積核個數卷積層5×532×3216卷積層5×532×3232卷積層5×532×3264卷積層5×532×3296卷積層5×532×32128卷積層5×532×32192最大池化層2×2--卷積層5×516×16256最大池化層2×2--分類器網絡主要由2層卷積層和1層最大池化層構成。卷積層卷積核大小為5×5,特征映射大小為8×8,卷積核的個數分別為128、64。最大池化層的卷積核大小為8×8。激活函數采用SoftMax,就是將模型的預測結果轉化到指數函數上,這樣保證了概率的非負性。表3-2分類器網絡參數類型卷積核大小特征映射大小卷積核個數卷積層5×58×8128卷積層5×58×864最大池化層8×8--3.3本章小結本章主要介紹了交通標志識別所采用的數據集和算法。數據集采用GTSRB數據集,算法采用神經網絡算法。神經網絡算法主要由批量歸一化層、顏色轉換網絡、空間轉換網絡和卷積神經網絡構成。4.實驗測試與結果分析為了檢驗算法的有效性,在GTSRB數據庫上訓練測試驗證所提算法的準確性,并且通過實驗對比對網絡參數進行優化。本章介紹GTSRB數據庫的特點,并對上一章提出的網絡進行了訓練和測試,并對實驗結果進行了分析。4.1數據采集及處理4.1.1數據采集自動駕駛汽車最近的進步表明,這項曾經虛構的技術在不久的將來正逐漸成為現實。在可預見的未來,各種自動化水平的車輛將在道路上共存。因此,自動駕駛機器能夠識別和理解交通標志的意義并遵守交通規則是至關重要的。GTSRB是一個在德國收集的多類的單圖像數據集,由43個類、5萬多張交通標志圖像組成。其中一些圖像樣本如圖4-1所示。圖4-1數據集樣本為了節省從原始數據集裁剪圖像的時間,本文使用已經處理過的GTSRB數據集中的圖像作為輸入,并使用交通標志的類別作為輸出。數據可從官方網站4.3本章小結本章介紹GTSRB數據集的處理和使用,在GTSRB數據庫上訓練測試驗證所提算法的準確性,對上一章提出的網絡進行了訓練和測試,并對實驗結果進行了分析。總結交通標志包含豐富的道路信息,能夠提醒駕駛員和行人注意前方的道路交通情況。然而隨著社會經濟的迅速發展和汽車產量的增加,道路交通擁堵、交通事故常常發生。作為智能交通系統的重要組成部分,交通標志識別系統的研究具有重要的理論價值和實際意義。本文為交通標志的識別提供了一種新的方法,但其識別性能仍超過了已有的最佳結果,精確度為99.59%。通過學習顏色和空間變換,該模型能夠在沒有外部支持的情況下適應圖像的特征。這本質上使模型能夠用更少的數據獲得更好的模型性能。但是由于計算能力有限,沒有進行參數掃描。這種模型很有可能與其他超參數集一起產生更高的性能。本文證明了使用多個空間轉換網絡可以提高性能,并提出了一個空間轉換模型,這個項目的目標是在不預處理或擴充數據集的情況下測試最高的性能。然而,通過預處理和擴充可以進一步提高模型的性能,目前的模型只在非常有限的數據集上訓練,無法對其他沒有訓練的交通標志進行分類。隨著數據量的增加,期望該模型能夠對更多的符號圖像進行分類。參考文獻[1]梁永偵,潘斌,郭小明,等.基于LAB顏色空間的圖像陰影檢測與去除方法[J].計算機與現代化,2019,No.290(10):92-97.[2]劉路民根,張耀宗,欒琳,等.一種基于形狀的紅外圖像泄漏氣體檢測方法[J].應用光學,2019,040(003):468-472.[3]楊金源.一種基于機器視覺的路面裂縫檢測系統:,CN109146859A[P].2019.[4]趙寶康,李晉文,楊帆,等.一種基于深度學習的遙感圖像目標檢測算法[J].計算機工程與科學,2019(12).[5]寧柏鋒.基于深度學習的無人機巡檢圖像銷釘故障檢測[J].計算機測量與控制,2019,v.27;No.254(11):31-35.[6]楊學斌,賈磊.基于機器學習的藏文圖像識別系統設計與實現[J].江蘇科技信息,2019,v.36;No.613(28):43-45.[7]賈少鵬,高紅菊,杭瀟.基于深度學習的農作物病蟲害圖像識別技術研究進展[J].農業機械學報,2019(S1).[8]徐星,宋小鵬,杜春暉.基于深度學習的驗證碼圖像識別[J].測試技術學報,2019,033(002):138-142.[9]汽車百科全書編纂委員會.汽車百科全書[M].北京:中國大百科全書出版社,2010:2[10]

De

la

Escalera,

Arturo,

J.

Ma

Armingol,

and

Mario

Mata.

"Traffic

sign

recognition

and

analysis

for

intelligent

vehicles."

Image

and

vision

computing

21.3

(2003):

247-258.[11]

Miura,

Jun,

et

al.

"An

active

vision

system

for

on-line

traffic

sign

recognition."

IEICE

TRANSACTIONS

on

Information

and

Systems

85.11

(2002):

1784-1792.[12]Sermanet,

Pierre,

and

Yann

LeCun.

"Traffic

sign

recognition

with

multi-scale

convolutional

networks."

Neural

Networks

(IJCNN),

The

2011

International

Joint

Conference

on.

IEEE,

2011.[13]J.

Stallkamp,

M.

Schlipsing,

J.

Salmen,

C.

Igel,

Man

vs.

computer:

Benchmarking

machine

learning

algorithms

for

traffi

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論