




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
緒論(一)引言邊緣檢測技術(shù)既是模式識別、機器人視覺、圖像分割、圖像匹配、目標識別與跟蹤、圖像壓縮等各個方面的研究基礎(chǔ)性工具,而且在數(shù)字圖像處理和計算機視覺等許多技術(shù)領(lǐng)域的研究中也發(fā)揮了重要的作用。傳統(tǒng)的邊緣檢測方法主要是通過對局部亮度、色彩、梯度及紋理或者其它人工設(shè)計的特點來進行邊緣或者非邊緣性的分類。諸如著名的Sobel與Canny之類的一些傳統(tǒng)邊緣算子主要集中使用了這些圖像的梯度。但是,邊緣一般都具有豐富的語義信息,僅僅靠一個局部線索難以獲得讓人感到滿意的結(jié)果。雖然因為它的高效,目前依然有得到廣泛的應(yīng)用,但它的精度和可靠性很難滿足現(xiàn)代化應(yīng)用。機器學習(MachineLearning)是計算機科學的一個分支,它使用已知數(shù)據(jù)(數(shù)據(jù)可以是歷史數(shù)據(jù)或?qū)崟r更新的數(shù)據(jù))來預(yù)測或響應(yīng)未知數(shù)據(jù),可以通過不斷模擬學習人類行為完善自身性能。它與模式識別、計算統(tǒng)計學和人工智能等領(lǐng)域密切相關(guān)。本文主要是提出一種基于機器學習的邊緣檢測算法。該算法將一個圖像中的每一個像素點劃分為邊緣點或非邊緣點,并通過計算某個點是邊緣點的概率來進行分類,最終結(jié)果得到的是一幅表明邊緣可行度的概率圖像。最終實驗結(jié)果表明,與其他傳統(tǒng)算法相比,基于機器學習的邊緣檢測算法在設(shè)計上具有更高的自適應(yīng)能力,可以得到更清晰的邊緣圖像。(二)圖像邊緣檢測的研究背景與意義隨著現(xiàn)代信息科學和技術(shù)的不斷進步,人們已經(jīng)開始更加注重對于圖像的邊緣檢測方法的研究與探索。圖像的邊緣檢測提取工作是能夠保證圖像邊緣檢測成功的理論基礎(chǔ)和技術(shù)前提,應(yīng)引起重視。邊緣是一個圖像最基本的特征,可以體現(xiàn)整個圖像的層次感和文理性。而且圖像處理過程的完成也必須要依靠邊緣信息。1.邊緣的基本概念目前,人們通常認為邊緣是灰度急劇變化的像素集合,是指兩個具有不同灰度的均勻圖像區(qū)域的邊界,即該邊界反映了局部的灰度變化。邊緣對一個完整的圖像來說意義較大,在從一個圖像中尋找特定的物體時,邊緣就發(fā)揮了其作用。對于邊緣有一些基本概念需要理解:邊緣法線方向是指在垂直于邊緣方向的某個點上灰度變化最大的方向。邊緣方向是指圖像物體邊界的切線方向,即與邊緣法線垂直的方向。邊緣強度是沿邊緣法線方向表示圖像局部變化強度的量。理想的邊緣大致來說可以劃分為兩類,一類是階躍狀的邊緣(step-edge),邊緣兩側(cè)像素的灰度值發(fā)生急劇變化,如圖1.1所示;另外一類為屋頂狀的邊緣(pulse-edge),邊緣像素的灰度值由減小到增大再減小,如圖1.2所示。圖SEQ圖\*ARABIC1.1階躍狀邊緣灰度函數(shù)圖像圖1.2屋頂狀邊緣灰度函數(shù)圖像2.邊緣檢測的基本概念邊緣檢測,是基于灰度的突變或者漸變等變化檢測圖像中物體的邊緣。邊緣檢測的目標就是為了準確地標識出數(shù)字影像中灰度改變明顯的像素點。邊緣檢測的基礎(chǔ)設(shè)計思想就是通過檢查各個像素與它們的鄰域的狀況來判斷該像素是否存在目標的邊界上。如果該像素處于目標的邊界上,則其相鄰域像素的灰度值就會存在一些較大的改變。如果考慮應(yīng)用某些算法檢測這種變化并對它們進行量化,則我們就可以標記出目標物體的邊界。邊緣檢測算法有如下四步:第一是圖像濾波,對進行邊緣檢測前的圖像用濾波器進行濾波以降低圖片中的噪聲,優(yōu)化邊緣檢測器的性能;第二是圖像增強,確定圖像中每個點及其鄰域的強度,通過計算梯度幅值對圖片中變化顯著的點突出顯示;第三是邊緣檢測,通過使用某種判別方法(常用如梯度幅值閾值判據(jù))對圖像中梯度幅值較大的點確定其是否為邊緣點;第四是圖像定位,可以通過圖像中子像素的分辨率來估算目標邊緣位置或方位。在傳統(tǒng)邊緣檢測算法中,前三步非常常見,這主要是由于在大多數(shù)的情況下,僅僅需要邊緣檢測算法來指出在圖像的某個像素附近會出現(xiàn)邊緣,而不需要指出邊緣的準確位置。邊緣檢測的三個主要共性準則:良好的檢測結(jié)果,指的是有較高的邊緣檢測準確率,出現(xiàn)圖像邊緣的任何一個地方都應(yīng)該有相應(yīng)的檢測結(jié)果,但是不應(yīng)該出現(xiàn)虛假的邊緣;邊緣位置必須精確,即我們所標記的邊緣位置必須足夠靠近圖像上真實邊緣的核心位置;對相同邊緣進行響應(yīng)的次數(shù)應(yīng)盡量減少,即,檢測響應(yīng)優(yōu)選為單像素。(三)圖像邊緣檢測的研究現(xiàn)狀圖像的邊緣指的是兩個相鄰區(qū)域的分界線,分界線也就是相鄰區(qū)域之間的像素集合。因此,圖像的邊緣可以被理解成圖像灰度中具有空間突變的像素集合。圖像的邊緣主要包含兩個元素,即:方向和幅度。沿其邊緣方向的像素取值變化相對平緩;而沿著垂直于其邊緣的方向,像素值的改變相對較大。因此,根據(jù)這些因素變化產(chǎn)生的特點,通常可以使用一階和二階導數(shù)的形式來描述并檢測其邊緣。綜上,可以通過求灰度值的導數(shù)來對圖像中的邊緣進行檢測,并且可以由微分算子來計算該導數(shù)。在圖像處理中,通常會使用差分計算法來近似地代替微分運算。所以邊緣檢測可以近似認為,用一個定義的模板,來對圖像進行濾波的過程,之后,可以適當?shù)厥褂煤唵稳珠撝堤幚怼3R姷囊浑A微分算子有Roberts,Prewitt,Sobel等,常見的二階微分算子包括Kirsh,Laplacian,LoG(LaplaceofGaussian),Canny和其他算子。在實際的處理操作中,通常是對模板矩陣和圖像像素值矩陣進行卷積操作以實現(xiàn)微分運算。微分算子在進行運算時很容易得到錯誤的結(jié)果,這是因為受到頻域中高頻分量的影響,而高頻分量是由圖像中類似噪聲或垂直邊緣方向上的像素點變換頻域得到的。所以,一般而言微分算子通常用于處理噪聲較小的簡單圖像。為了降低噪聲的影響,Canny算子和LoG算子在利用微分算子和圖像卷積前對圖像進行平滑和濾波,以得到更好的邊緣檢測結(jié)果。其中,Canny算子是高斯函數(shù)的一階導數(shù),LoG算子是使用Laplacian算子計算高斯函數(shù)的二階導數(shù)。兩種算子在降低噪聲和取得更好的邊緣檢測結(jié)果中存在顯著的成就。下面介紹幾種典型的算子模板:Roberts算子模板實現(xiàn)如圖1.3:1圖1.3Roberts算子模板Prewitt算子模板實現(xiàn)如圖1.4:?1圖1.4Prewitt算子模板Sobel算子模板實現(xiàn)如圖1.5:?1圖1.5Sobel算子模板Laplacian算子模板實現(xiàn)如圖1.6:0圖1.6Laplacian算子模板LoG算子模板實現(xiàn)如圖1.7:0?10圖1.7LoG算子模板(四)機器學習技術(shù)的原理及特點擁有智能是人與動物的根本區(qū)別。在日常生活中人們總是本能使用復(fù)雜而又高效的智能算法,基于經(jīng)驗可以得出不同的結(jié)論。而當機器需要完成類似操作時就需要利用機器學習。從廣泛的意義上來說,機器學習意味著使用機器(計算機的硬件和軟件)從數(shù)據(jù)中獲得知識,也意味著賦予機器從環(huán)境中學習的能力。具體而言,機器學習就是對某個實際問題建立計算模型,并利用已知的經(jīng)驗來提升模型效果的一類方法。一些常用的機器學習的工具有決策樹、神經(jīng)網(wǎng)絡(luò)、聚類、集成學習等。當計算機需要處理、分析的數(shù)據(jù)中存在一定相同的模式,并且想把其中的知識寫成一定的規(guī)則、形式化的固定下來,但又無法窮盡時,這時就可以使用機器學習的方法。
訓練樣本集創(chuàng)建創(chuàng)建真實可靠的訓練數(shù)據(jù)樣本集是影響算法分類器效果的關(guān)鍵點之一。在機器學習的過程中,只有提供足夠多的訓練樣本,分類器的訓練才能獲得豐富的學習信息,提高分類器的可信度和可靠性。該算法選用48×48像素的圖像塊進行訓練。將訓練樣本劃分成正、負兩種樣本。正樣本指的是以邊緣點作為中心點的圖像塊,而負樣本指的是以任意點作為中心點的圖像塊。本文將BSDS500(Berkeleysegmentationdataset)中的圖像用作實驗數(shù)據(jù)。BSDS500圖像數(shù)據(jù)集是我國邊緣檢測技術(shù)領(lǐng)域許多專家和學者普遍采用的重要技術(shù)數(shù)據(jù)集。它由200張訓練圖像,100張驗證圖像和200張測試圖像三部分組成。邊緣檢測技術(shù)領(lǐng)域其中的數(shù)據(jù)集常常都是不同的標注者自己進行標注,他們在進行標注時所需要利用的知識局限于他們自己對目標物體或者是目標部件中某些物體的理解。盡管認知因人而異,但他們在標記同一圖像的邊緣時具有很高的一致性。在本文中選取了3,000正樣本,5,000負樣本進行檢測。圖2.1顯示了一組原始圖像及其人工標注的圖像。根據(jù)手動標記的邊緣圖像,以邊緣點所在位置為中心對進行灰度化處理后的原始圖像進行樣本分割,最終獲得如圖2.2和圖2.3中所示的正負樣本。(a)原始圖像(b)人工標注圖像圖2.1BSDS數(shù)據(jù)庫圖像圖SEQ圖\*ARABIC2.2正樣本圖2.3負樣本
特征提取圖像特征是指可以在圖像中用作標志的屬性,可以分為統(tǒng)計特征和視覺特征。圖像的統(tǒng)計特征是指可以通過計算得到的人工特征,如圖像的直方圖,矩和頻譜等。圖像的視覺特征是指可以直接看到的自然特征,例如區(qū)域的亮度,紋理或輪廓等。在對一個圖像中的某些像素進行分類時,可以考慮使用該圖像中的某些特征作為一個弱分類器,可以將多個弱分類器通過一個算法訓練成一個較為強大的分類器,以實現(xiàn)最終的分類目標。在本文中選擇了Haar-like特征和方向梯度直方圖(HoG)兩種類型特征進行訓練。由于這些特征的普遍性和保存視覺資料的豐富性,其應(yīng)用范圍十分廣泛。(一)Harr特征原理及實現(xiàn)方法Haar-like特征檢測算法是一種十分經(jīng)典的面部特征提取算法,最早由Papageorgiou等人開發(fā)和應(yīng)用于面部檢測中,因為它類似于Haar小波(Harrwavelet)而得名。Viola與Jones在這一研究的基礎(chǔ)上采取了3種類型的4種特征。特別是當它與AdaBoost結(jié)合使用時,對面部檢測具有良好的效果。一般而言,當我們提到Haar-like時,它將與AdaBoost,級聯(lián)分類器,人臉識別等一起在網(wǎng)絡(luò)中出現(xiàn)。Haar特征分為三類:邊緣特征,線性特征,中心特征和對角線特征,它們被合并為特征模板。Haar特征值為特征模板中白色類型矩形的所有像素和黑色類型矩形的所有像素的差,其反映圖像的灰度變化。但是,矩形特征僅對某些簡單的圖形結(jié)構(gòu)(例如邊緣和線段)敏感,因此它只能描述具有特定方向(水平,垂直,對角線)的結(jié)構(gòu)。圖3.1Harr-like矩形對于圖中的A,B和D之類的特征,特征值的計算公式(3-1)為: V=Sum白而對于C來說,計算公式(3-2)如下: V=Sum在黑色區(qū)域中的像素總數(shù)乘上2時,原因在于要求兩種矩形區(qū)域內(nèi)的像素個數(shù)相等。通過手動修改一個特征模板的尺寸和位置,可以從一個圖像的子窗口中窮盡列舉出許多特征數(shù)據(jù)。上圖示例中的矩形特征模板被統(tǒng)稱為"特征原型";將特征原型放置在輸入圖像的子窗口中再進行矩形擴展(即縱向平移或者橫向伸縮)后的特征叫做"矩形特征";矩形特征的值稱為“特征值”。由于矩形特征以任意尺寸存在于圖像的任意位置,不受其他任何因素的影響,所以它是只由特征模板類型,所在位置,大小尺寸定義的函數(shù)。因此,類別,大小和所在位置發(fā)生變化將會導致一個小的矩形檢查窗口同時包含許多不同的矩形特征。例如,在尺寸為24*24像素的矩形檢測窗口中,矩形圖像特征的數(shù)目可以達到160,000之多。根據(jù)實現(xiàn)原理計算Haar特征非常復(fù)雜,因此通常使用積分圖(IntegralImage)來簡化計算過程。積分圖算法類似于傳統(tǒng)動態(tài)參數(shù)規(guī)劃算法,僅需遍歷一次待測圖像即可精確得到該圖像中所有像素的數(shù)量總和,大大提高了圖像中矩形特征值的計算速度和精度。積分圖的基本思路也就是把圖像中由一個起點延伸到每一點的矩形區(qū)域里面的像素積分總和都計算出來,然后把數(shù)據(jù)存儲在數(shù)組中。然后當需要重新開始計算某一圖像區(qū)域的像素數(shù)量總和時,可以直接從數(shù)組中索引相應(yīng)元素,而不是再重新開始計算該區(qū)域中像素的數(shù)量總和,從而大大加快了計算速度。積分圖可以利用相同工作時間在許多空間尺度下同時計算不同的矩形特征,從而極大地提高了特征檢測的準確性和速度。方法如下:(1)計算積分圖,在公式(3-3)中ii(x,y)表示在位置(x,y)上,相應(yīng)積分圖像中的像素是該位置左上角所有像素的總和。 iix,y=(2)首先公式(3-4)每一行都遞歸計算s(x,y),計算完畢之后公式(3-5)在每一列都計算ii(x,y)。 sx,y=s iix,y=ii初始值 sx,?1=0,ii其中s(x,y)為點(x,y)所在行以左的像素之和。(3)計算某個方塊內(nèi)的像素和根據(jù)(2)我們計算出各點左上的像素之和ii(x,y),如圖3.2中D區(qū)域內(nèi)部的像素和我們可以寫作iiD=iiiiD表示D區(qū)域內(nèi)部的像素和。圖3.2Haar-like特征積分圖(二)方向梯度直方圖特征原理及實現(xiàn)方法方向梯度直方圖(HistogramOfOrientedGradients,HoG)是一個被應(yīng)用于檢測目標的特征描述符。它通過計算并統(tǒng)計圖像局部區(qū)域的梯度方向直方圖來構(gòu)成特征。核心思想是可以通過要測試的圖像的梯度或邊緣方向的密度分布來描述圖像中檢測到的對象的外觀和形狀,這主要用于計算機視覺和圖像處理領(lǐng)域。與其他的特征描繪方法相比,HoG在圖像的局部網(wǎng)格單元上進行操作,因此HoG可以對圖像的幾何變形和光學變化保持良好的不變性。HoG特征提取過程如圖3.3所示,是先對圖像進行灰度化處理,然后將圖像分成小單元格(我們稱其為細胞單元),然后計算每個單元格中每個像素的方向梯度。然后統(tǒng)計每個單元格中不同梯度的數(shù)量以形成每個單元格的HoG描述子,最后進行歸一化以形成每個塊的HoG特征。通常將梯度方向分為8個方向,每個方向相隔45o,圖像單元數(shù)為3×3,如圖3.4所示。圖3.3HoG特征提取流程圖圖3.4方向梯度直方圖
分類器訓練對于提供的訓練樣本(其中包括正樣本和負樣本),分別提取其Harr特征和方向梯度直方圖(HoG)特征,以獲得一組高維特征向量。對于高維特征數(shù)據(jù),本文選擇了Adaboost和決策樹算法兩種分類算法進行綜合分析,取得了一種較為理想的效果。(一)AdaBoost算法和決策樹算法原理1.決策樹算法原理決策樹(DecisionTree)是一種非參數(shù)有監(jiān)督分類方法。它可以從這些具備信息特征和屬性標簽的一系列分析數(shù)據(jù)中進行分析總結(jié)并找出決策的基本規(guī)律,然后以各種樹狀式的結(jié)構(gòu)清晰顯示這些決策規(guī)律以便于解決如何正確進行信息分類和回歸的復(fù)雜問題。決策樹分類學習算法模型是一種基于眾多實例的歸納式學習模型方法,可以實現(xiàn)從給定的無序訓練樣本中任意選擇一個決策樹型作為分類的學習模型。若要生成決策樹,首先根據(jù)相似性把所有數(shù)據(jù)點分為兩組,然后針對每組重復(fù)這個二分過程。葉節(jié)點的每一層都包含比上一層更少的數(shù)據(jù)點,但具有更高的同質(zhì)性。決策樹的理論基礎(chǔ)是,相同路徑上的數(shù)據(jù)點彼此是相似的。樹中的每一個非葉節(jié)點都記錄下用于判斷類別的特征,并且每一個葉子節(jié)點都可以代表對其作出最終判斷的類別。每個葉子節(jié)點的根節(jié)點都可以構(gòu)造出一個分類路徑的規(guī)則。當我們測試新的樣本時,只是需要從一個根節(jié)點開始,在每個子樹的分支節(jié)點之間進行測試,然后沿著相應(yīng)的分支遞歸地進入子樹,然后再次對子樹進行測試,直到樣本能夠到達葉子節(jié)點為止,該葉子節(jié)點中所表示的類別即為當前測試樣本的預(yù)測類別。圖4.1顯示了標準決策樹模型。要構(gòu)建一顆標準決策樹,僅需要兩個步驟:步驟1:確定一個二元選擇題,它能夠把數(shù)據(jù)點拆分為兩組,并最大限度地提高每組數(shù)據(jù)點的同質(zhì)性。步驟2:對每個葉節(jié)點重復(fù)步驟1,直到滿足終止條件并且無法進行進一步劃分。圖4.1決策樹分枝示意盡管決策樹易于使用和理解,但它們具有不穩(wěn)定(易于過擬合)和不準確的缺點。為了盡可能避免這種情況,我們可以結(jié)合使用隨機森林或AdaBoost算法,使預(yù)測結(jié)果具有較好的穩(wěn)定性和準確性。2.AdaBoost算法原理Boosting
算法是由
Robert
T
.Schapire
提出的。Boosting算法將更多注意力放在分類錯誤的樣本上。對于這樣的樣本來加強學習,就像背單詞一樣,當?shù)谝槐楸惩暌粋€
List
的單詞,第二遍進行復(fù)習時,并不是這個
List
中的每一個單詞都會花費同樣的時間再去決定,而是會重點關(guān)注那些第一遍之后還設(shè)有記住的單詞。
Boosting算法在其實現(xiàn)中也使用了這種想法。首先,對每個訓練樣例賦予相同的權(quán)重,然后通過訓練構(gòu)造第一個弱分類器,對這個弱分類器進行測試,將那些分類錯誤的測試樣例增加權(quán)重,然后再將調(diào)整權(quán)重后的訓練集去訓練第二個弱分類器,并重復(fù)上述過程,直到最終獲得足夠好的分類器。但是,Boosting算法在解決實際問題時仍然存在一個重大的缺陷,即它們都是需要首先了解弱分類器算法的分類正確率和下限,但這在實際問題中很難得到解決,所以后來Freund和Schapire提出了AdaBoost(AdaptiveBoosting,自適應(yīng)增強)算法,這個算法可以很容易地應(yīng)用于解決實際問題中。
如圖4.2所示,這就是Adaboost的基本結(jié)構(gòu),最后的分類器YM是幾個弱分類器的組合,等同于最后m個弱分類器對其進行了投票以確定其分類,并且各個分類器的"話語權(quán)"α不一樣。圖4.2Adaboost結(jié)構(gòu)Adaboost算法主要目的就是在整個訓練集上維護一個分布權(quán)值的向量,使用加權(quán)訓練集產(chǎn)生弱分類器,然后通過計算該弱分類器的錯誤率并更新分布權(quán)值的向量,為分類錯誤的樣本分配較大的權(quán)值,為分類正確的樣本分配較小的權(quán)值。每次更新后,將會使用相同的弱分類算法生成一種新的分類假設(shè)。這些分類假設(shè)的順序組合構(gòu)成一個多分類器。最后,將這些多分類器與加權(quán)方法相結(jié)合,以獲得決策結(jié)果。該方法的優(yōu)點在于它不需要單個分類器就具有高識別率,也就是說,它不需要尋找具有高識別率的基本分類算法。Adaboost實現(xiàn)過程:假設(shè)現(xiàn)在一共有M個分類器,N個訓練樣例,每個訓練樣例Xn的正確分類結(jié)果為tn,ym(xn)代表訓練樣例xn在ym弱分類器下的預(yù)測結(jié)果。(1)對于每一個訓練樣例i,首先初始化它的權(quán)重為1N ωm,i=(2)對于每一個弱分類器m,從第一個開始重復(fù)以下步驟。=1\*GB3①計算誤差函數(shù): εm=這個公式(4-2)的含義即為,對于當前ym這個弱分類器,遍歷所有的訓練樣例,若在ym下的預(yù)測結(jié)果與真實結(jié)果不一致,該分類器的總誤差增加,剛開始時每一個樣例的誤差權(quán)重都是相同的,但隨著算法的不斷演進,誤差權(quán)重也會隨之改變。=2\*GB3②公式(4-3)計算該弱分類器的話語權(quán)α: ∝m=更新權(quán)重后如公式(4-4)所示: ωm+1,i=(3)現(xiàn)在,針對每一個弱分類器,我們都得到了與其相對應(yīng)的話語權(quán)α,用這個就可以更加合理地整合弱分類器從而成為一個強分類器,如公式(4-5)所示。 YMxAdaboost是一種實現(xiàn)簡單,應(yīng)用也簡單的算法。Adaboost算法通過組合弱分類器獲得強分類器。同時,分類誤差率的上限隨著訓練的增加而穩(wěn)步下降,并且不會產(chǎn)生過擬合。應(yīng)該說,它是可以應(yīng)用于各種分類場景的算法。但是,如果分類器中有個別極端數(shù)據(jù)導致了分類器異常從而分類失敗,則Adaboost算法將著重于這種極端數(shù)據(jù)分類失敗情況,這將使Adaboost算法非常敏感,異常的樣本數(shù)據(jù)很有可能在迭代中獲得更多的權(quán)重。這會影響最終強學習器的預(yù)測準確性,因此本文將決策樹和AdaBoost算法結(jié)合使用來進行分類器訓練。(二)基于AdaBoost和決策樹的分類器訓練決策樹是歸納學習的多級分類算法。它從一組無序和不規(guī)則的樣本數(shù)據(jù)中訓練以樹狀表示的分類規(guī)則。對于這兩種不同類型的決策樹分類,訓練好的決策樹應(yīng)該是一個二叉樹。本文將決策樹算法的思想與AdaBoost算法相結(jié)合,對所有訓練樣本訓練分類器,區(qū)分圖像中的邊緣點和非邊緣點,并獲得二叉樹。二叉樹上的葉節(jié)點是邊緣點和非邊緣點的數(shù)據(jù)。通過AdaBoost算法訓練每個節(jié)點上的數(shù)據(jù),以獲得強分類器。將二叉樹劃分為左子樹和右子樹,并從根節(jié)點遞歸執(zhí)行分類操作。由于分類器引入了決策樹分類算法,訓練的樣本數(shù)據(jù)S被重新劃分成為兩個新的樣本數(shù)據(jù)集Sleft和Sright,分別指的是二叉樹中的左子樹和右子樹,因此新的訓練樣本數(shù)據(jù)隨著二叉樹的構(gòu)成而進行了重新分類。○和×符號用于指示圖像中的邊緣點和非邊緣點。圖4.3展現(xiàn)了一個結(jié)合AdaBoost算法和決策樹算法兩種理念思想后的分類器訓練流程。圖4.3基于Adaboost的決策樹算法訓練過程示意圖Adaboost二元分類實現(xiàn)過程:決策樹對每個類別做二分類,即如果一個樣本屬于該類別則為1,如果不屬于則為-1。假設(shè)現(xiàn)在一共有m個樣本,k個類別,將樣本與類別組合,這樣對每個類別都有m個樣本,然后對每個類別訓練二分類的弱分類器,最后根據(jù)整體的分類準確率來分配新的權(quán)重。給定m個樣本,樣本xi的類別標簽集合為Yi;(1)首先初始化每個樣本每個類別的權(quán)重為1mk。(2)在第t輪迭代中,對每個類別,在m個樣本上訓練弱分類器,共得到k個弱分類器。對于樣本xi,關(guān)于類別l的分類結(jié)果為:ht(xi,l)。另外由公式(4-6): Y[l]=+1,l∈Y?1,l?Y可得:如果分類正確Yi[l],ht(xi,l)為1,否則為-1。 rt=在公式(4-7)中rt表示第t輪分類結(jié)果的準確性,如果全部分類正確,那么rt=1,分類錯誤的樣本越多,rt越小。(3)第t輪弱分類器的權(quán)重如公式(4-8): αt=之后進一步更新樣本權(quán)重如公式(4-9): Dt+1i,l Zt=i,l公式(4-10)中Zt用于權(quán)重的歸一化。(4)T輪之后,對于每個類別都有T個弱分類器。樣本x關(guān)于類別l的分類結(jié)果為: Hx,l=sign(t=1T
實驗仿真結(jié)果及分析圖5.1傳統(tǒng)算子邊緣檢測圖5.2機器學習邊緣檢測對于Berkeley圖庫中的一個數(shù)據(jù)圖像,在提取Harr特征和方向梯度直方圖(HoG)特征之后,使用AdaBoost算法和決策樹組合算法對其進行了測試。實驗證明,這種基于機器學習的算法具有較高的準確率。圖5.1和圖5.2分別給出傳統(tǒng)邊緣檢測的結(jié)果及機器學習邊緣檢測的結(jié)果。由此實驗結(jié)果我們可以清楚地看到,本文所提出的基于機器學習的邊緣檢測方法所獲得的實驗結(jié)果較傳統(tǒng)的算法更為優(yōu)越。原因是通過機器學習的方法獲得的邊緣圖像就是一幅表示概率性的圖像,與人的視覺感知一致。同時,它還證明了在訓練中選擇人工標注的邊緣圖像來作為訓練集的正確性。實驗結(jié)果表明,基于機器學習的圖像邊緣檢測方法無須進行調(diào)整任何自定義的參數(shù)或者閾值,適應(yīng)能力較高,并且具備廣泛的應(yīng)用性。
總結(jié)在現(xiàn)代信息科學和技術(shù)進步和飛速發(fā)展的當代,圖像處理的技術(shù)要求也愈來越高,目標識別,人臉跟蹤,裂縫檢測等都需要高精度更清晰的圖像邊緣。但是傳統(tǒng)的圖像邊緣算子的檢測效果受到圖像噪點和本身算法的限制,得出的圖像邊緣不能滿足現(xiàn)代越來越高的要求。因此,本文將機器學習與邊緣檢測相結(jié)合,提出了一種基于機器學習的圖像邊緣檢測算法。該算法的核心是計算圖像塊的中心點是邊緣點的概率。本文介紹了機器學習的各個階段,例如,訓練數(shù)據(jù)樣本的創(chuàng)建,特征的選擇和提取以及分類器的訓練。通過使用BSDS數(shù)據(jù)庫圖像并手動標記它們來創(chuàng)建訓練數(shù)據(jù)樣本,并在原圖上分割圖像創(chuàng)建正樣本和負樣本。特征
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025合同文書模板:華通物流有限公司貨運代理業(yè)務(wù)合作協(xié)議
- 2025某物流公司駕駛員工作服采購合同書
- 網(wǎng)絡(luò)項目設(shè)計合同
- 農(nóng)村個人贈與土地使用權(quán)協(xié)議
- 2025農(nóng)民房屋租賃合同書范本
- 租用電路合同范本
- 個人與個人借款合同范本
- 2025設(shè)備租賃合同(生產(chǎn)線設(shè)備租賃用)
- 打架承諾協(xié)議書范本
- 采購教育服務(wù)協(xié)議書
- 液氯鋼瓶應(yīng)急堵漏工具操作指導規(guī)程
- 2025新人教版七年級歷史下教案-第20課 明清時期社會經(jīng)濟的發(fā)展
- 股份制合作協(xié)議及企業(yè)章程草案
- 硬件工程師招聘筆試題及解答
- 脫硫塔內(nèi)部結(jié)構(gòu)優(yōu)化設(shè)計-洞察分析
- 加油站安全生產(chǎn)風險分級管控和隱患排查治理雙體系方案全套資料匯編
- SaaS軟件許可及使用服務(wù)協(xié)議
- GB/T 9755-2024合成樹脂乳液墻面涂料
- 語音廳合同范例
- 第六章 質(zhì)量和密度 綜合素質(zhì)評價卷(含答案)2024-2025學年北師大八年級物理下冊
- 中華民族共同體概論教案第二講-樹立正確的中華民族歷史觀
評論
0/150
提交評論