《輪廓信息與Itti模型結(jié)合的視覺顯著性檢測(cè)研究(論文)12000字》_第1頁(yè)
《輪廓信息與Itti模型結(jié)合的視覺顯著性檢測(cè)研究(論文)12000字》_第2頁(yè)
《輪廓信息與Itti模型結(jié)合的視覺顯著性檢測(cè)研究(論文)12000字》_第3頁(yè)
《輪廓信息與Itti模型結(jié)合的視覺顯著性檢測(cè)研究(論文)12000字》_第4頁(yè)
《輪廓信息與Itti模型結(jié)合的視覺顯著性檢測(cè)研究(論文)12000字》_第5頁(yè)
已閱讀5頁(yè),還剩22頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

輪廓信息與Itti模型結(jié)合的視覺顯著性檢測(cè)研究 21.1研究背景以及意義 21.2國(guó)內(nèi)外研究現(xiàn)狀 21.3本文研究?jī)?nèi)容以及章節(jié)安排 22視覺注意機(jī)制的理論基礎(chǔ) 32.1視覺信息的產(chǎn)生 33自下而上視覺注意模型——Iti模型 33.1Itti模型框架 33.2高斯金字塔 43.3初級(jí)視覺特征提取 63.3.1亮度特征的提取 63.3.2顏色特征的提取 63.3.3方向特征的提取 73.4中央周邊差分操作 73.5歸一化操作 83.6顯著圖的生成 83.7注意焦點(diǎn)轉(zhuǎn)移機(jī)制 93.7.1注意區(qū)域選取 93.7.2抑制返回機(jī)制 3.8實(shí)驗(yàn)結(jié)果 4改進(jìn)后的Itti模型 4.1加入輪廓信息模塊的Itti模型 4.1.2實(shí)驗(yàn)結(jié)果 4.2融入輪廓信息和特征自適應(yīng)閾值的Itti模型 4.2.1特征自適應(yīng)閾值 4.2.2實(shí)驗(yàn)結(jié)果 視覺顯著區(qū)域檢測(cè)技術(shù)是一種新型的無損圖像處理方法,主要是利用計(jì)算機(jī)設(shè)備來采集、分析和處理對(duì)象,它可以有效地提高工作效率。在一些復(fù)雜環(huán)境下使用該算法時(shí)還需要考慮其是否有缺陷或者其他因素。因?yàn)槿祟悓?duì)于事物感知能力和觀察力有限,所以人們一般只能通過肉眼來獲取外界信息,而不能直接獲得外部數(shù)據(jù)等特征;視覺顯著區(qū)域檢測(cè)技術(shù)具有快速高效的特點(diǎn),并且能夠?qū)D像中重要屬性進(jìn)行保存、分析以及處理,還能夠?qū)崿F(xiàn)對(duì)外界環(huán)境信息數(shù)據(jù)和特征的提取。該方法不但可以克服常規(guī)成像方法的不足,還可以提高工作效率和質(zhì)量水平(張銘澤,陳君向,2022)。這在某種程度上展現(xiàn)同時(shí)其可以應(yīng)用于很多工業(yè)生產(chǎn)中去,比如:環(huán)境監(jiān)測(cè)系統(tǒng)、產(chǎn)品檢驗(yàn)與控制、食品安全方面等等都需要在視覺明顯區(qū)域范圍內(nèi)進(jìn)行操作。因此,在日常生活中被廣泛應(yīng)用于各個(gè)領(lǐng)域當(dāng)中去觀察和識(shí)別各種事物,并獲取有用信息以獲得更好地發(fā)展與進(jìn)步,所以,該方法在各方面都具有很大的重要意義。從國(guó)內(nèi)外視覺顯著區(qū)域檢測(cè)的研究成果和應(yīng)用實(shí)例可以看出這些研究成果具有很大價(jià)值;而且隨著近些年來計(jì)算機(jī)圖像處理理論與實(shí)際工程相結(jié)合,在一定程度上促進(jìn)了視覺顯著區(qū)域檢測(cè)算法的發(fā)當(dāng)前,國(guó)內(nèi)國(guó)外在視覺顯著性的探索上,曾經(jīng)有許多的專家提出了不同的檢測(cè)方法。南州大學(xué)ILab實(shí)驗(yàn)室的Itti教授和他的弟子Siagian等人,在攻讀博士時(shí)期的首要事務(wù)恰恰是研究受生物學(xué)啟發(fā)的機(jī)器人的視覺定位"。2006年,Kochlab和J.Harel,提出了一個(gè)圖像的視覺顯著性檢測(cè)方法2]。2007年,Hou等人提出了一種采用頻域的方法來進(jìn)行顯著性檢測(cè)的方法:SR(spe析研究了圖像頻域log譜包含的光譜殘差信息,在此類背景下他們發(fā)現(xiàn)不一樣的圖像竟然有著相似的分布趨勢(shì)的頻域log幅度譜(成澤和,趙俊天,2023)。這種相似性說明圖像中存在多余的信息,清除這部分多余的信息獲得的便是引起人類視覺系統(tǒng)關(guān)注的顯著信息(張雅慧,陳澤羽,2021)。前述的深入分析驗(yàn)證了本文的理論框架,尤其是在關(guān)鍵概念的闡釋上,實(shí)現(xiàn)了理論層面的深化與拓展。這種深化不僅體現(xiàn)在對(duì)概念內(nèi)涵的深入剖析,還延伸至對(duì)其外延的廣泛探索。通過對(duì)相關(guān)文獻(xiàn)的全面回顧和實(shí)證數(shù)據(jù)的深入分析,本文進(jìn)一步明確了這些概念在理論體系中的地位和作用,以及它們之間的相互關(guān)系。同時(shí),這種拓展也為本文的研究提供了新的視角和思考方向,有助于推動(dòng)該領(lǐng)域理論的進(jìn)一步發(fā)展。本研究還強(qiáng)調(diào)了理論與實(shí)踐的緊密結(jié)合,通過將理論分析應(yīng)用于實(shí)際問題的解決,驗(yàn)證了其有效性和實(shí)用性,為相關(guān)實(shí)踐提供了有力的理論支撐。沒過多久,復(fù)旦大學(xué)的教授LimingZhang以及ChenleiGuo,基于頻譜殘差算法(SpectralResidual),提出了基于相位譜方法(PhaseSpectrum)的顯著性檢測(cè)方法4]。2009年,Achanta等人提出了一種在Lab顏色空間像素向量與平均像素向量歐氏距離的基礎(chǔ)之上的顯著性檢測(cè)方法:FT(Frequency-tuned)算法5]。2011年,南開大學(xué)的張雅慧,陳澤羽等人提出了一種顏色對(duì)比度算法:HC(Histogram-basedContrast)算法,也就是像素點(diǎn)和其他像素之間的顏色特征差異度越大那么顯著性越高(楊一凡,許慧妍,2021)?。2012年,Goferman等人提出了一種在局部特征和全局特征的基礎(chǔ)之上的顯著性檢測(cè)算法:CA(Context-Aware)算法7。2013年,ChuanYang等人提出了一種基于超像素分割和區(qū)域之間對(duì)比度的顯著性提取算法8]:GR(Graph-Regularized)算法,與CA算法類似,GR算法使用了目標(biāo)本文章節(jié)內(nèi)容安排如下:第一章:緒論。第二章:視覺注意機(jī)制的理論基礎(chǔ)。主要講述了視覺信息是如何產(chǎn)生。第三章:自下而上視覺注意模型——Iti模型。詳細(xì)介紹了Itti算法的一些理論基礎(chǔ),比如方向、亮度以及顏色特征的提取,還有高斯金字塔、中央周邊差分操作、歸一化操作等等。第四章:改進(jìn)之后的Itti模型。主要講述了運(yùn)用輪廓信息對(duì)Itti算法進(jìn)行的改進(jìn),其一是除去亮度、顏色、方向三個(gè)模塊之外,再添加一個(gè)輪廓信息的模塊,但是這個(gè)改進(jìn)的效果并不是太好,考慮到原來的方向和亮度特征不太明顯,從這些方案中看出所以其二就是利用輪廓信息的方向和亮度特征,也就是圖像分兩支走,一支按原本的算法進(jìn)行,另一支利用sobel算子提取輪廓信息之后,把得到的sobel結(jié)果重復(fù)原來算法的步驟,然后把兩個(gè)顯著圖進(jìn)行融合,就可以獲取改進(jìn)之后的結(jié)果圖。第五章:總結(jié)與致謝。對(duì)本文所做的工作進(jìn)行總結(jié),以及對(duì)給我提供幫助的所有人表達(dá)感謝。2視覺注意機(jī)制的理論基礎(chǔ)在日常生活中,人們可以通過不同的視覺信息來獲取各種各樣有價(jià)值且有用、豐富和非無用的圖像,這些圖片往往能夠產(chǎn)生很大一部分作用。本質(zhì)上來說就是人類對(duì)客觀世界的感知。視覺形成過程如下(魏光線進(jìn)入到角膜,然后經(jīng)過瞳孔進(jìn)入到晶狀體,晶狀體的作用是把光線進(jìn)行折射,然后到達(dá)玻璃體,玻璃體的作用是支撐以及固定眼球,這在一定程度上透露了經(jīng)過玻璃體把光線投到視網(wǎng)膜上,得到了基未找到引用源。人類和動(dòng)物可以通過觀察事物的體積、亮度、色彩以及運(yùn)動(dòng)情況,在這般的框架內(nèi)從而得到各種對(duì)人和動(dòng)物存活有著及其重要的信息。外界信息當(dāng)中最少有百分之八十以上依靠視覺獲取錯(cuò)誤!未找到引用源。故而,從這些現(xiàn)象中顯示視覺對(duì)人以及動(dòng)物來說至關(guān)重要(趙俊天,成欣怡,2023)。圖2-1視覺的形成過程Itti視覺顯著模型是由Itti教授提出來的。這個(gè)算法主要是利用圖象的亮度、顏色和方向這幾個(gè)特征[,然后對(duì)這三個(gè)特征得到的結(jié)果進(jìn)行一系列操作,從這些規(guī)定可以認(rèn)識(shí)到就可以獲取這幾個(gè)特征的顯著圖,融合后就可以獲取視覺顯著圖(趙澤銘,孫天羽,2022)。如圖3-1所示。這個(gè)方法只是利用純數(shù)學(xué)輸入圖像輸入圖像中央周邊差分操作以及歸一化特征圖12張單維特征圖線性合并顯著圖贏者取全返回抑制24張亮度方向6張上逐級(jí)迭代求解(朱曉彤,張昊天,2021)。(1)、利用高斯低通濾波技術(shù)對(duì)圖象采取高斯模糊;(2)、把從(1)得到的圖像采用下采樣操作,就能夠獲取一組不同大小的圖像。這在一定水平上揭露減少一層圖像,只需要把第K層圖像拿去進(jìn)行高斯模糊和降采樣。其中降采樣是隔行隔列降采樣,也就高斯金字塔第K層圖3-2高斯金字塔模型的建立這在某種程度上展現(xiàn)假設(shè)原來圖片是M×N大小的圖片,高斯金字塔的第K-1層圖像經(jīng)過Gaussian函數(shù)w卷積和下采樣得到第K層圖像,本篇文章也對(duì)結(jié)論進(jìn)行了再次驗(yàn)證,首先從理論上保證了研究假設(shè)的合理性及其邏輯一致性。通過系統(tǒng)地梳理和對(duì)比分析相關(guān)文獻(xiàn)資料,文章證明了研究框架的科學(xué)性和實(shí)用性。在此基礎(chǔ)上,文章采用了多種實(shí)證手段對(duì)結(jié)論進(jìn)行了檢驗(yàn),以確保其穩(wěn)健性和可靠性。通過與同類研究的對(duì)比,文章驗(yàn)證了結(jié)論的廣泛性和創(chuàng)新性。在與已有文獻(xiàn)的結(jié)論進(jìn)行對(duì)比后,本文不僅印證了部分已有理論,還提出了新的看法,為相關(guān)領(lǐng)域提供了理論發(fā)展的新視角和實(shí)證材料。同時(shí),文章還探討了結(jié)論在實(shí)際應(yīng)用中的潛在價(jià)值,為后續(xù)研究提供了方向和啟示計(jì)算公式如下(付奇朝,張?zhí)煊穑w文博,2023):式中G?(x,y)為第K層的高斯金字塔圖像,二維可分離的5×5的窗口函數(shù)@(m,n)=h(m)×h(n),具備低通特性,式中h是高斯密度分布函數(shù)(韓一飛,陳夢(mèng)瑤,2019)。@函數(shù)滿足約束條件:規(guī)范性、等貢獻(xiàn)性、可分離性和對(duì)稱性,所以窗口函數(shù)w(m,n)可表示如下(付羽琪,朱婧怡,2017):經(jīng)過不斷的迭代計(jì)算就能夠獲取一系列的圖象G?,G,…,GN,組合成為一個(gè)完整的高斯金字塔,G?即為原始圖象也就是高斯金字塔的最下面層,GN是高斯金字塔的頂層。在此類背景下除了上述方法以外,還可以直接將原來的圖象,也就是金字塔的最下面層層同一組等效加權(quán)函數(shù)進(jìn)行卷積形成高斯金字塔的每一層。這在某種程度上展示圖3-3是圖象經(jīng)過高斯金字塔處理后得出的一組不同尺度的圖3-3經(jīng)高斯金字塔處理之后的圖像在高斯金字塔中包含了一系列低通濾波器,因而它具備跨越較大頻率范圍的優(yōu)點(diǎn),能夠較為理想地對(duì)圖象進(jìn)行多尺度描述(蔡奇朝,趙睿璇,2019)。從這些方案中看出依靠著這個(gè)優(yōu)點(diǎn),高斯金字塔的應(yīng)用變得十分廣泛,這在一定程度上透露了不但在目標(biāo)檢測(cè)、運(yùn)動(dòng)姿態(tài)估計(jì)方面有所使用,而且在遙感云圖的尺度特征提取、數(shù)字水印算法等方面也運(yùn)用廣泛。高斯金字塔結(jié)構(gòu)簡(jiǎn)潔明了,未來可在與其它算法相結(jié)合,應(yīng)用到新的領(lǐng)域中(梁昊羽,馬茜茜,2019)。此研究體現(xiàn)了跨學(xué)科交流的價(jià)值,整合了來自不同領(lǐng)域的理論資源和研究技巧,目標(biāo)是擴(kuò)大研究的廣度和深度。跨學(xué)科探索不僅讓本文能全面了解研究客體的多層次性質(zhì),也為本文揭開了隱藏在表面之下的新事實(shí)。研究中,本文將理論運(yùn)用于實(shí)踐,測(cè)試其在真實(shí)情境中的效果。通過結(jié)合統(tǒng)計(jì)數(shù)據(jù)與案例分析的方法,本文努力確保研究結(jié)論既具有科學(xué)性又具備實(shí)際應(yīng)用價(jià)值,為政策制定者提供了有效的理論支持和決策指引。3.3初級(jí)視覺特征提取對(duì)于輸入的彩色通道,利用高斯降采樣,在這般的框架內(nèi)提取亮度、顏色以及方向這幾個(gè)特征(成對(duì)于亮度特征I,在RGB圖下表示為:在提取顏色特征時(shí)。由于顏色特征已經(jīng)包含了亮度特征,從這些現(xiàn)象中顯示所以需要將三基色通道轉(zhuǎn)換為廣義調(diào)諧的紅色、綠色、藍(lán)色和黃色的顏色特征(張一鳴,成奇倩,2022),分別表示為R、G、B、從這些規(guī)定可以認(rèn)識(shí)到紅綠和藍(lán)黃拮抗特征顯著圖的計(jì)算(付文博,趙向妍,2021):RG(c,s)=R(c)-G(c)-(G(s)-R(s))BY(c,s)=|B(c)-Y(c)-(式中RG代表的是紅色和綠色通道拮抗特征,也就是中心紅色和綠色拮抗,周圍綠色和紅色拮抗的差值,BY代表的是藍(lán)色和黃色的通道拮抗特征,這在一定水平上揭露是中心黃色和藍(lán)色拮抗,周圍藍(lán)色和黃3.3.3方向特征的提取選用Gabor濾波器來提取方向特征,從而獲取θ∈{0°,45°,90°,135°}的四個(gè)方向的特征圖,然算方向顯著特征圖:式中c是中心尺度,s是外圍尺度,其中c∈{2,3,4},s=c+δ,δ∈{3,4}。其中,實(shí)數(shù)部分為:虛數(shù)部分為:式中當(dāng)θ∈{0°,45°,90°,135°},帶入式(3-14)和(3-15)計(jì)算得到x',y'的值,再帶式(3-11)計(jì)算,可以3.4中央周邊差分操作根據(jù)人眼的生理結(jié)構(gòu)設(shè)計(jì)了中央一周邊差分操作[14]。對(duì)于人眼看到的視覺信息,如果反差特別大的到中心是特別亮的但是周圍卻比較暗淡的情況,又或者說看到的是中心是耀眼奪目的紅色可是周圍卻就比較多,相反而言,這在某種程度上展現(xiàn)如果圖像尺度較小的較大和較小的圖象進(jìn)行跨尺度相減(across-scale),就能夠取得圖象局部的中心與周圍背景信息的反差通過線性插值,把包含外圍背景信息的小尺度圖象和包含中心信息的大尺度圖象進(jìn)行點(diǎn)對(duì)點(diǎn)的減新性的思考模式,通過融合歷史上關(guān)于這一話題的重要發(fā)現(xiàn)來加也就是{2-5,2-6,3-6,3-7,4-7,4-8},從這些方案中看出也就是說一個(gè)特征通道能夠獲取六張中央周邊差分的結(jié)果圖,那么一共有1個(gè)亮度通道、2個(gè)顏色通道、4個(gè)方向通道共7個(gè)通道,可以產(chǎn)生42張1)將所有圖的取值固定為[0,M],目的是消除由于不同特征的顯著值的分布區(qū)間帶來的影響(高怡寧,2)計(jì)算圖中的最大值M和其他所有局部極值的平均值m;3)整幅圖像乘以(M-m)×(M-m)。3.6顯著圖的生成框架內(nèi)有一些特征圖中的十分明顯的對(duì)象,有可能被另外的較多的特征圖的噪聲或者不顯著的對(duì)象覆。從這些規(guī)定可以認(rèn)識(shí)到所以在沒有自頂向下的監(jiān)察的時(shí)候,利用歸一化操作算子N(.),對(duì)某些強(qiáng)刺激峰(醒目位置)的特征總體增強(qiáng),對(duì)含有大量相似峰反應(yīng)的特征圖進(jìn)圖3-4歸一化算子操作計(jì)算亮度顯著圖的公式如下:計(jì)算顏色顯著圖的公式如下(陳志遠(yuǎn),高秋倩,2023):計(jì)算方向顯著圖的公式如下:最終顯著圖的合并(張哲羽,趙穎慧,2022):3.7注意焦點(diǎn)轉(zhuǎn)移機(jī)制第一次的注視點(diǎn)是由顯著圖所獲得的最大值點(diǎn),在這之后,要選用一個(gè)指引注意進(jìn)行轉(zhuǎn)移的方法,點(diǎn)是目前注視點(diǎn)的提取結(jié)果:第二點(diǎn)是如果某個(gè)事物已引起關(guān)注,則其顯著性會(huì)被抑制機(jī)制抑制。3.7.1注意區(qū)域選取一般認(rèn)為,總顯著圖的最大值點(diǎn)和它的鄰域就是原圖象中的最具特征的目標(biāo)的區(qū)域。故而,在整個(gè)顯著圖中找到極值也就找到了在圖像中的顯著目標(biāo)。Itti算法選用勝者全贏機(jī)制(winnertakeall,WTA)10]來選取總顯著圖中的最值(周奇琪,孫志強(qiáng),2022)。這個(gè)機(jī)制利用的是代表WTA網(wǎng)絡(luò)和顯著圖的一個(gè)兩層積分放電的神經(jīng)元陣列,這在一定程度上闡明了底層神經(jīng)元的輸入電流就是顯著圖對(duì)應(yīng)位置的初始值錯(cuò)誤:未找到引用源,如圖3-5所示,上層神經(jīng)元的輸入電流是下層神經(jīng)元的電位通過電阻轉(zhuǎn)換而來的。顯著性圖的神經(jīng)元的時(shí)間常數(shù)比WTA如果顯著圖的神經(jīng)元的電位升高了,則其輸入電流在電容上積分(充電),而這個(gè)時(shí)候其輸出電流對(duì)勝者全贏機(jī)制網(wǎng)絡(luò)中的神經(jīng)元進(jìn)行充電(許澤辰,黃美珊,2022)。當(dāng)上層神經(jīng)元的電位升到一定閾值時(shí),就開始放電。這在某種程度上展現(xiàn)而首先進(jìn)行放電的神經(jīng)元?jiǎng)偤镁褪秋@著圖上最大顯著值點(diǎn)的神經(jīng)元,如此,這個(gè)點(diǎn)獲勝。該部分的創(chuàng)作參考了何其飛教授相關(guān)主題的研究成果,主要體現(xiàn)在思路和方法上。在思路上,本文學(xué)習(xí)他對(duì)研究問題深入鉆研的方法,明確研究目標(biāo)與假設(shè),構(gòu)建嚴(yán)謹(jǐn)?shù)难芯靠蚣堋_\(yùn)用定量和定性相輔相成的研究手段,力求在數(shù)據(jù)收集和分析時(shí)做到客觀、精確,保證研究結(jié)論的科學(xué)性和可靠性。盡管本研究受何其飛教授啟發(fā),但本文在多個(gè)環(huán)節(jié)融入了創(chuàng)新內(nèi)容,研究設(shè)計(jì)階段采取了更為豐富靈活的數(shù)據(jù)收集方法;數(shù)據(jù)分析時(shí)探索不同變量之間的復(fù)雜關(guān)系,使研究兼具理論價(jià)值和實(shí)踐指導(dǎo)意義。在找到最大值點(diǎn)之后,要得到最顯著區(qū)域,就要從引起注意的所有特征圖中,在此類背景下尋找對(duì)最大顯著值點(diǎn)貢獻(xiàn)最高的特征圖和在此特征圖上的特征值,利用閾值分割法,用該特征值的十分之一作為臨界點(diǎn),并在這特征圖上對(duì)應(yīng)的原始區(qū)域中劃分出最大顯著值點(diǎn)所在的區(qū)域,這就是最顯著區(qū),屆時(shí)昊忠,2021)。若是沒有相應(yīng)的控制機(jī)制,一旦注意到某個(gè)地方,注意點(diǎn)就會(huì)一直停留在此,那么其他的地方就沒有得到注意的機(jī)會(huì),這樣對(duì)于檢測(cè)顯著區(qū)域是不利的。要解決這個(gè)問題,就要讓注意焦點(diǎn)發(fā)生變化,而且不能隨意變化,這樣可能會(huì)有遺漏。故而,可以采取顯著值逐漸減小的次序來選擇注意點(diǎn),這就需要利用一個(gè)負(fù)反饋結(jié)構(gòu)來完成,這在某種程度上展示這個(gè)反饋是從WTA網(wǎng)絡(luò)到總顯著圖的(陳潤(rùn)天,成瑾萱,2021)。當(dāng)找到顯著值最大值勝出點(diǎn)的時(shí)候,總的顯著圖就會(huì)收到從WTA網(wǎng)絡(luò)發(fā)出的一個(gè)脈沖,且這個(gè)反饋信號(hào)的空間分布類似于off-中心型高斯差分函數(shù),這就說明我們需要抑制的位置就是此刻顯著值最大值的點(diǎn)。故此,顯著值最大值的點(diǎn)和它的附近區(qū)域就會(huì)被抑制,從這些方案中看出這樣注意焦點(diǎn)進(jìn)入到另一個(gè)顯著值最大的范圍。一旦出現(xiàn)不止一個(gè)顯著程度一樣的目標(biāo)時(shí),按照“就近原則”,焦點(diǎn)就會(huì)轉(zhuǎn)移到離當(dāng)前最大值點(diǎn)最近的還沒有被注意到的目標(biāo)。這個(gè)機(jī)制叫做抑制返回(Inhibitionof圖3-5勝者全贏神經(jīng)網(wǎng)絡(luò)選擇注意點(diǎn)的示意圖算法采用的仿真環(huán)境是MatlabR2018a,在確認(rèn)沒有錯(cuò)誤之后,運(yùn)行程序可以得到實(shí)驗(yàn)的結(jié)果,結(jié)圖3-6顯著圖提取圖3-6中,第一行左側(cè)是原圖,這在一定程度上透露了右側(cè)是顏色顯著圖,中間行左側(cè)是亮度顯著圖,右側(cè)是方向顯著圖,最后一行是最終的顯著圖。為提升研究發(fā)現(xiàn)的可靠程度和公信力,本文從廣泛的國(guó)內(nèi)外文獻(xiàn)中提取信息,整理出了當(dāng)前領(lǐng)域的研究趨勢(shì)與理論支撐。基于研究目的,設(shè)計(jì)出一套包含數(shù)據(jù)搜集途徑、樣本篩選條件及分析結(jié)構(gòu)的完善研究計(jì)劃。利用多重?cái)?shù)據(jù)源進(jìn)行相互驗(yàn)證,準(zhǔn)確反映研究實(shí)體的真實(shí)狀況。使用先進(jìn)的統(tǒng)計(jì)分析技術(shù)和工具對(duì)數(shù)據(jù)進(jìn)行嚴(yán)格處理,確保研究結(jié)論的科學(xué)客觀性。此外,也對(duì)可能發(fā)生的誤差和偏見實(shí)施了敏感性檢驗(yàn),增強(qiáng)了研究結(jié)果的穩(wěn)定性。由實(shí)驗(yàn)結(jié)果可以知道,得到的顯著圖只有中間的面包和一些白色的點(diǎn)點(diǎn),在這般的框架內(nèi)但是不能知道究竟是什么物體,所以該算法有一定的缺陷,需要進(jìn)行優(yōu)化改進(jìn)(殷志光,馬欣怡,2023)。由于原來的算法得到的顯著圖,效果不是特別的好,所以本文在算法原有的基礎(chǔ)上進(jìn)行了優(yōu)化改進(jìn)。在原有基礎(chǔ)上,除了亮度、顏色、方向三個(gè)模塊之外,再添加一個(gè)輪廓信息的模塊,流程如圖4-1特征圖12張交叉尺度以及歸一化單維特征圖24張方向圖4-1優(yōu)化一流程圖緣的方法是求出圖象中每個(gè)像素的上下左右四個(gè)領(lǐng)域的灰度值加權(quán)差,從這些現(xiàn)象中顯示利用求得的索貝爾算子選取的方法是先進(jìn)行加權(quán)平均,之后再進(jìn)行微分計(jì)算,計(jì)算方法見(4-1)(4-2),△f(x,y)=[f(x-1,y+1)+2f(x,y+1)+f(x+1,y+1]-[f(x-1,圖象,用A表示原圖,計(jì)算方法如公式(4-3)(4-4)所示(羅志天,錢慧敏,2022): 以及梯度方向:綜上所述,假如公式(4-9)的角度θ為零,就說明圖象這個(gè)地方具有縱向邊緣,左方相比于右方來說從這些規(guī)定可以認(rèn)識(shí)到輸入同一張照片之后,確保程序沒有錯(cuò)誤,運(yùn)行程序。以下是實(shí)驗(yàn)結(jié)果:圖4-2方法一顯著圖提取圖中,第一行第一張是原圖,第二張是顏色顯著圖,第三張是亮度顯著圖,最后一張是方向顯著圖,第二行左側(cè)是Sobel顯著圖,右側(cè)是最終的顯著圖。和原來算法的結(jié)果對(duì)比,如圖4-3所示:圖4-3顯著圖對(duì)比圖中左側(cè)是通過原來Itti算法獲取的顯著圖,右側(cè)是通過方法一獲取的顯著圖。這在一定水平上揭露通過對(duì)比可以發(fā)現(xiàn)現(xiàn)在的顯著圖相比原來的顯著圖而言,旁邊的夾子和陰影區(qū)域也逐漸顯現(xiàn)出來,但是如果不知道輸入的圖片是無法分辨這個(gè)是何物,所以效果不是很好(唐澤博,陳婉如,2021)。考慮到添加輪廓信息模塊之后的效果不是很好,通過觀察可以發(fā)現(xiàn),原本算法得到的亮度顯著圖和方向顯著圖,不能很好地反應(yīng)輸入的圖片,所以考慮能否采用輪廓信息的亮度和方向特征,這樣和原本的顏色特征圖三者都能較好地反應(yīng)出原本圖像的特征(韓澤和,趙婉茜,2021)。因此,輸入的圖片分兩支走,一支按原本的算法進(jìn)行,另一支利用sobel算子提取輪廓信息之后,這在某種程度上展現(xiàn)把得到的sobel結(jié)果重復(fù)原來算法的步驟,然后把兩個(gè)顯著圖進(jìn)行融合,得到最終的結(jié)果。過程如圖所示:信息圖4-4優(yōu)化二流程圖關(guān)于特征自適應(yīng)閾值。實(shí)際上就是自適應(yīng)閾值處理,針對(duì)一幅顏色反差不是特別大的圖像,如果要實(shí)現(xiàn)對(duì)圖像的閾值化處理僅采用一個(gè)閾值就可以完成。然而,有時(shí)候,圖像的顏色并不均衡,這個(gè)時(shí)候,僅采用一個(gè)閾值,就難以獲得一個(gè)明確的閾值分割結(jié)果。這在某種程度上展示所以在進(jìn)行閾值處理的時(shí)候,采用自適應(yīng)閾值處理的方法,計(jì)算出各個(gè)像素點(diǎn)臨近的加權(quán)平均值,從而計(jì)算出閾值,然后利用剛合,這肯定了研究設(shè)計(jì)的科學(xué)性和理論框架的完整性。通過細(xì)致入微的分析和多角度的檢驗(yàn),不僅鞏固了初始假設(shè),而且豐富了該領(lǐng)域的理論體系。研究為實(shí)踐提供了指引,通過針對(duì)核心問題的深入挖掘,揭示了其深層次的原因,這對(duì)資源的最佳配置、決策效率的提高以及行業(yè)的持續(xù)發(fā)展有著重要意義。此外,研究還突顯了理論聯(lián)系實(shí)際的重要意義,既致力于理論上的革新,又關(guān)注其實(shí)用性。原來的算法根據(jù)方向、亮度、顏色、三者融合后的特征計(jì)算分割閾值不魯棒,容易因?yàn)槟硞€(gè)較弱的特征導(dǎo)致細(xì)節(jié)丟失,從這些方案中看出比如輸入的圖片一開始夾子都沒有了,因?yàn)閵A子的顏色特征特別弱,所以可以考慮選level_SO、level_SC是否差別很大,這在一定程度上透露了當(dāng)差別很大的時(shí)候就用自適應(yīng)閾值,當(dāng)差別然后對(duì)于輪廓信息還是采用sobel算子進(jìn)行提取,提取之后把結(jié)果再次進(jìn)行原來算法的操作,利用輪廓的亮度和方向特征。輸入同一張照片之后,確保程序沒有錯(cuò)誤,運(yùn)行程序。以下是實(shí)驗(yàn)結(jié)果(陸志遠(yuǎn),何慧敏,2020):圖4-5方法二提取的顯著圖圖中,第一行第一張是原圖,第二張是Sobel結(jié)果圖,第三張是原來的顏色顯著圖,最后一張是輪廓的亮度顯著圖,第二行第一張是輪廓的方向顯著圖,第二張是輪廓的顯著圖,第三張是原來的顯著圖,最后一張是原來的顯著圖以及輪廓顯著圖相加之后得出顯著圖(韓雅靜,趙澤和,2020)。把輸入的圖片轉(zhuǎn)換為double型,然后再與得到的結(jié)果圖相乘,得出的最終顯著圖,如圖4-6:圖4-6最終顯著圖通過觀察可以發(fā)現(xiàn)這次得到的顯著圖相比原來的顯著圖,在這般的框架內(nèi)得到的信息更多更完整,面包的輪廓更加清晰了,旁邊的夾子也呈現(xiàn)得比較完好。而且,與添加輪廓信息模塊的方法相比,顯著圖更加清楚,輪廓分明。與圖4-3的第二幅圖相比(添加輪廓信息模塊的顯著圖),從這些現(xiàn)象中顯示可以直觀地感受到顯著圖的變化。以下是較為復(fù)雜圖片的各自提取情況,可以看出來方法二還是比較不錯(cuò)的(張雅慧,陳澤羽,2021)。圖4-7示例一圖4-8示例二圖4-9示例三圖4-7圖4-8圖4-9第一張是輸入的圖片,第二張是原來Itti算法的顯著圖,第三張是加入輪廓信息模塊得出的視覺顯著圖,最后一張是融入輪廓信息和特征自適應(yīng)閾值得出的視覺顯著圖(楊一凡,許慧妍,2021)。5總結(jié)在本文中,本文實(shí)現(xiàn)了原本的Itti算法模型,同時(shí)也看到了算法的不足之處,展示了相應(yīng)的顏色、獻(xiàn)談到輪廓信息,所以第一次嘗試是添加了輪廓信息這個(gè)模塊和原有的三個(gè)模塊一共四個(gè)模塊進(jìn)行融[1]張銘澤,陳君向.基于深度顯著性分析的目標(biāo)檢測(cè)[D].西安電子科技大學(xué),2022.[2]成澤和,趙俊天.圖像顯著性檢測(cè)算法研究[D].西安電子科技大學(xué),2023.[3]張雅慧,陳澤羽.基于視覺感知的圖像處理方法研究[D].中南大學(xué),2021.[4]楊一凡,許慧妍.基于視覺顯著性的區(qū)域立體匹配算法[J].計(jì)算機(jī)用,2021[5]黃昕怡,楊澤萱基于多特征級(jí)聯(lián)分類器的消防通道車輛

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論