圖像檢索算法研究與實現_第1頁
圖像檢索算法研究與實現_第2頁
圖像檢索算法研究與實現_第3頁
圖像檢索算法研究與實現_第4頁
免費預覽已結束,剩余1頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、.圖像檢索算法的研究與實現摘要: 在互聯網高速發展的今天,人們的搜索內容已不僅僅局限與對文本的搜索,很多時候我們需要搜索圖像,這就需要一種能夠快速和準確的尋找圖像的技術,這就是本文描述的圖像檢索技術。從歷史的發展來看,圖像檢索主要經歷了兩個階段,基于文本的圖像檢索和基于內容的圖像檢索。基于內容的圖像檢索可以分為兩類,一類為物理特征,包括顏色、紋理、形狀等;另一類為語義特征。本文概述物理特征,主要對語義特征展開說明。關鍵字:圖像檢索 基于內容 基于語義 情感語義 相關反饋技術隨著多媒體技術和數字照相機,掃描儀,打印機這些數字圖像設備的普及,全世界的數字圖像數量正以驚人的速度增長,每天都會產生數以

2、百萬計的圖像。隨著互聯網的發展,越來越多的人更加方便,快捷地接觸到這些圖像,人們面臨的不是缺少圖像媒體的內容,而是如何在浩如大海的圖像媒體中尋找自己需要的信息。這就需要一種能夠快速和準確地尋找圖像的技術,這就是所謂的圖像檢索技術。1一、 圖像檢索方法的分類從圖像檢索發展的歷程來看主要經歷了兩個階段:基于文本的圖像檢索和基于內容的圖像檢索。基于內容的圖像檢索實現了自動化、智能化的圖像檢索和管理,主要利用了圖像中的一些可視化信息。“以圖找圖”的特點引起人們的興趣。所用的圖像特征分兩類:一類為底層特征或物理特征,如顏色、紋理、形狀等;另一類為高層特征或語義特征,即圖像內容的語義描述及各類物理特征之問

3、的邏輯關系。目前基于內容的圖像檢索技術主要以圖像底層特征的相似性匹配檢索為主,輔助以圖像語義特征。具體分類如圖1所示。2圖1 圖像檢索算法分類圖(一) 基于文本的圖像檢索算法基于文本的圖像檢索技術是通過關鍵字或自由文本進行描述,查詢操作是基于該圖像的文本描述進行精確匹配或概率匹配。此方式簡單、易于理解,但檢索時要指明文本特征。由于人工注釋圖像的主觀性和不準確性等弊端,因此這種傳統的圖像檢索方法并不能滿足用戶的需要。(二) 基于內容的圖像檢索算法基于內容的圖像檢索把圖像處理、圖像識別、數據庫三個領域的技術成果結合起來,融合了圖像理解技術,提供了更加有效的檢索途徑。目前,基于內容的圖像檢索技術在國

4、內外已經取得了不少的成就。1. 基于顏色的圖像檢索算法顏色特征是一種全局特征,描述了圖像或圖像區域所對應的景物的表面性質。一般顏色特征是基于像素點的特征,此時所有屬于圖像或圖像區域的像素都有各自的貢獻。由于顏色對圖像或圖像區域的方向、大小等變化不敏感,所以顏色特征不能很好地捕捉圖像中對象的局部特征4。2. 基于紋理的圖像檢索算法紋理特征通常定義為局部特征 ,它描述了圖像或圖像區域所對應景物的表面性質。但由于紋理只是一種物體表面的特性 ,并不能完全反映出物體的本質屬性 ,所以僅僅利用紋理特征是無法獲得高層次圖像內容的。與顏色特征不同 ,紋理特征不是基于像素點的特征 ,它需要在包含多個像素點的區域

5、中進行統計計算。3. 基于形狀的圖像檢索算法基于形狀特征的圖像檢索主要是檢測出目標的輪廓線或分割出目標的輪廓, 并針對其進行形狀特征的提取或直接針對圖像尋找適當的矢量特征。形狀描述應該在盡可能區別不同目標的基礎上對目標的平移、旋轉和尺度變化來操作。目前, 雖然已經提出了許多形狀分析方法, 但要將其有效地運用于圖像檢索上還有一些問題亟待解決, 如算法的效率和復雜性,形狀特征的提取與描述等5。4. 基于語義的圖像檢索算法語義圖像檢索是更合理的圖像檢索方式。雖然目前基于內容的物理特征的圖像檢索作為一項倍受關注的技術在研究和商業方面都取得了一定成果, 但由于它只利用了圖像本身固有的物理信息, 因此,

6、它只在特定的應用領域,如指紋識別、商標檢索等方面獲得成功。圖2 圖像內容層次模型圖2所示的圖像內容層次模型中,語義位于最高層:第3層。第2層和第3層之間的差別被許多學者稱為“語義鴻溝”。語義鴻溝的存在是目前基于內容的圖像檢索系統還難以被普通用戶接受的原因。在某些狹窄的專業領域,比如指紋識別和醫學圖像檢索中,將圖像低層特征和高層語義建立某種聯系是可能的,但是在廣泛領域內,低層視覺特征與高層語義之間并沒有很直接的聯系。如何最大限度地減小圖像簡單視覺特征和豐富語義之間的鴻溝問題,是語義圖像檢索研究的核心。其中的關鍵技術,就是如何獲取圖像的語義信息6。圖像語義包括空間關系語義、對象語義、場景語義、行為

7、語義和情感語義。其中情感語義是最高層的語義,通常用形容詞來描述,其涉及到人的認知模型、文化背景和美學標準等。以用戶情感為線索的圖像檢索,目的在于令檢索系統能更好地理解和把握用戶心理感覺上對圖像檢索的要求,令檢索結果更接近于用戶的情感需求。此方法既有助于抓住用戶觀賞圖像時的情感變化,為合理地分析用戶在檢索獲取這些圖像時的提問提供依據,還有助于對現有基于內容檢索提供有益的補充,彌補現有研究在情感語義特征捕捉中的不足,以期更全面地揭示圖像特征。情感圖像檢索主要涉及以下四個方面的研究內容: 1)定義圖像的感性特征,即抽取圖像中較容易引起用戶情感變化的特征; 2)定義用戶情感信息的描述方式,即用戶用來表

8、達心理的形容詞(也稱為印象語,Impression Words)在計算機中的處理和表達方式; 3)計算圖像感性特征與用戶情感需求之間的語義相關性,即建立用戶高層次的情感信息和圖像低層次的感性特征之間的聯系,也即建立情感用戶模型; 4)通過學習機制,根據用戶的不同,自適應調整情感用戶模型,提高檢索的準確性,即個性化情感用戶模型。7情感圖像檢索的方法是從學術角度考慮,如何讓計算機更好的模擬人類的情感,而研究難度較大,檢索效率不高,難以完成對圖像高層語義的理解任務等缺點造成了當前圖像檢索具有一定的局限性。因此,采取通過相關反饋的方法來獲取更多的用戶查詢信息,被公認為行之有效的方法,并在許多圖像檢索系

9、統中得到應用。相關反饋技術最早是在文本領域中提出來的。通過一種人機交互機制使得計算機能夠不斷了解用戶對查詢結果的滿意度,并通過不斷修改查詢表達來得到更好的檢索結果。相關反饋技術的基本思想是:在檢索過程中允許用戶對檢索結果進行評價和標記,指出結果中哪些是與查詢圖像相關的,哪些是不相關的,然后將用戶標記的相關信息作為訓練樣本反饋給系統進行學習,以指導下一輪檢索,從而使得檢索結果更加符合用戶的需要9。相關反饋作為提高檢索性能的一種有效的手段 ,已成為圖像檢索系統中密不可分的一部分。相關反饋具有以下主要優點:1)簡易性。這種方式解除了用戶的負擔,在查詢提交階段不再需要人工構建查詢表達式,不再需要由用戶

10、指定精確的權值。只需要用戶和系統的交互,在系統返回的結果中指出他認為相關和不相關的圖像。2)可控性。在查詢的過程中可以強調一些重要的關鍵詞,減弱另外一些關鍵詞的影響,以反映用戶對語義的需求。而且還可將查詢進一步細化,分解成一系列有意義的、易于理解的小過程,采用漸進的方式來滿足查詢。盡管相關反饋技術對于檢索性能有很大的提高,但也存在一些問題:如何建立一個和相關反饋結合的、“友好”的用戶接口;如何解決檢索效率和查準率相抵觸的情況;如何對圖像的關鍵詞進行標注等。人的認知角度來看,人對圖像的描述和理解主要是在語義層次進行的。如何獲取和描述圖像的語義信息,使其盡可能與人對圖像內容的理解一致,是圖像檢索的關鍵所在。可以預言,基于語義的圖像檢索是未來Internet上圖像檢索系統的主導技術。雖然基于顏色、紋理等視覺特征的檢索系統在一些領域應用得很好,但在Internet這個龐大而雜亂的圖像庫中,語義檢索才是用戶最愿意使用的。如何獲取圖像的語義信息,是Internet圖像檢索的一個研究重點。8參考文獻1熊回香.基于內容的圖像檢索技術的發展方向J信息檢索技術,20042馮國光.齊影虹,肖揚波基于內容的圖像檢索技術綜述J科技廣場,20073胡必鑫.基于內容圖像檢索中顏色特征描述J.計算機工程與應用,2005.4傾明. 基于顏色和紋理特征圖像檢索技術的研究J.科學技術與工程,2009.5付瑋.基于

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論