畢業設計(論文)-Web圖像檢索系統的設計_第1頁
畢業設計(論文)-Web圖像檢索系統的設計_第2頁
畢業設計(論文)-Web圖像檢索系統的設計_第3頁
畢業設計(論文)-Web圖像檢索系統的設計_第4頁
畢業設計(論文)-Web圖像檢索系統的設計_第5頁
已閱讀5頁,還剩44頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、摘要計算機處理能力的日益增強,因特網技術的廣泛普及和網絡帶寬不斷提高,大量的圖像信息不斷產生,如何從這些海量圖像數據中搜索人們感興趣并有效利用這些圖像,成為迫切需要解決的問題。本設計首先以“Web圖像檢索為背景介紹了在Internet中檢索圖像的根本概念和常用的兩種重要技術:基于文本的圖像檢索和基于內容的圖像檢索,并簡要闡述了它們的根本概念、原理,說明了目前這一領域的開展現狀。其次重點介紹了圖像的內容特征:顏色特征、紋理特征和形狀特征,和以圖像內容特征為根底的Web圖檢索原理,對常用的對應圖像檢索算法分別介紹和比照,并分析了其優劣性。最后以基于內容的圖像檢索為重點,利用VC+編程工具對Web圖

2、像檢索系統進行了模擬和驗證。關鍵字:Web圖象檢索,特征提取,顏色直方圖,相似度 AbstractThe capacity of computer processing is in increasing , Internet technology is in popular with more and more people and network bandwidth broadens, Besides, a mass of image data information is being produced constantly ,so how to find sone image what p

3、eople are interested in and to use these effectively from the Web,become a urgent problem.Firstly, this project introduced the basic concept of Web image retrieval and two common but important technologys :based on text image retrieval and content-based image retrieval. and briefly describes their b

4、asic concept, principle and the current situation of the development of this field. Secondly ,it introduced the contents characteristic: color image features, the texture featuress and shape features, and theory of Web image retrieval that is based on these content features,meanwhile ,several import

5、ant image retrieval algorithms used are introduced and compared, and analysed their advantages and disadvantages. Finally ,to content-based image retrieval, Design a “Web image retrieval system to simulate and test by using VC+ 6.0 programming tool.Keywords: Web image retrieval, feature extraction,

6、color histogram ,similarity目 錄 TOC o 1-3 h z u HYPERLINK l _Toc262925956 摘要 PAGEREF _Toc262925956 h 1 HYPERLINK l _Toc262925957 Abstract PAGEREF _Toc262925957 h 2 HYPERLINK l _Toc262925958 目 錄 PAGEREF _Toc262925958 h 3 HYPERLINK l _Toc262925959 第一章 前 言 PAGEREF _Toc262925959 h 5 HYPERLINK l _Toc26292

7、5960 1.1 Web圖像檢索概述 PAGEREF _Toc262925960 h 5 HYPERLINK l _Toc262925961 1.2 圖像檢索方法的研究綜述 PAGEREF _Toc262925961 h 5 HYPERLINK l _Toc262925962 基于文本的檢索 PAGEREF _Toc262925962 h 5 HYPERLINK l _Toc262925963 基于內容的圖像檢索技術 PAGEREF _Toc262925963 h 6 HYPERLINK l _Toc262925964 圖像檢索技術研究的三個方向 PAGEREF _Toc262925964 h

8、 7 HYPERLINK l _Toc262925965 圖像檢索系統的性能指標和評價準那么 PAGEREF _Toc262925965 h 7 HYPERLINK l _Toc262925966 第二章 Web圖像檢索原理 PAGEREF _Toc262925966 h 9 HYPERLINK l _Toc262925967 2.1 基于文本的圖像檢索 PAGEREF _Toc262925967 h 9 HYPERLINK l _Toc262925968 2.2 基于內容的圖像檢索 PAGEREF _Toc262925968 h 10 HYPERLINK l _Toc262925969 2.

9、2.1 體系結構 PAGEREF _Toc262925969 h 10 HYPERLINK l _Toc262925970 2.2.2 查詢模塊 PAGEREF _Toc262925970 h 10 HYPERLINK l _Toc262925971 特征提取模塊 PAGEREF _Toc262925971 h 11 HYPERLINK l _Toc262925972 2.2.4 常用的圖像特征 PAGEREF _Toc262925972 h 11 HYPERLINK l _Toc262925973 匹配模塊 PAGEREF _Toc262925973 h 12 HYPERLINK l _To

10、c262925974 相似性度量函數 PAGEREF _Toc262925974 h 13 HYPERLINK l _Toc262925975 第三章 基于內容的圖像顏色特征提取 PAGEREF _Toc262925975 h 15 HYPERLINK l _Toc262925976 常用的顏色模型 PAGEREF _Toc262925976 h 15 HYPERLINK l _Toc262925977 3.1.1 RGB模型 PAGEREF _Toc262925977 h 15 HYPERLINK l _Toc262925978 3.1.2 HSV模型 PAGEREF _Toc2629259

11、78 h 16 HYPERLINK l _Toc262925979 3.1.3 L*a*b模型 PAGEREF _Toc262925979 h 16 HYPERLINK l _Toc262925980 模型 PAGEREF _Toc262925980 h 16 HYPERLINK l _Toc262925981 顏色特征的提取 PAGEREF _Toc262925981 h 17 HYPERLINK l _Toc262925982 顏色直方圖 PAGEREF _Toc262925982 h 17 HYPERLINK l _Toc262925983 顏色矩 PAGEREF _Toc2629259

12、83 h 18 HYPERLINK l _Toc262925984 顏色聚合向量 PAGEREF _Toc262925984 h 18 HYPERLINK l _Toc262925985 圖像特征的相似性匹配 PAGEREF _Toc262925985 h 19 HYPERLINK l _Toc262925986 直方圖相交法 PAGEREF _Toc262925986 h 19 HYPERLINK l _Toc262925987 歐氏距離方法 PAGEREF _Toc262925987 h 20 HYPERLINK l _Toc262925988 模糊方法 PAGEREF _Toc26292

13、5988 h 20 HYPERLINK l _Toc262925989 第四章 基于內容的圖像紋理特征提取 PAGEREF _Toc262925989 h 22 HYPERLINK l _Toc262925990 灰度共生矩陣 PAGEREF _Toc262925990 h 22 HYPERLINK l _Toc262925991 灰度共生矩陣的簡化計算 PAGEREF _Toc262925991 h 23 HYPERLINK l _Toc262925992 基于灰度共生矩陣的特征提取 PAGEREF _Toc262925992 h 24 HYPERLINK l _Toc262925993 綜

14、合顏色、紋理特征的檢索 PAGEREF _Toc262925993 h 24 HYPERLINK l _Toc262925994 第五章 圖像檢索系統設計與實現 PAGEREF _Toc262925994 h 26 HYPERLINK l _Toc262925995 系統開發環境介紹 PAGEREF _Toc262925995 h 26 HYPERLINK l _Toc262925996 系統需求分析 PAGEREF _Toc262925996 h 28 HYPERLINK l _Toc262925997 可行性分析 PAGEREF _Toc262925997 h 28 HYPERLINK l

15、 _Toc262925998 系統總體設計 PAGEREF _Toc262925998 h 29 HYPERLINK l _Toc262925999 系統功能結構圖 PAGEREF _Toc262925999 h 29 HYPERLINK l _Toc262926000 系統模塊設計與開發 PAGEREF _Toc262926000 h 29 HYPERLINK l _Toc262926001 系統測試 PAGEREF _Toc262926001 h 38 HYPERLINK l _Toc262926002 結果分析 PAGEREF _Toc262926002 h 45 HYPERLINK l

16、 _Toc262926003 總結 PAGEREF _Toc262926003 h 47 HYPERLINK l _Toc262926004 參考文獻 PAGEREF _Toc262926004 h 48 HYPERLINK l _Toc262926005 致 謝 PAGEREF _Toc262926005 h 49第一章 前 言 Web圖像檢索概述從20世紀70年代開始,有關圖像檢索的研究就已開始,當時主要是基于文本的圖像檢索技術Text-based Image Retrieval,簡稱TBIR,利用文本描述的方式描述圖像的特征,如繪畫作品的作者、年代、流派、尺寸等。到90年代以后,出現了對

17、圖像的內容語義,如圖像的顏色、紋理、布局等進行分析和檢索的圖像檢索技術,即基于內容的圖像檢索Content-based Image Retrieval,簡稱CBIR技術。CBIR屬于基于內容檢索Content-based Retrieval,簡稱CBR的一種,CBR中還包括對動態視頻、音頻等其它形式多媒體信息的檢索技術。 在檢索原理上,無論是基于文本的圖像檢索還是基于內容的圖像檢索,主要包括三方面:一方面對用戶需求的分析和轉化,形成可以檢索索引數據庫的提問;另一方面,收集和加工圖像資源,提取特征,分析并進行標引,建立圖像的索引數據庫;最后一方面是根據相似度算法,計算用戶提問與索引數據庫中記錄的

18、相似度大小,提取出滿足閾值的記錄作為結果,按照相似度降序的方式輸出。 為了進一步提高檢索的準確性,許多系統結合相關反應技術來收集用戶對檢索結果的反應信息,這在CBIR中顯得更為突出,因為CBIR實現的是逐步求精的圖像檢索過程,在同一次檢索過程中需要不斷地與用戶進行交互。1.2 圖像檢索方法的研究綜述目前,檢索的方法根本分為兩大類:基于文本的圖像檢索和基于內容的圖像檢索。基于文本的檢索基于文本的圖像檢索沿用了傳統文本檢索技術,回避對圖像可視化元素的分析,而是從圖像名稱、圖像尺寸、壓縮類型、作者、年代等方面標引圖像,一般以關鍵詞形式的提問查詢圖像,或者是根據等級目錄的形式瀏覽查找特定類目下的圖像,

19、如Getty AAT使用近133,000個術語來描述藝術、藝術史、建筑以及其它文化方面的對象,并推出30多個等級目錄,從7方面描述圖像的概念、物理屬性、類型和刊號等。又如Gograph將圖像分為動態圖像、照片、圖標、背景、藝術剪輯圖、插圖、壁紙、界面、成套圖像8個一級類,下設數量不等的子類。在圖像數字化之前,檔案管理者、圖書管理員都是采用這種方式組織和管理圖像。 圖像所在頁面的主題、圖像的文件名稱、與圖像密切環繞的文字內容、圖像的鏈接地址等都被用作圖像分析的依據,根據這些文本分析結果推斷其中圖像的特征?,F階段,真正進入普通意義上的實用階段的圖像檢索方法,根本上還都是采用了基于文本的檢索方法。這

20、種方法,實際上就是靠人工為圖像進行標注,用對圖像的一些描述信息來作為檢索時的關鍵字,如作者、標題、大致內容、創作時間等。廣泛流行的商用搜索引擎,如G00GLE、百度。這種檢索的策略,實際上是拋開了圖像信息本身,其實質還是傳統的文本信息檢索。而且,顯而易見的是,由于不同的人對同一幅圖像可能有不同的理解,從而不可防止的造成了二義性。并且由于現實情況的復雜性,要建立能夠完整表達圖像信息的關鍵字是十分困難的,幾乎不可能辦得到。同時,隨著圖像的不斷增多,人工標注的工作量也會急劇攀升。所以,使用這種方法,雖然在一定程度上緩解了人們的迫切需要,但往往不能取得令人滿意的效果,應用范圍受到極大的限制。所以說,基

21、于文本的圖像檢索方法,只能是權宜之策,而不是最終的解決之道?;趦热莸膱D像檢索技術基于內容的圖像檢索Content Based Image Retrieval,CBIR是基于內容檢索技術Content Based Retrieval,CBR)的一種是近些年開展起來的側重于挖掘圖像本身特征的一種檢索策略。圖像的內容即圖像的特征,而基于內容的檢索就是通過兩幅圖像的特征匹配,即圖像特征的相似性度量來實現的。要進行圖像特征匹配首先要進行特征提取。圖像的特征分為低層物理特征(如顏色、紋理、形狀、輪廓等)和高層語意特征(是人對圖像的概念級的反映,如對圖像的個人感受等)。高層特征在目前的條件下,一般通過人工

22、注釋的方法來實現,也就是前面說的基于文本的圖像檢索方法,這種方法要實現自動化有較大的困難,且主觀性太強,不利于標準化的實現。而低層次的顏色、紋理、形狀等特征那么相對較容易提取,也可較客觀地反映圖像之間的差異?;趦热莸牟樵兎椒ê突谖谋镜牟樵兎椒ㄏ啾?,有這樣幾個特點:(l)采用從圖像中提取出來的顏色、紋理、形狀等真實特征來作為檢索的依據,而不是人為的文字評價;(2)對這些特征進行相似性度量,即采用近似查詢的方法;(3)多采用例如查詢的方法QBE(QuerybyExamPle),即給出例如圖像,再從圖庫中查找與之相似的結果圖像來。如果將圖像檢索和圖像理解相比的話,兩者在根底技術上比較相似,但還是

23、存在著許多重要的不同之處的。比方,CBIR并不需要計算機識別出具體的目標是什么,計算機可以在完全不了解具體內容的意義的情況,而找出假設干幅類似的圖像來,另外,圖像檢索是模糊的相似性判斷,檢索結果應盡可能包含圖像庫中的所有相關圖像,并且允許在結果中存在不相關的圖像,而不同于圖像識別那樣必須找出明確的、完全相似的內容。采用CBIR方法開發的第一個功能較為齊全的系統,要屬IBM公司Almadell研究中心開發的QBIC3(QuerybyImageContent)系統,它可以利用顏色、紋理、形狀和草圖等多種方法進行檢索,用戶只需給出例如圖像或草圖,就可方便地在圖像庫中找到相似的圖像來。圖像檢索技術研究

24、的三個方向基于文本和基于內容是圖像檢索開展的兩個分支,不過從目前圖像檢索研究的趨勢而言,尤其結合網絡環境下列圖像的特征嵌入在具有文本內容的Web文檔中,出現了三個不同的研究著眼點。 (1)立足于文本,對圖像進行檢索:試圖將傳統的文本檢索技術移植于對多媒體信息的檢索上,因為基于文本的檢索技術開展已經成熟。但是因為受控詞匯本身的局限,易歧義,更新慢,所以不太容易應對網絡上日新月異的各類圖像。 (2)立足于圖像內容,對圖像進行分析和檢索:相比而言,盡管圖像檢索已經出現了諸如直方圖、顏色矩、顏色集等多種表征圖像特征的方法,但是要突破對低層次特征的分析,實現更高語義上的檢索,實現難度大,進展慢。不過,基

25、于內容的圖像檢索建立在多媒體信息的內容語義上,能夠更為客觀地反映媒體本質的特征。 (3)結合文本和內容,進行融合性研究:發揮各自的優勢促進圖像的高效、簡單檢索方式的實現,尤其是網絡環境下,結合圖像所在Web文檔的特征分析,推斷圖像的特征,同時結合對圖像的內容分析,共同標引到達對圖像的分析和檢索。 以說,三個方向都是相互影響和促進的,任何一個方向的進展都會促進圖像檢索技術向前更進一步。圖像檢索系統的性能指標和評價準那么圖像檢索有兩種類型:圖像匹配和相似度檢索。設圖像庫有N福圖像。對于匹配問題,理想情況下是正確圖像是檢索結果V(X0)中第一個。通常用下面的式子評價匹配結果: 匹配比率=對相似度問題

26、,通常的方法是人工一個相似圖像子集S,假定S中圖像的相似性比S和非S圖像的相似度高。取XS,Precision-Recall曲線能全面反映檢索效果,下面稱為P-R曲線,其中:recall=, precision=,由于相似圖像集合S是人工選出的,這個評價標準不可辟免帶有主觀因素。不同人對相似度感受不同,因此在一定程度上不可取。此外,采用排序方法評價系統性能也是一種常用的方法。固定返回圖像集合的數目n,設R為相關圖像數目,p為相關圖像的排序序號,T為實際的相關圖像數目,評價參數為:AVPR=,LAVPR=,MT= , 其中AVPR是相關圖像的平均排序,LAVPR是理想的相關圖像的平均排序,MT為

27、喪失的相關圖像率。一般地,AVPR 和LAVPR越小,檢索算法越好,MT越好,性能越好。第二章 Web圖像檢索原理2.1 基于文本的圖像檢索基于文本的圖像檢索方法誕生于二十世紀70年代,是圖像檢索方法的常用技術之一,它利用人工進行圖像語義識別,并用相應的文本關鍵詞對圖像語義進行注解以實現圖像的檢索。由于語言文字是人們進行語義表達最直觀和熟知的手段,也是檢索技術中廣泛采用的檢索方法,故通過其實現的圖像檢索使得檢索形式較為簡便、且由于采用人工注解圖像語義,有效跨越了。語義鴻溝,從一定意義上說是基于語義的圖像檢索方法。在圖像規模較小的初期應用中,這種方法有效地滿足了圖像的檢索需求,然而,隨著圖像檢索

28、應用的不斷深入,利用人工提取圖像語義標識以實現檢索的方法存在著一些明顯的缺陷:1、人工提取圖像語義標識需要消耗大量的人力資源,尤其面對呈指數級增長態勢的圖像資源,完全依賴人工工作存在著明顯的效率問題;2、人工實現圖像語義標識的提取過程存在著主觀片面性,圖像的語義豐富,充分理解圖像語義依賴于不同的知識結構及理解能力,不同人對其理解存在著主觀差異性。因此,面對不斷增長的圖像資源檢索需求,如何高效、客觀地實現圖像語義的識別是影響基于文本的圖像檢索方法開展的瓶頸技術。基于文本的圖像檢索結構如下所示:圖像庫文本檢索人工標注圖像關鍵字圖像文本數據結果輸出圖2.1 基于文本的圖像檢索系統構成2.2 基于內容

29、的圖像檢索.1 體系結構本設計以VC+為開發環境實現了一個基于內容的圖像檢索原型系統如圖2-2所示,主要用于驗證各種特征提取算法的可行性和有效性。首先對用戶提交的例如圖像進行特征提取,然后與圖像特征庫中的特征值進行匹配,最后將檢索結果返回給用戶。系統的關鍵模塊包括查詢模塊、特征提取模塊、匹配模塊,實際應用中每個模塊都有許多具體技術可以采用,下面主要討論各模塊的功能及相關實現技術。用戶界面圖像輸入模塊特征提取模塊查詢接口模塊圖像顯示模塊檢索匹配模塊圖像特征庫圖2.2 基于內容的圖像檢索系統結構 查詢模塊查詢模塊用于提供前端界面的有關查詢接口,用戶通過查詢界面訪問圖像庫從而找到滿足要求的圖像,檢索

30、結果也是通過這個接口返回給用戶。通常提供用戶查詢的方法有:(1)利用例如圖像:即用戶給定一幅與期望圖像類似的圖像作為查詢圖像。(2)利用繪制草圖:即用戶借助繪圖工具繪制出待查詢圖像。(3)利用主色調的檢索:用戶可以設置圖像顏色百分比和顏色分布信息,從而找到具有相似顏色及比率的圖像。特征提取模塊基于內容的圖像檢索首先要解決的問題就是圖像內容的分析和表示。圖像內容的分析和表示指的是通過對圖像像素的顏色屬性以及像素間的相住關系進行分析,從而得到一系列數字或者描述特征,這些特征可以在一定程度卜描述圖像本身的內容。然后,利用這此特征可以對圖像建立索引,從而到達圖像檢索的目的。因此,圖像內容的表示問題本質

31、上是一個圖像特征的提取問題。從廣義上來講,圖像的特征包括圖像的底層特征和高層語義特征。底層特征用來描述圖像共有的特征,主要包括顏色、紋理、形狀等;后者那么用來描述圖像自身的內容信息,比較抽象。本設計主要基于圖像底層特征的特征提取。系統中的特征提取模塊負責圖像處理工作,具體實現CBIR系統中支持的各種特征提取算法,從而能從圖像中提取相應的特征信息。本節簡要地介紹幾種圖像特征。 常用的圖像特征1、顏色特征:顏色信息是在圖像檢索中使用最廣泛的底層特征,它和圖像中的物體和場景有找緊密的聯系。與其他底層特征相比,顏色特征對于圖像縮放、旋轉、遮擋及其他形變有更強的魯棒性。最早采用顏色特征進行圖像檢索的是由

32、Swain和Ballard提出的基于顏色直方圖的檢索方法。圖像顏色特征的表達涉及如下幾個方面的問題:一是選擇一個適宜的顏色空間;二是將顏色特征量化為向量形式;三是定義種相似度(距離)標準用來度量不同圖像之間在顏色上的相似性。由于顏色特征和其他特征相比具有一定的穩定性,不隨物體的平移、旋轉、觀察距離的變化而變化,對于圖像縮放、旋轉、遮擋及其他形變有著更強的變化。2、紋理特征:紋理也是圖像的一個重要屬性。航空、遙感照片、織物設計圖案、復雜的自然風景以及動植物都有紋理。紋理特征有兩個要素構成:(1)紋理基元;(2)基元的排列。紋理基元是一種或多種圖像基元的組合,有一定的現狀和大小。紋理由紋理基元排列

33、而成,?;帕械氖杳艹潭?、周期性、方向性的不同,能使圖像的外觀產生極大地改變。紋理可以認為是灰度(顏色)在空間以一定的形式變化而產生的圖案,是真實圖像區域固有的特征之一。類似于顏色,紋理也常取決于飛人們的感知,一般說來可以認為紋理是由許多相似接近的、互相編織的元素構成,所以直觀來說紋理描述可提供圖像區域的平滑、稀疏、規那么性等特性。3、形狀特征:形狀特征對于人類說是識別物體的主要信息,是一種重要的圖像內容表達手段。按表達的形式分,可分為基于邊界的和基于區域的兩種類型。邊界特征包括:線型形狀,多邊形逼近,有限元模型和傅里葉描繪子。區域特征主要有矩不變量等。形狀特征是比顏色和紋理更高層一些的特征

34、,對形狀的表達比對顏色或紋理的表達從本質上要復雜的多,圖像的形狀信息不隨圖像顏色等特征的變化而變化,是物體穩定的特征。特別對于圖形,形狀是它唯一重要的特征。形狀特征的各種表示方法中一個重要標準是它必須具有仿射不變性,即相對于旋轉平移和尺度變換具有不變性。通常來說,形狀特征有兩種表示方法,一種是基于邊界輪廓特征(contour-based)的,包括:傅立葉形狀描述戶、小波輪廓描述子、邊界直方圖、鏈編碼、曲率尺度空間等,其中最典型的方法為傅立葉形狀描述子。一種是基于區域特征(region-based)的,如不變矩。前者只用到物體的外邊界,而后者那么關系到整個對象所在的區域。4、語義特征:圖像的視覺

35、特征在一定程度上能代表圖像包含的信息,但事實上,人們判斷圖像的相似性并非僅僅建立在視覺特征的相似性上更多的狀況下,用戶主要根據返回圖像的含義,而不是顏色、紋理、形狀等特征,來判別圖像滿足自己需要的程度這些圖像的含義就是圖像的高層語義特征,它包含了人對圖像內容的理解基于語義的圖像檢索的目的,就是要使計算機檢索圖像的能力到達人的理解水平在一般的圖像內容層次模型中,語義位于最高層;第2層和第3層之間的差異被許多學者稱為“語義鴻溝,語義鴻溝的存在是目前CBIR系統還難以被普通用戶接受的原因在某些狹窄的專業領域。比方指紋識別和醫學圖像檢索中,將圖像低層特征和高層語義建立某種聯系是可能的,但是在廣泛領域內

36、,低層視覺特征與高層語義之間并沒有很直接的聯系。采用顏色、紋理、形狀等底層特征對圖像進行的描述往往與人對圖像的描述存在較大的差異,直接利用這些特征作為檢索依據常得不到令人滿意的結果。解決這類問題的方法是采用高層的特征即“語義特征進行檢索。由于它是從人類視覺理解出發,著眼于提取圖像中符合人類視覺的概念。基于語義的檢索技術難度很大,是圖像檢索領域的研究方向。在語義級圖像檢索技術中,關鍵是實現語義的提取。這就要解決兩個問題:語義特征具有“模糊性,因此要提取圖像的語義特征就必須解決特征的“模糊化問題;語義特征與人的視覺理解緊密相關,所以在檢索中要融入人的視覺感知,在“理解圖像的根底上檢索圖像。雖然采用

37、語義內容進行查詢是最符合人的使用要求的方式,也是理想的檢索方式,但是就當前的計算機和圖像理解的開展水平來看,這種完全智能化的檢索方法前正處于研究階段,與實際應用還有較大的距離。匹配模塊查詢模塊將用戶的查詢請求通過特征提取模塊轉換為查詢特征向量,然后調用匹配模塊計算特征庫中的侮一個特征與待查圖像特征的相似度,并按相似程度由大到小排列返回給用戶所需要的圖像。 基于內容的圖像檢索系統所使用的匹配不是精確匹配而是一種基一于相似的檢索,它關心的是排序,選擇適宜的相似性度量函數很重要。目前研究圖像內容的相似性度量是指圖像特征間的相似性,是圖像檢索研究的重要組成局部。相似性度量方法的好壞影響到圖像檢索的性能

38、;而相似性度量的計算復雜性影響到圖像檢索的用戶響應時間。一般假設圖像特征矢量是距離空間中的元素(其中的元素稱為點),通過計算兩點之間的接近程度來衡量圖像特征之間的相似度。 相似性度量函數 對于圖像特征向量X, Y,假設滿足相似性度量中的正定性、對稱性和一三角不等性度量公理,它們之間的相似程度可以采用下面的距離度量或統計學方法來進行圖像相似性判斷。定義D(I, J)為例如圖像I和圖像數據庫中圖像J之問的距離表示圖像I的N維特征向量中第i個特征向量。(1)Minkowski距離如果圖像特征向量互相獨立而且同等重要,那么可以采用Minkowski距離L。來度量圖像之間的相似性:D(I,J)=(-fi

39、(J)| p)這里當P分別等于1,2,時,D(I,J)稱為L1,L2,L3,L 。(2)歐幾里德距離歐幾里德趾離是一個應用非常普遍的距離度量。它的計算簡單,并且與參考系統的旋轉不變量相關。它可以看作是當p=2時的Murkowski距離吞,即L2=3)直方圖交距離(Histogram intersection)直方圖交距離(Histogram intersection) G可以認為是L,距離的一種特殊形式,Swain等用直方圖交距離來計算圖像顏色之間的相似性。圖像I和圖像J的直方圖間的交距離定義為:S(I,J)=第三章 基于內容的圖像顏色特征提取在圖像的形狀、顏色、紋理等特征中,顏色特征是最顯著

40、、最可靠、最穩定的視覺特征,是人識別圖像的主要感知特征。相對幾何特征而言,顏色對圖像中子對象的大小和方向的變化都不敏感,具有相當強的魯棒性。同時,在許多情況下,顏色又是描述一幅圖像最簡便而有效的特征。人們對于幅圖像的印象,往往從圖像中顏色的空間分布開始。所有這些都促使顏色成為基一于內容的圖像檢索所采取的主要手段,如何準確充分的提取一幅圖像的顏色信息,井以適當的方式表示,將改接影響整個系統的效率和精度。常用的顏色模型所謂顏色模型就是指某個三維顏色空間的一個一可見光一子集,它包含某個顏色域的所有顏色。顏色模型的用途是在某個顏色域內方便地指定顏色,對于每一個顏色域都是可見光的子集,所以任何一個顏色模

41、型都無法包含所有可見光。 RGB模型所謂RGB模型,是指采用CIE規定的、以700nm(紅)、546.1nm(綠)、435.8(藍)三個光色為三基元,及顏色的三個屬性所構成的模型。該模型將自然界的顏色通過選用這三基色按照不同比例混合而形成的模型,該模型可以用如下立方體來示意:圖3.1 RGB顏色模型示意圖值得注意的是,RGB模型所覆蓋的顏色域取決于顯示設備熒光點的顏色特性,是與硬件相關的,與人的視覺感知有一定的距離,人們無法感知給定一個RGB值其所對應的顏色,這時使用面向視覺感知的顏色模型比較方便。 HSV模型HSV空間是一種符合人類視覺感知特征的顏色空間,特別適合于人類肉眼對顏色的識別,因此

42、被廣泛應用于計算機視覺領域。它把彩色信號表示為三種屬性:色調H(Hue)、飽和度S(Saturation)和亮度V(value),其中亮度又稱LightneSS或Intensity,所以HSV空間還有HLS和HIS這兩種叫法。HSV模型的色調H表示從一個物體反射過來的或透過物體的光的波長,更一般地說,色調是由顏色名稱來區分的,如紅、橙、黃、綠等,它用角度-180180或O360來度量。亮度V是顏色的明暗程度,通常用百分比度量,0%為最暗的黑色,而100%為最亮的白色。飽和度S指顏色的深淺程度,即在純色中包含的白色光的成份。例如同樣是紅色,也會因顏色濃度不同而分為深紅色、粉紅色和淺紅色。飽和度S

43、也用百分比來度量,從濃度最小的0%到濃度完全飽和的100%。色調H和飽和度S分量合起來定義了顏色的色度(Chromatieity)特性。 3. L*a*b模型L*a*b顏色模型是在1931年國際照明委員會(CIE)制定的顏色度量國際標準的根底上建立的。1976年,這種模型被重新修訂并命名為CIE L*a*b。L*a*b顏色設計為與設備無關,不管使用什么設備創立或輸出圖像,這種顏色模型產生的顏色都保持一致。L*a*b顏色由亮度或光亮度分量(L)和兩個色度分量組成:即a分量(從綠到紅)和b分量(從藍到黃)。CMY模型以紅、綠、藍的補色青(eyan)、品紅(Magenta)、黃(Yellow)為原色

44、構成的CMY顏色模型,常用于從白光中濾去某種顏色,又被稱為減性原色系統。CMY顏色模型對應的直角坐標系的子空間與RGB顏色模型所對應的子空間幾乎完全相同。差異僅在于前者的原點為白,而后者的原點為黑。前者是定義在白色中減去某種顏色來定義一種顏色,而后者是通過從黑色中參加顏色來定義一種顏色。CMY模型以打印在紙張上油墨的光線吸收特性為根底,當白光照射到半透明油墨上時,局部光譜被吸收,局部被反射回眼睛。理論上,青(Cyna)、品紅(Magenta)、和黃(Yelolw)色素能夠合成吸收所有的顏色并產生黑色。因為所有打印油墨都會包含一些雜質,這三種油墨實際上產生一種土灰色,必須與黑色(K)油墨混合才能

45、產生真正的黑色。將這些油墨混合產生顏色稱為四色印刷。減色(CMY)和加色(RGB)是互補色,每對減色產生一種加色,反之亦然。選取適宜的顏色空間后,將采用有效的算法提取顏色特征,典型的表達方法有顏色直方圖法(Color Histogram),顏色矩(Color Moments),顏色聚合向量CCV (Color Coherence Vector),顏色相關圖(Color Correlograms)等。顏色直方圖基于顏色直方圖的特征表示其核心思想是在一定的顏色空間中對圖像中各種顏色出現的頻數進行統計。彩色圖像的直方圖描述的是不同顏色在整幅圖像中所占的比例,而并不關心每種顏色所處的空間位置。所以顏色

46、直方圖特別適用于描述那些難以自動分割的圖像和不需要考慮物體空間位置的圖像。由于顏色直方圖具有尺度不變性和旋轉不變性,因此被廣泛采用。顏色直方圖是由橫坐標為顏色級別,縱坐標為顏色出現的頻率所繪成的圖形。它是顏色信息的函數,表示圖像中具有相同顏色級別的像素的個數。全局直方圖是一種經常被采用的顏色特征,已在很多圖像檢索系統中得到應用。設C(x,y)為RGB空間一幅彩色圖像,其顏色直方圖的定義為:1, if C(x,y)=k0 , 其他Hc(k)=h(C(x,y) k= 0,1,kh(C(x,y)=其中,M、N為圖像C(x,y)垂直和水平方向上的像素數目,并簡稱為圖像的高和寬;而k為變換空間的顏色數。

47、除此之外,還有如下幾種直方圖法:1、基于分塊顏色直方圖法,采用的分塊方法是把圖像分成單獨的NN塊,并且圖像分塊太大那么失去分塊的意義,不能充分包含顏色的分布信息,分塊太小那么會增加檢索過程的計算量。經試驗比較分析,對二維空間進行33劃分是較有效的劃分方案。2、累加直方圖法:當圖像中的特征并不能取遍所有可取值時,統計直方圖中會出現一些零值。這些零值的出現會對計算直方圖的相交帶來很大影響,從而使得算出的匹配值并不能正確的反映兩圖間的顏色差異。累加直方圖是以顏色作為橫坐標,從坐標原點到該顏色的所有顏色的像素出現的頻數為縱坐標繪出的圖形。3 、局部累加直方圖:在HSI空間里,H=0根本對應紅色,H=p

48、i/3根本對應黃色,H=2pi/3根本對應綠色。這樣在H軸上黃色與紅色間,黃色與綠色間距相等。但從人的視覺感知來講,黃色與紅色間,黃色與綠色間本無所謂哪兩個更相似。這說明色度信號的分布從視覺意義上講,并不滿足累加直方圖應用的前提。所以,對色彩比較復雜的自然景物圖像,一般累加直方圖算法在檢索中就會將不同色度的信號混淆起來。另外,一幅圖像的顏色一般非常多,尤其是真彩色圖像,因此直方圖矢量的維數會非常高。如果能采用局部累加后降維,那么計算量要少得多。統設計中,我們采用Pi/3為區間的長度,將H軸共分成6個不重疊的局部區間60k, 60(k+1),k=0,1,5,通過分別計算每個局部區間的累加直方圖進

49、行檢索。上述方法都保存了顏色在圖像中出現的概率信息,但也喪失了很多顏色的空間信息,因此不同的圖像有可能具有相同顏色特征表示。從劃分局部區域的角度來說可分為:基于固定塊的圖像分割、基于手工的區域分割、采用交互的半自動的區域分割以及一些自動的顏色分割方法。局部區域中的顏色信息可以表示為平均顏色、主顏色、顏色直方圖和二進制顏色集等來表示。顏色直方圖還具有以下性質: 性質一:直方圖中的數值都是統計而來的,描述了該圖像關于顏色的數量特征,可以反映圖像顏色的統計分布和根本色調。 性質二:直方圖喪失了圖像的空間位置特征。因此,不同的圖像可能有相同的顏色分布,從而就具有相同的直方圖。性質三:直方圖具有可疊加性

50、。如果將圖像劃分為假設干子區域,所有子區域的直方圖之和等于全局直方圖。顏色矩Stricker:和Orengo提出了顏色矩的方法33,認為顏色分布信息主要集中在圖像顏色的低階矩中,因此僅采用一階(均值),二階(方差)和三階(斜度)等顏色矩可以很有效地表示圖像中的顏色分布。與顏色直方圖相比,該方法的另一個好處在于無需對特征進行向量化。顏色矩己經成功地應用于許多基于內容的圖像檢索系統(如QBIC)中。圖像的顏色矩一共只需九個分量:三個顏色分量,每個分量上三個低階矩,與它的顏色特征相比是非常簡潔的。但是顏色矩特征的分辨能力較低,一般起到過濾縮小范圍的作用,通常和其它特征結合使用。顏色聚合向量Pass等

51、提出以圖像的顏色聚合矢量CCV(color coherence vector)作為圖像的顏色特征,它是圖像直方圖的一種演變,其核心思想是當圖像中顏色相似的像素所占據的連續區域的面積大于一定的閥值時,該區域中的像素為聚合像素,否那么為非聚合像素,這樣統計圖像所包含的每種顏色的聚合像素和非聚合像素的比率稱為該圖像的顏色聚合矢量,在圖像檢索過程中匹配目標圖像的聚合矢量和檢索圖像的聚合矢量,聚合矢量中的聚合信息在某種程度上保存了圖像顏色的空間信息。令定義為第i個聚合像素,為第j個非聚合像素,那么顏色聚合矢量(CCV)定義為:CCV=(1 ,1), (2, 2),(N , N)可以看出,(1 ,1),

52、(2, 2),(N , N)為圖像的顏色直方圖,由于參加了空間信息,采用顏色聚合向量CCV比采用顏色直方圖檢索的效果要好特別是對于大塊的均勻區域或者圖像中局部為紋理的圖像檢索效果更好。但是同時增大了計算量。3.3圖像特征的相似性匹配在基于文本的檢索方法中采用的是文本的精確匹配,而基于內容的圖像檢索那么是通過計算查詢圖像和圖像庫中候選圖像之間在視覺特征上的相似度匹配進行。因此,定義一個適宜的視覺特征相似度度量方法對檢索的效果有很大的影響。視覺特征大概可以表示成向量的形式,常用的相似度方法也是向量空間模型,即將視覺特征看作是向量空間中的點,通過計算兩個點直接的接近程度來衡量圖像特征間的相似度。常見

53、的方法有:直方圖相交法、直方圖歐氏距離、直方圖余弦距離、二值集hammimg距離、直方圖二次距離度量、二值集二次距離、直方圖Mahalanobis距離。以下只簡要介紹系統中常用的直方圖的交、直方圖歐氏距離兩種距離度量方法。3直方圖相交法度量直方圖距離的一種經典方法就是直方圖相交法。直方圖的相交是指兩個直方圖在每個bin維度中共有的像素數量。具體做法是,根據顏色索引檢索出查詢圖像的顏色直方圖,將其與圖像庫中的每一圖像的直方圖取交集,根據交集的值來選出最正確匹配圖像。在直方圖相交法中,令HQ(K)和HR(K)分別為查詢圖像Q和圖像庫R的特征統計直方圖,那么二者之間的匹配值為:直方圖交集方法能對兩幅

54、圖像進行詳細的比較,然而對于許多合成的圖像,如商標等,它們有大量的一致顏色,三維直方圖只有幾個域的值很高,而其它許多域的顏色信息變化有限。因而,對于這樣的圖像進行過細的比較是不必要的。又由于在掃描圖像時容易產生一些噪音,所以這種過細的比較容易產生錯誤的結果。3歐氏距離方法我們可以利用歐基里德距離公式Euclidean Distance來計算距離。對于兩個 N維直方圖x,y,兩者的歐氏距離可以表示如下: 此距離公式雖然簡單,但是與特定的顏色分布無關,因此我們可以引入相關權值A,這里A是一個維矩陣,此時距離公式可以表述如下: 為了簡化計算,將直方圖x,y標準化使其滿足: 矩陣,權表示顏色i與顏色j

55、之間的相似度。假設取z=x-y,那么有,取定了距離公式后,我們需要確定A的取值,且要保證此矩陣A能夠使,我們用表示顏色i與顏色j在RGB顏色空間的距離。 取。 有 因為.3模糊方法模糊理論是在美國加州大學伯克利分校電氣工程系的L.zadeh教授于1965年創立的模糊集合理論的數學根底上開展起來的,主要包括模糊集合理論、邏輯、模糊推理和模糊控制等方面的內容。他認為所有的自然語言均是模糊的,比方紅的和老的等概念沒有明確的內涵和外延,因而是不明確的和模糊的。可是,特定的環境中,人們用這些概念來描述某個具體對象時卻又能心領神會,很少引起誤解和歧義。模糊控制的根本思想:把人類專家對特定的被控對象或過程的

56、控制策略總結成一系列以IF(條件)THEN(作用)形式表示的控制規那么,通過模糊推理得到控制作用集,作用于被控對象或過程。控制作用集為一組條件語句,狀態語句和控制作用均為一組被量化了的模糊語言集,如正大,負大,正小,負小,零等。模糊集理論是對傳統集合理論的一種推廣,在傳統集合理論中,一個元素或者屬于一個集合,或者不屬于一個集合;而對于模糊集來說,每一個元素都是以一定的程度屬于某個集合,也可以同時以不同的程度屬于幾個集合。對人們現實生活中大量使用的一些含義確定但又不準確的語言表達,比方“今天天氣很熱、“車速過高,需要適當踩剎車等,用模糊數學可以很好的表達。第四章 基于內容的圖像紋理特征提取紋理分

57、析在計算機視覺、模式識別以及數字圖像處理中起著重要的作用。紋理可以用來探測和區分不同的物體和區域、推斷物體的外表方向、研究物體的形狀、區分各種物體所具有的不同的紋理類型。紋理是人眼視覺的重要組成局部,反映了物體的深度和外表信息,表達了物體外表顏色和灰度的某種變化,而這些變化又與物體本身的屬性有關,是圖像的固有特征之一。紋理基元有兩類特征:一類是紋理基元本身的性質,如形狀和大??;另一類特征是紋理基元之間的方向結構關系,如基元的排列方式、疏密、周期性及方向性。這兩類特征的不同,能使圖像的外觀產生極大的改變,同時這兩類特征之間還具有一定的依存關系。這里,我們認為紋理是像素灰度值在空間區域的變化模式。

58、這個定義對于大多數圖像處理過程來說是適宜的,因為很多時候我們只關心圖像的灰度分布。數字圖像中的紋理是相鄰像素的灰度或顏色的空間相關性,或是圖像灰度和顏色隨空間位置變化的視覺表現,使用數學或信息論的方法抽取的紋理度量稱為紋理特征。由于紋理特征可用來對圖像中的空間信息進行一定程度的定量描述,因此也是基于內容的圖像檢索中一個重要手段。它不僅反映圖像的灰度統計信息,而且反映圖像的空間分布信息和結構信息。根據人類視覺的感知,可用來描述紋理的性質有:均勻性(uniformity )、密度(density )、粗細度(coarseness )、粗糙度(roughness )、規律性(regularity )

59、 ,線性度(linearity )、定向性(directionality )、方向性(direction )、頻率(frequency )和相位(phase )。上一章討論的顏色特征無疑是圖像視覺的重要感知特征,但是由于把圖像的綜合信息僅壓縮到某一顏色空間,對于圖像特征信息有時表示能力缺乏,易出現顏色相近而視覺相差甚遠的情況。兩幅顏色分布相近但紋理不同的圖像,語義信息也不同。假設僅按照顏色特征進行檢索勢必會造成檢索準確性的降低。如果引入圖像的紋理特征,在進行相似性檢索時會拉大兩幅圖像的相似性距離,使圖像的檢索結果更精確。統計分析的方法利用紋理的統計特性和規律來描述紋理,它適用于像木紋、砂地、草

60、坪那樣的細而不規那么的自然紋理,也同樣適用于人工紋理,是最早應用在紋理分析中的方法之一。統計方法從根據像素灰度值的統計分析出發,推導出一些統計量表達紋理特征?;叶裙采仃囀敲枋鲈诜较蛏?,相隔S像元距離的一對像元,分別具有灰度值i和j的出現概率,其元素可記為P(i, j)s,)簡記為,。顯然灰度共生矩陣是一個對稱矩陣,其階數由圖像中的灰度級個數決定。假設灰度圖像f(x,y)其灰度級數為L,那么有。灰度共生矩陣的各元素值由下式求得:P(i,j|s,)= ,假設給定如下的僅具有3個灰度級的圖像區域,分別記數符合上述位置算子的像素空間組合的數目形成頻度矩陣,再將其歸一化,即除以符合位置關系的總數就得到

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論