




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第8
章
多媒體數據庫引言8.1多媒體數據庫概述8.1.1傳統的數據庫技術8.1.2多媒體數據庫的特點8.1.3多媒體數據庫的功能8.2多媒體數據庫的管理8.2.1多媒體數據的管理8.2.2多媒體數據庫管理系統的體系結構8.3多媒體數據庫的檢索8.3.1基于文本的多媒體數據庫檢索8.3.2基于內容的多媒體數據檢索技術概述8.3.3基于內容檢索的應用8.3.4多種類型媒體對象檢索的應用本章小結思考與練習引言與數值、字符等格式化數據不同,圖像、音頻、視頻等媒體信息所涉及的是非格式化數據,并且數據量相對龐大,我們一般稱其為多媒體數據。
傳統的數據庫系統在多媒體數據的處理、存儲和檢索上顯得力不從心,因此需要研究和建立一種新型數據庫技術——多媒體數據庫技術。
本章首先介紹了傳統數據庫的一些基本知識,然后介紹了多媒體數據庫涉及的主要內容,最后對多媒體數據庫中的一個重要的研究內容:基于內堂的數據檢索做了介紹。8.1多媒體數據庫概述數據庫(Database)是一個依照某種數據模型,組織、存儲和管理數據的數據集合。數據庫的兩層含義:1.數據庫基本概念是一個實體,能夠合理保管數據的“倉庫”,用戶在“倉庫”中存放要管理的事務數據。是數據管理的新方法和技術,能更合適的組織數據、更方便的維護數據、更嚴密的控制數據和更有效的利用數據。8.1.1傳統的數據庫技術2.數據庫管理數據的特點數據結構化:從全局整體觀點組織數據。描述數據時,既描述數據本身,又描述數據間關系;既考慮某個應用的數據結構,又考慮整個組織的數據結構。數據具有高共享性、低冗余度:通過數據模型和數據控制機制提高數據共享性數據共享可以大大減少數據冗余數據和程序之間獨立性較高指數據的組織和存儲方法與應用程序互不依賴、彼此獨立包括物理數據的獨立性和邏輯數據的獨立性兩個方面。2.數據庫管理數據的特點數據的安全性和完整性較高數據庫系統通過數據保護措施防止數據破壞。數據庫系統能提供完整性檢查。數據可以并發使用并能保證數據的一致性數據庫系統提供并發機制和協調機制,允許在同一時間內,多個用戶同時對數據實現多路存取,而不產生任何沖突,數據不遭到破壞。數據庫的故障恢復提供一套方法及時發現故障和修復故障,從而防止數據不被丟失或破壞。數據庫的運行管理功能:核心功能,包括:多用戶環境下的并發控制安全性檢查和存取限制完整性條件檢查和執行運行日志組織管理事務管理和自動恢復等數據庫操作功能:數據操作語言DML可進行增刪改查等操作數據定義功能:DBMS提供數據定義語言DDL提供建庫機制,可建立和修改庫結構、存儲結構、數據間聯系,定義數據的完整性約束條件和保證完整性的觸發機制等。3.數據庫管理系統的主要功能數據庫維護功能:包括:數據庫數據的載入、轉儲和恢復,數據庫的維護及數據庫的功能、性能分析和檢測等。數據庫通信功能:與操作系統的聯機處理、分時系統及遠程作業輸入的相關接口負責處理數據的傳送與網絡中其他軟件的通信以及數據庫之間的互操作3.數據庫管理系統的主要功能表示數據之間聯系的方法。先后經歷了層次模型、網狀模型、關系模型和面向對象模型等階段目前關系模型在實際應用中處于主導地位,而面向對象模型估計在不久的將來將會得到廣泛的應用。4.數據模型滿足以下條件:有且僅有一個結點無父結點,這個結點稱為根結點。除根結點之外,其他結點有且僅有一個父結點。層次模型滿足以下條件:允許一個以上的結點無父結點。一個結點可以有多個父結點。網狀模型數據:二維表中的元素,表格中每一行稱作一個元組,相當于一個記錄值;列:屬性值集,列的名字稱為屬性名。關鍵字(Key):能夠唯一識別一個元組的屬性。關系模型多媒體數據的數據量大,數據差異也大。媒體種類多,且每種媒體數據在又演變出幾十種不同的媒體格式。多媒體數據具有模糊性。難以表達和描述。多媒體數據的分布性。多媒體事務的處理時間比傳統事務要長。不同應用系統對多媒體數據的傳輸、表現和存儲方式的質量要求不一樣。多媒體信息涉及的版本眾多,包括歷史版本和選擇版本。數據量大,8.1.2多媒體數據庫的特點1.多媒體數據的特點需要設計合適的數據庫的組織和存儲方法。多種媒體類型增加了數據處理的困難。數據庫的多解查詢。用戶接口的支持。多媒體信息的分布性影響多媒體數據庫體系。數據庫應增加處理長事務的能力。
對于不同應用的不同的服務質量的要求,要根據的情況進行控制。版本控制的問題。2.多媒體數據對數據庫的影響8.1.3多媒體數據庫的功能能表達和處理多種復雜的數據類型。存儲技術具有數據壓縮和解壓等新功能。有能組織和管理各種媒體數據的特征和集成機制的時空關聯的方法。強調物理數據、邏輯數據和媒體數據獨立性。提供比傳統數據庫更強大的操作。提供網絡分布式數據功能。具有開放功能。提供事務和版本管理功能。多媒體數據庫的恢復和安全機制功能。8.2多媒體數據庫的管理8.2.1多媒體數據的管理實現多媒體數據管理的三種途徑:1、擴充關系數據庫2、面向對象數據庫方式3、基于超文本和超媒體方式1.擴充關系數據庫主要有三種:擴展現有的數據類型。增加一種大二進制對象BLOB(BinarylargeObject)字段來支持對多媒體數據對象的存取。擴充用戶自定義的數據類型允許用戶自定義一個抽象數據類型作為另一關系的列的值,而不僅僅是采用系統己定義的數據類型。擴充嵌套語義,采用NF2數據模型
2.面向對象數據庫方式更接近人類思維方式。面向對象數據模式語義豐富,具有很強的抽象能力,具有良好的可擴充性,可以很好地滿足復雜的多媒體對象的各種表示需求。以非線性的信息組織方來管理多媒體對象,較符合人們的思維方式,較適合制作電子文檔或電子出版物,但不適合一般用戶的資料管理。3.基于超文本和超媒體的方式8.2.2多媒體數據庫管理系統的體系結構針對每一種媒體建立一個獨立的數據庫管理系統;這些數據庫通過相互通信來協調和執行相應操作;對每種多媒體數據的管理是分開的。缺陷:當多種媒體的聯合操作時,增加了用戶的負擔。如果各種媒體數據庫設計時沒有按照標準化的原則進行,他們之間的通信和使用都會產生問題。1.組合型多媒體數據庫結構各種類型的媒體統一建模,只用一個單一的多媒體數據庫進行管理,并只用一個多媒體數據庫管理系統對這些媒體信息進行操作,各種用戶需求被統一到一個多媒體用戶接口上,多媒體的查詢檢索結構可以統一表現。缺陷:目前還沒有一個比較恰當而且高效的方法來管理所有的多媒體數據,因此很難實現。2.集中型多媒體數據庫結構多個數據庫管理系統組成的,每個數據庫管理系統之間沒有主從之分,只要求系統中每個數據庫管理系統能諧調地工作。缺陷:通信中必須首先解決每個成員多媒體數據庫系統的差異。3.協作型多媒體數據庫結構適合網絡環境下的工作。系統對每一種媒體的操作各用一個服務器來實現,所有服務的綜合和操作也用一個服務器完成,與用戶的接口采用客戶進程實現。客戶與服務器之間通過特定的中間系統連接。缺陷:要對服務器和客戶進行仔細的規劃和統一的考慮,采用標準化和開放的接口界面。4.客戶機-服務器型多媒體數據庫結構8.3多媒體數據庫的檢索8.3.1基于文本的多媒體數據庫檢索利用人工對多媒體信息進行分析,并抽取反映該多媒體數據的物理特性和內容特性的文本信息;對這些文本信息按照學科領域分類,或用關鍵字標引,并建立類似于文本文獻的標引著錄數據庫。用戶則通過輸入關鍵字,匹配查詢(關鍵字)和多媒體信息的注釋來搜索相關數據。1.基于文本的多媒體數據庫檢索流程利用文件擴展名和超文本標識。將多媒體文件名和文字解說中帶有的媒體信息作為關鍵詞。多媒體所在網頁的標題或多媒體數據附近的文本。人工選擇或指定的某些多媒體信息內容的關鍵詞。2.檢索途徑優點:利用關鍵字匹配的多媒體檢索技術成熟,查詢效率高。缺點:人工注釋工作量大,在海量系統中幾乎是不現實的;支持的查詢復雜程度完全取決于人工標注的詳盡程度,會出現同一對象描述程度不一的情況;人工標注信息帶有很大的主觀性;文本描述無法完全揭示和表達多媒體信息的實質內容和語義之間的關系,難以充分揭示和描述多媒體數據中有代表性的特征;對于實時廣播流媒體,人工處理是完全不可行的3.基于文本檢索的優缺點“內容”的概念:概念級內容:表達對象的語義,一般用文本形式來描述,通過分類和目錄來組織層次瀏覽,用鏈來組織上下文關聯。感知特征:視覺特征,聽覺特征等。邏輯關系:音頻、視頻對象的時間和空間關系,語義和上下文關聯等。信號特征:通過信號處理方法獲得的明顯的媒體區分特征。特定領域的特征:與應用相關的媒體特征。8.3.2基于內容的多媒體檢索技術概述特征抽取系統。將用戶或系統標明的媒體對象的特征提取出來。可由人工或系統自動完成;可以是全局性的或針對某個目標的。查詢系統。以示例查詢的方式向用戶提供檢索接口。主要是相似性檢索。1.基于內容檢索系統的體系結構(1)提交查詢要求。(2)相似性匹配。(3)返回候選結果。(4)特征調整。2.基于內容檢索的過程(1)模式識別法用戶在查詢請求中給定圖像、聲音或視像數據,系統用模式識別技術,把該媒體對象與多媒體數據庫中存儲的同類媒體對象進行逐個匹配。(2)特征描述法給每個媒體對象附上一個特征描述數據,用這種特征描述來表達媒體數據的內容。關鍵問題是如何獲取這種特征描述數據。(3)特征向量法用圖像壓縮技術對圖像進行分解并向量化。3.基于內容的檢索方法直接從媒體內容中提取信息線索。基于內容的檢索是一種近似匹配,這一點與常規數據庫檢索的精確匹配方法有明顯不同,基于內容的檢索只能是一種相似度的檢索。在應用中要換取其他性能的提高(比如檢索速度),因此不要求查詢結果一定是多媒體數據庫中滿足相似度和檢索結果集合大小限制的所有對象,而允許有所遺漏。特征提取和索引建立可由計算機自動實現,避免了人工描述的主觀性,也大大減少了工作量。4.基于內容檢索的特點關鍵技術顏色特征的提取顏色特征表達方法有顏色直方圖、顏色矩、顏色集、顏色聚合向量以及顏色相關圖等,而顏色直方圖是最常用一種方法。紋理特征的提取紋理特征的提取方法主要有結構分析方法、統計分析方法和頻譜分析方法。形狀特征的提取形狀表示:基于邊界的和基于區域的。前者典型方法是傅立葉描述子;后者典型方法有不變矩等。8.3.3基于內容檢索的應用1.基于內容的圖像檢索關鍵技術(1)鏡頭分割技術通過對鏡頭邊界的檢測將視頻分割為各個獨立的鏡頭。主要有基于全局特征的切變檢測、基于局部特征的切變檢測以及閩值法、光流法和模型法漸變檢測法。(2)關鍵幀提取技術有基于鏡頭邊界、基于圖像信息、基于運動分析、基于某種聚類算法等各種方法。(3)動態特征提取技術利用攝像機操作的表示來查詢鏡頭,可以利用運動方向和幅度特征來檢索運動的主體目標。2.基于內容的視頻檢索分類:(1)語音檢索。語音檢索技術主要包括①基于關鍵詞檢出技術的語音檢索。②基于大詞表連續語音識別技術的語音檢索。③基于子詞基元的語音檢索。④基于說話人的語音檢索技術。(2)音樂檢索。可以采用哼唱、節拍拍打、演奏輸入、樂譜錄入等多種方式提交查詢請求進行檢索。(3)音頻例子檢索。可以分為兩種:一種是將某類音頻用一個模板表示出來,對于用戶提交查詢的音頻例子,先使用模板去進行匹配,判斷其屬于模板,然后將這類模板對應的音頻例子按序反饋給用戶;另一種是對每個音頻例子建立模板,然后進行相似匹配。3.基于內容的音頻檢索查詢結果既能反映語義層次上的相似性,而能體
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 企業電子買賣合同樣本
- 農村集體場地租賃合同樣本
- 農村房屋贈送合同標準文本
- 供熱 bot 合同樣本
- 團隊創意思維的激發計劃
- 公司辦公維修合同樣本
- 關于學校保潔合同范例
- 公司購買設備合同樣本
- 中介公司用人合同樣本
- 中央空調工程合同樣本
- 阿拉善盟社區工作者招聘真題2024
- 北京2025年北京市農林科學院招聘43人筆試歷年參考題庫附帶答案詳解
- 2025年廣州市勞動合同范本下載
- 2025山西地質集團招聘37人筆試參考題庫附帶答案詳解
- 2025年北大荒黑龍江建三江水利投資有限公司招聘筆試參考題庫附帶答案詳解
- 靈活運用知識的2024年ESG考試試題及答案
- 國家藥品監督管理局直屬單位招聘考試真題2024
- 2025年梅河口康美職業技術學院單招職業技能考試題庫必考題
- 浙江省麗水市2024-2025學年高二上學期期末教學質量監控英語試題【含答案】
- 遼寧省七校協作體2024-2025學年高二下學期3月聯考地理試題(原卷版+解析版)
- 基于三新背景下的2025年高考生物二輪備考策略講座
評論
0/150
提交評論