第8章-數字圖像壓縮編碼_第1頁
第8章-數字圖像壓縮編碼_第2頁
第8章-數字圖像壓縮編碼_第3頁
第8章-數字圖像壓縮編碼_第4頁
第8章-數字圖像壓縮編碼_第5頁
已閱讀5頁,還剩82頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

多媒體通信北京科技大學楊揚第8章圖像壓縮編碼圖像數據壓縮基礎圖像壓縮編碼算法靜態圖像壓縮標準動態圖像壓縮標準H.26X標準1、圖像數據壓縮基礎色彩的基本概念彩色空間及其變換圖像數據壓縮的可能性1.1色彩的基本概念從人的視覺系統看,色彩可用色調、飽和度和亮度來描述。人眼看到的任一彩色光都是這三個特性的綜合效果,這三個特性可以說是色彩的三要素。其中:色調與光波的波長有直接關系;亮度和飽和度與光波的幅度有關。1.1色彩的基本概念—色調繪畫中要求有固定的色彩感覺,有統一的色調,否則難以表現畫面的情調和主題。例如我們說一幅畫具紅色調,是指它在色彩上總體偏紅。計算機在圖像處理上采用數字化,可以非常精確地表現色彩的變化,色調是相對連續變化的。用一個圓環來表現色譜的變化,就構成了一個色彩連續變化的色環。1.1色彩的基本概念—亮度亮度可以說是指各種純正的色彩相互比較所產生的明暗差別。在純正光譜中,黃色的明度最高,顯得最亮;其次是橙、綠;再其次是紅、藍;紫色明度最低,顯得最暗。1.1色彩的基本概念—飽和度飽和度是指顏色色調的表現程度。飽和度越高,色彩越艷麗、越鮮明突出,越能發揮其色彩的固有特性。但飽和度高的色彩容易讓人感到單調刺眼。飽和度低,色感比較柔和協調,可混色太雜則容易讓人感覺渾濁,色調顯得灰暗。對于同一色調的彩色光,飽和度越深,顏色越鮮明或說越純,相反則越淡。1.1色彩的基本概念視覺系統對顏色和亮度的響應特性1.1色彩的基本概念—圖像深度與色彩類型圖像深度是指位圖中記錄每個像素點所占的位數,它決定了彩色圖像中可出現的最多顏色數,或者灰度圖像中的最大灰度等級數。

每個像素點的圖像深度的分配還與圖像所用的色彩空間有關。以最常用的RGB色彩空間為例,圖像深度與色彩的映射關系主要有真彩色、偽彩色和調配色。1.1色彩的基本概念—圖像深度與色彩類型真彩色(true-color)是指圖像中的每個像素值都分成R、G、B三個基色分量,每個基色分量直接決定其基色的強度,這樣產生的色彩稱為真彩色。例如圖像深度為24,用R:G:B=8:8:8來表示色彩,則R、G、B各占用8位來表示各自基色分量的強度,每個基色分量的強度等級為28=256種。圖像可容納224=16M種色彩。這樣得到的色彩可以反映原圖的真實色彩,故稱真彩色。1.1色彩的基本概念—圖像深度與色彩類型偽彩色(pseudo-color)圖像的每個像素值實際上是一個索引值或代碼,該代碼值作為色彩查找表CLUT(ColorLook-UpTable)中某一項的入口地址,根據該地址可查找出包含實際R、G、B的強度值。用這種方式產生的色彩本身是真的,不過它不一定反映原圖的色彩。在VGA顯示系統中,調色板就相當于色彩查找表。從16色標準VGA調色板的定義可以看出這種偽彩色的工作方式。1.1色彩的基本概念—圖像深度與色彩類型調配色(direct-color)的獲取是通過每個像素點的R、G、B分量分別作為單獨的索引值進行變換,經相應的色彩變換表找出各自的基色強度,用變換后的R、G、B強度值產生的色彩。1.2圖像編碼概述能夠對多媒體數據進行壓縮編碼的前提是因為數據存在大量的冗余,尤其是聲音和圖像。數據壓縮的目的就是盡可能消除這些冗余。冗余一般分以下幾類:統計冗余(空間冗余和時間冗余)信息熵冗余結構冗余知識冗余視覺冗余1.2圖像編碼概述—統計冗余圖像數據存在大量的統計特征的重復,這種重復包括靜態單幀圖像數據在空間上的冗余和音頻、視頻數據在時間上的冗余。

在動態圖像序列中,前后兩幀圖像之間具有較大的相關性,表現出幀與幀之間的重復,因而存在時間冗余。1.2圖像編碼概述—信息熵冗余信息熵定義為一組數據所表示的信息量,即

式中,E為信息熵,N為數據的種類(或稱碼元)個數,pi為第i個碼元出現的概率。一組數據的數據量顯然等于各記錄碼元的二進制位數(即編碼長度)與該碼元出現的概率乘積之和,即

式中,D為數據量,為第i個碼元的二進制位數。一般取b0=b1=…bN-1(如ASCII編碼把所有碼元都編碼為7比特),這樣得到的D必然大于E。這種因碼元編碼長度的不經濟帶來的冗余稱為信息熵冗余或編碼冗余。1.2圖像編碼概述—結構冗余有些圖像從大面積上或整體上看存在著重復出現的相同或相近的紋理結構,例如布紋圖像和草席圖像,被稱為結構冗余。1.2圖像編碼概述—知識冗余有許多圖像的理解與圖像所表現內容的基礎知識(先驗或背景知識)有相當大的相關性,從這種知識出發可以歸納出圖像的某種規律性變化,這類冗余稱為知識冗余。知識冗余的一個典型例子是對人像的理解,比如,鼻子上方有眼睛,鼻子又在嘴的上方等。1.2圖像編碼概述—視覺冗余人類的視覺系統實際上只在一定程度上對圖像的變化產生敏感,即圖像數據中存在著大量人類視覺覺察不到的細節。事實上,人類視覺系統的一般分辨力為64灰度級,而一般圖像量化采用的是256灰度級,這類冗余稱為視覺冗余。1.2圖像編碼概述—幾種常見應用的碼率1.3圖像編碼的方法根據編碼過程中是否存在信息損耗可將圖像編碼分為有損壓縮和無損壓縮。無損壓縮無信息損失,解壓縮時能夠從壓縮數據精確地恢復原始圖像;有損壓縮不能精確重建原始圖像,存在一定程度的失真。根據編碼原理可以將圖像編碼分為熵編碼、預測編碼、變換編碼和混合編碼等。1.3圖像編碼的方法(1)熵編碼。熵編碼是純粹基于信號統計特性的編碼技術,是一種無損編碼。熵編碼的基本原理是給出現概率較大的符號賦予一個短碼字,而給出現概率較小的符號賦予一個長碼字,從而使得最終的平均碼長很小。常見的熵編碼方法有行程編碼(RunLengthEncoding)、哈夫曼編碼和算術編碼。1.3圖像編碼的方法(2)預測編碼。預測編碼是基于圖像數據的空間或時間冗余特性,用相鄰的已知像素(或像素塊)來預測當前像素(或像素塊)的取值,然后再對預測誤差進行量化和編碼。預測編碼可分為幀內預測和幀間預測,常用的預測編碼有差分脈碼調制(DifferentialPulseCodeModulation,DPCM)和運動補償法。1.3圖像編碼的方法(3)變換編碼。變換編碼通常是將空間域上的圖像經過正交變換映射到另一變換域上,使變換后的系數之間的相關性降低。圖像變換本身并不能壓縮數據,但變換后圖像的大部分能量只集中到少數幾個變換系數上,采用適當的量化和熵編碼就可以有效地壓縮圖像。(4)混合編碼。混合編碼是指綜合了熵編碼、變換編碼或預測編碼的編碼方法,如JPEG標準和MPEG標準。1.3圖像編碼的方法根據對壓縮編碼后的圖像進行重建的準確程度,可將常用的圖像編碼方法分為三類:(1)信息保持編碼:也稱無失真編碼,它要求在編解碼過程中保證圖像信息不丟失,從而可以完整地重建圖像。信息保持編碼的壓縮比較低,一般不超過3:1,主要應用在圖像的數字存儲方面,常用于醫學圖像編碼中。1.3圖像編碼的方法(2)保真度編碼:主要利用人眼的視覺特性,在允許的失真(Lossy)條件下或一定的保真度準則下,最大限度地壓縮圖像。保真度編碼可以實現較大的壓縮比,主要用于數字電視技術、靜止圖像通信、娛樂等方面。對于這些圖像,過高的空間分辨率和過多的灰度層次,不僅增加了數據量,而且人眼也接收不到。因此在編碼過程中,可以丟掉一些人眼不敏感的信息,在保證一定的視覺效果條件下提高壓縮比。

1.3圖像編碼的方法(3)特征提取:在圖像識別、分析和分類等技術中,往往并不需要全部圖像信息,而只要對感興趣的部分特征信息進行編碼即可壓縮數據。例如,對遙感圖像進行農作物分類時,就只需對用于區別農作物與非農作物,以及農作物類別之間的特征進行編碼,而可以忽略道路、河流、建筑物等其他背景信息。1.4圖像編碼的新技術圖像編碼已經發展了幾十年,人們不斷提出新的壓縮方法。如,利用人工神經網絡(ArtificialNeuralNetwork,ANN)的壓縮編碼、分形編碼(FractalCoding)、小波編碼(WaveletCoding)、基于對象的壓縮編碼(ObjectBasedCoding)和基于模型的壓縮編碼(ModelBasedCoding)等等1.4圖像編碼的新技術1)分形編碼分形編碼是在波蘭美籍數學家B.B.Mandelbrot建立的分形幾何理論的基礎上發展起來的一種編碼方法。分形編碼最大限度地利用了圖像在空間域上的自相似性(即局部與整體之間存在某種相似性),通過消除圖像的幾何冗余來壓縮數據。M.Barnsley將迭代函數系統(IterateFunctionSystem,IFS)用于描述圖像的自相似性,并將其用于圖像編碼,對某些特定圖像獲得了10000:1的壓縮比。分形編碼過程十分復雜,而解碼過程卻很簡單,故通常用于對圖像編碼一次,而需譯碼多次的信息傳播應用中。1.4圖像編碼的新技術

2)小波編碼1989年,S.G.Mallat首次將小波變換用于圖像編碼。經過小波變換后的圖像,具有良好的空間方向選擇性,而且是多分辨率的,能夠保持原圖像在各種分辨率下的精細結構,與人的視覺特性十分吻合。1.4圖像編碼的新技術3)模型編碼模型編碼是近幾年發展起來的一種很有前途的低比特率編碼方法,其基本出發點是在編、解碼兩端分別建立起相同的模型,編碼時利用先驗模型抽取圖像中的主要信息并用模型參數的形式表示,解碼時則利用所接收的模型參數重建圖像。1.4圖像編碼評價隨著眾多圖像壓縮算法的出現,如何評價圖像壓縮算法就成為重要的課題。一般說來,評價圖像壓縮算法的優劣主要有以下4個參數。

1)算法的編碼效率算法的編碼效率通常有幾種表現形式:平均碼字長度(R),圖像的壓縮比(rate,r),每秒鐘所需的傳輸比特數(bitspersecond,bps),圖像熵與平均碼長之比(η),這些表現形式很容易相互轉換。下面給出與圖像編碼效率有關的幾個定義。1.4圖像編碼評價

設一幅灰度級為N的圖像,圖像中第k級灰度出現的概率為Pk,圖像大小為Nx×Ny,每個像素用d比特表示,每兩幀圖像間隔Δt,則按信息論中信息熵的定義,數字圖像的熵H由下式定義:

由此可見,圖像熵H表示各灰度級比特數的統計平均值。1.4圖像編碼評價對于一種圖像編碼方法,設第k級灰度的碼字長度為Bk,則該圖像的平均碼字長度R為

1.4圖像編碼評價于是,可定義編碼效率η為每秒鐘所需的傳輸比特數bps為1.4圖像編碼評價

壓縮比r為

由于同一壓縮算法對不同圖像的編碼效率會有所不同,因此常需定義一些“標準圖像”,如國際上流行的三幅圖像Lena、Barbara和Mandrill。一般通過測量不同壓縮算法對同一組“標準圖像”的編碼性能來評價各圖像壓縮算法的編碼效率。1.4圖像編碼評價

2)編碼圖像的質量圖像質量評價可分為客觀質量評價和主觀質量評價。最常用的客觀質量評價指標是均方誤差(MSE)和峰值信噪比(PSNR),其定義如下:

1.4圖像編碼評價

主觀質量評價是指由一批觀察者對編碼圖像進行觀察并打分,然后綜合所有人的評判結果,給出圖像的質量評價。客觀質量評價能夠快速有效地評價編碼圖像的質量,但符合客觀質量評價指標的圖像不一定具有較好的主觀質量。主觀質量評價能夠與人的視覺效果相匹配,但其評判過程緩慢費時。1.4圖像編碼評價

3)算法的適用范圍特定的圖像編碼算法具有其相應的適用范圍,并不對所有圖像都有效。一般說來,大多數基于圖像信息統計特性的壓縮算法具有較廣的適用范圍,而一些特定的編碼算法的適用范圍較窄,如分形編碼主要用于自相似性高的圖像。1.4圖像編碼評價

4)算法的復雜度算法的復雜度即指完成圖像壓縮和解壓縮所需的運算量和硬件實現該算法的難易程度。優秀的壓縮算法要求有較高的壓縮比,壓縮和解壓縮快,算法簡單,易于硬件實現,還要求解壓縮后的圖像質量較好。選用編碼方法時一定要考慮圖像信源本身的統計特性、多媒體系統(硬件和軟件產品)的適應能力、應用環境以及技術標準。2.1圖像壓縮編碼算法—行程長度編碼把一系列的重復值(例如圖像象素的灰度值)用一個單獨的值再加上一個計數值來取代。

比如有這樣一個字母序列aabbbccccccccdddddd它的行程長度編碼就是2a3b8c6d。

很多位圖文件格式都用行程長度編碼,例如TIFF,PCX。2.1圖像壓縮編碼算法—行程長度編碼例如:有一線狀圖像,其灰度隨長度坐標的關系如下圖所示。描述這個一維圖像可以用順序的七個3bit的二進制數表示:011,011,011,011,101,101,101,共21比特。

如果用行程編碼方法對其編碼,其編碼就變成了100,011;011,101,共用了12比特,比前一種編碼節約了9個比特。2.2圖像壓縮編碼算法—哈夫曼編碼

基本思路:出現頻率越高的符號,對應的編碼長度越短編碼步驟如下:統計信源符號出現的概率;將信源符號按概率遞減順序排列;

把兩個最小的概率值加起來,作為一個新組合符號的概率;重復步驟(2)、(3),直到概率和達到1為止;在每次合并信源時,將合并的信源分別標記“1”和“0”(例如,概率小的標記為“1”,概率大的標記為“0”);尋找從每一信源符號到概率為1的路徑,記錄下路徑上的“1”和“0”;對每一符號寫出“1”和“0”序列;2.2圖像壓縮編碼算法—哈夫曼編碼考慮信源:進行哈夫曼編碼的過程如下:編碼前:平均碼長為3編碼后:平均碼長為2.45壓縮比:2.45/32.2圖像壓縮編碼算法—哈夫曼編碼哈夫曼編碼的不足:它必須精確地統計出原始文件中每個值的出現頻率,如果沒有這個精確統計,壓縮的效果就會大打折扣,甚至根本達不到壓縮的效果。因此哈夫曼編碼通常要經過兩遍操作,第一遍進行統計,第二遍產生編碼,所以編碼的過程是比較慢的。另外由于各種長度的編碼的譯碼過程也比較復雜,因此解壓縮的過程也比較慢。它對于位的增刪比較敏感。

2.2圖像壓縮編碼算法—辭典編碼辭典編碼是一種通用編碼技術,屬于無損壓縮技術。—辭典編碼的思想辭典編碼的根據是數據本身包含的重復代碼,如文本文件和光柵圖像就具有這種特性。辭典編碼歸納起來有兩類。第一類辭典編碼的想法是:查找壓縮的字符序列是否在以前輸入的數據中出現過,然后用已經出現過的字符串代替重復的部分,它的輸出僅僅是指向早期出現過的字符串的“指針”。2.2圖像壓縮編碼算法—辭典編碼第二類算法的思想是,從輸入的數據中創建一個“短語辭典”,編碼數據過程中,遇到已經在辭典中出現的“短語”時,編碼器就輸出這個詞典中該短語的“索引號”,而不是短語本身。J.Ziv和A.Lempel在1978年首次發表了介紹這種編碼的文章,在他們研究的基礎上,TerryA.Weltch在1984年發表了改進這種編碼算法的文章,因此這種編碼方法稱為LZW壓縮編碼。2.3圖像壓縮編碼算法—LZW編碼LZW(Lempel-Ziv&Welch)編碼又稱字串表編碼,屬于一種無損編碼,是Welch將Lempel和Ziv所提出的無損壓縮技術改進后的壓縮方法。LZW編碼的基本思想是:在編碼過程中,將所遇到的字符串建立一個字符串表,表中的每個字符串都對應一個索引,編碼時用該字符串在字串表中的索引來代替原始的數據串。2.3圖像壓縮編碼算法—LZW編碼例如,一幅8位的灰度圖像,我們可以采用12位來表示每個字符串的索引,前256個索引用于對應可能出現的256種灰度,由此可建立一個初始的字符串表,而剩余的3840個索引就可分配給在壓縮過程中出現的新字符串,這樣就生成了一個完整的字符串表,壓縮數據就可以只保存它在字符串表中的索引,從而達到壓縮數據的目的。字符串表是在壓縮過程中動態生成的,不必將它保存在壓縮文件里,因為解壓縮時字符串表可以由壓縮文件中的信息重新生成。2.4圖像壓縮編碼算法—算術編碼算術編碼在圖像數據壓縮標準(如JPEG,JBIG)中扮演了重要的角色。在算術編碼中,消息用0到1之間的實數進行編碼,算術編碼用到兩個基本的參數:符號的概率和它的編碼間隔。信源符號的概率決定壓縮編碼的效率,也決定編碼過程中信源符號的間隔,而這些間隔包含在0到1之間。編碼過程中的間隔決定了符號壓縮后的輸出。2.4圖像壓縮編碼算法—算術編碼算法舉例假設信源符號為{00,01,10,11},這些符號的概率分別為{0.1,0.4,0.2,0.3},根據這些概率可把間隔[0,1)分成4個子間隔:[0,0.1),[0.1,0.5),[0.5,0.7),[0.7,1),二進制消息序列的輸入為:10001100101101算術編碼過程如下頁圖所示:2.4圖像壓縮編碼算法—算術編碼3、靜態圖像壓縮標準JPEGJPEG20003、靜態圖像壓縮標準JPEG是國際標準化組織(ISO)和國際電報電話咨詢委員會(CCITT)關于靜止圖像編碼的聯合專家組(JointPhotographicExpertsGroup)名稱的縮寫。該標準可用于自然景象或任何連續色調圖像的數字數據的壓縮編碼和解碼。對于數字化精度為每種彩色分量每個樣點4至16比特的數字圖像有良好的壓縮效果,但不適用于二值圖像。3、靜態圖像壓縮標準JPEG標準綜合了多年來圖像壓縮編碼的研究成果,是一種集大成的算法。該標準規定了兩種工作方式,即順序方式和漸進方式;還規定了三種級別的編碼算法,即基本系統(Baselinesystem)、擴展系統(Extendedsystem)和無失真系統(Losslesscoding)。3.1JPEGJPEG是面向靜態圖像編碼的國際標準。在相同圖像質量條件下,JPEG文件擁有比其他圖像文件格式更高的壓縮比。JPEG目前被廣泛應用于多媒體和網絡程序中,是現今萬維網中使用最廣泛的兩種圖像文件格式之一。JPEG是一種有損壓縮,即在壓縮過程中會丟失數據,每次編輯JPEG圖像后,圖像就會被重復壓縮一次,損失就會有所增加。3.1JPEG順序(Sequential)方式:從左到右、從上到下對圖像順序進行基于離散余弦變換(DCT)的編碼。DCT理論上是可逆的,但在計算時存在誤差,因而基于DCT的編碼模式是一種有損編碼。3.1JPEG漸進方式(Progressivemode):整個圖像首先以一種低于最終質量要求的質量標準(如分辨率或數據精度)進行編碼,完成后再以較上次高一級的質量要求再進行一次編碼,但僅傳送為改善質量所需增加的那部分信息。這種過程可以重復若干次直至達到所需的最終質量要求。每個子過程中的編碼則還是順序方式的。3.1JPEG---基本系統以離散余弦變換為核心,采用順序工作方式,適用于一般精度(每種分量每個樣點8比特)的圖像,有良好的壓縮效果,壓縮比可調。標準規定,每個JPEG靜止圖像壓縮編解碼器都必須具有實現基本系統的功能。3.1JPEG---基本系統流程基本系統3.1JPEG---基本系統流程通過離散余弦變換減少圖像數據的相關性;利用人眼視覺特性對系數進行自適應量化;對每個子塊量化后的系數矩陣進行Z形掃描,將系數矩陣變換成符號序列;用哈夫曼變長碼對符號進行熵編碼。3.1JPEG---基本系統流程Z形掃描3.1JPEG---漸近方式漸進方式的基本實現有三種方式(1)頻譜選擇法,即按Z形掃描的序號將DCT量化序數分成幾個頻段,每個頻段對應一次掃描,每塊均先傳送低頻掃描數據,得到原圖概貌,再依次傳送高頻掃描數據,使圖像逐漸清晰;(2)逐次逼近法,即每次掃描全部DCT量化序數,但每次的表示精度逐漸提高。(3)階梯方式,圖像以數種分辨率來壓縮,其目的是為了讓具有高分辨率的圖像也可以在較低分辨率的設備上顯示。3.1JPEG---壓縮效果采用JPEG算法所能達到的壓縮效果,與被壓縮圖像的特性有關。對于在開發和測試本算法標準時所用的那些內容是彩色自然景物和人像的測試圖片,壓縮到0.15比特/像素時,圖像可識別;0.25比特/像素時,解碼后的圖像可評價為“有用(usefulimage)”;約0.75比特/像素時,被認為是“極佳(verygood)”;大約1.5比特/像素時基本上與原圖像無法區別。用無失真算法對這些測試圖片進行壓縮編碼,大致可以得到2:1的壓縮比。3.2JPEG2000JPEG2000的核心JPEG2000的優勢JPEG2000的應用3.2JPEG2000---核心放棄了JPEG所采用的以離散余弦變換算法為主的區塊編碼方式,而改用以離散小波變換算法為主的多解析編碼方式。JPEG2000還將彩色靜態畫面采用的JPEG編碼方式、2值圖像采用的JBIG(JointBinaryImageGroup)編碼方式及低壓縮率采用JPEGLS統一起來,成為對應各種圖像的通用編碼方式。3.2JPEG2000---優勢高壓縮率無損壓縮漸進傳輸感興趣區域壓縮3.2JPEG2000---應用目前,支持JPEG2000的軟件已經出現,如LuraWaveSmartCompressFreewareforWindows為ACDSee3.0提供JPEG2000LWF格式的外掛插件,這樣只要安置了這個插件就可以觀看和制作采用JPEG2000編碼的LWF格式文件。在不久的將來,JPEG2000無論是在傳統的JPEG市場(如數碼相機、掃描儀等)還是在新興應用領域(如網路傳輸、無線通訊、醫療影像等)都將大有用武之地。4、動態圖像壓縮標準MPEG是運動圖像專家組(MotionPictureExpertsGroup)的縮寫,是國際標準化組織中IEC/JTC1/SC2/WG11的一個小組。MPEG下分三個小組:視頻組(MPEG-Video)的任務是研究壓縮傳輸速度上限為1.5Mbps的視頻信號;音頻組(MPEG-Audio)的任務是研究壓縮每信道64、128和192Kbps的數字音頻信號;系統組(MPEG-System)則解決多道壓縮視頻、音頻位流的同步及合成問題。

MPEG委員會的工作始于1988年,1990年制訂出標準草案。兩年中MPEG工作參加單位由15家發展到150家。MPEG工作一開始就兼顧JPEG標準,CCITT的H.261標準,支持這兩個標準的優秀成果。4、動態圖像壓縮標準MPEG標準主要有以下五個,MPEG-1、MPEG-2、MPEG-4、MPEG-7及MPEG-21等。MPEG標準的視頻壓縮編碼技術主要利用了具有運動補償的幀間壓縮編碼技術以減小時間冗余度,利用DCT技術以減小圖象的空間冗余度,利用熵編碼則在信息表示方面減小了統計冗余度。這幾種技術的綜合運用,大大增強了壓縮性能。4、動態圖像壓縮標準MPEG-1標準于1992年正式出版,標準的編號為ISO/IEC11172,其標題為“碼率約為1.5Mb/s用于數字存貯媒體活動圖象及其伴音的編碼”。MPEG-2標準于1994年公布,包括編號為13818-1系統部分、編號為13818-2的視頻部分、編號為13818-3的音頻部分及編號為13818-4的符合性測試部分。該標準希望囊括數字電視、圖象通信各領域的編碼標準。MPEG-4是基于內容的壓縮編碼標準。MPEG-7是“多媒體內容描述接口標準”。MPEG-21是有關多媒體框架的協議。4.1MPEG-1標準MPEG-1標準叫作“運動圖像和伴隨聲音的編碼—用于速率約在1.5Mb/s以下的數字存儲媒體”,主要用于多媒體存儲與再現,如VCD等。

MPEG-1采用CIF視頻格式(分辨率為352×288),幀速率為25幀/秒或30幀/秒,碼率為1.5Mb/s(其中視頻約1.2Mb/s,音頻約0.3Mb/s)。

MPEG-1將視頻圖像序列劃分為I幀、P幀和B幀

標準草案于1991年11月完成,1992年11月正式通過。4.1MPEG-1標準MPEG-1由五個部分組成:MPEG-1Systems,規定電視圖像數據、聲音數據及其它相關數據的同步MPEG-1Video,規定視頻數據的編碼和解碼,MPEG-1Audio,規定音頻數據的編碼和解碼MPEG-1Conformancetesting,詳細說明如何測試比特數據流(bitstreams)和解碼器是否滿足MPEG-1前3個部分(Part1,2和3)中所規定的要求MPEG-1Softwaresimulation4.2MPEG-2標準MPEG-2標準的基本算法也是運動補償的預測和帶有DCT的幀間內變長編碼與MPEG-1的主要區別在于:

能夠有效地支持電視的隔行掃描格式

支持可分級的可調視頻編碼,這適用于需要同時提供多種質量的視頻業務的情況

根據MPEG-2的標準CCIR601格式(702×576×25幀)的信號可壓縮到4Mb/s~6Mb/s,而HDTV格式(1280×720×60幀)的信號可壓縮到20Mb/s左右。4.2MPEG-2標準---組成(1)MPEG-2Systems,規定電視圖像數據、聲音數據及其它相關數據的同步(2)MPEG-2Video,規定視頻數據的編碼和解碼

(3)MPEG-2Audio,規定聲音數據的編碼和解碼,是MPEG-1Audio的擴充,支持多個聲道

(4)MPEG-2Conformancetesting4.2MPEG-2標準---組成(5)MPEG-2Softwaresimulation(6)MPEG-2數字存儲媒體命令和控制擴展協議

(7)MPEG-2先進聲音編碼(MPEG-2AAC),是多聲道聲音編碼算法標準

(8)MPEG-2系統解碼器實時接口擴展標準

(9)MPEG-2DSM-CC一致性擴展測試

4.3MPEG-4標準MPEG-4于1998年10月定案,在1999年1月成為一個國際性標準,隨后為擴展用途又進行了第二版的開發,于1999年底結束,其正式名稱為ISO14496-2,是為了滿足交互式多媒體應用而制定的新一代國際標準,具有更高的靈活性和可擴展性。MPEG-4主要應用于可視電話、視頻郵件和電子新聞等,對傳輸速率要求較低,在4800bps~64000bps之間。4.3MPEG-4標準利用很窄的帶寬,通過幀重建技術,壓縮和傳輸數據,以求以最小的數據獲得最佳的圖像質量。基于內容的壓縮、更高的壓縮比和時空可伸縮性,是MPEG-4最重要的三個技術特征。

MPEG-4標準同以前標準的最顯著的差別在于它是采用基于對象的編碼理念,即在編碼時將一幅景物分成若干在時間和空間上相互聯系的視頻音頻對象,分別編碼后,再經過復用傳輸到接收端,然后再對不同的對象分別解碼,從而組合成所需要的視頻和音頻。4.4MPEG-7標準國際標準化組織(ISO)在制定MPEG-1、MPEG-2及MPEG-4的標準基礎上,推出了新的標準MPEG-7,該標準的正式名稱為“多媒體內容描述接口”(MultimediaContentDescriptionInterface),其目標是產生一種描述多媒體內容數據的標準,滿足實時、非實時以及推-拉應用的需求。它既不同于基于波形和基于壓縮的表示方式如MPEG-1和MPEG-2,又不同于基于對象的表示方式如MPEG-4,而是將對各種不同類型的多媒體信息進行標準化描述,并將該描述與所

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論