多媒體技術原理及應用_第1頁
多媒體技術原理及應用_第2頁
多媒體技術原理及應用_第3頁
多媒體技術原理及應用_第4頁
多媒體技術原理及應用_第5頁
已閱讀5頁,還剩155頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

多媒體技術原理及應用第一頁,共一百六十頁,2022年,8月28日2.1

信息表示與編碼

數字化表示彩色空間多媒體數據轉換

第二頁,共一百六十頁,2022年,8月28日2.1.1概述傳統上用模擬方式表示聲音和圖像信息。

易出故障,常產生噪音和信號丟失,且拷貝過程中噪音和誤差逐步積累;模擬信號不適合數字計算機加工處理。數字化處理:巨大的數據量。第三頁,共一百六十頁,2022年,8月28日

采樣定理:僅當采樣頻率≥2倍的原始信號頻率時,才能保證采樣后信號可被保真地恢復為原始信號。采用8bit數字化,從而1秒鐘電視信號的數據量約為99.2Mbits。即約為100Mbps。650MB的CD-ROM僅能存約1分鐘的原始電視數據。若HDTV(1.2Gbps),一張CD-ROM還存不下6秒鐘的HDTV圖像。第四頁,共一百六十頁,2022年,8月28日

人說話的音頻一般在20Hz~4kHz,即人類語音的帶寬為4kHz。依據采樣定理,設數字化精度為8b,則1秒鐘信號量為64kbits。因此,人講1分鐘話的數據量為480kB。數字化處理的關鍵問題-數據壓縮第五頁,共一百六十頁,2022年,8月28日壓縮的基礎-數據冗余

空間冗余

時間冗余

信息熵冗余結構冗余

知識冗余

視覺冗余

其他冗余

第六頁,共一百六十頁,2022年,8月28日空間冗余這是圖像數據中經常存在的一種冗余。在同一幅圖像中,規則物體和規則背景的表面物理特性具有相關性,這些相關性的光成象結構在數字化其他中就表現為數據冗余。

第七頁,共一百六十頁,2022年,8月28日時間冗余這是序列圖像和語音數據中所經常包含的冗余。圖像序列中的兩幅相鄰的圖像之間有較大的相關性,這反映為時間冗余。在語言中,由于人在說話時發音的音頻是一連續的漸變過程,而不是一個完全時間上獨立的過程,因而存在時間冗余。

第八頁,共一百六十頁,2022年,8月28日信息熵冗余信息熵是指一組數據所攜帶的信息量,它定義為:H=-∑i=0N-1Pilog2Pi

N為數據類數或碼元個數,Pi為碼元yi發生的概率.為使信息編碼單位數據量d接近于或等于H,應設:d=∑i=0N-1Pib(yi)

其中b(yi)是分配給碼元yi的比特數,理論上應取b(yi)=-log2Pi.實際一般取b(y0)=b(y1)=…=b(yK-1).例如,英文字母編碼碼元長為7bit,即b(y0)=b(y1)=…=b(yK-1)=7,這樣d必然大于H,由此帶來的冗余稱為信息熵冗余或編碼冗余。

第九頁,共一百六十頁,2022年,8月28日結構冗余有些圖像從大域上看存著非常強的紋理結構,我們稱它們在結構上存在有冗余。例如,布紋圖像和草席圖像。第十頁,共一百六十頁,2022年,8月28日知識冗余有許多圖像的理解與某些基礎知識有相當大的相關性。例如,人臉的圖像有固定的結構。比如說嘴的上方有鼻子,鼻子的上方有眼睛,鼻子位于正臉圖像的中線上等。這類規律性的結構可由先驗知識和背景知識得到,我們稱此類冗余為知識冗余。第十一頁,共一百六十頁,2022年,8月28日視覺冗余人類視覺系統對于圖像場的任何變化,并不是都能感知的。例如,對于圖像的編碼處理時,由于壓縮或量化截斷引入了噪聲而使圖像發生了一些變化,如果這些變化不能為視覺所感知,仍認為圖像足夠好。事實上人類視覺系統一般分辨能力約為26灰度等級,而一般圖像量化采用28灰度等級,這類冗余我們稱為視覺冗余。第十二頁,共一百六十頁,2022年,8月28日其他冗余例如,由圖像的空間非定常特性所帶來的冗余。

第十三頁,共一百六十頁,2022年,8月28日

數字圖像編碼技術

1.彩色空間常見模型:

RGB彩色空間

HSI彩色空間

YUV彩色空間

YIQ彩色空間第十四頁,共一百六十頁,2022年,8月28日RGB彩色空間R、G、B是彩色最基本表示模型,也是計算機系統中所使用的彩色模型。

RGB5:5:5方式用2個字節表示一個像素,具體位分配見圖2.1。圖2.1RGB5:5:5方式

RGB8:8:8方式R、G、B三個分量各占一個字節。T(1b)R(5b)G(5b)B(5b)第十五頁,共一百六十頁,2022年,8月28日HSI彩色空間這種模型中,用H(Hue,色調)、S(Saturation,飽和度)、I(Intensity,光強度)3個分量來表示一種顏色,這種表示更適合人的視覺特性。第十六頁,共一百六十頁,2022年,8月28日YUV彩色空間Y為亮度信號,U、V是色差信號(B-Y,R-Y)。

PAL制式彩色空間即為YUV。優點是亮度和色差信號分離,容易使彩色電視系統與黑白電視信號兼容。國際無線電咨詢委員會根據實驗認為采用雙倍度采樣4:2:2方案效果較好,提出CCIR601標準。變換公式(YUV<--->RGB)

Y=0.299*R+0.587*G+0.114*B;

U=-0.169*R-0.332*G+0.500*B;

V=0.500*R+0.419*G-0.081*B第十七頁,共一百六十頁,2022年,8月28日YIQ彩色空間廣播電視系統另一種常用的亮度與色差分離的模型。NTSC制式彩色空間即為YIQ。這里Y是亮度,I和Q共同描述圖像的色調和飽和度。變換公式(YIQ<--->RGB)

Y=0.299*R+0.587*G+0.114*BI=0.211*R-0.523*G+0.312*BQ=0.596*R-0.275*G-0.322*B第十八頁,共一百六十頁,2022年,8月28日2.數字圖像文件格式

TIFPCXGIF、TGA、BMP、DVI、JPEG等

第十九頁,共一百六十頁,2022年,8月28日TIF文件格式由美國AldusDeveloper’sDesk和Microsoft制定結構文件頭(8B)參數指針表

參數數據表

圖像數據

第二十頁,共一百六十頁,2022年,8月28日

文件頭含字節順序(2B,表示存儲格式:II-Intel格式;MM—Motorola格式);標記號(2B,版本信息);指向第一個參數指針表的編碼(4B)。參數指針表由每個長為12B參數塊構成,描述壓縮種類、長寬、彩色數、掃描密度等參數。較長參數(如調色板)只給出指針,參數放在參數數據表中。其結構定義如下:第二十一頁,共一百六十頁,2022年,8月28日

typedefstruct{inttag-type;

intnumber-size;

longlength;

longoffset;

}TIF-FIELD;圖像數據按參數表中描述的形式按行排列第二十二頁,共一百六十頁,2022年,8月28日PCX文件格式由ZSoft公司最初制定結構文件頭(128字節)數據部分(采用行程長度編碼)文件頭結構定義第二十三頁,共一百六十頁,2022年,8月28日

typedefstruct{charmanufacture;/*always0xa0*/charversion;

charencoding;/*always1*/charbits-per-pixel;/*colorbits*/intXmin,Ymin;/*imageorigin*/intXmax,Ymax;/*imagedimension*/inthres;/*resolutionvalues*/intvres;

charpalette[48];/*colorpalette*/charreserved;

charcolor-planes;/*colorplanes*/intbytes-per-line;/*linebuffersize*/intpalette-type;/*greyorcolorpalette*/charfiller[58];

}PCXHEAD;

其中Version若為5,文件內有個256色調色板,數據768字節,在文件最后。

第二十四頁,共一百六十頁,2022年,8月28日

文件體對像素數據采用行程長度編碼,由包含Keybyte和Databyte的包組成。分2種情況:

(1)若Keybyte最高位為11,則低6位為重復次數(Index),即后一個字節重復使用Index次。但最多重復63次,若再長重建一個包。如圖2.2。圖2.2PCX數據包的結構

(2)若Keybyte最高位不是11,那么該Databyte按原樣寫入圖像文件。對一個字符的表示用長度為1的包。11IndexDatabyte111Databyte第二十五頁,共一百六十頁,2022年,8月28日2.1.3多媒體數據轉換

不同媒體表示不同的信息表示方式。研究媒體之間轉換十分有意義。有些媒體之間的轉換是非常困難的事情,需要研究人類本身對各種媒體理解原理和解釋過程。有些媒體之間的轉換則相對容易,幾乎不用做什么工作。

第二十六頁,共一百六十頁,2022年,8月28日表2.1部分媒體的轉換關系轉換位圖圖像圖形語音音樂文本視頻數值位圖圖像-*映射??*映射*凍結?圖形***輪廓或理解-*

波形*樂譜**矢量化?*可視化語音??-*波形**語音合成?*合成音樂??***識別-*音樂合成??文本***文字識別**識別**語音識別*轉換-?*符號化視頻**序列化**序列化???-?數值?**計算***識別?*轉換?-第二十七頁,共一百六十頁,2022年,8月28日2.2

常用的數據壓縮技術

2.2.1概述

根據解碼后數據與原始數據是否完全一致,數據壓縮方法劃分為兩類:

可逆編碼(無失真編碼)解碼圖像與原始圖像嚴格相同,壓縮大約在2:1到5:1之間。如Huffman編碼、算術編碼、行程長度編碼等。不可逆編碼(有失真編碼)還原圖像與原始圖像存在一定的誤差,但視覺效果一般可以接受,壓縮比可以從幾倍到上百倍來調節。常用的有變換編碼和預測編碼第二十八頁,共一百六十頁,2022年,8月28日

根據壓縮的原理可以有以下分類:

預測編碼利用空間中相鄰數據的相關性來預測未來點的數據。差分脈沖編碼調制(DPCM)和自適應差分脈沖編碼調制(ADPCM)。

變換編碼將圖像時域信號變換到頻域空間上處理。時域空間有強相關的信號,反映在頻域上是某些特定的區域內能量常被集中在一起,從而實現壓縮.正交變換如離散余弦變換,離散付立葉變換和Walsh-Hadamard變換.

量化與向量量化編碼為了使整體量化失真最小,就必須依照統計的概率分布設計最優的量化器。已知最優量化器是Max量化器。對象元點進行量化時,也可以考慮一次量化多個點的向量量化。第二十九頁,共一百六十頁,2022年,8月28日

信息熵編碼根據信息熵原理,讓出現概率大的用短的碼字表達,反之用長的碼字表示。最常見的方法如Huffman編碼、Shannon編碼以及算術編碼。

子帶編碼將圖像數據變換到頻域后,按頻域分帶,然后用不同的量化器進行量化,從而達到最優的組合。或者分步漸近編碼,隨著解碼數據的增加,圖像逐漸清晰。

模型編碼編碼時首先將圖像中邊界、輪廓、紋理等結構特征找出來,保存這些參數信息。解碼時根據結構和參數信息進行合成,恢復出原圖像。具體方法有輪廓編碼、域分割編碼、分析合成編碼、識別合成編碼、基于知識的編碼、分形編碼等。第三十頁,共一百六十頁,2022年,8月28日

預測編碼線性預測-DPCM

基本原理是基于圖像中相鄰像素之間具有較強的相關性。每個像素可根據已知的前幾個像素來作預測。因此在預測編碼中,編碼和傳輸的并不是像素采樣值本身,而是這個采樣值的預測值與其實際值之間的差值非線性預測(不討論)第三十一頁,共一百六十頁,2022年,8月28日圖2.3DPCM系統原理框圖預測器

量化器編碼器解碼器

預測器信道接收端輸出XN’+++XNe’NXNeNe’NXN’++輸入^XN^發送端+-第三十二頁,共一百六十頁,2022年,8月28日XN為tN時刻的亮度采樣值;XN為根據tN時刻以前已知X1,X2,…,XN-1對XN所作的預測值;eN=XN-XN為差值信號;eN’為量化器輸出信號;XN’為接收端輸出,XN’

=XN+eN’

。因為:XN-XN’

=

XN-(XN+eN’)

=(XN-XN)-eN’

=eN-eN’所以,DPCM系統中的誤差來源是發送端的量化器,而與接收端無關,若去掉量化器使eN=eN’,則XN=XN’,即實現信息保持編碼。事實上,這種量化誤差是不可避免的。^^^^^第三十三頁,共一百六十頁,2022年,8月28日

變換編碼

輸入圖像G經正交變換U變換到頻域空間,像素之間相關性下降,能量集中在變換域中少數變換系數上,已經達到了數據壓縮的效果。對變換系數A中那些幅度大元素予以保留,其他數量多的幅度小的變換系數,全部當作零不予編碼,再輔以非線性量化,進一步壓縮圖像數據。由于量化器存在,量化后變換系數A′和A間必然存在量化誤差,從而引起輸入圖像G和輸出圖像G′間存在誤差。圖2.4中U′是U的逆變換。

第三十四頁,共一百六十頁,2022年,8月28日圖2.4

變換編碼原理框圖變換量化編碼器解碼器逆變換信道輸入發送端接收端輸出GG’U’UA’A第三十五頁,共一百六十頁,2022年,8月28日變換編碼數據壓縮主要是去除信源的相關性。設信源序列為X={X0,X1,…,XN-1},表征相關性的統計特性就是協方差矩陣:

ΦX=

其中σi,j=E{(Xi-EXi)(Xj-EXj)}.當協方差矩陣Φx

除對角線上元素之外各元素均為0時,就等效于相關性為0。為了有效壓縮,希望變換后的協方差矩陣為對角矩陣,并希望主對角線元素隨i,j增加盡快衰減。σ0,02

σ0,12σ0,N-12σ1,02

σ1,12σN-1,02σ1,N-12σN-1,12

σN-1,N-12…………………第三十六頁,共一百六十頁,2022年,8月28日

已知X的條件下,根據它的協方差矩陣去尋找一種正交變換T,使變換后的協方差矩陣滿足或接近為一對角陣。Karhunen-Loeve變換即是這樣一種變換,又稱為最佳變換,它能使變換后協方差矩陣為對角陣,并且有最小均方誤差。它的計算比較復雜。實際應用中采用了一些準最佳變換如DCT,DFT和WHT等,使用這些變換后的協方差矩陣一般都接近一對角陣。第三十七頁,共一百六十頁,2022年,8月28日

信息熵編碼又稱為統計編碼,它是根據信源符號出現概率的分布特性而進行的壓縮編碼。基本思想:在信源符號和碼字之間建立明確的一一對應關系,以便在恢復時能準確地再現原信號,同時要使平均碼長或碼率盡量小。如Huffman編碼、算術編碼。第三十八頁,共一百六十頁,2022年,8月28日1.Huffman編碼定理

在變長編碼中,對出現概率大的信源符號賦于短碼字,而對于出現概率小的信源符號賦于長碼字。如果碼字長度嚴格按照所對應符號出現概率大小逆序排列,則編碼結果平均碼字長度一定小于任何其他排列方式。Huffman定理是Huffman編碼的理論基礎第三十九頁,共一百六十頁,2022年,8月28日實現步驟

(1)將信源符號按概率遞減順序排列;(2)把二個最小概率相加作為新符號的概率,并按(1)重排;(3)重復(1)、(2),直到概率為1;(4)在每次合并信源時,將合并的信源分別賦“0”和“1”(如概率大的賦“0”,概率小的賦“1”);(5)尋找從每一信源符號到概率為1處的路徑,記錄下路徑上的“1”和“0”;(6)寫出每一符號的“1”、“0”序列(從樹根到信源符號節點)。第四十頁,共一百六十頁,2022年,8月28日圖2.5Huffman編碼信源符號概率編碼過程碼字碼長(βi)x1

x2x3x4x5x6x7x80.400.180.100.100.070.060.050.0410010110000010001010001000011133444550101010.090.130.190.230.370.601010011第四十一頁,共一百六十頁,2022年,8月28日

上述編碼的平均碼字長度:

R=∑Piβi=0.40×1+0.18×3+0.10×3+0.10×4+0.07×4+0.06×4+0.05×5+0.04×5=2.61第四十二頁,共一百六十頁,2022年,8月28日2.算術編碼20世紀60年代初,Elias提出了算術編碼概念。1976年,Rissanen和Pasco首次介紹了它的實用技術。其基本原理是將編碼的信息表示成實數0和1之間的一個間隔(Interval),信息越長,編碼表示它的間隔就越小,表示這一間隔所需的二進制位就越多。

第四十三頁,共一百六十頁,2022年,8月28日算術編碼舉例采用固定模式符號概率分配如下:

字符:aeiou

概率:0.20.30.10.20.2

范圍:[0,0.2)[0.2,0.5)[0.5,0.6)[0.6,0.8)[0.8,1.0)編碼數據串為eai。令high間隔的高端,low為低端,range為間隔的長度,rangelow為編碼字符分配的間隔低端,rangehigh為編碼字符分配的間隔高端。第四十四頁,共一百六十頁,2022年,8月28日

初始high=1,low=0,range=high-low,一個字符編碼后新的low和high按下式計算:

low=low+range×rangelow;

high=low+range×rangehigh。(1)在第一個字符e被編碼時,e的rangelow=0.2,rangehigh=0.5,因此:

low=0+1×0.2=0.2high=0+1×0.5=0.5range=high-low=0.5-0.2=0.3

此時分配給e的范圍為[0.2,0.5)第四十五頁,共一百六十頁,2022年,8月28日

(2)第二個字符a編碼時使用新生成范圍[0.2,0.5),a的rangelow=0,rangehigh=0.2,因此:

low=0.2+0.3×0=0.2high=0.2+0.3×0.2=0.26range=0.06

范圍變成[0.2,0.26)第四十六頁,共一百六十頁,2022年,8月28日

(3)對下一個字符i編號,i的rangelow=0.5,rangehigh=0.6,range=0.06,則:

low=0.2+0.06×0.5=0.23high=0.2+0.06×0.6=0.236結果:用[0.23,0.236)表示數據串eai,如果解碼器知道最后范圍是[0.23,0.236),它馬上可解得一個字符為e,然后依次得到惟一解a、i,最終得到eai。第四十七頁,共一百六十頁,2022年,8月28日圖2.6

算術編碼過程表示1e0.5ea0.260.2360.80.60.50.20uoieauoieauoieauoiea0.20.20.23eai第四十八頁,共一百六十頁,2022年,8月28日算術編碼的特點不必預先定義概率模型,自適應模式具有獨特的優點;信源符號概率接近時,建議使用算術編碼,這種情況下其效率高于Huffman編碼(約5%)。JPEG擴展系統采用。第四十九頁,共一百六十頁,2022年,8月28日2.3靜態圖像壓縮標準JPEG

第五十頁,共一百六十頁,2022年,8月28日2.3.1JPEG標準的主要內容

ISO/IEC10918號標準“多灰度連續色調靜態圖像壓縮編碼”即JPEG標準,選定ADCT作為靜態圖像壓縮的標準化算法。該標準為保證通用性,包含以下兩種方式:空間方式可逆編碼

空間方式對于基本系統和擴展系統來說,被稱為獨立功能。DCT方式非可逆編碼,包含基本系統(必須保證的功能)和擴展系統(擴充功能)第五十一頁,共一百六十頁,2022年,8月28日

基本系統是實現DCT編碼與解碼所需的最小功能集,大多數的應用系統只要用此標準,就能基本上滿足要求。擴展系統是為了滿足更為廣闊領域的應用要求而設置的。第五十二頁,共一百六十頁,2022年,8月28日2.3.2JPEG靜態圖像壓縮算法

1.

基于DPCM的無失真編碼

預測器熵編碼器表說明無失真編碼器源圖像數據壓縮圖像數據圖2.7無失真編碼簡化框圖第五十三頁,共一百六十頁,2022年,8月28日基于DPCM的無失真編碼優點是硬件易實現,重建圖像質量好。缺點是壓縮比太低,大約為2:1。第五十四頁,共一百六十頁,2022年,8月28日工作原理是對X的預測值X’,將X-X’進行無失真熵編碼。對X’的求法見圖給出的預測方式。

cbax選擇值預測選擇值預測0123非預測

abc4567a+b-ca+(b-c)/2b+(a-c)/2(a+b)/2(a)

X鄰域(b)

預測方式圖2.8預測器第五十五頁,共一百六十頁,2022年,8月28日2.基于DCT的有失真壓縮編碼

離散余弦變換量化處理DC系數的編碼和AC系數的行程編碼

熵編碼第五十六頁,共一百六十頁,2022年,8月28日圖2.9基于DCT編碼過程FDCT熵編碼器表說明無失真編碼器源圖像數據壓縮圖像數據量化器表說明88塊(YUV每個分量)第五十七頁,共一百六十頁,2022年,8月28日圖2.10解碼過程熵解碼器IDCT表說明解碼器逆量化器表說明88塊壓縮圖像數據恢復的圖像數據第五十八頁,共一百六十頁,2022年,8月28日離散余弦變換

(1)首先把原始圖像順序分割成8×8子塊;(2)采樣精度為P位(二進制),把[0,2P-1]范圍的無符號數變換成[-2P-1,2P-1]范圍的有符號數,作為離散余弦正變換(FDCT)的輸入;(3)在輸出端經離散余弦逆變換(IDCT)后又得到一系列8×8子塊,需將數值范圍[-2P-1,2P-1]變換回[0,2P-1]來重構圖像。第五十九頁,共一百六十頁,2022年,8月28日這里用的8×8FDCT的數學定義為:

F(u,v)=(1/4)C(u)

C(v)[∑x=07∑y=07f(x,y)·

cos((2x+1)u/16)·cos((2y+1)v/16)]

8×8IDCT的數學定義為:

f(x,y)=(1/4)[∑u=07∑v=07

C(u)C(v)F(u,v)·cos((2x+1)u/16)·cos((2y+1)v/16)]

其中:C(u),C(v)=1/√2

當u,v=0C(u),C(v)=1

其他下面的編碼針對FDCT輸出的64個基信號的幅值(F(0,0),…,F(7,7)稱作DCT系數)來進行

第六十頁,共一百六十頁,2022年,8月28日量化處理

量化是一個“多到一”的過程,失真原因關鍵是找最小量化失真的量化器,JPEG采用線性均勻量化器,定義為對64個DCT系數除以量化步長,然后四舍五入取整:FQ(u,v)=IntegerRound[F(u,v)/Q(u,v)]Q(u,v)是量化器步長,它是量化表的元素。量化表元素隨DCT系數的位置和彩色分量不同有不同的值,量化表尺寸為8×8與64個變換系數一一對應。這個量化表應由用戶規定(JPEG給出參考值-見表2.2,2.3),并作為編碼器的一個輸入。第六十一頁,共一百六十頁,2022年,8月28日

1611101624405161121214192658605514131624405769561417222951878062182237566810910377243555648110411392496478871031211201017292959811210010399表2.2亮度量化表第六十二頁,共一百六十頁,2022年,8月28日

17182447999999991821266699999999242656999999999947669999999999999999999999999999999999999999999999999999999999999999999999999999表2.3色度量化表第六十三頁,共一百六十頁,2022年,8月28日

量化的作用是在一定主觀保真度圖像質量前提下,丟掉那些對視覺影響不大的信息,通過量化可調節數據壓縮比。

第六十四頁,共一百六十頁,2022年,8月28日DC系數的編碼

64個變換系數經量化后,坐標u=v=0的F(0,0)稱DC系數(直流分量),它即64個空域圖像采樣值的平均值。相鄰8×8塊之間DC系數有強相關性。JPEG對量化后的DC系數采用DPCM編碼,即對DIFF=DCi-DCi-1編碼。

…blocki-1blockiDCi-1DCi圖2.11DC系數差分編碼第六十五頁,共一百六十頁,2022年,8月28日AC系數的行程編碼

其余63個交流系數(AC)采用行程編碼。從左上方AC0,1開始沿對角線方向“Z”字形掃描直到AC7,7掃描結束,這樣可增加行程中連續0的個數。AC系數編碼的碼字用兩個字節表示,如圖所示:

圖2.12Z字形掃描第六十六頁,共一百六十頁,2022年,8月28日圖2.13AC系數行程編碼碼字兩個非0值間連續0的個數

表示下一個非0值需要的bit數

下一個非0實際值7430字節1字節2例子:對“…,3,0,0,0,0,0,12,0,0,…”編碼…,(5,4),(12),….第六十七頁,共一百六十頁,2022年,8月28日熵編碼

為了進一步壓縮數據,需對DC碼和AC行程編碼的碼字再做基于統計特性的熵編碼。JPEG建議的熵編碼是Huffman編碼和自適應二進制算術編碼。熵編碼可分成兩步進行:把DC碼和AC行程碼轉換為中間符號序列給這些符號賦以變長碼字

第六十八頁,共一百六十頁,2022年,8月28日AC系數熵編碼的中間格式

熵編碼的中間格式由兩個符號組成:符號1:(行程,尺寸)符號2:(幅值)第一個信息參數“行程”表示前后兩個非0的AC系數之間連續0的個數。第二個信息參數“尺寸”是后一個非0的AC系數幅值編碼所需比特數。第六十九頁,共一百六十頁,2022年,8月28日行程取值范圍為1~15,超過15時用擴展符號1(15,0)來擴充,63個AC系數最多增加3個擴展符號1。編碼結束時用(0,0)表示。“尺寸”取值范圍為0~10。“幅值”用以表示非0的AC系數的值,范圍為[-210,210-1](最長10bit),結構形式如表2-4所示。第七十頁,共一百六十頁,2022年,8月28日1-1,12-3..-2,2..33-7..-4,4..74-15..-8,8..1567……89-511..-256,256…51110-1023..-512,512…1023表2.4符號2結構第七十一頁,共一百六十頁,2022年,8月28日DC系數的熵編碼對于直流分量DC也有類似于AC系數的編碼格式符號1:(尺寸)符號2:(幅值)“尺寸”表示DC差值的幅值編碼所需的比特數,而“幅值”表示DC差值的幅值,范圍為[-211,211-1]。可在表2.4中多加一級,幅值尺寸以1到11比特表示。將63個AC系數表示成為符號1和符號2序列,其中連續0的長度超過15時,有多個符號1;塊結束(EOB)時僅有一個符號1(0,0)。第七十二頁,共一百六十頁,2022年,8月28日“…4,0,0,0,0,0,0,0,……0,3,0”.4,3之間有31個0.

(15,0),(15,0),(1,2),(3)可變長度熵編碼就是對上述序列進行變長編碼。對DC系數、AC系數中的符號1采用Huffman表中的變長碼編碼(VLC),這里Huffman變長碼表必須作為JPEG編碼器輸入。符號2用碼字長度在表2.4中給出的變長整數VLI碼編碼。VLI是變長碼,但不是Huffman碼。VLI的長度存放在VLC中,JPEG提供VLI碼字表供用戶使用第七十三頁,共一百六十頁,2022年,8月28日JPEG提供2套Huffman碼表:亮度和色度。每套又有DC表和AC表各1個。共有4個表。表定義(亮度DC系數碼表)

16B說明碼字長度:

X’00010501010101010100000000000000’

第i個(1-16)元素值表示長度為i的Huffman碼個數。緊跟一組值說明亮度表分類:

X’000102030405060708090A0B’第七十四頁,共一百六十頁,2022年,8月28日表2.5亮度DC系數表分類碼長碼字分類碼長碼字0200641110130107511110230118611111033100971111110431011081111111053110119111111110第七十五頁,共一百六十頁,2022年,8月28日表2.6色度DC系數表分類碼長碼字分類碼長碼字0200661111101201771111110221088111111103311099111111110441110101011111111105511110111111111111110第七十六頁,共一百六十頁,2022年,8月28日表2.7JPEG壓縮效果評價壓縮效果(比特/像素)

質量0.25~0.50

中~好0.50~0.75

好~很好0.75~1.5

極好1.2~2.0

與原始圖像分不出來第七十七頁,共一百六十頁,2022年,8月28日3.基于DCT的累進操作方式編碼

順序方式:每個圖像分量的編碼一次掃描完成的;累進方式:圖像分量編碼要經過多次掃描才完成。累進方式第一次掃描只進行一次粗糙圖像的掃描壓縮,以相對于總的傳輸時間快得多的時間傳輸粗糙圖像,并重建一幀質量較低的可識別圖像;在隨后的掃描中再對圖像作較細的壓縮,這時只傳遞增加的信息,可重建一幅質量提高一些的圖像。這樣不斷累進,直到滿意的圖像為止。第七十八頁,共一百六十頁,2022年,8月28日需在量化器的輸出與熵編碼的輸入之間,增加一個足以存儲量化后DCT系數的緩沖區,對緩沖區中存儲的DCT系數多次掃描,分批編碼。有以下兩種累進方式:頻譜選擇法掃描中只對64個DCT變換系數中某些頻帶的系數進行編碼、傳送,隨后對其他頻帶編碼、傳送,直到全部系數傳送完畢為止。按位逼近法沿著DCT量化系數有效位(表示系數精度的位數)方向分段累進編碼。如第一次掃描只取最高有效位的n位編碼、傳送,然后對其余位進行編碼、傳送。第七十九頁,共一百六十頁,2022年,8月28日4.基于DCT的分層操作方式

分層方式是對一幅原始圖像的空間分辨率,分成多個分辨率進行“錐形”的編碼方法,水平(垂直)方向分辨率的下降以2的倍數因子改變。

圖2.14分層操作方式第八十頁,共一百六十頁,2022年,8月28日分層操作方式的過程(1)把原始圖像空間分辨率降低。(2)對已降低分辨率的圖像采用基于DCT的順序方式、累進方式或無失真預測編碼中的任何一種編碼方法進行編碼。(3)對低分辨率的圖像解碼,重建圖像,使用插值濾波器,對它插值,恢復圖像的水平和垂直分辨率。(4)把分辨率已升高的圖像作為原始圖像的預測值,對它們的差值采用基于DCT的順序方式、累進方式或用無失真方式進行編碼。(5)重復(3)、(4)直到圖像達到完整的分辨率編碼。第八十一頁,共一百六十頁,2022年,8月28日2.3.3JPEG2000簡介基于Internet網絡的多媒體應用,給圖像編碼提出了新的要求.2000年12月公布的新的JPEG2000標準(ISO15444),其目標是在高壓縮率的情況下,如何保證圖像傳輸的質量。JPEG中采用DCT變換考察整個時域過程的頻域特征或整個頻域過程的時域特征。JPEG2000采用以小波變換為主的多分辨率編碼方式。JPEG2000統一了面向靜態圖像和二值圖像的編碼方式,是既支持低比率壓縮又支持高比率壓縮的通用編碼方式。第八十二頁,共一百六十頁,2022年,8月28日

該算法主要特點如下:(1)高壓縮率。與JPEG相比,可修復約30%的速率失真特性。JPEG和JPEG2000在壓縮率相同時,JPEG2000的信噪比將提高30%左右;(2)無損壓縮。預測編碼作為對圖像進行無損編碼的成熟方法被集成在JPEG2000中;(3)漸進傳輸。JPEG2000可實現以空間清晰度和信噪比為首的各種可調節性,從而實現漸進傳輸,即具有“漸現”特性.(4)感興趣區域壓縮。JPEG2000支持所謂的“感興趣區域”。第八十三頁,共一百六十頁,2022年,8月28日2.4

運動圖像壓縮標準MPEG第八十四頁,共一百六十頁,2022年,8月28日2.4.1MPEG標準簡介MPEG標準是面向運動圖像壓縮的一個系列標準。最初MPEG專家組的工作項目是3個,即在1.5Mbps,10Mbps,40Mbps傳輸速率下對圖像編碼,分別命名為MPEG-1,MPEG-2,MPEG-3。MPEG-3后被取消.為了滿足不同的應用要求,MPEG又將陸續增加其他一些標準MPEG-4,MPEG-7,MPEG-21。第八十五頁,共一百六十頁,2022年,8月28日

MPEG算法編碼過程和解碼過程是一種非鏡象對稱算法(不對稱),解碼過程要比編碼過程相對簡單些。MPEG-1和MPEG-2只規定了解碼的方案,重點將解碼算法標準化。因而用硬件實現MPEG算法時,人們首先實現MPEG的解碼器,如C-Cube公司CL450解碼器系列。最近幾年,隨著MPC性能的提高,軟件解壓功能也逐漸得到支持。第八十六頁,共一百六十頁,2022年,8月28日2.4.2MPEG-1系統“用于數字存儲媒體運動圖像及其伴音速率為1.5Mbps的壓縮編碼”簡稱MPEG-1,作為ISO/IEC11172號建議于1992年通過。主要用于在CD-ROM存儲運動視頻圖像,它針對標準分辨率(NTSC制為352×240;PAL制為352×288)的圖像進行壓縮,每秒30幀畫面,具備CD音質。它還用于數字電話網絡上的視頻傳輸,如非對稱數字用戶線路(ADSL)、視頻點播、教育網絡等。使用MPEG-1的壓縮算法,可將一部120分鐘長的電影壓縮到1.2GB左右。因此,它被廣泛地應用于VCD制作。第八十七頁,共一百六十頁,2022年,8月28日MPEG-1分為5個部分(1)MPEG系統(11172-1),定義音頻、視頻及有關數據的同步;(2)MPEG視頻(11172-2),定義視頻數據的編碼和重建圖像所需的解碼過程,亮度信號分辨率為360×240,色度信號分辨率為180×120;(3)MPEG音頻(11172-3),定義音頻數據的編碼和解碼;(4)一致性測試(11172-4);(5)軟件模擬(11172-5)。第八十八頁,共一百六十頁,2022年,8月28日圖2.15

MPEG-1解碼器原型第八十九頁,共一百六十頁,2022年,8月28日MPEG-1編解碼器原型:多路復合而成的碼流假設以介質特定格式存儲在數字存儲介質(DSM)或網絡上,標準不規定介質特定格式。系統解碼器從輸入多路復合流中抽取定時信息,并對輸入流進行分流處理,輸出兩個基本流分別給視頻和音頻解碼器。視頻和音頻解碼器分別解碼輸出視頻和聲音信號。

第九十頁,共一百六十頁,2022年,8月28日

系統、視頻、音頻和介質4個解碼器之間用定時信息進行同步。多路復合流構造為2層:系統層和壓縮層。系統解碼輸入的是系統層;而視頻、音頻解碼器輸入的是壓縮層。第九十一頁,共一百六十頁,2022年,8月28日

系統解碼器執行兩類操作:一類是作用在整個多路復合流上的操作,稱為復合流操作;另一類是作用在單個基本流上的操作,稱為特定流操作。系統層分為兩個子層:一個子層稱為包(pack),是復合流操作對象;另一個子層稱為組(packet),它用于特定流操作。第九十二頁,共一百六十頁,2022年,8月28日

MPEG音頻標準的特點:音頻信號采樣率可以是32kHz,44.1kHz或48kHz。壓縮后的比特流可以按以下4種模式之一支持單聲道或雙聲道:提供給單音頻通道的單聲道模式;提供給兩個獨立的單音頻通道的雙-單聲道模式;提供給立體聲通道的立體聲模式;聯合立體聲模式,利用立體聲通道之間的關聯或通道之間相位差的無關性,或者對兩者同時利用。第九十三頁,共一百六十頁,2022年,8月28日

MPEG音頻標準提供3個獨立的壓縮層次,用戶可在復雜性和壓縮質量之間權衡選擇。層1最簡單,使用比特率384kbps,主要用于DCC;層2的復雜度中等,使用比特率192kbps左右,主要應用于數字廣播的音頻編碼、CD-ROM上的音頻信號以及CD-I和VCD。層3最為復雜,使用比特率64kbps,尤其適用于ISDN上的音頻傳輸,有損壓縮但音質保持逼真效果。MP3音樂是利用MPEGAudioLayer3的技術,聲音采用1:10甚至1:12的壓縮率

第九十四頁,共一百六十頁,2022年,8月28日

壓縮后的比特流具有預定義的比特率之一。MPEG音頻標準也支持用戶使用預定義的比特率之外的比特率。

編碼后的比特流支持循環冗余校驗(CRC)。MPEG音頻標準還支持在比特流中載帶附加信息。

第九十五頁,共一百六十頁,2022年,8月28日MPEG視頻數據流的結構圖2.16MPEG-1數據體系結構運動圖像序列圖片組圖片圖片切片宏塊塊8像素第九十六頁,共一百六十頁,2022年,8月28日

運動序列圖像組圖像信號分3個部分:一個亮度信號Y和兩個色度信號U、V。第九十七頁,共一百六十頁,2022年,8月28日圖2.17色度和亮度的位置關系亮度信號Y由偶數個行和偶數個列組成,色度信號U、V分別取Y信號在水平、垂直方向的1/2。如圖所示,黑點代表色度U、V位置,亮度Y位置用白圈表示。第九十八頁,共一百六十頁,2022年,8月28日

塊:一個塊由一個8×8的亮度信息或色度信息組成。宏塊一個宏塊由一個16×16的亮度信息和兩個8×8色度信息構成,如圖所示。圖2.18宏塊的組成圖像切片由一個或多個連續的宏塊構成。

YUV8X88X8123456第九十九頁,共一百六十頁,2022年,8月28日

2.4.4MPEG-1視頻編碼技術

主要問題:一方面無法達到很高的壓縮比,另一方面用單一的靜止幀內編碼方法能最好地滿足隨機存取的要求。解決方法:對這兩個方面做了折衷考慮。即為了減少時間上冗余性的基于塊的運動補償技術和基于DCT變換的減少空間上冗余性的ADCT技術

第一百頁,共一百六十頁,2022年,8月28日在MPEG中將圖像分為3種類型:I圖像利用圖像自身的相關性壓縮,提供壓縮數據流中的隨機存取的點。P圖像用最近的前一個I圖像(或P圖像)預測編碼得到(前向預測)。B圖像B圖像在預測時,既可使用了前一個圖像作參照,也可使用下一個圖像做參照或同時使用前后兩個圖像作為參照圖像(雙向預測)。

第一百零一頁,共一百六十頁,2022年,8月28日圖2.19

幀間預測1I2B3B4B5P6B7B8B1I前向預測雙向預測第一百零二頁,共一百六十頁,2022年,8月28日運動序列流的組成圖2.20典型的圖像類型的顯示次序1秒參照幀間有2個B圖像

每0.5秒1幀I圖像

IBBPBBPBBPBBPBBIBBPBBPBBPBBPBB第一百零三頁,共一百六十頁,2022年,8月28日傳輸順序MPEG編碼器需對上述圖像重新排序,以便解碼器高效工作,因為參照圖像必須先于B圖像恢復之前恢復。上述1~7幀圖像重排后圖像組次序為:4213756IPBBPBB第一百零四頁,共一百六十頁,2022年,8月28日運動補償技術運動補償技術主要用于消除P圖像和B圖像在時間上的冗余性提高壓縮效率。在MPEG方案中,運動補償技術工作在宏塊一級。B圖像宏塊有4種類型幀內宏塊,簡稱I塊;前向預測宏塊,簡稱F塊;后向預測宏塊,簡稱B塊;平均宏塊,簡稱A塊。對于P圖像,其宏塊只有I塊和F塊兩種。第一百零五頁,共一百六十頁,2022年,8月28日無論B圖像和P圖像,I塊處理技術都與I圖像中采用技術一致即ADCT技術。對于F塊、B塊和A塊,MPEG都采用基于塊的運動補償技術。F塊預測時其參照為前一個I圖像或P圖像B塊預測時其參照為后一個I圖像或P圖像對于A塊預測其參照為前后兩個I圖像或P圖像第一百零六頁,共一百六十頁,2022年,8月28日基于塊的運動補償技術基于塊的運動補償技術,就是在其參照幀中尋找符合一定條件,當前被預測塊的最佳匹配塊。找到匹配塊后,有兩種處理方法:一是在恢復被預測塊時,用匹配塊代替;二是對預測的誤差采用ADCT技術編碼,在恢復被預測塊時,用匹配塊加上預測誤差。第一百零七頁,共一百六十頁,2022年,8月28日表2.8宏塊的預測方式宏塊類型預測器預測誤差I塊I1(X)=128I1(X)-I1(X)F塊I1(X)=I0(X+mv01)I1(X)-I1(X)B塊I1(X)=I2(X+mv21)I1(X)-I1(X)A塊I1(X)=(I0(X+mv01)+I2(X+mv21))/2I1(X)-I1(X)第一百零八頁,共一百六十頁,2022年,8月28日4.MPEG-1視頻系統圖2.21簡化的視頻編碼框圖

第一百零九頁,共一百六十頁,2022年,8月28日圖2.22基本的視頻解碼器框圖

第一百一十頁,共一百六十頁,2022年,8月28日2.4.5MPEG-2標準MPEG-2(ISO/IEC13818)標準制定于1994年。它利用網絡提供的3~100Mbps的數據傳輸率來支持具有更高分辨率圖像的壓縮和更高的圖像質量。MPEG-2可支持交迭圖像序列,支持可調節性編碼,多種運動估計方式,提供一個較廣的范圍改變壓縮比,以適應不同畫面質量、存儲容量和帶寬的要求。它與MPEG-1兼容的基礎上實現了低碼率和多聲道擴展:MPEG-2可以將一部120分鐘長的電影壓縮到4~8GB(DVD質量),其音頻編碼可提供左右中及兩個環繞聲道、一個加重低音聲道和多達7個伴音聲道。第一百一十一頁,共一百六十頁,2022年,8月28日

除了作為DVD的指定標準外,MPEG-2還可用于為廣播、有線電視網、電纜網絡等提供廣播級的數字視頻。不過對普通用戶來說,由于現在電視機分辨率的限制,MPEG-2所帶來的高清晰度畫面質量(如DVD畫面)在電視上效果并不明顯,倒是其音頻特性(如加重低音、多伴音聲道等)得到了廣泛的應用。

MPEG-2Video定義了不同的功能檔次(Profiles)每個檔次又分為幾個等級(Levels),一個等級為N的解碼器能夠對最高為該等級的數碼流解碼。

第一百一十二頁,共一百六十頁,2022年,8月28日5個檔次簡單型(Simple)基本型(Main)信噪比可調型(SNRScalable)空間可調型(SpatialScalable)增強型(High)第一百一十三頁,共一百六十頁,2022年,8月28日4個等級低級(Low)35228830,它面向VCR并與MPEG-1兼容;基本級(Main)72046030或72057625,它面向視頻廣播信號;高1440級(High-1440)1440108030或1440115225,它面向HDTV;高級(High)1920108030或1920115225,它面向HDTV。

第一百一十四頁,共一百六十頁,2022年,8月28日11種規范高級的基本型MP@HL高級的增強型HP@HL高-1440級的基本型MP@H1440高-1440級的空間可調型SSP@H1440高-1440級的的增強型HP@H1440基本級的簡單型SP@ML基本級基本型MP@ML基本級的信噪比可調型SNP@ML基本級的增強型HP@ML低級的基本型MP@LL低級的信噪比可調型SNP@LL第一百一十五頁,共一百六十頁,2022年,8月28日MPEG-2音頻基本特性之一是向后與MPEG-1音頻兼容。可以是5.1也可以是7.1通道的環繞立體聲。5.1也稱為“3/2-立體聲加LFE”,其含義是播音現場前面可有3個喇叭通道(左、中、右),后面可有2個環繞聲喇叭通道。LFE是低頻音效的加強通道。7.1通道環繞立體聲與5.1類似,它另有中左、中右2個喇叭通道。第一百一十六頁,共一百六十頁,2022年,8月28日MPEG-2編碼方法

MPEG-2的編碼方法和MPEG-1區別主要是在隔行掃描制式下,DCT變換是在場內還是在幀內進行由用戶自行選擇,亦可自適應選擇。一般情況下,對細節多、運動部分少的圖像在幀內進行DCT,而細節少、運動分量多的圖像在場內進行DCT。MPEG-2采用可調型和非可調型兩種編碼結構。還可以使用一個基本層加上多個增強型的多層編碼結構,這由用戶按質量和壓縮比要求選擇使用.第一百一十七頁,共一百六十頁,2022年,8月28日圖2.23MPEG-2亮度宏塊結構第一百一十八頁,共一百六十頁,2022年,8月28日圖2.24空間可調型MPEG-2編碼器原理框圖第一百一十九頁,共一百六十頁,2022年,8月28日2.4.6MPEG-4標準國際標準MPEG-4“甚低速率視聽編碼”于1998年11月公布,它針對低速率下的視頻、音頻編碼,更加注重多媒體系統的交互性和靈活性。MPEG-4引入了AV對象(AVO),使得更多的交互操作成為可能:“AV對象”可以是一個孤立的人,也可以是這個人的語音或一段背景音樂等。MPEG-4對AV對象的操作主要有:

采用AV對象來表示聽覺、視覺或者視聽組合內容;組合已有AV對象來生成復合的AV對象,并生成AV場景;對AV對象的數據靈活地多路合成與同步,以便選擇合適的網絡來傳輸這些AV對象數據;允許接收端用戶在AV場景中對AV對象進行交互操作等。第一百二十頁,共一百六十頁,2022年,8月28日

MPEG-4標準主要構成部分:(1)傳輸多媒體集成框架(DMIF)。主要用于解決交互網絡中、廣播環境下以及光盤應用中多媒體應用的操作問題。它是MPEG-4制訂的會話協議,用來管理多媒體數據流。通過傳輸多路合成比特信息來建立客戶端和服務器端的連接與傳輸。(2)場景描述。場景聲音視頻對象間的關系的描述體現在兩個層次:BIFS描述場景中對象的空間時間安排,觀察者可以有與這些對象交互的可能性;在較低的層次上,對象描述子定義針對每個對象的基本流的關系,并提供諸如訪問基本流需要的URL地址、譯碼器的特性、知識產權等其他信息。第一百二十一頁,共一百六十頁,2022年,8月28日

MPEG-4具備與Web3DX3D和W3CSMIL的互操作性。XMT格式可在SMIL播放器、VRML和MPEG-4播放器間互換。(3)音頻編碼。MPEG-4不僅支持自然聲音,而且支持合成聲音。MPEG-4的音頻部分將音頻的合成編碼和自然聲音的編碼相結合,并支持音頻的對象特征。支持MIDI和TTS.(4)視頻編碼。MPEG-4也支持對自然和合成的視覺對象的編碼。合成的視覺對象包括2D、3D動畫和人面部表情動畫等。(5)緩沖區管理和實時解碼。MPEG-4定義了一個系統解碼模式(SDM),該解碼模式描述了一種理想的處理比特流句法語義的解碼裝置,它要求特殊的緩沖區和實時模式。通過有效地管理,可以更好地利用有限的緩沖區空間。第一百二十二頁,共一百六十頁,2022年,8月28日

與MPEG-1和2相比,MPEG-4更適于交互AV服務以及遠程監控,其設計目標使它具有更廣的適應性和可擴展性:MPEG-4傳輸速率可在4.8-64kbps之間,分辨率為176×144,可以利用很窄的帶寬通過幀重建技術壓縮和傳輸數據。它將應用在數字電視、動態圖像、互聯網、實時多媒體監控、移動多媒體通信、Internet/Intranet上的視頻流與可視游戲、DVD上的交互多媒體等方面。MPEG-4用MPEG-4壓縮算法的ASF可以將120分鐘的電影壓縮為300MB左右的視頻流;采用MPEG-4壓縮算法的DIVX編碼技術可以將120分鐘的電影壓縮600MB左右,也可以將一部DVD影片壓縮到2張CD-ROM上.第一百二十三頁,共一百六十頁,2022年,8月28日

MPEG-4屬于一種高比率有損壓縮算法,其圖像質量始終無法和DVD的MPEG-2相比,畢竟DVD的存儲容量較大。要想保證高速運動的圖像畫面不失真,必須有足夠的碼率,目前MPEG-4的碼率雖然可以調到和DVD差不多,但總體效果還有不小的差距。因此,對圖像質量要求較高的專業視頻領域暫時還不能采用。第一百二十四頁,共一百六十頁,2022年,8月28日

圖2.25MPEG-4視頻編碼器的算法方框圖第一百二十五頁,共一百六十頁,2022年,8月28日圖2.26MPEG-4終端的構成(接收端)第一百二十六頁,共一百六十頁,2022年,8月28日背景全景圖+視頻對象(VO)=合成圖像圖2.27MPEG-4應用實例第一百二十七頁,共一百六十頁,2022年,8月28日2.5

視聽通信編碼解碼標準H.26X

第一百二十八頁,共一百六十頁,2022年,8月28日2.5.1H.261方案ITU推薦的H.261方案標題“64kbps視聲服務用視象編碼方式”,又稱為P×64kbps視頻編碼標準。P取值范圍為1-30。P=1或2時,僅能支持QCIF(176×144)分辨率格式,每秒幀數較低的可視電話;當P≥6時,則可支持圖像分辨率格式為CIF(352×288)的電視會議。第一百二十九頁,共一百六十頁,2022年,8月28日2.5.2P×64kbps視頻壓縮編碼算法P×64kbps壓縮算法采用基于DCT的變換編碼和帶有運動預測的DPCM預測編碼的混合方法。P×64kbps標準的壓縮算法與MPEG-1標準有許多共同之處,只是傳輸速率P×64kbps覆蓋較寬的信道頻帶,而MPEG-1是基于較窄的頻帶上傳輸。

第一百三十頁,共一百六十頁,2022年,8月28日圖2.28H.261編碼器第一百三十一頁,共一百六十頁,2022年,8月28日圖2.29利用CIF的優點第一百三十二頁,共一百六十頁,2022年,8月28日2.5.3視頻層次數據結構

P×64kbps標準采用層次塊的視頻數據結構形式,使高壓縮視頻編碼算法得以實現。P×64kbps標準的視頻編碼定義一個視頻數據結構CIF保證解碼器對接收到的比特流進行沒有二義性的正確解碼。利用CIF格式,可使不同制式的各國電視信號變換為統一的中間格式,然后輸入給編碼器,從而使編碼器本身不必意識信號是來自哪種制式的。H.261標準適合各種各樣實時視覺應用,如位率不同(P不同),運動效果和圖像質量不同,位率提高、畫面質量改善。第一百三十三頁,共一百六十頁,2022年,8月28日圖2.30視頻數據結構圖圖像頭QCIF幀圖塊組1塊組2塊組3塊組1頭宏塊1宏塊2宏塊33宏塊1頭亮度塊1亮度塊4色度塊1色度塊2DCT系數……DCT系數塊結束…第一百三十四頁,共一百六十頁,2022年,8月28日圖2.31圖像數據層次結構123456789101112135幀QCIF123456789101112131415161718192021222324252627282930313233塊組123456宏塊8CIF塊8第一百三十五頁,共一百六十頁,2022年,8月28日

為了適應B-

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論