《多媒體技術(shù)》講稿第4章-3-2003_第1頁
《多媒體技術(shù)》講稿第4章-3-2003_第2頁
《多媒體技術(shù)》講稿第4章-3-2003_第3頁
《多媒體技術(shù)》講稿第4章-3-2003_第4頁
《多媒體技術(shù)》講稿第4章-3-2003_第5頁
已閱讀5頁,還剩106頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第四章---第三部分數(shù)據(jù)壓縮標準第4章要點

5.數(shù)據(jù)壓縮的標準

數(shù)據(jù)壓縮標準

<1>衡量壓縮效果的技術(shù)指標

<2>幾種典型的音頻壓縮標準

<3>幾種典型的圖像壓縮標準

《返回》數(shù)據(jù)壓縮效果的技術(shù)指標一般,人們總是希望壓縮倍數(shù)高,壓縮速度快,并且希望壓縮所需資源、時間對用戶來講是透明的。但同時希望確保壓縮的精度。但追求壓縮比率和追求精度往往是矛盾的。從應(yīng)用的角度看,主要的障礙是實現(xiàn)成本問題。越好的算法,計算復(fù)雜性越高,實現(xiàn)成本就越高。數(shù)據(jù)壓縮技術(shù),大致有如下幾項指標:

(1)壓縮比(數(shù)據(jù)量小)(2)壓縮、解壓算法簡單(3)恢復(fù)效果好(4)評價方法

《返回》第4章要點

5.數(shù)據(jù)壓縮的標準

<1>衡量數(shù)據(jù)壓縮效果好壞的技術(shù)指標

①壓縮比:在保證不失真或允許一定失真的前提下,壓縮前后所需的信息存儲量之比。下面給出兩種定義:定義1:即編碼效率:

η=H/R也用數(shù)據(jù)壓縮前后比特數(shù)之比。通常寫成x:1。

第4章要點

5.數(shù)據(jù)壓縮的標準

<1>技術(shù)指標定義2:

該式可用來衡量被壓縮的數(shù)據(jù)在原數(shù)據(jù)中所占的比重。當沒有引起失真時,表明已消除了多少冗余量。通常寫成x%。

②壓縮、解壓算法簡單:做到壓縮、解壓速度快,實現(xiàn)壓縮的軟硬件開銷小,盡量滿足實時壓縮和解壓需求。

③恢復(fù)效果好:根據(jù)壓縮對象的不同特點,保證不失真或允許一定失真情況下,恢復(fù)原始數(shù)據(jù)。

《返回》

評價方法(4)評價方法主觀評價法:圖像、聲音媒體質(zhì)量的評價方法被稱為平均主觀打分(MOS)方法。

如下表所示。客觀評價法:信噪比SNR=10lg(δ2/MSE)

均方誤差法,

MSE=1/N2

(xi-xi’)2

《返回》圖像、聲音媒體質(zhì)量的評價方法返回5.數(shù)據(jù)壓縮的標準

<2>幾種典型的音頻壓縮標準

①聲音壓縮標準按質(zhì)量,音頻信號可分為電話質(zhì)量的語音、調(diào)幅廣播質(zhì)量的音頻信號和高保真立體聲信號。三種音質(zhì)壓縮標準對比。如下表所示。三種音質(zhì)的壓縮標準表頻率范圍

抽樣頻率

量化位數(shù)信號速率

電話質(zhì)量的語音

200Hz~3.4KHz

8KHz

8比特

64Kbps

調(diào)幅廣播質(zhì)量的音頻

50Hz~7KHz

16KHz

14比特

224Kbps

高保真立體聲音頻(調(diào)頻廣播)

20Hz~20KHz(20Hz

~15KHz)44.1KHz

16比特

單聲道705Kbps

名稱對比項根據(jù)音頻信號是否損失劃分,分為無損壓縮和有損壓縮。無損壓縮法包括不引入任何數(shù)據(jù)失真的各種熵編碼;有損壓縮法又可分為波形編碼、參數(shù)編碼和同時利用這兩種技術(shù)的混合編碼方法。波形編碼(預(yù)測編碼)參數(shù)編碼混合編碼音頻壓縮標準如下表所示。

《返回》音頻編碼算法和國際標準返回幾種典型的音頻壓縮標準G.711PCM,采樣8KHz,->64KbpsG.721ADPCM,64kbps->32kbpdG.722高質(zhì)量,SB-ADPCM,量化比特14bitG.728參數(shù)編碼,矢量量化G.729低碼率的音頻壓縮標準->8kbpsG.723.1->5.3kbps,6.3kbps,用在電話網(wǎng)、移動網(wǎng)、Intenet的語音通信MPEG1AC-3用于音響,HDTV.對6個聲道壓縮->320kbps。采樣48KHz《返回》幾種典型的圖像壓縮標準幾種典型的圖像壓縮標準(1)JPEG靜態(tài)圖像壓縮標準(2)JBIG標準(二值圖像標準)(3)MPEG動態(tài)圖像壓縮標準(4)P×64標準的視頻編碼標準

(5)AVS標準

《返回》第4章要點

5.數(shù)據(jù)壓縮的標準

<3>幾種典型圖像的壓縮標準

①JPEG靜態(tài)圖像壓縮標準(JointPictureExpertsGroup--聯(lián)合圖象專家組)

A.JPEG圖像壓縮的四種工作模式:

a.基于DPCM的無失真壓縮:從左到右、從上到下掃描信號,為每個圖像元素編碼。DPCM,Huffman,無量化。

b.基于DCT順序工作方式:對變換時間長的掃描器,以復(fù)合掃描順序進行圖像編碼。

c.累進工作方式:保證準確恢復(fù)圖像所有樣本值的圖像編碼。由粗到細,多次掃描,先傳低頻,再傳高頻分量(細節(jié))。

d.分層工作方式:以多種分辨率進行圖像編碼,可直接獲得低分辨率圖像,重建復(fù)原全圖。

JPEG標準B.兩種基本壓縮算法(混合)1。基于DPCM的無失真算法(無量化器)圖2。基于DCT的有失真算法下面介紹JPEG標準的基于DCT的有失真算法壓縮原理:JPEG算法基本步驟:

JPEG算法操作可分成以下三個步驟:通過離散余弦變換(DCT)去除數(shù)據(jù)冗余;使用量化表對以DCT系數(shù)進行量化;對量化后的DCT系數(shù)進行編碼使其熵達到最小。

基于離散余弦變換(DCT)的有失真壓縮編碼的編碼過程如下圖所示JPEG標準算法框圖JPEG標準A.離散余弦變換

JPEG采用8×8子塊的二維離散余弦變換算法。1)DCT的實質(zhì)與特點:①利用正交變換實現(xiàn)圖象數(shù)據(jù)壓縮的實質(zhì),是通過圖象取樣信息從空間域轉(zhuǎn)到變換域,其能量集中,保持且近似于不相關(guān),從而保留能量集中部分即可使頻帶壓縮。②DCT的均方誤差編碼性能在理論上最接近于在馬爾科夫模型假定下的最佳統(tǒng)計匹配正交變換(KLT)。③DCT可用快速算法來實現(xiàn)。基于DCT的JPEG算法——

離散余弦變換示意圖8×8的子圖像塊的變換示意圖JPEG標準2)DCT過程(DiscreteCosineTransform)對于8×8的FDCT和IDCT數(shù)學(xué)表達式正交換(正偶數(shù)余弦變換的的歸一化形式)上式表明將圖象f從空間域(xy平面)轉(zhuǎn)換到變換域(uv平面)逆變換圖象譜F從變換域(u,v平面)轉(zhuǎn)換到空間域(x.y平面)。其中:二維DCT可分成行向一維DCT和列向一維DCT組合運算,二維快速DCT是把8×8塊不斷分成更小的無交疊子塊,直接對數(shù)據(jù)塊進行運算操作。基于DCT的JPEG算法——

DCT的可分離性圖示JPEG標準FDCT輸出64個基信號的幅值稱作“DCT系數(shù)”,即DCT變換系數(shù)值。64個變換系數(shù)中包括一個代表直流分量的“DC系數(shù)”和63個代表交流分量的“AC”系數(shù)。IDCT是FDCT的逆過程,它把64個DCT變換系數(shù)經(jīng)逆變換運算,重建一個64點的輸出圖象。在所用設(shè)備的計算精足夠高的前提下,且系數(shù)未經(jīng)過量化,原始的64點信號就能夠精確地恢復(fù)。3)量化基于DCT編、解碼框圖為了壓縮數(shù)據(jù),對DCT系數(shù)要作量化處理,量化的作用是在保持一定質(zhì)量前提下,丟棄圖像中對視覺效果影響不入的信息。量化處理是一個多到1的映射,是造成DCT編解碼信息丟失的根源之一。

JPEG中采用線性非均勻量化器,量化定義為對64個DCT系數(shù)除以量化步長,四舍五入取整.JPEG標準量化表的尺寸與64個變換系數(shù)一一對應(yīng)(64個),量化表元素隨DCT系數(shù)的位置和彩色分量的不同有不同值。它可由用戶規(guī)定(JPEG給出參考值),并作為編碼器的一個輸入。量化表中每個元素值為1到255間任意整數(shù),其值規(guī)定了它所對應(yīng)的DCT系數(shù)的量化器步長。JPEG標準量化的作用是在一定的主觀保真度圖象質(zhì)量前提下,丟掉那些對視覺影響不大的信息,不同頻率的余弦函數(shù)對視覺影響不同,可以根據(jù)不同頻率的視覺閾值來選擇量化表中的元素值的大小。這樣通過心理視覺實驗,去確定對應(yīng)于不同頻率的視覺閾值,以確定不同頻率的量化器步長。JPEG標準JPEG給出量化特性表(示范),根據(jù)心理視覺加數(shù)函數(shù)而得到亮度分量量化矩陣。同時還給出根據(jù)心理視覺加權(quán)函數(shù)而得出的色度分量量化矩陣。這是JPEG給出的參考值。基于DCT的JPEG算法——

亮度量化表和色度量化表亮度分量量化矩陣、色度分量量化矩陣(JPEG中給出的參考值)

低頻分量部分,量化步距較小JPEG標準4)系數(shù)編碼

64個變換系數(shù)經(jīng)量化后,坐標U:V=0的DC系數(shù)是直流分量,即64個空域圖象采樣值的平均值。相鄰塊(8×8)之間的DC系數(shù)相關(guān)性強,JPEG對DC系數(shù)采用DPCM(差分編碼)方法,即DIFF=DCJ-DCj-1。即對相鄰像素塊之間的L系數(shù)的差值進行編碼。基于DCT的JPEG算法——

對DC系數(shù)的編碼根據(jù)DC系數(shù)的特點,JPEG算法使用了差分脈沖調(diào)制編碼(DPCM)技術(shù),即對相鄰塊之間的DC系數(shù)的差值:DIFF=DCi-DCi-1進行編碼。JPEG標準其余63個交流系數(shù)(AC系數(shù))采用行程編碼從左上方Aco1開始,沿對角線方向,以“Z”字形(Zig-Zag)行程掃描,直至AC77掃描結(jié)束。量化后的AC系數(shù)通常會有許多零值,以“Z”字形路經(jīng)進行行程編碼,可增加行程中連續(xù)零的個數(shù),63個AC系數(shù)行程編碼的碼字甚至可用兩個字節(jié)表示.基于DCT的JPEG算法——

Z字形編排

基于DCT的JPEG算法——

對量化AC系數(shù)的Z字形編排編排的方法是按照Z字形的式樣編排。這樣就把一個8×8的矩陣變成一個1×64的矢量,頻率較低的系數(shù)放在矢量的頂部。JPEG標準5)熵編碼為了進一步壓縮數(shù)據(jù),可對DC和AC行程編碼的碼字再作基于統(tǒng)計特性的熵編碼,JPEG建議用哈夫曼(Huffman)或自適應(yīng)二進制算術(shù)編碼。熵編碼步驟:①熵編碼中的中間格式表示②可變長度熵編碼基于DCT的JPEG算法——

熵編碼的步驟

熵編碼可分成兩步進行,首先把DC碼和行程碼字轉(zhuǎn)換成中間符號序列;然后給這些符號賦以變長碼字。基于DCT的JPEG算法——

熵編碼的中間格式表示熵編碼的中間格式由兩個符號組成:符號1(行程,尺寸)符號2(幅值)符號1的高4位表示前后兩個非零AC系數(shù)之間連續(xù)“0”的個數(shù);符號1的低4位表示對后續(xù)非零系數(shù)進行編碼所需要的比特數(shù)。符號2表示后續(xù)非零系數(shù)的實際值。基于DCT的JPEG算法——

對符號1的進行哈夫曼編碼對DC系數(shù)和AC系數(shù)中的符號1采用哈夫曼表中的變長碼(VLC)編碼。哈夫曼變長碼表必須作為JPEG編碼器的輸入。需要注意的是在數(shù)據(jù)流中哈夫曼表的表示格式是一個間接的說明,在解碼時,解碼器利用這一間接說明重構(gòu)真正的哈夫曼表。基于DCT的JPEG算法——

對符號2做可變長度熵編碼符號2用變長整數(shù)(簡稱VLI)碼編碼。VLI是變長碼但不是哈夫曼碼;VLI的碼字是被固化在JPEG建議中,供計算用;JPEG解碼器能夠同時存儲最多4套不同的熵編碼表。JPEG標準6)累進操作方式編碼上述的是DCT順序操作方式。累進操作方式對每個圖象分量的編碼要經(jīng)過多次掃描未完成,第一次進行1次粗糙的壓縮,以便很快地傳輸粗糙圖象,用它來重建一幅度量較低的可識別圖象;第2次掃描作較細的壓縮,只傳送增加的信息,可重建一幅質(zhì)量提高了一些的圖象。不斷累進,直到達到較滿意的圖象質(zhì)量為止。JPEG標準增加一個足以存儲量化DCT系數(shù)的緩沖區(qū),對它們在多次掃描中分批進行編碼。有兩種累進方式:①頻譜選擇法②按位逼近法JPEG標準7)基于DCT的分層操作方式將原始圖象分成多個分辨率進行“錐形”(塔形)編碼方法。水平方向和垂直方向分辨率的下降以2的倍數(shù)因子改變。編碼過程為:①把原始圖象空間分辨率降低。②對"小尺寸"圖采用基于DCT的順序方式,累進方式或無失真予測編碼中位一種編碼方法進行編碼。③對低分辨率的圖象解碼,重建圖象,使用插值濾波器,對它插值,恢復(fù)圖象的水平和垂直分辨率。④把分辨率已提高的圖象作為原始圖象的預(yù)測值,對它們的差值采用基于DCT的順序方式,或累進方式,或無失真方式編碼。⑤重復(fù)③、④直到圖象達到完整的分辨率編碼。壓縮比與恢復(fù)圖像質(zhì)量的關(guān)系返回針對基于DCT的JPEG壓縮算法,在原始圖像每像素采用8比特編碼條件下,定量描述壓縮比與恢復(fù)圖像質(zhì)量的關(guān)系,如下表所示。第4章要點

5.數(shù)據(jù)壓縮的標準

JPEG2000小波MotionJPEG只進行幀內(nèi)編碼

《返回》第4章要點

5.數(shù)據(jù)壓縮的標準

②JBIG標準(JointBilevelImageGroup)

采用無損壓縮技術(shù)。適合于在分組網(wǎng)中傳輸高分辨率的二值圖像(1728×2376或2304×2896),可應(yīng)用于灰度或彩色圖像。有較高壓縮比(10:1)。而傳真標準G3、G4為2:1~4:1。

《返回》③MPEG動態(tài)圖像壓縮標準(MotionPictureExpertsGroup)——MPEG-1、2、4、7

MPEG-1是一個面向家庭電視質(zhì)量級的視頻、音頻壓縮標準;如VCD。

MPEG-2是面向演播級的視頻、音頻壓縮標準。該類數(shù)據(jù)要求的清晰度較高。如DVD、HDTV。

MPEG-4是基于內(nèi)容的數(shù)據(jù)壓縮標準。

MPEG-7是基于內(nèi)容的描述語言和格式的標準。

《返回》MPEG運動圖像編解碼標準標準的內(nèi)涵

MPEG的國際標準分為三個部分,即Systems,Video,audio。①Systems將分別的audio與Video合成為單一數(shù)據(jù)流。②Video和Audio的技術(shù)指標給出了兩者編碼位流的句法與語義。MPEG流

①MPEG1流結(jié)構(gòu)

MPEG1的流具有兩層:

System層包含定時與其它信息,去解復(fù)用audio和Video流,并在回放時同步audio與Video。

壓縮層包括壓縮audio和Video流。下圖表示了MPEG1的解碼系統(tǒng),系統(tǒng)解復(fù)用抽取定時信息,并傳到系統(tǒng)的有關(guān)單元去。系統(tǒng)層支持以下五個基本功能:1)解碼時多條壓縮流的同步;2)多條壓縮流交織為一個單一流;3)為啟動解碼而對緩沖區(qū)進行初始化;4)連續(xù)的緩沖區(qū)管理;5)時間標識。系統(tǒng)還解復(fù)用video與andio流并傳到相應(yīng)的解碼器去。

Video解碼器解壓縮的視頻流在MPEG標準的PartI中描述。C-Cube公司目前有CL450,CL480/484和CL9100等解碼器。②MPEG-2流結(jié)構(gòu)

MPEG-2定義了兩類系統(tǒng)流:Program(節(jié)目流)和transport(傳輸流)。兩者的復(fù)用流組成了Video與audio的基本的流,兩者均被分別捆包傳送。一個MPEG多路復(fù)用比特流可以是傳輸流(TS)或節(jié)目流(PS)。兩種流均由PES分組包或包含其他必要信息的分組構(gòu)成。兩種流類型均支持來自具有一個共同時間基準節(jié)目的視頻和音頻壓縮流的復(fù)用。傳輸流TS還支持來自具有獨立時間基準的多個節(jié)目的視頻和音頻壓縮流的復(fù)用。對于幾乎不發(fā)生差錯的環(huán)境而言,節(jié)目流通常更為合適,并且支持節(jié)目信息的軟件處理。傳輸流更適合于可能出錯的環(huán)境。一個傳輸流包括一或多個節(jié)目。視頻與音頻基本流由訪問單元組成。節(jié)目流編碼層允許將具有一個或多個基本流的一個節(jié)目組合成一個單一流。來自于各基本流的數(shù)據(jù)與那些允許節(jié)目中的基本流同步播放的信息復(fù)用一起。一個節(jié)目流包含來自于一個節(jié)目的復(fù)用在一起的一個或多個基本流。基本流數(shù)據(jù)攜帶于PES分組包中,PES分組包由分組頭及其后的分組包數(shù)據(jù)組成。一個MPEG多路復(fù)用比特流,不論是傳輸流還是節(jié)目流,其結(jié)構(gòu)分兩層:最外層是系統(tǒng)層,最內(nèi)層是壓縮層。系統(tǒng)層提供了使用系統(tǒng)中一個或多個壓縮數(shù)據(jù)流所必需的功能。MPEG規(guī)范的音頻和視頻部分定義了音頻和視頻數(shù)據(jù)的壓縮編碼層,并被系統(tǒng)層支持。③

視頻流數(shù)據(jù)層次

MPEG-1與MPEG-2標準定義了視頻流數(shù)據(jù)結(jié)構(gòu)的層次如下圖所示。比特流的語法層及其功能其中包括:

VIDEOSequence它由一系列的頭,一個或多個圖片組,和一個序列結(jié)束碼組成,它是前面所定義的視頻數(shù)據(jù)流的另一個術(shù)語。

Groupofpictures它是一個或多個圖片系列。允許隨機訪問其序列。

Picture一個視頻序列的基本編碼單元,圖片由三個正交的本色組成,包括亮度Y,兩個色度CbCr的值,Slice一個或多個結(jié)構(gòu)宏塊、在Slice里宏塊的順序是從左到右,從上到下。在差錯處理時Slice是很重要。如果位流有一個錯誤、解碼器可以是下一個Slice的起點,這有利于改善圖像質(zhì)量。Mocroblock一個16-pixelX16-line的亮度成分區(qū)和相應(yīng)的色度分量的8-pixelX8-line區(qū)。Block幀間圖像編碼(Inter-PictureCoding)①

圖片類型

MPEG標準專門定義3種圖片類型:intra,predicted和Bidirectional。Intra-Pictures即稱Ⅰ圖,編碼時僅使用本圖信息,Ⅰ圖提供所有可能的隨機訪問點進入壓縮的視頻數(shù)據(jù),Ⅰ圖僅使用變換編碼,因此它提供適度的壓縮倍數(shù),典型的約每象素2位為宜。PredictedPictures稱為P圖,它被編碼時考慮最接近的前面的Ⅰ或P圖,這種技術(shù)稱之為朝前預(yù)測,如下圖BidirectionalPictures稱為B圖,它使用過去的或前面的圖為參考,這種技術(shù)稱為雙向預(yù)測,如下面圖所示,B類圖提供最大的壓縮并不會產(chǎn)生誤差,因為它從不用為參考圖,雙向預(yù)測還減少了噪聲的影響,由于它對兩幀起了平均作用。②

視頻流I.P.B典型布局MPEG算法允許編碼時選擇頻率并定位Ⅰ圖,這種選擇基于對隨機訪問性在應(yīng)用時的需要,并定位在視頻序列里場景的剪切。在應(yīng)用中隨機訪問是重要的,I圖典型地用于每秒兩次。編碼器還選擇任意一對(Ⅰ或P)圖片間的雙向圖片數(shù)、這一選擇是基于某種因素,比如在編碼器里的存儲量、以及被編碼對象的特性,對于大的一類場景,工作的參數(shù)必須有雙向圖片分別作為連續(xù)的參考圖。下圖表示一個典型的I、P和B圖的安排,按顯示順序布局。MPEG編碼器在視頻流里重排圖片順序,提交給解碼器,以最有效的序列方式來表示圖片。實際上,在組合B圖之前Ⅰ圖需要重構(gòu)B圖來傳送。下圖表示了C-Cube公司的編碼的例子③MotionCompensation運動補償運動補償是用來消除時域冗余,增強P圖與B圖的壓縮效果的一種技術(shù).運動補償算法在宏塊內(nèi)進行。當一個宏塊由運動補償來壓縮時,壓縮文件包含以下信息:

a)在基準和被編碼的宏塊之間存在的空間差異。

b)在基準和被編碼的宏塊之間存在的內(nèi)容差異。不是在圖片里的所有的信息都可以由前面的圖片來預(yù)測的。例如考慮一個場景打開一扇門:在門后房間里的細節(jié)是不可能由前面的幀來預(yù)測的,因為在此之前門是關(guān)著的。當在某種情況下宏塊用P圖不能用運動補償來有效的表示。這時要用Ⅰ圖并使用變換編碼技術(shù)。B和P圖運動補償之間的差別在于:在P圖里宏塊僅使用前面的參考(I或P-圖),而在B圖里宏塊編碼使用過去的或?qū)淼膱D的任意結(jié)合。幀內(nèi)圖片(變換)編碼MPEG變換編碼算法包括下列步驟;a)離散余弦變換(DCT)b)量化Quantizationc)游程碼RLE編碼圖象塊與預(yù)測誤差塊有高的空域冗余度,為了減少冗余,MPEG算法用DCT變換8×8象元塊或8×8的誤差塊到頻域。下一步算法量化頻率系數(shù),量化是估計每個頻率系數(shù)為一個允許值的有限數(shù)之一的過程。編碼器選擇一個量化矩陣來決定如何量化8X8塊里的每個頻率系數(shù)。人類對于高頻的量化誤差感覺是低的,因此高頻比低頻量化得更粗糙些。DCT與量化的結(jié)合引起很多頻率系數(shù)為零,特別對高頻更是如此。為了發(fā)揮其長處,這些系數(shù)被組織為Z順序,用來產(chǎn)生較長的零過程。某些象素塊需要此其它的編碼更精確,例如,較平緩的密度梯度的塊需要精確編碼以避免可看到塊邊緣,為了處理塊之間的這種不均勻性,MPEG算法允許對每個16×16象元塊做一定的量化修正。這一機制還可被用來對特殊的位流提供平滑自適應(yīng)。同步MPEG標準提供時間同步機制去保證音頻與視頻的同步。MPEG-1標準定義兩個參數(shù)用來解碼:Systemclockreference(SCR)與Presentationtimestamp(PTS)。

MPER-2標準增加了programclockreference(PCR),同時也提供SCR與PCR去解決27MHz的擴展問題。返回MPEG4—Codingofaudio&Visualobjects.1)基于內(nèi)容(Based-contents)的編碼。2)Integration:考慮單、立體與多通道的音頻,二維、三維單色、立體或多視點的視頻。3)flexibilityandextensibility.MPEG-4編碼器軟件模型框圖返回MPEG-7多媒體內(nèi)容描述接口,規(guī)定一套可用于描述各種多媒體信息的描述符的標準,它與多媒體信息內(nèi)容一起,支持用戶對其感興趣的資源快速,有效撿索。應(yīng)用領(lǐng)域:

1)數(shù)字化圖書館(包括圖象分類圖象、音樂字典等)

2)多媒體目錄服務(wù)

3)廣播式媒體選擇(包括個人電子新聞服務(wù),媒體著作等)

4)旅游、文化、地理信息系統(tǒng)。返回第4章要點

5.數(shù)據(jù)壓縮的標準

④P×64標準的視頻編碼標準電話與會議電視業(yè)務(wù)的需要視聽業(yè)務(wù)視頻編解碼CODEC,H.261建議,俗稱p64Kbit/s(P=1~30).支持實時動態(tài)圖像的壓縮編解碼。標準中P是一個可變參數(shù),取值為1~30。P=1或2時,僅能支持桌面上的面對面直觀通信(即64Kbps或128Kbps);當P≥6時,支持通用中間格式每秒幀數(shù)較高活動圖像的電視會議。《返回》

H.261建議實際上是H.261標準CIF\QCIF;352*288幀間預(yù)測---DCT---Huffman、I幀/P幀;對稱數(shù)據(jù)流四個層次:塊層、宏塊層、塊組、圖象層為了適應(yīng)寬帶傳輸需要H.262建議(ISO/IEC13818標準)發(fā)展新的預(yù)測法和變換編碼法H.263建議。H.261主要技術(shù)參數(shù)

1)傳輸速率視頻信號編碼傳輸速率為p64Kbit/s(P=1~30)

建議使用的視頻比特率介于40Kbit/s~2Mbit/s之間。2)圖像尺寸

H.261的圖像尺寸格式如下表(1)H.261建議的圖像尺寸為一幀電視信號就是一幅圖像、視頻編碼圖像格式可歸納如下表:視頻復(fù)用編碼器1)視頻復(fù)用按4層結(jié)構(gòu)如下圖像層組塊宏塊塊(1)幀圖像層(PICTURELAYER)

每幅圖像的數(shù)據(jù)由圖像頭構(gòu)成,GOB的數(shù)據(jù)緊隨其后,結(jié)構(gòu)如下圖,丟棄的圖像的圖像頭不發(fā)送。(2)塊組層GOB每一幅圖像都被劃分成若干塊組(GOB)。一個塊組由1/12個CIF或1/3個QCIF的圖像區(qū)組成如下圖。一個GOB由176個像素乘48行構(gòu)成。(3)宏塊層每個GOB被劃分成33個宏塊,如下圖,一個宏塊為16×16,而Cb,Cr為8×8。宏塊的數(shù)據(jù)由MB頭組成,其后是塊數(shù)據(jù),如下圖。MQUANT,MVD和CBP的存在與否由MYTPE指示。(4)塊層宏塊由4個亮度塊和2個色差塊組成如下圖,塊數(shù)據(jù)由變換系數(shù)碼字和跟隨其后的塊終止標號組成。ITU-TH.263建議

H263是ITU-I標準,于1995年公布,設(shè)計來為低比特率通信用,早先的草案指定數(shù)據(jù)率小于64Kbits/s,后來取消了這一限制,希望能適用于寬范圍的比特率,不僅僅是低比特率應(yīng)用,在許多應(yīng)用中H.263取代了H.261。

返回H.263低比特率標準30Kbps用于電信部門,電話線、Modem28.8kbps/33.6Kbps/56Kbps支持多種格式Sub-CIF\QCIF\CIF\4CIF\16CIF效率不高,仍會有馬賽克

H.263的編碼算法類似于H.261,但有某些改進與變化,以利于提高性能和錯誤恢復(fù)。H.261與H.263編碼算法的區(qū)別在于:半象素精度(Halfpixelprecision)用于運動補償,而H.261使用全象素精度和循環(huán)濾波。數(shù)據(jù)的層次結(jié)構(gòu)某些部分是供選擇的,所以Codec能被構(gòu)成為低數(shù)據(jù)率或較好的錯誤恢復(fù)。有4種選擇的編碼方法用于改善性能H.263支持五種分辨率,它在H.261支持的QCIF和CIF的基礎(chǔ)上增加了SQCIF,4CIF,16CIF。SQCIF是QCIF的半精度,而4CIF與16CIF是CIF的4倍與16倍分辨率。H.324標準ITU從1993年開始著手制造一套新的多媒體通信技術(shù)標準。概括如下表:H.324多媒體系統(tǒng)總體結(jié)構(gòu)

(1)首要區(qū)別是增加了數(shù)據(jù)接口(2)它把數(shù)據(jù)調(diào)制解調(diào)器也包括了進去。它的復(fù)接和解復(fù)接部分H.223比H.221復(fù)雜(H.221只是視頻和音信號的復(fù)接)。(3)音頻編解碼器G.723主要用來作為語音信號的壓縮和解壓縮。本來采用G.723代號但發(fā)現(xiàn)它已被采用為ADPCM標準。所以改為G.723.1。(4)標準的數(shù)據(jù)通信應(yīng)用包括了應(yīng)用于實時語音圖形會議的T.120,用于簡單的點對點靜止傳輸?shù)腡.84,用于簡單的點對點文件傳輸?shù)腡.434,用于遠維離攝像機控制的H.224/H.281以及ISO/IECIR9577包括PPP和IP在內(nèi)的網(wǎng)絡(luò)協(xié)議,用戶數(shù)據(jù)緩存的V.14或LAPM/V.42也包括在內(nèi)。實測表明,當用28.8kbpsMODEM連接時,其電視畫面不夠連續(xù),只有在48kbps時,才能得到滿意的圖象。AVS視頻標準AVS視頻標準AVS視頻標準的制定過程方案的討論與確定(02年8月到12月)兩種可能與H.264的基本層兼容完全獨立的方案技術(shù)的征集和評估(02年12月至今)AVS視頻標準熵編碼反量化反變換運動補償預(yù)測控制數(shù)據(jù)量化后的變換系數(shù)運動數(shù)據(jù)幀內(nèi)/幀間編碼控制解碼器運動估計變換/量化-0環(huán)濾波幀內(nèi)預(yù)測返回技術(shù)征集技術(shù)類型征集技術(shù)幀間和幀內(nèi)預(yù)測技術(shù)(Inter&IntraPrediction)BFrame(清華)Interlace(清華)Sub-pixelInterpolation(浙大)MVPrediction&Coding(北工大,北航)IntraPrediction(清華)SkipMode變換和量化(Transform&Quantization)WaveletTransform(Integer)(華工)DCT(計算所,北工大)變換系數(shù)掃描(CoefficientScan)AlternateScan(計算所)熵編碼器(EntropyCoding)VLC(華工,計算所,北航)CABAC濾波器(Filtering)In-loopdeblockingfilter(華工,浙大,自動化所)文件格式(FileFormat)startcode(華為)High-levelsyntax(華為)AVS視

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論