剖析 MPEG-2 視頻編碼器_第1頁
剖析 MPEG-2 視頻編碼器_第2頁
剖析 MPEG-2 視頻編碼器_第3頁
剖析 MPEG-2 視頻編碼器_第4頁
剖析 MPEG-2 視頻編碼器_第5頁
已閱讀5頁,還剩3頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、剖析 MPEG-2 視頻編碼器 06-09-06 15:59:00 作者:未知編輯:studa201. MPEG-2標準簡介現(xiàn)有MPEG-2視頻標準的技術規(guī)范集包括6類(profile)4級(level)組成,并采用分級編碼。所謂級是指MPEG-2的輸入格式,標識從有限清晰度的VHS 質量圖象到HDTV圖象,每一種輸入格式編碼后都有一個相應的范圍。. 低級LL(Low Level):圖象輸入格式的象素是ITU-R Rec.BT 601格式的 1/4,即352*240*30或352*288*25,相應編碼的最大輸出碼率為4Mbps。. 主級ML(Main Level):圖象輸入格式符合ITU-R

2、 Rec.BT 601格式,即720*480*30或720*576*25。相應編碼的最大輸出碼率為15Mbps。高級類20Mbps。. 1440高級H14L(High 1440 Level): 是1440*1152*25的高清晰度格式。相應編碼的最大輸出碼率為60Mbps。高級類80Mbps。. 高級HL(High Level):圖象輸入格式為1920*1152*25的高清度格式。相應編碼的最大輸出碼率80Mbps。高級類為100Mbps。 所謂類是指MPEG-2的不同處理方法,每一類都包括壓縮和處理方法的一個集合。不同的類意味著使用不同集合的碼率壓縮工具。越高的類編碼越精細,而每升高一類將提

3、供前一類沒有使用的附加工具,當然實現(xiàn)的代價會更高。而解碼器卻是向下兼容的,任何一種高級類解碼器,均應能解碼用低級類方法編碼的圖像。MPEG-2共分6類:簡單類SP(Simple Profile);主類MP(Main Profile),它比簡單類增加了一種雙向預測方法,在相同比特率的情況下,將給出比簡單類更好的圖像。主類的擴展類P(Profile),主要是由Tektronic公司和SONY公司在主類的基礎上推出的更適用于演播室視頻節(jié)目制作要求的數(shù)據(jù)壓縮處理方法。信噪比可分級類SNRP(SNR Scaleable Profile);空間可分級類SPP(Spatially Scaleable Pro

4、file)和高級類HP(High Profile)。前兩種可分級工具允許將編碼的視頻數(shù)據(jù)分為基本層和上層信號。基本層表示編碼圖像的基本數(shù)據(jù),但代表的圖像質量低;上層信號則可用來改進信噪比或清晰度。這就意味著有時解碼器可以忽略比特流中的增強部分,而只解碼比特流中的基本部分,仍可得到有用的圖像序列,只不過此時所得的圖像分辨率低一些,或者幀速率低一些,或者質量低一些。現(xiàn)有數(shù)字電視廣播系統(tǒng)就利用了MPEG-2的這種可分級性,使數(shù)字信號能同時覆蓋接收條件好的和接收條件差的地區(qū),并使能接收和不能接收的區(qū)域過渡更為平滑,同時粗編碼的低層信號可以有較強的抗干擾能力,可以有更大的覆蓋范圍。由于MPEG-2不僅消

5、除了空間上的冗余,而且消除了時間上的冗余,因此使用MPEG-2可以在比較大的壓縮比的情況下保持較好的圖像質量,SONY的Betacam-SX采用10:1壓縮,數(shù)據(jù)率為18Mb/S是現(xiàn)有數(shù)字錄象機中最低的,有利于高速傳輸與存儲。另外,MPEG-2還具有如下特色: 1 輸出碼率流速率可適應同步或異步傳輸,無需固定; 2 適應于逐行或隔行掃描系統(tǒng); 3 可用于4:2:0、4:2:2、4:4:4等亮、色取樣; 4 按清晰度可以將圖象分為4個等級,高級解碼器可與低級解碼器實現(xiàn)下兼容; 5 按使用的工具和方法不同分為5種類型,即允許分層性編碼,以保證不同的傳輸與接收要求。 MPEG-2的這種開放性的優(yōu)點,

6、決定了Betacam-SX將來可直接與眾多公司生產的數(shù)字視頻系統(tǒng)連接,進行數(shù)據(jù)交換、傳輸、制作而不需任何數(shù)字的轉換設備,就連一貫采用M-JPEG數(shù)字壓縮算法的非線形編輯領域也在積極向MPEG-2靠攏。Matrox、品尼高等一些非線形軟、硬件主流產品廠商也已經宣布將于99年第一季度推出采用MPEG-2壓縮算法的視頻板卡及軟件,無疑這其中受益的是Betacam-SX,而且Betacam-SX本身還推出了一種盤帶結合型錄象機,為進行非線形編輯提供了更加優(yōu)越的條件。另外, MPEG-2將是廣播電視向全數(shù)字化過渡的最佳選擇也逐步被大多數(shù)視頻專業(yè)人士認可,所以美國以及西方各國普遍以MPEG-2標準作為數(shù)字

7、HDTV圖像壓縮編碼系統(tǒng)的核心,這無疑又為Betacam-SX的未來發(fā)展提供了一個優(yōu)越性。 四Betacam-SX的零幀編輯 最初的MPEG-2標準是為視頻分配而設計的,為家庭提供一個可接受的圖象質量,但是由于有限的數(shù)據(jù)率(最大為15Mb/S)和采用4:2:0取樣,它的質量并不適合專業(yè)制作和后期制作,4:2:0的取樣結構也不能達到演播室對多代復制所要求的圖象質量,采用小型GOP(Group Of Picture)結構和15Mb/S的數(shù)據(jù)率不能產生所需的圖象質量,大型的GOP結構又令演播室的信號切換很困難也不能實現(xiàn)零幀編輯,因此很多的錄象機采用幀內DCT處理,造成在整個節(jié)目到播出的鏈條中,節(jié)目制

8、作是唯一不使用MPEG-2的部分。SONY公司在與大批廠商的共同努力下,順應了發(fā)展的趨勢率先推出采用MPEG-2 MPML的改進型MPEG-2 4:2:2 PML壓縮算法的Betacam-SX,以兩幀(I幀和B幀)作為一個GOP,既保證了廣播級的圖像質量,又實現(xiàn)了高穩(wěn)定性以及高速的數(shù)據(jù)傳輸,但是最初我們還是有一點疑問,就是Betacam-SX如何實現(xiàn)零幀編輯,這恐怕也是很多家電視臺在選擇數(shù)字錄象機時的疑慮之處。在解釋Betacam-SX如何實現(xiàn)零幀編輯之前,首先讓我們先看一看其它采用幀內壓縮的數(shù)字錄象機是如何進行零幀編輯的。 在進行復制或編輯時,目前數(shù)字錄象機通常都使用串行數(shù)字(SDI)或模擬

9、接口相連接的。因為即使裝配了傳輸壓縮數(shù)字信號的接口(如:SDTI、QSDI等),那么它只能應用在復制操作中,而一旦需要疊加字幕或在系統(tǒng)使用時,也必須使用SDI或模擬接口。 與之對應,解碼也可分成三部分,解復用. 拆包和視頻解碼及音頻解碼。MPEG-2視頻ES結構可分為6層:視頻序列層。定義整個視頻序列的結構,是節(jié)目的隨機進入點。圖像組層(GOP)。支持圖象解碼過程中的隨機存取功能,GOP是視頻編輯的隨機進入點。圖像層。包含一幅圖象(幀)的所有編碼信息,是編碼處理的單位。象條層。在反DCT變換時提供同步的功能。宏塊層。宏塊是運動補償處理的單位。由亮度塊和色度塊組成,包含P幀 B幀的運動矢量。 象

10、塊層。象塊層是DCT變換的單位,提供DCT系數(shù)。3. MPEG-2的編碼方式MPEG-2有三種編碼方式:幀內壓縮編碼方式, 見圖3;幀間壓縮編碼方式,見圖4;幀內及幀間壓縮編碼方式, 見圖5。壓縮就是將視頻信號中冗余減少的過程,首先必須識別每個視頻場和幀中的冗余,這主要包括空間與時間上的冗余。去除視頻信號空間冗余可通過DCT變換來完成,DCT變換是一個無信號損失的雙向數(shù)學過程。它將空間分布的變化程度轉變成重現(xiàn)空間分布所需的頻率帶寬。變換所得到的系數(shù)值既可以代表不斷增加的更高的垂直和水平空間頻率,也可以代表不同的水平和垂直空間頻率組合。視頻信號經過DCT變換后,較高的空間頻率系數(shù)會變得非常細小,

11、而據(jù)人眼的視覺特性,較高的空間頻率系數(shù)可以少量的比特來表示,或者完全去掉而不影響圖像質量。在實際應用時為保持信號的可逆性和無損性,常常采用更多的比特來表示DCT系數(shù)。去除視頻信號時間冗余,可使用有運動補償?shù)膸g預測來完成。對于活動圖像多數(shù)情況下只是其中的很少一部分圖像在運動,即使有大范圍的活動部分,前后幀盡管有很大區(qū)別,但移動物體本身大多數(shù)情況下是相同的。因此只需要找到圖像中某一部分運動了多少就可以在前一幀找到相應圖像的內容,這個查找過程稱為運動估值,其表達方式是運動矢量;而把前一幀相應的運動部分補過來,得到其剩余的不同部分的過程稱為運動補償。就這樣,采用運動補償可以有效地去除視頻信號在時間方

12、向的重復信息,達到壓縮的目的。為了達到減少數(shù)據(jù)的目的,MPEG-2將4:2:2轉換成4:2:0,并且通過量化,將代表每一個系數(shù)的比特數(shù)目減少。一般使用11比特來代表DCT系數(shù),對于其他系數(shù)則采用較小的比特數(shù)目。每一個或每組宏塊都有不同的量化刻度,對每個宏塊采用不同的量化因數(shù),使只含幀內壓縮的MPEG能提供比同樣圖像質量的M-JPEG多出10%-20%的壓縮效果。而相對于原來的DCT系數(shù)的數(shù)據(jù),量化表及被量化的系數(shù)數(shù)據(jù)量要小得多。在量化過程后,無損數(shù)據(jù)壓縮是通過可變長度編碼VLC和游程長度編碼RLC實現(xiàn)的。VLC是在數(shù)據(jù)內尋找共同的圖案或字符,采用較小數(shù)量的比特為經常出現(xiàn)的數(shù)值進行編碼,而用較多

13、數(shù)量的比特為較少出現(xiàn)的數(shù)值進行編碼。RLC是用一個字符代表一串一定數(shù)目的零。總的目的只有一個,減少數(shù)據(jù)量。量化表控制是一個決定如何量化DCT系數(shù)的過程;輸出緩存可維持數(shù)據(jù)流,并提供量化器的控制,從而限制或維持數(shù)據(jù)流在一個一定的水平。在實 實際應用中,當壓縮數(shù)據(jù)被錄像機記錄時,需要提供一個持續(xù)不變的比特率,以使機械部分以穩(wěn)定的速率旋轉掃描機構。而對于硬盤記錄來說,又需要一個可變速的比特率。通常,一個可變速比特率是提供一個持續(xù)不變質量水平的較好選擇。幀間壓縮一般是在未壓縮的圖像上進行,是一個無損過程。在圖4中,在參考幀幀存中有一副完全解析度,完整數(shù)據(jù)的前一副圖像。在預測幀幀存中擁有一個根據(jù)前一幀和

14、運動矢量所建立的預測的當前幀。輸出是預測的當前幀與實際當前幀相減后的差值。若沒有運動或其他變化,當前幀便可得到完美的預測,差分幀輸出為 0(極易壓縮)。當前一幀和后一幀有點不同時,差分幀仍有少量數(shù)據(jù)需要壓縮。采用幀內壓縮編碼形成的圖像稱為I幀,形成過程見圖3;采用幀內及幀間壓縮編碼形成的圖像稱為B幀和P幀。P 幀為前向預測幀,是以前一個I 幀為預測幀進行編碼的。在I 幀和P 幀中間可以插入若干個B 幀,B 幀是從相鄰的最近的I 幀或P 幀作雙向預測進行編碼的。形成P幀時參考幀幀存只要求存儲一幀圖象,而形成B幀時,參考幀幀存則需存儲前后兩幀圖象。由三種相互間有預測與生成關系的不同的幀數(shù)據(jù),I 幀

15、 P幀 B幀數(shù)據(jù)按照不同的組合組成圖像組(GOP) ,再加上序列起始碼和序列頭等數(shù)據(jù)組成圖像序列或ES,ES再打包成PES;PES再按188byte的固定長度加上各種參數(shù)組成傳送碼流TS。4. 從MPEG-2 MPML到MPEG-2 PML目前業(yè)界流行的數(shù)字錄像機,采用的均是Digital-S. DVCPRO. DVCCAM 與Betacam-SX四種格式。這四種格式中,前3種采用的均是M-JPEG標準的幀內壓縮場編碼的方式, 只有SONY公司推出的Batecam-SX格式采用了MPEG-2標準,但它采用的是MPEG-2 4:2:2 PML 而不是MPEG-2 4:2:0 MPML 。原因在于:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論