




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、1多多 媒媒 體體 技技 術術第第4 4章章2第第3章章 多媒體數據多媒體數據壓縮編碼技術壓縮編碼技術n3.1 概述n3.2 數據壓縮的基本方法n3.3 靜態圖像壓縮編碼國際標準JPEGn3.4 運動圖像壓縮編碼國際標準MPEGn3.5 音頻數字化與壓縮編碼技術3第第3章章 多媒體數據多媒體數據壓縮編碼技術壓縮編碼技術n多媒體數據壓縮編碼的重要性u數據冗余類型u數據壓縮技術的分類4第第3章章 多媒體數據多媒體數據壓縮編碼技術壓縮編碼技術n媒體數據壓縮編碼的重要性u 信息時代的重要特征是信息的數字化。u 早期的計算機系統采用模擬方式表示信息,但存在著明顯的缺點:u 經常會產生噪音和信號丟失,并且
2、在復制過程中逐步積累噪音和誤差。u 模擬信號不適合數字計算機加工處理。5媒體數據壓縮媒體數據壓縮編碼的重要性編碼的重要性n 數字化后未經壓縮的視頻和音頻等媒體信息的數據量是非常大的 1. 圖像數據量的大小可用下面的公式來計算: 圖像數據量圖像的總像素色彩深度8 ( 單 位 為 B y t e , 簡 寫 為 B ) 例如,一幅640480、24位(bit)真彩色 的 圖 像 , 其 文 件 大 小 為 :64048024 8 921.6KB6媒體數據壓縮媒體數據壓縮編碼的重要性編碼的重要性n 2. 雙通道立體聲激光唱盤,采用脈沖碼調制采樣,采樣頻率為44.1KHz,采樣精度16位,其一秒鐘時間
3、內的采樣數據量為: 44.110001628176.4 KB 一個650MB的CDROM,大約可存1小時的音樂。7媒體數據壓縮媒體數據壓縮編碼的重要性編碼的重要性n 3. 對動態圖形和視頻圖像。例如對于彩色電視信號,設代表光強Y的帶寬為4.2MHz、色彩I為1.5MHz和色飽和度Q為0.5MHz,采樣頻率2倍原始信號頻率,各分量均被數字量化為8位,從而1秒鐘電視信號的數據量為: (4.21.50.5)281000000812.4 MB8媒體數據壓縮媒體數據壓縮編碼的重要性編碼的重要性u 容量為650MB的CDROM僅能存1分鐘的原始電視數據。若為高清晰度電視(HDTV)其1秒鐘數據量約為150
4、MB(1.2Gbps8),一張CDROM還存不下5秒鐘的HDTV圖像。n 巨大數字化信息的數據量對計算機存儲資源和網絡帶寬有很高的要求,解決的辦法就是要對視、音頻的數據進行大量的壓縮。播放時,傳輸少量被壓縮的數據,接收后再對數據進行解壓縮并復原。9數據冗余類型數據冗余類型u 1. 空間冗余u 基于離散像素采樣來表示物體顏色的方式通常沒有利用景物表面顏色的這種空間相關性,這些相關性的光成像結構在數字化圖像中就表現為空間冗余。我們可以通過改變物體表面顏色的像素存儲方式來利用空間相關性,達到減少數據量的目的。10數據冗余類型數據冗余類型u 2. 時間冗余u 時間冗余反映在圖像序列中的相鄰幀圖像(電視
5、圖像、動畫)之間有較大的相關性,一組連續畫面中的相鄰幀往往包含相同的背景和移動物體,只不過移動物體所在的空間位置略有不同,把一幀圖像中的某物體或場景可以由其他幀圖像中的物體或場景進行處理后重構出來,可以大大減少時間冗余。11數據冗余類型數據冗余類型u 3. 結構冗余u 有些圖像具有較強的相似性的紋理結構,例如布紋圖像和草席圖像,方格狀的地板圖案等,我們稱此為結構冗余。u 4. 知識冗余u 有許多圖像的理解與某些基礎知識有相當大的相關性,這類規律性的結構可由先驗知識和背景知識得到,我們稱此類冗余為知識冗余。根據已有的知識,我們可以構造圖像物體的基本模型,并創建圖像庫。12數據冗余類型數據冗余類型
6、u 5. 視覺冗余u 人的接收系統如視覺系統和聽覺系統是有一定限度的,人眼并不能察覺圖像場的所有變化,如人類視覺系統分辨能力約為64灰度等級,而一般圖像量化采用256灰度等級,這類冗余我們稱為視覺冗余。u 6. 聽覺冗余u 人耳的敏感性不能察覺所有頻率的變化,存在聽覺冗余。13數據壓縮技術數據壓縮技術 的分類的分類n 根據多媒體數據冗余類型的不同,解碼后數據與原始數據是否完全一致、質量有無損失來進行分類,壓縮方法可被分為有失真編碼和無失真編碼兩大類。u 無失真壓縮法也稱無損壓縮,無失真壓縮的特點是壓縮比較小,大約在2l至5l之間,主要用于文本數據、程序代碼和某些要求嚴格不丟失信息的環境中,常用
7、的無失真壓縮編碼有如哈夫曼編碼等。14數據壓縮技術數據壓縮技術 的分類的分類u 有失真壓縮法也稱有損壓縮,有失真壓縮法的冗余壓縮取決于初始信號的類型、前后的相關性、信號的語義內容等,壓縮比可以從幾到幾百倍,常用的有失真壓縮編碼技術有預測編碼、變換編碼、模型編碼、混合編碼方法等。主要用于壓縮圖像、聲音等信息。15n 常用的圖像和視頻壓縮方法如圖3-1所示:圖像和視頻壓縮方法圖像和視頻壓縮方法哈夫曼編碼哈夫曼編碼行程編碼行程編碼算術編碼算術編碼LZW編碼編碼DCT編碼編碼小波變換小波變換子帶編碼子帶編碼無失真壓縮無失真壓縮有失真壓縮有失真壓縮預測編碼預測編碼變換編碼變換編碼模型編碼模型編碼運動補償
8、運動補償混合編碼混合編碼分形編碼分形編碼JPEGMPEGH. 261數據壓縮技術數據壓縮技術 的分類的分類16行程(游程)行程(游程)RLE 編碼技術編碼技術n 行程編碼主要思路是用編碼器不斷比較信息源符號相鄰元素值的變化幅度,一旦發現有明顯的變化,就開始一個行程。編碼器檢測每一個行程起點位置開始的多次重復的比特或者字符序列,然后將一個相同值的連續串出現次數作為行程長度,并將行程長度轉換成代碼,再取用信息源符號的一個代表值作為代碼,這種編碼稱為行程編碼,或稱游程編碼,常用RLE表示。17對一幅兩維圖像對一幅兩維圖像F F(i i,j j)作水平)作水平掃描后得到的部分像素的像素值掃描后得到的部
9、分像素的像素值18行程(游程)行程(游程)RLE 編碼技術編碼技術n 用RLE對這一行數據編碼后得到的碼字表:n RLE編碼壓縮編碼技術尤其適用于: 計算機生成的圖形圖像和黑白二值圖像的編碼,解壓縮速度很快。RLE的壓縮率的大小取決于圖像本身的特點,可以得到較大的壓縮比。對復雜的圖像不適宜用RLE進行編碼。編編碼碼位位 1 2 3 4 5 6 7 8 9 10 11 12 13 14碼碼字字 8 6 4 8 4 7 8 7 4 6 4 5 5 5編編碼碼位位 15 16 17 18 19 20 21 22 23 24 25 26碼碼字字 3 3 8 3 3 3 5 2 4 1 4 019哈夫曼
10、編碼技術哈夫曼編碼技術n 假設一個信息源能產生的事件序列中的事件取自一個有限事件集,事件集S中的任一事件Si發生的概率為P(Si)都相等,即P(Si) 1/S,則 其 所 能 攜 帶 的 信 息 量 I ( S i ) 定 義 為: I(Si)log2 1/S log2 P(Si) (33) 這里P(Si)是信息源產生的事件為Si的概率。等式右邊加一負號的目的是保證I(Si)的數值不為負值。定義中用2為底的對數,并規定信息量I(Si)的計量單位為比特(bit)。20哈夫曼編碼技術哈夫曼編碼技術n 哈夫曼編碼屬于一種變字長碼,把信息源事件按概率大小順序排列,對出現概率大的信息源事件賦予短碼字,而
11、對于概率小的信息源事件賦予長碼,只要碼字長度按照信息出現的概率大小逆順序排列,可通過數學證明這一結論:平均碼字長度一定小于其它任何事件順序的排列方式。21哈夫曼編碼技術哈夫曼編碼技術n 哈夫曼編碼一般過程如下:u 1. 把事件(消息)按出現的概率由大到小排成一個序列。如P(1)P(2)P(3)P(Sm-1)P(Sm) ,即將信息源事件按概率遞減順序排列。u 2. 把其中兩個最小的概率P(Sm-1) ,P(Sm)挑出來,且將事件“1”賦給其中最小的,即P(Sm)1;事件“0”賦給另一稍大的即P(Sm-1) 0。22哈夫曼編碼技術哈夫曼編碼技術u 3. 把兩個最小概率相加作為新事件的概率,即 求
12、出 P ( S m - 1 ) , P ( S m ) 之 和 P ( S i ) : P ( S i ) = P ( S m - 1 ) 十 P ( S m )設P(Si)是對應于一個新的消息的概率。u 4. 將P(Si)與上面未處理的(m2)個消息P(Sm-2)的概率重新由大到小再排列,構成一個新的概率序列。u 5. 重復步驟2),3),4),在每次合并信息源時,將被合并的信源分別賦“0”和“1”直到所有m個事件的概率均已全部合并處理為止。23哈夫曼編碼技術哈夫曼編碼技術u 6. 尋找從每一個信息源事件到概率總和為1處的路徑,對每一信息源事件寫出“1”、“0”序列( 從 樹 根 到 信 息
13、 源 事 件 節 點 ) 作 為 碼 字 。Huffman編碼的平均碼字長度可以用下列公式求出: 這里的ni ,為第i個消息事件的碼字長度,P(Si)為第i個消息出現的概率。舉一例子來說明這一編碼過程。miiiSPnL1)(消消 息息ABCDEFGH概概 率率0.10.180.40.050.060.10.070.0424哈夫曼編碼技術哈夫曼編碼技術圖3-5 哈夫曼編碼全過程:F25哈夫曼編碼技術哈夫曼編碼技術n 根據哈夫曼的編碼規則,我們得到如表3-2所示: 由于8個消息事件A,B,C,H的每個概率為已知,則哈夫曼碼的平均長度L可按公式(3-6) 計算為:L10.4十3(0.180.10)4(
14、0.10十0.06十0 . 0 7 ) 十 5 ( 0 . 0 5 十 0 . 0 4 ) 2 . 6 1 比 特26哈夫曼編碼技術哈夫曼編碼技術n 圖像的熵H(S)可按公式(3-5) 計算為: 定義編碼效率為熵值H(S)與平均碼長L的比值,即: 編碼效率 (3-7) = 2 . 5 5 / 2 . 6 1 = 2 . 5 5 / 2 . 6 1 9 7 . 8 %9 7 . 8 % 哈 夫 曼 編 碼 有 它 的 不 足 之 處 : 必須先得到信息源碼元(消息)的統計概率,才能進行編碼。折中的方法是根據經驗值人為地給出Huffman碼表,但這樣的編碼無法達到最佳。比特55. 2)(log)(
15、)(12niiiSPSPSHLSH)(272829LZW編碼編碼nLZWLZW編碼是由編碼是由LempleLemple和和ZivZiv提出并經提出并經WelchWelch擴充擴充而形成的無損壓縮專利技術。而形成的無損壓縮專利技術。n它采用了一種先進的串表壓縮,將每個第一次它采用了一種先進的串表壓縮,將每個第一次出現的串放在一個串表中,用一個數字來表示出現的串放在一個串表中,用一個數字來表示串,壓縮文件只存貯數字,則不存貯串,從而串,壓縮文件只存貯數字,則不存貯串,從而使圖象文件的壓縮效率得到較大的提高。奇妙使圖象文件的壓縮效率得到較大的提高。奇妙的是,不管是在壓縮還是在解壓縮的過程中都的是,不
16、管是在壓縮還是在解壓縮的過程中都能正確的建立這個串表,壓縮或解壓縮完成后,能正確的建立這個串表,壓縮或解壓縮完成后,這個串表又被丟棄。這個串表又被丟棄。30LZW編碼示例編碼示例n例如:現有來源于二色系統的圖像數據源(假例如:現有來源于二色系統的圖像數據源(假設數據以字符串表示):設數據以字符串表示):aabbbaabbaabbbaabb,試對其,試對其進行進行LZWLZW編碼及解碼編碼及解碼。 n根據圖像中使用的顏色數初始化一個字符串表,根據圖像中使用的顏色數初始化一個字符串表,字符串表中的每個顏色對應一個索引。在初始字符串表中的每個顏色對應一個索引。在初始字符串表的字符串表的LZW_CLE
17、ARLZW_CLEAR和和LZW_EOILZW_EOI分別為字符表分別為字符表初始化標志和編碼結束標志。初始化標志和編碼結束標志。31n設置字符串變量設置字符串變量S1S1、 S2S2并初始化為空。并初始化為空。 最后的編碼結果為 :3001646332LZW編碼編碼nLZWLZW算法的適用范圍算法的適用范圍是是原始數據串最好是原始數據串最好是有大量的子串多次重復出現,重復的越有大量的子串多次重復出現,重復的越多,壓縮效果越好。反之則越差,可能多,壓縮效果越好。反之則越差,可能真的不減反增了真的不減反增了 33圖像壓縮預處理技術圖像壓縮預處理技術n圖像數據壓縮的任務是在不影響或少影圖像數據壓縮
18、的任務是在不影響或少影響圖像質量的前提下,盡量減少圖像的響圖像質量的前提下,盡量減少圖像的數據量。數據量。n圖像預處理技術:圖像預處理技術: 二次抽樣二次抽樣 人的視覺對圖像亮度分量的敏感程度人的視覺對圖像亮度分量的敏感程度高于色差分量。因此亮度值應以最大分高于色差分量。因此亮度值應以最大分辨率進行編碼。辨率進行編碼。 34圖像壓縮預處理技術圖像壓縮預處理技術濾波器濾波器 能有選擇地刪除、衰減或放大信息能有選擇地刪除、衰減或放大信息量化量化 用整數碼代替采樣值,真實值和量化值用整數碼代替采樣值,真實值和量化值間的誤差是分辨率和噪聲的混合間的誤差是分辨率和噪聲的混合預測編碼預測編碼 統計冗余改進
19、壓縮。對預測值和真實值統計冗余改進壓縮。對預測值和真實值之間的誤差進行編碼之間的誤差進行編碼35圖像壓縮預處理技術圖像壓縮預處理技術運動補償運動補償 用二維圖像位移矢量來預測鄰域圖像的用二維圖像位移矢量來預測鄰域圖像的位移值位移值變長碼變長碼 根據出現概率高低決定碼字長度根據出現概率高低決定碼字長度圖像內插法圖像內插法 允許產生中間圖像,因此臨近的圖像可允許產生中間圖像,因此臨近的圖像可以產生中間像,減少數據傳輸和存儲量。以產生中間像,減少數據傳輸和存儲量。36采采 樣樣n香農定理對于一個包含最高頻率香農定理對于一個包含最高頻率f0f0的模的模擬信號,但選擇的采樣頻率擬信號,但選擇的采樣頻率f
20、 f 滿足滿足 f= f= 2f02f0時,經過取樣后的離散信號能夠包含時,經過取樣后的離散信號能夠包含原模擬信號的全部信息,并且,經過反原模擬信號的全部信息,并且,經過反變換和低通濾波,可以不失真地恢復出變換和低通濾波,可以不失真地恢復出原始信號。原始信號。 37量量 化化n量化是在幅度軸上把連續值的模擬信號量化是在幅度軸上把連續值的模擬信號變成為離散值的數字信號,在時間軸上變成為離散值的數字信號,在時間軸上已變為離散的樣值脈沖,在幅度軸上仍已變為離散的樣值脈沖,在幅度軸上仍會在動態范圍內有連續值,可能出現任會在動態范圍內有連續值,可能出現任意幅度,即在幅度軸上仍是模擬信號的意幅度,即在幅度
21、軸上仍是模擬信號的性質,故還必須用有限電平等級來代替性質,故還必須用有限電平等級來代替實際量值實際量值 38n設信號的整個動態變化范圍為設信號的整個動態變化范圍為A,A,共分為共分為M M個量化等級;每個量化等級為個量化等級;每個量化等級為 A ,A ,則則有:有:A =A/MA =A/M。n量化級通常用二進制的位數量化級通常用二進制的位數n n表示表示, , 例如例如, ,對于對于 8 8 位位 (bit) (bit) 量化量化, ,相應的十進制量相應的十進制量化等級化等級M M為為 :M=2:M=28 8=256.=256.n量化的過程是把取樣后信號的電平歸并量化的過程是把取樣后信號的電平
22、歸并到有限個電平等級上到有限個電平等級上, ,并以一個相應的數并以一個相應的數據來表示。據來表示。 39數據壓縮算法的評價數據壓縮算法的評價n壓縮倍數壓縮倍數1 1)壓縮前和壓縮后的總的數據量之比)壓縮前和壓縮后的總的數據量之比2 2)平均比特數()平均比特數(bpdpbpdp) )表示表示n圖像質量圖像質量 重建圖像質量信噪比重建圖像質量信噪比SNR(SignalSNR(Signal Noise Noise Ration),Ration),即信號與噪聲的方差之比。首即信號與噪聲的方差之比。首先計算圖象所有象素的局部方差,將局先計算圖象所有象素的局部方差,將局部方差的最大值認為是信號方差,最小
23、部方差的最大值認為是信號方差,最小值是噪聲方差,求出它們的比值值是噪聲方差,求出它們的比值. . 40數據壓縮算法的評價數據壓縮算法的評價n壓縮和解壓縮的速度壓縮和解壓縮的速度對稱壓縮對稱壓縮非對稱壓縮非對稱壓縮壓縮的計算量壓縮的計算量41有損壓縮編碼技術有損壓縮編碼技術n預測編碼技術預測編碼技術nJPEGJPEGnMPEGMPEG42預測編碼技術預測編碼技術n 根據離散信號之間存在著一定的相關性的特點,利用圖像像素的以往樣本值(前面一個或幾個點的數據)對于新樣本值(下一個點的數據)進行預測,然后將樣本的實際值與其預測值相減得到一個誤差值(較小),這樣可以用比較少的數碼進行編碼得到較大的數據壓
24、縮結果,達到壓縮數據的目的,因此預測編碼技術是一種有失真編碼方法。43n 最常用的是差值脈沖編碼調制法,簡稱為DPCM。傳輸信道傳輸信道輸入輸入預測器預測器量化器量化器編碼器編碼器解碼器解碼器預測器預測器XnenXnen輸出輸出XnXnenXn預測編碼技術預測編碼技術44預測編碼技術預測編碼技術u 設xn為tn時刻的亮度取樣值,預測器根據tn時刻之前的樣本值x1,x2,xn-1對xn作預測,得到預測值xn,xn 與xn之間的誤差為: enxnxnu 接收端恢復的輸出信號為xn是xn的近似值,兩者的誤差是:xnxnxnxn十en(xn十en)enen 45預測編碼技術預測編碼技術n 在預測編碼中
25、,量化器的量化對像 是 預 測 誤 差 enen分布在零值附近,正負兩邊的分布一般是對稱的,圖3-3 預測誤差分布特性示意圖。概率概率預測誤差預測誤差圖圖3-3 3-3 預測誤差分布示意圖預測誤差分布示意圖46Y8Y7Y6Y5Y4Y3Y2Y1 0 X1 X2 X3 X4 X5 X6 X7 X8 量化輸出輸入電平非均勻量化間隔非均勻量化器非均勻量化器47預測編碼技術預測編碼技術n 非均勻量化器對于具有相同的輸入信號動態范圍、相同的圖像主觀評價質量下,輸出的比特數較低。n 預測編碼系統的缺點:u 預測誤差的量化是造成圖像質量下降的主要原因,比如在圖像邊界斜率過載,表現為圖像輪廓變模糊;因最小量化電
26、平不夠小(量化位數不夠高),使圖像灰度緩變區產生顆粒噪聲。 48靜態圖像壓縮編碼靜態圖像壓縮編碼的國際標準的國際標準-JPEGn 靜態圖像壓縮編碼JPEG概況nJPEG壓縮編碼的基本系統u(1) 數據塊準備u(2) 離散余弦正變換DCTu(3) 量化u(4) DCT系數Z形掃描u(5) DC系數編碼u(6) AC系數編碼nJPEG壓縮編碼的擴展系統49靜態圖像壓縮編碼的國際靜態圖像壓縮編碼的國際標準標準-JPEGn JPEG是國際上彩色、灰度、靜止圖像的第一個國際標準。用來在低分辨率到高分辨率的較寬范圍內支持較高的圖像分辨率和量化精度。它不僅適用于黑白、彩色照片和印刷圖片等靜止圖像的壓縮,而且
27、擴大到了彩色傳真、電話會議、新聞圖片的傳送上,以及電視圖像序列的幀內圖像的壓縮編碼也常采用JPEG壓縮標準。50靜態圖像壓縮編碼靜態圖像壓縮編碼的國際標準的國際標準-JPEGn 變換編碼的基本思路:u 1編碼時略去某些能量很小的高頻分量以降低碼率。u 2變換編碼還可以根據人眼對不同頻率分量的敏感程度而對不同系數采用不同的量化臺階,以進一步提高壓縮比。n JPEG開發的壓縮編碼算法有三種工作方式:u 1基本系統(單次掃描)。u 2擴展系統(常采用累進編碼或分層編碼方式)。u 3無損壓縮編碼。51JPEG 壓縮編碼的基本壓縮編碼的基本系統系統n 下面我們討論一個基于離散余弦正變換DCT的有失真JP
28、EG編解碼的工作原理,圖3-7是基于DCT的JPEG編碼的過程框圖。 521. 數據塊準備數據塊準備u 塊準備將一幀(幅)圖像分成88的數據塊。對于彩色圖像,可以看作多分量(Y亮度信號分量和U和V色度信號分量)進行壓縮處理。u 假設圖像的大小為480行,每一行有640個像素。并假設按4ll取樣格式,即四個亮度分量,一個色差分量U,一個色差分量V,則亮度分量就是一個640480的數值矩陣,色差分量是一個320240的數值矩陣。u 塊準備必須劃分出4800個(6404808)亮度塊和兩份1200個(3202408)色差塊,共計7200個數據塊。同時將原始圖象的無符號整數變為有符號整數532. 離散
29、余弦正變換離散余弦正變換 DCTDCTu2. 離散余弦正變換DCTu DCT DCT變換是一種正交變化,主要是把時域變變換是一種正交變化,主要是把時域變換為頻域,變換本身并不進行數據壓縮。它換為頻域,變換本身并不進行數據壓縮。它只是把信號映射到另一個域上,使信號在變只是把信號映射到另一個域上,使信號在變換域里容易進行壓縮,變換后的樣值更加獨換域里容易進行壓縮,變換后的樣值更加獨立和有序立和有序543. 量化量化u 量化是一種不可逆的、有失真的過程,在基于DCT的編碼器中,量化是引起信息丟失的主要原因。u 對DCT系數進行量化有兩個作用:u 降低系數的幅值。u 增加系數中值為0的項數。554.
30、4. DCT 系數系數Z Z形掃描形掃描圖3-10 Z形掃描順序 其一維數組元素的位置順序如圖3-10。 ZZ(0)C(0,0),ZZ(1)C(0,l),ZZ(2)C(l,0),ZZ(63)C(7,7)。編碼順序依據 ZZ的序號。 0 1 5 6 14 15 27 28 2 4 7 13 16 26 29 42 3 8 12 17 25 30 41 43 9 11 18 24 31 40 44 53 10 19 23 32 39 45 52 54 20 22 33 38 46 51 55 60 21 34 37 47 50 56 59 61 35 36 48 49 57 58 62 63565
31、. DC 系數編碼系數編碼u 對相鄰塊之間的DC系數的差值DIFFDiDi1進行編碼。u Blocki1Blocki圖圖 3-11 DC3-11 DC系數的差值系數的差值DIFFDIFFD Di iD Di i1 1DiDi1576. AC 系數的編碼系數的編碼 n Z形掃描將二維量化系數矩陣轉換成一維數組ZZ中的“零游程/非零值”。u 若最后一個“零游程/非零值”中只有零游程(ZRL),則直接傳塊結束碼字“EOB” 結束本塊。58JPEG 壓縮編碼壓縮編碼的基本系統的基本系統n 對于中等復雜程度的彩色圖像,其壓縮比與恢復圖像的質量大致如表3-10所示。 表3-10壓縮效果與恢復圖像質量的關系
32、壓壓縮縮效效果果(比比特特/像像素素)質質量量0.250.50中中好好,滿滿足足某某些些應應用用0.500.75好好很很好好,滿滿足足多多數數應應用用0.751.5極極好好,滿滿足足大大多多數數應應用用1.52.0與與原原始始圖圖象象幾幾乎乎分分不不出出59JPEG 壓縮編碼壓縮編碼的基本系統的基本系統n 順序編碼運行方式 60JPEG 壓縮編碼壓縮編碼的擴展系統的擴展系統n 1. 基于DCT的累進編碼運行方式累進編碼方式要掃描多次。61JPEG 壓縮編碼壓縮編碼的擴展系統的擴展系統n2. 分層編碼運行方式u 水平方向和垂直方向分辨率以2的倍數因子下降(降低原始圖像的空間分辨率),導出若干低分
33、辨率的原圖像,分層后再采用JPEG的壓縮編碼方法進行編碼,隨后以上重復步驟,直到圖像達到完整的分辨率編碼為止。62JPEG 壓縮編碼壓縮編碼的擴展系統的擴展系統n 3. 無損壓縮預測編碼運行方式源圖像源圖像數據數據表說明表說明預測器預測器熵編碼器熵編碼器壓縮后壓縮后圖像數據圖像數據63無損壓縮預測編碼無損壓縮預測編碼運行方式運行方式 DPCM編碼簡單,易于用硬件實現。由于是無失真編碼,解碼后的圖像質量很高。 Pxabcx選選擇擇值值預預測測選選擇擇值值預預測測0不不預預測測4abc1a5a(bc)/22b6b(ac)/23c7(ab)/264運動圖像壓縮編碼的國際運動圖像壓縮編碼的國際標準標準
34、MPEGn 運動圖像壓縮編碼MPEG概況nMPEG 標準簡介n幀間編碼技術n運動補償技術nMPEG視頻壓縮數據流結構nMPEG音頻65運動圖像壓縮編碼的國際運動圖像壓縮編碼的國際標準標準MPEGn MPEG專家組工作將整個過程分為三步:u 要求u 提出要求有雙重的目的:目標, 競爭的原則。u 竟爭u 提出了14個不同的方案。u 集中u 測試和評價,并綜合出一個最佳方案。66MPEG 標準簡介標準簡介n 1. MPEG1標準u MPEG1的標準名稱為“動態圖像和伴音 的 編 碼 ” 用 于 速 率 小 于 每 秒 約1.5Mbps的數字存儲媒體。u MPEG1的最大壓縮比可達約1200。u MP
35、EG1標準有3個部分組成:u MPEG1視頻(Video)u MPEG1音頻(Audio)u MPEG1系統(System)671. MPEG1 標準標準n 設計目標是把每秒30幀、亮度信號的分辨率為360240,色度信號分辨率為180120,傳送壓縮成數據率為1.2Mbps的編碼圖像。n MPEG1電視圖像的壓縮算法采用兩種基本壓縮技術:u 為減少時間冗余度,采用1616個像素組成的圖像塊的運動補償技術。u 為了減少空間冗余度,采用88圖像化的DCT變換技術。681. MPEG1 標準標準n 聲音壓縮編碼技術支持高壓縮的音頻數據流,其采樣率為48,44.l或22KHz,量化精度為16位的聲音
36、壓縮。n 支持兩個聲道,可設置成單聲道(mono)、雙聲道(dual)或立體聲(stereo)。采用MPEG1算法可以把位速率降到 0.192 Mbps。n MPEG1系統采用多路復合技術,把數字電視圖像和聲音復合成單一數據位流,MPEG1的數據位流分成內外兩層,外層為系統層,內層為壓縮層。69 2. MPEG2 標準標準n MPEG2標準稱為“活動圖像及有關聲音信息的通用編碼”標準。n 設計目標是把以10Mbps速度傳送每秒30幀、分辨率為720572高分辨率的廣播級視頻圖像,壓縮后的傳送數據率為315Mbps。n MPEG2標準是HDTV、DVD以及新型數字式交互有線網所采用的數字視頻壓縮
37、標準。n MPEG2標準是MPEG1標準的擴充、豐富和完善,并與MPEG1標準相兼容。702. MPEG2 標準標準 MPEG2標準主要分為四部分:u 第一部分:系統。 第二部分:視頻。u 第三部分:音頻。 第四部分:一致性測試。u MPEG2標準使計算機處理全彩色、全屏幕、全動態的視頻圖像,同時也能使有線、無線、CDROM等傳輸和存儲介質有效地傳送視頻圖像,并且具有CD的音質,使多媒體技術與通信和廣播等技術結合起來。713. MPEG4 標準標準n 用來支持低比特率下的多媒體通信,還支持用于通信、訪問和數字視聽數據處理的新方法。注重多媒體系統的交互性和靈活性,以最少量的數據、極低的音頻/視頻
38、壓縮碼率來顯示建立精確的畫面,達到具有高效編碼、高效存儲與傳播以及可交互操作的特性。724. MPEG7 標準標準n 正式名稱為多媒體內容描述接口。n MPEG7標準只規定信息內容描述格式,而不規定如何從原始的多媒體資料中抽取內容描述和查詢、檢索方法。MPEG7標準不針對特定的應用領域,而是盡可能支持廣泛的應用領域。n 主要用途:在數字圖書館、多媒體目錄服務、圖像分析、音樂詞典、教育、多媒體編輯、多媒體業務引導等多個領域。734. MPEG7 標準標準n 視頻壓縮算法用到了三項基本技術:u 幀間編碼技術和基于塊的運動補償技術。u 空間壓縮(也稱為幀內壓縮)技術。u 熵編碼,使用Huffman編
39、碼技術。n MPEG標準所用的編碼模型與JPEG的編碼模型類似,分為5個階段:u 幀間編碼和運動補償、變換編碼、量化、直流分量DC及交流分量AC的編碼和熵編碼。74幀間編碼技術幀間編碼技術n 利用的時間相關性可進一步消除視頻其相鄰幀之間具有冗余信息,提高壓縮比。n 將圖像分成三種類型:u 1. 參考幀(I)以自身圖像的相關性進行壓縮處理,必須要傳送。u 2. 預測幀(P) 用前面的參考幀或預測幀作為參照圖像信息進行預測編碼,并可作為下一個預測幀(B幀圖像或P幀圖像)的參照圖像信息。但因此可能引起預測誤差。75幀間編碼技術幀間編碼技術u 3. 雙向預測幀(B)u 又稱插補幀,在預測時,既可以使用
40、前面或后面的視頻幀(I參考幀,P預測幀)進行雙向預測,也可以同時使用前后兩個視頻幀進行預測編碼,但本身不能作為下一個預測幀的參照圖像信息。n在編碼時,先對參考幀進行變換編碼,然后對預測幀進行編碼,再對兩者之間的雙向預測幀進行編碼,這個過程對隨后的下一個預測幀和雙向預測幀重復,直到完成所有幀的編碼為止。76幀間編碼技術幀間編碼技術n 采用下述四種預測技術:n 幀內編碼 前向預測n 后向預測 雙向預測 u 圖3-12顯示一個典型的視頻圖像序列次序。 I B B P B B P B B P B B P B B I B B 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
41、17 18 I I幀和幀和P P幀間有兩個幀間有兩個B B幀幀每十五幀有一幅每十五幀有一幅I I幀圖像(幀圖像(0.50.5秒)秒)77運動補償技術運動補償技術n 討論預測器計算表達式,設前一參照幀為I0,后一參照幀為I2,當前幀為I1的示意圖。X01mv21mv78運動補償技術運動補償技術n 表3-13給出了I幀內塊、F前向預測塊、B后向預測塊和A平均值塊的預測器的計算表達式。79 MPEG2 視頻數據流的視頻數據流的六層結構圖六層結構圖圖像序列頭圖像序列頭 圖像組圖像組圖像組圖像組序列尾序列尾 圖像組圖像組圖像圖像組頭組頭圖象圖象I、P、B圖象圖象I、P、B圖像頭圖像頭宏塊片宏塊片宏塊片宏
42、塊片 宏塊宏塊片頭片頭宏塊宏塊宏塊宏塊18828838848858868888視頻序列層視頻序列層圖像組層圖像組層宏塊片層宏塊片層宏塊層宏塊層YCb Cr圖像層圖像層塊層塊層80視頻數據流之間視頻數據流之間的關系圖的關系圖 圖像組層圖像組層宏塊層宏塊層88像素像素塊層塊層 宏塊片層宏塊片層視頻序列層視頻序列層圖像層圖像層81MPEG視頻壓縮視頻壓縮數據流結構數據流結構n 1. 視頻序列層:u 圖像序列頭包含了圖像寬度、高度、像素長寬比、幀率、位率、緩沖區尺寸、量化矩陣等信息。n 2. 圖像組層:u 圖像組頭包含時間代碼等信息,圖像組中的第一個圖像總是I圖像幀。 n 3. 圖像層:u 由圖像頭及
43、多個宏塊片構成的。圖像頭包含該圖像的編碼類型及碼表選擇等信息。82MPEG視頻壓縮視頻壓縮數據流結構數據流結構n 4. 宏塊片層:u 宏塊片由宏塊片頭和多個連續的宏塊以及附加數據組成。n 5. 宏塊層:u MPEG算法中的基本編碼單元。它是圖像幀內的一個1616像素的亮度信息和兩個88像素色差信號塊組成,附加數據包括宏塊的編號、宏塊的編碼類型、量化參數、運動矢量等信息。83宏塊結構有三種格式宏塊結構有三種格式n 411411格式:格式: 422422格式:格式: 54460123570123 Y Cb Cr Y Cb Cr84宏塊結構有三種格式宏塊結構有三種格式n 444格式: 0 1 2 3
44、 4 8 6 10 5 9 7 11 Y Cb Cr856. 塊塊 層層n MPEG算法中最小的編碼單元,它包含88像素,有三類圖像信息之一,亮度信號(Y)、色差信號(U/V)。 Y U V 1 2 3 4 5 6 88 88 86MPEG 音頻音頻n MPEG音頻標準有以下特點:u 1. 音頻信號采樣率可以是22KHz,44.1 KHz或48KHz。u 2. 壓縮后的比特流可以按以下3種模式之一支持單聲道或雙聲道:u(1)提供給單音頻通道的單聲道模式。u(2)提供給兩個獨立的單音頻通道的雙單聲道模式。u(3)提供給立體聲通道的立體聲模式。87MPEG 音頻音頻u 3. 3個獨立的壓縮層次:u
45、(1)層1最簡單,使用比特率384Kbps。u( 2 ) 層 2 的 復 雜 度 中 等 , 使 用 比 特 率192Kbps左右,主要應用于數字廣播的音頻編碼。u(3)層3最復雜,使用比特率64Kbps,音質好,適用于ISDN上的音頻傳輸。u 4. 編碼后的比特流支持循環冗余校驗CRC。u 5. 還支持在比特流中攜帶附加信息。88幀間編碼技術幀間編碼技術n 編碼器的輸出視頻圖像序列排列順序。1 4 2 3 7 5 6 10 8I P B B P B B P B9 13 11 12 16 14 15 B P B B I B Bn 發送端編碼器的輸出到接收端解碼器的輸入端,經解碼器的輸出,又恢復為圖3-12編碼器輸
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 四川省閬中市閬中中學2025屆高三考前突擊模擬試卷化學試題試卷(1)含解析
- 湖北生物科技職業學院《工程結構加固》2023-2024學年第二學期期末試卷
- 廈門興才職業技術學院《大學語》2023-2024學年第一學期期末試卷
- 江蘇省淮安市盱眙縣2025年新初三摸底考試化學試題含解析
- 遵義師范學院《中國戲劇影視音樂作品賞析》2023-2024學年第一學期期末試卷
- 重慶三峽職業學院《寫意山水寫生與水墨表現》2023-2024學年第二學期期末試卷
- 江蘇省連云港等四市2025年高三下學期化學試題期末聯考試題含解析
- 采購合同履行保密保密地點重點基礎知識點
- 如何做好電話銷售
- 韶關市高一上學期第一次月考地理試題
- 2025年許昌職業技術學院單招職業適應性考試題庫及答案1套
- 2025年開封大學高職單招(數學)歷年真題考點含答案解析
- 【9化一模】2025年安徽省合肥市蜀山區九年級中考一模化學試卷(含答案)
- 炎癥性腸病(IBD)概述
- 護理質量與安全分析匯報
- 2025-2030軌道車涂料行業市場現狀供需分析及投資評估規劃分析研究報告
- 無線電基礎知識培訓課件
- 4.1 基因指導蛋白質的合成(課件)高一下學期生物人教版(2019)必修2
- 出租車司機崗前教育培訓
- 肝癌科普預防
- 中學2021年秋季開學疫情防控工作方案及要求4篇
評論
0/150
提交評論