多媒體計算機技術_第1頁
多媒體計算機技術_第2頁
多媒體計算機技術_第3頁
多媒體計算機技術_第4頁
多媒體計算機技術_第5頁
已閱讀5頁,還剩157頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

多媒體計算機技術

魯宏偉編著

電子工業出版社2004年7月第2版

任沐我川J:m亮

華中科技大學計算機學院

信息存儲國家重點實驗室

武漢430074XLZM6610@163.com

聯系電話/p>

第三章數字圖像處理技術

:?信號處理的基本術語思

X?圖像數據壓縮基礎題

2?圖像數據壓縮算法

??常用圖形、圖像文件的格式

2?靜態圖像壓縮標準

X?動態圖像壓縮標準

Z?H.261和H.263標準

信號處理的基本術語

?采樣與量化

?DFT和IDFT

?小波變換

采樣和量化

Z?信號的數字化處理包括兩個步驟,一個是信號在時間

?上的離散化,即采樣;另一個是幅度上的離散化,即

Z量化。

Z?采樣也稱抽樣,是信號在時間上的離散化,即按照一

?定時間間隔At在模擬信號x(t)上逐點采取其瞬時值。

二它是通過采樣脈沖和模擬信號相乘來實現的

采樣和量化BaeU

?量化是對幅值進行離散化,即將振動幅值用二進制量

化電平來表示。量化電平按級數變化,實際的幅度值

是連續的物理量。具體幅度值用舍入法歸到靠近的量

化電平上。

?對模擬信號采樣首先要確定采樣間隔。如何合理選擇

△t涉及到許多需要考慮的技術因素。

DFT和IDFT

??傅立葉分析是將原始信號分解成不同頻率成分的正弦

?波,將時域信號轉變為頻域信號的一種數學方法,在

Z信號的分析和處理中有著十分重要的作用

:?對數字信號,需要采用相關的離散化方法,這就是由

:傅立葉分析得到的離散傅立葉變換DFT,其逆變換表

Z示為IDFT。

DFT和IDFTBacU

:-設是連續函數力(。的N個采樣值,則這小個點的

Z寬度為N的DFT定義為

N-1

jMIN0,1,…,N-1

■Xk=£xne-,k=

:?IDFT定義為“

1N-\

7m

?Xn=^£x/2k,N,n=0,l,…,N—1

35稱為N點、DFT的變換核函數

j2mk/N稱為N點IDFT的變換核函數

小波變換

?一個小波是一個在有限周期內的波形,它的平均值為

°

?比較正弦波形和小波,正弦信號正是Fourier分析的基

礎,它沒有限定的周期,它可以從負無窮擴展到正無

窮,正弦信號是平滑并且是可預知的,小波信號是不

規則的并且不對稱。

正弦波

圖3.3正弦信號和小波信號

小波變換

傅立葉分析是將信號分解為各種頻率的正弦信號,類

似地,小波分析是將信號分解為滑動的、與母系小波

成比例的各種子波。

傅立葉i

變換

信號不同頻率的連續正弦子波

小波變換BacU

:?小波變換可以使得信號的低頻長時特性和

:高頻短時特性同時得到處理,具有良好的

:局部化性質,能有效地克服傅氏變換在處

?理非平穩復雜信號時存在的局限性,具有

X極強的自適應性。

:?由于小波變換能夠有效地解決方塊效應和

Z基本上解決蚊式噪聲,所以小波變換已經

:成為當今圖像壓縮編碼的主要研究方向。

圖像數據壓縮基礎

色彩的基本概念

視覺系統對顏色的感知

?彩色空間及其變換

-RGB顏色模式圖像數據壓縮的可能性

-Lab顏色模式-統計冗余

-HSB顏色模式-信息谷冗余

-CMYK顏色模式-結構冗余

-顏色模型的色域-知識冗余

-視覺冗余

-彩色空間的線件變換標準

圖像的種類

色彩的基本概念-

:?從人的視覺系統看,色彩可用的調、飽

:和度和亮度來描述。人眼看到的任一彩

:色光都是這三個特性的綜合效果,這三

:個特性可以說是色彩的三要素,其中色

?調與光波的波長有直接關系,亮度和飽

:和度與光波的幅度有關。

I?圖像深度與色彩類型

??圖像深度與顯示深度

:圖像深度與色彩類型S

??圖像深度是指位圖中記錄每個像素點所

:占的位數,它決定了彩色圖像中可出現

:的最多顏色數,或者灰度圖像中的最大

?灰度等級數。

z?每個像素點的圖像深度的分配還與圖像

:所用的色彩空間有關。以最常用的RGB

:色彩空間為例,圖像深度與色彩的映射

:關系主要有真彩色、偽彩色和調配色。

真彩色

BaeU

??真彩色(true-color)是指圖像中的每個像

:素值都分成R、G、B三個基色分量,每個基

:色分量直接決定其基色的強度,這樣產生的

?色彩稱為真彩色。例如圖解深度為24,用R:

ZG:B=8:8:8來表示色彩,則R、G、B各占

Z用8位來表示各自基色分量的強度,每個基色

:分量的強度等級為28=256種。圖像可容納224

?=16M種色彩。這樣得到的色彩可以反映原

Z圖的真實色彩,故稱真彩色

:偽彩色-I

,?偽彩色(pseudo-color)圖像的每個像素值實際上是

?一個索引值或代碼,該代碼值作為色彩查找表CLUT

:(ColorLook-UpTable)中某一項的入口地址,根據

■該地址可查找出包含實際R、G、B的強度值。

Z?用這種方式產生的色彩本身是真的,不過它不一定反

,映原圖的色彩。在VGA顯示系統中,調色板就相當于

■色彩查找表。從16色標準VGA調色板的定義可以看出

Z這種偽彩色的工作方式

,?偽彩色一般用于65K色以下的顯示方式中。標準的調

Z色板是在256K色譜中按色調均勻地選取16種或256種

?色彩。一般應用中,有的圖像往往偏向于某一種或幾

z種色調,此時如果采用標準調色板,則色彩失真較多。

.因此,同一幅圖像,采用不同的調色板顯示可能會出

?現不同的色彩效果。

16色標準VGA調色板

EacU

16色VGA調色板

代碼RGB顏色名稱效果

0000黑(Black)

]0°128深藍(哈vy);

201280深綠(DarkGreen)

30128128深青(DarkCyan)

4128o0深紅(Maroon)

51280128紫(Purple)

61281280橄欖綠(Olive)

7192192192灰白(Lightgray)

8128128128深灰(Darkgray)

900255藍(blue)

1002550綠(green)

110255255青(cyan)

1225500紅(red)

132550255品紅(magenta)

142552550黃(Yellow)

采用不同的調色板顯示同一幅

圖像的效果實例1-

Baeu

S果

調

:調配色S

■=EacU

??調配色(direct-color)的獲取是通過每個像素點的R、

?G、B分量分別作為單獨的索引值進行變換,經相應的

Z色彩變換表找出各自的基色強度,用變換后的R、G、

yB強度值產生的色彩。

調配色與偽彩色相比,相同之處是都采用查找表,不

?同之處是前者對R、G、B分量分別進行查找變換,后

二者是把整個像素當作查找的索引進行查找變換。因此,

.調配色的效果一般比偽彩色好。

??調配色與真彩色比,相同之處是都采用R、G、B分量

Z來決定基色強度,不同之處是前者的基色強度是由R、

?G、B經變換后得到的,而后者是直接用R、G、B決定。

,在VGA顯示系統中,用調配色可以得到相當逼真的彩

Z色圖像,雖然其色彩數受調色板的限制而只有256色

圖像深度與顯TJX深度f—

BacU

?顯示深度表示顯示緩存中記錄屏幕上一個點

的位數(bit),也即顯示器可以顯示的色彩

數。因此,顯示一幅圖像時,屏幕上呈現的

色彩效果與圖像文件所提供的色彩信息有關,

也即與圖像深度有關;同時也與顯示器當前

可容納的色彩容量有關,也即與顯示深度有

才:關。

3Z-顯示深度大于圖像深度

1:-顯示深度等于圖像深度

顯示深度小于圖像深度

:顯示深度大于圖像深度J

--在這種情況下屏幕上的色彩能較真實地

:反映圖像文件的色彩效果。如當顯示深

:度為24位,圖像深度為8位時,屏幕上

:可以顯示按該圖像的調色板選取的256

二種顏色;圖像深度為4位時可顯示16色。

:這種情況下,顯示的色彩完全取決于圖

:像的色彩定義

:顯示深度等于圖像深度J

:-在這種情況下,如果用真彩色顯示模式

:來顯示真彩色圖像,或者顯示調色板與

:圖像調色板一致時,屏幕上的色彩能較

:真實地反映圖像文件的色彩效果。反之,

:如果顯示調色板與圖像調色板不一致,

:則顯示色彩會出現失真

:顯示深度小于圖像深度J

??此時顯示的色彩會出現失真。例如,若

Q顯示深度為8位,需要顯示一幅真彩色

:的圖像時顯然達不到應有的色彩效果。

:在這種情況下不同的圖像軟件有不同的

:處理方法

:色調與色相I

??繪畫中要求有固定的色彩感覺,有統一

:的色調,否則難以表現畫面的情調和主

:題。例如我們說一幅畫具紅色調,是指

:它在色彩上總體偏紅。計算機在圖像處

:理上采用數字化,可以非常精確地表現

:色彩的變化,色調是相對連續變化的。

:用一個園環來表現色譜的變化,就構成

:了一個色彩連續變化的色環。

色彩連續變化的色環I

BseU

?太陽光帶中的六標準

色與六個中間色,即

紅橙,黃橙,黃綠,

藍綠(青),藍紫,

紅聚(品紅),合稱

十二色相或色調。

?把不同的色調按紅橙

黃綠藍展的順序銜接

起家,就形成了一個

色詞連續變化過渡由

圓環,稱作為色環。

亮度與明度

BaeU

:-同一物體因受光不同會產生明度上的變化

??不同顏色的光,強度相同時照射同一物體也

Z會產生不同的亮度感覺。

:-明度也可以說是指各種純正的色彩相互比較

:所產生的明暗差別。在純正光譜中,黃色的

2明度最高,顯得最亮;其次是橙、綠;再其

?次是紅、藍;紫色明度最低,顯得最暗。

同一物體因受光不同會產生明度上的變化

Baeu

?照射的光越強,反射光也越強,看起來越亮。

顯然,如果彩色光的強度降到使人看不到了,

在亮度標尺上它應與黑色對應。

?同樣,如果其強度變得很大,那么亮度等級

應與白色對應。亮度是非彩色屬性,彩色圖

像中的亮度對應于黑白圖像中的灰度

:飽和度與純度

??淡色的飽和度比濃色要低一些。

:?飽和度還和亮度有關,同一色調越亮或

X越暗越不純。

:?飽和度越高,色彩越艷麗、越鮮明突出,

:越能發揮其色彩的固有特性。但飽和度

:高的色彩容易讓人感到單調刺眼。飽和

:度低,色感比較柔和協調,可混色太雜

?則容易讓人感覺渾濁,色調顯得灰暗。

飽和度與純度

BaeU

?對于同一色調的彩色光,飽和度越深,顏色

越鮮明或說越純,相反則越淡

飽和度和亮度

BaeU

不飽和N-----------------純飽和--------------->不飽和

*在飽和的彩色光中增加白光的成分,相當于

增加了光能,因而變得更亮了,但是它的飽

和度卻降低了。若增加黑色光的成分,相當

于降低了光能,因而變得更暗,其飽和度也

降低了

加帝素妹對顏佰的感知

硼電5m確0700

齡笠.邰土北k炳蹦x■51》

視覺系統對顏色和亮度的響應特性

視覺系統對顏色的感知

產生波長不同的光所需要的三基色值

:人眼對圖像的亮度信息敏感、

2對顏色分辨率弱北

:?由于人眼對色彩細節的分辨能力遠比對亮度

一細節的分辨能力低,若把人眼剛能分辨的黑

Z白相間的條紋換成不同顏色的彩色條紋,那

?么眼睛就不再能分辨出條紋來。如圖所示,

:等寬的藍紅相間的彩條,藍綠相間的彩條和

一黑白相間的條紋比較。使眼睛逐漸遠離屏幕,

:當你分辨不出彩條時,黑白條還能分辨出來

:?彩色空間及其變換

Z-RGB顏色模式

Z-Lab顏色模式

:-HSB顏色模式

Z-YUV顏色模式

Z-CMYK顏色模式

RGB顏色模式NEXT

.?自然界中所有的顏色都可以用紅、綠、藍(RGB)

?這三種波長顏色的不同的強度組合而得,這就是

Z人們常說的三基色原理。

Z?因為RGB顏色合成產生白色,它們也叫作加色

:?把三種整、色交互重疊,就產生了次混合色:青

:(cyan)>洋紅(magenta)、黃(yellow)

:?在數字視頻中,對RGB三基色各進行8位編碼就

Z構成了大約16.7萬種顏色,這就是我們常說的真

?彩色。

:?電視機和計算機的監視器都是基于RGB顏色模式

二來創建其顏色的。

目錄返回

RGB顏色模式

自然界中所有的顏色都可以用

紅、綠、藍(RGB)這三種顏色

的光(紅光波長700nm、綠光綠

4

波長546.1nm>藍光波長435.8A

黃青

nm)按不同的強度疊加而成,

這就是人們常說的三基色原理。

當三基色等量相加時,得到

紅藍

色;等量的紅綠相加而藍為0

品紅

值時得到黃色;等量的紅藍相

加而綠為0時得到品紅色;等

量的綠藍相加而紅為0時得到

色。

目錄返回

彩色空間

?當三基色按不同強度相疊加

時,可得到任何一種顏色。

任一顏色和這三種顏色之間

的關系可用下面的式子來描

述:

■顏色=R(紅色的百分山+

G(綠色的百分比)+(族色的

百分*比)

?任一顏色可以想象成RGB三

車空間中的一個點,該點的

史標為(r,g,b),其中r、

g>b分別為該顏色中紅、綠、

熊三基色所占的百分比。自

然界的所有顏色構成一個

“彩色空間”。

目錄返回

顏色的顯示

電視機和計算機的監視器都是基于RGB顏色模式來創

建其顏色的。它們使用的陰極射線管CRT(cathoderay

tube)是一個有源物體。CRT使用3個電子槍分別產生紅

(Red)>綠(Green)和藍(Blue)三種波長的光,并以各種

不同的相對強度綜合起來產生顏色

??□?”

電子槍

掩蔽罩

熒光涂層屏幕

.

L

X

IZU

WW小川川I川

RGB相加混色模型

RGB相加色示例NEXT

RGB強度顏色

000黑(Black)

001藍(Blue)

010綠(Green)

011青(Cyan)

100紅(Red)

101品紅(Magenta)

110黃(Yellow)

111白(White)

N

Lab顏色模式NEXT

■該顏色模式由一個發光率

(luminance)和兩個顏色(a,b)

軸組成。它由顏色軸所構成

的平面上的環形線來表示顏

色的變化,其中徑向表示色

飽和度的變化,自內向外,

飽和度逐漸增高;圓周方向

A.光度=100(白)表示色調的變化,每個圓周

B.綠到紅分量形成一個色環;而不同的發

光率表示不同的亮度并對應

藍到黃分量

C.不同環形顏色變化線。

D.光度=0(黑)到紅

分量

:Lab顏色模式《■

■QEacL

:?Lab顏色是由RGB三基色轉換而來

Z的

:?它是一種具有“獨立于設備”的顏

:色模式,既不論使用任何一種監視

:器或者打印機,Lab的顏色不變。

HSB顏色模式

,?從心理學的角度來看,

顏色有三個要素:色

相、飽和度和亮度。

HSB顏色模式便是基

于人對顏色的心里感

受的顏色模式。

A.飽和度B.色相C.亮度D.所有色相

HSB色彩空間可以用一個圓錐空間模型來描述o

錐空間模型

QnEacL

(A)HSI圓錐空間模型

(B)線條示意圖:圓

.錐上亮度、色度和飽和

/飽和度|I度的關系。

色調I(C)縱軸表示亮度

亮I(D)圓錐縱切面:描

(C送了同一色調的不同亮

(B)度和飽和度關系。

尸?(E)圓錐橫切面:色調H為繞著圓

、融截面度量的色環,圓周上的顏色

為完全飽和的純色,色飽和度為穿

-過中心的半徑橫軸。

彩色空間的線性變換標準

[NEXT

?為了使用人的視角特性以降低數據量,通常把RGB

Z空間表示的彩色圖像變換到其他彩色空間。

Z彩色空間變換有三種:YIQ,YUV和YCrCb

??YIQ適用于NTSC彩色電視制式

Z?YUV適用于PAL和SECAM彩色電視制式

:?而YCrCb適用于計算機用的顯示器

彩色空間的線性變換標準

[NEXT

ZYUV與YIQ模型

?在彩色電視制式中,使用YUV和YIQ模型來表示彩色

:圖像。在PAL彩色電視制式中使用YUV模型,Y表示亮度,

?UV用來表示色差,U、V是構成彩色的兩個分量;在NTSC

;彩色電視制式中使用YIQ模型,其中的Y表示亮度,I、Q

,是兩個彩色分量。

xYUV/YIQ特點

:?亮度信號(Y)和色度信號(U、V)是相互獨立的

??可以利用人眼的特性來降低數字彩色圖像所需要的存儲

:容量。

彩色空間的線性變換標準[NEXT

人眼對彩色細節的分辨能力遠比對亮度細節的分辨能力低。例如,

要存儲RGB8:8:8的彩色圖像,即R、G和B分量都用8位二進制數表

示,圖像的大小為640X480像素,那末所需要的存儲容量為

921600字節。如果用YUV來表示同一幅彩色圖像,Y分量仍然為

640X480,并且Y分量仍然用8位表示,而對每四個相鄰像素(2X2)

的U、V值分別用相同的一個值表示,那末存儲同樣的一幅圖像所

需的存儲空間就減少到460800字節。這實際上也是圖像壓縮技術

的一神方法。

與YUV顏色模式類似的一種稱為YCrCb模式,主要適用于計算機用

的顯示器。

掃描綾

5/318

⑥計算所得的Cb,Cr樣本

?Y樣本

目錄返回

YUV顏色模式

:?一幅彩色圖像和它對應的亮度信號(Y

:分量)圖像YUV表示法的重要性是它的

Z亮度信號(Y)和色度信號(U、V)是相互

:獨立的,也就是說Y信號分量構成的黑

?白灰度圖與用U、V信號構成的另外兩幅

;單色圖是相互獨立的。由于Y、U、V是

:獨立的,所以可以對這些單色圖分別進

:行編碼。黑白電視能接收彩色電視信號

就是利用了YUV分量之間的獨立性。

目錄返回

YUV顏色模式

:?一幅彩色圖像和它對應的亮度信號(Y

:分量)圖像

:彩色空間RGB-YUV

NEXT

:YUV與RGB彩色空間變換

:Y=0.299R+0.587G+0.114B

2U=-0.147R-0.289G+0.436B

ZV=0.615R-0.515G-0.100B

寫成矩陣的形式:

Y0.2990.5870.114R

U=-0.147-0.2890.436G

V0.615-0.515-0.100B

彩色空間RGB-YIQfNEXf

YIQ與RGB彩色空間變換

Y=0.299R+0.587G+0.114B

I=0.596R-0.275G-0.321B

Q=0.212R-0.523G+0.3nB

寫成矩陣的形式:

11

1.1J.

:彩色空間RGB-YCrCb-

:EacL

?YCrCb與RGB彩色空間變換

:數字域中的彩色空間變換與模擬域的彩色空間變換

?不同。它們的分量使用Y、Cr和Cb來表示,與RGB空間的

Z轉換關系如下:

2Y=0.299R+0.578G+0.114B

ZCr=(0.500R-0.4187G-0.0813B)+128

2Cb=(-0.1687R-0.3313G+0.500B)+128

?寫成矩陣的形式:

CMYK顏色模式NEXT

z?這是彩色印刷使用的一種顏色模式。它由青

■(cyan)>洋紅(magenta)、黃(yellow)和黑(black)

Z四種顏色組成。

Z-這種模式的創建基礎和RGB不同,它不是靠

X增加光線,而是靠減去光線。這是因為與監

?視器或者電視機不同,打印紙不能創建光源,

:即它不會發射光線,而只能吸收和反射光線,

?即它只能夠吸收特定波長而反射其它波長。

:?通過對上述四種顏色的組合,可以產生可見

2光譜中的絕大部分顏色。

CMYK顏色模式BacU

CMYK模型以打印在紙張上

油墨的光線吸收特性為基礎,

白光照射到半透明油墨上時,

部分光譜被吸收,部分被反射

回眼睛。

理論上,青色(C)、洋紅

(M)和黃色(Y)色素能合成吸收

CMYK相減混色模型所有顏色并產生黑色。由于這

個原因,這些顏色叫作減色。

因為所有打印油墨都會包含一些雜質,這三種油墨實際上

產生一種土灰色,必須與黑色(K)油墨混合才能產生真正的

黑色。將這些油墨混合產生顏色叫作四色印刷。

顏色模型的色域BacU

色域是一個色系能夠顯示或打

印的顏色范圍。人眼看到的色譜比

任何顏色模型中的色域都寬。

在顏色模型中,Lab具有最寬的

色域,它包括RGB和CMYK色域中的所

有顏色。通常RGB色域包含能在計算

機顯示器或電視屏幕(發出紅、綠

和藍光)上所有能顯示的顏色。因

而一些諸如純青或純黃等顏色不能

:A.Lab色域B.RGB色域C.CMYK色域在顯示器上精確顯示。

:CMYK色域較窄,僅包含使用印刷色油墨能夠打印的顏色。當

■不能被打印的顏色在屏幕上顯示時,它們稱為溢色一一即超出CMYK

,色域之外。

:-圖像數據壓縮的可能性

z-統計冗余

z-信息燧冗余

?-結構冗余

Z-知識冗余

Z-視覺冗余

圖像的種類

NEXT

標準單色圖標準灰度圖

圖像的種類

NEXT

256色標準圖像24位標準圖像

圖像的種類

256色標準圖像轉換成的灰度圖24位標準圖像轉換成的灰度圖

統計冗余

??圖像數據存在大量的統計特征的重復,這種

Z重復包括靜態單幀圖像數據在空間上的冗余

:和音頻、視頻數據在時間上的冗余。

:-在動態圖像序列中,前后兩幀圖像之間具有

z較大的相關性,表現出幀與幀之間的重復,

:因而存在時間冗余。

信息燧冗余

??信息嫡定義為一組數據所表示的信息量,即

0N-1

:£=-工小1嗎,

?j=0

Z式中,£為信息嫡,N為數據的種類(或稱碼元)個數,

■為第,.個碼元出現的概率。

:?一組數據的數據量顯然等于各記錄碼元的二進制位數

,(即編碼長度)與該碼元出現的概率乘積之和,即

_N-T

:式中,〃為數據量,為第,個碼元的二進制位數。

Z?一般取%…(如ASCII編碼把所有碼元都編碼為

?7比特),這樣得到的〃必然大于昆這種因碼元編碼長

Z度的不經濟帶來的冗余稱為信息燧冗余或編碼冗余。

信息燧冗余?

圖26個英文字母相對頻率

結構冗余.

有些圖像從大面積上或整體上看存

在著重復出現的相同或相近的紋理結構,

例如布紋圖像和草席圖像,被稱為結構

冗余。

知識冗余

BacU

有許多圖像的理解與圖像

所表現內容的基礎知識(先

驗或背景知識)有相當大的

相關性,從這種知識出發

可以歸納出圖像的某種規

律性變化,這類冗余稱為

知識冗余。知識冗余的一

個典型例子是對人像的理

解,比如,鼻子上方有眼

睛,鼻子又在嘴的上方等。

目錄返回

視覺冗余

;人類的視覺系統

?實際上只在一定程度

Z上對圖像的變化產生

?敏感,即圖像數據中

Z存在著大量人類視覺

?覺察不到的細節。事

z實上,人類視覺系統24比特標準圖像轉換成的灰度圖

?的一般分辨力為64灰

z度級,而一般圖像量

?化采用的是256灰度

z級,這類冗余稱為視

2覺冗余。

256色標準圖像轉換成的灰度圖

第三章數字圖像處理技術

??J信號處理的基本術語考

z,J圖像數據壓縮基礎題

Z?圖像數據壓縮算法

Z?常用圖形、圖像文件的格式

Z?靜態圖像壓縮標準

Z?動態圖像壓縮標準

:?H.261和H.263標準

圖像數據壓縮算法

評價壓縮算法的指標

壓縮算法分類

行程長度編碼?預測編碼

哈夫曼編碼?變換編碼

算術編碼?模型法編碼

詞典編碼?混合編碼

:評價壓縮算法的指標.■

:?壓縮比指壓縮編碼后的數據量與原始

:數據大小的比值;

:?算法的復雜性和運算速度;

:?失真度。

?壓縮前:Synthetic.bmp393,270B壓縮后:Synthetic.jpg18,756B

壓縮比:18756/393270-1/21

?將16M色的真彩圖像(圖A)轉變為256色(圖B),數據量減少了約3倍,壓

?縮比為1:3.當然這時產生了色彩失真,但如果選擇原圖的色彩范圍定義

?調色板,色彩失真較小,人眼一般都還能接受.如果把圖像深度從8位再

:壓縮到4位,即從256色再壓到16色(圖C),雖然數據量只減少了2倍,壓縮

Z比為1:2,但這時的人眼所看到的色彩失真比第一次大得多,效果很差

壓縮算法分類

BaeU

根據對編碼數據進行解碼后與編碼

前的數據是否一致可以把數據編碼方法

分為兩類:

-無損編碼。解碼后的數據與編碼前的數據

完全一致,沒有任何失真。

-有損編碼。解碼后的數據與原始數據有一

定程度的偏差或失真,但一般不影響聽覺

或視覺效果。

行程長度編碼NEXT

:?把一系列的重復值(例如圖像象素的灰

X度值)用一個單獨的值再加上一個計數

2值來取代。

:?比如有這樣一個字母序列一、

Zaabbbccccccccdddddd它的行程長度編碼

:就是2a3b8c6d。

:■很多位圖文件格式都用行程長度編碼,

?例如TIFF,PCXo

行程長度編碼例

BacU

?有一線狀圖像,其灰度隨長度坐標

一的關系如圖3.1所示。描述這個一維4?一

Z圖像可以用順序的七個3bit的二進

2*~

.制數表示:011,011,011,011,1*~

Z101,101,101,共21比特。IIIiIII

0?1l*12+13r4,5+6,7。

z如果用行程編碼方法對其編碼,其圖3」一維圖像的例子"

,編碼就變成了100,011;011,101,

:共用了12比特,比前一種編碼節約

?了9個比特。

香農-范諾算法NEXT

信源(消息集)編碼輸出集

I編碼器

Z=屹],...,Z[]

X={X1,??.,xn}

符號集Am=d,…,am}

嫡(Entropy)的概念

嫡是信息量的度量方法,它表示某一事件出現的

消息越多,事件發生的可能性就越小,數學上就是概

率越小。

某個事件的信息量用4曰=崛名然表示,其中Pi

為第i個事件的概率,0<Pi?L

哈夫曼編碼INEXT

(1)統計信源符號出現的概率;

⑵將信源符號按概率遞減順序排列;

(3)把兩個最小的概率值加起來,作為一個新組合符號

的概率;

(4)重復步驟(2)、(3),直到概率和達到1為止;

⑸在每次合并信源時,將合并的信源分別標記“1”和

“0”(例如,概率小的標記為“1”,概率大的標記

為“0”);

(6)尋找從每一信源符號到概率為1的路徑,記錄下路徑

上的“1”和“0”;

(7)對每一符號寫出“1”和“0”序列;

哈夫曼編碼的例子NEXT

Xjxxxxx

?考慮信源23456

0.250.250.200.150.100.05

進行哈夫曼編碼的過程如下:

信源符號概率編碼過程碼長

0

0

0.2501

10.55

1.00編碼前:平均碼長為3

0

0.25

102

1編碼后:平均碼長為2.45

x0.20

30.4511壓縮比:

12.45/3

0

x40.150003

0.30

x50.1000104

10.0500114

:哈夫曼編碼的不足S

二?它必須精確地統計出原始文件中每個值的出現

:頻率,如果沒有這個精確統計,壓縮的效果就

z會大打折扣,甚至根本達不到壓縮的效果。因

?此哈夫曼編碼通常要經過兩遍操作,第一遍進

二行統計,第二遍產生編碼,所以編碼的過程是

:比較慢的。

:?另外由于各種長度的編碼的譯碼過程也比較復

:雜,因此解壓縮的過程也比較慢。

z?它對于位的增刪比較敏感。

算術編碼

INEXT

?算術編碼在圖像數據壓縮標準(如JPEG,JBIG)中扮演了重要的角

:色。在算術編碼中,消息用0到1之間的實數進行編碼,算術編碼用到

.兩個基本的參數:符號的概率和它的編碼間隔。信源符號的概率決定

?壓縮編碼的效率,也決定編碼過程中信源符號的間隔,而這些間隔包

■含在0到1之間。編碼過程中的間隔決定了符號壓縮后的輸出。

Z算法舉例

■假設信源符號為{00,01,10,11),這些符號的概率分別為{0.1,

:0.4,0.2,0.3),根據這些概率可把間隔[0,1)分成4個子間隔:

?[0,0.1),[0.1,0.5),[0.5,0.7),[0.7,1),二進制消息序列

■的輸入為:10001100101101

Z需要注意的幾個問題..

:EaeL

?1.由于實際計算機精度不可能無限長,運算中溢出是明顯的問題,

:但多數機器都有16位、32位或者64位的精度,因此可使用比例縮放

■法解決。

-2.算術編碼器對消息只產生一個碼字,這個碼字是在[0,1)中的一

.個實數,因此譯碼器在接受到表示這個實數的所有位之前不能進行

工譯碼。

-3.算術編碼也是一種對錯誤很敏感的編碼方法,如果有一位發生錯

,?誤就會導致整個消息譯錯。

?算術編碼可以是靜態的或者自適應的。在靜態算術編碼中,信源

;符號的概率是固定的。在自適應算術編碼中,信源符號的概率根據編

.碼時符號出現的頻繁程度動態地進行修改,在編碼期間估算信源符號

--概率的過程叫做建模。需要開發動態算術編碼的原因是因為事先知道

,精確的信源概率是很難的,而且是不切實際的。當壓縮消息時,我們不

2能期待一個算術編碼器獲得最大的效率,所能做的最有效方法是在編

■碼過程中估算概率。因此動態建模成為確定編碼器壓縮效率的關鍵。

詞典編碼

,詞典編碼的思想

,第一類詞典法的想法是企圖查找正在壓縮的字符序列

?是否在以前輸入的數據中出現過,然后用已經出現過的字

:符串替代重復的部分,它的輸出僅僅是指向早期出現過的

■字符串的“指針”O

詞典編碼

LZ77算法

算法中用到的幾個術語:

:1.輸入數據流(inputstream):要被壓縮的字符序列。

-2.字符(character):輸入數據流中的基本單元。

*3.編碼位置(codingposition):輸入數據流中當前要編碼的字符位

上.置,指前向緩沖存儲器中的開始字符。

:4.前向緩沖存儲器(Lookaheadbuffer):存放從編碼位置到輸入數據

:?流結束的字符序列的存儲器。

?5.窗口(window):指包含W個字符的窗口,字符是從編碼位置開始向

后數也就是最后處理的字符數。

16.指針(pointer):指向窗口中的匹配串且含長度的指針。

詞典編碼

?LZ77編碼算法的核心是查找從前向緩沖存儲器開始的最

:長的匹配串。編碼算法的具體執行步驟如下:

-1.把編碼位置設置到輸入數據流的開始位置。

Z2.查找窗口中最長的匹配串。

?3.以“(Pointer,Length)Characters”的格式輸出,

:其中Pointer是指向窗口中匹配串的指針,Length表

?示匹配字符的長度,Characters是前向緩沖存儲器中

Z的不匹配的第1個字符。

?4.如果前向緩沖存儲器不是空的,則把編碼位置和窗

:口向前移(Length+1)個字符,然后返回到步驟2。

詞典編石馬-LZ77算法

詞典編碼-LZSS算法

■?LZ77通過輸出真實字符解決了在窗口中出現沒有匹配

?串的問題,但這個解決方案包含有冗余信息。冗余信

Z息表現在兩個方面,一是空指針,二是編碼器可能輸

?出額外的字符,這種字符是指可能包含在下一個匹配

:串中的字符。

:LZSS算法以比較有效的方法解決這個問題,它的思

,想是如果匹配串的長度比指針本身的長度長就輸出指

z針,否則就輸出真實字符。

詞典編碼-LZSS算法

編碼算法的具體執行步驟如下:

?1.把編碼位置置于輸入數據流的開始位置。

?2.在前向緩沖存儲器中查找與窗口中最長的匹配串

:①Pointer:=匹配串指針。

,■②Length:=匹配串長度。

-3.判斷匹配串長度是否大于等于最小匹配串長度(Lengths

?.MIN-LENGTH),

:如果“是":輸出指針,然后把編碼位置向前移動Length個字符

如果“否”:輸出前向緩沖存儲器中的第1個字符,然后把編碼

--位置向前

三:移動一個字符。

.4.如果前向緩沖存儲器不是空的,就返回到步驟2。

詞典編碼-LZSS算法

詞典編碼-LZSS算法

■?在相同的計算機環境下,LZSS算法比LZ77可獲得比較

*高的壓縮比,而譯碼同樣簡單。這也就是為什么這種

Z算法成為開發新算法的基礎,許多后來開發的文檔壓

?縮程序都使用了LZSS的思想。例如,PKZip,ARJ,

:LHArc和ZOO等等,其差別僅僅是指針的長短和窗口的

:大小等有所不同。

:?LZSS同樣可以和嫡編碼聯合使用,傷|如ARJ就與霍夫

:曼編碼聯用,而PKZip則與Shannon-Fano聯用,它的

?后續版本也采用霍夫曼編碼。

第二類詞典編碼

輸入第二類算法的

數據流想法是企圖從輸入

的數據中創建一個

“短語詞典

(dictionaryof

數據流

thephrases),,,

這種短語可以是任

意字符的組合。編

碼數據過程中當遇

到已經在詞典中出

現的“短語”時,

編碼器就輸出這個

詞典中的短語的

“索引號”,而不

是短語本身。

LZ78算法

■?LZ78的編碼思想是不斷地從字符流中提取新的綴-符

:串(String),通俗地理解為新“詞條”,然后用“代

:號”也就是碼字(Codeword)表示這個“詞條”。這

?樣一來,對字符流的編碼就變成了用碼字(Codeword)

:去替換字符流(Charstream),生成碼字流(Code

:stream),從而達到壓縮數據的目的。

:?LZ78編碼器的輸出是碼字-字符(W,C)對,每次輸出一

X對到碼字流中,與碼字W相對應的綴-符串(String)用

?字符C進行擴展生成新的綴-符串(String),然后添加

T到詞典中。

LZ78算法

[W]123456789

與LZ77相比,LZ78

的最大優點是在每個編

步位置詞典■wi

|彝碼步驟中減少了綴-符

11串(String)比較的數目,

22而壓縮率與LZ77類似。

33

5

58

預測編碼INEXT

z?一般在圖像中局部區域的象

:素是高度相關的,因此可以

A用先前象素的有關灰度知識

:來對當前象素的灰度進行預

?計,這就是預測。

:*預測編碼可分為線性預測編

:碼和非線性預測編碼。前者

?常被稱為差分脈沖編碼調制,

:即DPCM(DifferentialPulse

0CodeModulation)。

的原理框圖

DPCMNEXT

DPCM原理:圖像中相鄰像素值具有相關性。每個

向素值可用與之相關的幾個向素值來做預測。

(b)DPCM譯碼框圖

:DPCM編碼示例

ZDPCM系統如圖所示,預測器的預輸入k仇)輸出或理)

?測值為前一個樣值(圖中D表示單位二咚

Z延遲)。假設輸入信號已經量化,一:+

?差值不再進行量化。若DPCM系統.

Z的輸入為{0,1,2,1,123,3,4,4,...},貝IjL

一編碼過程如下:

9)0121123344???

Q?)0012112334?■?

d{n}LI11-1011010?■?

變換編碼

INEXT

139144149153155155155155

變換編碼就是將時域信號144151153156159156156156

150155160163158156156156

(如圖像光強矩陣)變換到頻159161162160160159159159

159160161162162155155155

域信號(系數空間)上進行處161161161161160157157157

理的方法。162162161163162157157157

162162161161163158158158

在空間上具有強相關的信源圖象樣本

號,反映在頻域上是某些

?[X⑵COS空3]

特定的區域內能量常常被4iU)>016

集中在一起,或者是系數

235.6-1.0-12.1-5.202.1-1.7-2.71.3

矩陣的分布具有某些規律。-22.6-18.5-6.2-3.2-2.9-0.10.4-1.2

-10.9-9.3-1.61.50.2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論