




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、多媒體技術期末復習提要第一章多媒體技術概論復習內容:1、 多媒體、多媒體技術、多媒體系統媒體在計算機領域通常有兩種含義:一是指存儲信息的實體,如磁盤、光盤、磁帶、半導體存儲器等;二是指傳遞信息的載體,如數字、文字、聲音、圖形和圖像等。可見多媒體技術中的媒體是指后者。國際電話電報咨詢委員會CCITT(Consultative Committee on International Telephone and Telegraph,國際電信聯盟ITU的一個分會)把媒體分成5類: (1)感覺媒體(Perception Medium):指直接作用于人的感覺器官,使人產生直接感覺的媒體。如引起聽覺反應的聲音
2、,引起視覺反應的圖像等。 (2)表示媒體(representation Medium):指傳輸感覺媒體的中介媒體,即用于數據交換的編碼。如圖像編碼(JPEG、MPEG等)、文本編碼(ASCII碼、GB2312等)和聲音編碼等。 (3)表現媒體(Presentation Medium):指進行信息輸入和輸出的媒體。如鍵盤、鼠標、掃描儀、話筒、攝像機等為輸入媒體;顯示器、打印機、喇叭等為輸出媒體。 (4)存儲媒體(Storage Medium):指用于存儲表示媒體的物理介質。如硬盤、軟盤、磁盤、光盤、ROM及RAM等。 (5)傳輸媒體(Transmission Medium):指傳輸表示媒體的物理
3、介質。如電纜、光纜等。文本、聲音、圖形、圖像和動畫等是信息的載體,其中兩個或多于兩個的組合構成了多媒體。多媒體的英文單詞是Multimedia,它由media和multi兩部分組成。一般理解為多種媒體的綜合。ITU對多媒體含義的描述是: 使用計算機交互式綜合技術和數字通信網技術處理多種表示媒體-文本、圖形、圖像和聲音,使多種信息建立邏輯連接,集成為一個交互系統。多媒體系統是指利用計算機技術和數字通訊網技術來處理和控制多媒體信息的系統,如:CAI課件、視頻/音頻演示系統等。2、 促進多媒體技術發展的關鍵技術(1) 多媒體存儲與管理技術(2) 多媒體的標準化技術 (3) 多媒體數據庫(4) 數據壓
4、縮與編碼 (5) 多媒體通信 (6) 多媒體系統集成技術3、 多媒體技術的特性主要有:集成性、實時性、交互性、高質量4、 多媒體系統的組成多媒體系統的基本構成主要有:計算機硬件、多媒體計算機所配置的硬件(如壓縮、解壓縮專用芯片)、多媒體I/O控制及接口、多媒體的核心系統、多媒體創作系統和多媒體應用系統。5、多媒體的技術研究與應用開發 多媒體涉及的技術范圍很廣,技術很新、研究內容很深,是多種學科和多種技術交叉的領域。目前,多媒體技術的研究和應用開發主要在下列幾個方面:(1) 多媒體數據的表示技術(2) 多媒體創作和編輯工具(3) 多媒體數據的存儲技術(4) 多媒體的應用開發第二章 音頻信號及其處
5、理1、 聲音信號的物理特征 聲音信號主要的物理特征有:頻率、振幅、響度、音調、音色、和諧、不和諧等。頻率:信號的頻率是指信號每秒種變化的次數,波形中兩個連續波峰(或波谷)之間的距離稱為周期T,一秒鐘內所出現的周期數目即為頻率,頻率的單位為赫茲(Hz)。頻率能反映出聲音的聲調,我們所聽到的聲音如果細尖表示頻率高,聲音粗低表示頻率低。聲音按照頻率分為三種類型:次聲、可聽聲、超聲。低于20Hz的聲音為次聲,或稱為亞音信號(subsonic);可聽聲的聲音頻率范圍為2020000 Hz;高于20000 Hz的聲音為超聲,或稱超聲波(ultrasonic)信號。多媒體計算機中處理的聲音主要指可聽聲。一般
6、情況下人說話的話音信號的頻率范圍在3003000 Hz,稱為話音(speech)信號,在這種頻率范圍里感知的聲音幅度大約在0120 dB之間。振幅:聲音信號的另一個基本參數是振幅,它表示聲音信號的強弱。聲音信號的強度相差很大,從可以聽見的最弱聲到最強聲,其強度相差1萬億倍。聲音的強弱采用分貝作為量綱,區別兩個強度I和I0的分貝數(dB)是:聲音分貝數 = 10*log(I/ I0 )在心理上,聲音有兩個最重要的量綱,即響度和音調,其他還有音色、和諧、不和諧等。由聲音的物理特性得知,聲音的振幅增加,聲音的響度也增加;頻率增高,音調則增高。幅度與響度之間的關系是非線性的,幅度加倍不等于響度加倍;頻
7、率與響度、音調之間也有關系,頻率的變化既影響響度也影響音調;它們的關系起決于它們出現的情景,即使是最簡單的物理量綱也要受神經系統的綜合分析。例如,一個樂隊創造出豐富多彩的聽覺感受,一個精彩的報告給人們留下深刻的印象,而一些機器轟鳴聲和飛機的噪音使人煩躁不安。這些平時聽到的聲音感覺好壞不時響度和音調參數所能表達的,而是聲音心理學研究的問題。聲音的響度起決于幅度和頻率兩個因素,如果頻率不變,幅度高比幅度低的聲音信號要響些,如果幅度不變,甚高頻和甚低頻的聲音似乎比中頻聲音要柔弱的多。音頻的定義以及分類,聲音的三要素:l 音頻的頻率范圍在20Hz到20kHz之間。l 音頻這種聽覺媒體主要分為波形聲音、
8、語音和音樂。l 聲音的三要素指音調、音強和音色。2、模擬信號和數字信號我們把在時間和幅度上都是連續的信號稱為模擬信號。在某些特定的時刻對這種模擬信號進行測量叫做采樣(sampling),由這些特定時刻采樣得到的信號稱為離散時間信號。采樣得到的幅值是無窮多個實數值中的一個,因此幅度還是連續的。如果把信號幅度取值的數目加以限定,這種由有限個數值組成的信號就稱為離散幅度信號。我們把時間和幅度都用離散的數字表示的信號就稱為數字信號。音頻信號的數字化處理過程:(1)選擇采樣頻率,進行采樣;(2)選擇分辨率,進行量化;(3)形成聲音文件。數字化實際上就是采樣和量化。如前所述,連續時間的離散化通過采樣來實現
9、,就是每隔相等的一小段時間采樣一次,這種采樣稱為均勻采樣(uniform sampling);連續幅度的離散化通過量化(quantization)來實現,就是把信號的強度劃分成一小段一小段,如果幅度的劃分是等間隔的,就稱為線性量化,否則就稱為非線性量化。3、采樣定理采樣頻率的高低是根據奈奎斯特理論(Nyquist theory)和聲音信號本身的最高頻率決定的。奈奎斯特理論指出,采樣頻率不應低于聲音信號最高頻率的兩倍,這樣就能把以數字表達的聲音還原成原來的聲音,這叫做無損數字化(lossless digitization)。采樣定律用公式表示為fs >= 2f 或者 Ts <= T/
10、2其中f為被采樣信號的最高頻率。如果不遵循采樣定理,則必然造成誤差,通常稱為混疊效應。為了更好地防止混疊效應,一是對信號進行濾波,濾除高頻成分,使信號的最高頻率限制在fmax之內。其二是嚴格依據定理,以22fmax的頻率進行采樣。4采樣精度、采樣位數、聲道數采樣數據位數(Sampling Data)也稱量化精度,是指每個采樣點在A/D轉換后所表示的數據范圍。常用的采樣數據位數有:8bit,14bit,16bit。樣本大小是用每個聲音樣本的位數bit/s(即bps)表示的,它反映度量聲音波形幅度的精度。樣本位數的大小影響到聲音的質量,位數越多,聲音的質量越高,而需要的存儲空間也越多;位數越少,聲
11、音的質量越低,需要的存儲空間越少。一個聲音文件的數據量可由下列公式推導出來: (采樣頻率*采樣數據位數*聲道數)/8 = 字節數/秒(B/s)如果對每個取樣的幅度值用R位二進制編碼(R比特)表示,就得到數字信號的傳輸速率或比特率I,I=fs*R(bit/s 或 b/s)當信號帶寬給定從而fs已知且不變時,傳輸速率就簡單地由采樣位數R來確定。在有關編碼的文獻及書本中,比特率(或數碼率、碼率、速率、數據率)用來表示I和R,具體指哪一個從其量綱即可以確定,不會混淆。一般傳輸時多用I,存儲時多用R。5常見的音頻信號常見的音頻信號主要有:電話音頻信號、調頻調幅無線電廣播音頻信號和高保真的立體聲音頻信號。
12、由于其用途不同,這些音頻信號的帶寬也各不相同,而且在音響設備中,通常以帶寬來衡量聲音的質量。圖2-05表示了這4種常見音頻信號的帶寬。數字激光唱盤(CD)FM無線電廣播AM無線電廣播電 話10 20 50 200 3400 7k15k 20k圖2-05音頻信號的帶寬6質量的評價聲音質量的評價是一個很困難的問題,目前還在繼續研究的課題。前面介紹了用聲音信號的帶寬來衡量聲音的質量,等級由高到低依次是DAT,CD,FM,AM和數字電話。此外,聲音質量的度量還有兩種基本的方法:一種是客觀質量度量,另一種是主觀質量度量。評價語音質量時,有時同時采取兩種方法評估,有時以主觀質量度量為主。聲音客觀質量的度量
13、主要用信噪比(signal to niose ratio,SNR),峰值信噪比(PSNR)等。7音頻信號的標準和規范表2-04數字電話的編碼標準組 織ISOCCITTGSMCTIANSA標 準G.711G.721G.728GSMGIA制定時間19921972198419921983198919891982傳輸率Kb/s1286432161384.82.4編碼算法PCMADPCMLD-CELPRPE-LTVSELPCELPLPC質 量5.04.34.14.03.73.83.22.5使用場合CD長途電話網絡移動通信保密電話CCITT:國際電報電話咨詢委員會,GSM:歐洲移動通信專家組,CTIA:美
14、國移動通信標準,NSA:美國國家安全局。8、 音頻文件大小的計算文件的字節數/每秒=采樣頻率(Hz)´采樣位數(位)´聲道數/89、常見的聲音文件格式,如:.WAV、.VOC、.MIDI文件10、 MIDI的含義、MIDI與數字化聲音的比較MIDI是樂器數字接口的英文縮寫,泛指數字音樂的國際標準,它是音樂與計算機結合的產物。MIDI信息實際上是樂譜的數字描述,這里樂譜完全由音符序列、定時以及被稱為合成音色的樂器定義組成。當一組MIDI消息通過音樂合成器芯片演奏時,合成器就會解釋這些符號并產生音樂。選擇MIDI還是數字化聲音,要考慮計算機處理數字文件的能力,對回放硬件的控制能
15、力以及是否有語言對話的需要等方面因素。產生MIDI樂音的方法很多,現在用得較多的方法有兩種:一種是(frequency modulation,FM)合成法,另一種是樂音樣本合成法,也稱為波形表(Wavetable)合成法。11、波形聲音與MIDI音樂的比較MIDI消息實際上就是樂譜的數字表示。與波形聲音相比,MIDI數據不是聲音而是指令,因此它的數據量要比波形聲音少得多。如30分鐘的立體聲高品質音樂,用波形文件無壓縮錄制,約需300MB的存儲空間;而同樣的MIDI數據,則只需200KB,兩者相差1500倍之多。另外,對MIDI的編輯很靈活,可以自由地改變曲調、音色等屬性,波形聲音就很難做到這一
16、點。波形聲音與設備無關,MIDI數據是與設備有關的,即MIDI音樂文件所產生的聲音與用來回放的特定的MIDI設備有關。總的來說,數字化聲音最重要的優點是重放質量的一致性、可靠性比較好,可自始至終保證質量,而MIDI在這一點上則比較差。12、數據壓縮基礎信源信宿信源編碼信源解碼信道編碼信道解碼調 制傳輸通道解 調信 源 編 碼信 道 解 碼信道噪 聲圖2-2-1統一的數字傳輸系統模型圖中信源編碼和信源解碼即為本課程所要研究的內容,統稱為信源解碼;而信道編碼和信道解碼統稱為信道編碼。信源解碼:主要解決有效性問題。通過對信源的壓縮、擾亂、加密等一系列處理,力求用最少的數碼傳遞最大的信息量,使信號更適
17、宜傳輸。信道編碼:主要解決可靠性問題。即盡量使處理過的信號在傳輸過程中不出錯或少出錯,即使出了錯也要能自動檢錯和盡量糾錯。如果信道編碼的糾錯能力足以保證對數字序列的無誤差解碼,則圖2-2-1中的信道編碼、解碼器(簡寫為Codec,即Coder+Decoder),調制、解調器(簡寫為Modem,即Modulator + Demodulator),以及實際的物理傳輸通道(模擬信道),有時集中成一個理想的方框,叫作無噪聲數字信道,如圖2-2-1中的虛線右邊部分。而模擬信道加上Modem構成的方框,即為一個實際的數字信道。因此,從信息論角度看,信源編碼編碼的一個最主要的目的,就是要解決數據的壓縮問題,
18、它構成了數據壓縮的理論基礎。13、數據壓縮及其必要性數據壓縮,就是以最少的數碼表示信源所發的信號,減少容納給定消息集合或數據采樣集合的信號空間。所謂信號空間即被壓縮的對象是指:1、 物理空間,如硬盤、磁盤、磁帶等數據存儲介質;2、 時間空間,如傳輸給定消息集合所需要的時間;3、 電磁頻譜區域,如為傳輸給定消息集合所要求的帶寬等。而數據壓縮的好處就在于:1、 較快地傳輸各種信源(降低信道占有費用)-時間域的壓縮;2、 在現有通信干線上開通更多的并行業務(如電視、傳真、可視電話等)-頻率域的壓縮;3、 降低發射機功率-能量域的壓縮;4、 緊縮數據存儲量(降低存儲費用)-空間域的壓縮。14、數據壓縮
19、技術的分類比較一致的分類方法,是將數據壓縮分為在某種程度上可逆的與實際上不可逆的兩類,這樣更能說明它們的本質區別。1、 可逆壓縮也叫作無失真編碼、無噪聲編碼(Noiseless Coding)、冗余度壓減(Redundancy reduction)、熵編碼(Entropy Coding)、數據緊縮(Data compaction)、信息保持編碼(Lossless,bit-preserving),等等。2、 不可逆壓縮又稱有失真(Lossy)編碼,信息論中叫熵壓縮(Entropy Compression).15、 實用的數據壓縮數據壓縮冗余度壓縮熵壓縮統計編碼霍夫曼編碼游程編碼二進制編碼LZW編
20、碼其它量 化特征提取零記憶量化均勻量化馬克斯量化壓擴量化序列量化預測編碼分組量化直接映射變換編碼分析-合成增量調制線性預測非線性預測自適應預測運動補償預測矢量量化神經網絡方塊截尾KLTDCTDFTHAAR非正交編碼第三章 語音編碼技術1、 數據壓縮技術的三個重要指標 這三個指標是:壓縮前后所需的信息存儲量之比;壓縮算法;恢復效果。2、音頻信號的編碼方式大致分為三大類:(1) 波形編碼,如PCM、APC、SDC、ATC(2) 音源編譯碼器(分析合成方法),如LPC(3) 混合編碼方法2、 話音信號壓縮的主要依據音頻冗余主要表現為時域冗余度、頻域冗余度。 一、時域信息冗余度l 幅度非均勻分布l 樣
21、本間的相關性l 周期之間的相關性l 基音之間的相關性l 靜止系數(話音間隙)l 長時自相關函數 二、頻域信息冗余度l 非均勻的長時功率譜密度l 語音特有的短時功率譜密度三、人的聽覺感知機理l 人的聽覺具有掩蓋效應l 人耳對不同頻率聲音的敏感程度不同,對低頻率比較敏感l 人耳對對語音信號的相位變化不敏感4、常見的語音編碼技術有:常見的音頻數據壓縮方法無損壓縮有損壓縮哈夫曼編碼算術編碼行程編碼波形編碼音源編碼混合編碼PCMDM、ADMDPCM、ADPCM子帶編碼失量編碼LPCMPE、RPE、CELP、MP-LPC5、 PCM由采樣和量化兩部分組成,量化有好幾種方法,但可歸納成兩類:一類
22、稱為均勻量化,另一類稱為非均勻量化(律壓擴(companding)算法,另一種稱為A律壓擴算法。)。采用的量化方法不同,量化后的數據量也就不同。因此,可以說量化也是一種壓縮數據的方法。、DM、ADM、DPCM、ADPCM6、 DM增量調制也稱調制(delta modulation,DM),它是一種預測編碼技術,是PCM編碼的一種變形。PCM是對每個采樣信號的整個幅度進行量化編碼,因此它具有對任意波形進行編碼的能力;DM是對實際的采樣信號與預測的采樣信號之差的極性進行編碼,將極性變成“0”和“1”這兩種可能的取值之一。由于DM編碼只須用1位對話音信號進行編碼,所以DM編碼系統又稱為“1位系統”。
23、 DM存在“斜率過載”(slope overload)和粒狀噪聲(granular noise)。7、自適應增量調制(ADM) 為了對DM中出現的“斜率過載”和“粒狀噪聲”問題進行改進,從而提出了自適應增量調制(ADM) 。使增量調制器的量化階能自適應,也就是根據輸入信號斜率的變化自動調整量化階的大小,在檢測到斜率過載時開始增大量化階,而在輸入信號的斜率減小時降低量化階。8、自適應脈沖編碼調制(adaptive pulse code modulation,APCM)是根據輸入信號幅度大小來改變量化階大小的一種波形編碼技術。這種自適應可以是瞬時自適應,即量化階的大小每隔幾個樣本就改變,也可以是音
24、節自適應,即量化階的大小在較長時間周期里發生變化。改變量化階大小的方法有兩種:一種稱為前向自適應(forward adaptation),另一種稱為后向自適應(backward adaptation)。9、差分脈沖編碼調制DPCM(differential pulse code modulation)是利用樣本與樣本之間存在的信息冗余度來進行編碼的一種數據壓縮技術。差分脈沖編碼調制的思想是,根據過去的樣本去估算(estimate)下一個樣本信號的幅度大小,這個值稱為預測值,然后對實際信號值與預測值之差進行量化編碼,從而就減少了表示每個樣本信號的位數。它與脈沖編碼調制(PCM)不同的是,PCM是
25、直接對采樣信號進行量化編碼,而DPCM是對實際信號值與預測值之差進行量化編碼,存儲或者傳送的是差值而不是幅度絕對值,這就降低了傳送或存儲的數據量。此外,它還能適應大范圍變化的輸入信號。10、ADPCM是利用樣本與樣本之間的高度相關性和量化階自適應來壓縮數據的一種波形編碼技術,CCITT為此制定了G.721推薦標準,這個標準叫做32 kb/s自適應差分脈沖編碼調制32 kb/s Adaptive Differential Pulse Code Modulation7。CCITT推薦的G.721 ADPCM標準是一個代碼轉換系統。它使用ADPCM轉換技術,實現64 kb/s A律或律PCM速率和3
26、2 kb/s速率之間的相互轉換。11、 重點了解DPCM系統原理圖中各個信號的含義,及主要處理的過程描述。第四章 視 頻 信 號 處 理1、 圖像的屬性主要包括:分辨率、像素深度、圖像深度、真/偽彩色、圖像的表示法和種類等。其中分辨率又包括:顯示分辨率和圖像分辨率。2、 位圖圖像、矢量圖形的概念;矢量圖與位圖比較位圖圖像(Bit-Map Image)是指在空間和亮度上已經離散化的圖像。通常把一幅位圖圖像考慮為一個矩陣,矩陣中的一個元素(像素)對應圖像的一個點,相應的值表示該點的灰度或顏色等級。矢量圖形(Vector-Based Image)是用一個指令集合來描述的。這些指令用來描述圖中線條的形
27、狀、位置、顏色等各種屬性和參數。矢量圖與位圖比較,主要看空間和性能兩方面,一般說來,要看圖像的復雜程度,簡單的圖使用矢量圖描述好一些,復雜的圖使用位圖好一些。3、 計算機中常用的顏色模型主要有紅綠藍(RGB)和色調-飽和度-亮度(hue-saturation-lightness,HSL)顏色模型。在HSL模型中,H定義顏色的波長,稱為色調;S定義顏色的強度(intensity),表示顏色的深淺程度,稱為飽和度;L定義摻入的白光量,稱為亮度。4、 稱為CMY模型由青色(Cyan)、品紅(Magenta)和黃色(Yellow)三基色組成,通常寫成CMY。用這種方法產生的顏色之所以稱為相減色。5、
28、目前采用的彩色空間變換有三種:YIQ, YUV和YCrCb。每一種彩色空間都產生一種亮度分量信號和兩種色度分量信號,而每一種變換使用的參數都是為了適應某種類型的顯示設備。其中,YIQ適用于NTSC彩色電視制式,YUV適用于PAL和SECAM彩色電視制式,而YCrCb適用于計算機用的顯示器。6、 YUV表示法的重要性是它的亮度信號(Y)和色度信號(U、V)是相互獨立的,也就是Y信號分量構成的黑白灰度圖與用U、V信號構成的另外兩幅單色圖是相互獨立的。由于Y、U、V是獨立的,所以可以對這些單色圖分別進行編碼。此外,黑白電視能接收彩色電視信號也就是利用了YUV分量之間的獨立性。YUV表示法的另一個優點
29、是可以利用人眼的特性來降低數字彩色圖像所需要的存儲容量。7、 目前世界上現行的彩色電視制式有三種:NTSC制、PAL制和SECAM制。這里不包括高清晰度彩色電視HDTV (High-Definition television)。8、 在彩色電視中,用Y、C1, C2彩色表示法分別表示亮度信號和兩個色差信號,C1,C2的含義與具體的應用有關。在NTSC彩色電視制中,C1,C2分別表示I、Q兩個色差信號;在PAL彩色電視制中,C1,C2分別表示U、V兩個色差信號;在CCIR 601數字電視標準中,C1,C2分別表示Cr,Cb兩個色差信號。所謂色差是指基色信號中的三個分量信號(即R、G、B)與亮度信
30、號之差。在彩色電視中,使用Y、C1,C2有兩個重要優點:Y和C1,C2是獨立的,因此彩色電視和黑白電視可以同時使用,Y分量可由黑白電視接收機直接使用而不需做任何進一步的處理;可以利用人的視覺特性來節省信號的帶寬和功率,通過選擇合適的顏色模型,可以使C1,C2的帶寬明顯低于Y的帶寬,而又不明顯影響重顯彩色圖像的觀看。因此,為了滿足兼容性的要求,彩色電視系統選擇了一個亮度信號和兩個色差信號,而不直接選擇三個基色信號進行發送和接收。9、 彩色電視信號的類型主要有:復合電視信號、分量電視信號、S-Video信號。10、對色差信號使用的采樣頻率比對亮度信號使用的采樣頻率低,這種采樣就稱為圖像子采樣(su
31、bsampling)。 這種壓縮方法的基本根據是人的視覺系統所具有的兩條特性, 一、是人眼對色度信號的敏感程度比對亮度信號的敏感程度低,利用這個特性可以把圖像中表達顏色的信號去掉一些而使人不察覺; 二、是人眼對圖像細節的分辨能力有一定的限度,利用這個特性可以把圖像中的高頻信號去掉而使人不易察覺。10、 了解行程編碼的主要概念,熟悉掌握LZW編碼的編、譯碼過程。11、變化編碼的基本概念:變換編碼就是對圖象進行某種正交變換,并對變換后的數據進行編碼,從而達到壓縮數據的目的. 常見的正交變換有:傅立葉變換、哈爾變換、斜變換、正弦變換、余弦變換、K-L變換、小波變換等。從理論上講, K-L變換效果最佳
32、,但由于其只有求出輸入數據的相關矩陣和本征矢量,才能進行K-L變換,且沒有快速算法,實現復雜,因此,很少使用。 正交變換的具有如下特性:Ø 熵保持Ø 能量保持Ø 去相關Ø 能量重新分布與集中11、 詳細了解JPEG編碼和譯碼的主要步驟、及各個步驟的作用和理論依據。12、 DC和AC系數各有何特點,分別采用什么方法對它們進行數據壓縮。13、 按照JPEG中的要求,對DC和AC系數進行實際的編碼。14、 掌握Huffman編碼過程。Huffman編碼體現了統計編碼的思想。它對于出現頻率大的符號用較少的位數來表示,而對于出現頻率小的符號用較多的位數來表示。其編
33、碼效率主要取決于需編碼的符號出現的概率分布,越集中則壓縮比越高。第五章 動態圖像的處理1、 動態圖像的特點:(1) 數據量大(2) 幀與幀之間存在大量的時間冗余信息(3) 幀內存在大量的空間冗余信息2、動態圖像的數據壓縮技術(1) 幀內有變換編碼、預測編碼、熵編碼等(2) 幀間主要采用:幀間預測編碼和運動補償3、 幀間差值的統計特性表明:一般動態圖像的幀間差值比較小,這種統計特性是幀間壓縮編碼的基本依據4、 運動補償預測(Motion Compensation,簡寫)技術通常由以下幾個方面組成:l 首先把圖像分割為靜止的和運動的兩個部分,假設運動物體僅作平移。n 估計物體的位移值。n 用位移估值(即運動矢量motion vector)進行運動補償預測n 預測信息編碼。5、 熟悉運動補償預測技術的基本原理,能解釋其運動補償預測編碼的系統框圖。量化器運動補
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 人教部編版九年級上冊水調歌頭教學設計
- 七年級生物下冊 4.2.1《食物中的營養物質》教學設計2 (新版)新人教版
- 人教版初中歷史與社會九年級上冊 2.2.1 土耳其凱末爾革命 教學設計
- 初中語文人教部編版(2024)七年級上冊(2024)第一單元閱讀綜合實踐教案及反思
- 中職政治 (道德與法治)第2課 生涯規劃 筑夢未來公開課教學設計
- 六年級數學下冊 數學好玩第3課時 可愛的小貓教學設計 北師大版
- 一年級下冊美術教學設計-3.五彩的泡泡5-嶺南版
- 九年級英語上冊 Unit 7 Teenagers should be allowed to choose their own clothes Section B(3a-Self Check)教學設計(新版)人教新目標版
- 病案管理培訓制度課件
- 七年級英語上冊 Unit 2 This is my sister Section B (1a-1d)教學設計(新版)人教新目標版
- 2025年滁州市城投交通控股有限公司招聘19人筆試參考題庫附帶答案詳解
- 汽車美容師洗車方法實際操作試題及答案
- 鹽城2025年江蘇鹽城建湖縣部分醫療衛生事業單位校園招聘專業技術人員37人筆試歷年參考題庫附帶答案詳解
- 中國電影史知到課后答案智慧樹章節測試答案2025年春華東師范大學
- 對外經濟貿易大學自主招生個人陳述寫作實例
- 部門決算管理制度
- 神經內科護理案例分析
- 2025年安徽省中考模擬英語試題(原卷版+解析版)
- 【初中語文】第11課《山地回憶》課件-2024-2025學年統編版語文七年級下冊
- 入團考試模擬100題及答案
- 玉盤二部合唱正譜
評論
0/150
提交評論