《全國計算機等級考試一級教程》課件-1-3_第1頁
《全國計算機等級考試一級教程》課件-1-3_第2頁
《全國計算機等級考試一級教程》課件-1-3_第3頁
《全國計算機等級考試一級教程》課件-1-3_第4頁
《全國計算機等級考試一級教程》課件-1-3_第5頁
已閱讀5頁,還剩22頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1.3多媒體簡介

隨著電子技術和信息處理技術的發展,計算機技術、廣播電視技術和通信網絡技術這三個領域互相滲透、通融、促進,從而形成了一門新的技術,即多媒體技術,出現了改善人類信息的交流。對人們生活方式、交互環境起到了不容忽視的作用。

1.3.1多媒體的基本概念

多媒體是指文本、圖形、圖像、聲音、動畫、視頻等多種媒體的統稱。多媒體技術是指利用計算機對文本、圖形、圖像、聲音、視頻等多種信息綜合處理,在各種媒體信息間建立邏輯關系和人機交互作用的技術。按照國際電信聯盟(ITU)標準的定義,媒體一般分為感覺媒體、表示媒體、表現媒體、存儲媒體和傳輸媒體。

多媒體是融合了兩種以上媒體的人機交互式信息交流和傳播媒體,具有以下5個特點:多樣性、交互性、集成性、數字化和實時性。1.3.2媒體的數字化

在計算機和通信領域里,歸結為最基本的三種媒體是:聲音、圖像、文本。傳統的計算機只能夠處理單一的文本媒體,而多媒體計算機能夠同時采集、處理、存儲和展示多種媒體信息。1.聲音

聲音是一種重要的媒體,其種類繁多,如人的語音、動物的聲音、樂器聲、機器聲,等等。(1)聲音的數字化

聲音是通過空氣傳播的連續的波,即聲波。聲波傳入人耳,人們就產生了聲音的感覺。計算機系統通過輸入設備(麥克風等)輸入聲音信號,并對其進行采樣、量化而將其轉換成數字信號,然后通過輸出設備(音箱等)輸出。將連續的模擬信息變成離散的數字信號就是數字化,數字化的基本技術是脈沖編碼調制,主要包括采樣、量化、編碼3個基本過程:

①采樣:聲音用電表示時,聲音信號是在時間上和幅度上都連續的模擬信號。每隔一段時間對連續的模擬信號進行測量,就是采樣。每秒鐘的采樣次數即為采樣頻率。采樣頻率越高,采集到的樣本就越多,則聲音信號的還原性能就越好。根據奈奎斯特采樣定理,當采樣頻率大于或等于聲音信號最高頻率的兩倍時,就可以將采集到的樣本還原成原聲音信號。

②量化:在這些特定的時刻采樣后得到的信號轉換成相應的數值,就是量化。轉換后的數值以幾位二進制數的形式進行存儲即為量化位數。

量化位數一般為8位、16位。量化位數越大,采集到的樣本精度就越高,聲音的質量就越高。但量化位數越多,需要的存儲空間也就越多。

記錄聲音時,每次只產生一組聲波數據,稱單聲道;每次產生兩組聲波數據,稱雙聲道。雙聲道具有空間立體效果,但所占空間比單聲道多一倍。

③編碼:經過采樣、量化后,還需要進行編碼,即將量化后的數據轉換成二進制碼組。編碼是將量化的結果采用二進制數的形式表示。有時也將量化和編碼過程統稱為量化。最終產生的音頻數據量按照下面公式計算:頻數據量(B)=采樣時間(S)×采樣頻率(Hz)×量化位數(b)×聲道數/8

采樣和量化過程中使用的主要硬件是A/D轉換器(模擬/數字轉換器,實現模擬信號到數字信號的轉換)和D/A轉換器(數字/模擬轉換器,實現數字信號到模擬信號的轉換)。(2)聲音文件格式

存儲聲音信息的文件格式有很多種,常用的有WAV文件、MPEG文件、RealAudio文件、MIDI文件、VOC文件、AU文件以及AIF文件等。WAV文件又稱為波形文件,它是以“.wav”作為文件的擴展名。WAV文件是Windows中采用的波形文件存儲格式,它是對聲音信號進行采樣、量化后生成的聲音文件。波形文件中除了采樣頻率、樣本精度等內容外,主要是由大量的經采樣、量化后得到聲音數據組成的。因此,波形文件的大小可以近似地等于大量的聲音數據所占用的存儲空間。MPEG文件是指采用MPEG(.mp1/.mp2/.mp3)音頻壓縮標準進行壓縮的文件。MPEG音頻文件的壓縮是一種有損壓縮,根據壓縮質量和編碼復雜程度的不同可分為3層,分別對應MP1、MP2、MP3這三種音頻文件,壓縮比分別是4:1,6:1~8:1,10:1~12:1。其中MP3文件因為其壓縮比高、音質接近CD、制作簡單、便于交換等優點,非常適合在網上傳播,是目前使用最多的音頻文件格式,其音質稍差于WAV文件。RealAudio文件是由RealNetwork公司推出的一種網絡音頻文件格式,采用了“音頻流”技術,其最大的特點就是可以實時傳播音頻信息,尤其是在網速較慢的情況下,仍然可以較為流暢地傳送數據,因此主要適用于在網絡上在線播放。現在的RealAudio文件格式主要有RA、RM和RMX三種,這些文件的共性在于隨著網絡帶寬的不同而改變聲音的質量,在保證大多數人聽到流暢聲音的前提下,使帶寬較寬的聽眾獲得好的音質。MIDI(MusicalInstrumentDigitalInterface,電子樂器數字接口)文件規定了樂器、計算機、音樂合成器以及其他電子設備之間交換音樂信息的一組標準規定。MIDI文件中的數據記錄的是一些關于樂曲演奏的內容,而不是實際的聲音。因此MIDI文件要比WAV文件小很多,而且易于編輯、處理。MIDI的缺點是播放聲音的效果依賴于播放MIDI的硬件質量,但整體效果都不如WAV文件。產生MIDI樂音的方法有很多種,常用的有FM合成法和波表合成法。MIDI文件的擴展名有“.mid”、“.rmi”等。VOC文件是聲霸卡使用的音頻文件格式,它以“.voc”作為文件的擴展名。AU文件主要用在Unix工作站上,它以“.au”作為文件的擴展名。AIF文件是蘋果機的音頻文件格式,它以“.aif”作為文件的擴展名。。2.圖像(1)靜態圖像的數字化

一幅圖像可以近似地看成是由許許多多的點組成的,因此它的數字化通過采樣和量化就可以得到。圖像的采樣就是采集組成一幅圖像的點。量化就是將采集到的信息轉換成相應的數值。組成一幅圖像的每個點被稱為是一個像素,每個像素值表示其顏色、屬性等信息。存儲圖像顏色的二進制數的位數,稱為顏色深度。(2)動態圖像的數字化

由于人眼看到的一幅圖像消失后,還將在視網膜上滯留幾毫秒,因此動態圖像正是根據這樣的原理而產生的。動態圖像是將靜態圖像以每秒鐘n幅的速度播放,當n≥25時,顯示在人眼中的就是連續的畫面。(3)點位圖和矢量圖

表達或生成圖像通常有兩種方法:點位圖法和矢量圖法。點位圖法就是將一幅圖像分成很多小像素,每個像素用若干二進制位表示像素的顏色、屬性等信息。矢量圖法就是用一些指令來表示一幅圖。(4)圖像文件格式

bmp文件:是Windows采用的圖像文件存儲格式。

gif文件:供聯機圖形交換使用的一種圖像文件格式,目前在網絡通信中被廣泛采用。

tiff文件:二進制文件格式。廣泛用于桌面出版系統、圖形系統和廣告制作系統,也可以用于一種平臺到另一種平臺間圖形的轉換。

png文件:圖像文件格式,其開發目的是替代GIF文件格式和TIFF文件格式。

wmf文件:是絕大多數Windows應用程序都可以有效處理的格式,其應用很廣泛,是桌面出版系統中常用的圖形格式。

dxf文件:一種向量格式,絕大多數繪圖軟件都支持這種格式。(5)視頻文件格式

avi文件:是Windows操作系統中數字視頻文件的標準格式。

mov文件:是QuickTimeforWindows視頻處理軟件所采用的視頻文件格式,其圖像畫面的質量比AVI文件要好。1.3.3多媒體數據壓縮

多媒體信息數字化之后,其數據量往往非常龐大。多媒體信息必須經過壓縮才能滿足實際的需要。

數據壓縮可以分為兩種類型:無損壓縮和有損壓縮。1.無損壓縮

無損壓縮是指壓縮后的數據能夠完全還原成壓縮前的數據,壓縮比較低一般為2:1~5:1。常用的無損壓縮編碼技術包括行程編碼、熵編碼等。(1)行程編碼

行程編碼簡單直觀,編碼和解碼速度快;其壓縮比與壓縮數據本身有關,行程長度大,壓縮比就高。適于計算機繪制的圖像,如BMP、AVI文件;對于彩色照片,由于色彩豐富,采用行程編碼壓縮比會比較小。(2)熵編碼

根據信源符號出現概率的分布特性進行碼率壓縮的編碼方式稱為熵編碼,也叫統計編碼。其目的在于在信源符號和碼字之間建立明確的一一對應關系,以便在恢復時能準確地再現原信號,同時使平均碼長或碼率盡量小。熵編碼包括霍夫曼編碼和算術編碼。

算術編碼的優點是每個傳輸符號不需要被編碼成整數“比特”。雖然算術編碼實現方法復雜,但通常算術編碼的性能優于霍夫曼編碼。JPEG標準:第一個針對靜止圖像壓縮的國際標準。JPEG標準制定了兩種基本的壓縮編碼方案:以離散余弦變換為基礎的有損壓縮編碼方案和以預測技術為基礎的無損壓縮編碼方案。

MPEG標準:規定了聲音數據和電視圖像數據的編碼和解碼過程、聲音和數據之間的同步等問題。MPEG-1和MPEG-2是數字電視標準,其內容包括MPEG電視圖像、MPEG聲音及MPEG系統等內容。MPEG-4是1999年發布的多媒體應用標準,其目標是在異種結構網絡中能夠具有很強的交互功能并且能夠高度可靠地工作。MPEG-7是多媒體內容描述接口標準,其應用領域包括數字圖書館、多媒體創作等。2.有損壓縮

有損壓縮是指壓縮后的數據不能夠完全還原成壓縮前的數據,其損失的信息多是對視覺和聽覺感知不重要的信息。有損壓縮的壓縮比要高于無損壓縮。典型的有損壓縮編碼方法有預測編碼、變換編碼、基于模型編碼、分形編碼及矢量量化編碼等。(1)預測編碼

預測編碼是根據離散信號之間存在著一定相關性的特點,利用前面一個或多個信號對下一個信號進行預測,然后對實際值和預測值之差進行編碼和傳輸。在接收端把差值與實際值相加,恢復原始值。在同等精度下,就可以用比較少的“比特”進行編碼,達到壓縮的目的。

預測編碼中典型的壓縮方法有脈沖編碼調制、差分脈沖編碼調制、自適應差分脈沖編碼調制等,它們比較適合于聲音、圖像數據的壓縮,因為這些數據由采樣得到,相鄰采樣值之間相差不多很大,可以用較少位來表示。(2)變換編碼

變換編碼是指先對信號進行某種函數變換,從一種信號空間轉換到另一種信號空間,然后再對信號進行編碼。如將時域信號變換到頻域,因為聲音、圖像信號在頻域中其能量相對集中在直流及低頻部分,高頻部分則只包含少量的細節,如果去除這些細節,并不影響人類對聲音或圖像的感知效果,所以對變換后的信號進行編碼,能夠大大壓縮數據。

變換編碼包括四個步驟:變換、變換域采樣、量化和編碼。變換本身并不進行數據壓縮,它只把信號映射到另一個域,使信號在變換域里容易進行壓縮,變換后的樣值更獨立和有序。典型的變換有離散余弦變換DCT、離散傅里葉變換DFT、沃爾什—哈達瑪變換WHT和小波變換等。量化是將處于取值范圍X的信號映射到一個較小的取值范圍Y中,壓縮后的信號比原信號所需的比特數減少。(3)基于模型編碼

如果把以預測編碼和變換編碼為核心的基于波形的編碼稱為第一代編碼技術,則基于模型的編碼就是第二代編碼技術。

基于模型編碼的基本思想是:在發送端,利用圖像分析模塊對輸入圖像提取緊湊和必要的描述信息,得到一些數據量不大得模型參數;在接收端,利用圖像綜合模塊重建原圖像,是對圖像信息的合成過程。(4)分形編碼

分形編碼的目的是發覺自然物體(如大地、森林等)在結構上的自相似形,這種自相似形是圖像整體與局部相關性的表現。分形編碼正是利用了分形幾何中的自形似的原理來實現的。首先對圖像進行分塊,然后尋找各塊之間的相似形,這里相似形的描述主要是依靠仿射變換確定的。一旦找到了每塊的仿射變換,就保存這個仿射變換的系數。由于每塊的數據量遠大于仿射變換的系數,因而圖像得以大幅度的壓縮。

分形編碼以其獨特新穎的思想,成為目前數據壓縮領域的研究熱點之一。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論