武漢大學多媒體技術的應用_第1頁
武漢大學多媒體技術的應用_第2頁
武漢大學多媒體技術的應用_第3頁
武漢大學多媒體技術的應用_第4頁
武漢大學多媒體技術的應用_第5頁
已閱讀5頁,還剩54頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

理解多媒體、多媒體技術的概念明確多媒體中的主要元素及其特點了解多媒體的關鍵特性以及這些特性之間的關系了解多媒體的關鍵技術、主要應用領域和發展方向了解多媒體數據壓縮方法第8章多媒體技術概述多媒體的基本概念1多媒體的定義2多媒體技術及其特性3多媒體中的媒體元素及其特征1多媒體的定義“多媒體”一詞譯自英文“Multimedia”即“Multiple”和”Media”的合成其核心詞是媒體何謂多媒體呢?媒質:存儲信息的實體,如磁盤、光盤、磁帶、半導體存儲器等。媒介:傳遞信息的載體,如數字、文字、聲音、圖形和圖像等。媒體(medium)在計算機領域有兩種含義:即媒質和媒介。 (1)感覺媒體:能直接作用于人們的感覺器官,從而能使人產生直接感覺的媒體。如語音、音樂、各種圖像、動畫、文本等。 (2)表示媒體:為了傳送感覺媒體而人為研究出來的媒體。借助于此種媒體,便能更有效的存儲或傳送感覺媒體。如語言編碼、電報碼等。 通常概念的“媒體”,可分為以下五種類型: (3)顯示媒體:用于通信中使電信號和感覺媒體之間產生轉換用的媒體。如輸入、輸出設施,鍵盤鼠標器、顯示器、打印機等。 (5)存儲媒體:用于存放某種媒體的媒體如紙張、磁帶、磁盤、光盤等。 (4)傳輸媒體:用于傳輸某些媒體的媒體,如電話線、電纜光纖等。 多媒體計算機技術的定義: 計算機綜合處理多種媒體信息,文本圖形、圖像、音頻和視頻,使多種信息建立邏輯連接,集成為一個系統并具有交互性。2計算機技術及其特性多媒體計算機技術的三個主要特性信息載體的多樣性交互性集成性

信息載體的多樣性是相對于計算機而言的,即指信息媒體的多樣性。 多媒體就是要把計算機處理的信息多樣化或多維化,從而改變計算機信息處理的單一模式,使人們能交互的處理多種信息。信息載體的多樣性交互性 多媒體的交互性是指用戶可以與計算機的多種信息媒體進行交互操作從而為用戶提供了更加有效地控制和使用信息的手段。集成性

集成性是指以計算機為中心綜合處理多種信息媒體,它包括信息媒體的集成和處理這些媒體的設備的集成。

信息媒體的集成包括信息的多通道統一獲取、多媒體信息的統一組織和存儲、多媒體信息表現合成等方面。

多媒體設備的集成包括硬件和軟件兩個方面。 多媒體媒體元素是指多媒體應用中可顯示給用戶的媒體組成。1.1.3多媒體中的媒體元素及特征音頻動畫視頻文本圖形圖像文本 文本分為非格式化文本文件和格式化文本文件。 非格式化文本文件:只有文本信息沒有其他任何有關格式信息的文件,又稱為純文本文件。如“.TXT”文件。 格式化文本文件:帶有各種文本排版信息等格式信息的文本文件。如“.DOC”文件。圖形 圖形(Graphic)一般指用計算機繪制的畫面,如直線、圓、圓弧、矩形、任意曲線和圖表等。 圖形的格式是一組描述點、線、面等幾何圖形的大小、形狀及其位置、維數的指令集合。 在圖形文件中只記錄生成圖的算法和圖上的某些特征點,因此也稱矢量圖。圖像圖像(Image)是指由輸入設備捕捉的實際場景畫面,或以數字化形式存儲的任意畫面。 靜止的圖像是一個矩陣,陣列中的各項數字用來描述構成圖像的各個點(稱為像素點pixel)的強度與顏色等信息。這種圖像也稱為位圖(bit-mappedpicture)。 用于生成和編輯位圖圖像的軟件通常稱為“paint”程序。 圖像文件在計算機中的存儲格式有多種,如BMP、PCX、TIF、TGA、GIF、JPG等,一般數據量都較大。圖像處理時要考慮三個因素:分辨率圖像深度與顯示深度圖像文件大小分辨率屏幕分辨率:顯示器屏幕上的最大顯示 區域,即水平與垂直方向 的像素個數。圖像分辨率:數字化圖像的大小,即該 圖像的水平與垂直方向的 像素個數。像素分辨率:像素的寬和高之比一般為 1:1。圖像深度和顯示深度

圖像深度(也稱圖像灰度、顏色深度)表示數字位圖圖像中每個像素上用于表示顏色的二進制數字位數。

顯示深度:表示顯示器上每個點用于顯示顏色的2進制數字位數。 若顯示器的顯示深度小于數字圖像的深度,就會使數字圖像顏色的顯示失真。顏色深度顏色總數圖像名稱12單色圖像416索引16色圖像8256索引256色圖像1665536HI—Color圖像2416672216TrueColor圖像顏色深度與顯示的顏色數目圖像文件大小 用字節表示圖像文件大小時,一幅未經壓縮的數字圖像的數據量大小計算如下:圖像數據量大小=像素總數×圖像深度÷8例如:一幅640×480的256色圖像為 640×480×8/8=307200字節Comparison:寬度:271高度:300顏色:2大小:9.9KB寬度:271高度:300顏色:4大小:19.8KBComparison:寬度:271高度:300顏色:256大小:79.4KB寬度:271高度:300顏色:真彩色大小:238.2KB1.BMP格式 BMP是標準的WINDOWS和OS/2的圖形和圖像的基本位圖格式,有壓縮(RLE)和非壓縮之分。BMP支持黑白圖像、16色和256色的偽彩色圖像以及RGB真彩色圖像。2.PCX格式 是使用游程長編碼(RLE)方法進行壓縮的圖像文件格式文件。支持黑白圖像、16色和256色的偽彩色圖像、灰度圖像以及RGB真彩色圖像,圖像文件的基本格式3.GIF格式 GIF是壓縮圖像存儲格式,它使用LZW壓縮方法,壓縮比較高,文件長度較小。支持黑白圖像、16色和256色的彩色圖像。4.TIF格式 TIF格式是工業標準格式,支持所有圖像類型。文件分成壓縮和非壓縮兩大類。5.JPG和PIC格式 JPG和PIC都使用JPEG方法進行圖像數據壓縮。這兩種格式的最大特點是文件非常小。它是一種有損壓縮的靜態圖像文件存儲格式。支持灰度圖像、RGB真彩色圖像和CMYK真彩色圖像。6.PCD格式 PCD格式是Photo-CD的專用存儲格式,文件中含有從專業攝影照片到普通顯示用的多種分辨率的圖像,所以數據量都非常大。3視頻和動畫的文件格式

動畫文件的格式主要有兩種:FLIC格式和MMM格式。

視頻文件的使用一般與標準有關,主要有AVI、MOV、MPG、DAT、DIR等。音頻 數字音頻(Audio)可分為波形聲音語音和音樂。 波形聲音實際上已經包含了所有的聲音形式,它可以將任何聲音都進行采樣量化,相應的文件格式是WAV文件或VOC文件。

語音也是一種波形,所以和波形聲音的文件格式相同。

音樂是符號化了的聲音,樂譜可轉變為符號媒體形式。對應的文件格式是MID或CMF文件。 計算機音頻技術主要包括聲音的采集、數字化、壓縮/解壓縮以及聲音的播放。

數字化主要包括采樣和量化這兩個方面。

采樣頻率(samplingrate)是將模擬聲音波形轉換為數字時,每秒鐘所抽取聲波幅度樣本的次數,單位是Hz(赫茲)。

量化數據位數(也稱量化級)是每個采樣點能夠表示的數據范圍,經常采用的有8位、12位和16位。

例如,8位量化級表示每個采樣點可以表示256個不同量化值,而16位量化級則可以表示65536個不同的量化值 記錄聲音時,如果每次生成一個聲道數據,稱為單聲道;每次生成兩個聲波數據,稱為立體聲(雙聲道)。

數字音頻的存儲量: 可用以下公式估算聲音數字化后每秒所需的存儲量(未經壓縮的)存儲量=采樣頻率×量化位數÷8

例如,數字激光唱盤(CD-DA)的標準采樣頻率為44.1kHz,量化位數為16位,立體聲。一分鐘CD-DA音樂所需的存儲量為44.1K×16×2×60÷8=10584KB若使用雙聲道,存儲量再增加一倍聲音文件的基本格式1.WAV文件2.MP33.MIDI文件WAV文件 Windows所用的標準數字音頻稱為波形文件,文件的擴展名是“.WAV”,它記錄了對實際聲音進行采樣的數據。它可以重現各種聲音,但產生的文件很大。 人的講話聲使用8位量化級11.025KHz采樣率就能較好的還原。CD音質需要16位量化級、44.1KHz的采樣率。mp3文件MP3是MPEG(MovingPictureExpertGroup運動圖像專家組)第三層壓縮文件格式,提供8kb/s到128kb/s的數據率和高達96:1的壓縮比,有較好的音質。主要應用于因特網上的聲音傳輸。常見的MP3音樂就使用了該壓縮標準,是MP3播放器的主要格式。MIDI MIDI文件的擴展名為“.MID”,它與波形文件不同,記錄的不是聲音本身,而是將每個音符記錄為一個數字,因此比較節省空間,可以滿足長時間音樂的需要。 MIDI的主要限制是缺乏重現真實自然的能力。采用波表法進行音樂合成的聲音卡可以使MIDI音樂的質量大大提高。 動畫是活動的畫面,實質是一幅幅靜態圖像的連續播放。動畫的連續播放既指時間上的連續,也指圖像內容上的連續。 計算機設計動畫有兩種:一種是幀動畫,一種是造型動畫。動畫

幀動畫是由一幅幅位圖組成的連續的畫面,就如電影膠片或視頻畫面一樣要分別設計每屏幕顯示的畫面。

造型動畫是對每一個運動的物體分別進行設計,賦予每個動元一些特征,然后用這些動元構成完整的幀畫面。動元的表演和行為是由制作表組成的腳本來控制。 存儲動畫的文件格式有FLC、MMM等視頻 視頻是由一幅幅單獨的畫面序列(幀frame)組成,這些畫面以一定的速率(fps)連續地投射在屏幕上,使觀察者具有圖像連續運動的感覺。 視頻文件的存儲格式有AVI、MPGMOV等。視頻和動畫的文件格式

動畫文件的格式主要有兩種:FLIC格式和MMM格式。

視頻文件的使用一般與標準有關,主要有AVI、MOV、MPG、DAT、DIR等。1.FLIC動畫

早期版本的FLIC文件只支持320×200×256色模式,文件的擴展名為“.FIY”。較新版本支持的分辨率和顏色數都有所提高,文件的擴展名也改為“.FLC”。它使用了無損壓縮方法,畫面效果十分清晰,但本身不能存儲同步聲音。2.MMM動畫 MMM格式是微軟多媒體動畫的文件格式。3.AVI文件 AVI文件將視頻和音頻信號混合交錯地存儲在一起。其文件擴展名為“.AVI”,采用了Intel公司的Indeo視頻有損壓縮技術,較好地解決了音頻信息與視頻信息同步的問題。4.MOV文件 MOV是Macintosh計算機用的影視文件格式。也采用了Intel公司的Indeo視頻有損壓縮技術,以及視頻與音頻信息混排技術。5.MPG文件 是PC機上全屏幕活動視頻的標準文件格式,它是使用MPEG方法進行壓縮的全運動視頻圖像。6.DAT文件 DAT是VideoCD或KaraokeCD數據文件的擴展名,也是基于MPEG壓縮方法的一種文件格式。7.DIR格式 DIR是MarcoMedia公司使用的Director多媒體著作工具產生的電影文件格式。多媒體技術的應用 就目前而言,多媒體技術已在商業教育培訓、電視會議、聲像演示等方面得到了充分應用。在教育與培訓方面的應用在通信方面的應用在其他方面的應用在教育與培訓方面的應用 多媒體技術使教材不僅有文字、靜態圖像,還具有動態圖像和語音等。使教育的表現形式多樣化,可以進行交互式遠程教學。 利用多媒體計算機的文本、圖形、視頻、音頻和其交互式的特點,可以編制出計算機輔助教學CAI(ComputerAssistedInstruction)軟件,即課件。在通信方面的應用多媒體技術在通信方面的應用主要有: 可視電話 視頻會議 信息點播(InformationDemand) 計算機協同工作CSCW (ComputerSupported CooperativeWork)

信息點播有桌上多媒體通信系統和交互電視ITV。

計算機協同工作CSCW是指在計算機支持的環境中,一個群體協同工作以完成一項共同的任務。 計算機的交互性,通信的分布性和多媒體的現實性相結合,將構成繼電報電話、傳真之后的第四代通信手段。在其他方面的應用 多媒體技術給出版業帶來了巨大的影響,其中近年來出現的電子圖書和電子報刊就是應用多媒體技術的產物。 利用多媒體技術可為各類咨詢提供服務,如旅游、郵電、交通、商業、金融、賓館等。 多媒體技術還將改變未來的家庭生活,多媒體技術在家庭中的應用將使人們在家中上班成為現實。多媒體技術的發展方向目前,多媒體主要從以下幾個方向發展:

多媒體通信網絡環境的研究和建立將使多媒體從單機單點向分布、協同多媒體環境發展,在世界范圍內建立一個可全球自由交互的通信網。 對該網絡及其設備的研究和網上分布應用與信息服務研究將是熱點。1 利用圖像理解、語音識別、全文檢索等技術,研究多媒體基于內容的處理、開發能進行基于內容的處理系統是多媒體信息管理的重要方向。

多媒體標準仍是研究的重點:各類標準的研究將有利于產品規范化,應用更方便。它是實現多媒體信息交換和大規模產業化的關鍵所在。23 多媒體技術與相鄰技術相結合,提供了完善的人機交互環境。多媒體仿真智能多媒體等新技術層出不窮,擴大了原有技術領域的內涵,并創造新的概念。 多媒體技術與外圍技術構造的虛擬現實研究仍在繼續進展。多媒體虛擬現實與可視化技術需要相互補充,并與語音、圖像識別、智能接口等技術相結合,建立高層次虛擬現實系統。45虛擬現實技術(VR)

虛擬現實的定義可歸納為:利用計算機技術生成的一個逼真的視覺、聽覺觸覺及嗅覺等的感覺世界,用戶可以用人的自然技能對這個生成的虛擬實體進行交互考察。 虛擬現實技術是在眾多相關技術上發展起來的一個高度集成的技術,是計算機軟硬件技術、傳感技術、機器人技術、人工智能及心理學等飛速發展的結晶。多媒體數據壓縮方法 壓縮處理一般是由兩個過程組成:一是編碼過程,即將原始數據經過編碼進行壓縮,以便存儲與傳輸;二是解碼過程,此過程對編碼數據進行解碼,還原為可以使用的數據。 數據壓縮可分為兩種類型:一種叫做無損壓縮,另一種叫做有損壓縮。無損壓縮混合壓縮有損壓縮無損壓縮 無損壓縮常用在原始數據的存檔,如文本數據、程序以及珍貴的圖片和圖像等。 其原理是統計壓縮數據中的冗余(重復的數據)部分。常用的有:RLE(runlengthencoding)行程編碼Huffman編碼算術編碼LZW(lempel-ziv-welch)編碼有損壓縮 圖像或聲音的頻帶寬、信息豐富,人類視覺和聽覺器官對頻帶中某些頻率成分不大敏感,有損壓縮以犧牲這部分信息為代價,換取了較高的壓縮比。 常用的有損壓縮方法有:PCM(脈沖編碼調制)、預測編碼、變換編碼、插值與外推等。 新一代的數據壓縮方法有:矢量量化和子帶編碼、基于模型的壓縮、分形壓縮及小波變換等。混合壓縮 混合壓縮是利用了各種單一壓縮的長處,以求在壓縮比、壓縮效率及保真度之間取得最佳折衷。 該方法在許多情況下被應用,如JPEG和MPEG標準就采用了混合編碼的壓縮方法。(1)靜止圖像壓縮標準 國際標準化組織(ISO)和國際電報電話咨詢委員會(CCITT)聯合成立的“聯合照片專家組“JPEG

(jointphotographicexpertsgroup)于1991年提出的“多灰度靜止圖像的數字壓縮編碼“(簡稱JPEG標準)。 這是一個適應于彩色和單色多灰度或連續色調靜止數字圖像的壓縮標準。視頻編碼和壓縮的國際標準

JPEG標準支持很高的圖像分辨率和量化精度。它包含兩部分: 第一部分是無損壓縮,基于差分脈沖編碼調制(DPCM)的預測編碼。 第二部分是有損壓縮,基于離散余弦變換(DCT)和Huffman編碼,通常壓縮20-40倍。(2)運動圖像壓縮標準 視頻圖像壓縮的一個重要標準是MPEG(MovingPictureExpertsGroup)于1990年形成的一個標準草案(簡稱MPEG標準)。 它兼顧了JPEG標準和CCITT專家組的H.261標準。

MPEG標準分成MPEG視頻、MPEG音頻和MPEG系統三大部分。 MPEG算法除了對單幅圖像進行編碼外(幀內編碼),還利用圖像序列的相關特性去除幀間圖像冗余,大大提高了視頻圖像的壓縮比。 壓縮比可達到60-100倍。9、春去春又回,新桃換舊符。在那桃花盛開的地方,在這醉人芬芳的季節,愿你生活像春天一樣陽光,心情像桃花一樣美麗,日子像桃子一樣甜蜜。4

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論