多媒體技術第二章 數字聲音_第1頁
多媒體技術第二章 數字聲音_第2頁
多媒體技術第二章 數字聲音_第3頁
多媒體技術第二章 數字聲音_第4頁
多媒體技術第二章 數字聲音_第5頁
已閱讀5頁,還剩58頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第二章數字聲音2.1數字聲音基礎2.1.1音頻信號的特征聲音信號由不同的振幅與頻率合成而成,稱為復音。復音包括基頻和諧音,兩者決定聲音的音質和音色。規則音頻分為語音、音樂和音效。聲音三要素:音調、音強和音色。基頻與音調諧波與音色幅度與音強頻帶與音寬2.1.2聲音信號數字化模擬信號模擬信號是指幅度隨時間連續變化的信號。

數字信號數子信號是指時間和幅度都是離散的信號,即離散信號,通常是僅含高低電平的“方波”信號。模擬信號的數字化PCM(pulsecodemodulation脈沖編碼調制)采樣:將時間連續信號變為時間不連續信號。量化:將幅度變為某一最小量的整數倍,即將幅值離散化,量化過程必定產生量化誤差。編碼:按一定規律產生二進制位流輸出信號。數字化過程兩個主要參數:采樣頻率:采樣頻率遵從采樣定理

fs

>=2f

或者Ts=<T/2量化精度:取決于表示一個采樣樣本值的二進制位數,位數越多,精度越高。2.1.2聲音信號數字化聲音20-20kHz話音300-3000Hz

采樣頻率越高,量化精度越高,聲道越多,則聲音質量越好,而數字化后的數據量也越大。每秒聲音所占數據量為采樣頻率*量化位數*聲道數2.1.3音頻的主要技術參數

聲音質量與數據率質量采樣頻率(kHz)量化精度(bit)單聲道/立體聲數據率(kB/s)頻率范圍(Hz)電話88單聲道8200~3400AM11.0258單聲道11.050~7000FM22.0516立體聲88.220~15000CD44.1016立體聲176.410~20000DAT4816立體聲192.010~200002.1.3音頻的主要技術參數44.100次/秒的采樣頻率值根據以下的原則確定:

人耳能夠聽見的最高聲音頻率為20kHz,為了避免高于20kHz的高頻信號干擾采樣,在進行采樣之前,需要對輸入的聲音信號進行濾波。考慮到濾波器在20kHz處大約有10%的衰減,因此再將其提高10%成為22kHz。這個值再乘以2就得到44kHz的采樣頻率。但是,為了能夠與電視信號同步,PAL電視的場掃描為50Hz,NTSC電視的場掃描為60Hz,所以取50和60的整數倍,選用了44,100Hz(或44.1kHz)作為激光唱盤聲音的采樣標準。2.1.3音頻的主要技術參數采樣率為1,000Hz、量化等級為10的采樣量化過程2.1.3音頻的主要技術參數經過D/A轉換器得到的信號波形有較大的失真2.1.3音頻的主要技術參數采樣率為2000Hz、量化等級為40的采樣量化過程2.1.3音頻的主要技術參數采樣率為4000Hz、量化等級為40的采樣量化過程2.1.3音頻的主要技術參數采樣頻率、量化位數設置2.1.3音頻的主要技術參數PCM編碼PCM方法可以按量化方式的不同,分為均勻量化PCM、非均勻量化PCM和自適應量化PCM等幾種。如果采用相等的量化間隔對采樣得到的信號做量化,那么這種量化稱為均勻量化。均勻量化就是采用相同的“等分尺”來度量采樣得到的幅度,也稱為線性量化。2.1.4數字化聲音的壓縮均勻量化2.1.4數字化聲音的壓縮改進PCM編碼技術的一個方法是采用非均勻量化,即讓量化級高度隨信號幅度而變化。信號幅度小,則縮小量化級高度,信號幅度大時,則增大量化級高度。這樣就可以在滿足精度要求的情況下用較少的位數實現編碼。在聲音數據還原時,采用相同的規則。在非均勻量化中,采樣輸入信號幅度和量化輸出數據之間定義了兩種對應關系,一種稱為μ律(μ-Law)壓(縮)擴(展)算法,另一種稱為A律(A-Law)壓(縮)擴(展)算法。這兩種算法主要用于數字電話通信中。2.1.4數字化聲音的壓縮μ律的壓縮特性2.1.4數字化聲音的壓縮音頻壓縮編碼的標準國際電信聯盟(ITU,原CCITT)先后提出了一系列有關語音壓縮編碼的建議。1972年制定了G.711,采用的是μ律或A律的PCM編碼技術.數據速率為64kb/s。1984年.公布G.721標準.它來用的是ADPCM編碼技術.數據速率為32kb/s。以上兩個標準均適用于300Hz--3,400Hz窄帶語音信號.也可用于公用電話網。針對寬帶語音信號(50Hz--7kHz),ITU制定了G.722編碼標準,它的數據速率為64kb/s,用此標準編碼,可在ISDN(綜合業務數據網)的B通道上傳輸音頻數據。2.1.4數字化聲音的壓縮ISO(國際標準化組織)也制定了一系列的相應的標準其運動圖像專業組(MPEG)在制定運動圖像編碼標準的同時,制定了高保真立體聲音頻壓縮標準“MPEG音頻”。雖然MPEG聲音標準是MPEG標準的一部分,但它同時也完全可以獨立應用。MPEG聲音壓縮算法是第一個高保真聲音數據壓縮的國際標準。MPEG音頻根據不同的算法分為3個層次。層次1與層次2具有大致相同的算法。MPEG音頻的層次3進一步引入了輔助子帶、非均勻量化和熵編碼等技術,可以進一步提高壓縮率。立體聲信號的編碼也可以在MPEG音頻中作為附加功能實現。MPEG音頻壓縮技術的傳輸速率為每聲道32kb/s--448kb/s。2.1.4數字化聲音的壓縮2.1.5數字音頻的文件格式文件的擴展名說明wav(Waveform)Windows采用的波形聲音文件存儲格式voc(CreativeVoice)聲霸卡存儲的聲音文件存儲格式mid(MIDI)Windows的MIDI文件存儲格式mp2MPEGAudioLayer1,2mp3MPEGAudioLayer3ra(RealAudio)RealNetworks公司的流式聲音文件格式wmaWindowsMediaAudioauSun和NeXT公司的聲音文件存儲格式aiffApple計算機上的聲音文件存儲格式sndSGI圖形工作站上的聲音存儲文件seq,sngMIDI文件存儲格式2.1.5數字音頻的文件格式MP3是Internet上流行的音樂格式MP3

為MPEGAudioLayer3的縮寫,是由ISO/MPEG語音編碼標(AudioCodingStandard)所制定的一種聲音壓縮技術,壓縮比是CD的1:10到1:12,采樣率為44kHz、比特率為112kbit/s。MP3音樂是以數字方式儲存的音樂,如果要播放,就必須有相應的數字解碼播放系統,一般通過專門的軟件進行MP3數字音樂的解碼,再還原成波形聲音信號播放輸出,這種軟件就稱為MP3播放器,如Winamp等。

MP3格式文件在播放時需要專門的工具軟件,Realplayer是一個集強大的功能和小巧玲現于一體的MP3播放器。它能夠對MP3文件的播放做全面的控制,支持MMX(多媒體指令集)技術。它內置的圖形化均衡器可以方便地調節音色,使之更符合個人喜好。此外,應用較為廣泛的MP3播放軟件還有Winplay3和MusicMatch等2.1.5數字音頻的文件格式2.1.5數字音頻的文件格式WAV(WaveAudioFileFormat)

是Windows用來儲存數碼聲音的格式。它使用三個參數來表示聲音:采樣位數、采樣頻率和聲道數。聲道有單聲道和立體聲之分。MIDI

是MusicalInstrumentDataInterface的簡稱,即樂器數字化接口。它采用數字方式對樂器所奏出來的聲音進行記錄(每個音符記錄為一個數字),然后,播放時再對這些記錄通過FM或波表合成:FM合成是通過多個頻率的聲音混合來模擬樂器的聲音;波表合成是將樂器的聲音樣本存儲在聲卡波形表中,播放時從波形表中取出產生聲音。RA、RAM和RM

都是Real公司成熟的網絡音頻格式,采用了“音頻流”技術,所以非常適合網絡廣播。在制作時可以加入版權、演唱者、制作者、Mail和歌曲的Title等信息。RA可以稱為互聯網上多媒體傳播的霸主,適合于網絡上進行實時播放,是目前在線收聽網絡音樂最好的一種格式。WMA

是WindowsMediaAudio的縮寫,相當于只包含音頻的ASF文件。WMA文件在80kbps、44kHz的模式下壓縮比可達1∶18,基本上和VQF(是一種比較先進的技術,通常認為96kbpsVQF與128kbpsMP3質量相同)相同。而且壓縮速度比MP3提高一倍。Ogg

全稱是OGGVobis是一種新的音頻壓縮格式,類似于MP3等現有的音樂格式。但有一點不同的是,它是完全免費、開放和沒有專利限制的。OGGVobis有一個很出眾的特點,就是支持多聲道.

波形聲音文件

波形聲音文件,是一種為交換多媒體資源而開發的資源交換文件格式。它支持各種采樣頻率和量化精度的聲音數據,并支持聲音數據的壓縮。2.1.5數字音頻的文件格式電腦音樂的出現使人們的音樂思維方式產生了革命性的突破,為音樂的表現表達提供了全新的工具和工作方式。電子音樂與傳統音樂的本質區別在于,它打破了千萬年來傳統音樂用“聲樂語言”和“器樂語言”表達樂思的基本格局,可以創作出聞所未聞的聲音,即所謂的“天籟之音”,并且這種擴展是無窮無盡的。在音樂創作領域,由于MIDI、電子樂器和多媒體計算機的結合,給人們提供了一種快捷、獨特的制作方式,它更加強調音色的非常規化、電子化、空間感和對比等,并且逐漸形成一種嶄新的音樂風格。2.2音樂合成和MIDI技術2.2.1什么是MIDIMIDI(MusicalInstrumentDigitalInterface電子樂器數字接口)是用于樂器合成器、樂器和計算機之間交換音樂信息的一種標準協議。MIDI是將電子樂器鍵盤的演奏信息(包括鍵名、力度、時間長短等)記錄下來,這些信息成為MIDI消息。對應一段音樂的MIDI文件不記錄任何聲音信息,而只是包含一系列產生音樂的MIDI消息。播放時只需從中讀出MIDI消息,通過音樂合成器芯片解釋這些指令并產生音樂。MIDI是由軟件部分和硬件部分組成的系統規范,這個規范定義了MIDI設備間數字傳送時電纜硬件接口和協議。規范定制的目的是使各生產樂器廠家之間通過統一的MIDI交換信息及控制信號,從而完成音樂的合成。這樣,任何電子樂器,只要有處理MIDI信息的處理器和適當的硬件接口都能變成MIDI裝置。2.2.1什么是MIDI合成器是利用數字信號處理器DSP或其他芯片來產生音樂或聲音的電子裝置。利用合成器產生MIDI樂音的主要方法是FM合成法和波表合成法。2.2.2MIDI合成方式FM合成法FM合成法是20世紀80年代初由美國斯坦福大學的JohnChowning發明的,稱為“數字式頻率調制合成法”,簡稱FM合成法。FM合成法生成樂音的基本原理是,用數字信號來表示不同樂音的波形,然后把它們組合起來,再通過數模轉換器(DAC)生成樂音播放。各種不同樂音的產生是通過組合各種波形參數、采用各種不同的算法實現的。FM合成器的算法包括確定用什么樣的波形作為數字載波波形,用什么樣的波形作為調制波形,用什么樣的波形參數去組合來產生所希望的樂音。例如,改變數字載波頻率;可以改變樂音的音調,改變它的幅度,可以改變它的音量。選擇的算法不同,載波器和調制器的相互作用不同,生成的音色也不同。2.2.2MIDI合成方式波表合成法使用FM合成法來產生各種逼真的樂音是相當困難的,有些樂音幾乎不能產生。為了能真實地再現樂音,目前的聲卡一般采用樂音樣本合成法,即波表合成法。這種方法就是把真實樂器發出的聲音以數字的形式記錄下來,播放時改變播放速度,從而改變音調周期,生成各種音節的音符。樂音樣本的采集相對比較直觀,音樂家在真實樂器上演奏不同的音符,選擇44.1kHz的采樣頻率、16bit的量化位數,這相當于CD-DA的質量,把不同音符的真實聲音記錄下來,這就完成了樂音樣本的采集。2.2.2MIDI合成方式軟、硬波表合成硬波表的音色庫是存放在聲卡的ROM或RAM中軟波表的音色庫以文件的形式存放在硬盤里,需要是再通過CPU進行調用。“可下載樣本”的合成技術(DLS)2.2.2MIDI合成方式2.2.3GM--標準MIDI樂器排序表以前各生產商在設計MIDI發聲工具(如聲卡、音源器、合成器等)時并沒有一個統一的樂器排序標準,基于這種情況,各生產商終于達成了共識,共同編制了一份“標準MIDI樂器排序表”(GeneralMIDIInstrumentMap,GM)。GM共收錄了十六類不同的樂器,每類各選八種音色,共有128種音色。在第十號MIDI通道(MIDIChannel10)收錄了各種鼓和其他打擊樂器。表中最后一類(第十六類)并非樂器聲,而是一些聲效(SoundEffect),如電話鈴聲、小鳥叫聲、海浪聲、直升機聲、槍聲等。現在大部分的MIDI發聲工具均以這“標準MIDI樂器排序表”作為樂器排序的標準。2.2.4MIDI系統的組成MIDI系統實際就是一個作曲、配器、電子模擬的演奏系統。基于計算機的MIDI音樂系統有多種構筑方案,但基本上都由以下幾部分組成:多媒體計算機、輸入設備(MIDI鍵盤)、音序器、發生設備、合成器、聲音處理設備和還聲設備等。這些設備可以是獨立的,也可以是集成的。如果在計算機上安裝了MIDI軟件,可將音樂的創作、樂譜的打印、節目編排、音樂的調整、音響的幅度、節奏的速度、各聲部之間的協調、混響都可由MIDI軟件控制完成。基于計算機的MIDI音樂制作系統2.2.4MIDI系統的組成輸入設備具有USB接口MIDI鍵盤2.2.4MIDI系統的組成音序器是用來記錄、編輯和播放MIDI文件的設備。音序器分硬件和軟件兩種。最早的是硬件音序器,也稱為編曲機。它可以是一個獨立的設備,也可以內置于合成器中。這類音序器的編輯和修改必須在它的面板上進行,使用是很不方便的。常見的型號有YamahaQY700等。2.2.4MIDI系統的組成YamahaQY700音序器2.2.4MIDI系統的組成發聲設備音源只是一個資源庫音源分硬件和軟件兩種。硬件音源是現在專業MIDI制作不可缺少的設備,因為它們可以提供比任何一塊聲卡上的波表都要好很多的音色,這些獨立音源基本上是專業人士使用的,常見的型號有RolandJV1080和YamahaMU100R等。多媒體聲卡上都有一個128種音色的GM音色庫。2.2.4MIDI系統的組成聲音處理設備通過調音臺、效果器、均衡器等聲音處理設備對音頻信號進行均衡、限幅、壓縮、延時、混響等特技處理,也可以用軟件進行處理。2.2.4MIDI系統的組成2.2.5MIDI的工作過程

MIDI電子樂器通過MIDI接口與計算機相連,MIDI靠這個接口傳遞消息(Message)來進行彼此通信。這樣,計算機可通過音序器軟件來采集MIDI電子樂器發出的一系列消息或指令。這一系列消息可記錄到以(.MID)為擴展名的MIDI文件中。在計算機上音序器可對MIDI文件進行編輯和修改。最后,將MIDI文件送往音樂合成器,由合成器將MIDI文件進行解釋并產生波形,然后通過聲音發生器送往揚聲器播放出來。2.2.5MIDI的工作過程2.2.6MIDI的特點及與WAV文件的比較MIDI的特點生成的文件比較小,因為MIDI文件存儲的是命令,而不是聲音波形;容易編輯,因為編輯命令比編輯聲音波形容易的多;使用MIDI文件,其聲卡上必需含有硬件音序器或配置有軟件音序器;可以作背景音樂,因為MIDI音樂可以和其它的媒體,如數字電視、圖形、動畫、語音等一起播放,這樣可以加強演示效果。WAV與MIDI文件的比較MIDI消息實際上就是樂譜的數字表示,MIDI數據不是聲音而是指令,因此它的數據量要比波形聲音少得多;對MIDI的編輯靈活,可以自由地改變曲調、音色等屬性,波形聲音很難做到這點;波形聲音與設備無關,MIDI數據與設備有關。2.2.6MIDI的特點及與WAV文件的比較MIDI數據一般用于下列情況由于無法獲得足夠的RAM存儲器、硬盤存儲空間、CPU處理能力或帶寬而不能使用數字音頻;擁有高質量的MIDI聲源;您對將要發布的應用軟件具有完全的控制能力,因此您的用戶將會具有高性能的MIDI播放硬件;無需處理口語對話。2.2.6MIDI的特點及與WAV文件的比較數字音頻一般用于下列情況您無法控制回放硬件;您擁有處理數字文件的計算機資源和帶寬;您需要處理口語對話。2.2.6MIDI的特點及與WAV文件的比較2.3聲卡2.3.1聲卡介紹聲卡的功能播放數字音樂錄音實時的效果器音頻解碼音樂合成2.3.1聲卡介紹聲卡的分類按數據采樣位數分類:8位、16位、24位按總線方式分類:ISA、PCI、USB按與計算機的連接方式分類:獨立聲卡、集成聲卡按用途分類:普通聲卡、專業聲卡聲卡的性能指標采樣和量化能力芯片類型輸出聲道數合成技術兼容性2.3.1聲卡介紹2.3.1聲卡介紹2.3.2聲卡的工作原理2.3.2聲卡的工作原理主芯片主芯片承擔著三維音效處理的運算和加速、MP3解碼、MIDI的合成及硬件等級的聲音處理。CODEC芯片I/O控制芯片負責和協調聲卡輸入/輸出控制音樂合成器

MIDI合成器有兩種:頻率調制合成器、波形表合成器

I/O設備輸出線路輸入(LineIn):可與盒式錄音機、唱機等相連進行錄音。話筒輸入(MicIn):可與話筒相連,進行語音錄入。線路輸出(LineOut):可跳過音頻卡的內置放大器,而連接一個有源揚聲器或外接放大器進行音頻的輸出。揚聲器輸出(Speakerout):從音頻卡內置功率放大器連接揚聲器進行輸出,該插口的輸出功率一般為2一4W。游戲棒/MIDI接口(Joystick/MIDI):可連接游戲捧或MIDI設備如MIDI鍵盤。2.3.2聲卡的工作原理音頻卡上的插口和接口2.3.2聲卡的工作原理2.4音頻處理軟件音頻編輯軟件CoolEditPro(AdobeAudition)

CoolEditPro2.0是SyntrilliumSoftware公司出品的,由CoolEditPro1.2版本升級而來,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論