第3章數字音頻處理技術_第1頁
第3章數字音頻處理技術_第2頁
第3章數字音頻處理技術_第3頁
第3章數字音頻處理技術_第4頁
第3章數字音頻處理技術_第5頁
已閱讀5頁,還剩50頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第第 3 章章數字音頻處理技術數字音頻處理技術 聲音的概述聲音的概述 數字化音頻數字化音頻 聲卡與音箱聲卡與音箱 MIDI技術技術 數字音頻的采集、編輯和轉換數字音頻的采集、編輯和轉換本章要點:本章要點: 聲音(聲音(Sound)是通過一定介質(如空氣、水等)傳播的連續波,在)是通過一定介質(如空氣、水等)傳播的連續波,在物理學中稱為聲波。聲音是振動的波,是隨時間連續變化的物理量。物理學中稱為聲波。聲音是振動的波,是隨時間連續變化的物理量。 聲波的振幅通常是指音量,它是聲波波形的高低幅度,表示聲波的振幅通常是指音量,它是聲波波形的高低幅度,表示聲音信號的強弱程度。聲音信號的強弱程度。 (1)

2、聲音信號的周期是指兩個相鄰聲波之間的時間長度,即重復聲音信號的周期是指兩個相鄰聲波之間的時間長度,即重復出現的時間間隔,以秒(出現的時間間隔,以秒(s)為單位。)為單位。 (2) 聲音信號的頻率是指每秒鐘信號變化的次數,即為周期的倒聲音信號的頻率是指每秒鐘信號變化的次數,即為周期的倒數,以赫茲(數,以赫茲(Hz)為單位。)為單位。 (3) 聲音依靠介質(空氣、液體、固體)的振動進行傳播。聲源是一聲音依靠介質(空氣、液體、固體)的振動進行傳播。聲源是一個振蕩源,它使周圍的介質產生振動,并以波的形式進行傳播。人個振蕩源,它使周圍的介質產生振動,并以波的形式進行傳播。人耳感覺到這種傳播過來的振動,再

3、反映到大腦,就聽到了聲音。聲耳感覺到這種傳播過來的振動,再反映到大腦,就聽到了聲音。聲音在不同的介質中傳播,其傳播的速度和衰減的速率是不一樣的,音在不同的介質中傳播,其傳播的速度和衰減的速率是不一樣的,這兩個因素導致了聲音在不同的介質中傳播的距離不同。這兩個因素導致了聲音在不同的介質中傳播的距離不同。 不同的聲音有不同的頻率范圍。聲音按頻率可分為不同的聲音有不同的頻率范圍。聲音按頻率可分為3種:次聲波、種:次聲波、可聽聲波和超聲波。人耳只能聽到頻率在可聽聲波和超聲波。人耳只能聽到頻率在20Hz20kHz之間的聲音,之間的聲音,聽不到低于聽不到低于20Hz和高于和高于20kHz的聲音。低于的聲音

4、。低于20Hz的為次聲波,高于的為次聲波,高于20kHz的為超聲波。人的發聲器官發出的聲音頻率是的為超聲波。人的發聲器官發出的聲音頻率是803400Hz,但,但人說話的聲音信號頻率通常為人說話的聲音信號頻率通常為300Hz3kHz,把在這種頻率范圍內的,把在這種頻率范圍內的信號稱為語音信號。信號稱為語音信號。 次聲波人耳可聽域超聲波20000Hz 聲音以振動的形式從聲源向四周傳播。從聲源直接到達人類聲音以振動的形式從聲源向四周傳播。從聲源直接到達人類聽覺器官的聲音是聽覺器官的聲音是“直達聲直達聲”。直達聲的方向辨別非常容易。但。直達聲的方向辨別非常容易。但是,在現實生活中,森林、海洋、建筑、地

5、貌和景物等存在于我是,在現實生活中,森林、海洋、建筑、地貌和景物等存在于我們周圍,聲音從聲源發出后,經過多次反射才能被人們聽到,這們周圍,聲音從聲源發出后,經過多次反射才能被人們聽到,這就是就是“反射聲反射聲”。 (1) 音調即聲音的高低,與頻率有關。頻率越高,音調越高,反之亦音調即聲音的高低,與頻率有關。頻率越高,音調越高,反之亦然。在使用音頻處理軟件對聲音的頻率進行調整時,其音調會隨之變然。在使用音頻處理軟件對聲音的頻率進行調整時,其音調會隨之變化。不同的聲源有它自己特定的音調,如果改變了聲源的音調,那么化。不同的聲源有它自己特定的音調,如果改變了聲源的音調,那么聲音會發生質的轉變,使人們

6、無法辨別聲源本來的面目。聲音會發生質的轉變,使人們無法辨別聲源本來的面目。 (2) 音強即聲音的響亮程度(或音量),與振幅相關,取決于聲波信音強即聲音的響亮程度(或音量),與振幅相關,取決于聲波信號的強弱程度。音強與聲波振幅成正比,振幅越大,強度越大,反之號的強弱程度。音強與聲波振幅成正比,振幅越大,強度越大,反之亦然。唱盤、亦然。唱盤、CD盤以及其他形式的聲音載體中的音強是一定的,通盤以及其他形式的聲音載體中的音強是一定的,通過播放設備的音量控制,可以改變聆聽時的強度。如果想改變原始聲過播放設備的音量控制,可以改變聆聽時的強度。如果想改變原始聲音的音強,可以在聲音數字化以后,使用音頻處理軟件

7、提高音強。音的音強,可以在聲音數字化以后,使用音頻處理軟件提高音強。 (3) 音色指聲音的感覺特性,與波形相關,影響聲音感覺特色音色指聲音的感覺特性,與波形相關,影響聲音感覺特色的因素是復音。所謂的因素是復音。所謂“復音復音”是指具有不同頻率和不同振幅的是指具有不同頻率和不同振幅的混合聲音,自然聲中大部分是復音。在復音中,最低頻率是混合聲音,自然聲中大部分是復音。在復音中,最低頻率是“基音基音”,它是聲音的基調;其他頻率的聲音稱為,它是聲音的基調;其他頻率的聲音稱為“諧音(泛諧音(泛音)音)”。 從模擬信號過渡到數字信號從模擬信號過渡到數字信號 回顧歷史,大多數電信號的處理一直是用模擬元部件回

8、顧歷史,大多數電信號的處理一直是用模擬元部件(如晶體管、變壓如晶體管、變壓器、電阻、電容等器、電阻、電容等)對模擬信號進行處理。但是,開發一個具有相當精對模擬信號進行處理。但是,開發一個具有相當精度、且幾乎不受環境變化影響的模擬信號處理元部件是相當困難的,度、且幾乎不受環境變化影響的模擬信號處理元部件是相當困難的,而且成本也很高。而且成本也很高。如果把模擬信號轉變成數字信號,用數字來表示模擬量,對數字信號如果把模擬信號轉變成數字信號,用數字來表示模擬量,對數字信號做計算,那么難點就發生了轉移。把開發模擬運算部件的問題轉變成做計算,那么難點就發生了轉移。把開發模擬運算部件的問題轉變成開發數字運算

9、部件的問題,這就出現了數字信號處理器開發數字運算部件的問題,這就出現了數字信號處理器(digital signal processor,DSP)。DSP與通用微處理器相比,除了它們的結構不同外,與通用微處理器相比,除了它們的結構不同外,其基本差別是,其基本差別是,DSP有能力響應和處理采樣模擬信號得到的數據流,有能力響應和處理采樣模擬信號得到的數據流,如做乘法和累加求和運算。如做乘法和累加求和運算。 從模擬信號過渡到數字信號從模擬信號過渡到數字信號 在數字域而不在模擬域中做信號處理的主要優點是:首先,數字在數字域而不在模擬域中做信號處理的主要優點是:首先,數字信號計算是一種精確的運算方法,它不

10、受時間和環境變化的影響;信號計算是一種精確的運算方法,它不受時間和環境變化的影響;其次,表示部件的數學運算不是物理上實現的功能部件,而是僅其次,表示部件的數學運算不是物理上實現的功能部件,而是僅用數學運算去模擬,其中的數學運算也相對容易實現;此外,可用數學運算去模擬,其中的數學運算也相對容易實現;此外,可以對數字運算不見進行編程,如欲改變算法或改變某些功能,還以對數字運算不見進行編程,如欲改變算法或改變某些功能,還可對數字部件進行再編程。可對數字部件進行再編程。 話音信號是典型的連續信號,不僅在時間上是連續的,而且在幅度上也是話音信號是典型的連續信號,不僅在時間上是連續的,而且在幅度上也是連續

11、的。在時間上連續的。在時間上“連續連續”是指在一個指定的時間范圍里聲音信號的幅值是指在一個指定的時間范圍里聲音信號的幅值有無窮多個,在幅度上有無窮多個,在幅度上“連續連續”是指幅度的數值有無窮多個。我們把在時是指幅度的數值有無窮多個。我們把在時間和幅度上都是連續的信號稱為模擬信號。間和幅度上都是連續的信號稱為模擬信號。 在某些特定的時刻對這種模擬信號進行測量叫做采樣在某些特定的時刻對這種模擬信號進行測量叫做采樣(sampling),由這,由這些特定時刻采樣得到的信號稱為離散時間信號。采樣得到的幅值是無窮些特定時刻采樣得到的信號稱為離散時間信號。采樣得到的幅值是無窮多個實數值中的一個,因此幅度還

12、是連續的。如果把信號幅度取值的數多個實數值中的一個,因此幅度還是連續的。如果把信號幅度取值的數目加以限定,這種由有限個數值組成的信號就稱為離散幅度信號。例如,目加以限定,這種由有限個數值組成的信號就稱為離散幅度信號。例如,假設輸入電壓的范圍是假設輸入電壓的范圍是0.0V-0.7V,并假設它的取值只限定在并假設它的取值只限定在0,0.1,0.2,0.7共共8個值。如果采樣得到的幅度值是個值。如果采樣得到的幅度值是0.123V,它的取值就應算作,它的取值就應算作0.1V,如果采樣得到的幅度值是如果采樣得到的幅度值是0.26V,它的取值就算作,它的取值就算作0.3,這種數值就稱為,這種數值就稱為離散

13、數值。我們把時間和幅度都用離散的數字表示的信號就稱為數字信離散數值。我們把時間和幅度都用離散的數字表示的信號就稱為數字信號。號。 采樣頻率又稱取樣頻率,它是指將模擬聲音波形轉換為數字音采樣頻率又稱取樣頻率,它是指將模擬聲音波形轉換為數字音頻時,每秒鐘所抽取聲波幅度樣本的次數。采樣頻率的高低是根據頻時,每秒鐘所抽取聲波幅度樣本的次數。采樣頻率的高低是根據奈奎斯特理論奈奎斯特理論(Nyquist theory)和聲音信號本身的最高頻率決定的。和聲音信號本身的最高頻率決定的。奈奎斯特理論指出:采樣頻率不應低于聲音信號最高頻率的兩倍,奈奎斯特理論指出:采樣頻率不應低于聲音信號最高頻率的兩倍,這樣就能把

14、以數字表達的聲音還原為原來的聲音,這叫做無損數字這樣就能把以數字表達的聲音還原為原來的聲音,這叫做無損數字化化(lossless digitization)。你可以這樣來理解奈奎斯特理論:聲音信號。你可以這樣來理解奈奎斯特理論:聲音信號可以看成由許許多多正玄波組成的,一個振幅為可以看成由許許多多正玄波組成的,一個振幅為A、頻率為、頻率為f的正炫的正炫波至少需要兩個采樣樣本表示,因此,如果一個信號中的最高頻率波至少需要兩個采樣樣本表示,因此,如果一個信號中的最高頻率為為f,采樣頻率最低要選擇采樣頻率最低要選擇2f。例如:電話話音的信號頻率約為。例如:電話話音的信號頻率約為3.4kHz,采樣頻率就

15、選為采樣頻率就選為8kHz。 量化位數又稱取樣大小,它是每個采樣點能夠表示的數據范量化位數又稱取樣大小,它是每個采樣點能夠表示的數據范圍。量化位數的大小決定了聲音的動態范圍,即被記錄和重放的圍。量化位數的大小決定了聲音的動態范圍,即被記錄和重放的聲音最高與最低之間的差值。聲音最高與最低之間的差值。 聲道數是指所使用的聲音的通道個數,它表明聲音一次同聲道數是指所使用的聲音的通道個數,它表明聲音一次同時產生的聲波組數。聲音的聲道數也是技術發展的重要標志,時產生的聲波組數。聲音的聲道數也是技術發展的重要標志,從單聲道到環繞立體聲,聲音的質量越來越好,但是同時增加從單聲道到環繞立體聲,聲音的質量越來越

16、好,但是同時增加了對存儲和傳輸媒體的要求。了對存儲和傳輸媒體的要求。 (1) 單聲道是比較原始的聲音復制形式,早期的音頻卡采用的比單聲道是比較原始的聲音復制形式,早期的音頻卡采用的比較普遍。當通過兩個揚聲器回放單聲道信息的時候,可以明顯感較普遍。當通過兩個揚聲器回放單聲道信息的時候,可以明顯感覺到聲音是從兩個音箱中間傳遞到耳朵里的。覺到聲音是從兩個音箱中間傳遞到耳朵里的。 (2) 立體聲又稱為雙聲道。單聲道缺乏對聲音的位置定位,而立立體聲又稱為雙聲道。單聲道缺乏對聲音的位置定位,而立體聲技術則徹底改變了這一狀況。聲音在錄制過程中被分配到兩體聲技術則徹底改變了這一狀況。聲音在錄制過程中被分配到兩

17、個獨立的聲道,從而達到了很好的聲音定位效果。個獨立的聲道,從而達到了很好的聲音定位效果。 (3) 準立體聲指的是在錄制聲音的時候采用單聲道,而放音有時準立體聲指的是在錄制聲音的時候采用單聲道,而放音有時是立體聲,有時是單聲道。是立體聲,有時是單聲道。 (4) 準立體聲指的是在錄制聲音的時候采用單聲道,而放音有時準立體聲指的是在錄制聲音的時候采用單聲道,而放音有時是立體聲,有時是單聲道。是立體聲,有時是單聲道。 (5) 5.1聲音系統來源于聲音系統來源于4.1環繞,不同之處在于它增加了一個中環繞,不同之處在于它增加了一個中置單元。這個中置單元負責傳送低于置單元。這個中置單元負責傳送低于80 Hz

18、的聲音信號,在欣賞的聲音信號,在欣賞影片時有利于加強人聲,把對話集中在整個聲場的中部,以增加影片時有利于加強人聲,把對話集中在整個聲場的中部,以增加整體效果。整體效果。 (6) 是在是在5.1的基礎上又增加了中左和中右兩個發音點,以求達到的基礎上又增加了中左和中右兩個發音點,以求達到更加完美的境界。更加完美的境界。 音頻數據壓縮比的表達式音頻數據壓縮比的表達式 音頻數據壓縮比音頻數據壓縮比 = 壓縮后的音頻數據壓縮后的音頻數據壓縮前的音頻數據壓縮前的音頻數據 數據率為每秒位數,它與信息在計算機中的實時傳輸有直接關系,數據率為每秒位數,它與信息在計算機中的實時傳輸有直接關系,而其總數據量又與計算

19、機的存儲空間有直接關系。用數字音頻產生而其總數據量又與計算機的存儲空間有直接關系。用數字音頻產生的數據一般以的數據一般以WAVE的文件格式存儲,以的文件格式存儲,以 “.WAV”作為文件擴展名。作為文件擴展名。 編碼作用:一方面是采用一定的格式來記錄數字數據,另一方面是編碼作用:一方面是采用一定的格式來記錄數字數據,另一方面是采用一定的算法來壓縮數字數據以減少存儲空間和提高傳輸效率。采用一定的算法來壓縮數字數據以減少存儲空間和提高傳輸效率。壓縮比越大,信息丟失越多,信號還原后失真越大。壓縮比越大,信息丟失越多,信號還原后失真越大。數據量數據量=采樣頻率采樣頻率(量化位數(量化位數/8)聲道數聲

20、道數聲音持續時間聲音持續時間 對于調頻廣播級立體聲,采樣頻率為對于調頻廣播級立體聲,采樣頻率為44.1kHz,量化等級為,量化等級為16位(即位(即2字節)聲道形式為雙聲道,則轉換后每秒以千字節為字節)聲道形式為雙聲道,則轉換后每秒以千字節為單位的數據量為:單位的數據量為: 44 100(Hz)(16/8)()(B)2=176 400B/s172kB/s 用用44.1kHz的采樣頻率對聲波進行采樣,每個采樣點的量化位的采樣頻率對聲波進行采樣,每個采樣點的量化位數選用數選用16位,則錄制位,則錄制3分鐘的立體聲節目,其波形文件所需的分鐘的立體聲節目,其波形文件所需的存儲容量為:存儲容量為:44

21、100(Hz)(16/8)()(B)2360=31 752 000B/s 31 007.8kB/s 30.28MB/s 用用44.1kHz的采樣頻率對聲波進行采樣,每個采樣點的量化位的采樣頻率對聲波進行采樣,每個采樣點的量化位數選用數選用16位,則錄制位,則錄制5分鐘的單聲道節目,其波形文件所需的分鐘的單聲道節目,其波形文件所需的存儲容量為:存儲容量為:44 100(Hz)(16/8)()(B)1560=26460000B/s 26460kB/s 26.46MB/s數據的采樣頻率和量化位數是影響數據的兩個因素。提高采樣頻率數據的采樣頻率和量化位數是影響數據的兩個因素。提高采樣頻率和增加量化位數

22、將使相應的數據量大大增加,給聲音信號的存儲與和增加量化位數將使相應的數據量大大增加,給聲音信號的存儲與傳輸帶來困難,這就需要在聲音的質量與數據量之間作出恰當的選傳輸帶來困難,這就需要在聲音的質量與數據量之間作出恰當的選擇。擇。數字音頻等級數字音頻等級 采樣頻率采樣頻率/kHz量化位量化位數數/bit聲道數聲道數每分鐘的數據量每分鐘的數據量/MB(無壓縮)(無壓縮)等效音質等效音質11.0258單聲道單聲道0.63語音語音22.0516雙聲道雙聲道5.05FM廣播廣播44.116雙聲道雙聲道10.09CD唱盤唱盤常用的采樣指標及等效音質常用的采樣指標及等效音質 信號類型信號類型頻率范圍頻率范圍/

23、Hz 采樣率采樣率/kHz量化位數量化位數/bit 電話話音電話話音200340088寬帶音頻寬帶音頻5070001616調頻廣播調頻廣播201500037.816高質量音頻高質量音頻202000044.116 如同存儲文本文件一樣,存儲聲音數據也需要有存儲格式。在因如同存儲文本文件一樣,存儲聲音數據也需要有存儲格式。在因特網上和各種機器上運行的聲音文件格式很多,但目前比較流行特網上和各種機器上運行的聲音文件格式很多,但目前比較流行的有以的有以.wav(waveform),.au(audio),.aiff(audio interchangeable file format)和和.snd(sou

24、nd)為擴展名的文件格式。為擴展名的文件格式。.wav格式主要用在格式主要用在PC上,上,.au主要用在主要用在Unix工作站上,工作站上,.aiff和和snd主要用在蘋果機和美國主要用在蘋果機和美國視算科技有限公司視算科技有限公司(Silicon Graphics,Inc.,SGI)的工作站上。的工作站上。 數字音頻數據是以文件的形式保存在計算機里。數字音頻的文數字音頻數據是以文件的形式保存在計算機里。數字音頻的文件格式主要有件格式主要有WAV、MP3、WMA、MIDI、VOC、PCM、RA、CDA等。等。 WAV(Wave)文件,又名波形文件,擴展名為)文件,又名波形文件,擴展名為.WAV

25、這是這是Windows本身存放數字聲音的標準格式,幾乎所有的音頻處理本身存放數字聲音的標準格式,幾乎所有的音頻處理軟件都支持軟件都支持WAV格式。格式。 MP3(MPEG Audio-3)是現在最流行的聲音文件格式,)是現在最流行的聲音文件格式,其擴展名為其擴展名為.MP3,它是采用,它是采用MPEG標準音頻數據壓縮編碼中層標準音頻數據壓縮編碼中層技術壓縮之后的數字音頻文件,技術壓縮之后的數字音頻文件,MP3格式壓縮音樂的典型比格式壓縮音樂的典型比例有例有10:1、17:1,甚至,甚至70:l 。 微軟的微軟的Windows Media Audio 7是一種壓縮的離散文件或流式文是一種壓縮的離

26、散文件或流式文件,其文件擴展名是件,其文件擴展名是.WMA,WMA(Windows Media Audio)相對)相對于于MP3的主要優點是在較低的采樣頻率下保持良好的音質。的主要優點是在較低的采樣頻率下保持良好的音質。 樂器數字接口樂器數字接口MIDI(Musical Instrument Digital Interface)是由世界上主要電子樂器制造廠商建立的一個通信標準,以規定計是由世界上主要電子樂器制造廠商建立的一個通信標準,以規定計算機音樂程序、電子合成器和其他電子設備之間交換信息與控制信算機音樂程序、電子合成器和其他電子設備之間交換信息與控制信號的方法。號的方法。 VOC(Crea

27、tive Voice)文件是)文件是Creative公司波形音頻文件格式,公司波形音頻文件格式,也是聲霸卡使用的音頻文件格式。每個也是聲霸卡使用的音頻文件格式。每個VOC文件由文件頭塊文件由文件頭塊(Header Block)和音頻數據塊()和音頻數據塊(Data Block)組成。)組成。 RA(Real Audio)是)是Real networks推出的一種音樂壓縮格推出的一種音樂壓縮格式,其壓縮比可以達到式,其壓縮比可以達到96:1,其最大特點是可以采用流媒體的,其最大特點是可以采用流媒體的方式實現網上實時播放,即邊下載邊播放。該文件擴展名方式實現網上實時播放,即邊下載邊播放。該文件擴展

28、名是是.RA。 CDA(CD Audio)又稱為)又稱為CD音樂,其擴展名為音樂,其擴展名為.CDA,是,是標準的激光盤文件。它是唱片采用的格式,又叫標準的激光盤文件。它是唱片采用的格式,又叫“紅皮書紅皮書”格格式,記錄的是波形流,該文件的特點是音質好,絕對純正,但式,記錄的是波形流,該文件的特點是音質好,絕對純正,但缺點是數據量大,無法編輯。缺點是數據量大,無法編輯。 PCM(Pulse Code Modulation)文件是模擬的音頻信號經)文件是模擬的音頻信號經過模數轉換(過模數轉換(A/D轉換)直接形成的二進制數字序列,該文件沒轉換)直接形成的二進制數字序列,該文件沒有附加的文件頭和文

29、件結束標志。有附加的文件頭和文件結束標志。 最基本的編輯是刪除聲音文件中不需要的聲音片段,一般的最基本的編輯是刪除聲音文件中不需要的聲音片段,一般的方法是確定片段的起點和終點,把它刪掉。方法是確定片段的起點和終點,把它刪掉。 可以將單聲道的聲音變成雙聲道的聲音。可以將單聲道的聲音變成雙聲道的聲音。 聲音從無到有,逐漸增強,直到正常,有逐漸走近的效果。聲音從無到有,逐漸增強,直到正常,有逐漸走近的效果。 均衡控制指對不同頻段的聲音音量的調整,可以使聲音產生均衡控制指對不同頻段的聲音音量的調整,可以使聲音產生清脆,低沉,柔和等效果。清脆,低沉,柔和等效果。 音頻信號是依賴時間的連續媒體,因此,音頻

30、處理的時序性音頻信號是依賴時間的連續媒體,因此,音頻處理的時序性要求很高。如果在時間上有要求很高。如果在時間上有25ms的延遲,人就會感到斷續。的延遲,人就會感到斷續。 對語音信號的處理,不僅是信號處理問題,還要抽取語意等對語音信號的處理,不僅是信號處理問題,還要抽取語意等其他信息;可能還會涉及到語言學、社會學、聲學等。其他信息;可能還會涉及到語言學、社會學、聲學等。 音頻信號分為兩類:語音信號與非語音信號。非語音信號又可分音頻信號分為兩類:語音信號與非語音信號。非語音信號又可分為音樂和雜音。非語音信號的特點是不具有復雜的語義和語法信為音樂和雜音。非語音信號的特點是不具有復雜的語義和語法信息,

31、信息量低,識別簡單。語音是語言的物質外殼。息,信息量低,識別簡單。語音是語言的物質外殼。 (1) 相應處理:音頻獲取,包括比如語音識別與理解。相應處理:音頻獲取,包括比如語音識別與理解。(2) 相應處理:音頻合成,包括音樂合成和語音合成;聲音定位,相應處理:音頻合成,包括音樂合成和語音合成;聲音定位,包括立體聲模擬,音頻包括立體聲模擬,音頻/視頻同步,其目的是讓計算機產生真視頻同步,其目的是讓計算機產生真實感聲音。實感聲音。 (3)相應處理:人通過網絡,與處于異地的人進行語音通信,需要相應處理:人通過網絡,與處于異地的人進行語音通信,需要的音頻處理包括:語音采集、音頻編碼的音頻處理包括:語音采

32、集、音頻編碼/解碼、音頻傳輸等。解碼、音頻傳輸等。音頻編音頻編/解碼技術是信道利用率的關鍵。解碼技術是信道利用率的關鍵。 (1) 通過聲卡,人們可將外部的聲音信號錄入計算機,并以文件形通過聲卡,人們可將外部的聲音信號錄入計算機,并以文件形式保存,需要時只需調出相應的聲音播放即可。式保存,需要時只需調出相應的聲音播放即可。(2) 對聲音文件進行多種特技效果的處理,音樂合成功能和性能主對聲音文件進行多種特技效果的處理,音樂合成功能和性能主要依賴于合成芯片。要依賴于合成芯片。(3) MIDI接口:外部電子樂器與計算機之間的通信。接口:外部電子樂器與計算機之間的通信。CD-ROM:各種各樣的。:各種各

33、樣的。游戲棒接口:游戲棒接口:(4)文語轉換和語音識別文語轉換和語音識別 對聲音文件進行多種特技效果的處理,音樂合成功能和性能主對聲音文件進行多種特技效果的處理,音樂合成功能和性能主要依賴于合成芯片。要依賴于合成芯片。 聲卡是將話筒或線性輸入的聲音信號經過聲卡是將話筒或線性輸入的聲音信號經過A/D轉換變成數字信轉換變成數字信號進行數據處理,然后再經過號進行數據處理,然后再經過 D/A轉換成模擬信號,送往混轉換成模擬信號,送往混音器中放大,最后輸出驅動揚聲器發聲。音器中放大,最后輸出驅動揚聲器發聲。聲卡的核心器件是數字音頻處理芯片和音樂合成器,他們決聲卡的核心器件是數字音頻處理芯片和音樂合成器,

34、他們決定了聲卡的性能優劣。定了聲卡的性能優劣。 聲卡的分類主要根據數據采樣量化的位數來分,通常分為聲卡的分類主要根據數據采樣量化的位數來分,通常分為8位、位、16位和位和32位幾種類型,位數越高取樣頻率越高,量化精度越位幾種類型,位數越高取樣頻率越高,量化精度越高,音質就越好。高,音質就越好。 (1) 采樣頻率一般有采樣頻率一般有3種標準:種標準:11.025kHz(語音等級)、(語音等級)、22.05kHz(音樂等級)、(音樂等級)、44.1kH。(高保真效果等級)。采樣。(高保真效果等級)。采樣頻率的高低直接影響聲卡的頻率響應范圍。頻率的高低直接影響聲卡的頻率響應范圍。 量化位數通常有兩種

35、標準:量化位數通常有兩種標準:8位和位和16位。對于語音信號,位。對于語音信號,8位量化位數基本可以滿足要求;但是對于音量幅度變化很大的位量化位數基本可以滿足要求;但是對于音量幅度變化很大的交響樂,就需要交響樂,就需要16位量化音頻質量。位量化音頻質量。(2) 采用什么樣的核心器件是決定聲卡性能高低的主要因素。采用什么樣的核心器件是決定聲卡性能高低的主要因素。 (3) 聲卡依其與計算機的連接方式不同,分為聲卡依其與計算機的連接方式不同,分為ISA總線、總線、PCI總總線和通過線和通過USB電纜連接的外置方式。電纜連接的外置方式。 (4) 聲卡所支持的聲道數也是聲卡技術發展的重要標志之一,聲卡所

36、支持的聲道數也是聲卡技術發展的重要標志之一,它決定了聲卡的基本功能。通常有它決定了聲卡的基本功能。通常有2聲道(即立體聲)、聲道(即立體聲)、2.1聲聲道、道、4.1聲道、聲道、5.1聲道甚至聲道甚至7.1聲道等,多通道聲卡是營造逼真聲道等,多通道聲卡是營造逼真音效環境的先決條件。音效環境的先決條件。 多媒體電腦將其聲音文件通過電腦中的聲卡,將數字音頻信號轉為多媒體電腦將其聲音文件通過電腦中的聲卡,將數字音頻信號轉為模擬音頻信號再由其輸出口輸出,這時音頻信號電平較弱,一般只模擬音頻信號再由其輸出口輸出,這時音頻信號電平較弱,一般只有幾百毫伏,還不能推動喇叭正常工作。而推動喇叭正常工作的電有幾百

37、毫伏,還不能推動喇叭正常工作。而推動喇叭正常工作的電壓一般需要幾伏左右的信號電壓。這時就需要將聲卡輸出的小信號壓一般需要幾伏左右的信號電壓。這時就需要將聲卡輸出的小信號通過放大器(俗稱功放)加以放大。放大后的音頻信號就可以推動通過放大器(俗稱功放)加以放大。放大后的音頻信號就可以推動喇叭將音頻電信號轉換為聲音信號了。而現在最新推出的喇叭將音頻電信號轉換為聲音信號了。而現在最新推出的USB多媒多媒體音箱則可以不需要聲卡,它通過電腦的體音箱則可以不需要聲卡,它通過電腦的USB接口輸出端引入數字接口輸出端引入數字音頻信號,然后音頻信號,然后USB多媒體音箱將此信號通過內部專用的多媒體音箱將此信號通過

38、內部專用的USB IC芯片轉換為模擬音頻信號,從而實現取代聲卡的功能。芯片轉換為模擬音頻信號,從而實現取代聲卡的功能。 按照材質不用分:塑料音響和木質音響按照材質不用分:塑料音響和木質音響按照功率放大器分:有源音箱和無源音箱按照功率放大器分:有源音箱和無源音箱按照接口:普通聲卡接口,數字接口,按照接口:普通聲卡接口,數字接口,USB接口,接口, IEEE1394接口接口按照聲道數分:多種類型按照聲道數分:多種類型 (1) 輸出功率是音箱最重要的指標,輸出功率分為額定功率和輸出功率是音箱最重要的指標,輸出功率分為額定功率和最大峰值功率兩種。最大峰值功率兩種。額定功率額定功率是音箱諧波失真在標準范

39、圍內變化時,音箱長是音箱諧波失真在標準范圍內變化時,音箱長時間工作輸出功率的最大值。時間工作輸出功率的最大值。最大峰值功率最大峰值功率是在不損壞音箱的前提下,瞬時功率的最是在不損壞音箱的前提下,瞬時功率的最大值。大值。 (2) 頻率范圍頻率范圍是指音箱最低有效回放頻率和最高有效回放頻率是指音箱最低有效回放頻率和最高有效回放頻率之間的范圍,單位為赫茲。之間的范圍,單位為赫茲。 頻率響應頻率響應是指將一個以恒定電壓輸出的音頻信號與音箱系是指將一個以恒定電壓輸出的音頻信號與音箱系統相連接時,音箱產生的聲壓會隨頻率的變化而增大或衰減,統相連接時,音箱產生的聲壓會隨頻率的變化而增大或衰減,相位也會隨頻率

40、而發生變化。相位也會隨頻率而發生變化。 聲壓、相位與頻率變化的曲線分別叫做聲壓、相位與頻率變化的曲線分別叫做幅頻特性幅頻特性和和相頻特相頻特性性,合稱,合稱頻率特性頻率特性。 (3) 信噪比信噪比是指音箱回放的有效信號與噪聲信號的比值,單位是指音箱回放的有效信號與噪聲信號的比值,單位是分貝(是分貝(dB)。信噪比越高越好。)。信噪比越高越好。 (4) 失真度分為諧波失真、互調失真和瞬態失真失真度分為諧波失真、互調失真和瞬態失真3種。種。 諧波失真是指聲音回放中由于增加了原信號沒有的高諧波失真是指聲音回放中由于增加了原信號沒有的高次諧波成分而導致的失真;次諧波成分而導致的失真; 互調失真影響到的

41、主要是聲音的音調方面;互調失真影響到的主要是聲音的音調方面; 瞬態失真是因為揚聲器具有一定的慣性質量,盆體的瞬態失真是因為揚聲器具有一定的慣性質量,盆體的振動無法跟上瞬間變化的電信號的振動而導致的原信號與回放振動無法跟上瞬間變化的電信號的振動而導致的原信號與回放音色之間的差異。音色之間的差異。 (5) 靈敏度靈敏度是指產生全功率輸出時的輸入信號。輸入信號越低,是指產生全功率輸出時的輸入信號。輸入信號越低,靈敏度越高,音箱性能就越好。音箱的靈敏度每差靈敏度越高,音箱性能就越好。音箱的靈敏度每差3dB,輸出,輸出的聲壓就相差一倍,一般的聲壓就相差一倍,一般84dB以下為低靈敏度,以下為低靈敏度,8

42、7dB為中靈敏為中靈敏度,度,90dB以上為高靈敏度。以上為高靈敏度。 (6) 阻抗是指揚聲器輸入信號的電壓與電流的比值。阻抗是指揚聲器輸入信號的電壓與電流的比值。 音箱的輸入阻抗一般分為高阻抗和低阻抗兩種:高于音箱的輸入阻抗一般分為高阻抗和低阻抗兩種:高于16的是高阻抗,低于的是高阻抗,低于8的是低阻抗,音箱的標準阻抗是的是低阻抗,音箱的標準阻抗是8。在功放與輸出功率相同的情況下,低阻抗的音箱可以獲得較大在功放與輸出功率相同的情況下,低阻抗的音箱可以獲得較大的輸出功率,但阻抗太低又會造成欠阻尼和低音劣化等現象。的輸出功率,但阻抗太低又會造成欠阻尼和低音劣化等現象。 MIDI( Musical

43、 Instrument Digital Interface)是音樂樂器數字接)是音樂樂器數字接口。口。MIDI是一種技術規范,它定義了為把電子樂器連接到計算機所需是一種技術規范,它定義了為把電子樂器連接到計算機所需要的電纜和端口的一種硬件標準,也定義了控制計算機和具有要的電纜和端口的一種硬件標準,也定義了控制計算機和具有MIDI接接口的設備之間進行消息交換的一整套規則,包括電子樂器之間傳送數據口的設備之間進行消息交換的一整套規則,包括電子樂器之間傳送數據的通信協議。的通信協議。 MIDI(樂器數字接口)是數字音樂的國際標準,任何電子樂器,(樂器數字接口)是數字音樂的國際標準,任何電子樂器,只要

44、有處理只要有處理MIDI指令的微處理器,并有合適的硬件接口,都可以成為指令的微處理器,并有合適的硬件接口,都可以成為一個一個MIDI設備。設備。MIDI的音樂符號化過程實際上就是產生的音樂符號化過程實際上就是產生MIDI協議信協議信息的過程。它沒有波形聲音那種數字化采樣和編碼過程,而是將電子樂息的過程。它沒有波形聲音那種數字化采樣和編碼過程,而是將電子樂器鍵盤的彈奏過程記錄下來,作為某首樂譜的一種數字描述的器鍵盤的彈奏過程記錄下來,作為某首樂譜的一種數字描述的MIDI消消息。當需要重新產生這首樂譜時,只需要從息。當需要重新產生這首樂譜時,只需要從MIDI文件中讀出相應的文件中讀出相應的MIDI

45、消息再通過音樂合成器生成音樂聲波,經放大后由揚聲器播出。消息再通過音樂合成器生成音樂聲波,經放大后由揚聲器播出。 MIDI有以下常用的術語有以下常用的術語(1)MIDI音樂合成器音樂合成器 利用數字信號處理器或其他芯片來產生音樂或聲音的電子裝利用數字信號處理器或其他芯片來產生音樂或聲音的電子裝置。置。(2)MIDI消息或指令消息或指令 樂譜的一種記錄格式,相當于樂譜語言。樂譜的一種記錄格式,相當于樂譜語言。(3)MIDI接口接口 MIDI硬件通信協議。硬件通信協議。(4)MIDI通道通道 共共16個通道,其中個通道,其中110通道作擴展合成器,通道作擴展合成器,1316用作基本用作基本合成器合

46、成器(5)MIDI文件文件 由控制數據和樂譜信息數據構成。由控制數據和樂譜信息數據構成。(6)音序器)音序器 是為是為MIDI作曲而設計的計算機程序或電子裝置。作曲而設計的計算機程序或電子裝置。 1. 存儲容量小;存儲容量小;2. 具有背景音樂或音響效果的配音功能;具有背景音樂或音響效果的配音功能;3. 便于編輯和修改;便于編輯和修改;4. 可以在可以在MIDI合成器中完全重現原來的演奏。合成器中完全重現原來的演奏。根據根據MIDI的特點,在以下幾種情況下比較適合用的特點,在以下幾種情況下比較適合用MIDI譜曲:譜曲:(1)需要播放長時間的高質量的音樂。)需要播放長時間的高質量的音樂。(2)需

47、要以音樂作背景音響效果,同時從)需要以音樂作背景音響效果,同時從 CD一一ROM裝載裝載其他音樂文件。其他音樂文件。(3)需要以音樂作背景音響效果,同時播放波形音頻,以)需要以音樂作背景音響效果,同時播放波形音頻,以實現語音和音樂的同時輸出。實現語音和音樂的同時輸出。 MIDI規范規定,每種規范規定,每種MIDI裝置通常由一個接收器和一個發送器裝置通常由一個接收器和一個發送器組成,如果該裝置只作輸出端或輸入端,則可以省去其中之一。組成,如果該裝置只作輸出端或輸入端,則可以省去其中之一。 接收器可以接收接收器可以接收MIDI格式的消息,并執行格式的消息,并執行MIDI命令;命令; 發送器可以生成

48、符合發送器可以生成符合MIDI格式的消息并向外發送。格式的消息并向外發送。 一個接收器和一個發送器構成一對一個接收器和一個發送器構成一對MIDI消息輸入輸出組合,它們消息輸入輸出組合,它們之間用一種通用的異步收發器互相連接,數據傳輸的比特率為之間用一種通用的異步收發器互相連接,數據傳輸的比特率為3125bps,每個數據字節(,每個數據字節(8位)前后各有一個起始位和停止位。位)前后各有一個起始位和停止位。 MIDI設備的端口有三種:設備的端口有三種:MIDI In(輸入口)、(輸入口)、MIDI Out(輸出(輸出口)和口)和MIDI Thru(傳送口)。(傳送口)。 MIDI規范規定,規范規

49、定,MIDI鍵盤共有鍵盤共有128個鍵。個鍵。MIDI消息可以描述每個消息可以描述每個音符對應的鍵號、按鍵持續時間、音量和力度等信息。音符對應的鍵號、按鍵持續時間、音量和力度等信息。 MIDI接收器有接收器有16個聲道(個聲道(Channel),它們可以同時向聲音合成),它們可以同時向聲音合成器傳送器傳送16路不同的聲音。路不同的聲音。 MIDI 音樂的產生過程音樂的產生過程 MIDI電子樂器電子樂器 MIDI接口接口 音序器音序器 音樂合成器音樂合成器 MIDI文件文件 揚聲器揚聲器 MIDI指令指令 計算機音頻卡計算機音頻卡 模擬音頻信號模擬音頻信號聲頻卡的聲頻卡的MIDI音樂合成主要有兩

50、種方法:音樂合成主要有兩種方法: FM 數字式頻率調制合成法。數字式頻率調制合成法。 波形表合成法。波形表合成法。MIDI作曲和核配器系統核心部分是一個被稱為序列器的軟件。這個軟件作曲和核配器系統核心部分是一個被稱為序列器的軟件。這個軟件即可以裝到個人電腦里,也可做在一個專門的硬件里。序列器實際上是即可以裝到個人電腦里,也可做在一個專門的硬件里。序列器實際上是一個音樂詞處理器(一個音樂詞處理器(word porcessor),應用它可以記錄、播放和編輯),應用它可以記錄、播放和編輯各種不同各種不同MIDI樂器演奏出的樂曲。序列器并不真正的記錄聲音,它只記樂器演奏出的樂曲。序列器并不真正的記錄聲

51、音,它只記錄和播放錄和播放MIDI信息,這些信息從信息,這些信息從MIDI樂器來的電腦信息,就像印在紙樂器來的電腦信息,就像印在紙上的樂譜一樣,它本身不能直接產生音樂,上的樂譜一樣,它本身不能直接產生音樂,MIDI本身也不能產生音樂,本身也不能產生音樂,但是它包含有如何產生音樂所需的所有指令,例如用什么樂器、奏什么但是它包含有如何產生音樂所需的所有指令,例如用什么樂器、奏什么音符、奏得多快,奏得力度多強等。音符、奏得多快,奏得力度多強等。 序列器可以是硬件,也可以是軟件,它們作用過程完全與專業錄音棚里序列器可以是硬件,也可以是軟件,它們作用過程完全與專業錄音棚里多軌錄音機一樣,可以把許多獨立的

52、聲音記錄在序列器里,其區別僅僅多軌錄音機一樣,可以把許多獨立的聲音記錄在序列器里,其區別僅僅是序列器只記錄演奏時的是序列器只記錄演奏時的MIDI數據,而不記錄聲音;它可以一軌一軌地數據,而不記錄聲音;它可以一軌一軌地進行錄制,也可以一軌軌地進行修改,當你彈鍵盤音樂時,序列器記錄進行錄制,也可以一軌軌地進行修改,當你彈鍵盤音樂時,序列器記錄下從鍵盤來的下從鍵盤來的MIDI數據。一旦把所需要的數據存儲下來以后,可以播放數據。一旦把所需要的數據存儲下來以后,可以播放你剛作好的曲子。如果你覺得這一聲部的曲子不錯,可以把別的聲部加你剛作好的曲子。如果你覺得這一聲部的曲子不錯,可以把別的聲部加上去,新加上

53、去的聲部播放時完全與第一道同步。上去,新加上去的聲部播放時完全與第一道同步。 MIDI系統是如何工作的系統是如何工作的 MIDI程序的設計目標就是要將所要演奏的音樂或音樂曲目,按其進行的程序的設計目標就是要將所要演奏的音樂或音樂曲目,按其進行的節奏、速度、技術措施等要求,轉換成節奏、速度、技術措施等要求,轉換成MIDI控制語言,以便在這些控制語言,以便在這些MIDI指令的控制之下,各種音源在適當的時間點上,以指定的音色、時指令的控制之下,各種音源在適當的時間點上,以指定的音色、時值、強度等、演奏出需要的音響。在錄音系統中,還要控制記錄下這些值、強度等、演奏出需要的音響。在錄音系統中,還要控制記錄下這些音響。音響。MIDI所適應的范圍只是電聲樂曲或模擬其他樂器的樂曲。所適應的范圍只是電聲樂曲或模擬其他樂器的樂曲。 MIDI技術的產生與應用,大大降低了樂曲的創作成本,節省了大量樂隊技術的產生與應用,大大降低了樂曲的創作成本,節省了大量樂隊演奏員的各項開支,縮短了在錄音棚的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論