信號與系統(tǒng)三級項目-基于matlab的語音信號采集與分析報告_第1頁
信號與系統(tǒng)三級項目-基于matlab的語音信號采集與分析報告_第2頁
信號與系統(tǒng)三級項目-基于matlab的語音信號采集與分析報告_第3頁
信號與系統(tǒng)三級項目-基于matlab的語音信號采集與分析報告_第4頁
信號與系統(tǒng)三級項目-基于matlab的語音信號采集與分析報告_第5頁
已閱讀5頁,還剩1頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

.../信號與系統(tǒng)三級項目姓名:班級:電子信息工程2班課程名稱:信號與系統(tǒng)指導(dǎo)教師:閆盛楠2017年6月基于Matlab的語音信號采集與分析〔燕山大學(xué)信息科學(xué)與工程學(xué)院摘要:此次三級項目的內(nèi)容是:通過運用Matlab語言實現(xiàn)語音信號的采集、分析和處理。在本次項目中,我們首先利用Matlab實現(xiàn)了對語音信號的采集,讀取,然后對讀入的聲音信號進行了頻域分析,之后定性與定量地判別了男女聲,最終驗證了抽樣定理,得出了利用手機通信時對聲音的采樣應(yīng)不低于8000Hz的結(jié)論。前言:通過這次三級項目的實施,我們對Matlab語言的使用、信號的采集與分析及抽樣定理都有了深刻的理解,我們將我們的理解與收獲以報告的形式記錄下來,以便于更好的總結(jié)。在本次信號與系統(tǒng)的三級項目中,負(fù)責(zé)語音信號的采集與資料的收集,負(fù)責(zé)聲音信號的讀入、頻譜分析、辨別男女聲以及書寫報告,負(fù)責(zé)驗證抽樣定理,負(fù)責(zé)制作ppt。在整個過程中,我們既有分工,又相互合作,共同解決棘手的問題。最終完成了三級項目要求的內(nèi)容:對男聲女聲的頻譜有了較為深深刻的印象,可以簡單的辨別男女聲音,驗證了抽樣定理的準(zhǔn)確性并驗證了電話可以對語音信號采用8kHz的采樣速率的結(jié)論。ⅠMatlab簡介Matlab的全稱是MatrixLaboratory,中文翻譯名稱是矩陣實驗室,Matlab由美國Mathworks公司出品,用于算法計算、矩陣分析、數(shù)值計算、和將數(shù)據(jù)達到可視化的高級技術(shù)計算機語言和交互式環(huán)境。主要包括Matlab和Simulink。Matlab的功能有分析目的數(shù)值,計算各種矩陣,將科學(xué)數(shù)據(jù)以各種圖形,圖表形式展現(xiàn)出來,更在建立非線性動態(tài)系統(tǒng)模型和仿真方面擁有自己的優(yōu)勢。在工程設(shè)計,科學(xué)研究等多方面科學(xué)研究領(lǐng)域發(fā)揮了強大的作用。Matlab可以實現(xiàn)函數(shù)和數(shù)據(jù)的圖形繪制,算法實現(xiàn),圖形用戶界面的創(chuàng)建,矩陣運算,連接其他編程語言的程序等。應(yīng)用領(lǐng)域有信號處理與通信、圖像處理、控制設(shè)計、工程設(shè)計。語音信號處理,顧名思義是將信號處理與語音學(xué)相結(jié)合的科學(xué),被應(yīng)用于現(xiàn)代通信領(lǐng)域,人與人、人與機器之間的信息交流。而Matlab作為一種擁有強大功能,交互性好的計算數(shù)值和圖形可視化計算高級語言,能夠?qū)⑿盘柼幚硪约皵?shù)值分析綜合在一起。伴隨著Matlab功能越來越強大,其廣泛應(yīng)用于仿真、數(shù)字語音信號處理、數(shù)字圖像處理等領(lǐng)域。直接利用Matlab信號處理工具箱中的庫函數(shù),可以很快捷的對數(shù)字化的語音信號進行分析。Ⅱ主要內(nèi)容2.1語音信號的產(chǎn)生及組成起初,說話者會在自己的大腦中產(chǎn)生想表達的語言內(nèi)容,然后將這些內(nèi)容用其包含的響度、音速序列、基音周期的起伏順序等表示出來,類似于對這些內(nèi)容編碼。完成信息編碼后,說話者用一些專用的神經(jīng)肌肉發(fā)出命令控制自己的聲帶振動,控制聲道的形狀以達到發(fā)出編碼中的聲音序列。這些信息以聲波的方式在空氣中傳播,傳遞到語音收聽人的耳中,那么,語音感知的過程開始。2.2語音信號的采集與讀取語音信號的采集方式有多種,在本次項目中要求用麥克風(fēng)和聲卡采集一段語音信號。在實施項目的過程中,我們一共總結(jié)了三種采集聲音信號的方式。一是利用windows自帶的錄音機,缺點是采樣率是一個固定值,無法進行設(shè)置;二是利用Matlab語言進行聲音的錄制,缺點是要調(diào)用代碼,調(diào)用函數(shù)才能獲得語音信號,不夠方便;三是利用錄音筆進行聲音信號的采集。考慮實際情況,我們選擇通過利用錄音筆設(shè)置采樣率為48000Hz后進行聲音信號的采集,其中,男生女生各錄制一段內(nèi)容相同的語音,長度約為10s。在聲音信號采集完成后,進行了將聲音信號讀入matlab的步驟。在網(wǎng)上搜的資料基本上全是老版本的Matlab,于是保存的函數(shù)用的都是wavread,然而自從2013版本之后,通過參考幫助文檔,發(fā)現(xiàn)這個函數(shù)就被換成了audioread〔file,參數(shù)為待讀取音頻的路徑。[y,fs]=audioread<file>;這樣,就將聲音信號的信息轉(zhuǎn)換為一個矩陣變量并把它賦給了y;將采樣率〔即之前設(shè)置好的48000賦給了fs。實現(xiàn)了語音信號的采集與讀取。2.3對語音信號進行頻譜分析頻譜分析就是計算信號的頻譜,包括幅度譜和相位譜。最初引入離散傅里葉變換<DFT>的目的就是為了使計算機能夠幫助分析連續(xù)時間信號的頻譜,然而,當(dāng)N很大的時候,求一個N點的DFT要完成N*N次復(fù)數(shù)乘法和N<N-1>次復(fù)數(shù)加法,其計算量相當(dāng)大,1965年庫利和圖基巧妙地利用了ωn因子的周期性和對稱性,構(gòu)造了一個DFT快速算法,即快速傅里葉變換〔FFT,而快速傅里葉變換的出現(xiàn)使這種分析方法的實用價值更加突出。通過對FFT的簡單了解,對語音信號的分析我們采用如下方案:使用plot函數(shù)畫出已經(jīng)導(dǎo)入到程序中的聲音信號的時域波形,并對原始波形進行用FFT函數(shù)傅里葉變換后,再使用plot就可畫出其頻譜。頻譜分析部分代碼如下:y=y<:,1>;%對聲音信號提取單聲道%=======頻域圖像======n=0:length<y>-1;%建立一個信號等長的序列time=n/fs;%建立時間序列,作為橫坐標(biāo)subplot<2,1,1>;%圖1:時域波形圖plot<time,y>;%作圖title<'音頻信號波形圖'>%標(biāo)題xlabel<'時間/s'>;%標(biāo)注橫坐標(biāo)ylabel<'幅值'>;%標(biāo)注縱坐標(biāo)gridon;%打開網(wǎng)格線%=======頻域圖像======N=length<y>;%取信號矩陣的長度Y1=fft<y,N>;%N點傅里葉變換mag=abs<Y1>;%取模f=n*fs/N;%頻率序列subplot<2,1,2>;%圖2:頻譜圖%取1/2作圖plot<f<1:fix<N/2>>,mag<1:fix<N/2>>>;title<'音頻信號fft頻譜圖'>;%標(biāo)題xlabel<'頻率/Hz'>;%標(biāo)注橫坐標(biāo)ylabel<'幅度'>;%標(biāo)注縱坐標(biāo)gridon;%打開網(wǎng)格線在程序運行結(jié)束后我們得到了這樣的圖像:女聲:男聲:實現(xiàn)了對語音信號進行頻譜分析。2.4分析男聲和女生的差別男聲和女聲的差別在生活中我們感覺男生的聲音雄渾低沉,女生的聲音尖細(xì)清脆。男、女聲在頻率方面存在很大的差別:一是男、女聲的基音頻率有差別,男聲的基音頻率大致在100—200HZ之間,而女聲的基音頻率則在200—350HZ之間;二是男聲低頻成份比較多,女聲高頻成份比較多。2.4.2定性地辨別男女聲的第二點我們可以通過考慮觀察男女頻譜函數(shù)中地頻率成分進行判斷。在我們的常識中,女生的聲音比較尖,音調(diào)比較高,頻率當(dāng)然會高一點,男生的頻率會低一些。由2.3中男聲和女聲的頻域波形圖,我們可以辨別出男聲女聲頻譜中的細(xì)微不同:男聲的低頻部分的幅值較高,高頻部分的偏低;而女聲恰好相反,高頻部分的幅值較高而低頻部分的偏低。實現(xiàn)了定性的辨別男女聲。通過觀察語音信號的頻譜圖是可以辨別男女聲的這種方法的缺點是:需要將兩幅圖進行比較并且人的主觀判斷會造成較高的錯誤率。。2.4.3定量地辨別男女聲我們知道,一個波形可以由無數(shù)正弦波和余弦波疊加而成,有如下公式:可將以上公式變換為:那么,當(dāng)n=0時我們可以得到一個特殊的波形,稱為基波。聲音也是一種波,也由無數(shù)正弦波和余弦波疊加而成,那么在聲音信號中n=0的波就是該聲音信號的基波,由此我們引出了基音的概念:基音,一般的聲音都是由發(fā)音體發(fā)出的一系列頻率、振幅各不相同的振動復(fù)合而成的。這些振動中有一個頻率最低的振動,由它發(fā)出的音就是基音,其余為泛音。發(fā)音體整體振動產(chǎn)生的音〔振動長度越大,頻率越小,叫做基音,決定音高;發(fā)音體部分振動產(chǎn)生的音,叫做泛音,決定音色。女生的基音偏高而男生的基音偏低,因此,我們考慮利用基音頻率進行男聲女聲的辨別。通過大量查閱網(wǎng)上的資料以及對多人聲音的測試,我們決定將250Hz定為男女聲音的分界點,基音頻率小于250Hz的為男聲,基音頻率大于250的為女聲。通過測試,這種方法準(zhǔn)確度較高,但對于聲音偏低沉的女聲和聲音比較高的男聲仍然會出現(xiàn)識別錯誤的現(xiàn)象。實現(xiàn)提取基音頻率并辨別男女聲的代碼如下:%======基音頻率提取======[~,index]=max<t>;timewin=floor<0.015*fs>;xwin=t<index-timewin:index+timewin>;[y,~]=xcov<xwin>;ylen=length<y>;halflen=<ylen+1>/2+30;yy=y<halflen:ylen>;[~,maxindex]=max<yy>;fmax=fs/<maxindex+30>;disp<[file,'基音頻率為',num2str<fmax>,'Hz']>%======通過基因頻率判斷男女聲======iffmax<250;disp<[file,'是男聲文件']>;elsedisp<[file,'是女聲文件']>;end;sound<t,fs>;通過這種方式的測試出來的結(jié)果:女聲的音頻文件:E:\REC003.mp3基音頻率為327.4725HzE:\REC003.mp3是女聲文件女聲的音頻文件:E:\REC005.mp3基音頻率為134.4538HzE:\REC005.mp3是男聲文件通過以上兩種方法,實現(xiàn)了分析男聲和女生的差別。2.5驗證抽樣定理抽樣定理的內(nèi)容如下:一個頻譜受限的信號f<t>,如果頻譜只占據(jù)-ωm~ωm的范圍,則信號f<t>可以用等間隔的抽樣值惟一地表示。而抽樣間隔必須不大于1/2????<其中ωm=2π????>,或者說,最低抽樣頻率為2????。由于人的聲音頻率為300Hz—3400Hz,根據(jù)奈奎斯特采樣定理可知,采樣頻率必須要大于等于2倍的3400Hz,即6800Hz,向上取至8kHz,這是一個既可以保證信號抽樣準(zhǔn)確和恢復(fù)基本正確,又不會造成抽樣太多,數(shù)據(jù)量過大的采樣頻率。要實現(xiàn)音頻數(shù)據(jù)的降采樣有多種方法,通過上網(wǎng)查詢,我們采用了函數(shù)downsample<>,它能夠較好地模擬直接降采樣的過程,降采樣后的變化也更容易發(fā)現(xiàn)。首先通過降采樣函數(shù)downsample降采樣處理,參數(shù)分別為原信號y和降采樣率的倍數(shù)。利用函數(shù)downsample<>進行降采樣后,矩陣的長度會大大變短,而在我們以后的頻譜分析中,為了方便比較,我們需要相同長度的數(shù)據(jù),所以就采用了interp<>函數(shù)對降采樣后的數(shù)據(jù)進行了插值處理,保證了信號的長度,然后采用了之前畫出時域和頻域圖像部分以及男女聲判別部分的代碼,畫出降采樣的后數(shù)據(jù)的時域、頻域圖像和基音頻率。我們在錄制聲音時選用的fs為48000Hz,對其進行6倍的降采樣就是8000Hz。根據(jù)抽樣定理,如果降采樣倍數(shù)小于6,聲音信號就是可以恢復(fù)的,如果降采樣的倍數(shù)大于6,那么聲音信號就會產(chǎn)生失真。我們將原信號、降6倍信號、降20倍信號的頻譜圖放在一起進行了對比,發(fā)現(xiàn)在頻域圖的主要頻譜的部分,降6倍的與原信號的波形幾乎沒有差別,而降20倍的波形已經(jīng)有了較為明顯的失真。原信號采樣率48000Hz降6倍采樣采樣率8000Hz降20倍采樣采樣率2400Hz實現(xiàn)了對抽樣定理的驗證。Ⅲ總結(jié)與心得3.1總結(jié)本次三級項目我們主要進行了語音信號的采集,并對采集的語音信號進行時域和頻域波形顯示及仿真,然后對采集的語音信號進行降采樣處理和男女聲的區(qū)分。我們使用的是在Matlab中編寫程序進行采樣和波形顯示以及降采樣處理,對于男女聲區(qū)分我們使用了兩種方法:頻譜觀察法與基音頻率法。通過多組音頻信號的測試我們認(rèn)為基音頻率法的準(zhǔn)確率和客觀性比較高。在基音頻率法中,我們發(fā)現(xiàn)男聲的基頻主要集中在小于250Hz這個范圍內(nèi),女聲基頻主要集中在大于250Hz這個范圍內(nèi)。這個基頻范圍是我們根據(jù)一些樣本得出的,樣本數(shù)量較少,使得判別存在一定誤差。聲音信號的主要頻率范圍為200Hz~3400Hz,根據(jù)抽樣定理可得,采樣頻率應(yīng)不小于8000Hz。3.2心得本次三級項目中我們組分工明確,組內(nèi)成員互幫互助,最終全部實現(xiàn)了該次項目的全部內(nèi)容。在項目實施的過程中,我們也遇到

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論