語音信號共振峰提取方法_第1頁
語音信號共振峰提取方法_第2頁
語音信號共振峰提取方法_第3頁
語音信號共振峰提取方法_第4頁
語音信號共振峰提取方法_第5頁
已閱讀5頁,還剩5頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、0.引言在語音數字信號處理的研究中,語音信號的共振峰是一個十分重要的性能參數。共振峰是準周期脈沖激勵進入聲道時產生的一組共振頻率。共振峰參數包括共振峰頻率和頻帶寬度,它是區別不同韻母的重要參數。當前共振峰的提取方法有很多種,每種方法各有利弊,本文對多種共振峰提取方法進行實驗和比較分析。與基音提取類似,得到精確的共振峰估值也是很困難的,這些困難是:(1虛假峰值在正常情況下,頻譜包絡中的最大值完全是由共振峰引起的。但有時會出現虛假峰值,在利用非線性預測分析方法的頻譜包絡估計時,出現虛假峰值情況較多,而采用線性預測方法時,出現虛假峰值情況得到了很大的改善。(2共振峰合并當出現相鄰共振峰時,可能會有頻

2、率靠得太近難以分辨的情況,而尋找一種理想的能對共振峰合并進行識別的共振峰提取算法有不少實際困難。(3高音調語音傳統的頻譜包絡估值方法是利用由諧波峰值提供的樣點,而高音調語音(如女聲和童聲的諧波間隔比較寬,因而為頻譜包絡估值所提供的樣點比較少。而利用線性預測進行頻譜包絡估值可以一定程度上改善這一問題。1.譜包絡提取共振峰信息包含在語音頻譜包絡中,因此共振峰參數提取的關鍵是估計自然語音頻譜包絡,并認為譜包絡中的最大值就是共振峰。下圖1是對21 幀信號的線性預測譜包絡提取分析。圖12.倒譜法提取共振峰雖然可以直接對語音信號求離散傅里葉變換(DFT,然后用DFT 譜來提取語音信號的共振峰參數,但是,直

3、接DFT的譜要受基頻諧波的影響,最大值只能出現在諧波頻率上,因而共振峰測定誤差較大。為了消除基頻諧波的影響,可以采用同態解卷技術,經過同態濾波后得到平滑的譜,這樣簡單地檢測峰值就可以直接提取共振峰參數,因而這種方法更為有效和精確。因為倒譜運用對數運算和二次變換將基音諧波和聲道的頻譜包絡分離開來。因此用低時窗l(n從語音信號倒譜c(n中所截取出來得h(n,能更精確地反映聲道響應。這樣,由h(n經DFT得到的H(k,就是聲道的離散譜曲線,用H(k代替直接DFT的頻譜,因為去除了激勵引起的諧波波動,所以可以更精確地得到共振峰參數。圖2倒譜法求取的共振峰參數圖3.LPC法提取共振峰從線性預測導出的聲道

4、濾波器是頻譜包絡估計器的最新形式,線性預測提供了一個優良的聲道模型(條件是語音不含噪聲。盡管線性預測法的頻率靈敏度和人耳不相匹配,但它仍是最廉價、最優良的行之有效的方法。用線性預測可對語音信號進行解卷:即把激勵分量歸入預測殘差中,得到聲道響應的全級模型H(z的分量,從而得到這個分量的ai參數。盡管其精度由于存在一定的逼近誤差而有所降低,但去除了激勵分量的影響。此時求出聲道響應分量的譜峰,就可以求出共振峰,這里有兩種途徑:一是用標準的求取復根的方法計算全級模型分母多項式A(z的根,稱為求根法;一是用運算量較少的DFT法,求A(z的離散頻率響應A(k的谷點來得到共振峰的位置。因為A(z=1-i=1

5、pa i z-i,所以若求此多項式系數序列(1,a1,a2,a p的DFT,就可以得到A(k。但是一般預測階數p不大,這就影響了求其谷點即求其共振峰頻率值的精度。為了提高DFT的頻率分辨率,可以采用補0的辦法增加序列的時間長度,即用(1,a1,a2,a p,0,0,0進行DFT,為了能利用FFT,長度一般取為64點、128點、256點、512點等。另外也可以采用拋物線內插技術, 解決頻率分辨率較低的情況下的共振峰頻率值的求取。圖3LPC譜估計法求取的共振峰參數圖語音信號共振峰提取方法的研究分析青海師范大學物理系楊丹姜占才余鎣良李振起摘要目前的提取語音共振峰的方法比較多,常用的方法有倒譜法、LP

6、C譜估計法、LPC倒譜法,但沒有一種方法是十分完美的,為了系統的深入的研究共振峰的提取,本文對同一幀語音信號進行了不同方法的共振峰提取實驗仿真,給出了具體的共振峰頻率數據,同時對不同方法的優缺點進行了科學的、深入的研究分析,用Matlab對算法進行仿真實現,實驗結果表明共振峰的提取方案中LPCC倒譜法避免了一般同態處理中對復對數的麻煩,可以較為理想的實現對共振峰的提取。關鍵詞共振峰倒譜法LPC譜估計法LPC倒譜法 同態處理1614.求根法提取共振峰找出多項式復根的過程通常采用牛頓拉夫遜(Newton-Raphson 算法。其方法是一開始先猜測一個根值并就此猜測值計算多項式及其導數的值,然后利用

7、結果再找出一個改進的猜測值。當前后兩個猜測值之差小于某門限時結束猜測過程。由上述過程可知,重復運算找出復根的計算量相當可觀。然而,假設每一幀的最初猜測值域前一幀的根的位置重合,那么根的幀到幀的移動足夠小,經過較少的重復運算后,可使新的根的值會聚在一起。當求根過程初始時,第一幀的猜測值可以在單位圓上等間隔設置。具體過程是:設:z i =r i e j i 為第一個根,則其共軛值z i =r i e -j i也是一個根。設與i 對應的共振峰頻率為F i ,3dB 帶寬為B i ,則它們存在下面的關系:2TF i =i e -B i T=r i 所以:F i =i 2T B i =-ln r iT

8、式中,T 是采樣周期。因為預測器階數p 是預先選定的,所以復共軛對的數量最多是p/2。因而判斷某一個極點屬于哪一個共振峰的問題就不太復雜。而且,不屬于共振峰的額外極點容易排除掉,因為其帶寬比共振峰帶寬要大得多。5.LPC 倒譜法提取共振峰語音信號的倒譜可以通過對信號做傅里葉變換,取模的對數,在求反傅里葉變換得到。由于頻率響應H (e j反應聲道的頻率響應和被分析信號的譜包絡,因此用log |H (e j|做傅里葉反變換求出的LPC 倒譜系數,也可以被認為是包含了信號譜的包絡信息,因此可以將其看作對原信號短時倒譜的一種近似。 圖4LPC 倒譜法求取的共振峰參數圖通過線性預測分析得到的合成濾波器的

9、系統函數為H (z =11-i =1pa i z -i,其沖擊響應為h(n。下面求h(n的倒譜h (n ,首先根據同態分析方法,有H (z =log H (z 因為H(z是最小相位的,即在單位院內是解析的,所以H (z 一定可以展開成級數形式,即H (z =n =1+h (n z -n ,就是說H(z 的逆變換h (n 是存在的。設h (0=0,將式兩邊同時對z-1求導,得z -1log æèççççöø÷÷÷÷11-i =1a i z -i=z -i n =1+h (n z

10、 -n得到n =1+nh(n z -n +1=i =1pia i z -i +11-i =1a i z -i有æèçöø÷1-i =1p a i z -i n =1+nh(n z -n +1=n =1+ia i z -i +1,令式左右兩邊z 的各次冪前系數分別相等得到ìíîïïïïïïïïh (1=a 1h (n =a n +i =1n -1æèçöø÷1-i n

11、a i h(n -i 1n p h (n =i =1p æèçöø÷1-i n a i h (n -i n >p 按照上式可直接從預測系數ai求得倒譜h(n 。這個倒譜是根據現行預測模型得到的,又稱為LPC 倒譜。6.分析和總結以上實驗表明,倒譜法因為其頻譜曲線的波動比較小,所以估計共振峰參數的效果是較好的,但其運算量太大。LPC 法的缺點是用一個全極點模型逼近語音譜,對于含有零點的某些音來說A(z的根反映了極零點的復合效應,無法區分這些根是相對于零點還是極點,或完全與聲道的諧振極點有關。聲道的系統函數可以由一組LPC 預測系數

12、唯一確定,因此通過分析能估計出聲道調制的效果,即獲得共振峰參數。當然,LPC 分析階P 的選擇很重要,它近似等于語音信號的抽樣頻率,這是因為語音譜一般可用每1kHz 具有1對共扼極點的平均密度來表示聲道造成的響應,于是采樣頻率為Fs(kHz的語音信號的LPC 譜大約有Fs 個極點。LPC 分析在大多數情況下能成功提取語音的共振峰參數。求根法求取共振峰的優點在于通過對預測多項式系數的分解可以精確地確定共振峰的中心頻率和帶寬。LPC 倒譜由于利用線性預測中聲道系統函數H(z的最小相位特性,因此避免了一般同態處理中對復對數的麻煩。圖5共振峰參數求取三種方法比較分析圖當前還有很多種新的共振峰提取方法,

13、每個方法都是在傳統共振峰提取方法的基礎上進行研究和改進提出的,在一定的基礎上較好的實現了共振峰的提取,效果也較為理想,但都保留了一定的改進空間供后來者繼承和研究創新。參考文獻1Wat anabe A.Formant estimat ion method using inverse-filter control J .IEEE Transactions on Speech and Audio Processing,2001,9(4:317-326.2L.R.Rabiner,B.H.Juang.Fundamentals of Speech Recognition.Prentice Hall,Eng

14、lewood Cliffs,1993.清華大學出版社(影印,2002年.3黃海,陳祥獻.基于Hilbert-Huang 變換的語音信號共振峰頻率估計J .浙江大學學報:工學版,2006,40(11:1926-1930.4胡航.語音信號處理(修訂版.哈爾濱工業大學出版社,2002年.5于萍,韓冰等.嗓音聲學分析和電聲門圖的比較研究J .聽力學及言語疾病雜志,2005,13(3:160-163.6韓繼慶,張磊,鄭鐵然.語音信號處理.清華大學出版社,2004年.1王宏志.一本晚清翻譯史的構思J .中國比較文學,2001,(2:104.2譚汝謙.中國譯日本書綜合目錄M .香港:香港中文大學出版社,1980.3(日實藤惠秀.中國人留學日本史M .譚汝謙,林啟彥譯.北京:生活·讀書·新知三聯書店,1983.4李喜所.近代中國的留學生M .北京:北京人民出版社,1987.122、124、144、198-201.5費正清.劍橋中國晚清史下卷M .北京:中國社會科學出版社

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論