




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
摘要語音基音周期檢測概述2.1語音信號的基本模型語音信號的產生過程可以抽象為三個模型的級聯,這三個模型分別是激勵模型,聲道模型以及輻射模型,流程框圖如下圖所示:圖1語音信號產生的流程框圖激勵模型人在發濁音時,會產生脈沖,該脈沖的形狀看起來像斜三角形,此時經過激勵形成的脈沖串的周期就是基音周期[8]。單個斜三角形脈沖串的數學表達式為:(2.1)式(2.1)中,為斜三角波的上升時間,為斜三角波下降的時間。單個斜三角形脈沖串的頻譜存在低通濾波器的特征,可以以Z變換的全極點形式表示:(2.2)上式中的c是常數,。單位脈沖串與幅值因子表示形式如下: (2.3)濁音的激勵模型可表示為:(2.4)而發清音時,聲帶比較松弛,可以用隨機白噪聲對激勵信號進行模擬。聲道模型聲道的數學模型可以分為兩種:一是將聲道看作是一個由不同截面積的聲管連起來的系統,稱之為無損聲管模型;二是把聲道看作是一個諧振腔,這個諧振腔腔體的諧振頻率就是共振峰,從這個角度描述的聲道模型就是共振峰模型。輻射模型輻射阻抗,是聲壓波與速度波兩者之間的反比,可以用來顯示口唇的輻射效應[9]。假如口唇的開口面積大小遠遠低于頭部外表的面積之和,那么就可以通過單板開槽輻射的處理方式來推導出輻射阻抗:(2.5)式子當中,,。輻射引起的能量損耗正比于輻射阻抗的實部,輻射模型可以設置用一個高通濾波器表示,如:(2.6)式中r接近1。在工程應用中處理信號的時候,通常采用該預加重技術。要想得到原信號,可以先對信號進行采樣,在采樣結束之后插入一個一階的高通濾波器,最后進行“去加重”。綜上,一個完整的語音信號的產生模型由三個子模型串聯而成,其傳遞函數為:(2.7)2.2語音基音周期人的發音有三種激勵方式,因而能夠形成清音、濁音和爆破音三種類型的聲音。當聲道中某個地方的橫截面面積很小,氣流飛快地流經此處形成湍流,當氣流的速度與截面積的比值大于某個設定的門限值便會發出清音。如果聲道中某個地方完全閉合,在這瞬間釋放產生的聲音就是爆破音。當氣流流經聲門時,聲帶產生振動,能形成一股準周期的脈沖串氣流,通過激勵聲道產生的語音就是濁音。這種聲帶振動的頻率又被稱為基頻,而基頻的倒數又稱為基音周期,基音周期的大小一般與聲帶的厚薄程度以及松緊程度等因素有關,除此之外,說話者是男是女也會對它的大小造成影響[10]。基音周期,它的提取問題一直是人們研究的問題,在語音信號處理中占有著重要的地位,基音檢測的主要困難表現在:(1)基音周期檢測會受到聲道的影響,一般不能直接從中提出只跟聲帶振動相關的聲源信息;(2)位于清音和濁音之間的過渡幀是否具有周期性;(3)聲道共振峰結構、噪聲等一些因素會對波形的峰值造成影響,所以不能輕易判斷出每個基音周期的起始位置和終止位置;(4)一般男性說話的基音頻率比較低,而女性和小孩說話的基音頻率相對較高,基音頻率之間的差距會使得基音周期檢測有一定的難度[11];(5)在工程應用中,會受到噪聲環境的影響。2.3基音周期檢測的經典方法2.3.1平均幅度差函數法傳統的平均幅度差函數(AMDF)定義為:(2.8)式中R是信號x(n)的平均值。平均幅度差函數算法和短時自相關函數類似,對于具有周期特性的濁音信號來說,相應的也會具有一定的周期特性,并且周期等于濁音信號的周期。和自相關法不同的是,在周期的整數倍點上具有谷值特征。通過能夠計算出濁音信號的基音周期,但是清音信號沒有周期,所以也不會有有周期[12]。除此之外還能夠通過這種特性對自然語音段進行清濁音判決,找出語音中的濁音段,然后對濁音段的基音周期進行基音檢測。通過實驗對比得出,平均幅度差函數法計算比短時自相關法簡單,計算錯判率小。基于平均幅度差函數的基音周期檢測算法框圖如圖2所示:圖2平均幅度差函數算法框圖2.3.2倒譜法語音信號,是卷積信號,初始序列的復倒頻譜,其定義可表示為[13]:(2.9)倒譜或稱“倒頻譜”的定義為:(2.10)通過對信號的短時譜取對數,然后再IDFT得到語音信號的倒譜,根據信號的倒頻譜特征可以檢測出基音信息。這種基音周期檢測法,往往能取到比較成功的結果,但是由于引進了對數運算,所以該算法在進行具體數字實現時會有一定的難度,計算量較大。在信號沒有加噪時,該算法進行基音周期檢測的準確性很高,然而當語音信號存在加性噪聲時,它的性能就會減弱,提取效果也會受到一定的影響,這是因為噪聲會把含噪語音的對數功率譜的低電平部分填滿,使得基音峰值點的周期性無法顯示[14]。算法框圖如圖3所示:圖3倒譜法框圖2.3.3自相關法一般在時域中可以用相關函數對兩個信號的相似程度進行測定,相關函數可以分為兩種:一種是自相關函數,一種是互相關函數,自相關函數能夠用來檢測語音信號之間的時域相關性。離散語音信號的自相關函數可以表示為下式:(2.11)如果信號是周期地或者是隨機的,則可以用自相關函數將信號表示成:(2.12)自相關函數的性質有:如果信號是周期的,那么它的自相關函數也是周期的,且該自相關函數的周期等于信號的周期[15]。周期信號的自相關函數在抽樣為0,,,……的時候都能夠取到最大值。自相關函數是偶函數,圖像關于y軸對稱,=。結合上述性質,利用自相關函數可以提取周期信號的周期。因為清音信號沒有周期性,所以它的自相關函數也沒有周期性,k值越大,幅度越小;而濁音信號是周期的,所以它的自相關函數也是周期的,周期等于信號周期,且濁音信號的會在基音周期的倍數點上有峰值出現。因此可以檢測信號的自相關函數是否有峰值對語音進行清濁音判決,并且由第一個峰值點的位置可以求出基音周期。算法框圖如圖4所示[16]。圖4自相關函數算法框圖第3章基于提升算法的語音基音周期檢測3基于提升算法的語音基音周期檢測3.1小波變換的基本理論3.1.1小波變換的概念傅里葉分析,是一種常用的信號頻域分析方法,它使用的是一種全局的變換技術,所以僅用傅里葉變換,不能準確描述信號的時頻局域化特性。但是時頻局部化性質對非平穩信號來說非常重要,所以傅里葉分析在處理非平穩信號時就會顯得心有余而力不足。隨著科技的發展,研究人員又在傅里葉變換的基礎之上,提出了很多處理信號的方法,小波變換法由此誕生。在對信號進行處理的時候,特別是非平穩信號,它在每個時刻的頻域特征都不容忽視。小波變換法,一種嶄新的變換分析方法,與傅里葉變換不同的是,它能夠將時域和頻域兩者有機地結合起來,處理很多傅里葉變換解決不了的問題。其基本思想是通過變換的方式著重強調有些問題的具體特征,通過伸縮、平移等一些基礎的運算功能來對信號進行多分辨率分析,最后實現高頻部分的時間細分與低頻部分的頻率細分,不放過信號的任意細節處理,稱為繼傅里葉變換在科學方法上的又一重大突破,展示了一種對信號進行分析的新途徑。小波變換的定義為:(3.1)其逆變換為:(3.2)其中:(3.3)式中:為傅里葉變換,取有限值,a為縮放因子,b為平移因子。1.連續小波變換將任意空間中的函數在小波基下做出展開,一般把這種展開稱為函數的連續小波變換,用以下的等式來定義:(3.4)通過上面提到的連續小波變換的定義,能夠發現小波變換與傅里葉變換兩者之間的共同點就是它們都是一種積分變換,但兩者之間還存在很多不同點。若是采用的小波滿足“平方可積”條件,則連續小波變換存在逆變換,逆變換公式為:(3.5)式中,為對提出的“平方可積”條件。連續小波變換的主要性質如下:(1)線性。(3.6)則(3.7)(2)時移共變性(3.8)(3)時標定理(3.9)(4)微分運算(3.10)2.離散小波變換離散小波變換的定義如下:(3.11)信號的離散小波變換的系數為:(3.12)離散小波變換的重構公式可以用下式表示:(3.13)式(3.14)中的是一個常數,不會受到原始信號的影響,與原始信號無關。3.1.2利用小波變換進行基音周期檢測的原理小波變換的主要特性如下:線性時移不變性;信號不連續性在小波變換不同分辨率下的傳遞性。因為聲門閉合的瞬間會在語音信號中以突變的形式存在,類似于圖像處理領域的邊緣檢測,Mallat等人指出,對多尺度的邊緣檢測在小波域中就是尋找局部極大值。Kadambe等人就是利用上述相關理論,并在這些理論的基礎之上提出一種基于小波變換的基音周期檢測法[17]。由小波變換知,假設為光滑函數,和定義如下:(3.14)記,則對一個實函數,在尺度S處有以下小波變換:(3.15)(3.16)由此得出,,分別能夠與實函數經變換后得到的函數的一階導數和二階導數成正比,而函數一階導數絕對值的最大值對應的就是突變點,所以幅值局部極大值點就是函數的突變點[18]。假設將光滑函數的一階導數作為小波函數,那么可以用小波變換的模極大值來對信號的突變點進行檢測,即如果在處存在尖銳的變化,那么該小波變換系數在時就會以極大值的方式呈現。人在發音時,聲門閉合,氣流陡然增加,在語音波形圖上表示為一個顯著的跳變,相鄰聲門閉合的時間間隔就是瞬態基音周期,對多個瞬態基音周期求平均值可以得出語音信號的基音周期,流程圖如下圖所示[19]。圖5小波變換法框圖3.1.3小波基的選取在實際應用中,不同的小波函數性質也會大不相同,在解決同一個問題時,使用不同的小波基函數可能會得到不同的檢測結果,所以小波基函數的選取非常重要,一般會按照自相似的原則來選取合適的小波基函數。在做實驗時,通常需要提前了解各個小波函數及其性質,最后憑借小波分析信號的實際結果與理論之間的誤差選取合適的小波基函數。常用的小波函數及性質如下:Haar小波,如圖6所示,該小波是在20世紀初Haar利用平移思想構造出來的首個規范正交的小波基函數,它是支撐域在范圍的單個矩形波,消失矩數為1,計算量很小,是最簡單的正交小波函數。Haar函數的定義為:(3.17)但是Haar小波在時域上具有非連續性,所以一般作為基本小波使用時,性能方面不是很好,但是它也有一些優點,比如運算非常簡單等等,大部分用于理論方面的研究。圖6haar小波Daubechies小波,簡稱為dbN小波,N是它的階數,是由InridDaubechies,一個在世界上有著重要地位的小波分析學者構造出來的小波函數,其數學表達式為:(3.18)式中,表示二項式的系數。Daubechies小波是具有緊支撐性、正交性以及雙正交性三種性質的小波,且具有良好的正則性,能夠使信號在重構過程中比較光滑,但它沒有對稱性,支撐寬度為2N-1,消失矩數為N,其中dB6小波函數圖如圖7所示。隨著階數次數的增大,消失矩越大,光滑性就越好,且頻帶的劃分效果也顯得很好,但是計算量也會相應的增加,導致時變性變差。圖7dB6小波(3)Symlets小波,一般表示為symN(N=2,3,……,8),是由小波分析學者Daubechies在db系小波函數的基礎上進行改進后構造的一種近似對稱的函數,具有緊支撐性、雙正交性等性質,其中sym6小波如下圖所示。symN小波的支撐寬度是2N-1,消失矩數也是2N-1。圖8sym6小波(4)Meyer小波,小波函數圖為圖9所示,其函數定義為:(3.19)Meyer小波的小波函數跟尺度函數都是在頻域中進行定義的,它不是緊支撐的,但它具有很快的收斂速度。Meyer小波具有正交性和雙正交性,可以進行CWT和DWT,但是不存在快速算法FWT,且局部分析能力差。圖9Meyer小波(5)MexicanHat小波,其波形圖如圖10所示,它的定義為:(3.20)它是Gauss概率密度函數的二階導數,可以進行CWT,但是不可以做DWT,而且它的形狀有點兒類似于墨西哥帽的截面,所以又叫墨西哥草帽函數。它在頻域和時域上都具備優異的局部化性質,并且滿足,多用于系統識別。圖10MexicanHat小波(6)Morlet小波,該小波圖如下圖所示,其定義函數為:(3.21)Morlet小波不存在尺度函數,也不具有正交性和雙正交性,屬于非正交分解,是一種高斯包絡下的單頻率正弦函數,不具備緊支撐性,應用領域廣泛,可以用于信號表示和分類以及特征提取。圖11Morlet小波3.1.4小波變換分解層數的確定信號在不同層次上的小波變換系數代表了信號中包含的有效信息,由于小波變換在分解尺度變大的情況下,信號部分的小波系數增大,噪聲部分的小波系數將會降低。所以通過對信號的分解層數進行增加能夠有效地區分出有用信號與噪聲信號。在具體的小波變換中,按照Mallat算法的2抽樣分解定理,即每分解一次,得到的數據就要進行2抽樣,低頻部分的數據會被送到下一級再進行分解,可選取的最大分解層數為。但結合實際情況來看,一般不會選擇很大的分解層數,雖然不會丟失有用的信息,但是隨著層數的增多,采樣點數就會減少,不利于觀察。而且隨著分解層數的增加,使得分解層數過多,對所有的各層小波空間的系數進行閾值處理都會造成信號的信息丟失比較嚴重,有用的信息會變得越來越少。從信號重構方面考慮,信號的分解次數越多,信號失真越嚴重,最終導致重構信號和原信號之間的誤差很大,得到的信號遠不如原來的信號,同時還會使得運算量大大增加,使得處理變慢。對于不同信號類型,不同信噪比下都有一個理想的分解層數,從而取得更好的效果。3.2提升算法的基本理論3.2.1提升算法的基本思想在過去的二三十年里,科研人員提出多種對小波進行構造和對小波濾波器組進行構造的方法,為實際工程應用等方面提供了許多不同的小波,如正交小波等等。這些構造辦法絕大部分是在頻域中完成的,構造過程相對繁瑣。1995年,Sweldens博士等人在一代小波變換的基礎之上提出了采用提升方法構造的第二代小波(secondgenerationwavelet)方法,這種方法不僅是一種新型的基于空間域的小波構造方法,而且還保留了傳統小波多分辨率的優良特性,主要有以下四點優勢[20-21]:提升算法構造小波時不會再依賴于傅里葉變換,在自適應構造以及結構化設計方面具有鮮明的優點;構造方法不拘泥于固有的模式,它能夠從一些相對單一的小波函數,通過提升方案對小波函數的特性進行改善,最終能夠構造出具有期望特性的小波;不依附于固定的小波函數的伸縮和平移,它適用于沒有采用等間隔采樣的小波構造;該算法更加簡單,占用內存少,能夠節約儲存空間,計算速度非常快,能夠節約一半的計算量。1998年,Sweldens等眾多學者通過研究得出,對于任意一個具有FIR濾波器的小波變換,都能夠通過一系列多步提升方法來進行解決,這一結論建立了傳統小波變換與提升算法之間的聯系[22]。從理論發展水平看,第二代小波在現階段有很多構造方法,經過國內外學者的不斷研究,提升小波開始逐步由理論應用到實際工程,在故障診斷等眾多領域得到了廣泛的應用[23]。3.2.2提升算法1.提升算法的基本原理用提升算法對小波進行構造使,能夠通過一種簡便的途徑對小波的基本理論進行闡述,并且在一代小波變換當中都能夠找到跟它相對的提升算法。提升小波算法對信號的高頻部分和低頻部分進行分離是通過預測和更新這兩個提升環節實現的,因為信號自身具有局部相關性的特性,所以可以通過相鄰的信號值,經過適當的預測算子將某一點的信號值預測出來,信號中的高頻信息稱為預測誤差,這個過程稱為預測環節[24]。預測環節之后得出的高頻信息又經過更新算子調整信號的下抽樣,得到信號的低頻信息,這個過程稱為更新環節。提升小波變換主要由正變換和逆變換構成,即可以分為分解和重構兩部分。提升算法的正變換主要有以下三個階段:
(1)分裂(Split)
分裂的目的將原始信號x(n)劃分成兩個相同長度、互相沒有交集的部分:即和。如果和之間的相關性越強,信號就會呈現出更好的分裂效果,一般常用的是惰性分裂法,惰性分裂法即按照奇偶性來對信號進行奇采樣和偶采樣,一個為奇樣本,另一個為偶樣本,使得,:(3.22)分裂的反過程就是聚合(Merge),將已知的偶樣本和奇樣本進行合并,可方便地恢復原始信號x(n)。(2)預測(Prediction)預測,就是基于原始數據相關性的基礎之上,利用奇偶序列的相關性,用子數據集來對進行預測,預測誤差如下:(3.23)其中,P(.)表示的是預測算子。在預測過程完成后,能夠計算得到信號的一半信息,用d(n)來代替。目前,多項式插值是常用的預測算子。對信號進行預測的過程也是一個可逆的過程,通常情況下只要選出一種預測算子P(.),就能夠通過和d(n)來對進行修復,最終恢復到信號x(n)。(3.24)(3)更新(Update)更新的最終目的就是為了用d(n)對原始信號x(n)進行修正,使得原始信號x(n)在經過修正后只含有低頻成分,即(3.25)其中,式(3.25)中U(.)指的是更新算子。在此階段完成后,可以通過計算得出信號的另一半,用原信號的低頻信息來對這一半進行替代,即用c(n)來代替。上文所述的三個步驟是信號的一層的提升分解,具體過程示意圖如下圖12所示。圖12提升分解結構示意圖把上面分解的過程顛倒過來,再將加法和減法兩種運算互相轉換的過程就是提升分解逆變換的過程。提升算法的逆變換過程和正變換過程類似,同樣也分為三個階段:反更新、反預測以及合并,逆過程如圖13所示。圖13提升重構結構示意圖2.提升小波分解與重構的多相位表示設、、h、g是雙正交小波濾波器組,完美重建的條件如下所示:(3.26)多相位矩陣可以定義為:(3.27)在這個階段,小波變換是由多相矩陣進行的。如果和設為1,且和兩者均為0,則為單位矩陣,小波變換稱為懶小波變換。懶小波變換除了將輸入信號分解為奇偶分量外,其他什么也不做。的定義與此類似。圖14為小波變換的多相顯示。圖14小波變換多相表示如圖所示,完全重建的條件現在由:(3.28)(3.29)假設行列式P(z)=1(3.30)提升定理表明,任何與h互補的其他有限長濾波器為:(3.31)其中,是勞倫多項式,這種形式的濾波器與h都能夠互補。如果是以多相形式寫入,那么新的多相矩陣如下所示:(3.32)同樣,可以使用提升定理來創建與互補的濾波器:(3.33)對偶多相矩陣為:(3.34)從所有給定的方程來看,可以明確得到提升算法的具體工作原理。過程是從懶小波開始的,然后兩個多相矩陣都等于單位矩陣。在對懶小波應用原始或雙重提升步驟之后,能夠得出一個全新的更為繁瑣的小波變換。換句話說,將小波變換的復雜度提升到更高,可以執行許多提升步驟來構建高度復雜的小波變換。利用歐幾里德算法,可以將任意雙帶子頻帶的FIR濾波分解為一組提升步驟。多相矩陣被分解為三角形子矩陣的級聯,其中每個子矩陣對應于提升或雙重提升步驟,圖15中濾波器組的多相矩陣被分解為三角形子矩陣(3.35)圖15左側是使用提升的正小波變換,右側是使用提升的逆小波變換3.2.3常用小波基的提升算法實現dB4小波濾波器的z變換為:(3.36)其中:(3.37)dB4小波濾波器的多相位矩陣在提升算法下的因式分解如下:(3.38)由上得出dB4小波變換的提升算法為:(3.39)其它小波基的算法構造如下表所示表1小波基提升算法構造HaarDaubechies4Daubechies6Filter(9-7)3.2.4基于提升算法的語音基音周期檢測本文采用的是基于提升算法的語音基音周期檢測,算法具體步驟如下所示:第一步:首先求出整個自然語音段波形幅值絕對值的最大值A;第二步:用平滑分析窗對語音信號進行分幀,設置幀移;第三步:對第i幀語音信號進行初步有聲無聲判斷。求出這一幀語音信號幅值絕對值的最大值,如果該值比A/15小,就判斷信號為無聲,i加1,繼續執行該步驟,否則,執行下一個步驟;第四步:計算得出語音信號第i幀的全局最大值;第五步:用提升算法對第i幀語音j尺度和j+1尺度二代小波變換系數進行計算;第六步:找到j尺度和j+1尺度二代小波變換局部極大值,且局部極大值的數值要大于全局最大值的0.6倍,如果局部極大值點的個數少于2,就會把該幀信號判斷為清音,基音周期值設置為0,繼續執行步驟八,否則,執行步驟七;第七步:比較j尺度和j+1尺度的局部極大值點。若接近或重合,則基音周期為尺度j時局部極大值之間的距離,繼續下一步。否則,將j加1,執行步驟五;第八步:將i加1,直到i為最大值。否則,執行步驟三。基于提升算法的語音基音周期檢測算法流程圖如圖16所示。圖16基于提升算法的語音基音周期檢測算法流程圖3.3本章小結本章首先簡單的介紹了小波變換的基本概念和相關性質,之后講述了如何通過小波變換來實現語音基音周期檢測,而在小波變換中,小波基的選擇也是一個關鍵步驟,所以接著又介紹了多種小波基的性質以及小波變換分解層數的確定;在3.2節里主要講述了提升算法的相關理論,包括提升算法的提出、基本原理,以及一些常用小波基的提升算法實現。第4章算法仿真及結果分析4算法仿真及結果分析4.1MATLAB仿真平臺介紹MATLAB仿真軟件,是一款強大的應用于商業的數學軟件,是由上個世紀美國MathWorks公司推出的一款軟件。該軟件主要應用于數據分析、工程計算等領域,應用范圍覆蓋率非常廣。MATLAB由matrix&laboratory單詞拼湊而成,代表著矩陣實驗室,軟件自身主要負責面對數值計算以及可視化程序設計等之類的高科技工作環境。該軟件以矩陣運算作為基礎,計算效率遠遠高于c和c++,把相當多的功能融合到一個簡單易學、易于操作的視窗環境中。而且MATLAB仿真軟件內部擁有功能豐富的應用工具箱以及函數庫,降低了對用戶的數學基礎和計算機語言知識的要求,通過封裝大量的函數,使得用戶在進行復雜的數學運算時可以直接調用,只需要去關注模型建立的工作,而無需研究思考一些復雜繁碎的程序設計過程,進而使得用戶在工作方面的效率得到一個大幅度的提升。經過不斷的更新,MATLAB的功能也變得越來越強大,為用戶提供豐富的資源,涵蓋多種領域的研究,為社會上不同行業的科技工作者提供了極大的便利。現如今,與mathematica、maple并稱為三大數學軟件。4.2算法仿真與結果分析4.2.1純凈信號的基音周期檢測仿真與分析實驗處理的原始語音樣本是在安靜環境下錄制的元音“a”的wav音頻文件,該信號的采樣頻率是44.1kHz,每個樣點是用16bit量化,單聲道。選取該語音信號,波形如圖17所示。圖17元音“a”的原始信號波形本文分別采用兩種方法來檢測該純凈信號的基音周期:一是自相關函數法,如下圖所示,由于語音具有短時平穩的特性,通過對原始語音信號進行加窗(窗長為512的矩形窗),選取一幀語音信號,結果如圖18所示,計算其短時自相關函數,結果如圖19所示,由圖19可以看出自相關函數波形在時延為基音周期的倍數上存在極大值,根據圖中的極大值位置可以計算得出該純凈信號的基音周期值為4.1723ms。圖18一幀語音信號波形圖圖19一幀語音信號的自相關函數圖二是dB4提升小波法,通過dB4小波對該語音信號依次進行三層分解,如圖20所示,選取二層分解后得到的波形計算出局部極大值點,局部極大值點的位置對應著聲門閉合的瞬時,通過相鄰的兩個極大值之間的距離能夠求出該信號的語音基音周期,基音周期為4.1723ms。圖20dB4提升小波顯然,對于純凈的語音信號,兩種算法都能夠準確提取出該信號的語音基音周期。自相關算法比較簡單,是求基音周期的經典方法,而提升算法構造方法靈活,計算速度快,便于硬件實現。4.2.2不同小波基的檢測效果比較因為不同的小波函數之間存在著大不相同的性質,在對問題進行分析時,可以使用不同的小波基函數來分析同一個問題,并且得到的檢測結果可能也會有所區別,所以本文研究使用幾種不同的小波基的提升算法來對該語音信號進行基音周期檢測。圖21Haar提升小波圖22dB6提升小波圖22filter(9-7)提升小波上述三個圖是分別用Haar小波和dB6小波以及filter(9-7)小波三種小波基來對原始語音信號進行三層分解后所構成的波形圖,通過實驗可以求出波形的局部極大值的位置,進而計算出基音周期為4.1723ms。實驗結果表明,這三種小波基在沒有受到外界噪聲干擾的情況下,都能準確地進行基音周期檢測。由于噪聲環境會對語音基音周期檢測增加一定的難度,所以本文研究在不同信噪比之下常用小波基的抗噪聲性能,如表2所示:表2不同小波基在不同信噪比下檢測基音周期的性能比較10dB5dB0dB-5dB-10dBHaar小波4.1723ms4.1723ms4.1723ms3.4467ms-dB4小波4.1723ms4.1723ms4.1723ms4.0816ms-dB6小波4.1723ms4.1723ms4.1723ms4.1723ms3.0839msfilter(9-7)4.1723ms4.1723ms4.1723ms3.8095ms-實驗結果表明,dB6小波函數的抗噪聲性能最好,在信噪比為-10dB的情況下也能提取出語音基音周期,提取出來的值為3.0839ms,誤差為1.0884ms,其它小波在噪聲信噪比設置為-10dB無法提取出語音基音周期,所以在噪聲環境下選取合適的小波基函數來實現基音周期檢測也顯得至關重要,它能夠影響基音周期檢測的準確性。4.2.3算法抗噪性能分析語音是人與人之間交流信息和傳遞信息的一個重要手段,在進行基音周期檢測時往往會受到外界噪聲環境的干擾,因此探討算法在進行基音周期檢測時的抗噪聲性能已經成為了一個重要的研究方向。為了研究算法的抗噪聲性能,本文利用三種算法仿真了不同信噪比下的語音信號基音周期檢測結果。1.自相關法圖23自相關法的檢測結果(snr=10)圖24自相關法的檢測結果(snr=5)圖25自相關法的檢測結果(snr=0)圖23-25三幅圖是對純凈語音信號加噪,信噪比分別設置為10dB、5dB以及0dB,利用自相關法對該加噪后的語音信號進行基音周期檢測,實驗結果表明信噪比大于等于5dB的時候,自相關法能夠準確提取出語音基音周期,當信噪比小于等于0dB的情況下,自相關函數的波形呈現不出周期性,自相關法檢測不出語音基音周期。2.提升小波算法該仿真實驗中選用最簡單的harr小波。圖26haar提升小波法的檢測結果(snr=10)圖27haar提升小波法的檢測結果(snr=5)圖28haar提升小波法的檢測結果(snr=0)圖29haar提升小波法的檢測結果(snr=-5)圖26-29是對純凈語音信號加噪,信噪比分別設置為10dB、5dB、0dB以及-5dB,利用haar提升小波來對該加噪后的語音信號進行三層分解后進行基音周期檢測,通過三個局部極大值點的位置可以計算得出該信號的基音周期。實驗結果表明當信噪比大于等于-5dB的時候,該算法能夠準確提取出語音基音周期,當信噪比小于等于-10dB的時候,該提升小波算法提取不出基音周期。3.提升小波和自相關相結合法雖然提升算法確實在很多方面性能優于一些經典的基音周期檢測算法(如平均幅度差函數法、自相關法),但是因為語音信號自身的復雜性,能夠準確地對語音基音周期進行檢測的難度就顯得非常大,所以本文又仿真分析了將自相關法和提升算法相結合的方法來實現語音基音周期檢測。圖30提升小波和自相關相結合法的檢測結果(snr=10)圖31提升小波和自相關相結合法的檢測結果(snr=5)圖32提升小波和自相關相結合法的檢測結果(snr=0)圖33提升小波和自相關相結合法的檢測結果(snr=-5)圖34提升小波和自相關相結合法的檢測結果(snr=-10)圖30-34是提升算法和自相關算法兩者相結合的語音基音周期檢測算法,依次為信噪比設置為10dB、5dB、0dB、-5dB以及-10dB,通過haar提升小波對加噪后的語音信號進行三層分解并對該分解的信號求自相關。實驗結果表明,在低信噪比的情況下,該算法能夠較為準確地進行語音基音周期檢測。表3不同方法檢測基音周期的抗噪聲性能比較10dB5dB0dB-5dB-10dB自相關法4.1723ms4.1723msHaar小波4.1723ms4.1723ms4.1723ms3.4467ms-提升小波-自相關4.1723ms4.1723ms4.1723ms4.1723ms-本文通過對純凈語音信號“a”進行加噪來研究不同算法的抗噪聲性能,仿真實驗中加的噪聲是高斯噪聲,再用自相關函數法,提升算法以及將提升算法和自相關算法兩者結合起來使用的方法來對SNR=10dB,SNR=5dB,SNR=0dB等不同信噪比下的語音信號進行語音基音周期的檢測,結果圖23-34以及表2所示。通過表2可以發現當對語音信號進行加噪后,將信噪比設置為10dB和5dB的時候,三種方法都能夠比較準確地提取出語音信號的基音周期。而信噪比設置為0dB后,自相關函數法無法提取出該語音信號的基音周期,而提升算法和提升小波-自相關法都可以在SNR=0dB的情況下準確提取出語音基音周期,相比于自相關函數法,后兩者抗噪聲性能更好。通過表3中的實驗結果還可以看出將提升算法和自相關函數法兩者相結合的方法在抗噪聲性能方面也具有明顯的優勢,能夠在低信噪比的情況下準確地進行語音基音周期檢測,并且性能優于提升算法。4.2.4自然語音段的基音周期檢測由于純凈的濁音信號具有較好的周期性,波形也比較穩定,不能代表實際語音的不斷變化和波形的起伏,因此本文4.2.4節是對自然語音段進行基音周期檢測,實驗所要處理的語音樣本是在安靜環境下錄制的一個詞語“開始”的wav音頻文件,該信號的采樣頻率是44.1kHz,每個樣點是用16bit量化。原始信號的波形圖如圖34所示。圖34自然語音段波形示意圖圖35dB6提升小波法圖35是用提升小波對該自然段語音信號“開始”進行的基音周期檢測圖,選取的小波基函數為dB6小波,幀長為512個采樣點,幀移為256個采樣點,通過實驗可以得出該自然語音段的基音周期檢測圖,該信號基音周期較為平穩,檢測的結果比較理想。第5章總結與展望5總結與展望語音信號處理技術的研究工作最早可以上溯到19世紀70年代,并且在上個世紀得到了長足的發展,現如今,隨著21世紀的到來,社會逐漸步入了高速發展、科技化的階段,語音技術應用的范圍領域越來越廣泛,語音信號最基本的研究方向就是基音周期,所以能夠準確地進行語音基音周期檢測也顯得非常重要[25-26]。本文針對如何進行語音基音周期檢測簡單地介紹了三種常用的經典的方法,分別是平均幅度差函數法、倒譜法以及自相關函數法,主要研究了基于提升算法的語音基音周期檢測。最后對自相關算法和提升算法兩種方法做了一些仿真實驗并對實驗結果進行了分析。具體工作內容主要包括以下幾個方面:首先,通過兩種算法來檢測純凈的語音信號的基音周期:一個是經典法,即自相關函數法,一個是提升算法。然后將兩種算法做一個比較來對它們的優缺點進行分析。實驗表明自相關函數法和提升算法這兩種算法都能夠較為準確地實現語音基音周期檢測,而提升算法構造方法比較靈活,計算速度相當快。其次,通過對純凈的語音信號進行加噪,分別研究三種算法在不同信噪比之下能否提取出語音基音周期以及它們的抗噪聲性能如何。實驗驗證,經典的基音周期提取算法自相關函數法在信噪比比較高的情況下能夠獲得令人滿意的提取效果,但是當在低信噪比的情況下,它的基音周期提取效果就會大打折扣,甚至于提取不出來,而提升算法-自相關法抗噪聲性能優于提升算法,而提升算法的抗噪聲性能又明顯優于自相關算法。最后,錄制一段自然語音段,對語音段求出基音周期。基音周期的檢測一直是重點研究問題,隨著科技的進步,對基音檢測的技術要求也變得越來越高。本文只是涉及了整個大的課題中的冰山一角,除此之外還存在著很多問題和內容等著去研究,還有很多工作需要進一步改進和完善,比如說人在不同情感下的語音基音周期的檢測結果是否相同等等。但是提升算法相對于一些經典算法來說,不管是在運算的效率方面還是抗噪聲方面,都有著良好的性能,可以預想在不久之后,提升算法在語音基音周期檢測方面會越來越受關注和研究。參考文獻參考文獻[1]劉維巍.語音信號基音周期檢測算法研究[D].哈爾濱:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年安徽醫科大學附屬宿州醫院博士碩士研究生招聘筆試真題
- 額葉與認知訓練效果-全面剖析
- 綠色融資與可持續發展-全面剖析
- 鋼鐵行業綠色發展-第1篇-全面剖析
- 一年級數學計算題專項練習集錦
- 2025至2030中國瓷磚行業盈利模式與競爭趨勢研究報告
- 小學班主任課外活動安排計劃
- 電商運營培訓課程心得體會
- 苗木種植前期準備及保障措施
- 裝配式建筑施工質量標準化措施
- 2025年證券從業資格證考試題庫試題及答案
- 管道工程安全管理與保障措施考核試卷
- 豬場出售合同協議
- 電瓶車充電安全培訓講義
- 雨季行車安全教育
- 2024-2025學年人教版八年級地理下學期全冊教案
- 樓梯 欄桿 欄板(一)22J403-1
- 微觀經濟學(山東大學)知到智慧樹章節測試課后答案2024年秋山東大學
- 15D502 等電位聯結安裝
- 新版冀教版科學四年級下冊全冊教案(雙面打印)
- MSAGRR數據自動生成工具(已經解密)
評論
0/150
提交評論