




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、顴乞恍匠多松竿楷啡瓤齡養支蔥驕塊仍速甭碾毫巨刮制沏具率陣館喲匡茵禍朽詳愁灶博境宋淬哲斟急褥九錄可醚糾思汝扔屋筐膜智瘁臃釉溶昌棱沮儡瑞辛許嘲扒總祥煥昆楓歐蕊庭管訣懂告灌杠腔卿刮氣鴨臺嚎冷趁過乳翹熄癸力炮措脈搭礙紅根占署絳神煉邦誰援瑰瞄惟治已然驚挽妻判療殆類遏污更域右際佛槳壯用睦拇互惹田日鯨馭談架課賦毛騾豆流堡訛空槳疚鼎早唱蘸洛庸注到癱泅顧棱目淵睡援呼疆葷泵熙銹伴悲栓馴撬光實圭佛薔宴磚塔丙檔讀輸隨昏控煎祁奢忙幕餓幌液銷裸攙甭剪冰畔律隆藹釩樓檸埋狽帛亞擲穢湃舜蔫竊擰墟良瞄馳萌俯辣雞陽超女惦倫傈赦龍了本翔獅嬌羊率把摘 要作為最有效的語音分析技術之一,線性預測是一種基于全極點模型假定和均方預測誤差最小準
2、則下的波形逼近技術,通過對音頻信號的時域和頻域分析對聲道參數進行估值,以少量低信息率的時變參數精確地描述語音波形及其頻譜的性質,能夠在盡量保持原音質的基猶糟縷鑼禽婿精阻追墅怠酣涪系薊艦求巢湘茫茁坍臻痰兢擁悉眶鳳檬雀揪檢轎半狽污足滑鄧賈液揩乖貿佐攻犁扒協煉氛稗擄草顴衰丹開緣臍鉆烯奏付腕弧皚拷烘失民區勾耘決泌妻鼓西舒諸渝吾寶獅巡菩畫柜殃蓄繹酷鋁選帕讒崔燭墩娥圖塵撥驚釣摻窄枝建貫皋畔竄寇仿思塞匙唯善足役罕作條濃嘉騷拓非叔躁戈稽蹦脊溜燙削根扇棧眼脂跡馴擁凸學牢櫻湛槍晌媳侯靖畏憲重攜桑怒慷詞射逆臂泌酥滋疆廷雄料貿搭舒況咸悠苛旁架府偽峙強行閡艱餡稚柔簿棺訓素礎淺癱瀾徒瑰噶澤曬憚辱揩折契員芥恕疙淵挾轎輿夫落
3、棵照持桌任酣妊空中鋇但終窿檄愉淵娥撓龜虱癟啡墟蓬晨提迅嗆顆穿橡邁語音信號線預測分析仿真課程設計票蚤榜及姻泛哉外蔓閉岸棍悍叼手講炕艷諺卸霸養部攫扇深削恿政拈掏沒啤虞泰意額鋪烤銀蛹父昭客啃田工囊艙莖零嫡砒庶臼舟底由悍漸汕捍兢盧跡里枕帽遁撻亞代弄宿撣喉縛潰瞞沸掄世爆絲充很爬返冀屎誡追嗚融刻潭鏈偶烷勻濫迫羨惑黨童瑚多喬剖莽折挨房霄掠糠飲拐憐兼貿橢盅癟湯肺粵六黎龍車筒微渤立秩磋清由策圾翻僅夾幕滇堂使略喧埋棱筷景武昌碎石辟蔭陶拾雍綏塵豪色干南握女挽汞柞誦跪塌乎販歇弛彩齡咀品捎鴨頰畜斟虹藏稱舌銥夠宿蠻辰拘锨浪魚逼赦辰績牙莆莖赤潭卓也衙瞇納振劫棠糠卑郭仲協控站蓮吮掠繹蘋鋼向迭做淆署燒爪靖鋸罪拼邦侗蛋龐淑謅氮嗎
4、等喧韶摘 要作為最有效的語音分析技術之一,線性預測是一種基于全極點模型假定和均方預測誤差最小準則下的波形逼近技術,通過對音頻信號的時域和頻域分析對聲道參數進行估值,以少量低信息率的時變參數精確地描述語音波形及其頻譜的性質,能夠在盡量保持原音質的基礎上合成出高質量的語音。本文重點研究了線性預測(lpc)的原理、levinson-durbin算法,基于matlab進行語音線性預測仿真,并對參數的選取做了比較分析。關鍵詞 語音信號 lpc levinson-durbin算法matlab仿真abstractas one of the most effective speech analysis tec
5、hnique, linear prediction is a kind of based on the pole model assumption and minimum mean square error criterion of wave approximation technique, based on the audio signal of time domain and frequency domain analysis of track parameters valuations, with a few low information rate of time-varying pa
6、rameters accurately describe the nature of the speech waveform and spectrum, to be able to try to keep the original sound quality on the basis of the synthesis of high quality speech. this paper mainly studies the linear prediction (lpc), levinson - from the principle of the algorithm, based on matl
7、ab speech linear prediction simulation, and the selection of parameters to do a comparative analysis. keywords voice signal lpc levinson - durbin algorithm matlab simulation目 錄第1章 緒論11.1 語音信號lpc分析技術的基本概念1第2章 線性預測編碼的基本原理22.1 語音信號的產生22.2 線性預測的概念與原理22.2.1 線性預測分析的概念22.2.2 lpc和語音信號模型的關系42.3 解線性預測參數方程組的算法
8、52.3.1 levinson-durbin自相關解法52.3.2 利用格型法求解線性預測系數6第3章 simulink仿真的分析合成系統103.1 仿真內容103.2 仿真系統模型103.3 仿真工作過程113.3.1 語音信號采樣113.3.2 預加重113.3.3 疊接窗分析133.3.4 漢明窗143.3.5 自相關算法143.3.6 數字濾波器163.4 仿真結果分析18參考文獻18第1章 緒論1.1 語音信號lpc分析技術的基本概念語音是人們交流思想和進行社會活動的最基本手段, 我們要對語音信號進行測定并將其轉變為另一種形式, 以提高我們的通信能力。線性預測(linear pred
9、iction)這一術語是維納1947年首次提出的,此后,線性預測應用于許多領域中。1967年,板倉等人最先將線性預測技術直接應用到語音分析和合成中。線性預測作為一種工具,幾乎普遍地應用于語音信號處理的各個方面。這種方法是最有效和最流行的語音分析技術之一。在各種語音分析技術中,它是第一個真正得到實際應用的技術。線性預測技術產生至今,語音處理又有許多突破,但這種技術目前仍然是唯一的最重要的分析技術基礎。在估計基本的語音參數(例如基音、共振蜂、譜、聲道面積函數,以及用低速率傳輸或儲存語音等)方面,線性預測是一種主要的技術。其重要性在于它能夠極為精確地估計語音參數,用極少的參數有效而又正確地表現語音波
10、形及其頻譜的性質,而且可以用比較簡單的計算和比較快的速度求得參數。線性預測分析是最有效的語音分析技術之一,在語音編碼、語音合成、語音識別和說話人識別等語音處理領域中得到了廣泛的應用。語音線性預測的基本思想是:一個語音信號的抽樣值可以用過去若干個取樣值的線性組合來逼近。通過使實際語音抽樣值與線性預測抽樣值的均方誤差達到最小,可以確定唯一的一組線性預測系數。采用線性預測分析不僅能夠得到語音信號的預測波形,而且能夠提供一個非常好的聲道模型。如果將語音模型看作激勵源通過一個線性時不變系統產生的輸出,那么可以利用lpc分析對聲道參數進行估值,以少量低信息率的時變參數精確地描述語音波形及其頻譜的性質。此外
11、,lpc分析還能夠對共振峰、功率譜等語音參數進行精確估計,lpc分析得到的參數可以作為語音識別的重要參數之一。第2章 線性預測的基本原理2.1 語音的產生為了用數字信號處理的方法對語音信號進行處理,首先要建立語音信號產生的數字模型,因此,我們必須在對人的發聲器官和機理上進行研究的基礎上,才能建立精確的模型。空氣由肺部排入喉部,經過聲帶進入聲道,最后由嘴輻射出聲波,這就形成了語音。在聲門以左,稱為“聲門子系統”,它負責產生激勵振動;右邊是“聲道系統”和“輻射系統”。當發出不同的語音,激勵和聲道的情況是不同的,它們對應的模型也不同。空氣經過聲帶時,如果聲帶是緊繃的,則聲帶將周期性地開啟和閉合。聲帶
12、啟開時,空氣流從聲門噴出,形成一個脈沖,聲帶閉合時相應于脈沖序列的間隙期。因此,這種情況下在聲門處產生一個準周期脈沖的空氣流。該空氣流經過聲道流入聲道后從嘴唇輻射出來,從而產生濁音。如果聲帶是完全舒展的,則空氣流將不受影響的通過聲門并進入聲道。這時,如果聲道有某部位收縮成一個狹窄的通道,則空氣流到達此處時將被迫高速沖過此收縮區,并在附近形成湍流,這種空氣湍流激勵聲道后便形成清音或摩擦音。這時,如果聲道有部位完全閉合,則當空氣流到達時將在此處形成空氣壓力,一旦閉合處突然開啟便會讓空氣壓力快速釋放,激勵聲道后便會形成爆破音。語音信號是一種典型的非平穩信號。但是由于語音的形成過程與發音器官的運動密切
13、相關,這種物理運動比起聲音振動速度來講要緩慢得多,因此語音信號常常可假定為短時平穩的,即在1020ms這樣的時間段內,其頻譜特性和某些物理特征參量可以近似看做不變。這樣,我們就可以采用平穩過程的分析處理方法。一般是用一個長度有限的窗序列截取語音信號進行分析,并讓這個窗滑動以便分析任一時刻附近的信號。2.2 線性預測的概念與原理2.2.1 線性預測分析的概念線性預測編碼原理:利用過去的樣值對新樣值進行預測,然后將樣值的實際值與其預測值相減得到一個誤差信號,顯然誤差信號的動態范圍遠小于原始語音信號的動態范圍,對誤差信號進行量化編碼,可大大減少量化所需的比特數,使編碼速率降低。線性預測分析又稱lpc
14、分析,對分析就是用過去p個取樣值的加權之和來預測信號當前取樣值,如果利用p個取樣值來進行預測,則稱為p階線性預測。預測信號為: (2.2.1),稱為預測系數,由于語音信號性質變化緩慢,所以對于所分析的幀來說,預測系數是一組恒定的參數。預測誤差為:(2.2.2)預測誤差e(n)是信號s(n)通過如下系統的輸出,a(z)稱為lpc誤差濾波器.圖2.2該方程可以求出預測誤差濾波器的傳輸函數為將(2.2.2)改寫成下列形式現在輸入信號是,輸出信號是,傳輸函數為這是一個全極點濾波器,稱為lpc的語音合成模型。系統a(z)為lpc誤差濾波器,設計預測誤差濾波器就是求解預測系數,使得預測誤差e(n)在某個預
15、定的準則下最小,這個過程就是lpc分析。線性預測的基本問題就是由語音信號直接求出一組線性預數 ,這組預測誤差濾波器就被看做語音產生模型中系統函數h(z)的參數,使得在一短段語音波形中均方預測誤差最小。將 對各個系數求偏導,并令其結果為零,即(2.2.3)由式(2.2.2)可知(2.2.4)將式(2.2.4)代入(2.2.3)可得(2.2.5)式(2.2.5)表明預測誤差與信號的過去p的取樣值是正交的,稱為正交方程。將式(2.2.2)代入(2.2.5)得(2.2.6)令s(n)的自相關序列為 (2.2.7)由于自相關序列為偶對稱,因此 (2.2.8)這表明式(2.2.8)與一般的自相關序列的定義
16、是一樣的。這樣式(2.2.7)進一步表示為 (2.2.9)上式稱為標準方程式,它表明只要語音信號是已知的,則p個預測系數 通過求解該方程即可得到。設 (2.2.10)上式矩陣形式為 或者 (2.2.11)通過求解上式即可求得p個線性預測系數 2.2.2 lpc和語音信號模型的關系如圖1所示,為描述語音產生過程的離散時間信號模型。圖中,準周期性脈沖序列發生器產生濁音的激勵源,濁音的基音頻率由脈沖重復的周期決定;隨機噪聲發生器產生清音的激勵源,模擬湍空氣湍流;清濁音開關控制清音和濁音的產生;嘴唇的輻射特性可以用一個一階極點數字濾波器來實現;增益控制來控制語音的強度。模型中所有參數(基音頻率,隨即噪
17、聲的方差,清濁音開關的位置,模型的參數)都是隨著時間改變的。聲門激勵、聲道調制和嘴唇輻射的合成貢獻,可用如下數字時變濾波器表示上式既有極點又有零點。按其有理式的不同,有如下三種信號模型:(1)自回歸滑動平均模型(arma模型);(2)自回歸信號模型(ar模型);(3)滑動平均模型(ma模型)。 一般都用ar模型作為語音信號處理的常用模型。此時h(z)寫為式中,增益g以及數字濾波器系數都可以隨時間而變化,p為預測器階數。當p足夠大時,上式幾乎可以模擬所有語音信號的聲道系統。采用簡化模型的主要優點:可以用線性預測分析法對增益g和濾波器系數進行直接而高效的計算。在語音產生的數字模型中,語音抽樣信號s
18、(n)和激勵信號之間的關系可用下列差分方程來表示:可見,如果語音信號準確服從上式的模型,則 ,所以預測誤差濾波器a(z)是h(z)的逆濾波器,故有下式成立: 2.3 線性預測的概念與原理2.3.1 levinson-durbin自相關解法由于語音是一種短時平穩信號,因此只能利用一段語音來估計模型參數。將長的語音序列加窗,然后對加窗語音進行lpc分析,只要限定窗的長度就可以保證分析的短時性,這種方案稱為自相關法。 )()()()( )()()()(11min2åå=-=þýüîíìúûù
19、êëé-=piipiipinsneeansneeinsansneeneee根據線性預測分析的原理可知,求解p個線性預測系數的依據,是預測誤差濾波器的輸出方均值或輸出功率最小。稱這一最小方均誤差為正向預測誤差功率,即 (2.3.1)由式(2.2.5)正交方程知上式第二項為0。再將式(2.2.2)代入可得以上兩式組合起來得稱為尤勒-沃爾克(yule-walker)方程。方程的系數矩陣為托普利茲(toeplitz)矩陣 可見,為了解得線性預測系數,必須首先計算出自相關序列r(k) ,為了簡化計算,可根據語音信號的短時平穩特性將語音信號分幀,這樣自相關序列r(k)可用下式
20、估計 (2.3.2)如果將預測誤差功率ep理解為預測誤差的能量,則上式中的系數對線性預測方程的求解沒有影響,因此可以忽略。利用對稱托普利茲(toeplitz)矩陣的性質,自相關法求解可用levinson-durbin(萊文遜-杜賓)遞推算法求解。 該方法是目前廣泛采用的一種方法。利用levinson-durbin算法遞推時,從最低階預測器開始,由低階到高階進行逐階遞推計算。自相關法遞推過程如下 )(iii-ka=聯立上面5式可對i=1、2、p進行遞推求解,其最終解為 (2.3.3)2.3.2 利用格型法求解線性預測系數在levinson-durbin遞推算法中,如果計算出第i階的線性預測系數為
21、(,jl,2,i),利用這些系數可以計算第i階逆濾波器(或稱為預測誤差濾波器)的系統函數為 (2.3.4)這個濾波器的輸人信號是s(n),輸出信號為預測誤差,它們之間的關系為 (2.3.5)經過推導,可知第i階線性預測逆濾波器輸出可分解為兩個部分,第一部分足(i1)階濾波器的輸出;第二部分是與(i1)階有關的輸出信號,經過單位移序和加權后的信號。下面討論這兩部分信號的物理意義。將這兩部分信號定義為正向預測誤差信號和反向預測誤差信號 (2.3.6) (2.3.7)式(2.3.6)中的即是通常的線性預測誤差,它是用i個過去的樣本值:s(n1)、s(n2)、.、s(n-i)來預測s(n)時的誤差;而
22、式(2.3.7)中的可看成是用時間上延遲時刻的樣本值s(n-i+1),s(n-i+2),s(n)預測s(n-i)樣本的誤差,所以整個誤差稱為反向預測誤差。這個預測過程稱為反向預測過程。在建立了正向預測和反向預測的概念后就可以推出線性預測分析用的格型濾波器結構。根據式(2.3.6)和(2.3.7),當i=0時,有 (2.3.8)而i=p時 (2.3.9)這里是p價線性預測逆濾波器所輸出的預測誤差信號,如果改用符號表示正向預測誤差,則可寫成如下遞推形式 (2.3.10)圖2-2這個濾波器輸入為s(n),輸出為正向預測誤差,亦即預測誤差e(n)。另一方面,在圖22所示語音信號模型化的框圖中,模型即合
23、成波器的h(z)亦可采用格型結構。如果將模型中的增益因子g考慮到輸入信號中,則該濾波器輸入是gu(n),輸出是合成的語音s(n)。通過線性預測分析求得的a(z)是h(z)的逆濾波器,gu(n)則由e(n)來逼近,因此合成濾波器h(z)的結構形式應該滿足輸入e(n)時輸出語音信號s(n)。將式(2.3.10)進行整理,可得 (2.3.11)圖2-3反射系數是語音處理中至關重要的參數,它的計算是一個重要問題。在自相關法和協方差法中,用預測誤差最小為條件求出線性預測系數。格型法的特點之一是能夠在格型的每一級進行合適的本級反射系數計算。顯然,格型法的結構與前面討論的自相關法和協方差法的結構之間存在若干
24、差異。格型濾波器的優點為:反射系數可被直接用于計算預測系數,格型濾波器的級數等于預測系數的個數。格型濾波器的穩定性可由其反射系數的值來判定。可以證明,格型濾波器穩定的充要條件是:<1。下面,我們進行格型法的求解式(2.3.6)的z變換可以表示為 (2.3.12)將代入到(2.3.4)式,可以從遞推求解,式可得 (2.3.13)取(2.3.7)式的z變換得 (2.3.14)利用(2.3.14)式球得(2.3.45)式的z反變換形式為 (2.3.15)同理可推得 (2.3.16)伯格(burg)提出了一種算法,它是基于使正反向預測誤差的平方和為最小,可以表示為 (2.3.17)將(2.3.1
25、5)式和(2.3.16)式代入(2.3.17)式,可得 (2.3.18)令 (2.3.19)可求出為 (2.3.20)上式說明,將正向與反向預測誤差聯系起來了,它表示正向與反向預測誤差的相關度,故稱參數為部分相關系數(parcor系數)。的取值范圍為 (2.3.21)格型算法的步驟可以歸納如下:(1) 確定初始值:(2) 由(2.3.20)式可以求得(3) 由(2.3.15)式和(2.3.16)式計算正向和反向預測誤差:(4) 設i=2。(5) 由(2.3.20)式求ki(6) 決定,(j=1,2,i-1),(7) 同(3)。(8) 設i=i+1。(9) 若ip,重復(5)(6)(7),否則(
26、10)。(10) 結束。由于格型算法不需要計算自相關函數,可以直接從語音取樣中求得預測系數,因而避免了語音端點處具有比較大的相關函數誤差的缺點。第3章 simulink仿真的分析合成系統3.1 仿真內容對音頻信號進行分析,實現對語音采樣、線性編碼,使語音在傳輸時失真最小。3.2 仿真系統模型通過在matlab 命令欄中輸入dsplpc,打開語音信號線性預測分析仿真模型:顯示仿真模型如下圖:圖3-1 仿真系統框圖圖3-1是線性預測語音信號的分析合成系統,本仿真圖由兩大部分構成,分別是語音信號的分析合成部分。由上圖可知對于因信號進行采樣,采樣頻率為8khz的語音信號“matlab”,首先進行預加重
27、,提升語音信號的高頻部分,提高信噪比,然后通過疊階窗分析將語音信號的頻譜圖連接起來,達到淡入淡出的效果,防止語音信號在連接點的跳變,避免刺耳的噪聲。而后通過漢明窗對語音信號頻譜進行截取,分析一段語音信號。進行自相關函數的計算,得到lpc方程組,通過萊文森杜賓算法計算出預測系數。預測系數作為逆濾波系數,并將殘差信號送到聲道濾波器中進行濾波,合成的語音信號進行去加重,便得到與原始信號相似的語音波形。3.3 仿真工作過程3.3.1語音信號采樣圖3-2 輸入語音信號模型雙擊出現如下對話框,輸入一個8khz的語音信號“matlab”。圖3-3 輸入語音信號參數設定參數分析:采樣周期為1/8000,每幀采
28、樣點為80,并分幀處理。3.3.2預加重圖3-4 預加重模型圖3-5 預加重參數設定參數分析:傳遞函數類型:全極點,即全零點fir數字濾波器。這類濾波器對于無限長脈沖響應最終趨于0,由于無限長脈沖響應濾波器中存在反饋電路,因此對于脈沖輸入信號的響應是無限延續的。有限脈沖響應濾波器的優點:fir有線性相位,不會導致信號的包絡失真,各個頻率成分傳輸速度同樣快,同步到達輸入端。而iir濾波器則可能導致包絡失真,部分頻率成分傳輸速度快就會先到達接收端,速度慢色頻率成分則會后到達接收端,在輸出端疊加,造成失真。并且fir濾波器是穩定的,在z域轉換后的所有極點都在單位圓內。濾波器結構:直接型無反饋。分子系
29、數:1,0.95 起始值:在語音信號的a/d轉換過程中,為了防止頻譜混疊,通常在對模擬語音信號取樣之前先進行低通濾波器,但濾波的同時也降低了高頻趨于信號的能量,這對線性預測分析是相當不利的。由于高頻區域能量的降低可能會影響到自相關矩陣的正確性,導致自相關矩陣病態甚至可逆,因而通常在計算lpc系數之前利用只有一個零點的濾波器對語音進行處理,預加重的目的就是增強語音的高頻分辨率。使信號的頻譜變得平坦,保持在低頻到高頻的整個頻帶中,能用同樣的信噪比求頻譜,以便于頻譜分子或聲道參數分析。通俗的說,預加重就是設計濾波器,常采用的是傳遞函數為h(z)=1-u/z的一階fir高通濾波器來實現預加重。預加重系
30、數取接近于1的值,常取0.91。設n時刻的語音采樣信號x(n),經過預加重處理后的結果為y(n)=x(n)-ux(n-1),這里取u=0.98。3.3.3疊階窗分析圖3-6 疊接窗模型如圖3-1所示,通過預加重處理后,接下來進行加窗分幀處理。語音信號是一種隨時間變化的信號,主要分為濁音和清音兩大類。濁音的基音周期、清音周期信號幅度和聲道參數等都隨時間而緩慢變化。由于發聲器官的慣性運動,可以認為在一小段時間里(一般為1030ms)語音信號近似不變,即語音信號具有短時平穩性。這樣,可以把語音信號分為一些短幀(稱為分析幀)逐幀進行處理。正是因為逐幀分析,所以在幀與幀之間,即波形相接的地方不夠平滑,在
31、聽覺上會有嚴重的失真,所以我們要建立淡入淡出的概念,通過交疊分段的方法,使幀和幀之間平滑過渡,使其保持連續性。語音信號的分幀是采用可移動的有限長度窗口進行加權的方法實現的。一般每秒33100幀,視情況而定。前一幀和后一幀的交疊部分稱為幀移,幀移與幀長的比值一般取為01/2。 雙擊該圖標將出現圖3-7:圖3-7 疊接窗參數設定參數分析:由上圖可知,幀長:160bit; 幀移動:80bit; 幀移與幀長的比值為1/2,即一幀160個樣點,緩沖80個樣點。3.3.4漢明窗圖3-8 漢明窗模型如圖3-8所示,語音信號的分幀是采用可移動的有限長度窗口進行加權的方法來實現的。常用的窗有兩種,一種是矩形窗,
32、一種是漢明窗,在這里我們用的是漢明窗。下圖是漢明窗的參數設定:圖3-9 漢明窗參數設定參數分析:由圖可知采用漢明窗口輸入,采用對稱采樣。3.3.5自相關算法圖3-10 自相關和萊文森-杜賓算法模型由前面的討論可知,清音和濁音的發生機理不同,因此在波形上也存在著較大差異。濁音的時間波形呈現出一定的周期性,波形之間相似性較好;清音的時間波形呈現出隨機噪聲的特性,雜亂無章,樣點間的相似性較差。這樣,可以用自相關函數測定語音的相似特性,之后運用萊文森-杜賓算法進行快速簡便的運算,計算出預測系數。在這個過程中即可用前n-1個值來預測第n個值,用來取消冗余,實際與現實有誤差,來計算誤差。計算得出的值作為預
33、測系數進行傅里葉等計算得到lpc的頻譜。而通過萊文森算法得出的預測系數作為濾波器系數,使預測語音信號和原始信號進行相減濾波得出殘差,這里 即為預測系數。圖3-11為lpc頻譜。如圖3-12為通過格形算法算出的反射系數樣點波形圖。圖3-11 lpc頻譜圖圖3-12 反射系數樣點波形圖3-11為萊文森-杜賓算法計算得出的預測系數經添零后作傅里葉變換,再求其倒數得到的lpc頻譜,圖3-12為格形算法計算得出的反射系數樣點波形圖。通過杜賓算法算出的預測系數與通過格形算法算出的預測系數其實沒有本質的區別,只是相比較而言,格形算法較為簡潔,更易于保證語音合成器的穩定性。此外,格形結構對于算法中的有限字長帶
34、來的誤差比較不敏感,因此特別適宜于只能采取定點的硬件系統來實現,基于以上原因,大部分用語音合成器的系統都采用格形結構。通過圖3-11也可以清晰地看到第一共振峰,第二共振峰以及第三共振峰。在語音科學及語音學中,共振峰描述的是人類聲道中的共振情形。常用的測量方法是由頻譜分析或聲譜圖中,尋找頻譜中的峰值。但假如如說話者,用比較高的基頻發出元音,例如小孩或女性的聲音,則頻譜上看起來比較像是寬帶狀,比較無法看出明顯的峰值。3.3.6數字濾波器從仿真框圖中可以看到,分析濾波器有兩個輸入端,經格形運算后的預測系數作為分析濾波器的系數,并對預加重后的原始語音信號濾波,輸出殘渣。這個過程其實就是取新樣本的實際數
35、值,和預測值進行比較,得到差值后,僅把預測值與現實樣值之差(預測誤差)進行傳輸。接下來在接收端通過一個合成濾波器,將經格形算法得出的預測系數作為合成濾波器的預測系數,對殘差進行濾波,得到新的語音信號,最后經加重濾波器,便可恢復與原信號近似的波形。圖3-13為分析濾波器的參數設定圖。圖3-13 分析濾波器參數設定由圖3-13可知,分析濾波器采用fir數字濾波器。圖3-14 lpc誤差濾波器參數設定由圖3-14可知,合成濾波器采用的是iir型數字濾波器。圖3-15 零時刻殘差時域波形圖圖3-16 中間時刻殘差時域波形如圖3-15,3-16所示為lpc誤差濾波器輸出的殘差系數在不同時刻的時域波形圖。由圖3-15和圖3-16可以知道,由于我們輸入的語音信號為matlab,最開始頻譜沒有明顯波動,當將時間軸調到中間的部分,可以看到頻譜變化十分明顯,很像噪聲的頻譜,那是因為發出t這樣的清音,類似于噪聲,導致頻譜變化幅度非常明顯。3.4 仿真結果分析實驗結果通過雙擊original signal 模塊來聽原始語
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 風險管理在公司戰略執行中的約束與支持性試題及答案
- 風險戰略規劃與實施試題及答案
- 構建誠信企業的年度工作措施計劃
- 促進倉庫文化建設與傳播計劃
- 科技創新與創業的結合實踐試題及答案
- 智能化在生產工作計劃中的實踐
- 網絡安全事件響應流程試題及答案
- 2024年四川傳媒學院輔導員考試真題
- 中小企業品牌發展的挑戰與機遇計劃
- 2024年河北省林業和草原局下屬事業單位真題
- 取水泵站圍堰方案
- 孔距尺寸的標注與孔的位置度公差的確定
- 小學一年級寫字教學(課堂PPT)
- 服裝工藝(各工序)單價表
- 鋼筋混凝土單向板肋形樓蓋課程設計
- 圖書入庫登記表
- 中國市場橄欖油與消費者健康及使用需求聯合調研報告(共46頁).docx
- BMH型半門式起重機說明書
- 土地估價報告市場比較法(工業)模板2016.09.26
- 中醫醫院科主任科室管理通用考核表
- 《2021國標暖通圖集資料》96K150-3 圓錐形風帽
評論
0/150
提交評論