(畢業論文)基于ADPCM的語音編解碼設計_第1頁
(畢業論文)基于ADPCM的語音編解碼設計_第2頁
(畢業論文)基于ADPCM的語音編解碼設計_第3頁
(畢業論文)基于ADPCM的語音編解碼設計_第4頁
(畢業論文)基于ADPCM的語音編解碼設計_第5頁
已閱讀5頁,還剩31頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、1 緒論1.1 課題研究的背景和意義隨著社會時代的發展,人類迅速進入信息時代,對于各種資源的利用率要求越來越高,從而推動了語音編解碼技術的飛躍發展。與此同時,伴隨著微電子技術的快速發展,以及超大規模集成電路設計技術的不斷完善,使得語音編解碼技術越來越廣泛的深入到通信領域、消費電子領域,辟如數字錄音筆、ip電話、復讀機等等都是語音壓縮編碼技術的典型應用。語音編碼技術就是將模擬的語音信號數字化離散化,利用語音聽覺上的制約或者數據的冗余度來壓縮信號的一些不必要的信息,以此來增加傳輸速率、減少存儲容量,然后再進行傳輸、存儲或者處理,而解碼就是相反的一個過程。adpcm是自適應差分脈沖編碼調制的簡稱,是

2、語音編碼的多種算法中的一種,更是最早使用于數字通信系統中的一種語音編解碼算法。此算法利用了語音信號樣點間的相關性,針對語音信號的非平穩特點,使用了自適應預測和自適應量化,即預測器和量化器它們的參數能隨著輸入信號的統計特性,自適應于或接近于最佳的參數狀態,在32kbps的速率上能夠給出網絡等級話音質量。adpcm究其本質是一種針對 16bits( 或8bits或者更高) 聲音波形數據的一種有損壓縮算法,它可以將聲音流中每次采樣的 16bit 數據用4bit 來存儲,所以其壓縮比為 1:4。而且它的壓縮/解壓縮算法非常簡單,所以又是一種低空間消耗、高質量高效率聲音獲得的好途徑。adpcm 其主要是

3、針對連續波形數據的,保存的則是波形的變化情況,從而以達到描述整個波形的目的。1.2語音編碼的發展和研究狀況 數字語音有很多的優點是模擬語音不可比擬的,它能更方便的傳輸和存儲,可以在噪聲信道中進行相當可靠的傳輸,容易進行交換,能夠很方便的對信號進行加密傳輸。數字語音可以由模擬語音簡單的抽樣,量化來得到,但由于數字語音其數據量比較大如果不經過處理,那它在傳輸和存儲時就會占用很大量的信道資源以及存儲空間,那么給系統提出的要求勢必就會很高,所以數字語音通常情況下都是要進行壓縮編碼的。在確保編碼語音一定質量的前提下,究竟如何高效率進行壓縮編碼,或者說在給定信息速率的前提下,如何去提高編碼后的語音質量,是

4、當代語音編碼所要研究的重點。 語音編碼技術一般分為兩種:信源編碼和信道編碼。信源編碼的目的是為了提高信號的傳輸和存儲效率,在這指的就是數字語音信號被壓縮的比特率(即每秒鐘傳輸語音信號所得出的比特數,通常也可以稱為數碼率),使得更多路的語音信號能在同樣的信道容量中傳輸,或者說只需要較小的容量存儲數字語音信號,所以這一類編碼又被稱為語音信號的壓縮編碼。而信道編碼因為是為了提高傳輸的可靠性而作出的處理,所以又被稱為可靠性編碼。語音信號編碼從方法上講有波形編碼和分析合成系統兩大分支。波形編碼是以盡最大可能無失真的重構出語音波形為目標,在其編碼時以波形逼近為基本原則,在時域上或變換域上直接進行編碼,雖然

5、這種方法壓縮效率不很高,但是在6416kb/s 的速率上,卻可以合成出相當高的語音質量,然而在速率進一步下降時,編碼語音的質量將會隨之大幅度下降。常用的波形編碼算法有:時域上編碼的pcm(pulse code modulation),adpcm,apc(adaptive predictive coding); 在頻域上進行編碼的子帶編碼sbc(sub-band coding)和自適應變換編碼atc(adaptive transform cording)。分析合成系統是把語音信號產生模型作為基礎,把語音信號變換成模型參數后再進行編碼,因此又稱之為參數編碼。參數編碼其出發點同波形編碼有所不同,它的

6、原則是以在盡量保持語音可懂度的條件下,為語音信號搭建一個數學模型,然后通過給定的語音信號計算模型參數并且量化編碼來實現。而且它的模型參數對比于語音波形來說數據量是很小的,因而其壓縮效率很高。雖然也許參數編碼會導致重建話音和原始語音在它時域波形上有很大的區別,但它的可懂度仍然可以保持在一個相當高的程度。現在,還時常采用混合編碼的方案,混合編碼是波形編碼和參數編碼優點的結合,這種結合是保留分析合成編碼技術精華的基礎,引用波形編碼準則優化激勵源信號,從而在一個較小的數碼率上(4.89.6kbit/s)獲得更高質量的合成語音。 自1937年以來的脈沖編碼調制(pcm)是ah里夫斯已經提出,語音編碼技術

7、的發展歷史已經超過60年。尤其是在過去的20年里,隨著計算機的語音編碼技術和微電子技術的發展得到了快速發展。64kbit/s的pcm系統標準ccitt于1972年確定了64kbit/s的pcm語音編碼g. 711建議,已被廣泛應用于數字交換機,數字通訊等領域,到現在為止,仍然是占主導地位。雖然這種編碼方法可以得到良好的語音質量,但缺點是,它會占用更多的帶寬,有限的帶寬資源條件下不使用。ccitt在20世紀80年代初,就開始專攻小于64kb/s的非pcm編碼算法,32k比特/秒adpcm語音編碼g. 721建議,于1984年通過,它不僅可以實現與pcm等效語音質量,還更好的抗誤碼性能,它被廣泛用

8、于海底電纜,衛星,和可變速率的數字語音內插編碼器清空設備。連續地,在那之后,1986年,1988,做了進一步的修改在此,也可以是32k比特/秒的pcm比特率,一般是高速率的一半,達到接近正常的pcm語音質量,防誤性能優于pcm格式。隨后頒布g. 723標準,擴大到24kbit/s和40kbit/s的編碼標準稅率。 1990年g. 723,g. 721由itu合并,將進一步擴展的編碼率16kbit /秒,從而促進g. 726標準形成的。語音插值技術和浮動利率結合原來的pcm通道的adpcm編碼,可擴展到8-10倍,稱之為數字語音通道倍增設備dcme。 g. 726標準算法不僅簡單,但高品質的聲音

9、,即使在經過反復的切換,以確保他們的聲音質量,所以網絡會議系統,8-isdn通信和voip網絡通信等方面具有廣泛的應用。然后16kb/s的低時延碼激勵線性預測(ld-celp)g. 728建議,在1992年出版。正是由于其較低的利率,高性能,低延遲在實踐中廣泛使用,如:單路單載波衛星,無繩電話和數字插值空氣設備,海事衛星通信,存儲,數字移動無線系統,分組語音,轉發系統,語音留言錄制。最后,在11月1995年共軛代數碼激勵線性預測(cs-acelp)8kb/s的語音編碼g. 729建議itu-tsgl5全體會議通過,并通過g. 729附件降低復雜8kb/s的cs-acelp講話編解碼器在itu-

10、tsgl5 1996年6月的會議上正式成為國際標準。這種編碼其延遲小,可以節省帶寬的87.5,為32kb/s的adpcm語音質量,音質在同級別最優的比特率,在嘈雜的環境中也可以更好的語音質量。雖然csacelp語音編解碼器占用比特率比adpcm的少,但是其算法復雜度遠沒有adpcm的算法簡單明了,所以在現代通信系統中,adpcm這種編碼算法仍然占主導地位。1.3 語音壓縮編碼的評價語音質量是一個語音編碼系統必然要保證的性能指標,速率再低,編碼效率再高,不能得到滿意的語音質量也不能算是一個優良的編碼算法。那么,在語音壓縮編碼中,怎樣評價一個語音壓縮質量的好壞就成為了是一個極其重要的概念,通常,評

11、價語音壓縮的標準主要有以下幾點:1)語音質量語音質量的評價方法可分為主觀評定和客觀評定兩大類??陀^評定方法用客觀測量的手段來評價語音編碼質量,常用的方法有均方誤差、信噪比、加權信噪比、平均分段信噪比等。主觀評定方法是用人們自身去感受語音質量的感覺,然后主觀評判其語音壓縮編碼的質量。2)編碼速率編碼速率,可以使用“比特/秒”(比特/秒或bps)的措施,即總速率編碼,通常用i表示,即每秒的編碼比特的數量。3)編解碼復雜度所謂編解碼的復雜度指的就是實現一個信號編解碼算法的難易程度。編解碼算法的復雜程度和語音編碼的話音質量有著相當密切的聯系。在一個相同的數碼率情況下,算法復雜一些的將會獲得更好的語音質

12、量。編解碼復雜度可以由算法復雜程度、硬件實現及價格等許多因素來衡量。4)編解碼延時數字音頻編解碼器的延遲主要由兩部分組成:算法延遲和處理延遲。之前的壓縮的音頻信號到高速緩存中的數據必須是有效的,這個時間延遲稱為算法延遲,它是不是唯一的方法,以減少通過改變延遲時間。即,音頻信號壓縮編碼器和解碼器的編解碼器的實現在不同的應用程序所需的時間的處理延遲,國際社會已延時的編解碼器不同的要求,如長途編解碼器延遲不超過5-10毫秒,但對于可視電話可以擴展到幾十毫秒到幾百毫秒。5)穩健性(robustness)所謂穩健性是指編譯碼系統的抗噪聲、抗信道誤碼能力。一個實用的聲碼器,其誤碼率要求在10-3的信道上傳

13、輸時,語音質量不至于過分惡化,而對于移動通信中的聲碼器則要求在信道誤碼率為310-2時仍能正常工作。adpcm就語音質量的評價上來說,語音質量的客觀評價方法主要采用均方誤差和信噪比來評定。但客觀評價還不能全面反映人對語音質量的感覺,而主觀評定方法符合人們對語音質量感覺的要求。主觀評價的優越性,主要體現在其處理還原后給人主觀感覺效果很好,感覺語音失真度??;就編碼速率來講,adpcm的編碼速率為16kb/s,優于其他編碼方式;就其編解碼的復雜度而言,adpcm采用四位二進制的差值編碼方式,使用起來簡單又容易實現;它的抗噪能力也比較強即穩健性相當好。1.4 論文研究的主要內容及章節內容安排本論文研究

14、的內容是語音編解碼的算法及軟件實現過程,主要是研究adpcm的語音編解碼算法及在matlab軟件中的實現。論文共分4章,各章內容安排如下:第一章:簡要介紹課題研究背景和意義,語音編解碼的發展和研究狀況以及它的評價標準。第二章:主要介紹語音信號脈沖編碼基本理論,為對語音進行adpcm編碼譯碼系統提供理論依據。第三章:介紹pcm與dpcm(differential pulse code modulation)的工作原理,并對二者進行比較,從而體現出dpcm編碼的優越性。接著介紹增量調制dm(delta modulation)及自適應增量調制adm(adaptive delta modulation

15、)的原理與運用,二者比較得出adm更容易跟蹤信號變化快的的語言,最后闡述了adpcm的由來及主要原理。第四章:確定adpcm實現的總體設計框圖,以及adpcm編碼和解碼實現過程的設計流程圖, 并采用matlab軟件對adpcm編解碼系統的實現進行了仿真。2 語音信號脈沖編碼基本理論當前最主要的通信業務有電話、圖像(傳真、電視)等,它們都是時間上和幅度上連續的模擬信號,如果要想實現數字化的傳輸和交換,則首先要做的就是把模擬信號變化成數字信號,電話信號數字化一般被稱為語音編碼,而圖像信號數字化就被稱為圖像編碼。雖然兩者各有各的特點,但兩者的編碼原理基本上仍然是一致的。而當前的通信網中很多業務基本上

16、都是電話業務,因此語音編碼將為本章討論的重點。可以說這些理論對任何模擬信號數字化的實現過程都是適用的,其不失一般意義。依照語音的特點,通常把語音編碼方法分為波形編碼和參量編碼,波形編碼是指對信號的波形進行編碼,它具有較高重建信號質量的能力。參量編碼則是通過提取語音信號的一些特征參量,從而對其進行編碼,它的特點是碼速率較低,但其語音質量要較波形編碼差一些。 波形編碼的質量比較高,通常在3003400hz話路通道中傳輸模擬信號(例如模擬數據信號、電話信號、傳真信號及各種隨路信令信號等)在數字化以后,仍然可以達到原來的質量容限。這一特點是通信網由模擬轉換為數字過渡過程中極其重要的一點。根據語音的特性

17、,通常分為波形編碼和參數編碼類型的兩類語音編碼方法,波形編碼,用于編碼的信號波形,它具有更高的能力來重建信號的質量。參數編碼是通過提取語音信號的參數的一些特點,從而編碼,它的特點是較低的比特率,但不如波形編碼的語音質量。波形編碼質量是比較高的,通常會在通道3003400hz傳輸各種模擬信號(如模擬數據信號,電話信號,傳真信號,與信道相關信令的各種信號)后的數字仍實現其原來的質量寬容。的通信網絡,其特征在于由模擬到數字的轉換是非常重要的。語音信號有很多波形編碼方法,例如脈沖編碼調制(pcm)、自適應增量調制(adm)、自適應差值脈沖編碼調制(adpcm)、子帶編碼(sbc)、矢量編碼(vqc:v

18、ector quantitation coding)等。為對語音進行adpcm編碼譯碼系統提供理論依據,下面主要介紹編碼的一些基本理論。2.1 語音信號壓縮的基本原理在數字通信中,語音信號被編碼為二進制數字序列,通過信道傳輸或存儲,在經過解碼后恢復為可懂的語音。將語音信號編碼為二進制數字序列后再經傳輸或儲存有其獨特的優點。例如,可擺脫傳輸或存儲中噪聲的干擾。模擬傳輸信道的噪聲總是要使語音信號發生畸變,而數字通信只要有足夠的通信站,就能排除所有噪聲的影響;另一方面,磁帶錄音機存儲模擬信號時要受磁帶噪聲和其他噪聲的影響,而采用計算機存儲數字語音信號時,惟一的失真來自模數轉換前的低通濾波。另外,數字

19、編碼的信號還便于處理和加密、再生與轉發,也可與其他信號復用一個信道,設備便于集成等。最簡單的語音編碼方法是對其直接進行模/數變換;只要其取樣率足夠高,量化每個樣本的比特數足夠大,那么就能保證解碼恢復的語音信號有非常好的音質,而且也不會丟失有用信息??墒菍φZ音信號直接進行數字化其所需數碼率太高,比如普通電話通信中采用8khz取樣率,如用12bit進行量化,則數碼率為96kbit/s,這樣大的數碼率即使對很大容量的傳輸信道也是難以承受的。而語音信號用pcm編碼后,數碼率為64kbit/s,不進行壓縮很難用調制解調器在電話線路上傳輸,所以必須進行壓縮編碼。對語音進行編壓縮碼的基本依據有兩個。一是,從

20、產生的物理機理和語音結構的性質來看,語音信號中存在較大的冗余度。從信息保持的角度講,只有當信源本身具有冗余度,才能對其進行壓縮。語音壓縮實質上就是識別語音中的冗余度并設法去除掉它們。冗余度最主要部分可以分別從時域或頻域來考慮,歸納起來有以下幾個方面:1,語音信號樣本間的相關性很強,即其短時譜不平坦。2,濁音語音段具有準周期性。3,聲道的形狀及其變化比較慢。4,傳輸碼值的概率分布是非均勻的。語音編碼的第二個依據是利用人類聽覺的某些特性。人耳聽不到或感知不靈敏的語音分量可視為冗余(這種冗余可看作為主觀上的冗余),所以可以利用人耳感知模型,去除掉人耳感覺不靈敏的語音分量,而重構后的語音質量不明顯下降

21、??傊?,利用冗余度或者是聽覺上的制約,可以壓縮表示語音信號的必要信息,從而可降低傳輸速率或存儲容量。下面給出脈沖編碼的基本框圖:圖1 模擬脈沖編碼框圖2.2 采樣定理2.2.1 nyquist采樣定理采樣是指將時間上連續的模擬信號變為時間上離散樣值的過程。采樣定理最主要要回答的問題是看能不能由離散樣值序列重建出原始的模擬信號。且抽樣定理還是任何模擬信號數字化的理論基礎。其主要有以下幾種:nyquist采樣定理;帶通采樣定理;自然采樣平頂采樣。接下來簡單的介紹一下nyquist采樣定理和帶通采樣定理。 nyquist采樣定理:設定一個頻率帶限信號為,將其頻帶限制在(0, )或以下,若對以不低于的

22、采樣速率進行等間隔采樣,那么獲得時間離散的采樣信號 (其中稱為采樣間隔), 通過所得到的采樣值原信號將完全的確定。 奈奎斯特采樣定理指出,如果信號是一個不小于2倍的采樣率進行采樣的,則由所得到的離散采樣值就可以唯一的恢復原信號。根據抽樣理論,使采樣信號通過一個低通濾波器,其帶寬不小于,過濾掉高頻成分,因此它可以恢復的原始信號的無失真的從中。隨著時間離散采樣值來代替連續時間模擬信號的采樣定理的意義是,這將模擬信號處理數字化奠定了理論基礎。2.2.2 帶通信號采樣nyquist采樣定理僅僅討論了頻譜分布在(0, )上的基帶信號的采樣問題, 但在實踐中,我們遇到的信號,尤其是語音信號中,通常會在一個

23、有限的頻帶(, )范圍內的信號的帶通頻率分布,由奈奎斯特采樣定理,依然能按照的采樣速率去進行采樣。當時,即當信號最高頻率遠遠大于該信號帶寬b時,若仍然按照nyquist采樣率去進行采樣的話,那么它的采樣頻率就會變得很高,從而就很難去實現, 或隨后的處理速度是非常困難符合要求的。帶通采樣定理:設一個帶限信號,將其頻帶限制在(,)范圍內,若其采樣速率關系式滿足: (1) 其中n為整數,其取值區間為:0,n,n為/b的整數部分。那么的頻譜將不會發生混疊,即能從中無失真的恢復出。從以上采樣定理中很容易推導出最低采樣率(2)(當n=最大值n時, 最小),且又由式可以得知:帶通采樣頻率最小值在2b到4b之

24、間,即 (3)通常,當帶通信號的帶寬比信號的最低頻率大時,就可將此信號作為低通信號處理。只有當不滿足上述條件時才使用帶通抽樣定理。2.3 量化定理2.3.1 基本概念量化是指將一個幅度連續變化的信號變為一個離散信號的過程。由于用有限長度的二進制數字碼組表示模擬信號樣值是pcm的數字化過程,然而有限長度的二進制數字碼組又只能代表有限數量的樣值,所以若要用有限的數量樣值去表示原模擬信號無限個幅度抽樣值,那么就需要對其進行量化。量化的方法就是,將所需量化樣值的最大變化范圍分成若干個相鄰區間段落,當其樣值落在某一間區間內,它的輸出數值就用此區間內的某一個單一固定值來表示。量化間隔可以是相等的,也可以是

25、不相等的,一般有均勻量化和非均勻量化兩種量化方法。從量化結果可以發現,不論量化的間隔有多么小,都會帶來一定的誤差,隨之就產生了量化噪聲。雖然將量化間隔取得較小,量化級數會因此變多從而能減小一定的量化誤差,但與此同時,也會相應的增加數碼率,提高編碼設備的復雜程度,而且需要較寬的傳輸信道。例如,對語音信號,其抽樣速率為,如果每個樣值編碼8位,量化共有256個量化間隔,每路語音pcm編碼后的數碼率為8x8=64kib/s;如果每位樣值編11位碼,數碼率提高到88kbit/s。2.3.2 均勻量化均勻量化也叫線性量化,它在量化時各量化間隔是相等的。任意一個量化器都會有一定的量化范圍,通常取-vv。在均

26、勻量化的情況下與, 量化間隔()和量化級數n的關系為: (4)通常情況下每一個量化間隔內的量化值可以取此區間內的任意一值,但是理論上為了減小平均量化誤差功率, 一般量化值的取值會取量化間隔中間值,那么這樣量化的最大誤差便為/2。一般來說,信源碼都是二元碼,所以其碼位n與量化級數n的關系為,即。對于均勻量化的量化間隔或是量化電平用n位碼表示,就得到了數字編碼信號,通常稱為線性pcm編碼信號。2.3.3 非均勻量化非均勻量化是一種量化間隔取決于使用不同信號的,在信號幅度值比較小的區間內就采用小的量化間隔,而在信號幅值比較大的區間內則采用大的量化間隔,量化間隔不再是一個恒定值。非均勻量化較均勻量化方

27、法具有以下兩個優點:a)當對一個概率密度非均勻分布的語音信號進行量化時,非均勻量化方式就可以得到較高的平均信號量化噪聲功率比。b) 在非均勻量化,量化噪聲的語音信號的rms值的功率大致成比例的采樣,即,量化的或大或小的語音信號的量化噪聲信號的方法,無論水平是相同的,即改善均勻量化的聲音時,小信號量化噪聲比。非均勻量化小的用于小信號的量化噪聲,以確保在同一時間有一定的限制,在量化過程中,有足夠的動態范圍的量化比特數并沒有把一個大的信號過載。如果我們知道的語音信號的幅度的概率密度函數的序列,我們可以設計給定的量化比特數的量化噪聲是最小的非均勻量化器。輸入語音信號的方差和概率密度函數進行量化,與量化

28、的質量密切相關,我們需要通過量化方法一種受二者影響較小的,目前在這方面的杰出貢獻的,我們經常看到的a律或律量化。非均勻量化的過程中,可以等效地視為非線性的壓縮語音信號的振幅,然后的線性量化處理。非線性壓縮方法是目前理想的對數壓縮。所謂的對數壓縮,也就是說,要量化的對數壓縮的語音信號的振幅值,振幅的第一語音信號的對數,然后量化值,提高量化器的動態范圍。在解碼側,通過過程的逆過程 - 恢復的話音消息的采樣的指數函數的對數。僅取自量化步長的量化噪聲對數壓縮,從該語音信號的方差。然而,其值的對數的語音信號的振幅可能很大,需要定量或定量的特定的量化比特的電平,以便對數壓縮更難以實現。可將對數壓縮特性作些

29、近似,這樣才有了后來的律的壓縮方式:先將語音抽樣信號作公式(5)變換得到,量化器再對進行量化。 (5)當時, 當時, 當時, 輸入輸出信號相同,即沒有進行壓縮,信號子幅度范圍即量化電平均勻分布;當很大,并且也很大時,則有: (6)此時的律量化器的信噪比可推導為: (7)由上述公式可知: 律量化器信噪比與關系不大。大量實驗結果表明,對于一個固定的值,若減為二分之一,則減少6db;而對于一個固定的值,碼每增加一位,則增加6db。律量化器以量化信噪比作較小犧牲為代價,使量化器有一個比較寬的動態范圍。通常作為“長途電話質量”語音波形標準的7位律pcm在動態范圍合適的情況下保持有34db的信噪比。而若用

30、均勻量化器得到同樣寬度的動態范圍,大約需要11位,比律量化器高出50%還多。2.3.4自適應量化一方面,在語音信號中的量化器的量化步長,從選定的足夠大,以適應動態范圍;另一方面,希望減小量化步長,以減少量化噪聲相差。這種現象的原因是語音信號,語音通信過程是不固定的。與揚聲器或通信環境的變化,和由濁音清音段到段的語音內容,語音信號的幅度會在一個很寬的范圍內。正如我們所看到的,使用非均勻量化,以適應這些幅度的波動是一種方式,還有一個比這更好的方式,采用自適應量化,即使量化的量化步長自動適應輸入電平的變化。在本節將介紹自適應量化的一般原則。自適應量化的基本思想,是使量化步長的距離,變成輸入信號相匹配

31、的幅度變化,作為輸入信號的振幅從規定的變化,從而進一步提高其定量結果的量化步。也可以在前面的一個固定量化器的自適應增益控制,使之進入到量化器的輸入信號保持到一個固定的常數方差。這兩種方法是等效的。這兩種方法應容易地估計隨時間變化的輸入信號的振幅,來糾正從(n)的量化步長的增益值。并根據不同的估計方法,自適應量化可以分為兩種類型:一種是輸入振幅或輸入估計值本身的方差,此程序被稱為前饋自適應量化(aqf),另一種是,在根據與量化步長從量化器輸出是自適應的,或等價的輸出碼字c(n)自適應調整,這個程序被稱為反饋自適應量化(aqb)。無論的aqf法或aqb方法,可以顯著提高量化的輸入信號電平變化的適應

32、能力,可以使大或小信號輸入信號輸入具有很高的量化噪聲比。1)前饋自適應量化所謂前饋自適應是指,信號的能量或者方差是通過輸入信號其本身估算出來的,通常是先在估算出的方差后,然后令兩種系統輸出 (8)即正比于,而反比于盯。因為量化噪聲不能影響的aqf估值方法,所以aqf估值相當可靠的。在同一時間,這也意味著,為了信息的傳送量,使用額外的比特到解碼器,被稱為邊信息。典型5-6位需要編寫每個量階,所以,估值的頻率不能太高,不然總的編碼速率過大,一般為10至30毫秒的時間估計。 aqf方法還具有的另一個問題是,將引入一個較長的編碼延遲,它經常被用于子幀的編碼處理。2)反饋自適應量化器 反饋自適應量化器的

33、估值方法是使用量化的信號后去提取量階信息,所以就避免了邊帶信息和延遲的問題。 aqb的問題是其估值精度將量化噪聲的影響,并會影響加劇量化粗糙性的增加,甚至有可能導致量化工作不正常。因此,aqb方法通常被用在相對較高的質量在短暫的延遲語音編碼中。通常說來,前饋的適應性和反饋自適應相比,信噪比略高一些,但是前饋自適應需要延遲一段時間,短期時間去計算方差,而反饋自適應然后瞬間完成??傊軌蚪o予超過律或a律自適應量化量化的信號信噪比,適當的選擇,但也允許自適應動態范圍與后者相當,選擇一個較小的無語言也使活動時量化噪聲非常低,因此自適應量化是一種非常有效的編碼方法。3 自適應差分脈沖編碼調制adpcm

34、目前,脈沖編碼調制(pcm)的數字通信系統已經在大容量數字微波、光纖通信系統,以及市話網局間中繼傳輸系統中獲得廣泛的應用。但是現有的pcm編碼必須采用64kbit/s的a律或律對數壓擴的方法,才能符合長途電話傳輸語音的質量指標,其占用頻帶要比模擬單邊帶通信系統寬很多倍。這樣,對于費用昂貴的長途大容量傳輸,尤其是對于衛星通信系統,采用pcm數字通信方式時的經濟性很難和模擬相比擬。因此,人們一直致力于研究壓縮數字化語音占用頻帶的工作,也就是努力在相同質量指標的條件下,降低數字化語音數碼率,以提高數字通信系統的頻帶利用率。 自適應差值編碼調制(adpcm)是在差值脈沖編碼調制(dpcm)基礎上逐步發

35、展起來的。它在實現上采用預測技術減少量化編碼器輸入信號的多余度,將差值信號編碼以提高效率、降低編碼信號速率,這廣泛應用于語音和圖像信號數字化。ccitt近幾年確定了64kb/s32kb/s的變換體制,將標準的pcm碼變換為32kb/s的adpcm碼,傳輸后再恢復為64kb/s的pcm信號,從而使64kb/s數字話音壓縮速率一倍,使傳輸信道的容易擴大一倍。 adpcm中的量化器與預測器均采用自適應方式,即量化器與預測器的參數能根據輸入信號的統計特性自適應于最佳參數狀態。通常,人們把低于64kb/s數碼率的語音編碼方法稱為語音壓縮編碼技術,語音壓縮編碼方法很多,自適應差值脈沖調制(adpcm)是語

36、音壓縮編碼中復雜程度較低的一種方法。它能32kbit/s數碼率上達到符合64kbit/s數碼率的語音質量要求,也就是符合長途電話的質量要求。adpcm是波形編碼中非常有效的一種數字編碼方式。在adpcm系統中量化器和預測器均采用自適應方式,即量化器和預測器的參數能隨輸入信號的統計特性自適應于或接近于最佳的參數狀態。與pcm系統相比,adpcm的量化器和預測器都是根據前面出現的pcm抽樣值并對下一個抽樣值進行預測,將當前的抽樣值和預測值進行求差,然后對差值進行編碼。對差值編碼需要的位數要比直接對原始語音信號編碼所需的位數少,從而達到對信號壓縮的目的,在這里編碼所包含的信息從原來的原始語音信號變為

37、語音信號之間的變化。3.1 脈沖編碼調制pcmpcm編碼被稱為脈沖編碼調制,這是在一個數字通信的編碼,是最簡單的波形編碼方法,編碼主要過程是語音,圖像,對其進行采樣以規則的間隔上的一些模擬信號,使該信號是離散的,在同一時間的樣值被舍入,根據分層量化單元的舍入,而在采樣脈沖振幅的采樣值與一組二進制碼。 pcm編碼的最大的優點是,音質好,最大的缺點是笨重。我們常見的音頻cd上使用了pcm編碼。pcm模式是抽樣,量化和編碼三個基本方面完成。音頻信號通過一個低通濾波器的帶限濾波處理,從取樣,量化和編碼三環節完成pcm調制,來實現a / d轉換,形成pcm數字信號的糾錯編碼和調制,它被記錄在記錄介質上。

38、數碼錄音cd和磁帶介質。在播放期間,從記錄介質中取出由數字信號處理,例如解調和糾錯后,恢復成pcm數字信號,然后由數/模變換器以及低通濾波器還原成模擬音頻信號。在cd-pcm的數字信號轉換成模擬信號,以恢復解碼器 - 被稱為cd-pcm解碼器。脈沖調制就是將一個時間連續,取值連續的模擬信號變換成時間離散,取值離散的數字信號后在信道中傳輸。脈沖編碼調制的過程就是先對模擬信號進行抽樣,再對樣值幅度量化,最后進行編碼。 模擬信號的周期性掃描的將時間連續信號轉換成離散時域信號的過程稱為采樣。經過模擬信號采樣的原始信號也應包含的所有信息,能恢復原來的模擬信號無失真。采樣速率的下限是由抽樣定理來確定。量化

39、在pcm中所指的就是將一個經過抽樣后得到的瞬時值使其幅度離散化,即用一組規定的電平去表示其瞬時抽樣值最接近電平的值。通過采樣的模擬信號進行量化獲得的量化的脈沖幅度調制信號,這是一個預定電平的樣值來表示的瞬時值的最近水平。對于編碼,使用一個二進制代碼來表示每個組有一個固定的量化電平,但它實際上是量化同時在編碼過程中,因此也可以被稱為編碼處理的模擬/數字轉換,可以是a / d轉換的意思。3.2 差分脈沖編碼調制dpcm差分脈沖編碼調制記錄的不是信號的絕對大小而是相對大小。因為通常情況下的信號的相對大小的變化小于信號本身,那么編碼所用的碼位也就少。假如取樣頻率足夠高的話,那么大多數連續采樣之間將產生

40、很大的關聯。所以差分系統就利用了這種信息的冗余,不在于記錄信號的大小,而是去記錄相鄰值之間差值的大小。圖2 dpcm編碼器示意圖差分編碼中使用的預測編碼技術,這個想法是從輸入中減去預測值,然后進行量化的預測誤差,和最終的代碼的預測值和實際值之間的差值。與過去的數據來預測當前樣本,然后使用的錯誤代碼來重建原始樣品的解碼器。此方法使用一個相對較小的比特數,但其性能依賴于它的能力,以適應變化的信號和預測編碼方法。為了便于分析,我們需要定義預測器的性質。按照語音產生模型和數學上容易進行處理,通常是線性的預測,即預測輸出x(n)與前量化值的線性組合關系 (9)為簡單起見,往往可能采取以下的通式(10)在

41、一個固定的一階預測的形式 (10)此時,差分方程滿足于,則系統函數有 (11)當系統函數的式(10)是相當于數字積分器(當a =1),且al時,它們可以被稱為“漏積分器”。大量實驗表明,使用二階預測器有可能獲得一個大信號噪聲比(snr),即 (12)則有 (13)該系統函數有 (14)當兩個極點為實數時,就有二階預測器的性能高于一階的預測器,這種預測是通常被稱為“雙積分器”,比較一階預測器有4分貝的改善。這種線性預測系數在跟隨語音變化而變化時,那么它被稱為自適應預測。自適應預測有三個特點:首先,相同的量化的比特數,信噪比總是大于非預測編碼,即,其自適應預測增益總是大于1。二是它的增益是隨時間變

42、化的,因為它是信號頻譜函數,譜的動態范圍越大,其信號樣本之間相關性就越強,預測增益也就越高。因此,這種預測器又被稱之為基于頻譜包絡的預測。三,其量化噪聲是類似于白噪聲,因此輸出噪聲頻譜是平坦的。由2.3小節可知,自適應量化包括前饋自適應量化和反饋自適應量化,同樣,自適應預測器也可分為前饋自適應和反饋自適應,前饋自適應預測器計算預測系數是通過誤差 (15)最小來求得。e(n)為線性預測誤差,是按照幀時來變化的,即按照10到30毫秒為一幀來決定求和樣本點數n和系數,而是式(15)使用了輸入語言信號,它在其接收端是得不到的,因而其預測系數必須作為邊信息傳輸到接收端。對反饋自適應預測器,預測系數從其序

43、列出發,使誤差(16)最小得到,由圖3可知,在發送端與接收端都能得到,所以除了傳送,無須要任何的附加邊信息傳給接收端。圖3 自適應預測編碼系統為了清楚可見,現將前饋自適應預測和反饋自適應預測做一下簡略的比較。1)效果是前饋反饋自適應預測一般稍好,但主要的問題的前饋預測的發送到接收器的預測系數,并且,以確保準確的傳遞,需要適當的量化和編碼它們,并有效地與結合起來,實現高效率的傳輸,這將使發件人反饋的預測變得更加復雜,并沒有這個問題。2)傳輸的誤碼對反饋自適應預測的編碼影響比較大,在前饋自適應預測器中,誤碼不會影響預測器系數。當然,預測系數其傳輸本身也會出現誤碼,但是它只局限于影響本幀的結果,在一

44、般情況下,編碼器的預測器系數時,將采取有效措施,即使發生誤碼,不會導致系統不穩定。反饋預測算法獲得的預測系數,不保證它們形成的合成濾波器的一定的穩定性,同時,又要考慮該算法的收斂性和有限字長的影響,這將使得相對復雜反饋自適應預測算法。3.3增量調制dmdpcm對輸入信號與預測值之差進行編碼,當采樣頻率的增加,減少樣品之間的變化,樣本之間的相關性變強。增量調制本質上是一個dpcm方法,與一般dpcm兩個主要區別是:首先,在delta調制的波形的采樣率遠高于奈奎斯特采樣定理確定的采樣率,第二個是使用兩個電平值信號差即1比特量化器。這是在更高的采樣頻率和一個1-bit編碼。因為只有一個量化電平來表示

45、樣本值的變化,以跟蹤信號的變化,則必須使用上述一般要求相對高的采樣頻率為200khz,因此,反映差分編碼本身,而不是原來的信號。 圖4 使用1比特差分碼進行編碼的調制dm,也被稱為調制器,它是一種預測編碼技術,被pcm編碼的基礎上發展而來的,它可以說是一個變化的pcm,pcm編碼的每一個采樣信號的幅度是整個量化和編碼,所以它具有任意波形的編碼能力; dm實際采樣的采樣信號的極性之間的實際差異信號和預測編碼,有關的極性變成“0”和“1”兩個可能的值之一。如果實際的采樣信號減去采樣信號預測之間的差異是“積極的”(即“積極”的極性),然后用“1”,而是使用“0”。由于只有一個1-bit的dm編碼的語

46、音信號進行編碼,編碼系統,也被稱為dm“升位系統”??梢钥闯鰪膱D4中,在開始階段,有調制器的輸出不能跟蹤的輸入信號的現象非??焖俚淖兓?,我們稱這種現象為調制器的“斜率過載”。一般來說,當輸出信號的反饋環路中是最大變化速度超過的輸入信號的變化率,將有一個所謂的斜率過載。發生這種現象的主要原因,因為由量化步長的限制,和量化步長的大小的變化的輸出信號的反饋環路的最大速率是固定的。從圖4可以看出,當輸入信號的變化相對緩慢,即輸入信號和預測信號,當該差值接近于零,delta調制器的輸出,有隨機交替的“0”和“l “的現象。這種現象被稱為“粒狀噪聲(顆粒噪聲)”調制器,該噪聲不能被消除。當輸入信號的變化更

47、快,斜率過載將成為人們關注的焦點,當輸入信號的變化慢時,它會再次成為關注的焦點粒狀噪聲。因此,為了避免發生斜率過載時,通常有必要增加量化步長,但這樣做,它會成為較大的顆粒噪聲,相反,如果你想減少顆粒噪聲,那么它是必要的,以減少量化步長,這樣就使得斜率過載會變得更加嚴重,因此,促進自適應增量調制adm的發展研究。3.4 自適應增量調制adm自適應增量調制的基本思想就是使增量自適應于語音信號的平均斜率變化,當語音信號波形的平均斜率變大時,就會自動增大,反之,就會自動減小,從而緩解增量調制中由于固定引起的矛盾。通常情況下,人耳對過載量化噪聲不是很敏感,而對顆粒噪聲較為敏感,因此就需要將的幅值取得足夠

48、的小。然而,雖然此時被取得比較小,隨之而來的過載噪聲就會因此增大,所以此時必須要通過增加采樣頻率來確保減少信號量化過程中的過載噪聲,但是如果此時去提高采樣頻率,又會使其信息壓縮的效果因此降低。所以綜上兩方面的要求,需要采用一種隨輸入波形自適應改變大小的自適應編碼方式,從而使得值隨信號平均斜率變化而變化:當斜率大時,就會自動增大;當斜率大時,就會自動減小。這就是自適應增量調制adm(adaptive dm)。此方法的原理:在一段語音信號幅值變化不很大的區間內,就取較小的值去抑制顆粒噪音;而在幅值變化比較大的區間內,就取相對較大的值去減小過載噪音。它的增量幅度確定方法是,先在顆粒噪音不會產生大的影

49、響的條件下,確定一個最小的幅值。在相同符號持續產生的情況下,將幅值增加到原來的2倍。也就是當+、+連續增加時,若下一個殘差信號仍然是相同的符號,則就再將幅值再次翻番,等等,還要確定最大限幅,只要的振幅的最大值一個持續產生相同的符號將繼續增加的幅度下來。如果相反,殘差信號是一個不同的符號,將前一個原始幅度的1/2作為這一次振幅。即,如果連續地產生相同的兩個或更多個相同的,而第三個將增加一倍幅,如果它們具有不同的符號,在的幅值被減小了1/2。此外,不同的電話號碼時,繼續產生時的振幅減小,已減少到最低限度,以便確定初始振幅極限為止。此adm算法,采樣率至少為16千赫。圖5 連續0和1引起增量步長的改

50、變3.5 自適應差分脈沖編碼調制adpcm3.5.1 編碼原理自適應差分脈沖編碼調制就是用預測編碼去壓縮數據量。其主要結合了adm的差分信號和pcm的二進制碼的方法,是一種性能非常好的波形編碼。它的核心思想是:一是使用自適應量化步長的想法來改變其大小,即小的差值用比較小的量化階去編碼,大的差值使用大的量化階去編碼;二是是使用以前的樣值來估計即將到來的下一個輸入樣本的預測值,所以實際樣本值和預測值之間的差已被保持在最低限度。圖6 adpcm原理框圖adpcm編碼的想法是實際樣本值與預測值和預測之間的差值被編碼,其量化的方式非均勻量化,并讓不同幅值信號的信噪比接近一致,以避免語音信號的小振幅的sn

51、r值是小的,但大幅值語音信號信噪卻又比較大的現象。它的編碼過程如圖6所示。向編碼器輸入一個語音數據的16位的二進制補碼,這是在32767-32767之間的范圍內。為預測采樣值,其同線性輸入之間的差值為d。量化的差分量化器,用于產生一個帶符號的4的編碼數據i,該數據的表示7和-7之間的范圍內,其特征在于,所述編碼的值的最高位是符號位的數據。編碼時,首先要計算出16位二進制補碼的當前采樣值與上一個預測采樣值的差值d,那么將輸出的4位adpcm值i即為該差值的量化編碼。在該算法的過程中,將存儲預測采樣定義為一個結構變量,還定義一個量化步長索引,并制定兩個表。一表是索引調整表,差值量化編碼i作為其輸人

52、,用以更新步長索引;另一表為步長調整表,將步長索引為其輸人,步長q為輸出。編碼時,先用上一個采樣點的步長去索引查步長調整表求出步長q。若是當前采樣值與采樣預測值之間的差值d為負,那么i的d3位置即最高位為1。假如該差值絕對值大于步長q,那么i的d2位置1。若大于,則i的d1位置1,如果大于,則i的d0位置1。如果上述條件沒有得到滿足,那么相應的位置將被設置為0。這將確定的編碼值i,然后,再將編碼值i作為指標,來作為索引調整表的輸入,然后輸出索引調整通過查表所獲得,并與結構變量中原步長索引相加,生成新的步長索引用于編碼下一個采樣值中使用。編碼輸出i后,還需要重復進行相同的計算過程,從而獲得新的預

53、測樣本。 3.5.2 解碼原理解碼是編碼的相反的過程,給出adpcm的解碼過程框圖如圖7所示。將前面編碼輸出的i作為解碼器的輸入,然后通過逆量化器將編碼i逆量化成差值。差值和預測采樣相加后得到一個解碼輸出。解碼的過程和編碼過程中求圖7 解碼原理框圖預測采樣其原理是相同的,如果你想能夠在解碼端的也重現,那么你需要編碼端的能夠很好的跟蹤上。這里所涉及的因素算法本身的延遲和實施平臺,實時的方法等。解碼過程:首先求得獲得量化步長,這個可以根據步長索引查步長調整表來得到,并讓差值量化編碼i經過逆量化器后得到語音差值,這是求i的逆過程;接著和前次預測值一同重建當前的語音信號;最后根據固定預測,更新預測采樣

54、,用i去更新量化步長索引值。4 基于adpcm的語音編解碼設計的軟件實現本章提出了一種基于adpcm的語音編解碼設計,確定adpcm實現的總體設計框圖,以及adpcm編碼和解碼實現過程的設計流程圖, 并采用matlab軟件對adpcm編解碼系統的實現進行了仿真。4.1 總體設計框圖依據adpcm編解碼的基本原理,得出該設計的總體設計框圖如圖8所示,首先用電腦自帶錄音軟件錄制一段“.wav”格式語音作為設計中的信源即“輸入語音信號”。用matlab自帶函數“wavread(文件名)”將語音信號讀取進來(該函數讀入即為離散信號)并對其采樣;然后,用adpcm的編碼方式對其編碼;再將編碼后的信號輸入到一個模擬的信道中模擬傳輸,在輸出端對信號進行語音還原即adpcm的解碼,并求得原始信號與編解碼傳輸信號之后的誤差。圖8 程序框圖該主程序主要代碼如下:y,fs=wavread(lf.wav);sound(y,fs) %播放原始語言y=wavread(lf.wav); %讀入原始語音y1=y(1:1000:1323000 ,1); %采樣bmh=bm(y1); %對信號進行編碼x=awgn(bmh,20); %加白噪聲模擬信道bmh=round(x); %濾波取整y=jm(bmh);

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論