




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第1章緒論1.1數字通信的一般模型1.2常見的媒體信號1.3媒體信號編碼的必要性
1.4媒體信號壓縮編碼的分類
1.5媒體信號壓縮編碼標準
習題與思考題 1.1數字通信的一般模型
人類社會是建立在信息交流的基礎上的,信息交流是推動人類社會文明、進步與發展的巨大動力。根據香農信息論的定義,信息是事物運動狀態或存在方式的不確定性的描述。人們通過對周圍世界的觀察得到各種信息,信息是抽象的意識或知識。
通信的本質就是信息交流,即通信系統上傳輸的本質內容是信息。但是為了傳輸信息,必須在發送端將信息轉化為具體的消息。消息是包含信息的語言、文字、數據、圖像、符號等。在通信中,消息特指擔負著傳遞信息任務的符號及其序列。消息是具體但非物理的。為了在實際的通信系統中傳輸消息,就必須把消息加載(調制)到具有某種物理特征的信號上去。也就是說,信號是信息的載體,它是物理性的,如電信號、光信號等。接收端收到載有信息的物理信號后,經過處理變成語言、文字、圖像、符號等形式的消息,人們再從中得到有用信息。
圖1-1是比較完整的數字通信系統的一般模型,現實生活中的數字通信系統基本上都可以用此模型來概括。這個模型將數字通信系統抽象為信源、編碼、信道、解碼(譯碼)、信宿等五個模塊。圖1-1數字通信系統的一般模型
1.信源
信源是信息的來源地,它的作用就是產生信息,但信息并不能直接輸出。信源輸出的是以符號形式出現的具體消息,這些消息承載了信息。信源輸出的消息可以有多種形式,但可以歸納為兩類:離散消息,例如由字母、文字、數字等各種符號組成的符號序列或單個符號;連續消息,例如語音、視頻等在時間上連續的信號。
信源的核心問題是信源符號的概率如何分布,它包含多少信息,用香農信息論的術語來說,就是信源的熵是多少。
2.編碼器與譯碼器
編碼是對消息符號進行處理的過程,或者說是把消息變換成信號的過程,而譯碼就是編碼的反變換。根據編碼器的實際功能,可將編碼器分為三種:信源編碼、信道編碼和加密編碼。
信源編碼的作用有兩個:一是把信源發出的消息轉換成由碼元符號(一般為m進制碼元)組成的碼元符號序列,形成基帶信號;二是通過信源編碼來壓縮信源的冗余度,減少傳輸所需的碼率,提高通信系統傳輸消息的有效性(這正是本書要討論的內容)。信源編碼的主要指標就是它的編碼效率,即理論上所需的碼率與實際達到的碼率之比。信道編碼的作用是在信源編碼器輸出的符號序列上有目的地增加一些監督碼元,使之具有檢錯或糾錯的能力,其目的在于提高通信系統傳輸消息的可靠性。由于信道編碼會增加冗余的監督碼元,因而會增大碼率,這正好與信源編碼相反。
加密編碼的目的在于隱藏碼元符號中的信息內容,防止信號在傳輸過程中信息被泄露,從而提高通信系統傳輸信息的安全性。
譯碼器與編碼器一一對應,其作用是對接收到的編碼信號(已疊加了干擾)進行反變換,以盡可能準確地恢復原始的信源符號。
3.信道與干擾源
信道是傳輸消息的通道,或者說是傳輸物理信號的設施和媒介。在狹義的通信系統中,實際信道有明線、電纜、波導、光纖、無線電波傳播空間等等,這些都屬于傳輸電磁波能量的信道。對廣義的通信系統來說,信道還可以是其他的傳輸媒介。信道除了傳送信號以外,還有存儲信號的作用,如書寫通信方式就是一例。信道的主要問題是單位時間內它能夠不失真傳送多少信息,即信道容量的大小。
信息在處理和傳輸的每個環節都可能會引入噪聲和干擾,使得信號發生畸變。為了分析方便,一般把在系統其他部分產生的干擾和噪聲也等效地折合成信道干擾,看成是由一個噪聲源產生的,作用于所傳輸的信號上。這樣,信道輸出的是已疊加了干擾的信號。由于干擾或噪聲往往具有隨機性,所以信道的特性一般用概率空間來描述(如輸入和輸出之間的條件概率矩陣或者條件概率密度函數),而噪聲源的統計特性又是劃分信道的一個重要依據。
4.信宿
信宿是信息傳遞的對象,即信息的目的地。信宿一般為接收信息的人或機器,它實際接收的是消息v,該消息v可以與信源發出的消息u相同,也可以不同。當兩者形式不同時,v是u的一個映射。信宿關心的問題是能夠從v中收到或提取多少有用信息。
1.2常見的媒體信號
圖1-1所示的數字通信系統傳輸的主要內容為媒體信號。媒體信號客觀地表示了自然界和人類活動中的原始信息,是承載各種信息的載體,是信息的具體表示形式。媒體信號編碼屬于圖1-1中的信源編碼,其目的主要在于解決媒體信號傳輸過程中的有效性問題。
常見的媒體信號主要包括下面幾種:
(1)文字(Text):文字是語言的書寫符號系統,是記錄語言的書寫形式。
(2)圖像(Image):圖像一般指自然界中的客觀景物通過某種系統映射的結果,可使人們產生視覺感受,如照片、圖片等,一般采用位圖形式進行存儲。就色彩而言,圖像一般分為單色圖像、灰度圖像和彩色圖像三大類。
(3)圖形(Graphic):圖形是指采用某種算法語言或應用軟件生成的矢量化圖形,一般采用數學方法進行描述,具有體積小、線條圓滑變化等特點。
(4)音頻(Audio):人類能夠聽到的所有聲音信號的總稱,其頻率范圍在20Hz~20kHz左右。語音是一類特殊的音頻信號,單指由人發聲器官發出的各種聲音信號。
(5)視頻(Video):視頻信號是動態播放的圖像。利用人眼的視覺暫留效應,當每秒鐘播放24幅以上內容連續變化的靜態圖像時,人眼無法辨別單幅的靜態畫面,看上去是平滑連續的動態圖像,即視頻,如圖1-2所示。圖1-2由連續變化的圖像構成的視頻
1.3媒體信號編碼的必要性
近年來,隨著計算機、多媒體和網絡通信技術的飛速發展,數字媒體技術逐漸代替了模擬媒體技術。例如,數字媒體技術已經在數字影音系統、高清晰度電視、數字音頻廣播、電話會議系統、無線通信與移動通信、消費類電子、互聯網多媒體業務等領域中得到了廣泛的應用。然而,數字化后的音視頻等媒體信號,如果沒有有效的壓縮編碼方案,海量的數據將給存儲和傳輸帶來巨大的壓力,這就促進了各種媒體信源壓縮編碼算法的發展。在語音、音頻、圖像和視頻等媒體信號實時通信中,語音信號需要的傳輸帶寬無疑是最低的。語音信號的帶寬一般在4kHz以下,對應的采樣頻率為8kHz,一般采用8位壓擴量化,原始的未經壓縮的數字信號的碼率為I=8×8=64kb/s。在當代的數字通信系統中,這個碼率雖然不是很高,不采用壓縮編碼技術也可以實現實時通信,但是采用壓縮編碼技術后其效率會更高。比如,在現代的移動通信系統中,實際的語音信號經過壓縮編碼后碼率一般都低于16kb/s,甚至更低。這樣,實時傳輸壓縮后的語音信號的信道帶寬僅為實時傳輸原始語音信號信道帶寬的1/4,甚至更低,從而節省了信道資源。從存儲角度來看,一幅2032×1354像素、每像素采用8bit量化的灰度圖像,需要2.7MB左右的存儲空間。同樣大小的彩色圖像,則需要8.1MB左右的存儲空間。一個存儲容量為1024MB的數碼相機,僅能拍攝存儲126張未經壓縮的2032×1354像素的彩色圖片。實際上,現在的數碼相機一般都會采用JPEG靜態圖像壓縮技術,該技術能根據圖像內容動態調整壓縮比例,但一般都能達到10∶1的壓縮比例。這就是說,一個存儲容量為1024MB的數碼相機,至少能拍攝存儲1200張以上2032×1354大小的彩色圖片,這對大多數應用已經足夠。在語音、音頻、視頻等媒體信號實時通信中,高清晰視頻(HighDefinitionTelevision,HDTV)信號需要的傳輸帶寬無疑是最高的。HDTV的圖像大小一般為1920×1080個像素,每秒鐘60幀,一般按4∶2∶2的格式采樣亮度信號和色度信號(見2.2.5節),每秒鐘的數碼率高達1.85Gb/s。這就是說,一分鐘的未經壓縮編碼的HDTV信號需要高達13.9GB的存儲空間,而一部HDTV格式的電影一般都時長90分鐘。可見,如果沒有視頻壓縮編碼技術,實時傳輸和存儲未經壓縮的HDTV信號幾乎是不可能的。由此可見,海量的語音、音頻、圖像及視頻等媒體數字信號,如果不進行壓縮編碼,則無論是傳輸或是存儲這些信號都很困難。因此,媒體信號壓縮編碼的作用是不可替代的,它的社會效益、經濟效益也是非常明顯的。當媒體信號經過壓縮編碼后,不僅其數據量大大減少了,也帶來了一些其他好處:
(1)節省媒體信號在各種信道上的傳輸時間,使信息交流更加快速,即時間域壓縮;
(2)減少媒體信號在實時傳輸時的帶寬要求,或者增加現有信道可開展的業務,即頻率域壓縮;
(3)減少媒體信號在通信時的能量消耗,降低通信設備的發射功率等,即能量域壓縮;
(4)減少媒體信號存儲時所需的內存空間,即空間域壓縮。
1.4媒體信號壓縮編碼的分類
1.信號編碼的一般模型
媒體信號經過數字化后,轉換成數據信號。媒體信號數據的壓縮編碼就是以盡量少的數據來表示原始媒體信號的信息,其一般模型如圖1-3所示。圖1-3信號編碼的一般模型
(1)建模表達。根據要解決的問題,建立一個客觀的數學模型,以便能更有效或更緊湊地重新表達原始數據信號,減少數據中的冗余,得到與原始數據信號相關但又不同的模型參數數據。
(2)二次量化。用更簡潔的數碼表示得到的模型參數數據。對具體的應用來說,由于這些模型參數數據可能用無限(或過高的)表示精度,而實際應用不需要如此高的精度,所以可以重新量化這些模型參數,降低表示這些參數所需要的數據量。由于從模擬信號轉換到數字信號時已經經過了一次量化,因此此處稱為二次量化。
(3)熵編碼。對模型參數的量化表示或消息流進行碼字分配,得到最后的壓縮碼流。此時一般要求編碼后的碼流能不失真地反映模型參數的量化符號,即能保持量化后信號的熵,所以稱之為熵編碼(具體參見第4章)。
在上述三個步驟中:步驟(1)既可以為可逆過程,也可以為不可逆過程;步驟(2)一般都為不可逆過程;步驟(3)一般為可逆過程。可逆或不可逆是指能否由經過處理后的數據無差錯地恢復出處理前的數據。如果能無誤差地恢復,則為可逆過程;反之為不可逆過程。
2.信號壓縮編碼分類
媒體信號的壓縮編碼方法可根據編碼過程中是否采用不可逆過程分為兩類,即可逆壓縮編碼和不可逆壓縮編碼。可逆壓縮編碼又叫做冗余度壓縮、無失真編碼、熵保持編碼等,其核心是可以由壓縮碼流無失真、無差錯地恢復出原始碼流。不可逆壓縮又叫做熵壓縮、有失真編碼,其核心是不能由壓縮碼流無差錯、無失真地恢復出原始碼流。香農在創立信息論時指出,數據是信息與冗余度的組合,熵編碼的目的就是要去除數據中的冗余度。實際的媒體信號編碼同時采用可逆壓縮(無失真)編碼技術和不可逆壓縮(有失真)編碼技術。設想我們從森林將一批大小不一的圓木(數據)裝上一輛卡車,并將其運輸(通過信道傳輸)到木材加工廠。這時,我們的目標是降低運輸成本,而主要手段是在同一輛車上裝更多的圓木,同時盡量減輕每車圓木的重量(可以看到,裝更多圓木和減輕每車圓木重量有時是矛盾的)。在這種情況下,我們判斷有無失真的標準是圓木的形狀是否發生變化。通常,我們想多裝一些圓木最簡單的方法就是有序地擺放圓木。這是因為隨機擺放圓木的話,圓木之間的間隙會很大(外在冗余度),有序擺放可以減少間隙(外在冗余度去除),從而可以在同一輛卡車上裝載更多的圓木。其次,由于濕的圓木比較重,體積也有所膨脹(存在“內在冗余度”水分),這對降低運輸成本都是不利的。因此我們可以將這些木材晾干(內在冗余度去除)后再運輸。最后,如果木材加工廠允許我們對圓木進行少量的初加工,比如去掉樹皮、將圓木加工成方木、將木材加工成標準長度等,并且這些加工過程中的廢料都會被扔掉,則同一輛卡車上必然能裝載更多的木材,同時能減輕每車木材的重量。顯然,此時圓木的形狀已經發生改變,比如從圓木變成方木(有失真壓縮),而這種壓縮已經“不可逆”,即我們無法再從方木“還原”成原來的圓木。由這個例子我們可以給出一些壓縮編碼的基本概念和結論:
①有冗余度就可以壓縮(隨機擺放圓木有較大空隙,濕的圓木內部有水分);
②壓縮只能在一定限度內可逆(圓木形狀不發生改變);
③超過一定的限度,必然帶來失真(如去掉圓木樹皮、圓木變方木、加工圓木至標準長度等,這些措施都會使得圓木的形狀發生改變);
④允許的失真越大,壓縮的比例也越大(極端情況下,圓木因初加工被拋棄,沒有圓木需要運輸)。
1.5媒體信號壓縮編碼標準
1.音頻編解碼標準
音頻編碼始于20世紀70年代的脈沖編碼調制(PCM),并按語音編碼和音頻編碼兩條路線發展。在音頻編碼方面,主要關鍵技術包括:心理聲學模型、時頻變換、窗切換、時域噪聲整形、帶寬擴展、立體聲
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 英語社團年度工作總結模版
- 教育行業招生營銷數字化策略與教育改革策略報告2025
- 汽車共享出行平臺運營模式創新與用戶出行需求洞察報告
- 汽車維修廠總結模版
- 七年級生物下冊知識點總結模版
- 新三板全國中小企業股份轉讓系統掛牌企業董監高任職資格總結模版
- 區塊鏈技術在市場營銷策略中的創新實踐
- 中醫婦科學總結模版
- 健康檔案數字化管理平臺的研究與實施
- 教師培訓總結
- 水電站砂石加工系統封閉施工方案
- 2024輸送機械檢查與維護規范第1部分帶式輸送機
- SH-T+3098-2011石油化工塔器設計規范
- 2024年湖北省武漢市中考語文試卷真題(含答案)
- 個人代持協議書
- 人教版小學數學五年級下冊期末測試卷有完整答案
- 機組啟動試運行調試大綱
- 醫務人員技術檔案
- JBT 7387-2014 工業過程控制系統用電動控制閥
- 18文言文二則《囊螢夜讀》公開課一等獎創新教學設計
- (正式版)JBT 106-2024 閥門的標志和涂裝
評論
0/150
提交評論