




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1.1數字視聽技術概述1.2信號的數字化1.3信號的調制與糾錯1.4數據壓縮技術的標準1.5視頻數據壓縮技術1.6音頻數據壓縮技術技能訓練項目1激光視盤機符號識別技能訓練項目2激光視盤機與外圍設備的連接技能訓練項目3激光視盤機的操作技能訓練項目4激光視盤機的整機檢驗本章小結思考題第1章數字視聽技術基礎
1.1數字視聽技術概述
數字視聽技術是指應用數字編碼方式來描述和表達圖像、聲音等各種媒體信息,進行存儲后借助于數字信號處理技術進行處理,并通過音、視頻重放設備再現聲音和圖像信息的一門新興技術。視聽技術經歷了一個從模擬到數字的發展過程,早期的錄音機、錄像機和電視機視聽產品,均為模擬式產品,從音、視頻信號的獲取、處理、存儲到輸出均采用模擬技術。隨著數字技術的發展,CD機、DVD機、數字攝錄機、數字電視機等數字視聽產品已得到廣泛應用。1.1.1數字視聽技術的發展
數字視聽技術的出現,把人們帶入了一個圖像更清晰、聲音更逼真的領域。現代科技的飛速發展,使得視聽產品升級換代日新月異。數字視聽技術借助激光技術、網絡技術、通信技術、計算機技術及存儲技術的發展,其產品得到了長足的發展,使消費者充分享受到數字視聽帶來的樂趣。圖1-1表示數字視聽技術在不同技術應用領域的主要產品類型。圖1-1數字視聽產品的應用
1.激光視聽技術
激光英文名是Laser,即Lightamplificationbythestimulatedemissionofradiation的縮寫。激光技術應用在數字視聽領域是基于其一個最重要的特點,即激光可以聚焦成能量高度集中的極小光點,這樣就可以在一張直徑僅為數厘米的光盤上以極高的密度記錄下經壓縮編碼處理的數字音、視頻信息,并且讀取信號的激光頭與光盤沒有任何接觸,不會造成光盤磨損,有利于長久保存節目源。20世紀70年代后期,荷蘭飛利浦公司成功開發出光盤制造技術,日本索尼公司在系統軟件方面也取得了較大突破,完善了數字音頻信號的編碼、解碼和糾錯的系統軟件,解決了機械振動、灰塵污染、碟面劃傷、制造缺陷等對光盤記錄和播放的影響,為激光視盤機大規模商業生產打下了一定基礎。
1980年,飛利浦、索尼、寶麗金等35個世界制造商就視盤機的信號記錄格式和光盤制造材料等技術規格達成了協議,形成了CD光盤國際標準。1982年飛利浦和索尼公司聯合開發制造了商用數字視盤機,即CD-DA,簡稱CD機,主要用于記錄音樂節目。為滿足不同的需求,在CD機的基礎上不斷開發出新的品種,形成了CD系列產品。主要有CD-G、CD-ROM、CD-I、CD-R等,這一階段的產品采用的都是MPEG-1音、視頻編碼標準。
DVD光盤是DigitalVideoDisc(數字視頻光盤)的簡稱,后來則稱為“DigitalVersatileDisc”,即“數字通用光盤”,它是在VCD視盤機基礎上發展起來的,將圖像和伴音信號記錄在CD大小的光盤上,使用了比CD激光頭波長更短的激光管,其信號記錄密度也大大高于CD盤片,其整機性能得到了很大的提高。
在畫面上,DVD采用MPEG-2解壓縮標準。比以往的VHS錄像和MPEG-1標準要清晰得多,VHS和MPEG-1壓縮標準的解析度最多達到240線,而MPEG-2解壓縮標準能達到500線以上,可與電影播放質量相媲美。在音效上,DVD光盤可以提供杜比數碼環繞立體聲效果,就是DolbyAC-3-5.1聲道效果。DolbyAC-3-5.1是一種全數字化的音頻編碼技術。它提供6個完全獨立的聲道,即兩個全頻帶主聲道、兩個全頻帶環繞聲道、一個全頻帶中置聲道和一個1/10頻帶的重低音聲道。通過這6個聲道,使觀眾明顯感覺到電影院那種身臨其境的立體效果。近年來,DVD視盤機又有了新的發展,逐行DVD、高清DVD、藍光DVD等出現在人們的視野。2002年,由13家國際知名廠商聯合宣布成立藍光光盤組織(Blue-rayDiscFounders),宣布支持采用藍色激光DVD存儲技術制定出新的高密度DVD標準——Blue-rayDisc(BD)。現在所說的“藍光”、“藍光碟片”指的是Blue-ray和HDDVD的泛稱,因為兩者都是使用藍光波長的激光。Blue-ray是專指Sony和Phillips合作研發出的規格。HDDVD是東芝所說的HDDVD技術。Bluedisc和HDDVD都是基于藍色波段的激光頭,因此都可以稱為藍光,藍光是對下一代光盤載體的統稱。從技術層次看,雖然現在的DVD在存儲的密度及讀寫速度方面較之CD已經有了長足的進步,但DVD仍舊采用的是紅色激光波段進行數據的讀取和刻寫,使得在光存儲的密度以及讀寫速度方面的提升受到了限制。而新一代的藍光DVD技術采用全新的藍色激光波段進行工作,光盤存儲容量在原來的DVD的基礎上擴大了將近5倍,使得存儲的容量有了很大的突破。
2.網絡視聽技術
近年來,隨著通信技術綜合化、數字化、智能化和個性化的發展,以及計算機網絡技術的日益成熟,在網絡平臺上實現語音、數據和圖像傳輸等多種業務已經成為通信行業發展的目標和必然趨勢。數字視聽技術在電話網(包括固定和移動電話網)、廣電網、計算機網上的應用取得了迅猛發展,得到了廣泛應用,如視頻點播、在線影院、遠程醫療、遠程教育、交互式電視等,滿足各個行業網絡化發展的需要。隨著計算機性能和網絡通信技術的發展,人們開始借助于網絡瀏覽信息、交換數據和商業交易。而圖像、視頻等多媒體業務已逐漸成為信息處理領域中主要的信息媒體形式。因此下一代網絡(NGN)將語音、數據、視頻等多種業務集于一體,它是一個建立在IP技術基礎上的新型公共電信網絡。目前,下一代網絡還沒有完全投入運行,所以互聯網就成為音、視頻傳輸的重要手段。
在網絡上以數據流的方式實時發布音頻、視頻多媒體內容的媒體技術叫流媒體技術,流媒體的技術應用主要表現在如下幾個方面。
1)視頻點播
隨著計算機技術的發展,流媒體技術越來越廣泛地應用于視頻點播(VOD)系統。VOD系統是指在用戶需要時隨時提供交互式的視頻服務業務。目前VOD技術逐漸趨于完善,并廣泛應用于局域網及有線電視網。它能對單個用戶提供大量的影片、視頻節目、游戲、信息以及其他服務,其區別于傳統視頻節目接收方式的交互性表現在主動性和選擇性強,用戶對通過網絡傳送來的節目擁有播放控制能力。流媒體的視頻直播應用突破了網絡帶寬的限制,實現了在低帶寬環境下的高質量影音傳輸,其中的智能流技術保證不同連接速率下的用戶可以得到不同質量的影音效果。但音、視頻文件的大容量仍然阻礙了VOD技術的進一步發展。由于服務器端不僅需要大容量的存儲系統,同時還要承擔大量數據的傳輸,因而服務器根本無法支持大規模的點播。同時,由于局域網中的視頻點播覆蓋范圍小,用戶也無法通過Internet等網絡媒介收聽或觀看局域網中的節目。
2)視頻會議
市場上采用流媒體技術作為核心技術的視頻會議系統并不占多數。視頻會議是流媒體技術的一個商業用途,采用流媒體格式傳送音、視頻文件,使用者不必等待整個影片傳送完畢就可以實時、連續地觀看,雖然在畫面質量上有一些損失,但就一般的視頻會議來講,并不需要很高的圖像質量。當然,流媒體技術并不是視頻會議的必需選擇,但對視頻會議的發展起了重要的推動作用。
通過流媒體進行點對點的通信,最常見的就是可視電話。只要兩端都有一臺接入Internet的電腦和一個攝像頭,在世界任何地點都可以進行音、視頻通信。此外,大型企業可以利用基于流媒體的視頻會議系統來組織跨地區的會議和討論。
3)遠程教育
電腦的普及、多媒體技術的發展以及Internet的迅速崛起,給遠程教育帶來了新的機遇。越來越多的遠程教育網站開始采用流媒體作為主要的網絡教學方式。在遠程教學過程中,最基本的要求就是將信息從教師端傳到遠程的學生端,需要傳送的信息可能是多元的,如視頻、音頻、文本、圖片等。將這些信息從一端傳送到另一端是實現遠程教學需要解決的問題,在當前網絡帶寬的限制下,流媒體傳輸將是最佳選擇。學生在家通過一臺計算機、一條電話線、一個調制解調器就可以參加遠程教學。教師也無需另外做準備,授課的方法基本與傳統授課方法相同,只不過面對的是攝像頭和計算機而已。使用流媒體的VOD技術還可以進行交互式教學,達到因材施教的目的。像RealSystem、Flash、Shockwave等技術就經常應用到網絡教學中。學生可以通過網絡共享學習經驗。大型企業可以利用基于流媒體技術的遠程教育對員工進行培訓。
4)?Internet直播
隨著寬帶網的不斷普及和流媒體技術的不斷發展。沖浪者能夠在Internet上直接收看體育賽事、商貿展覽等,廠商可以借助網上直播形式將自己的產品和活動傳遍全世界。網絡帶寬問題的改善促進了Internet直播的發展,Internet直播已經從實驗階段走向實用,并能夠提供較滿意的音、視頻效果。流媒體技術的發展,實現了在低帶寬環境下提供高質量的音、視頻信息;保證不同連接速率下的用戶能夠得到不同質量的音、視頻效果;減少服務器端的負荷,同時最大限度地節省帶寬。流媒體在Internet直播中充當著重要角色。
5)全數字視頻網絡監控系統
數字視頻壓縮技術已經取得較大的進展,MPEG-4、H.264等新的視頻壓縮格式使得在保證較高圖像質量前提下的視頻碼率有效地減小到不足1Mb/s,甚至在不足100kb/s的帶寬下也能傳輸質量很好的CIF幅面的全實時圖像。另外,網絡環境也取得了前所未有的進展,ADSL、HFC等各種網絡接入方式迅速普及到各種用戶應用領域,基于網絡的電視監控系統已成為電視監控系統實現方式的主流模式,無論系統大小,幾乎都以該系統是否有網絡接口作為評判系統是否具備了先進性的依據之一。
3.其他新型視聽技術
1)?MP3與MP4
MP3(MPEG-1Layer3)是當今較流行的一種音頻格式,全稱為MPEG(MPEG:MovingPictureExpertsGroup)AudioLayer3。它是基于MPEG-1第三層音頻(正式名稱11172-3)壓縮算法的一種(Layer3)。MP3是一種有損壓縮,它是基于人耳的聽覺特性來提高壓縮率的一種編碼算法。在基本上保持CD音質的前提下,MP3的數據壓縮比高達1∶12,一首4分鐘的歌曲約3~5Mb,但音質仍然相當高。
MP4使用的是MPEG-2AAC技術,AAC俗稱A2B或高級音頻編碼(AdvancedAudioCoding)。其中,MPEG-2是MPEG于1994年11月針對數碼電視(數碼影像)提出的。它的特點是音質更加完美而壓縮比更大(1∶15)。MPEG-1支持采樣率為32kHz、44.1kHz和48kHz的單聲道及雙聲道編碼,而Layer3預設為32~320kb/s。MPEG-2則是對MPEG-1的向后兼容多聲道擴展方案,它增加了一個“低頻擴展”聲道,從而提升至5個聲道編碼,比特率的變化范圍增至1Mb/s。而MPEG-2AAC在采樣率為8~96kHz下提供了1~48個聲道可選范圍的高質量音頻編碼。
MP4并不是MPEG-4或者MPEGAudioLayer4。MPEG-4是一種多媒體應用技術規范,它提供了交互使用圖像、多媒體的合成技術,主要體現在范圍極廣的比特率下自然合成音頻的編碼和組合。它是一種開放型的技術,用一種新規范包容了所有多媒體應用技術。
2)多媒體計算機技術
多媒體計算機技術(MultimediaComputingTechnology)是指計算機綜合處理文本、圖形、圖像、視頻和音頻等多種媒體信息,使多種信息建立邏輯鏈接、集成為一個系統并具有交互性的技術。多媒體技術的基本特征是信息載體多樣性、集成性和交互性。人機相互交流是多媒體最大的特點,沒有多媒體,對于電視、電影,你只能在一旁欣賞,而在多媒體上,你可以從圖形到顏色都予以修改,你可以參與其中,改變劇情,叫演員按照你的意思演出。要把一臺普通的計算機變成多媒體計算機要解決的關鍵技術是:①視頻、音頻信號獲取技術;②多媒體數據壓縮編碼和解碼技術;③視頻、音頻數據的實時處理和特技;④視頻、音頻數據的輸出技術。數字視聽技術在PC機應用中主要有4個發展階段。第一階段,數字視頻、音頻只在一些特定的專業領域應用。這主要是從事影視制作的專業人員利用計算機數字視頻進行編輯、特殊效果處理等,這些功能僅是數字視頻的少部分,基本上代表了用最小的代價在硬件上完成數字編輯。第二階段,可以在計算機上看到視頻實時顯示,需要有外部視頻源。第三階段,數字音、視頻在專業領域的廣泛應用。可以捕獲視頻序列,將視頻序列壓縮后存儲起來,隨時可以再播放。具體實現有兩種捕獲視頻序列的方法:—種是軟件方法,此法壓縮成本低,但所支持的視頻顯示窗口不能太大;另一種是硬件方法,此方法要比軟件方法的壓縮快得多,所支持的視頻窗口也可以較大,但成本較高。另外,此階段在標準化方面還不成熟,所以盡管存在許多視頻獲取方法,但不能保證獲取的視頻能在其他文件上使用。第四階段,數字音、視頻技術的標準化與大眾化。對數字視頻如何存成文件進行了標準化,AVI(AudioVideoInterleaced)成為標準文件格式,數字視頻不再是特殊用途的工具了,加上壓縮/解壓技術運用,使數字視頻文件存儲在PC系統成為可能并能在此基礎上進行音、視頻文件的編輯和處理。多媒體技術使數字視聽技術、計算機技術和通信技術3大信息處理技術緊密地結合起來,為信息處理技術發展奠定了新的基石。1.1.2數字視聽設備的種類與特點
1.數字視聽設備的種類
1)激光視聽設備
激光視聽設備是采用光盤存儲數字音、視頻信息,通過激光讀取信息的數字設備,主要包括CD機、VCD機、DVD機等,新的產品有HDDVD(高清DVD)和藍光DVD。
2)網絡視聽設備
網絡視聽設備是利用通信網絡進行圖像和聲音通信的數字設備,包括會議電視、可視電話、視頻點播、數字閉路電視以及Internet上的各項應用等。
3)便攜式視聽設備
便攜式視聽設備是能夠隨身攜帶的數字視聽設備,目前在市場上普及的有MP3播放器和MP4播放器等。
2.數字視聽設備的特點
數字視聽設備與模擬視聽設備相比,具有如下幾個方面的特點。
1)數字化
數字技術在越來越多的音、視頻產品中應用,模擬視聽產品已漸漸退出歷史舞臺。繼激光數字視聽產品取代原來的模擬錄音、錄像機后,我國電視數字化的進程明顯加快,模擬信號向數字信號過渡全面展開。這不僅體現在單一數字設備的改進和創新上,如出現了數字攝像機、錄像機、特技機、切換臺等大批運用數字技術的設備,而且大規模、整體性的數字系統也日趨完善,出現了全數字電視演播室、全數字電視轉播車、數字衛星新聞采集(DSNC)轉播車等。這種數字化還正向全電視系統縱深發展,相繼出現了地面數字廣播(DVB-T)、數字衛星直播用戶(DTH)等。
2)集成化
隨著數字電子技術的發展,一塊芯片上可以集成越來越多的音、視頻信號的處理功能,使產品的用途更廣,體積更小。
3)網絡化
現代的數字視聽產品不僅能提供高清晰度的圖像和高保真的聲音,而且還有多種用途,如點播節目、網上購物、網上銀行、網際漫游等,可以促進電視、電腦、通信三者的融合,成為信息高速公路進入家庭的捷徑。技術人員已經擬定了一套適應數字視聽產品相互連接的家庭網絡的基本格式。這套方案的確立,使未來家庭數字視聽產品之間可以實現相互控制操作。
4)個性化、人性化
數字視聽產品設計將突出個性化和人性化。激烈的競爭促使生產者不斷對消費市場進行細分,推出滿足個性化需求的新技術、新產品,像大屏幕液晶電視、大容量快速存儲技術、技術含量高的數碼影像產品都更多地體現出人性化設計的特點。
1.2信號的數字化
1.2.1模擬信號與數字信號
1.模擬信號及其特點
模擬信號是指在時間軸上連續變化的信號。對于模擬信號,可以通過相對應的一些參數(如頻率、周期、幅度等)來描述其變化的情況。模擬信號雖具有變化直觀、形象等特點,但容易受到干擾,而且其所表示的范圍較小,精度相對較低。
2.數字信號及其特點
數字信號是指用一系列數據組來表示的信號,數字信號在時間軸上是離散的,而且表示數字信號幅度的數字量也是離散的。數字信號只有0或1兩種狀態,因此,它具有抗干擾能力強、精度高、表示的動態范圍寬、穩定性高、便于存儲和變換等一系列優點。
由于CD光盤上記錄的是數字化音頻信號,VCD/DVD光盤上記錄的是數字化的音頻和視頻信息,因此,在將模擬的音頻和視頻信號記錄到光盤之前,必須對其進行數字化處理。1.2.2音頻信號的數字化
將模擬的音頻信號變化為數字信號,必須經過采樣、量化和編碼3個主要過程。圖1-2是模擬信號數字化的過程示意圖。圖1-2模擬信號的數字化過程
1.采樣
采樣是將模擬信號變換為數字信號的第一步。所謂采樣,就是以一定的頻率在時間軸上對模擬信號離散地進行取樣,用離散的樣本值代替原來連續的信號波形的過程。采樣時,在一定的時間范圍內,采樣時間間隔越小,采樣點越多,因而采樣頻率等于采樣時間間隔的倒數。
在信號的數字化過程中,采樣頻率和每個時刻的采樣值非常重要,它們決定了波形的重放精度。采樣頻率越高,采樣的周期越短,丟失的信息就越少,經過數字化處理后與原來信號間的誤差就越小,精度也越高。圖1-2(a)所示為采樣脈沖與模擬信號的關系示意圖。在實際應用中,并不是無限地追求高精度,而是要求精度滿足要求就可以了。根據奈奎斯特采樣定理,只要采樣頻率大于或等于模擬信號中最高頻率的2倍,就可以不失真地恢復出原模擬信號。例如,音頻信號的最高頻率是20kHz,采樣頻率應大于或等于40kHz。
在實際應用中,為了能與數字式磁帶錄音機PCM處理器使用的采樣頻率(44.1kHz)兼容,在錄制CD時,一般采用44.1kHz作為采樣頻率。
2.量化
由采樣獲得的信號,雖然在時間上是離散的,但其在幅度上仍然是連續的信號。要把采樣保持后得到的信號在幅度上變換成離散的信號,必須對其進行量化處理。
所謂量化,是指將各個時刻波形的幅值(采樣值)用有限位的二進制數來表示(1位二進制數稱為1bit)的過程,實質上是通過四舍五入的方法將每一個采樣值歸并到某一個相鄰整數的過程。如果用n位二進制碼來表示一個量化級(或稱量化電平級數),則它所能夠表示的量化級的總數為
M?=?2n
這樣,當選用4位二進制數時,它只能代表0~15共16個十進制數,用它來量化時,就只能代表0~15個電壓值(等級);若選用16位二進制數時,它可能代表0~65535共65536個十進制數,用它來量化時,就可以代表0~65536個電壓值(等級)。對CD中的音頻信號,采用的量化位數為16,相應音頻信號的動態范圍理論上可達到
20lg216?=?96dB音頻信號的量化示意圖如圖1-2(b)、(c)所示。由圖1-2(b)、(c)可見,經過量化處理后,量化值與采樣值之間產生了誤差。這種由于量化引起的輸入信號與輸出信號之間的誤差稱為量化誤差。
量化誤差對信號來說就是量化噪聲。量化噪聲的大小取決于量化級數的多少,即所使用的二進制位數的多少。位數越多,量化等級越細,量化噪聲就越小。通常,各種信號量化噪聲的信噪比(S/N)可表示為
(1-1)其中,b為量化位數,m為由信號的統計性質決定的常數,對正弦信號m=3.01。由此可見,對一量化位數為16的正弦信號,其信噪比接近98dB。
由于在CD系統中,對音頻信號的采樣頻率為44.1kHz,若量化位數為16,對立體聲音頻信號進行數字化時,每秒種要傳送的碼元數量,也就是碼率(或稱數據傳輸率)為
碼率?=?采樣頻率?×?量化位數?×?2?
=?44.1?×?16?×?2?=?1.4112Mb/s
若考慮到誤碼檢出和誤碼校正用碼的要求,還要增加20%~30%的冗余脈沖,則需傳送的碼率為2Mb/s,為此要求設備的帶寬必須在1~1.5MHz。
3.編碼
編碼是將已量化的各電平值用二進制數來表示的過程。經過編碼后,一個模擬信號就可以用一系列的二進制數字來表示。信號的編碼示意圖如圖1-2(d)所示。
編碼后形成的二進制碼為數字信號,在電路中用脈沖的有無,即高電平“1”和低電平“0”來表示。“1”為有脈沖,“0”為無脈沖,這些脈沖的幅度和寬度均相等。由此形成的脈沖信號稱為脈沖編碼信號,其過程用PCM(PulseCodeModulation)表示,即脈沖編碼調制。對于音頻信號,數字信號的波形與圖1-2(d)中所示的波形會有所不同,它不完全在橫坐標(即零電平)的上方,而是在零電平的上、下變化。因此,為了能夠正確表示在零電平上、下方的正、負數,必須用二進制數的補碼來表示。同時,當補碼的所有位均為0或均為1時,它所代表的數值接近于零,這一特點對于防止系統故障是非常有利的。1.2.3視頻信號的數字化
1.視頻信號的特點
如前所述,音頻信號的頻率范圍為20Hz~20kHz,而且在此頻率范圍內是連續變化的模擬信號。當采樣頻率為44.1kHz,并采用16位的量化位數時,其碼率為2Mb/s。
視頻信號與音頻信號相比,具有一些明顯的特點。首先,視頻信號是由亮度信號、色度信號、同步信號、消隱信號等組成的,頻率范圍為0~6MHz。其次,在視頻信號中,同步信號與消隱信號是固定不變的,而變化的亮度與色度信號位于消隱信號之間,這樣就使得亮度和色度信號被消隱信號分成一段一段的信號,形成在時間軸上不連續的信號。為此,對視頻信號的數字化分為全信號數字化和分量數字化兩種基本方式。全信號數字化是指對復合全電視信號直接進行數字化。這種方法相互間的干擾較大,而且當電視制式不同時,解碼方法也不同。
分量數字化是指對亮度信號Y、色差信號(R-Y)、(B-Y)分別進行數字化,然后采取時分復用制進行處理。這種方法可以避免反復編碼和解碼的過程,而且亮度信號與色差信號分開處理,相互間的影響較小,特別是可以將625/50制和525/60制統一起來,是目前普遍采取的方法。
2.視頻信號的采樣結構與采樣頻率
1)采樣結構
對于音頻信號,由于其在時間軸上是連續的,因此,對采樣點的結構沒有特殊的要求。但對于視頻信號來講,由于其在時間軸上并不是連續的,而且采用隔行掃描時奇數行與偶數行都存在半行結構,所以,在采樣時就存在著采樣點的分布問題。這是因為,若采樣頻率不是行頻的整數倍,那么,采樣點就可能發生重合,使圖像的質量下降。目前,對視頻信號數字化時,都采用固定型正交采樣結構,采樣頻率為行頻的整數倍,而且使每一場中的采樣點都對齊且重合。
2)采樣頻率
根據奈奎斯特采樣定理,采樣頻率與信號帶寬有一定的關系。對于625/50制式,其掃描帶寬為5.8~6.0MHz;對于525/60制式,其掃描帶寬為5.6MHz。考慮到采樣后的混疊噪聲要足夠小,要求采樣頻率應為被采樣信號的2.2~2.7倍。因此,對于PAL制,采樣頻率至少應為12.72~13.2MHz。
另外,為了使625/50和525/60兩種掃描制式兼容,應使用同一種采樣頻率。626/50和525/60的行頻分別為15625Hz和15734Hz,二者的最小公倍數為2.25MHz。綜上所述,亮度信號的采樣頻率應大于13.2MHz,而且是2.25MHz的6倍,選13.5MHz。
在確定色差信號的采用頻率時,考慮到色差信號CB、CR的帶寬小于2MHz,為了降低采樣后的混疊噪聲,保證采樣頻率為行頻的整數倍及制式的兼容性,色差信號的采樣頻率定為6.75MHz,為亮度信號采樣頻率的一半。而且,該頻率也是PAL制行頻的432倍,是NTSC制的429倍。
3)視頻信號的量化位數與碼率
被處理信號的信噪比與量化位數有著密切的關系,若被量化的信號是單極性信號,則信噪比可由下式確定:
=
6n?+
10.8dB(1-2)
式中,n為量化位數。由此可見,隨著量化位數的增加,信噪比相應得到提高,而且每增加一位,信噪比可提高6dB,但同時也會使電路的復雜性和設備的成本大大提高。綜合考慮,電視信號的量化位數一般取8位較為合理,此時的信噪比可達59dB。在分量數字化中,由于亮度信號的采樣頻率為13.5MHz,兩個色差信號的采樣頻率為6.75MHz,量化位數都是8bit,因此
碼率?=?13.5?×?8?+?6.75?×?8?×?2?=?216Mb/s
可見,視頻信號傳送的碼率要比音頻信號的碼率(2Mb/s)高出100倍以上。
4)電視信號的數字化標準
電視信號數字化標準有2∶1∶1、4∶2∶2和4∶4∶4等格式。DVD視盤機采用的是4∶2∶2標準,圖像水平清晰度達500線,如表1-1所示。其采樣頻率為
Y∶CR∶CB=13.5MHz∶6.75MHz∶6.75MHz
如果將亮度信號和色差信號的采樣頻率都減少一倍,就構成了2∶1∶1標準,當然每數字行的點數也要減少一倍,這就是VCD的標準,其圖像水平清晰度可達250線。
5)視頻壓縮編碼
根據上述分析可知,即使按照2∶1∶1的低檔標準編碼的電視信號,其傳輸碼率也將達到108Mb/s,要求帶寬高達100MHz。這樣,將給信號的存儲、錄放處理和傳輸等帶來巨大的困難。利用頻帶壓縮編碼技術(也稱碼率壓縮)可在不降低圖像質量的前提下降低碼率。頻帶壓縮的方法有3種,即同步信號去除、高效編碼和DCT編碼。
(1)同步信號去除。
由于電視信號在行場的逆程期間不攜帶圖像信息,因此,可以在傳輸過程中將其去除,而只傳送光柵可見部分的取樣點,即只對有效行進行數字化處理,處理完成后再嵌上行、場同步信號。這一方法在電視畫中畫技術中得到采用,可以減少17%的碼率。
(2)高效編碼。
高效編碼是利用人眼的視覺惰性和電視信號的統計特性來減少碼率的一種編碼方式。人眼的視覺惰性有兩個明顯的特點:一是視覺檢測有一個門限值,低于該門限值的誤差不會被發覺;二是該門限值會隨著時間和空間圖像的內容而變化。對于第一點,在編碼時,可以在視覺門限值較小的圖像部分將取樣頻率或量化位數取得高一些,而在視覺門限值較高的圖像部分,采用較低的取樣頻率或量化位數,這樣,就可以在不降低圖像質量的前提下降低傳送的碼率。對于第二個特點,可對幀間變化快的運動圖像,適當降低采樣頻率,此時雖然幀內圖像的水平和垂直分辨率有所下降,但由于這種運動圖像的視覺門限值較高,所以不會被發覺;對于幀間變化較慢的靜止或慢運動圖像,因其視覺門限值較低,要求有較高的分辨率,不能降低其采樣頻率。為此,可采用每兩幀傳送一次,在快速運動部分將幀內頻率降低一半,這在視覺上不會感覺到圖像質量的下降。
(3)?DCT編碼。
DCT(DiscreteCosineTransform)變換也稱離散余弦變換,它是一種數字編碼的變換方式。在正常情況下,大多數圖像信號中的低頻分量都要比高頻分量的幅度大,水平線和垂直線出現的幾率比斜線出現的幾率大。因此,可以采用DCT變換的方式,將取樣后的圖像樣值進行變換,形成新的編碼序列,以獲得更高的編碼效率。
DCT變換是一種傅里葉變換。對于二維的電視圖像來講,對應的二維DCT變換與反變換的表達式為
(1-3)
(1-4)其中,式(1-3)為DCT的正變換,它可以將像素的采樣值變換成頻率系數;式(1-4)為DCT的逆變換,它可以將頻率系數還原成像素的采樣值。式中的x,y,u,v?=
0,1,2,…,7;
f?(x,y)是像素的位置函數;F(u,v)是對應于f?(x,y)中每個像素經DCT變換后的系數函數;C(u)、C(v)是常數,當u=v=0時,C(u)
=?C(v)
=
1/,當u和v不為零時,C(u)
=?C(v)+=
1。當u?=?v?=
0時,式(1-3)可簡化為
(1-5)式(1-5)表示64個像素點的平均值,相當于直流分量。在進行DCT變換時,首先要將整幅圖像進行分割,再橫向分成若干片,每片圖像再縱向切成若干個宏塊,如圖1-3所示。為便于理解,以圖1-3中像塊取4?×?4個像點,每個像點量化位數為4的例子進行說明。對每個宏塊,在水平方向上進行4次取樣(4個像素點),垂直方向是4條掃描線,即每個宏塊中含有16個像素點。若對每個像素進行量化和編碼,運用DCT變換的方法,即可以將16個像點量化的數據從空間坐標轉換成頻率坐標分量,實際上就是將信號分解成若干頻率分量,然后用頻率的分量來表示。由圖1-3可見,數據經過DCT變換后,將大多數像點中的低頻分量表示高值,并抽到坐標的左上角,由于許多像點的亮度電平都相等,因此,高頻分量的值為零。這樣,大多數方塊中的數據將變成零,使數據量大大減少,從數據上說是起到了壓縮的效果。若畫面的亮度與色彩有明顯變化時,量化后的高頻分量將增大,低頻分量則變小。但當對頻率坐標中的系數進行量化處理后,大多數的高頻分量也變成了零,只剩下直流分量和低頻分量。此時,若對這16個像點在數據排列上進行“Z”字形掃描后編碼,則可使得編碼后的數據量大為減少,達到數據壓縮的目的。經過這種處理后,再使用哈夫曼編碼,進行一次量化運算和編碼變成更簡化的數字信號。圖1-3空間坐標轉換為頻率坐標(DCT變換)
1.3信號的調制與糾錯
1.3.1記錄信號的調制
1.光盤信息的特點
在光盤上記錄的信號,都是以微小的凹坑形式來代表數字“1”和“0”的。如果按照數據流直接以有無凹坑來記錄數據,則最小凹坑尺寸等于記錄的1位數據。光盤可讀出的最小凹坑由聚焦光點的尺寸決定,這樣就可以直接刻錄信號并決定記錄密度。在實際應用中,數據流信息是由數字“1”、“0”的某些組合構成的,這樣,數據碼流連續為“0”和連續為“1”的情況是經常出現的。在光盤錄制的數據中,若出現連續為“0”或連續為“1”的情況,不但會使得激光束的通斷頻率降低,造成光強不穩定,也會使伺服電路的工作出現不正常現象。另外,如果數字連續出現為“0”的情況,有可能使DSP電路中的壓控振蕩器工作不正常。因此,在激光視盤機中,為了使伺服系統穩定地工作,應盡量減少信號的低頻分量和直流平均分量,并排除干擾,在信號記錄到光盤之前需要對其進行調制。
2.光盤信息的調制與解調
由于CD/VCD和DVD光盤記錄數據密度等方面的不同,在CD/VCD視盤機中采用EFM(EighttoFourteenModulation)調制,而在DVD機中,對記錄的數據要進行EFM+調制。
所謂EFM調制,就是把8位字長的字符調制成14位字長的字符。對16位的數據,首先應把它分為兩個8位的數據字分別送到8位—14位變換器,變成14位的通道位信號,然后用通道位流在光盤上進行記錄。其調制規則是:在PCM碼中,每對數碼的“1”之間至少要有兩個“0”碼,而至多不能超過10個“0”碼。EFM調制遵循3T~11T原則(T為1位信號所占用的時間)。在信號記錄和拾取過程中,由于數碼流是串行傳輸的,這樣,當一個14位的數碼以1結尾,而下一個14位的數碼又有可能以1開始時,在這樣的兩組數碼的連接處便不能滿足3T~11T規則。為此,在每兩個14位的數碼之間插入了3位的連接位。3位連接位的選擇可以是000、010、001這3種的任何一種,以保證EFM數據流中相鄰兩個數據間至少有兩個“0”位的存在。
EFM+調制與EFM調制一樣,仍然滿足3T~11T的信號坑長度原則,但在EFM+調制技術中不再需要EFM要求的3位連接碼。與每位字節(8位數字信號)對應的EFM+代碼只有16位,比EFM的17位通道碼縮短了16%,提高了光盤物理空間的利用率。
EFM解調是EFM調制的逆過程。在編碼過程中,需要對模擬信號進行PCM編碼、
CIRC糾錯、EFM調制等數字化處理,將數字信號記錄到光盤上。在解碼過程中,則要進行EFM解調、反交錯、D/A轉換等處理,才能還原出原來的模擬信號。
在進行EFM解調時,需要先將串行輸入的待解調信號進行串/并轉換,然后對每個并行的14位數據進行鎖存,再經14位—8位譯碼器將其還原為8位數據信號。EFM+解調則是將16位數據還原為8位數據信號。1.3.2誤碼的檢測、糾錯與補償
1.誤碼的檢測與糾錯
對于以光盤為存儲媒體的CD/VCD/DVD視盤機來講,在原版制作、盤片制造、使用過程以及其他可能的原因下,很容易造成重放的數字信號出現誤碼現象,這樣勢必會引起重放的圖像和聲音出現不同的失真。既然在光盤的刻錄與重放過程中不可避免地會產生誤碼,這就要求對產生的誤碼進行檢測,并及時地進行糾正。在對誤碼進行糾錯之前,首先應識別信號中原有的誤碼及誤碼的位置,為此一般在原信息碼中以一定規則增加一個或幾個多余碼元,使原來信息碼中不相關的碼元變為相關。這樣,在信號的播放還原處理中,可以根據相應的規則進行誤碼校驗。
目前常用的誤碼檢測與糾錯方法一般有奇偶檢驗法、循環冗余檢驗(CyclicRedundancyCheck,CRC)法、交叉交織里德-索羅門碼(CrossInterleaveReed-solomonCode,CIRC)法、里德-索羅門乘積碼(Reed-SolomonProductCode,RSPC)法等。
1)奇偶校驗法
奇偶校驗法是一種最基本而簡單有效的校驗方法。利用奇偶校驗法可以判斷一組數據碼中個別誤碼的所在位置。該方法的基本思想是根據字節中二進制數位中的“1”和“0”的個數是奇數還是偶數來檢驗是否有誤碼產生。具體實現時,首先在信息位之外添加一位“1”或“0”,并使包括該位在內的全體碼中的“1”的個數總是為奇數(或者為偶數),然后利用當誤碼產生時奇偶發生顛倒的性質來檢查出誤碼。對于利用奇偶校驗法檢測出的誤碼,可采用縱橫奇偶校驗法進行糾錯處理。奇偶校驗法僅能對奇數個1或0發生誤碼有效。
2)循環冗余檢驗法
循環冗余檢驗法是一種比奇偶校驗的檢錯、糾錯能力更強、更加行之有效的方法。它是以代數計算方法來分析碼的結構,然后再以代數運算方法來設置檢驗位。其過程比奇偶校驗法復雜。
3)交叉交織里德-索羅門碼法
交織法是對付群誤碼的一種最基本的方法。這種方法在記錄時改變數字信號的順序,重放時再按照原來的順序重排。前者稱為交織,后者稱為去交織。經過交織和去交織處理后,原來的誤碼也同時被分散開來,群誤碼也變成了隨機誤碼,然后再采用奇偶校驗法糾錯。
交叉交織里德-索羅門碼法是指在交織前和交織后的不同字組上都加上糾錯碼,這樣就可在交織前和交織后各形成一個奇偶校驗字,使得糾錯能力進一步增強。里德-索羅門碼由里德-索羅門發明,它至少設置兩個校驗位,并且校驗位和信息位按規定的算術模式運算后產生至少兩個校正字。在記錄時校正字的值為0,在重放時根據校正字的值是否為0來判斷誤碼是否出現,并經過反運算來決定誤碼的位置,以便加以糾錯。該碼對隨機誤碼具有極強的糾錯能力。
在CD/VCD中,采用的是CIRC(交叉交織里德-索羅門)糾錯編碼方法,它是將交叉交織法與4階里德-索羅門碼進行組合而進行糾錯的。這種糾錯碼對于出現頻度很高的隨機誤碼,由里德-索羅門碼幾乎給予全部糾正;對于那些經常出現但碼長較短的群誤碼,則由交叉交織來糾正;對偶爾出現的很長的群誤碼,則由另外的交織來解決。
CIRC糾錯碼綜合了交織、延時交織、交叉交織及里德-索羅門碼等糾錯技術,不僅能糾錯隨機誤碼,還對突發誤碼有特強的糾錯能力。
在DVD中采用的是里德-索羅門乘積碼(RSPC)糾錯編碼方式,它是在里德-索羅門編碼方法基礎上發展起來的一種新的糾錯技術。實踐表明,即使糾錯前的誤碼率為1%,經RSPC糾錯后也會下降到10-20以下,而在同樣條件下,CIRC糾錯后誤碼率僅可達到10-6水平。
2.誤碼的補償
由于數字信號只有“0”和“1”兩種狀態,因此,對信號在刻錄和重放時產生的個別誤碼被檢測出來后,就比較容易進行糾正了,只要將原來誤碼的地方取反即可。若檢測出的某一位“1”為誤碼,則只需將該位變成“0”即可得到糾正。
在CD/VCD中采用的CIRC糾錯技術,雖然有很強的糾錯能力,但也很難做到百分之百的糾正。為此,在數字系統中又采用了誤碼補償的方法對不能及時糾正的誤碼進行進一步控制。所謂誤碼補償,就是根據誤碼的前后關系推斷出原來的數據,再進行替換的方法。常用的誤碼補償方法有靜噪法、前值保持法和線性內插法3種。
靜噪法也稱零值替代法,這種方法就是使誤碼位置的值恒為零。當發生差錯并被識別出來時,使電路在出錯的這一點上切斷揚聲器的聲音信號和到顯像管的圖像信號。
前值保持就是當發現有可疑的誤碼時,用最靠近它的前一個數據字來代替它,由于音頻和視頻信號的相關性,補償后的數據誤差率將會大大降低。
線性內插是指取出錯前的一個數據字與出錯后的一個數據字的平均值,并用該值代替這個出錯的字。利用這種方法,可以得到更為精確的糾錯。
1.4數據壓縮技術的標準
1.4.1數據壓縮技術的分類
由于在數據中間存在一定的冗余度,以及在數據之間存在一定的相關性,因此可對數據進行適當的壓縮處理以解決數據傳輸過程中的存儲、傳輸帶寬等問題。數據壓縮分為無損壓縮與有損壓縮兩大類。無損壓縮是指對原始數據壓縮重構,重構后得到的數據與原來的數據完全相同,這種壓縮方式的壓縮比一般較低,常用于對文本數據的壓縮;有損壓縮是指對原始數據壓縮重構,重構后得到的數據與原來的數據有所不同,此壓縮方式的壓縮比較高,常用于對圖像、音頻和視頻信號的壓縮。
目前常用的數據壓縮標準主要有用于靜止圖像壓縮的JPEG系列標準、用于視頻和音頻通信的H.26X系列標準、用于音頻和視頻編碼的MPEG系列標準以及用于二值圖像編碼的JBIG標準等。1.4.2不同數據壓縮標準的特點
1.H.26X系列標準
H.26X系列主要針對低速率環境下的實時應用設計,特點是強調算法的簡單性和實時性,適用于視頻會議和可視電話等實時交互的情況。其中,H.261和H.263是視頻會議和可視電話的主要視頻編碼標準。
1)?H.261視頻編碼標準
H.261是ITU-T為在綜合業務數字網(ISDN)上開展雙向聲像業務(可視電話、視頻會議)而制定的,是最早的運動圖像壓縮標準,速率為64kb/s的整數倍。H.261采用預測編碼(DPCM)與離散余弦編碼(DCT)混合編碼方法,只對通用中間格式(CommonIntermediateFormat,CIF格式,亮、色信號的水平和垂直像素數均為ITU-R601標準圖像的一半)和四分之一CIF格式(QuarterCIF)兩種圖像格式進行處理,每幀圖像分成圖像層、宏塊組(GOB)層、宏塊(MB)層、塊(Block)層來處理。
2)?H.263視頻編碼標準
H.263是在H.261基礎上發展起來的,它是ITU-T為低于64kb/s的窄帶通信信道制定的視頻編碼標準,其信源編碼算法的核心仍是H.261中的DPCM/DCT混合編碼方法,但做了一些改進以提高性能和糾錯能力。隨后出現的第二版(H.263+)及H.263++增加了許多選項,使其具有更廣泛的適用性。H.263與H.261相比采用了半像素的運動補償,并增加了4種有效的壓縮編碼模式。
ITU-T在H.263發布后又修訂發布了H.263標準的版本2,非正式地命名為H.263+標準。它在保證原H.263標準核心句法和語義不變的基礎上,增加了若干選項以提高壓縮效率或改善某方面的功能。為提高壓縮效率,H.263+采用先進的幀內編碼模式;增強的PB幀模式改進了H.263的不足,增強了幀間預測的效果;去塊效應濾波器不僅提高了壓縮效率,而且提供重建圖像的主觀質量。
H.263++?在H.263+?基礎上增加了3個選項,主要是為了增強碼流在惡劣信道上的抗誤碼性能,同時為了提高增強編碼效率。這3個選項為:
選項U——增強型參考幀選擇,它能夠提供增強的編碼效率和信道錯誤再生能力(特別是在包丟失的情形下),需要設計多緩沖區用于存儲多參考幀圖像。
選項V——數據分片,它能夠提供增強型的抗誤碼能力(特別是在傳輸過程中本地數據被破壞的情況下),通過分離視頻碼流中DCT的系數頭和運動矢量數據,采用可逆編碼方式保護運動矢量。選項W——在H.263+?的碼流中增加補充信息,保證增強型的反向兼容性,附加信息包括:指示采用的定點IDCT、圖像信息和信息類型、任意的二進制數據、文本、重復的圖像頭、交替的場指示、稀疏的參考幀識別。
3)?H.264視頻編碼標準
H.264是由ISO/IEC與ITU-T組成的聯合視頻組(JVT)制定的新一代視頻壓縮編碼標準。H.264與先期的視頻壓縮標準相比引入了很多先進的技術,包括4?×?4整數變換、空域內的幀內預測、1/4像素精度的運動估計、多參考幀與多種大小塊的幀間預測技術等。新技術帶來了較高的壓縮比,同時大大提高了算法的復雜度。
H.264的主要優點不但體現在相同的重建圖像質量下,比H.263+減小50%碼率,而且對信道時延的適應性較強,既可工作于低時延模式以滿足實時業務(如會議電視等),又可工作于無時延限制的場合(如視頻存儲等)。同時由于采用“網絡友好”的結構和語法,加強對誤碼和丟包的處理,可以提高網絡適應性及解碼器的差錯恢復能力。
2.JPEG系列標準
JPEG是聯合圖像專家組(JointPictureExpertGroup,JPEG)的英文縮寫,是國際標準化組織(ISO)和國際電報電話咨詢委員會(CCITT)聯合制定的靜態圖像的壓縮編碼標準。1986年由國際電報電話咨詢委員會和國際標準化組織兩個國際組織聯合成立了一個聯合專家小組,它是國際上彩色、灰度、靜止圖像的第一個國際標準。JPEG標準是一個適用范圍廣泛的通用標準。它不僅適用于靜態圖像的壓縮,而且電視圖像序列的幀內圖像的壓縮編碼也常采用JPEG壓縮標準,1992年該標準正式成為國際標準。
JPEG標準的應用目標是為了給出一個適用于連續色調圖像的壓縮方法,使之滿足以下要求:
①壓縮比及圖像保真度可在較大的范圍內調節,供用戶選擇。
②可應用于任何連續色調數字圖像,不限制圖像的內容,即圖像的長寬比、景物內容、圖像的復雜程度等。
③計算的復雜性是可控制的,其軟件可在各種CPU上完成,算法也可用硬件實現。
④?JPEG算法具有順序編碼、累進編碼、無失真編碼和分層編碼等4種操作方式。
JPEG2000是新一代靜止圖像壓縮標準,由聯合圖像專家組(JPEG)于2000年出臺。JPEG2000中主要采用了離散小波變換(DWT)與嵌入式可截斷優化塊編碼(EBCOT)兩大核心技術,與JPEG標準相比,它具有很多優點。首先具有明顯高于JPEG的壓縮比,在低比特率時能獲得更好的視覺效果。另外,JPEG2000標準中新加入了對感興趣區域(ROI)的支持,也就是說它可以將使用者對于圖片中更關心或者更感興趣的某一區域以更高的比特率壓縮,從而強調更具價值的那部分圖像信息。
3.MPEG系列標準
MPEG是MovingPictureExpertsGroup的縮寫,即“活動圖像專家組”,它是由ISO和IEC(國際電工委員會)聯合組成的活動圖像專家組織,所制定的標準是國際通用的標準。MPEG標準主要面向視頻信息的存儲和廣播,由視頻、音頻和系統3部分組成。針對不同的圖像質量要求,MPEG標準還分為初級標準MPEG-1、通用標準MPEG-2、高壓縮率標準MPEG-4、多媒體描述接口標準MPEG-7和多媒體框架MPEG-21等。
MPEG-1標準是專為傳輸碼率在1.5Mb/s以下的數字記錄媒體制定的,如VCD、DAT、CD-ROM等。MPEG-2是MPEG-1的升級版本,是按照廣播電視圖像質量的要求制定的,其傳輸碼率是MPEG-1的4倍,支持的帶寬范圍從2Mb/s到超過20Mb/s,它不僅適應于廣播電視,也適應于通信和數字存儲媒體等領域,而且還與MPEG-1標準有正向互換性。目前,MPEG-2標準在數字電視和DVD領域得到廣泛應用。最新的MPEG-4是下一代全球多媒體標準。MPEG-4的傳輸速率在4800~6400b/s之間,分辨率為176?×?144,可以利用很窄的帶寬通過幀重建技術壓縮和傳輸數據,從而能以最少的數據獲得最佳的圖像質量。與MPEG-1和MPEG-2相比,MPEG-4更適于交互AV服務以及遠程監控。它將在數字電視、動態圖像、互聯網、實時多媒體監控、移動多媒體通信、Internet/Intranet上的視頻流與可視游戲、DVD上的交互多媒體應用等方面獲得廣泛的應用。
MPEG-7標準的正式名稱叫“多媒體描述接口”,并于2001年11月發布,是為了解決多媒體內容的檢索問題。通過這個標準,MPEG希望對以各種形式存儲的多媒體結構有一個合理的描述,通過這個描述,用戶可以方便地根據內容訪問多媒體信息。在MPEG-7體系下,用戶可以更加自由地訪問媒體。MPEG-7的目的在于提供一個標準化的核心技術,以便描述多媒體環境下的視頻和音頻內容,最終使視頻和音頻搜集像文本搜集一樣簡單方便。MPEG-7的多媒體內容描述功能對MPEG-1、MPEG-2、MPEG-4起到性能提高和功能擴展的作用。
MPEG-21標準的正式名稱為“多媒體框架”,是一個支持通過異構網絡和設備,使用戶透明方便地使用多媒體資源的標準,其目的是建立一個交互的多媒體對象,實現多種業務模型,包括對版權和交易的自動管理,對內容使用者隱私的尊重等。MPEG-21提供了一種以高效、透明和可互操作的方式,在用戶間實現交換、接入、消費、貿易和控制DI(theDigitalItem)的解決方案。
1.5視頻數據壓縮技術
1.5.1視頻數據的壓縮原理
1.圖像(視頻)信號壓縮的可能性
在通信與數字電視系統中,由于活動圖像信號的數據量較大,在信號傳輸過程中占有的帶寬較寬,因此必須進行壓縮處理。圖像信號之所以能夠進行壓縮處理,主要基于以下幾個方面的原因。
1)圖像信號中存在冗余度
圖像信號中的冗余度主要存在于圖像信號的結構和統計兩個方面。在電視圖像信號的結構中,其在空間和時間上有很強的相關性,或者說,其幀內與幀間存在很強的相關性,信號中的冗余度很大,可以對其進行壓縮處理,而在解碼后這些冗余度還可以進行不失真的恢復。
2)利用人眼的視覺特性
對于圖像信號,可以利用人眼的視覺特性對圖像數據進行壓縮,即在不被主觀感覺察覺的容限范圍內,盡量減少表示信號的精度,甚至忽略某些信息。例如,可以按照圖像信號各部分的特點決定對它的采樣頻率和量化等級,盡量做到在主觀視覺的容限之內降低圖像信號的傳輸速率。
除此之外,也可以利用人眼對圖像信號中亮度信號敏感,而對色度信號不敏感的不同感覺,對圖像信號進行壓縮處理。
3)有規律的重復信號可壓縮
視頻信號中的行、場同步,行、場消隱等周期重復信號占有相當的比重,圖像信號僅存在于場掃描過程中每行掃描的正程期間。因此,可以對這類有規律的、重復的、固定不變的信號在編碼時按照某種方法進行壓縮處理。
2.MPEG標準的圖像格式與參數
1)圖像的分割
通常,把一幅完整的圖像稱為一幀,每幀PAL制式和NTSC制式的電視信號分別由625行和525行組成,對應的幀頻分別為25Hz和30Hz。為對圖像進行數字化處理,必須首先對每幀圖像進行分割,即將一幀圖像橫向切成若干條(PAL制式18條,NTSC制式15條),每一條稱為一片(slice);然后,再將每一片縱向切成22塊(PAL制式和NTSC制式),稱之為宏塊或大塊(macroblock)。這樣,在625行制中,每幀圖像分成8?×?22?
=?396個宏塊;在525行制中,每幀分成15?×?22?=?330個宏塊。在MPEG標準中,宏塊是對圖像處理的基本單元。在每個宏塊中的彩色圖像,又可以用一個亮度Y和兩個色差信號(CR、CB)來表示。根據大面積著色原理,在圖像的傳送過程中,亮度信號的清晰度遠高于對色差信號的清晰度,因此,通常又把亮度宏塊平均分成4小塊。最后再將2個色差塊和4個亮度小塊(共6個塊)分成64個(8?×?8?=?64)像素小塊,每個像素對應一個采樣點,而一個宏塊中的色差信號采樣點與每一個小塊亮度信號的采樣點相同。像素是構成圖像的最小單元,圖像的清晰度主要取決于像素的多少,像素越多,圖像分得越細,清晰度就越高,反之越低。圖1-4是MPEG標準的圖像分割示意圖。在對圖像進行數字處理時,每個像素用8位二進制數表示,這樣每個采樣點的亮度信號便可獲得28?=?256個等級,具有足夠高的精度。但在量化過程中,也同樣會產生量化噪聲。對單極性的視頻信號,其信噪比(S/N)可用公式(1-2)來表示。圖1-4圖像分割示意圖
2)圖像格式的基本參數
(1)視頻信號數據傳輸的碼率。
在視頻信號的數字化中,DVD采用4∶2∶2標準,VCD采用2∶1∶1標準。前者的采樣頻率為
Y∶CR∶CB=13.5MHz∶6.75MHz∶6.75MHz
后者的采樣頻率為
Y∶CR∶CB=6.75MHz∶3.375MHz∶3.375MHz在4∶2∶2標準中,為使視頻信號有6MHz的帶寬,即約有500線的清晰度,相應像素的規定為:625/50制時每行是864個,525/60制時每行是858個。在數字電視中,為使625/50制和525/60制相兼容,國際標準定義了有效行,并規定有效行的亮度信號的像素都為720個。有效行是指亮度信號中的圖像信號部分有了圖像信號,消隱信號和同步信號可以在后期編排上去。對每一幀圖像,625/50制的有效行為576行,525/60制的有效行為480行。這樣,對每一幀的亮度像素數,625/50制的為576?×?720,525制的為480×720,再加上兩個色差信號的像素(625/50制的為288?×?360?×?2,525/60制的為240?×?360
?×?2)。于是可得每秒鐘要傳輸的像素數為
(576?×?720?+?288?×?360?×?2)?×?25?=?15.552?×?106
或
(480?×?720?+?240?×?360?×?2)?×?30?=?15.552?×?106
由于每個像素用8位二進制數表示,所以傳輸圖像數據的碼率為
碼率?=?像素傳輸速率?×?8位/像素
=?15.552?×?106像素/s?×?8位/像素
=?124.416Mb/s在2∶1∶1標準中,MPEG-1標準采用折半的方法,即按照廣播級標準,將每一幀的有效行數和有效行的像素數都取一半。通過同樣的分析可得到傳輸數據的碼率為
碼率?=?像素傳輸速率?×?8位/像素
=?(288?×?352?+?144?×?176?×?2)?×?25?×?8
=?30.41286Mb/s
(2)?MPEG視頻標準的圖像格式。
根據上述分析,MPEG-2與MPEG-1的圖像格式參數如表
1-2所示。
3)?3種幀
在MPEG視頻標準中,圖像壓縮基于圖像中的兩種特性:空間相關性和時間相關性。這兩種相關性使得圖像中存在大量的冗余信息。如果能將這些冗余信息去除,只保留少量非相關信息進行傳輸,就可以大大節省傳輸頻帶。而接收機利用這些非相關信息,按照一定的解碼算法,可以在保證一定的圖像質量的前提下恢復原始圖像。
按照MPEG標準,活動圖像的畫面可分為3種類型,分別稱為幀內編碼幀(IntraCodedFrame,即I幀)、前向預測幀(PredictiveCodedFrame,即P幀)和雙向預測幀(BidirectionallyPredictiveCodedFrame,即B幀)。
I幀圖像采用幀內編碼方式,即只利用單幀圖像內的空間相關性,而沒有利用時間相關性。I幀使用幀內壓縮,不使用運動補償,它以靜止圖像壓縮的方法(DCT編碼等)進行處理。I幀與其前后相鄰的圖像之間具有獨立性,其壓縮信號不但全部記錄在光盤上,而且還是產生其他兩種幀圖像的基礎。I幀主要用于接收機的初始化和信道的獲取,以及節目的切換和插入,I幀圖像的壓縮倍數在3種幀中最小,數據量則是3種幀中最大的。I幀圖像是周期性出現在圖像序列中的,出現頻率可由編碼器選擇。
P幀圖像采用幀間編碼方式,即同時利用了空間和時間上的相關性。P幀圖像只采用前向時間預測,只傳送與它前面I幀的差值信息(又稱預測差圖像),該差值信息可看成是運動圖像的變化部分,其數據量要比I幀少得多。如果P幀前面不是I幀而是P幀,同樣也可以由它前面的P幀獲得預測誤差而形成新的P幀信號。P幀的獲得如圖1-5(a)所示。
B幀圖像采用雙向時間預測,它是根據其前面的I幀(或P幀)與后面的P幀來獲得預測誤差的。由于B幀傳送它前面的I幀(或P幀)與后面的P幀之間的預測誤差,因此可以大大提高壓縮倍數。B幀的信息量一般要比P幀少,其壓縮率在3種幀中是最大的。值得注意的是,由于B幀圖像采用了未來幀作為參考,因此MPEG-2編碼碼流中圖像幀的傳輸順序和顯示順序是不同的。在I幀和P幀或P幀與P幀之間一般可以插入兩個B幀,B幀的獲得如圖1-5(b)所示。圖1-5預測幀的獲得示意圖順便指出,每幀圖像輸入的順序是按照時間出現的順序即IBPBP或IBBPBP排列的。為了便于從I幀和P幀獲得B幀,以及解碼時便于從I、P幀插補到B幀,在編碼時首先應對輸入圖像的幀進行重排,使其順序變為IPBPB或IPBBPB。
4)圖像數據的比特流分層格式
MPEG-1和MPEG-2的視頻結構是相同的。為更好地表示編碼數據,MPEG用句法對視頻數據規定了層次結構,共分為6個層次,自上到下分別是:圖像序列層、圖像組層(GOP)、圖像層、像條層(片層或宏塊條)、宏塊層和像塊層。
各層之間的關系如圖1-6所示。圖1-6圖像數據的層次第一層是像塊層,由8像素?×?8行的一組亮度成分或相應的色差成分構成,在編碼中它是DCT處理的基本單元。注意,亮度像塊顯示的圖像相當于色度像塊形式圖像的1/4大小。
第二層是宏塊層,由16?×?16像素的亮度成分和對應的兩個色度分量的8?×?8像素的成分構成。一個宏塊有4個亮度像塊和2個色差像塊(CR、CB),這是進行運動預測和運動補償的單元。在MPEG-1中圖像的色度格式是4∶2∶0,而在MPEG-2中圖像的色度格式還包括4∶2∶2和4∶4∶4格式,因此,一個宏塊又由許多8?×?8的塊組成。
3種格式的宏塊結構如圖1-7所示,其中的4∶2∶0格式由6個塊組成,包括4個亮度塊和兩個色度塊;4∶2∶2格式由8個塊組成,包括4個亮度塊、兩個CB塊和兩個CR塊;4∶4∶4格式由12個塊組成,包括4個亮度塊、4個CB塊和4個CR塊。圖1-73種格式的宏塊結構第三層是像條層,它是在一幀圖像中從左到右分割下來的完整的一條圖像,也是若干個宏塊的集合。在信號處理中,片是同步恢復單元。
第四層是圖像層(幀),它是由若干個片組成的一幅完整的圖像。這種圖像可以是幀內編碼圖像(I圖像),也可以是預測編碼圖像(P圖像)。圖像層是構成活動圖像的基本單位,在信號處理中,它是基本的編碼單元。第五層是圖像組(幀組)層,它由幾幅編碼的圖像組成(PAL制為5幅,NTSC制為6幅),每個圖像組是視頻隨機存儲單元。
第六層是圖像序列層,它體現了連續圖像的比特流。用一個序列頭開始,包含一個或多個幀組,以一個序列尾碼結束。序列層是節目內容的隨機存儲單元。1.5.2MPEG視頻編/解碼原理
1.MPEG視頻編碼原理
MPEG算法既具有很高的壓縮比,又可以保持很好的圖像質量,這單靠幀內編碼是不能完全實現的。在MPEG壓縮編碼中,主要是通過DCT變換和運動預測技術來壓縮空間冗余和時間冗余的,即首先通過運動估計和運動補償去除圖像序列間的時間冗余,然后再通過DCT變換將差值信號的空間冗余去除,使系數能量集中在低頻部分,最后通過量化和可變字長編碼最終達到壓縮編碼的目的。
MPEG視頻編碼器的組成框圖如圖1-8所示,它主要由幀畫面的重新排列、運動補償預測器、運動估計器、離散余弦變換器(DCT)、離散余弦反變換器(DCT-1)、量化自適應器(Q)和逆量化器(Q-1)、幀存儲器、視頻緩存器等組成。這一框圖對MPEG-1與MPEG-2均適用。其主要區別在于MPEG-2采用了自適應場/幀處理技術,通過對物體運動特性和圖像細節的豐富程度做出判定來選擇場處理或幀處理,因此只需將MPEG-1視頻編碼器框圖中的“自適應量化器”和“編碼統計處理”部分改為“編碼控制”即可。因為P幀是由I幀獲得的,而B幀又是根據I幀(或P幀)和P幀獲得的,因此,在編碼時首先要對輸入的幀進行重排,即把P幀排在B幀前面。例如,若幀重排前的順序是IBBPBP,則重排后的順序為IPBBPB,這就是在編碼器內幀的編碼順序。
運動補償是一種把現在的圖像部分看成是由前面的圖像及變動的差值部分構成的預測技術,它是利用消去時間冗余度的部分來提高壓縮比的技術。運動補償預測算法在宏塊級中分別進行幀內預測、前向預測、后向預測和平均預測,與幀內編碼相比,運動補償可改善壓縮比大約3倍。圖1-8視頻編碼器組成框圖具體的編碼過程如下所述。
1)?I幀編碼
當輸入I幀時,開關S1、S2、S4分別置于上方的位置,S3置于左側,編碼器對I幀進行編碼。具體編碼時,首先進行幀改組,即把圖像橫向切割成許多條(片),每片寬度為16個像素,再將第一條縱向切為每16個像素長的各個小段,這樣就得到16?×?16的像素構成的塊,稱為宏塊。宏塊可以分成4部分,每一部分為8?×?8?=?64像素的區塊。對各宏塊進行DCT變換后,空域中64個像素的亮度或色度數值就變換成頻域中的64個頻率系數,其中高頻系數反映的是圖像細節,直流成分代表圖像的平均亮度。變換后的頻率系數送量化自適應器,并參
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 貴州工業職業技術學院《大學體育三籃球》2023-2024學年第二學期期末試卷
- 云南輕紡職業學院《激光先進制造》2023-2024學年第二學期期末試卷
- 2025【企業采購合同】簽訂企業采購合同
- 吉林工業職業技術學院《數理統計(B)》2023-2024學年第二學期期末試卷
- 河北軌道運輸職業技術學院《現代通信原理》2023-2024學年第二學期期末試卷
- 華中師范大學《音樂技能(一)》2023-2024學年第一學期期末試卷
- 廣西自然資源職業技術學院《數據分析與商務智能》2023-2024學年第二學期期末試卷
- 天津國土資源和房屋職業學院《基礎化學Ⅰ》2023-2024學年第二學期期末試卷
- 四川文理學院《人工智能科學計算》2023-2024學年第二學期期末試卷
- 湖南機電職業技術學院《日本文化概況》2023-2024學年第二學期期末試卷
- 《現代設計史》復習資料大全
- DBJ33T 1320-2024 建設工程質量檢測技術管理標準
- 腰椎骨折健康宣教
- GB/T 23862-2024文物包裝與運輸規范
- 九年級化學上冊(滬教版2024)新教材解讀課件
- 2024屆四川省自貢市富順縣數學三下期末統考試題含解析
- 醫院醫共體理事會章程
- 液化氣供應站承包經營合同書
- 工程公司考勤制度
- 幼兒園傳染病分析及預防總結
- 危重患者的液體管理
評論
0/150
提交評論