大學計算機學院多媒體基礎運動估計(版)_第1頁
大學計算機學院多媒體基礎運動估計(版)_第2頁
大學計算機學院多媒體基礎運動估計(版)_第3頁
大學計算機學院多媒體基礎運動估計(版)_第4頁
大學計算機學院多媒體基礎運動估計(版)_第5頁
已閱讀5頁,還剩47頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

運動(yùndòng)估計根底陳虎第一頁,共五十三頁。視頻圖像(túxiànɡ)的冗余空間(kōngjiān)冗余時間(shíjiān)冗余第二頁,共五十三頁。視頻圖像(túxiànɡ)的冗余

視頻序列圖像在時間上存在很強的相關性,采用運動估計和運動補償技術可以消除時間冗余(rǒnɡyú)以提高編碼效率,這種技術廣泛用于視頻壓縮的一些國際標準中,如H.261/263/264、MPEG-1/2/4。第三頁,共五十三頁。視頻(shìpín)編碼框架第四頁,共五十三頁。消除時間(shíjiān)冗余當前圖像塊與參考圖像對應(duìyìng)塊求差值相似圖像塊才能有效消除時間冗余圖像塊越相似,消除時間冗余效果越好采用運動搜索的方法尋找最相似的塊運動估計(gūjì)與補償第五頁,共五十三頁。運動(yùndòng)以及運動(yùndòng)搜索時間上目標的空間(kōngjiān)位移運動(yùndòng)矢量通過搜索比較,確定相似塊以及運動矢量的過程第六頁,共五十三頁。運動估計(gūjì)的分類全局運動估計基于塊的運動估計基于象素點的運動估計基于區域的運動估計基于網格的運動估計時域運動估計頻域運動估計(DFT、DCT、DWT)第七頁,共五十三頁。運動(yùndòng)估計的分類a全局(quánjú)運動估計c基于(jīyú)塊的運動估計b基于象素點的運動估計d基于區域的運動估計第八頁,共五十三頁。運動估計(gūjì)的分類a基于塊的運動(yùndòng)估計b基于網格(wǎnɡɡé)的運動估計塊匹配運動估計因算法簡單、便于硬件實現得到廣泛應用,本文將對其進行重點討論,下面簡稱其為“運動估計〞。第九頁,共五十三頁。基于塊的運動(yùndòng)估計根本思想(sīxiǎng)是將圖像序列的每一幀分成許多互不重疊的宏塊,并認為宏塊內所有象素的位移量都相同,然后對每個宏塊到參考幀某一給定特定搜索范圍內根據一定的匹配準那么找出與當前塊最相似的塊,即匹配塊,匹配塊與當前塊的相對位移即為運動矢量。視頻壓縮的時候,只需保存運動矢量和殘差數據就可以完全恢復出當前塊。第十頁,共五十三頁。基于(jīyú)塊的運動估計第十一頁,共五十三頁。基于塊的運動(yùndòng)估計第十二頁,共五十三頁。基于(jīyú)塊的運動估計第十三頁,共五十三頁。基于塊的運動(yùndòng)估計第十四頁,共五十三頁。塊匹配法根本(gēnběn)流程分成互不重疊N×N大小的塊,塊遵循物體剛性平動的假設模型根據一定(yīdìng)的匹配準那么和搜索算法,在參考幀中給定的搜索范圍內,尋找到當前塊的最正確匹配塊

當前塊和最正確匹配塊之間的相對位移就是當前塊的運動矢量第十五頁,共五十三頁。匹配(pǐpèi)準那么均方誤差(wùchā):平均(píngjūn)絕對誤差:絕對誤差:第十六頁,共五十三頁。舉例(jǔlì)第十七頁,共五十三頁。運動估計快速(kuàisù)算法分類分層的和多分辨率的快速塊匹配方法固定搜索模式的快速塊匹配方法基于時空相關性和視覺特性的快速塊匹配方法基于連續消除的快速塊匹配方法基于象素子抽樣的快速塊匹配方法第十八頁,共五十三頁。分層的或多分辨率法在較粗糙的分辨率下預測(yùcè)一個接近的大尺寸的運動矢量,然后在較高的分辨率下進一步修正。稱為分層的或多分辨率的運動估計快速算法。缺點:計算過程復雜,內存需求較大。第十九頁,共五十三頁。分層的或多分辨率法第二十頁,共五十三頁。象素子抽樣法通常的匹配準那么是把塊里所有的象素點進行計算和比較,事實上一個(yīɡè)塊里相鄰象素的差異很小,使得它們之間也存在冗余。子采樣運動估計算法就利用了這一事實,只取其中的一局部象素進行計算,可大大減少計算量,但同時降低了準確性。第二十一頁,共五十三頁。全搜索(sōusuǒ)法對搜索區域的所有位置進行窮盡搜索。精度最高計算復雜,難以實時(shíshí)處理必須研究相應的運動估計快速算法第二十二頁,共五十三頁。三步法搜索模板(múbǎn)半徑依次減半對小運動檢測效果不好搜索范圍大于7時,搜索步驟不止三步第二十三頁,共五十三頁。梯度(tīdù)下降法反復使用3×3模板進行(jìnxíng)搜索。模板中心處SAD值最小時結束。對大運動檢測效果不好第二十四頁,共五十三頁。四步法反復使用5×5方形模板(múbǎn)進行搜索。模板(múbǎn)中心處SAD值最小時再用3×3模板(múbǎn)搜索一次確定最正確匹配位置。第二十五頁,共五十三頁。菱形(línɡxínɡ)法

搜索方式與四步法類似,只是(zhǐshì)搜索模板換為兩個菱形模板。第二十六頁,共五十三頁。六邊形法

搜索方式與菱形法類似(lèisì),只是大搜索模板換為一個六邊形模板。第二十七頁,共五十三頁。2D對數(duìshù)法反復使用(shǐyòng)3×3模板進行搜索。模板中心處邊界時結束。第二十八頁,共五十三頁。比較(bǐjiào)2D對數(duìshù)法與全搜索法的比較水平、垂直方向最大位移為6第二十九頁,共五十三頁。固定(gùdìng)模式搜索法的缺點沒有利用圖像(túxiànɡ)本身的相關信息,不能根據物體運動的劇烈程度自適應的改變搜索起點和搜索半徑。對于運動劇烈的圖像,從原點開始搜索時,要經過屢次搜索才能找到匹配點,搜索點過多,且容易陷入局部最優點。第三十頁,共五十三頁。粒子(lìzǐ)群優化算法粒子(lìzǐ)群優化(ParticleSwarmOptimization,PSO)是由Kennedy和Eberhart在1995年共同提出的,源于對鳥群遷徙和魚群聚集行為的啟發。第三十一頁,共五十三頁。粒子(lìzǐ)群優化算法群體中的每個個體視為沒有質量和體積的“粒子〞,可以理解為是搜索空間中的點或者優化問題中的解。每個粒子都有自己的速度和空間位置,還有一個由目標函數決定的適應度值。在進化迭代過程中,每個粒子根據自身最優解和群體最優解更新自己的飛行速度大小和前進的方向。最終所有粒子向群體的最優解聚集,尋找(xúnzhǎo)到搜索空間的全局最優解。速度(sùdù)位置自身最優解群體最優解第三十二頁,共五十三頁。粒子(lìzǐ)群優化算法粒子群的搜索(sōusuǒ)空間N粒子群優化運動(yùndòng)估計運動估計的搜索空間D=2“粒子〞粒子的位置粒子的速度“搜索點〞搜索點的水平和垂直坐標搜索點的水平和垂直速度第三十三頁,共五十三頁。生物(shēngwù)地理分布優化算法2021年,DanSimon提出了一種新型的智能優化算法,稱為生物地理分布優化算法(Biogeography-basedOptimization-BBO),該算法源于對生物地理分布情況(qíngkuàng)的啟發。第三十四頁,共五十三頁。生物(shēngwù)地理分布優化算法BBO的搜索(sōusuǒ)空間N生物地理分布優化運動(yùndòng)估計運動估計的搜索空間D=2“島嶼〞島嶼適合指數變量“搜索點〞搜索點的水平和垂直坐標第三十五頁,共五十三頁。常用(chánɡyònɡ)搜索算法總結全搜索法特點:效果最好、復雜度很高三步法、對數搜索法特點:效果一般、復雜度低、適應差鉆石(zuànshí)搜索法、十字搜索法特點:效果較好、復雜度低、適應較好群智能搜索法〔遺傳、粒子群、生物地理分布〕特點:效果很好、復雜度較高、適應較好第三十六頁,共五十三頁。序列(xùliè)相關性和視覺特性人們針對序列圖像的時空相關性和人眼視覺(shìjué)特性,提出了許多改進算法,主要可分類下面幾類:預測搜索起點扁平搜索模板背景圖像快速檢測多預測點搜索第三十七頁,共五十三頁。預測搜索(sōusuǒ)起點

利用相鄰塊之間的運動相關性選擇一個反映(fǎnyìng)當前塊運動趨勢的預測點作為初始搜索點,這個預測點一般比原點更靠近全局最小點。從預測點開始搜索可以在一定程度上提高搜索速度和搜索精度。第三十八頁,共五十三頁。扁平搜索(sōusuǒ)模板在序列圖像中,大多數的運動矢量都位于水平或垂直方向,因此有些論文設計(shèjì)了扁平搜索模板〔非對稱搜索模板〕來加快搜索速度。可參考十字菱形搜索法〔CDS〕。第三十九頁,共五十三頁。背景(bèijǐng)圖像的快速檢測由于一般序列中背景圖像占有相當的比例,對背景圖像的快速(kuàisù)檢測對搜索算法的性能提高很大。一般有兩種方法:中止判別條件〔門限一般設置512左右〕從中心點開始用小模板檢測第四十頁,共五十三頁。多預測(yùcè)點搜索

這種方法(fāngfǎ)是根據鄰塊運動矢量預測多個搜索點,在搜索過程中選擇預測性能最好的預測點,通常于小模板搜索方法(fāngfǎ)想結合。預測方法至關重要。第四十一頁,共五十三頁。圖像(túxiànɡ)1第四十二頁,共五十三頁。圖像(túxiànɡ)2第四十三頁,共五十三頁。殘差圖像(túxiànɡ)第四十四頁,共五十三頁。運動(yùndòng)殘差圖像第四十五頁,共五十三頁。舉例(jǔlì)第四十六頁,共五十三頁。舉例(jǔlì)第四十七頁,共五十三頁。結果(jiēguǒ)分析第四十八頁,共五十三頁

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論