對目標識別的一些算法的頁PPT課件_第1頁
對目標識別的一些算法的頁PPT課件_第2頁
對目標識別的一些算法的頁PPT課件_第3頁
對目標識別的一些算法的頁PPT課件_第4頁
對目標識別的一些算法的頁PPT課件_第5頁
已閱讀5頁,還剩26頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、對目標識別的一些算法的學習與思考對BP人工神經網絡的詳細介紹對蛇模型的簡要介紹對一個目標跟蹤視頻的思考人工神經網絡人工神經網絡簡介:人工神經網絡就是模擬人思維的第二種方式。這是一個非線性動力學系統,其特色在于信息的分布式存儲和并行協同處理。雖然單個神經元的結構極其簡單,功能有限,但大量神經元構成的網絡系統所能實現的行為卻是極其豐富多彩的。人工神經網絡是目標識別的重要方法神經網絡有上百種,世界各地專許多專家、教授都在研究,但目前神經網絡發展依然是初級階段 BP神經網絡是最基本的也是應用最廣泛的神經網絡一個三層、三輸入、一輸出bp網絡的例子:顏色紋理形狀2131顏色2 代表:肉色 紋理1代表:皮膚

2、紋理 形狀3代表: 橢圓形 輸出1代表:人臉物體類別理想狀態如果第一次輸入3214如何使系統自動從4調節到1?4代表猴子的臉權值 Rumelhart Hinton和Williams于1986年發表文章,提出了誤差逆向傳播神經網絡,也稱BP神經網絡。BP網絡思路:利用實際輸出與理想輸出的差值(稱為誤差)反饋到前面的網絡,從而改變各層權值,權值改變后,使誤差減小。通過不斷輸入同樣的輸入值(學習),使輸出值逼近理想值。例子中誤差是4-1=3利用 3 去改變各層權值使誤差減小。假設輸入一次“2、1、3”,誤差減小1那么第二次輸入 輸出為3第三次輸入 輸出為2第四次輸入 輸出為1 達到目標,不再輸入。共

3、四次輸入通過例子可知,BP神經網絡的關鍵是尋找這么一個函數權值=f(誤差)如果改變上述函數使得,每次輸入,輸出減少1.5則如圖顏色紋理形狀2134第一次輸入顏色紋理形狀2132.5第二次輸入顏色紋理形狀2131第三次輸入共三次輸入改變f (誤差)之后,網絡學習能力增強!如何選取函數f ?網絡如何后向反饋的?定義E為誤差函數定義:利用以上公式,推導出重要公式:輸出y改變最外層E,最外層E改變最外層是前向傳播時已經得到的最外層 改變次一層 ,以此類推,網絡中的 全部被改變與如何建立聯系?梯度下降法思路:沿誤差E下降最快的方向將權向量移動一個很小的距離。重復這一過程,將產生一系列權重向量為學習速率參

4、數直接引用梯度下降法的結論:公式意義:權值改變量為 時,E減小的最快通過前向傳播確定每層的 和誤差E E改變各層各層 改變各層使E減小學習完成學習完成后的神經網絡能做什么?神經網絡在目標識別中做分類器顏色紋理形狀2131假如神經網絡學習100次后第101次輸入:是人臉45650不是簡介參數活動輪廓模型 參數活動輪廓模型又稱為蛇模型,最初由Kass等于1987年提出。經典的蛇模型是在內力、圖像力和外部約束力共同作用下移動的變形輪廓線C(s)=(x(s),y(s),其中s 0,1為曲線參數,它通過最小化如下能量函數來達到鎖定圖像特征的目的:調節內力參數圖像力參數外部約束力參數為內部能量項,用于控制

5、曲線的彈性和剛度,由下式定義:為與圖像有關的外部能量項,將蛇吸引到圖像特征附近。用于定義目標邊緣的典型外部能量項一般定義為:為用戶定義的能量項,與具體應用有關利用蛇模型進行計算的步驟如下:(1)根據具體的應用,定義適當的能量函數, 并設置適合的初始曲線;(2)利用變分方法,得到能量函數的歐拉方程;(3)迭代求解歐拉方程,直到得到最小能量函數為止,此時得到的曲線即為最終求解結果。 近十年來,蛇模型已經被眾多研究者成功地應用于計算機視覺的許多領域,如邊緣提取、圖像分割與分類、運動跟蹤、3D重建、立體視覺匹配等。但國內對其研究比較少。優點:(1)圖像數據、初始估計、目標輪廓以及基于知識的約束統一于一

6、個特征提取過程中;(2)經適當初始化后,它能自主地收斂于能量極小值狀態。(3)尺度空間中由粗到精的極小化能量可以極大地擴展捕獲區域和降低計算復雜性。缺陷:(1)對初始位置敏感,需要依賴其他機制將蛇放置到感興趣的圖像特征附近;(2)由于蛇模型的非凸性,它有可能收斂到局部極值點,甚至發散。(3)無法收斂到輪廓的深度凹陷部分。(4)不具備自動拓撲變換能力。對蛇模型的改進:Balloon模型GVF蛇模型基于動態規劃的蛇模型具有拓撲變化的蛇模型 這些模型都是對基本蛇模型某一方面缺陷作出的一些改進,仍未從根本上解決蛇模型存在的困難對一段目標跟蹤視頻算法的思考對鼠標圈定的任何物體的跟蹤是如何實現的?我感覺是不是可以充分利用視頻的連續性去實現視頻和圖片的最大不同是一個是連續的,一個是靜止的。即視頻一秒有許多幀,這一幀和下一幀的變化會非常小,可以利用被鼠標圈定的部分作為模板去匹配下一幀圖像,然后把下一幀識別出來的圖像作為新的模板去匹配再下一幀的圖像。不斷進行遠近、旋轉變化的過程可能是讓系統不斷學習新的圖像的過程。圈定的目標消失后,再次出現如何識別?學習的方法:可能是神經網絡將所有模板存儲

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論