計算機視覺(作業)_第1頁
計算機視覺(作業)_第2頁
計算機視覺(作業)_第3頁
計算機視覺(作業)_第4頁
計算機視覺(作業)_第5頁
已閱讀5頁,還剩7頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

視覺是各個應用領域,如制造業、檢驗、文檔分析、醫療診斷,和軍事等領域中各種智能/自主系統中不可分割的一部分。由于它的重要性,一些先進國家,例如美國把對計算機視覺的研究列為對經濟和科學有廣泛影響的科學和工程中的重大基本問題,即所謂的重大挑戰(grandchallenge)。"計算機視覺的挑戰是要為計算機和機器人開發具有與人類水平相當的視覺能力。機器視覺需要圖象信號,紋理和顏色建模,幾何處理和推理,以及物體建模。一個有能力的視覺系統應該把所有這些處理都緊密地集成在一起。作為一門學科,計算機視覺開始于60年代初,但在計算機視覺的基本研究中的許多重要進展是在80年代取得的。現在計算機視覺已成為一門不同于人工智能、圖象處理、模式識別等相關領域的成熟學科。計算機視覺與人類視覺密切相關,對人類視覺有一個正確的認識將對計算機視覺的研究非常有益。為此我們將先介紹人類視覺。計算機視覺與人類視覺密切相關,對人類視覺有一個正確的認識將對計算機視覺的研究非常有益。為此我們將先介紹人類視覺。人類視覺感覺是人的大腦與周圍世界聯系的窗口,它的任務是識別周圍的物體,并告訴這些物體之間的關系。我們的思維活動是以我們對客觀世界與環境的認識為基礎的,而感覺則是客觀世界與我們對環境的認識之間的橋

梁,使我們的思維與周圍世界建立某種對應關系。視覺則是人最重要的感覺,它是人的主要感覺來源。人類認識外界信息的80%來自視覺。人有多種感覺,但對人的智力產生影響的主要是視覺和聽覺。味覺和嗅覺是豐富多樣的,但很少有人去思考它們。在視覺和聽覺中形狀、色彩、運動、聲音等就很容易被結合成各種明確和高度復雜、多樣的空間和時間的組織結構。所以這兩種感覺就成了理智活動得以行使和發揮作用的非常合適的媒介和環境。但人聽到的聲音要想具有意義還需要聯系其它的感性材料。而視覺則不同,它是一種高度清晰的媒介,它提供關于外界世界中各種物體和事件的豐富信息。因此它是思維的一種最基本的工具。視覺對正常人來說是生而有之,毫不費力的能力。但實際上視覺系統所完成的功能卻十分復雜的。有人認為視覺本身就包含了思維的一切基本因素。設想你要在一個會場中尋找一位朋友,呈現在你眼前的是由參加會議的人、桌、椅、主席臺等組成的復雜景物。眼睛得到這些信息以后先要對景物的各部分進行分類,然后從中選出與朋友的外表有關的特征作出判斷,那么在人的眼睛視網膜上映照的景物成象是否就能直接提供判斷時所需要的有關特征呢?不是的,這里需要大腦的思考。例如,雖然人在不同距離處觀察同一物體時在眼睛中成象的大小是不同的。但人們在觀察某人以便估計他的身高時卻不會因為他在近處而感到他高些,也不會因他在遠處而感到他矮些。這是由于大腦根據被觀察物體的距離和與周圍物體的比較,并依靠有關的知識對輸入的圖象

信息進行處理,解釋的結果。如果你是在一個燈光暗淡的劇院中尋找朋友,這個問題就變得更為困難。你剛走進劇院時開始會感到一片漆黑看不清東西,過了幾分鐘你的眼睛變得習慣于在黑暗中觀察。事實上你的視覺系統在此期間中對微光變得更敏感了。但這時許多本來可用的信息喪失了,物體可能難以與背景相區分,許多細節難以分辨。即使這樣人也總能認出朋友。總之,視覺是一個復雜的感知和思維的過程,視覺器官-眼睛接受外界的刺激信息,而大腦對這些信息通過復雜的機理進行處理和解釋,使這些刺激具有明確的物理意義。從以上分析我們還可以看到敏感(Sensations)、感覺(Perception)、認知(Cognition)這三個概念之間的聯系和差別。敏感是把外界的各種刺激轉換成人體神經系統能夠接受的生物電信號。它所完成的是信號的轉換,并不涉及對信號的理解。例如,人眼是視覺的敏感器官,它使光信號通過視網膜轉換電信號。與攝象機的光電傳感器相似,視網膜的感光細胞對光信號在平面上進行采樣,產生點陣形式的電信號,所不同的僅是攝象機的空間采樣是均勻的,而視網膜的采樣是不均勻的,在中央凹附近采樣分辨率高,而在周圍的分辨率低。而感覺的任務是把敏感器官的各種輸入轉換和處理成為對外部世界的理解。例如,對視覺來說就是能說出周圍世界中有什么東西和這些東西之間的空間關系。這些都是關于周圍世界的概念。從輸入的點陣形式的信號到形式對客觀世界的各種概念其中要經過復雜的信息處

理和推理。而認知是以人們對周圍客觀世界的概念為基礎的。如果沒有感覺這個人與外部世界的橋梁或窗口,人的思維活動就換去基本的依據。計算機視覺人類正在進入信息時代,計算機將越來越廣泛地進入幾乎所有領域。一方面是更多未經計算機專業訓練的人也需要應用計算機,而另一方面是計算機的功能越來越強,使用方法越來越復雜。這就使人在進行交談和通訊時的靈活性與目前在使用計算機時所要求的嚴格和死板之間產生了尖銳的矛盾。人可通過視覺和聽覺,語言與外界交換信息,并且可用不同的方式表示相同的含義,而目前的計算機卻要求嚴格按照各種程序語言來編寫程序,只有這樣計算機才能運行。為使更多的人能使用復雜的計算機,必須改變過去的那種讓人來適應計算機,來死記硬背計算機的使用規則的情況。而是反過來讓計算機來適應人的習慣和要求,以人所習慣的方式與人進行信息交換,也就是讓計算機具有視覺、聽覺和說話等能力。這時計算機必須具有邏輯推理和決策的能力。具有上述能力的計算機就是智能計算機。智能計算機不但使計算機更便于為人們所使用,同時如果用這樣的計算機來控制各種自動化裝置特別是智能機器人,就可以使這些自動化系統和智能機器人具有適應環境,和自主作出決策的能力。這就可以在各種場合取代人的繁重工作,或代替人到各種危險和惡劣環境中完成任務。

計算機視覺就是用各種成象系統代替視覺器官作為輸入敏感手段,由計算機來代替大腦完成處理和解釋。計算機視覺的最終研究目標就是使計算機能象人那樣通過視覺觀察和理解世界,具有自主適應環境的能力。要經過長期的努力才能達到的目標。因此,在實現最終目標以前,人們努力的中期目標是建立一種視覺系統,這個系統能依據視覺敏感和反饋的某種程度的智能完成一定的任務。例如,計算機視覺的一個重要應用領域就是自主車輛的視覺導航,目前還沒有條件實現象人那樣能識別和理解任何環境,完成自主導航的系統。因此,目前人們努力的研究目標是實現在高速公路上具有道路跟蹤能力,可避免與前方車輛碰的視覺撞輔助駕駛系統。這里要指出的一點是在計算機視覺系統中計算機起代替人腦的作用,但并不意味著計算機必須按人類視覺的方法完成視覺信息的處理。計算機視覺可以而且應該根據計算機系統的特點來進行視覺信息的處理。但是,人類視系統是迄今為止,人們所知道的功能最強大和完善的視覺系統。如在以下的章節中會看到的那樣,對人類視覺處理機制的研究將給計算機視覺的研究提供啟發和指導。因此,用計算機信息處理的方法研究人類視覺的機理,建立人類視覺的計算理論,也是一個非常重要和信人感興趣的研究領域。這方面的研究被稱為計算視覺(Computational)。計算Vision視覺可被認為是計算機視覺中的一個研究領域。有不少學科的研究目標與計算機視覺相近或與此有關。這些學科中包括圖象處理、模式識別或圖象識別、景物分析、圖象理解等。由于歷史發展或領域本身的特

點這些學科互有差別,但又有某種程度的相互重迭。為了清晰起見,我們把這些與計算機視覺有關的學科研究目標和方法的角度加以歸納。1.圖象處理圖象處理技術把輸入圖象轉換成具有所希望特性的另一幅圖象。例如,可通過處理使輸出圖象有較高的信-噪比,或通過增強處理突出圖象的細節,以便于操作員的檢驗。在計算機視覺研究中經常利用圖象處理技術進行預處理和特征抽取。2.模式識別(圖象識別)模式識別技術根據從圖象抽取的統計特性或結構信息,把圖象分成予定的類別。例如,文字識別或指紋識別。在計算機視覺中模式識別技術經常用于對圖象中的某些部分,例如分割區域的識別和分類。3.圖象理解(景物分析)給定一幅圖象,圖象理解程序不僅描述圖象本身,而且描述和解釋圖象所代表的景物,以便對圖象代表的內容作出決定。在人工智能視覺研究的初期經常使用景物分析這個術語,以強調二維圖象與三維景物之間的區別。圖象理解除了需要復雜的圖象處理以外還需要具有關于景物成象的物理規律的知識以及與景物內容有關的知識。計算機視覺是一門涉及人工智能、神經生物學、心理物理學、計算機科學、圖像處理、模式識別等多個領域的交叉學科。它不僅是人眼的延伸,更重要的是具有人腦的一部分功能。近年來,隨著計算機技術尤其是多

媒體技術和數字圖像處理及分析理論的成熟,以及大規模集成電路的迅速發展,機器視覺技術得到了廣泛的應用研究,取得了巨大的經濟與社會效益。人類正在進入信息時代,計算機越來越廣泛地被應用到人類生產生活的幾乎所有領域。計算機視覺是計算機科學和人工智能科學發展結合的必然產物,它主要是依靠計算機的技術來幫助人類理解視覺的機理,再進一步用計算機實現部分人類視覺的功能。JEEE1988年8月的會刊組織了計算機視覺專輯,在其引言中,定義計算機視覺為用任何辦法對2D數據作出的理解III。計算機視覺作為一門近三十年來新興的綜合性的學科,它己經吸引了來自各個學科的研究者參加到對它的研究之中,其中包括計算機科學和工程,信號處理,物理學,應用數學和統計學,神經生理學和認知科學等。它要求從事機器視覺的科技工作者從人類視覺信息處理的研究成果中尋找一些問題的解決思路;同時,計算機視覺也為從事生物視覺研究的學者們提供了檢驗其理論的有效工具。計算機視覺的應用1.零件識別和定位在對視場中物體的外形信息有充分了解、照明條件可得到嚴格控制的工業環境中,計算機視覺得到成功的應用。如工業自動化生產線上對傳送帶上的零件位姿定位,引導工業機器人實時準確地去抓取它。視覺系統只由一臺攝像機組成,結構簡潔,成本低,視場范圍大。2.智能視覺監控

動態場視覺監控是計算機視覺領域一個新興的應用方向。視覺監控區別于傳統意義上的監控系統在于其智能性。簡單而言,不僅用攝像機代替人眼,而且用計算機代替人、協助人,來完成監視或控制任務,從而減輕人的負擔。快速準確的運動檢測,運動檢測主要是從監控攝像機所捕捉的序列圖像中檢測是否有運動物體存在;實時性、魯棒性的基于三維模型的車輛與行人的定位、識別和跟蹤;異常現象的檢測、報警與目標的行為預測,視覺監控系統的最終目的是為了解釋監視場景中所發生的事件,根據要求對異常事件進行報誓,并能根據當前目標所處的狀態對將要發生的事件進行預測;遠距離的身份識別,生物特征識別技術與人的運動分析的結合是視覺監控系統的一個重要問題。臉像與步態是具有可感知性與非接觸性優點的生物特征,是目前被認為可以用于視覺監控系統中的身份識別的兩個主要生物特征。3.運動體視覺導航運動體通過視覺系統利用立體對可以恢復三維場景信息,并利用場景的三維信息識別目標、識別道路、判斷障礙物等,實現道路規劃、自主導航,與周圍環境自主交互作用等。將立體圖像對和運動信息組合起來,可以構成滿足特定任務分辨率要求的場景深度圖。這種技術在無人汽車、無人飛機、無人戰車等自主系統的自主導航得到了很好的應用。4.醫學圖像分析目前醫學圖像已經廣泛用于醫學診斷,成像方法包括X射線成像、計算機層析(CT)成像、核磁共振成像

(MRI)、超聲成像等。計算機視覺在醫學圖像診斷方面有兩個方面的應用,一是對圖像進行增強、標記、染色等處理來幫助醫生診斷疾病,并協助醫生對感興趣的區域進行測量和比較;二是利用專家知識系統對圖像進行自動分析和解釋,給出自動分析和解釋,給出診斷結果。5.其他計算機視覺在人機交互(眼球跟蹤)、虛擬現實、遠程教育、遙感圖像分析、電影電視制作等領域也有著廣泛的應用。計算機視覺的研究內容賈云德認為計算機視覺研究內容可分為五個內容。一是輸入設備,輸入設備包括成像設備和數字化設備。目前用于獲取數字化圖像的大多數產品化的輸入設備還遠遠不能滿足實際的需要,因此,需要研究各種性能先進的成像系統。二是低層視覺,低層視覺主要是對初始圖像進行變換和處理。三是中層視覺,主要是恢復場景、表面法線方向、輪廓等有關場景的205維信息。四是高層視覺,主要是在以物體為中心的坐標系中,在原始輸入圖像、圖像基本特征、2.5維圖的基礎上恢復物體完整三維圖,建立物體三維描述、識別三位物體并確定物體的位置和方向。五是體系結構,根據系統模型來研究系統的結構,涉及:并行結構,分層結構,信息流結構,拓撲結構以及從設計到實現的途徑。張廣軍總結說,計算機視覺研究內容主要包括:攝像機模型、三維

視覺模型、視覺系統標定、視覺系統的數據管理、視覺系統的實時化技術和視覺系統的工程化技術。計算機視覺面臨的問題計算機視覺的問題是一個逆問題(inverseprob輸入的圖像為二維圖像的灰度,它是三維物體幾何特征、光照、物體材料表面性質、物體的顏色、攝像機參數等許多因素的函數,由灰度反推以上各種參數是逆問題。這些問題往往都是非線性的,問題的解不具有唯一性,而且對噪聲或離散化引起的誤差及其敏感。另一個原因是Marr的視覺系統框架是一個自下而上的、模塊化的、單向的、數據驅動型的結構。神經生理學的深入研究表明,這種與人的視覺系統還有很大距差。雖然對這種差別目前還缺乏深入的理解,但是顯然人的視覺系統上下各層次之間存在著更為復雜的相互作用。更重要的是,郵良球運動等現象可知,生物視覺系統的認知過程是一種復雜的與外界交互作用的主動性過程。人類雖然是視覺專家,但是它又不同于人的問題求解過程,難以描述人類視覺的整體性和選擇性的行為。此外,理解自然景物還需要大量的知識。一個完整的機器視覺系統的主要工作過程如下1、工件定位檢測器探測到物體已經運動至接近攝像系統的視野中心,向圖像采集部分發送觸發脈沖。2、圖像采集部分按照事先設定的程序和延時,分

別向攝像機和照明系統發出啟動脈沖。3、攝像機停止目前的掃描,重新開始新的一幀掃描,或者攝像機

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論