




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
人臉識別數(shù)字圖像處理簡介
人臉識別是基于人的臉部特征信息進行身份識別的一種生物識別技術(shù)。用攝像機或攝像頭采集含有人臉的圖像或視頻流,并自動在圖像中檢測和跟蹤人臉,進而對檢測到的人臉進行臉部的一系列相關(guān)技術(shù),通常也叫做人像識別、面部識別。人臉識別過程一般分三步:(1)首先建立人臉的面像檔案。即用攝像機采集單位人員的人臉的面像文件或取他們的照片形成面像文件,并將這些面像文件生成面紋編碼貯存起來。(2)獲取當前的人體面像。即用攝像機捕捉的當前出入人員的面像,或取照片輸入,并將當前的面像文件生成面紋編碼。(3)用當前的面紋編碼與檔案庫存的比對。即將當前的面像的面紋編碼與檔案庫存中的面紋編碼進行檢索比對。上述的“面紋編碼”方式是根據(jù)人臉臉部的本質(zhì)特征和開頭來工作的。這種面紋編碼可以抵抗光線、皮膚色調(diào)、面部毛發(fā)、發(fā)型、眼鏡、表情和姿態(tài)的變化,具有強大的可靠性,從而使它可以從百萬人中精確地辯認出某個人。人臉的識別過程,利用普通的圖像處理設(shè)備就能自動、連續(xù)、實時地完成。人臉識別方法簡介基于特征臉(PCA)的人臉識別方法:特征臉方法是基于K-L變換的人臉識別方法,K-L變換是圖像壓縮的一種最優(yōu)正交變換。高維的圖像空間經(jīng)過K-L變換后得到一組新的正交基,保留其中重要的正交基,由這些基可以張成低維線性空間。如果假設(shè)人臉在這些低維線性空間的投影具有可分性,就可以將這些投影用作識別的特征矢量,這就是特征臉方法的基本思想。這些方法需要較多的訓練樣本,而且完全是基于圖像灰度的統(tǒng)計特性的。基于PCA的人臉識別研究,對圖像進行簡單灰度處理,剪切出臉部部分,選擇合適算法進行檢測。人臉識別圖像預處理像素可視為N維空間中的一個點。由于人臉結(jié)構(gòu)的相似性,當把很多這樣的人臉圖像歸一化縮放之后,這些圖像在這一超高維空間中不是隨機或散亂分布的,而是存在某種規(guī)律,因此可以通過K-L變換用一個低維子空間描述人臉圖像(本征臉),同時又能保存所需要的識別信息。K-L變換K-L變換是建立在統(tǒng)計特性基礎(chǔ)上的一種變換,也稱為霍特林變換,因他在1933年最先給出將離散信號變換成一串不相關(guān)系數(shù)的方法。K-L變換的突出優(yōu)點是相關(guān)性好,是均方誤差意義下的最佳變換。實際上起著數(shù)據(jù)降維的作用,并保證降維過程最大化保留原數(shù)據(jù)的差異目的是為了得到本征臉在計算機中,圖像被分割成下圖所示的像素,各像素的灰度值用整數(shù)表示。一幅M×N個像素的數(shù)字圖像,其像素灰度值可以用M行、N列的矩陣G表示:圖像的歸一化目的:縮圖,計算灰度對于一個全自動的人臉識別系統(tǒng),其首要的工作是人臉圖像的分割以及主要器官的定位。另外,由于K-L變換本質(zhì)上依賴于圖像灰度在空間分布上的相關(guān)性,因此還需要對人臉圖像進行一系列的預處理,以達到位置校準和灰度歸一化的目的。假設(shè)已根據(jù)分割及定位算法,得到了人臉正面圖像左右兩眼中心的位置,并分別記為Er和El,則可通過下述步驟達到圖像校準的目的1、進行圖像旋轉(zhuǎn),以使Er和El的連線ErEl保持水平。這保證了人臉方向的一致性,體現(xiàn)了人臉在圖像平面內(nèi)的旋轉(zhuǎn)不變性2、根據(jù)圖所示的比例關(guān)系,進行圖像
裁剪。圖中,O點為ErEl的中點,且d=ErEl。經(jīng)過裁剪,在2d×2d的圖像內(nèi),可保證O點固定于(0.5d,d)處。這保證了人臉位置的一致性,體現(xiàn)了人臉在圖像平面內(nèi)的平移不變性3、進行圖像縮小和放大變換,得到統(tǒng)一大小的標準圖像,規(guī)定標準圖像的大小為128×128象素點,則縮放倍數(shù)為β=2d/128。這使得d=ErEl為定長(64個象素點),即保證了人臉大小的一致性,體現(xiàn)了人臉在圖像平面內(nèi)的尺度不變性經(jīng)過校準,不僅在一定程度上獲得了人臉表示的幾何不變性,而且還基本上消除了頭發(fā)和背景的干擾。完成了旋轉(zhuǎn)、平移和尺度不變性后,需要對校準的圖像做灰度拉伸,以改善圖像的對比度,然后采用直方圖修正技術(shù)使圖像具有統(tǒng)一的均值和方差,一部分消除光照強度的影響圖像的格式轉(zhuǎn)換和壓縮圖像采集設(shè)備采集的圖像通常以bmp或jpg格式存入計算機。以bmp格式文件為例,bmp文件通常分為四部分:文件頭、信息頭、調(diào)色板、數(shù)據(jù)部分。·一幅24位的真彩圖像的每個像素由三個字節(jié)表示,這樣,儲存一幅640
3
480的圖像就需要占用640×3×480=921600字節(jié),無論對于存儲容量和處理時間都是不太理想的,因此,需要對圖像進行壓縮。·一般采用的方法是將彩色圖像轉(zhuǎn)換為灰度圖像,公式為:
Y=R×0.299+G×0.587+B×0.114,其中Y被稱為灰度值。這樣,彩色圖像的每個像素通過索引使用統(tǒng)一的調(diào)色板,節(jié)省了大量的存儲空間和處理時間。圖像計算與匹配圖像通過計算分析得到模板或者模型將分析出來的模板或模型與數(shù)據(jù)庫里圖像進行比對,得到結(jié)果可變形模板主動表觀模型Warp到變?yōu)檩斎雸D像標準形狀紋理圖像比對檢測結(jié)果從電腦導入圖像從攝像頭拍照圖像大小歸一化,彩色圖轉(zhuǎn)換成灰度圖圖像灰度值歸一化
人臉檢測訓練圖像
人臉識別人臉圖像采集模塊圖像預處理模塊
人臉信息庫歐式距離判斷輸出基本信息結(jié)束否識別模塊人臉識別實際運用1.中科奧森人臉識別系統(tǒng)中科院人臉識別技術(shù)成功用于奧運會開幕式8月8日,數(shù)萬名觀眾由國家體育場鳥巢的100多個人
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 秋色中考語文作文
- 移動網(wǎng)絡(luò)安全防護與加密技術(shù)考核試卷
- 礦產(chǎn)勘查樣品處理與分析質(zhì)量控制考核試卷
- 淀粉在寵物食品的營養(yǎng)配比考核試卷
- 企業(yè)安全生產(chǎn)培訓教材考核試卷
- 客運站服務創(chuàng)新與差異化發(fā)展考核試卷
- 烘焙食品銷售策略考核試卷
- 社交電商平臺的多元化發(fā)展與創(chuàng)新模式探索考核試卷
- 無線廣播電視傳輸中的信號傳輸距離擴展考核試卷
- 教案新人教版高一語文必修一第1單元檢測題
- 2025至2030中國射頻芯片市場趨勢展望及需求前景研究報告
- 應急急救知識課件
- 慢性病管理與護理方法試題及答案
- 定向培養(yǎng)協(xié)議書模板
- 文綜中考試卷及答案解析
- 基于CRISPR-Cas9技術(shù)探索敲除RAB7A增強肺癌對吉西他濱敏感性的機制研究
- 2025年山東省東營市廣饒縣一中中考一模英語試題(原卷版+解析版)
- 形勢與政策(貴州財經(jīng)大學)知到智慧樹章節(jié)答案
- 《管子·弟子職》全文翻
- 人教版巴市杭錦后旗九年級化學上冊說課課件:第二單元 我們周圍的空氣》實驗活動1 氧氣的實驗室制取與性質(zhì)(17張PPT)
- 《內(nèi)部控制六大業(yè)務流程及管控》
評論
0/150
提交評論