模式識別第一講-緒論_第1頁
模式識別第一講-緒論_第2頁
模式識別第一講-緒論_第3頁
模式識別第一講-緒論_第4頁
模式識別第一講-緒論_第5頁
已閱讀5頁,還剩41頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

模式識別

PatternRecognition計算機學院

第一章緒論

模式識別的研究內容、方法和應用

模式識別的例子人的識別能力是司空見慣的。如何使機器具有人和動物的識別能力?使機器具有智能是人類的愿望。(機器是人手的延長,智能機是人腦的延長。)但使機器具有智能這個工作很不容易,仍然有許多謎,人腦的識別機制不明。盡管已有近五十年的歷史,但仍有許多問題有待解決,也可以說剛起步。一.什么是模式識別

識別的本質是分類。使機器具有能夠自動地對物體描述、分類、分組的能力是科技、工程中的重要問題。模式——模式可以是一個手寫的字符、一幅指紋圖像、一幅人臉的圖像、一段語音信號等。模式識別——研究模式的分類、聚類、和估計問題。模式識別中的兩大類問題

1、分類。(有監督的分類/識別,SupervisedClassification):把模式分到預先定義好的類里去。

2、聚類。(無監督的分類/識別,UnsupervisedClassification,clustering):基于相似性,把模式聚合成一定的類。二.模式識別的應用在社會科學、生物學、心理學、醫學、市場分析預測、自動化、計算機視覺、人工智能、遙感、軍事、生物特征識別等問題中有重要應用。隨著計算機性能的提高、Internet的迅速發展,模式識別的應用不僅在它的傳統領域,如文字識別、語音識別、指紋識別、遙感圖像、醫學…等領域越做越好,而且涌現了很多新的應用。例如數據挖掘(datamining)、文檔的分類(documentclassification)、財政金融、股票的預測、預報,多媒體數據庫的檢索,基于biometrics(生物統計學)的人的身份鑒別,甚至有的人研究識別人的情感。模式識別應用的一些例子問題的領域應用輸入模式模式類生物信息科學序列分析DNA/蛋白質(Protein)序列DNA/蛋白質(Protein)序列數據挖掘搜索有用的模式多維空間的點緊湊(Compact)且分得開的聚類文檔分類(document)Internet搜索文本文件語義(semantic)類,如商業、體育、文娛等

模式識別應用的一些例子(續)文本圖像分類盲人閱讀機,OCR,支票閱讀,郵件分揀文本圖像字符工業自動化(計算機視覺)印刷電路板的質量檢查,裝配線灰度或距離(深度)圖像缺陷有/無,抓、裝配零件模式識別應用的一些例子(續)多媒體數據庫檢索Internet搜索VideoclipVideo生物特征識別(biometric)身份鑒別指紋、面部、虹膜(iris)人的認證,訪問控制遙感農作物等的預測、預報多頻譜圖像地形地貌的分類,生長情況模式識別應用的一些例子(續)語音識別電話的自動應答,翻譯機,人機通信語音波形語音的單字(詞)計算機輔助診斷X-片、CT、fMRI、ECG、EEG、機器故障一維、兩維信號正常/異常三.幾個例子(字符識別)印刷體、手寫體

通過OCR(OpticalCharacterReader)等設備獲取字符的圖像G1.字符識別特征空間特征向量特征:每一個區域中,屬于字符部分的面積占該區域面積的比例。統計性、緊致性與可分性模式不是確定性的,具有一定的統計分布。假設同一類別的樣本在特征空間中較為相近,而與其他類別的樣本分得較開。此即緊致性假設。分類區域、形式線性(或分段線性)R1R2R3二次的R3R2R1R2一般的R1R3R4小結:

模式可以用多維向量空間中的一個矢量(一個點)來表示。要用到線性代數等工具。

模式不是確定性的,而是具有統計分布。要用到概率論與數理統計等工具。

分類就是要把特征空間劃分為一些區域,不相交,類間不重迭。

2.兩類字符識別10原始特征向量:0000.3...000.6...作直方圖,可以得到“0”和“1”的分布分界面的確定:使錯誤率最小

小結:

設計分類器時不是要求沒有錯分類的,而是在一定意義下使錯誤率最小

下面我們再看一個稍微復雜的問題

3.三類字符識別---除了“0”、“1”之外,還要識別“x”

X一個特征(占的總面積)就不夠了。“0”、“x”的覆蓋面積近似相等。加上另一特征(對角線上1、7、13、19、25面積之和)10分類規則:

ifelse特征提取兩類字符識別:從25維原始特征→1維的特征矢量三類字符識別:從25維原始特征→2維的特征矢量特征提取:對原始特征進行變換,得到對給定分類問題更有效的新特征,并實現降維。

例子小結:

通過上面幾個例子,我們接觸到了如下幾個重要概念:特征向量,特征空間,特征提取,決策區域

也看到了一個模式識別系統的基本工作過程。

四.模式識別系統在解決不同的具體問題時,要根據該問題的性質,確定傳感器、預處理、特征提取和分類的算法。信息獲取預處理特征提取與選擇分類器設計、訓練分類決策特征提取與選擇:應區分能力強、特征數較少。運用先驗知識。分類器設計:采用何種分類方法?五.常用的模式識別方法

模板匹配(templatematching)統計的方法(statisticalP.R.)人工神經網絡的方法(artificialneuralnetwork,ANN)句法或結構的方法(syntacticorstructuralP.R.)這些方法不是絕對獨立的,同一種方法有不同的解釋,有時要混合使用。

1.模板匹配

模式識別中使用最早、最簡單、直觀的方法

所謂匹配是一類運算,用來確定兩個對象間的相似性。在模板匹配中,要有一個模板(一般是一個二維形狀)或一個模式原型(prototype),待匹配的模式和這個預先存儲好的模板相匹配

模板匹配一般要花費較大的計算量,隨著計算機速度的加快,這種方法變得更可行了

1.模板匹配(續)例子:字符匹配剛性模板匹配的缺點:處理畸變模式難使用變形模板2.統計模式識別

在統計模式識別中,每一模式是用一個d維的測量值、特征向量來表示的,它是d維特征空間的一個點。目標是選擇這樣的一些特征,使同一類的模式在空間中盡量緊湊,而不同類的模式間盡量分開、不相交。給定一組樣本,模式識別的任務是要確定決策(分界)面、邊界,以把不同的類分開。

三類統計模式識別方法在統計決策理論的方法下,決策邊界是根據模式的概率分布確定的。這些概率分布是事先知道,或通過學習估計得到。另外一種統計模式識別的工具是判別分析(discriminantanalysis)。這種方法是先假定決策邊界的數學形式(一次、二次…),然后利用訓練樣本確定最好的邊界(方程中的一些參數)。再一種方法是從樣本中直接構造決策邊界。如Vapnik的支撐向量機(supportvectormachine,SVM)推廣(泛化,generalization)能力:如何使設計的分類器具有較好的推廣能力?3.人工神經網絡的方法

模擬人腦的計算。人工神經網絡由大量簡單的計算單元相互連接組成。輸入層隱層輸出層人工神經網絡的突出優點是它可以學習復雜的非線性輸入輸出關系(從樣本序列中)盡管統計的方法和人工神經網絡在基本原理上有很多不同,但它們在方法上是等價或相似的。4.句法或結構的方法

句法模式識別的方法來源于這樣的思想:復雜的模式是由簡單的子模式組成的,而子模式又可能由更簡單的子模式組成。最簡單的子模式稱為基元(primitives),復雜模式就是由這些基元以及它們間的相互關系確定。例:醫療診斷問題-心電圖正常/異常

句法模式識別的方法來源于形式語言和自動機:模式—句子,基元—字母表,模式結構—語法規則,模式分類—語法分析。結構模式識別的優點是它的層次結構,用少量的基元和規則來描述物體。這種方法常用在有一定結構的模式上,例如心電圖(ECG)、物體輪廓的分析上

本章小結

介紹了模式模式識別的一些基本概念。

模式識別的一些常用方法:

六、課程內容統計決策理論概率密度估計線性判別分析近鄰法特征提取與選擇聚類實際模式識別例子課程總結與研究前沿簡介參考書:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論