中國地質大學-模式識別實習報告_第1頁
中國地質大學-模式識別實習報告_第2頁
中國地質大學-模式識別實習報告_第3頁
中國地質大學-模式識別實習報告_第4頁
中國地質大學-模式識別實習報告_第5頁
已閱讀5頁,還剩11頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、精選優質文檔-傾情為你奉上模式識別上機實習報告 學 號: 班級序號: 姓 名: 指導老師: 中國地質大學(武漢)信息工程學院遙感系2017年4月專心-專注-專業一、用貝葉斯估計做二類分類【問題描述】 利用貝葉斯估計將某地區的遙感圖像數據做二類分類,將圖像中的裸土和水田加以區分,并使用envi classic的color mapping工具將分類好的圖像加以顏色。【模型方法】與分布有關的統計分類方法主要有最大似然/ 貝葉斯分類。最大似然分類是圖像處理中最常用的一種監督分類方法,它利用了遙感數據的統計特征,假定各類的分布函數為正態分布,在多變量空間中形成橢圓或橢球分布,也就是和中個方向上散布情況不

2、同,按正態分布規律用最大似然判別規則進行判決,得到較高準確率的分類結果。否則,用平行六面體或最小距離分類效果會更好。【方案設計】(1)確定需要分類的地區和使用的波段和特征分類數,檢查所用各波段或特征分量是否相互已經位置配準;(2)根據已掌握的典型地區的地面情況,在圖像上選擇訓練區;(3)計算參數,根據選出的各類訓練區的圖像數據,計算和確定先驗概率;(4)分類,將訓練區以外的圖像像元逐個逐類代入公式,對于每個像元,分幾類就計算幾次,最后比較大小,選擇最大值得出類別;(5)產生分類圖,給每一類別規定一個值,如果分10 類,就定每一類分別為1 ,2 10 ,分類后的像元值便用類別值代替,最后得到的分

3、類圖像就是專題圖像. 由于最大灰階值等于類別數,在監視器上顯示時需要給各類加上不同的彩色;(6)檢驗結果,如果分類中錯誤較多,需要重新選擇訓練區再作以上各步,直到結果滿意為止。【結果討論】優點: (1)生成式模型,通過計算概率來進行分類,可以用來處理多分類問題, (2)對小規模的數據表現很好,適合多分類任務,適合增量式訓練,算法也比較簡單。 缺點: (1)對輸入數據的表達形式很敏感。(2)需要計算先驗概率,分類決策存在錯誤率。局部區域:精度評價步驟:(1)首先需要將外部程序生成的分類文件轉化為ENVI可以識別的分類圖,方法如下:Envi打開圖像-Tools-ColorMapping-Densi

4、tySlice-Setdefaultnumerofranges(設置為聚類數目)-Applydefaultranges-outputrangestoclassimage(2)對分類結果進行合并與命名(3)從參考影像(高分辨率影像)上選取ROI并命名,方法:Envi打開圖像-Tools-RegionofInterest-ROITools(4)將ROI文件與分類圖像相關聯,方法:BasicTools-RegionofInterest-ReconcileROIsParameters-輸入參考影像-輸入分類影像(5)Classification-PostClassification-Confusion

5、Matrix-UsingGroundTruthROIs二、用Fisher估計做二類分類【問題描述】 利用Fisher估計將某地區的遙感圖像數據做二類分類,將圖像中的裸土和水田加以區分,并使用envi classic的color mapping工具將分類好的圖像加以顏色。【模型方法】設計線性分類器首先要確定準則函數,然后再利用訓練樣本集確定該分類器的參數,以求使所確定的準則達到最佳。在使用線性分類器時,樣本的分類由其判別函數值決定,而每個樣本的判別函數值是其各分量的線性加權和再加上一閾值w0。如果我們只考慮各分量的線性加權和,則它是各樣本向量與向量W的向量點積。如果向量W的幅度為單位長度,則線性

6、加權和又可看作各樣本向量在向量W上的投影。顯然樣本集中向量投影的分布情況與所選擇的W向量有關,圖3.3表示了在一個二維空間兩個類別樣本在兩個不同的向量w1與w2上投影分布的情況。其中用紅點及藍點分別表示不同類別的樣本。顯然對向量的投影能使這兩類有明顯可分開的區域,而對向量的投影,則使兩類數據部分交迭在一起,無法找到一個能將它們截然分開的界面。Fisher準則的基本原理,就是要找到一個最合適的投影軸,使兩類樣本在該軸上投影的交迭部分最少,從而使分類效果為最佳。【方案設計】(1)計算各類樣本的均值向量mi,Ni 是類i 的樣本個數 (2)計算樣本類內離散度矩陣Si 和總類內離散度矩陣Sw 。 (3

7、)計算樣本類間離散度矩陣Sb 。Sb=(m1m2)(m1m2)T 。 (4) 求向量w 。為此定義Fisher準則函數 使得JF(W) 取的最大值的w 為:w=S1w(m1m2) 。 (5)將訓練集內所有樣本進行投影。 (6)計算在投影空間上的分割閾值y0 。閾值的選取可以有不同的方案,比較常用的一種為 (7)對于給定的X ,計算它在 上的投影點y 。(8)根據決策規則分類,有 【結果討論】優點:(1)一般對于線性可分的樣本,總能找到一個投影方向,使得降維后樣本仍然線性可分,而且可分性更好即不同類別的樣本之間的距離盡可能遠,同一類別的樣本盡可能集中分布。 (2) Fisher方法可直接求解權向

8、量(3)Fisher的線性判別式不僅適用于確定性模式分類器的訓練,而且對于隨機模式也是適用的,Fisher還可以進一步推廣到多類問題中去 缺點: (1)對線性不可分的情況,Fisher方法無法確定分類局部區域:精度評估:三、用k-means算法對圖像進行分類【問題描述】 利用k-means算法對某地區的遙感圖像數據進行分類,將圖像中的裸土和水田加以區分,并使用envi classic的color mapping工具將分類好的圖像加以顏色。【模型方法】 K-Means是聚類算法中的一種,其中K表示類別數,Means表示均值。顧名思義K-Means是一種通過均值對數據點進行聚類的算法。K-Mean

9、s算法通過預先設定的K值及每個類別的初始質心對相似的數據點進行劃分。并通過劃分后的均值迭代優化獲得最優的聚類結果。K值是聚類結果中類別的數量。簡單的說就是我們希望將數據劃分的類別數。K值決定了初始質心的數量。K值為幾,就要有幾個質心。選擇最優K值沒有固定的公式或方法,需要人工來指定,建議根據實際的業務需求,或通過層次聚類的方法獲得數據的類別數量作為選擇K值的參考。這里需要注意的是選擇較大的K值可以降低數據的誤差,但會增加過擬合的風險。【方案設計】(1)未聚類的初始點集(2)隨機選取兩個點作為聚類中心(3)計算每個點到聚類中心的距離,并聚類到離該點最近的聚類中去(4)計算每個聚類中所有點的坐標平

10、均值,并將這個平均值作為新的聚類中心(5)重復(3),計算每個點到聚類中心的距離,并聚類到離該點最近的聚類中去(6)重復(4),計算每個聚類中所有點的坐標平均值,并將這個平均值作為新的聚類中心【結果討論】優點: 原理簡單,實現容易,聚類效果中上缺點:(1)無法確定K的個數 (2)對離群點敏感 (容易導致中心點偏移)(3)算法復雜度不易控制, 迭代次數可能較多(4)局部最優解而不是全局優 (這個和初始點選誰有關)(5)結果不穩定 (受輸入順序影響)局部區域精度評估:實習心得經過一個學期對模式識別的學習,我學習到了基本的理論知識,了解到了計算機處理圖像的思想,了解到了神經網絡,深度學習的原理,這些知識都為我的課程實踐和進一步的學習打下了堅實的基礎。在本次實習上機中,我體會頗多,學到了很多東西。我加強了對模式識別這門課程的認識,并且復習了自己以前學習到的知識。這些都使得我對計算機有了更深入的認識!總之,通過這次課程設計,我收獲頗豐,相信會為自己以后的學習和工作帶來很大的好處。通過上機實習的訓練,我進一步學習和掌握了對程序的設計和編寫,從中體會到了各種算法的方便和巧妙。像k-means算法就是一個原理很簡單但分類效果很好的算法,這種借助計算機進行數據處理的思維,讓我開闊了視野,也鍛煉了我的動手能力。由于時

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論