數(shù)字圖像處理與識別實(shí)驗報告.doc_第1頁
數(shù)字圖像處理與識別實(shí)驗報告.doc_第2頁
數(shù)字圖像處理與識別實(shí)驗報告.doc_第3頁
數(shù)字圖像處理與識別實(shí)驗報告.doc_第4頁
數(shù)字圖像處理與識別實(shí)驗報告.doc_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

數(shù)字圖像處理與識別實(shí)驗報告 實(shí)驗題目:手寫數(shù)字識別實(shí)驗?zāi)康模菏褂蒙窠?jīng)網(wǎng)絡(luò)圖像識別方法對鼠標(biāo)滑動輸入的手寫數(shù)字進(jìn)行訓(xùn)練和識別,使計算機(jī)能夠識別09十個數(shù)字。了解機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)原理并且將其應(yīng)用在圖像處理識別中。實(shí)驗方法:基于反向傳播(BP)神經(jīng)網(wǎng)絡(luò)方法BP拓?fù)渚W(wǎng)絡(luò)結(jié)構(gòu):BP網(wǎng)絡(luò)包含輸入層、隱含層和輸出層,每層包含了許多并行運(yùn)算的神經(jīng)元,層與層之間的神經(jīng)元采用全互連方式,當(dāng)樣本輸入網(wǎng)絡(luò)后,各神經(jīng)元的激勵值由輸入層經(jīng)各隱含層向輸出層傳播。然后計算目標(biāo)輸出與實(shí)際輸出的誤差,并按照誤差減小的方向,從輸出層逐層修正各連接權(quán)值,最后回到輸入層,如此反復(fù)直到達(dá)到期望的輸出。這種信息的正向傳遞和誤差的反向傳播過程,就是BP網(wǎng)絡(luò)每一層權(quán)值不斷調(diào)整過程,也就相當(dāng)于網(wǎng)絡(luò)的學(xué)習(xí)過程。它的實(shí)質(zhì)是計算誤差信號的最小值,采用的是梯度下降算法,按誤差函數(shù)的負(fù)梯度方向修改權(quán)值。本實(shí)驗中可以將訓(xùn)練與測試同步結(jié)合起來,測試的過程中也在不斷的學(xué)習(xí)。本次實(shí)驗采用的是神經(jīng)網(wǎng)絡(luò)中的監(jiān)督式學(xué)習(xí),也就是說外部環(huán)境有一個監(jiān)督元。它能為一組輸入提供期望得到的輸出,系統(tǒng)可以根據(jù)實(shí)際輸出與目標(biāo)輸出的差值反饋給權(quán)重來調(diào)節(jié)權(quán)重的值,這一差值也就是誤差信號。在試驗中,系統(tǒng)每次做出一個預(yù)測,會提問你預(yù)測的是否正確,若正確則不用對參數(shù)進(jìn)行重新訓(xùn)練,若錯誤,則需要輸入正確的值,系統(tǒng)對參數(shù)進(jìn)行訓(xùn)練,這就是一個監(jiān)督學(xué)習(xí)的方式。基于BP神經(jīng)網(wǎng)絡(luò)的數(shù)字識別算法步驟為:a. 初始化神經(jīng)單元參數(shù)。包括輸入層、隱藏層和輸出層節(jié)點(diǎn)數(shù)量,本次實(shí)驗的輸入層是400(2020的灰度值),隱藏層是26,輸出層是10,設(shè)置最大迭代次數(shù)為50.b. 加載訓(xùn)練數(shù)據(jù)集。將已經(jīng)訓(xùn)練過的數(shù)字圖像數(shù)據(jù)導(dǎo)入進(jìn)來。我輸入的是一個2020像素的手寫數(shù)字圖像,將其轉(zhuǎn)化為灰度圖,取400個像素值作為輸入層的值。實(shí)驗中需要大量的訓(xùn)練數(shù)據(jù),對神經(jīng)網(wǎng)絡(luò)中的參數(shù)進(jìn)行訓(xùn)練。本實(shí)驗,下圖為輸入的黑白手寫數(shù)字圖像。c. 初始化訓(xùn)練參數(shù)。這里是采取的隨機(jī)生成兩組權(quán)重參數(shù)。d. 迭代找誤差最小值對應(yīng)的訓(xùn)練參數(shù)。梯度下降算法找誤差最小值,再反饋回參數(shù)。實(shí)驗結(jié)果:(1)識別阿拉伯?dāng)?shù)字“3” (2)識別中文數(shù)字“三” (3)識別錯誤時進(jìn)行修正訓(xùn)練分析討論:(1) 這是一個可以邊測試邊學(xué)習(xí)的過程,隨著輸入數(shù)據(jù)的增加,識別率也會逐漸變高,可以收入大量不同人寫的數(shù)字,避免全部由一個人手寫,這樣系統(tǒng)隨著訓(xùn)練就愈發(fā)的能識別各種不同字跡的數(shù)字。(2) 識別的正確與否與手寫數(shù)字的大小和位置有一定關(guān)系,寫的偏小或者寫在邊角識別不準(zhǔn)確。(3) 系統(tǒng)具有自學(xué)習(xí)過程,我原本訓(xùn)練的是阿拉伯?dāng)?shù)字3,后來嘗試加入中文數(shù)字三,經(jīng)過反復(fù)訓(xùn)練,系統(tǒng)對于3和三都能正確識別。附錄:Matlab重點(diǎn)程序%開啟圖形視窗 case start, FigHandle = figure(WindowButtonDownFcn,NumberDrawdown,Color,black);axis(1 imSize 1 imSize); % 設(shè)定圖軸范圍%axis off; grid off; box on; %將圖軸加上圖框 title(手寫體輸入框); % 按鍵回調(diào)函數(shù)調(diào)用,判斷結(jié)論是否正確,若不正確加入訓(xùn)練集重新訓(xùn)練uicontrol(Parent,FigHandle,Position,360 6 70 30,String,識別,Callback,.exa=(rgb2gray(frame2im(getframe(gca);,B =imresize(exa,20 20);,.BB =double(B)./255;,pred = predict(Theta1, Theta2, reshape(BB,1,400);,correct(reshape(BB,1,400),pred);,training);uicontrol(Parent,FigHandle,Style,pushbutton,Position,270 6 70 30,String,訓(xùn)練,Callback,training); uicontrol(Parent,FigHandle,Style,pushbutton,Position,450 6 70 30,String,清除,Callback,cla);訓(xùn)練部分:% = Part 1:設(shè)置神經(jīng)單元參數(shù) =input_layer_size = 400; % 2020 輸入灰度值hidden_layer_size = 26; % 26個隱藏層單元num_labels = 10; % 10個輸出 % = Part 2:加載訓(xùn)練數(shù)據(jù)集 =fprintf(Loading and Visualizing Data .n)load(data.mat);m = size(X, 1);% = Part 3: 初始化訓(xùn)練參數(shù) =fprintf(nInitializing Neural Network Parameters .n)initial_Theta1 = randInitializeWeights(input_layer_size,hidden_layer_size);initial_Theta2 = randInitializeWeights(hidden_layer_size, num_labels);initial_nn_params = initial_Theta1(:) ; initial_Theta2(:);% = Part 4: 迭代找誤差最小對應(yīng)的參數(shù)=fprintf(nTraining Neural Network. n)options = optimset(MaxIter, 50); % 迭代50次lambda = 1;costFunction = (p) nnCostFunction(p, . input_layer_size, . hidden_layer_size, . num_labels, X, y, lambda); % 誤差反饋找參數(shù)nn_params, cost = fmincg(costFunction, initial_nn_params, options);Theta1 = reshape(nn_params(1:hidden_layer_size * (input_layer_size + 1), .hidden_layer_size, (input_laye

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論