深度學習技術應用課件:模型訓練與評估_第1頁
深度學習技術應用課件:模型訓練與評估_第2頁
深度學習技術應用課件:模型訓練與評估_第3頁
深度學習技術應用課件:模型訓練與評估_第4頁
深度學習技術應用課件:模型訓練與評估_第5頁
已閱讀5頁,還剩57頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

基于Flask的模型應用與部署-貓狗識別深度學習應用技術項目引導案例

深度學習正迅速成為人工智能應用的關鍵工具。深度學習中最突出的問題之一是圖像分類,圖像分類就是根據各自在圖像信息中所反映的不同特征,把不同類別的目標區分開來的圖像處理方法。

要說到深度學習圖像分類的經典案例之一,那就是貓狗大戰了。貓和狗在外觀上的差別還是挺明顯的,無論是體型、四肢、臉龐和毛發等等,都是能通過肉眼很容易區分的。項目引導案例模型訓練與評估01運用Flask將模型部署成網頁端應用02思考一下

如何讓機器來識別貓和狗呢?項目引導案例模型訓練與評估職業能力目標01任務描述與要求02任務分析與計劃03知識儲備04任務實施05任務檢查與評價06任務小結07任務拓展08

模型訓練與評估了解圖像分類的基本過程和特征處理了解ResNet殘差網絡產生的背景、結構及網絡了解常用的模型訓練評估指標能夠搭建Tensorflow模型訓練環境能夠正確劃分訓練集與測試集能夠使用基于Tensorflow的Keras框架進行模型訓練能夠使用可視化工具對模型進行評估職業能力目標01知識目標技能目標職業能力目標01任務描述與要求02任務分析與計劃03知識儲備04任務實施05任務檢查與評價06任務小結07任務拓展08

模型訓練與評估

首先進行環境、數據的準備,貓狗訓練集數據和驗證集數據的劃分,再搭建ResNet模型、模型編譯、之后進行模型訓練,最后對模型進行評估,展示可視化訓練結果。任務描述任務要求模型所需的環境、數據準備;數據集的劃分;模型編譯、訓練;模型評估,展示可視化結果。任務描述與要求02職業能力目標01任務描述與要求02任務分析與計劃03知識儲備04任務實施05任務檢查與評價06任務小結07任務拓展08

模型訓練與評估任務分析圖像分類中提取的特征有哪些方法?如何查看模型的準確率?任務分析與計劃03任務計劃表通過上面的思考,你是否對本任務要完成的工作有所了解?讓我們一起來制訂完成本次任務的實施計劃吧!任務分析與計劃03項目名稱基于Flask的模型應用與部署-貓狗識別任務名稱模型訓練與評估計劃方式自主設計計劃要求請用8個計劃步驟來完整描述出如何完成本次任務序號任務計劃1

2

3

4

5

6

7

8職業能力目標01任務描述與要求02任務分析與計劃03知識儲備04任務實施05任務檢查與評價06任務小結07任務拓展08

模型訓練與評估ResNet殘差網絡204知識儲備圖像分類1模型評估3圖像分類04

圖像分類,核心是從給定的分類集合中給圖像分配一個標簽的任務。實際上,這意味著我們的任務是分析一個輸入圖像并返回一個將圖像分類的標簽,標簽總是來自預定義的可能類別集。圖像分類的基本過程04

圖像分類的基本操作是建立圖像內容的描述,然后利用機器學習方法學習圖像類別,最后利用學習得到的模型對未知圖像進行分類。一般來說,圖像分類性能主要與圖像特征提取和分類方法密切相關。04圖像特征處理

從圖像中提取有用的數據或信息,得到圖像的“非圖像”的表示或描述,如數值、向量和符號等。這一過程就是特征提取,而提取出來的這些“非圖像”的表示或描述就是特征。圖像分類中提取的特征主要有兩類:

底層視覺特征局部不變特征04顏色:常用的顏色空間包括:RGB、HSV空間、反顏色空間等。圖像特征處理形狀:描述形狀的方法通常分為基于區域的形狀描述方法和基于輪廓的形狀描述方法兩種。紋理:紋理特征是不依賴于顏色和亮度的反映圖像中同質現象的視覺特征,其本質是刻畫像素的鄰域灰度空間分布規律。基于區域的形狀描述方法:注重集合形狀的全局特征,描述形狀局部特征的能力有限。基于輪廓的形狀描述方法又可以分為基于空間域的方法和基于變換域的方法:

基于空間域:即集合特征描述方法。

基于變換域:主要將目標輪廓的邊緣點數據變換到頻率域中。

局部不變特征也稱為局部特征,首要任務是要提取出更加穩定的圖像特征來描述圖像。提取分為兩個部分:特征點(或區域)探測和特征描述。

特征點探測:采用一定的規則或者策略從圖像中選取一些有代表性的特征點或特征區域;

特征描述:根據特征點探測所得特征點或特征區域,提取出滿足一定不變性要求的特征向量。04圖像特征處理穩定:希望該特征能對旋轉、尺度縮放、仿射變換、視角變化、光照變化等圖像變化因素保持一定的不變形,對運動、遮擋、噪聲等因素也保持較好的可匹配性。ResNet殘差網絡204知識儲備圖像分類1模型評估3204殘差網絡背景321計算資源的消耗模型容易過擬合梯度消失/梯度爆炸在深度學習中,網絡層數增多一般會伴著下面幾個問題:04殘差網絡背景

實驗中發現,隨著網絡層數的增加,網絡發生了退化的現象:隨著網絡層數的增多,訓練集loss逐漸下降,然后趨于飽和,當再增加網絡深度的話,訓練集loss反而會增大。

殘差網絡就應運而生,殘差網絡是由來自MicrosoftResearch的4位學者提出的卷積神經網絡。特點:容易優化,能通過增加相當的深度來提高準確率。其內部的殘差塊使用了跳躍連接,緩解了在深度神經網絡中增加深度帶來的梯度消失問題。04ResNet結構

ResNet提出了兩種mapping:一種是identitymapping,左圖中“彎彎的曲線”,另一種residualmapping,指的就是除了“彎彎的曲線”的另外一部分,所以最后的輸出是y=F(x)+x。identitymapping指的恒等映射,也就是公式中的x,而residualmapping指的是“差”,也就是F(x)=y-x部分。04ResNet結構

ResNet使用兩種殘差單元,如圖所示。左圖對應的是淺層網絡,而右圖對應的是深層網絡。一般稱整個結構為一個”buildingblock“。使用殘差結構的兩個好處:前向傳播時,淺層的特征可以在深層得到重用;反向傳播時,深層的梯度可以直接傳向淺層。ResNet50網絡04

ResNet網絡是參考了VGG19網絡,在其基礎上進行了修改,并通過短路機制加入了殘差單元,ResNet50首先對輸入做了卷積操作,之后包含4個殘差快(ResidualBlock),最后進行全連接操作以便于進行分類任務,網絡構成示意圖,Resnet50則包含50個conv2d操作。ResNet殘差網絡204知識儲備圖像分類1模型評估32

模型的好壞是“相對”的,什么樣的模型好的,不僅取決于算法和數據,還決定于任務需求。因此,選取一個合理的模型評價指標是非常有必要的。

評估一般可以分為回歸、分類和聚類的評估。

常見的幾種評估模型的參數指標,如預測準確率(Accuracy)、精確率(Precision)、召回率(Recall)、F1值和ROC曲線模型常見評估指標04模型常見評估指標04真陽性(TP,TruePostive):真實值是Positive,模型認為是Positive的數量;假陽性(FP,FalsePositive):真實值是Negative,模型認為是Positive的數量。這就是統計學上的第二類錯誤(TypeIIError)。真陰性(TN,TrueNegative):真實值是Negative,模型認為是Negative的數量;假陰性(FN,FalseNegative):真實值是Positive,模型認為是Negative的數量。這就是統計學上的第一類錯誤(TypeIError)。模型常見評估指標04準確率(Accuracy)的定義是:對于給定的測試集,分類模型正確分類的樣本數與總樣本數之比,準確率的計算公式為:

Accuracy=(TP+TN)/(TP+TN+FP+FN)精確率(Precision)的定義是:分類模型預測的正樣本中有多少是真正的正樣本:

Precision=TP/(TP+FP)召回率(Recall)的定義是:對于給定測試集的某一個類別,樣本中的正類有多少被分類模型預測正確。Recall=TP/(TP+FN)模型常見評估指標04在現實情況下,精確率和召回率像是坐在蹺蹺板上一樣,往往出現一個值升高,另一個值降低,那么,需要一個指標來綜合考慮精確率和召回率,這個指標就是F值模型常見評估指標04

通過真正率和假正率來繪制ROC曲線來評估分類模型。ROC曲線橫縱坐標范圍在區間「0,1」之間,一般來說,ROC曲線與x軸形成的面積越大,模型的分類性能越好。IOU交并比04

對具體的某個物體來講,我們可以使用交并比,即模型所預測的檢測框和真實(GroundTruth)的檢測框的交集和并集之間的比例,來量化貼和程度。AP和mAP04常用的用于評價模型好壞的綜合指標:均值平均精度,即mAP(MeanAveragePrecision)。mAP用于反應模型在給定所有的類別上表現的好壞程度,其計算方法相對復雜。可以簡單理解為以下公式:mAP=所有類別的平均精度求和后除以所有類別,即數據集中所有類的平均精度的平均值。mAP總是在固定的數據集上計算,它不是量化模型輸出的絕對度量,但是是一個比較好的相對度量。職業能力目標01任務描述與要求02任務分析與計劃03知識儲備04任務實施05任務檢查與評價06任務小結07任務拓展08

模型訓練與評估05任務實施訓練集、驗證集劃分21模型訓練3模型評估4訓練集、驗證集劃分環境、數據準備05數據集的文件名是以type.num.jpg這樣的方式命名的,比如cat.0.jpg。使用Keras的ImageDataGenerator要求將不同種類的圖片分在不同的文件夾中,整理后的數據集結構如下所示。1、數據集介紹環境、數據準備05安裝模型所需要的依賴包,并加載導入。2、依賴包安裝及加載圖像數據處理053、路徑設置輸出項目所在的路徑:運用BASE_PATH的路徑,用于設置INPUT_DIR的值。圖像數據處理054、標簽設置與路徑添加本次任務要檢測類別只有貓與狗。要把所有的圖片的路徑放入paths列表中。訓練集和測試集劃分05任務實施訓練集、驗證集劃分2環境、數據準備1模型訓練3模型評估4051、數據集截取云平臺功能限制,為了減少訓練時間,只需要其中部分圖片用來訓練模型。本次訓練選取1000張圖像進行模型訓練。訓練集和測試集劃分052、數據集劃分讀取圖片數據生成數據集,X為訓練集,Y為標簽數組,貓的標簽設置為0,狗的標簽設置為1。訓練集和測試集劃分053、訓練集、驗證集劃分X為訓練集,Y為標簽數組,訓練集和驗證集的劃分比例為8:2。訓練集和測試集劃分sklearn.model_selection.train_test_split(*arrays,test_size,shuffle)arrays:數據集的數組test_size:0-1的浮點數,值為測試集的劃分比例shuffle:布爾值,是否在劃分前打亂數據集05任務實施訓練集、驗證集劃分2環境、數據準備1模型訓練3模型評估4051、基礎模型設置模型參數的介紹:模型訓練Flatten()展平層,將tensor展開,不做計算Dense()全連接層Dropout()丟棄法,用于防止過擬合052、延展模型為了使該模型更加契合我們的項目,需要在原有的基礎之上添加額外的層。模型訓練053、模型編譯tf.keras.Mpile(optimizer,loss,metrics),參數介紹如下:

模型訓練參數介紹如下:optimizer:模型訓練使用的優化器,可以從tf.keras.optimizers中選擇。loss:模型優化時使用的損失值類型,可以從tf.keras.losses中選擇,此次訓練只有兩個類別需要判別,所以使用二元交叉熵。metrics:訓練過程中返回的矩陣評估指標,可以從tf.keras.metrics中選擇054、模型開始訓練tf.keras.Model.fit(x,y,batch_size,epochs,validation_data)模型訓練參數介紹如下:x:訓練集數組。y:訓練集標簽batch_size:批處理數量。epochs:迭代次數。validation_data:驗證集的圖片和標簽數組。055、載入模型進行訓練tf.keras.models.load_model(filepath,compile,options)模型訓練參數介紹如下:filepath:模型文件路徑。compile:布爾值,確認在加載之后是否編譯模型,非必填項options:可選擇tf.saved_model.LoadOptions里的特殊選項值,非必填項。05任務實施訓練集、驗證集劃分2環境、數據準備1模型訓練3模型評估4模型評估051、查看模型的準確率與損失值#查看模型準確率print(history.history['accuracy'])print(history.history['val_accuracy'])print(history2.history['accuracy'])print(history2.history['val_accuracy'])#查看模型損失值print(history.history['loss'])print(history.history['val_loss'])print(history2.history['loss'])print(history2.history['val_loss'])05使用history的參數。模型準確率是逐步上升的;2、準確率可視化模型評估05使用history2的參數。模型準確率是趨于飽和的。2、準確率可視化模型評估05使用history的參數,模型損失是逐步下降的3、損失可視化模型評估05使用history2的參數,模型損失沒有太多變化。3、損失可視化模型評估職業能力目標01任務描述與要求02任務分析與計劃03知識儲備04任務實施05任務檢查與評價06任務小結07任務拓展08

模型訓練與評估任務檢查與評價061、請參照評價標準完成自評和對其他小組的互評。2、各組請代表分析本組任務實施經驗。項目名稱基于Flask的模型應用與部署-貓狗識別任務名稱模型訓練與評估評價方式可采用自評、互評、老師評價等方式說明主要評價學生在項目學習過程中的操作技能、理論知識、學習態度、課堂表現、學習能力等

評價內容與評價標準序號評價內容評價標準分值得分1理論知識(20%)了解圖像分類的基本過程和特征處理、ResNet殘差網絡產生的背景、結構及網絡、以及常用的模型訓練評估指標。(20分)20分

2專業技能(40%)環境、數據準備(5%)正確的安裝及加載依賴包(1分)5分

正確的路徑設置(2分)正確的設置標簽與添加路徑(2分)3訓練集、驗

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論