




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
7-3項目1—利用CNN識別英文語音數字模塊?語音識別:讓機器對你言聽計從目錄CONTENTS提出問題01預備知識03解決方案02任務1—提取音頻文件的語音特征數據04任務3—利用訓練好的模型來識別語音06任務2—構建語音數字識別神經網絡模型05一.提出問題問題描述
在醫院、銀行、飯店等場所,由于資源和人手受限,人們必須排隊等候服務,因此叫號系統應運而生。數字0~9是生活中常見的10個基數,任何一個數字都是由10個基數構成的,如果想通過英文叫號系統將對應的阿拉伯數字及時顯示在大屏上,如何實現數字語音到數字文本的轉換呢二.解決方案1.選擇神經網絡分類解決問題基本思想:首先將語音進行切分,然后提取每個單詞的語音特征;其次構建一個多層CNN模型,利用0~9的語音樣本集對模型進行訓練,得到滿足精度的模型;最后利用訓練好的模型逐個對提取的單詞的語音特征進行分類,看它屬于0~9中的哪個數字,最后將識別的數字組合起來就得到識別的結果。二.解決方案2.具體方案三.預備知識1.webrtcvad模塊切分音頻文件中有效的語音信號audios的內容三.預備知識2.python_speech_features模塊提取語音信號的全部特征三.預備知識2.python_speech_features模塊提取語音信號的全部特征提取的語音特征:(部分)三.預備知識3.PaddlePaddle框架飛槳的應用框架三.預備知識3.PaddlePaddle框架利用飛漿搭建一個預測房價的神經網絡模型輸入維度為1輸出維度為1為線性模型無需加非線性激活函數四.任務1——提取音頻文件的語音特征數據1.設計特征數據提取類VoiceFeature123將類VoiceFeature另存為VoiceFeature.py文件四.任務1——提取音頻文件的語音特征數據2.提取語音特征數據features包含4個語音數字,其特征數據為13通道3×64的矩陣五.任務2——構建語音數字識別神經網絡模型1.定義語音數字識別神經網絡模型均為輸出輸入為n×13×3×64輸出為1×10五.任務2——構建語音數字識別神經網絡模型1.定義語音數字識別神經網絡模型模型代碼實現五.任務2——構建語音數字識別神經網絡模型1.定義語音數字識別神經網絡模型模型代碼實現五.任務2——構建語音數字識別神經網絡模型2.模型訓練及保存最優模型以動態圖的模式實時執行訓練,設置CPU/GPU訓練模式、優化器、Loss計算方法、精度計算方法等創建定義好的模型AudioCNN實例,并將模型的狀態設置為訓練加載訓練數據和測試數據設置訓練迭代次數,啟動模型迭代訓練。(1)訓練保存訓練好的模型五.任務2——構建語音數字識別神經網絡模型2.模型訓練及保存最優模型以動態圖的模式實時執行訓練,設置CPU/GPU訓練模式、優化器、Loss計算方法、精度計算方法等創建定義好的模型AudioCNN實例,并將模型的狀態設置為訓練加載訓練數據和測試數據設置訓練迭代次數,啟動模型迭代訓練。保存訓練好的模型六.任務3——利用訓練好的模型來識別語音1.配置模型識別的機器資源從前面的模型定義和訓練來看,訓練好最后的模型所花的時間相對較少,這主要是因為所使用的AudioCNN比較簡單。但現實生活中,可能會遇到更復雜的機器學習、深度學習任務,需要運算速度更高的硬件(GPU、TPU),甚至同時使用多個機器共同執行一個任務(多卡訓練和多機訓練)。但本項目是在普通的計算機上進行訓練和預測,所以通過以下語句配置模型識別的機器資源。六.任務3——利用訓練好的模型來識別語音2.為模型實例加載模型參數實現代碼:模型文件加載模型參數載模僅用于預測六.任務3——利用訓練好的模型來識別
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 考試心態調整特許金融分析師考試試題及答案
- 證券投資中的人機結合分析試題及答案
- 2025年財務報告標準變動試題及答案
- 2025年CFA考試資本市場操作試題及答案
- 微生物分析報告的撰寫技巧試題及答案
- 2024年項目管理新挑戰及應對策略試題及答案
- 預備工作2025年證券從業資格證試題及答案
- 礦山安全應急預案與演練-石墨滑石考核試卷
- 2025年審計審查重點試題及答案
- 礦山環境管理與生態斷層監測考核試卷
- 廣東省2024-2025學年佛山市普通高中教學質量檢測物理試卷及答案(二)高三試卷(佛山二模)
- 【9數一模】2025年安徽合肥市第四十五中學九年級中考一模數學試卷(含答案)
- 電網工程設備材料信息參考價(2024年第四季度)
- 2023年(第九屆)全國大學生統計建模大賽 論文模板及說明
- 經濟效益證明(模板)
- 汽車總裝車輛返工返修作業標準管理辦法
- D建筑消防設施故障維修記錄表
- DB43∕T 497-2009 博落回果-行業標準
- 黑龍江省哈爾濱市恒泰石材有限公司(擴大區)建筑用凝灰巖
- 創意綜藝風脫口秀活動策劃PPT模板
- 棗樹桃小食心蟲
評論
0/150
提交評論