南京郵電大學大學生科技創新訓練計劃STITP_第1頁
南京郵電大學大學生科技創新訓練計劃STITP_第2頁
南京郵電大學大學生科技創新訓練計劃STITP_第3頁
南京郵電大學大學生科技創新訓練計劃STITP_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、項目編號: SZDG2016003 項目名稱:基于模型自適應的高可靠性說話人身份識別研究 參加項目的學生: 徐 波 通信工程 B14010332申子健 通信工程 B14010617陳愛月 通信工程 B14010307指導教師:邵曦通信與信息工程學院成果形式:軟件研究成果簡介:本項目利用 MA TLAB 模型仿真功能,實現語音識別技術來確定說話人身份。在收集到 語音信號后,完成對信號的處理。主要是先進行MFCC特征提取,然后使用語音識別技術, 將提取到的信息和已有的說話人模型進行比對,來確定說話人是否為本人,最終搭建成一個 輸入一處理一輸出的語音識別平臺。研究內容包括與文本無關的說話人身份識別實

2、現,以及 識別算法的優化。項目中應用的關鍵技術:MFCC 語音特征提取技術,將格式為WAV的語音文件轉為 HTK格式,高斯混合模型(GMM),通用背景模型(UBM),極大似然估計算法(EM),最大后 驗準則算法(MAP ),支持向量機技術(SVM )。我們為本項目詳細撰寫了說明書,PPT演示模板,項目結題報告。特色與創新點:1.只需要說話人的WAV文件,修改極少的代碼,即可方便的擴大現有語音庫以及更改 目標說話人,該算法系統可以對現實生活中的任何一個人進行識別;2在說話人身份識別的算法系統中,測試語音不需要規定具體說的內容,只要有聲紋 特征,即可進行識別;3將 SVM 算法用于計算說話人得分的

3、環節,將低維度線性不可分問題轉換為高維線 性可分問題,可以有效提高現有算法的識別精度。該項目基于一種新型的模型自適應方法進行說話人身份的識別,該方法采用高斯混合模 型與支持向量機技術結合,無論是在識別概率與識別時間這兩方面均較傳統識別方法有提 高。而且,當用戶說話時背景有較大噪聲時,該方法能對噪聲有魯棒性。該項目具有廣闊的 應用前景和商業價值。成果圖片:圖 1:錄入測試說話人的語音:圖1錄入測試說話人的語音圖2:系統給出的識別結果。其中score的值的大小代表著測試說話人是目標說話人的概率,scores1.0就認為測試者是目標說話人,scores1.0認為測試者是“偽造者”圖2系統識別結果圖3:說話人識別的實驗結果通過DET (Detection Error Tradeoff)曲線表示,該曲線在 模式識別尤其是語音識別的研究比較常見,該曲線橫坐標表示錯誤接受率,縱坐標表示錯誤 拒絕率,一般情況下從原點做y=x直線與DET曲線交點的橫(縱)坐標即為錯誤率。我們 將GMM-UBM的計算結果和GMM-SVM的計算結果在同一張圖上,可以看到使用向量機技術進行 說話人身份識別能夠在傳統的高斯混合模型的基礎上等誤識率將實現將近4%的提高:2010呂 2 1 seNULj3BH 鄉 1bn esi

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論