




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、語音模式識別與聲控智能家居設想模式識別(Pattern Recognition)是指對表征事物或現象的各種形式的信息進行處理和分析,以對事物或現象進行描述、辨認、分類和解釋的過程,是信息科學和人工智能的重要組成部分。近年來,在生物識別技術領域中,聲紋識別技術以其獨特的方便性、經濟性和準確性等優勢受到世人矚目,并日益成為人們日常生活和工作中重要且普及的安驗證方式。而且利用基因算法訓練連續隱馬爾柯夫模型的語音識別方法現已成為語音識別的主流技術,該方法在語音識別時識別速度較快,也有較高的識別率。語音識別本質上是一種模式識別,因此,識別算法的好壞對識別效果影響巨大。在半個多世紀的發展中,各種算法層出不
2、窮,如濾波器模型法、線性預測技術(LP) 、動態時間規整算法(DTW) 、隱馬爾科夫模型( HMM) 、矢量量化技術(VQ) 、人工神經網絡(ANN) 和支持向量機( SVM) 等。語音識別技術所涉及的領域包括:信號處理、模式識別、概率論和信息論、發聲機理和聽覺機理、人工智能等等。一 語音識別的原理1.聲學特征提取聲學特征的提取與選擇是語音識別的一個重要環節。聲學特征的提取既是一個信息大幅度壓縮的過程,也是一個信號解卷過程,目的是使模式劃分器能更好地劃分。由于語音信號的時變特性,特征提取必須在一小段語音信號上進行,也即進行短時分析。這一段被認為是平穩的分析區間稱之為幀,幀與幀之間的偏移通常取幀
3、長的1/2或1/3。通常要對信號進行預加重以提升高頻,對信號加窗以避免短時語音段邊緣的影響。2.模型建立語音識別系統的模型通常由聲學模型和語言模型兩部分組成,分別對應于語音到音節概率的計算和音節到字概率的計算。聲學模型主要包括HMM聲學建模和上下文相關建模。語言模型語言模型主要分為規則模型和統計模型兩種。統計語言模型是用概率統計的方法來揭示語言單位內在的統計規律,其中N-Gram簡單有效,被廣泛使用。3.語音搜索連續語音識別中的搜索,就是尋找一個詞模型序列以描述輸入語音信號,從而得到詞解碼序列。搜索所依據的是對公式中的聲學模型打分和語言模型打分。在實際使用中,往往要依據經驗給語言模型加上一個高
4、權重,并設置一個長詞懲罰分數。方法包括 Viterbi、N-best搜索和多遍搜索、前向后向搜索算法。4.系統實現語音識別系統選擇識別基元的要求是,有準確的定義,能得到足夠數據進行訓練,具有一般性。英語通常采用上下文相關的音素建模,漢語的協同發音不如英語嚴重,可以采用音節建模。系統所需的訓練數據大小與模型復雜度有關。模型設計得過于復雜以至于超出了所提供的訓練數據的能力,會使得性能急劇下降。二 語音識別的過程語音識別主要包括語音信號預處理、特征提取、特征建模(建立參考模式庫) 、模式匹配和后處理幾個功能模塊,其中后處理為可選部分,如圖3 所示。圖3 基于仿生模式識別的語音識別原理框圖一
5、個語音識別系統主要包括訓練和識別兩個階段。無論是訓練還是識別,都需要首先對輸入的語音進行預處理,并進行特征提取。下具體說明各個模塊的功能。 (1) 預處理:對輸入的原始語音信號進行處理,濾除背景噪聲等,進行語音信號的斷點檢測5 ,并進行語音分幀以及預加重等處理工作。(2) 特征提取:負責計算語音的聲學參數,并進行特征的計算,提取關鍵特征參數。為了減小計算量,本文采用一種新的特征提取方法,在傳統的能量、過零率、倒譜等特征的基礎上,提取每個字能量、過零率和倒譜的最大值的位置在字中所占的比例作為改進的特征量。(3) 識別階段:將輸入語音的特征量和參考模式庫中的模式進行比較,將相似度最高的模式所屬的類
6、別作為識別的中間候選結果輸出。(4) 訓練階段:輸入若干次訓練語音,用上述提取得到一組特征參數,建立訓練語音的參考模式庫。(5) 后處理:對上述得到的候選識別結果繼續處理,通過更多知識的約束,得到最終的結果。三 自適應與魯棒性語音識別系統的性能受許多因素的影響,包括不同的說話人、說話方式、環境噪音、傳輸信道等等。提高系統魯棒性,是要提高系統克服這些因素影響的能力,使系統在不同的應用環境、條件下性能穩定;自適應的目的,是根據不同的影響來源,自動地、有針對性地對系統進行調整,在使用中逐步提高性能。以下對影響系統性能的不同因素分別介紹解決辦法。解決辦法按針對語音特征的方法和模型調整的方法分為兩類。前
7、者需要尋找更好的、高魯棒性的特征參數,或是在現有的特征參數基礎上,加入一些特定的處理方法。后者是利用少量的自適應語料來修正或變換原有的說話人無關(SI)模型,從而使其成為說話人自適應(SA)模型。說話人自適應的特征方法有說話人規一化和說話人子空間法,模型方法有貝葉斯方法、變換法和模型合并法。語音系統中的噪聲,包括環境噪聲和錄音過程加入的電子噪聲。提高系統魯棒性的特征方法包括語音增強和尋找對噪聲干擾不敏感的特征,模型方法有并行模型組合PMC方法和在訓練中人為加入噪聲。信道畸變包括錄音時話筒的距離、使用不同靈敏度的話筒、不同增益的前置放大和不同的濾波器設計等等。特征方法有從倒譜矢量中減去其長時平均
8、值和RASTA濾波,模型方法有倒譜平移。四 聲控智能家居控制口令觸發模式:設置合理確認流程聲控智能家居控制,是在現有的智能家居控制系統中,增加了語音用戶界面VUI。目前已有的智能家居控制系統,主要有兩種方式:無線遙控和有線操作(電力載波或者中央布線)。都會有一個中央控制器或者中央遙控器來操作家里的各種家電。通過在中央控制器或者遙控器中集成引入LD3320 芯片,可以很方便的為智能家居系統增加語音用戶界面VUI。對于中央遙控器,如果是使用電池供電,那么就應該采用和聲控電視遙控器采用一樣的按鍵觸發模式。考慮到用戶的需求,在不接觸控制器的狀態下,通過語音來遠程操作家里的各種家電。因此,口令觸發模式就
9、是最適合的模式。同時,一定需要設置確認的流程,務必要避免誤觸發/誤識別的情況發生。以下以三個二級確認的流程來舉例說明,開發者可以在此基礎上進行修改,或者拓展成三級確認的流程。也可以在產品中支持多種流程,由終端用戶根據自己使用的習慣來選擇。1) 設置前置口令,第二級說“操作+設備”設置口令為“阿拉丁”或者“大管家”(口令可以選擇發音響亮,瑯瑯上口的詞語)。中央控制器處于一直上電的狀態,所以識別芯片一直處于循環識別狀態,只有在識別出是口令后,才進入下一階段的識別流程。并且充分利用LD3320芯片的特性,在添加口令的同時另外增加垃圾詞語直至達到LD3320 芯片的最大容量,這樣可以很大程度地避免其他
10、聲音帶來的誤識別。(在成功識別出口令后,可以選擇播放很輕微的“嘀”的一聲,或者閃一下小的LED 燈,來作為提示)在識別出口令后,在接下來的8 秒鐘時間內,等待接收用戶的命令,比如“全部關閉”,“打開廚房燈”,“打開空調”等等。如果在限定的時間內,沒有正確識別和接收到用戶的命令,則取消本次識別流程。重新回到等待口令的狀態。2) 把操作(打開/關閉)作為口令,第二級說“設備”從 1)的流程可以變化出另外一種流程:口令設置為“打開”和“關閉”,命令詞語為“臺燈”,“空調”等設備名稱。3) 第一級循環識別“操作+設備”,第二級說“確定”這一種是“后確認”的流程:在第一級循環識別時,識別內容是操作的名稱
11、,比如“打開床頭燈”,“全部關閉”等等,識別出后,只有在接下來的5 秒鐘時間內說出“確定”這個關鍵口令,才進行正式操作,否則就取消本次識別流程,重新進入循環識別狀態。說明:1. 每次加載識別列表時,如果命令字不到LD3320 的最大容量,都可以添加垃圾詞語吸收可能的噪音2. 可以對同一識別詞語設置多個不同的習慣發音,方便用戶使用。五、結 語雖說智能家居系統中也早已有廠家將語音控制引入其中,并宣傳這將是未來主流方向,但是鑒于目前存在著種種因素的影響,如對自然語言的識別和理解、語音信息量大、語音的模糊性、單個字母或詞、字的語音特性受上下文的影響、環境噪聲和干擾對語音識別有嚴重影響,致使識別率低等問題。這些都致使語音系統并未能真正進入智能家居系統,而所謂的引領智能家居聲控潮流,還為時尚早!唯有技術不斷升級及產品的更新方能真正讓聲控技術進入智能家居市場!參考文獻1 徐毅,殷業,王沛.基于仿生模式識別的語音識別研究. 上海電機學院學報2007 年第10 卷第
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030消防維保行業市場發展分析與發展前景及投資戰略研究報告
- 2025-2030智慧園區產業市場深度調研及發展趨勢與投資戰略研究報告
- 2025-2030住房貸款行業競爭格局分析及投資前景與戰略規劃研究報告
- 2025-2030中國高純度焦亞硫酸鈉市場需求分析及投資戰略規劃研究報告
- 2025-2030中國耐化學涂料行業市場發展趨勢與前景展望戰略研究報告
- 2025-2030中國濃縮洗衣液行業發展分析及投資風險與戰略研究報告
- 2025-2030中國椰麥果肉椰子汁行業市場發展現狀及競爭格局與投資前景研究報告
- 2025-2030中國快捷酒店行業市場深度調研及投資前與投資策略景研究報告
- 測試期勞動合同續簽范本
- 民宿房源協議
- 實驗報告3(PN結工藝制備)
- DB44∕T 1988-2017 廣東終身教育資歷框架等級標準
- 第18章生殖毒性研究
- 巧用EXCEL建立合同管理臺帳并動態管理合同
- 汽車吊接地比壓計算
- 基于單片機的環境監測系統PPT演講
- 干部個人廉潔檔案樣表.doc
- 三相異步電動機
- 水利水電工程水閘畢業設計
- 溝槽管件尺寸對照表
- AGSt品牌保護程序和表格最新版完整
評論
0/150
提交評論