基于云的機器人問答系統設計與實現.docx_第1頁
基于云的機器人問答系統設計與實現.docx_第2頁
基于云的機器人問答系統設計與實現.docx_第3頁
基于云的機器人問答系統設計與實現.docx_第4頁
基于云的機器人問答系統設計與實現.docx_第5頁
已閱讀5頁,還剩10頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第五屆“挑戰杯,中國聯通安徽省大學生課外學術科技作品競賽研究報告基于云的機器人問答系統設計與實現薛建2013年4月目錄一、序言11. 1研究背景 1 1.1.1人機交互技術 11.1.2自然語言識別技術 2 1.2國內外研究現狀分析 3二、系統設計4 2 1設計思路 42 1. 1機器人隱0 5 2 1. 2訊飛語音云 5 2.1.3百度問答服務云 6 2.2詳細設計 7 2.2 1機器人隱0模塊 7 2.2.2訊飛語音云模塊 9 2.2.3百度問答服務云模塊 10三、系統性能分析12四、應用前景與展望未來13五、參考文獻14一、序言隨著機器人技術和人工智能研究的發展,越來越多的智能機器人進入到人們的 日常生活當中,但是目前人與機器人之間的交互仍然主要是通過按鈕、開關等命令 方式,這種交互方式顯得很生硬,不夠人性化。為了使得人與機器人的交互方式更 加方便、自然、和諧,基于自然語義識別的人機交互系統的研究顯得十分重要,這 也是近年來人機交互技術的研究重點?;谠朴嬎愕臋C器人問答系統使用了訊飛語 音云和百度知道問答服務云,實現了用戶向機器人提出問題,機器人經過短暫“思 考”回答出相應的答案并且在說話的同時做出相應行為的功能,該系統實現了一定 程度的自然語義的識別,提供了一種更加人性化的人機交互方式。基于云的機器人問答系統運用當前主流的云技術,將機器人技術、語音識別技 術和網絡查詢技術結合在一起,建立一套機器人問答服務系統,提供了一種更加人 性化的基于自然語言的人機交互方式。云技術的使用,提高了語音識別的效率和問 題答案的準確率,為系統的可行性提供了保證。1.1研究背景1.1.1人機交互技術人機交互技術是指通過計算機輸入、輸出設備,以有效的方式實現人與計算機 對話、交換信息的技術。人們可以借助鍵盤、鼠標、操作桿、位置跟蹤器、數據手 套等設備,用手、腳、聲音、姿態和身體的動作、視線甚至腦電波等向計算機傳遞 信息;計算機通過打印機,繪圖儀、頭盔式顯示器、音頻等輸出設備或顯示設備給 人提供信息。目前,人機交互技術正處于多通道、多媒體的智能人機交互階段,已經取得了 不少研究成果,不少產品已經問世。側重多媒體技術的有:觸摸式顯示屏實現的“桌 面”計算機,能夠隨意折疊的柔性顯示屏制造的電子書,從電影院搬進客廳指日可 待的30顯示器,使用紅綠藍光激光二極管的視網膜成像顯示器;側重多通道技術 的有:“漢王筆”手寫漢字識別系統,結合在微軟的了處16?0操作系統中數字墨 水技術,廣泛應用于0打1。60?的中文版等辦公、應用軟件中的181八匕0106 連續中文語音識別系統,輸入設備為攝像機、圖像采集卡的手勢識別技術,以 1?只0肥手機為代表的可支持更復雜的姿勢識別的多觸點式觸摸屏技術,以及 1?只0肥中基于傳感器的捕捉用戶意圖的隱式輸入技術。人機交互技術領域熱點技術的應用潛力已經開始展現,比如智能手機配備的地 理空間跟蹤技術,應用于可穿戴式計算機、隱身技術、浸入式游戲等的動作識別技 術,應用于虛擬現實、遙控機器人及遠程醫療等的觸覺交互技術,應用于呼叫路由、 家庭自動化及語音撥號等場合的語音識別技術,對于有語言障礙的人士的無聲語音 識別,應用于廣告、網站、產品目錄、雜志效用測試的眼動跟蹤技術,針對有語言 和行動障礙人開發的“意念輪椅”采用的基于腦電波的人機界面技術等。熱點技術的應用開發是機遇也是挑戰?;谝曈X的手勢識別率低,實時性差, 需要研究各種算法來改善識別的精度和速度;眼睛虹膜、掌紋、筆跡、步態、語音、 唇讀、人臉、0嫩等人類特征的研發應用也正在受到關注;自然語言理解目前在語 言模型、語料庫等方面取得了很大的進展,基于自然語言理解的人機交互方式也是 目前研究的熱點;另外,與“云計算”等相關技術的融合與促進也需要繼續探索。人機交互技術與計算機始終相伴發展,匕6?的運算能力日趨強大,網絡和 通信技術的快速發展,顯示技術的重大突破都將為人機交互提供新的起點與高度。 也許有一天,你的房間的墻壁和窗戶都是基于技術的巨型顯示器,無需遙控 器和控制器,游戲機或電視機就能“感應”到你目光的變化、捕捉到你的手勢和動 作、聽懂你語音的命令,用你的頭、手、足、軀干就可以控制游戲中的角色。互聯 網正在向“云端”計算時代發展,人機交互的發展仍將延續由以計算機為中心的復 雜交互向以人為中心的簡單、自然交互轉移的理念,理想的人機交互模式就是“用 戶自由。1.1.2自然語言識別技術自然語言識別,即實現人機間自然語言通信,或實現自然語言理解和自然語言 生成,這是十分困難的。造成困難的根本原因是自然語言文本和對話的各個層次上 廣泛存在的各種各樣的歧義性或多義性。使機器識別語言是人類早已有之的科技幻想,并且早有實踐足跡。早在1920 年,美國一家公司所出品的名為“此也0如X”玩具狗便可以“聽從”主人的話而 執行走或者停的任務。不過在這之后相當長的時間里。這項科技的進展僅限于如何 更多、更精確地識別各種口音,進而執行諸如文字顯示等十分簡單的任務。1952 年,貝爾實驗室的0狀18等人成功研究出了世界上第一個能識別10個英文數字發 音的實驗系統。大規模的語音識別研究是在進入了上個世紀70年代以后,在孤立詞和小詞匯 量句子的識別方面取得了實質性的進展。進入80年代以后,研究的重點逐漸轉向大詞匯量、非特定人連續語音識別。 此時語音識別的研究思路也發生了重大變化,即由傳統的基于標準模板匹配的技術 思路開始轉向基于統計模型(目)的技術思路。此外,再次提出了將神經網絡技術 引入語音識別問題的技術思路,亦即開始了跨學科的人工智能研究道路。進入90年代以后,語音識別的研究并沒有什么重大突破。但是,在語音識別 技術的應用及產品化方面出現了很大的進展,諸如聽寫機等基于語音的信息輸入設21備此時大量出現。由僅限于定義為輸入法功能的語音識別,向包含后臺數據分析的 語義識別轉型的關鍵推動力量,是美國的0仙?八作仙68680 ?0608八陰此丫)計劃。顯然,語義識別技術蘊含著著人機互動的遠大前景,也因 此擁有各方足夠高的評價和期許。但它幾十年來卻缺乏足夠的表現。自然語義識別技術目前在語言模型、語料庫等方面取得了一些進展。語言文字 是人類之間用來傳播信息的主要載體,怎樣讓機器理解這些由人類自然語言組成的 信息,是擺在人們面前的一個難題。這個難題又可以分為“自然語言處理”和“自 然語言理解”兩個部分,“自然語言處理”是基礎技術,我們的最終目的也必定是 為了更好地實現“自然語言理解”。自然語言的處理是一個十分龐大的工程,自然語言的語法通常都是十分復雜 的,相對于英語來說,漢語語法就更加復雜,因此目前還沒有什么方法能夠有效的 消除自然語義識別時的“歧義問題”?,F階段,自然語言的處理主要有以下幾種主 要方法:1.基于關鍵字匹配的方法;2以句法-語義分析為主的方法;3基于大規模語料庫的自然語言處理的方法。這幾種方法雖然都有各自的一些特點,但是效果都不是十分理想,也都存在著 弊端?;陉P鍵字匹配的方法是一種近似匹配技術,主要的缺點是分析技術不精確, 會導致很多的錯誤。以語法-語義分析為主的方法,由于自然語言語法的復雜性、 語義的歧義性,分析起來非常復雜,而且無法做到準確、全面。而基于大規模語料 庫的自然語言處理,則是一個過于龐大的工程,不適合于工程應用。1.2國內外研究現狀分析在10月2日的蘋果產品發布會上,1?06 48的技術升級幅度可謂令業界失望。 然而,被蘋果定義為“私人語音助理”來做壓軸功能發布的義匕應用,仍然是抓 足了人們的眼球。在發布會上,蘋果宣稱5匕1可以支持自然語言輸入與識別,用戶可“命令” 手機讀短信、詢問天氣、設置鬧鐘等,并且可以搜尋餐廳、電影院等生活信息,甚 至是直接訂位、訂票;另外其與8結合服務的能力也相當強悍,能夠依據用戶默 認的居家地址或是所在位置來判斷、過濾搜尋的結果。811被蘋果這樣的企業推出進行商用,已經意味著“語音識別”這一已經不 算新鮮的科技,進一步實現了人工智能化,進而向“語義識別”又邁出了一大步, 同時意味著第一款基于它的改變大眾生活的消費級產品已經誕生。在國內,科大訊飛通過在語音核心技術領域的長期積累,不但在中文語音技術 上保持領先地位,并且在英文語音技術上也達到國際領先水平。訊飛語音云是全球 首個能同時提供語音合成、語音搜索、語音聽寫的移動互聯網智能交互平臺。作為3移動互聯網基礎能力設施,訊飛語音云基于“云計算”技術基礎將上述業界領先的 智能語音技術向各開發廠商和用戶同時開放。移動互聯網應用開發伙伴可以像使用 水、電那樣“即開即用、按需取用”,在很短時間內構建出“能聽會說”的特色移 動互聯網應用,從而使移動互聯網語音創新開發的門檻顯著降低、開發周期顯著縮 短,將有利于移動互聯網應用的不斷創新和豐富。二、系統設計 2.1設計思路人機交互技術的未來發展趨勢,就是基于自然語義識別的人機交互技術,我們 的目標是使得計算機或者機器人能夠聽懂人類的語言,能夠執行人類語言語義中所 包含的命令,并能用人類語言與人類進行交流。系統設計的基本思路是:利用機器人的話筒采集用戶提出的問題的語音數據, 調用訊飛語音云的語音識別技術將采集到的語音數據識別成文字數據,獲得文字問 題,然后將文字問題在百度問答系統中進行查詢并獲得問題的答案,最后調用機器 人語音合成模塊將文字答案合成成為語音答案并回答給用戶,同時配合一些說話時 候的動作,顯得更加生動。系統主要包含三個模塊:嫩0機器人模塊、訊飛語音云 模塊和百度問答服務云模塊。系統的工作流程圖如圖一所示:圖一:系統工作流程圖2.1.1機器人嫩0嫩0機器人是一款人工智能機器人,身高為23寸,約60厘米,它是由法國 八1己6“以 100108公司生產的。嫩0擁有著討人喜歡的外形,并具備有一定程度 的人工智能和情感智商,在學術領域里,嫩0是目前世界上運用最廣泛的類人機器 人。圖二:似0機器人實物圖 嫩0的硬件是采用最新科技設計制造的,這保證了嫩0動作的流暢性,同時嫩0 還配備了多種傳感器,比如攝像頭、聲納、陀螺儀等等。嫩0使用的是八10 6606 的嵌入式處理器,嫩0支持在多種平臺上(“皿X、11仏0*8或08等操作系統 下)編程并且擁有一個開放式的編程構架,使得不同的軟件模塊可以更好的相互作 用。不論使用者的專業水平如何,都能夠通過圖形化編程平臺來為嫩0編寫程序, 實現各種復雜的功能,進行各個領域的研究。2.1.2訊飛語音云基于自然語言的人機交互技術的基礎是自然語義識別技術,而自然語義識別技 術的前提是語音的識別技術。語音作為人們獲取和溝通信息最方便、最有效的手段, 智能語音交互技術對于未來人機交互技術的發展具有不可替代的作用,已經被業界 公認為移動互聯網時代的關鍵技術之一,蘊藏著巨大的市場前景,并有重要的戰略意義??拼笥嶏w通過在語音核心技術領域的長期積累,不但在中文語音技術上保持領 先地位,并且在英文語音技術上也達到國際領先水平。訊飛語音云是全球首個能同 時提供語音合成、語音搜索、語音聽寫的移動互聯網智能交互平臺。作為移動互聯 網基礎能力設施,訊飛語音云基于“云計算”技術基礎將上述業界領先的智能語音 技術向各開發廠商和用戶同時開放。移動互聯網應用開發伙伴可以像使用水、電那 樣“即開即用、按需取用”,在很短時間內構建出“能聽會說”的特色移動互聯網 應用,從而使移動互聯網語音創新開發的門檻顯著降低、開發周期顯著縮短,將有 利于移動互聯網應用的不斷創新和豐富。2.1.3百度問答服務云I社6四6七是計算機出現以來甚至是人類有史以來最偉大的創舉,它改變了全球 通訊和信息資源共享的方式,把各種各樣的資源從經濟、科技、教育到體育、藝術 聯系在一起,構成了一個巨大的網絡資源庫?,F在,網絡已經發展成為一個全球的、巨大的、分布和共享的信息空間。人們 越來越依賴于網絡來獲取信息。我們可以隨時從網絡上查找所需要的信息,網絡作 為一個龐大的資源庫,其包含了人類現有的方方面面的知識?;诖笠幠UZ料庫的自然語言處理方法是自然語義識別技術的方法之一,其難 點在于大規模語料庫的建立,前面提到網絡上有著各種資源、各種知識,因此我們 可以想到將網絡作為我們的大規模語料庫。對網絡語料庫的使用,我們可以使用谷 歌、百度等搜索引擎進行搜索,而百度問答服務系統則為我們提供了更為方便的使 用。圖三為百度知道網站頁面的截圖。圖三:百度知道網站截圖 百度知道是百度旗下的一款問答平臺,它由用戶提出問題,再由別的具備該問 題知識的用戶進行回答,并從眾多回答者中評選出最佳答案。由于互聯網的巨大性、網絡資源的豐富性,百度問答已經匯集了無數個問題以及這些問題較為準確的答 案,這些問題涉及了各個方面,小到生活點滴,大到科學、哲理。既然百度問答服 務云如此強大,我們自然可以想到將它近似的作為語義識別時所用到的巨大規模的 語料庫。趣答網是類似百度問答的一個網站,它也提供了網絡問答服務。該網站是由清 華大學計算機系人工智能實驗室的智能信息獲取組設計和維護的。網站運用互聯網 信息獲取技術的理論和方法,包括情感分析(評論與觀點挖掘自動問答技術、 多文檔摘要技術,實現了對用戶提出的問題,給出直接合理的答案,該網站也可以 作為我們系統的問答服務云。2.2詳細設計前面介紹了嫩0問答服務系統的相關背景知識,而整個系統就是對這些知識的 一個綜合集成。嫩0問答服務系統主要分為三個模塊:嫩0模塊、訊飛語音云模塊 和百度問答模塊。該系統在前端方面,即面向用戶、與用戶交互的技術,主要是語音識別以及語 音合成的技術。語音識別技術是把用戶的口語轉化成文字,其中需要強大的語音知 識庫,因此需要用到所謂的“云計算”技術,即使用訊飛語音云。而語音合成則是 把返回的文字結果轉化成語音輸出,這個技術理論上本地就可以完成,比如直接調 用嫩0模塊的說話子模塊,當然,在云端完成也可以,比如使用訊飛語音云的語音 合成模塊。在后臺技術方面,主要是處理用戶的問題,調用百度問答服務云模塊獲 取問題的答案,并返回最匹配的結果。2.2.1機器人嫩0模塊嫩0模塊的基礎是嫩00,嫩00是運行在應0上的主程序的名稱,它控制著 嫩0,嫩00的架構也就是對嫩0進行編程時所要用到的編程架構。這個框架允許 不同的模塊(動作模塊、音頻模塊、視頻模塊)之間進行通信,提供了函數和信息 的共享機制。嫩00支持交叉編程平臺,我們可以在110界8、11皿X或者1狀操作系統下對 他進行編程。嫩00也支持多種編程語言,我們可以使用這些語言調用嫩00的功 能模塊,但是我們只能用語言和訪0語言來編寫在用戶自定義的在嫩00 上運行的模塊,嫩00為這兩種語目提供了完備的八?I。嫩00對0+十語目的支持是 最好的,我們用編寫實時的代碼,的代碼可以快速的在嫩0上運行。相比 較之下,訪0。語言的執行效率就低很多。圖四展示了嫩0機器人編程模塊的結 構。7圖四:似0機器人的編程結構圖為了使代碼的編譯變得更加簡便,嫩0的編程建議使用0仙1“工具,它的作 用是管理工程中的依賴關系并且支持交叉編譯。4仙1“也是一個支持交叉平臺的 工具,支持評10*8、11皿X和操作系統。918114是基于著名的01成6編譯 系統開發來的,因此它允許你使用你電腦上已有的集成開發環境,比如叩。、1成6、 或者是18皿1 5七舊10。搭建好上述嫩0的編程平臺后,就可以開始編寫嫩0模塊。嫩0模塊的主要功 能是獲取聲音和說出語音答案。對于獲取聲音部分,主要用到以下模塊和函數:1.從50皿亞X廿狀丨01模塊:該模塊提供了基本的聲音處理的函數,任何處理 音頻的模塊需要新建一個模塊繼承自該模塊。2丨86比116社?;66;6此68 0函數:該函數的作用是設置從嫩0的話筒里獲得 的聲音片段的格式,包括采樣頻率、聲道設置等等。3 #00688 0函數:這事一個回調函數,該函數的功能是對聲音緩沖區進行處 理,每當獲得了一塊緩沖區的聲音數據后,系統就會自動就調用該函數對 聲音數據進行處理。為了實現我們想要的功能,我們需要重載這個回調函 數。4 8仏代06丨610=0函數、8丨0沖6丨610=0函數:這兩個函數的作用分別是 開始和停止聲音片段的獲取。對于說出語音答案部分,主要用到以下模塊和函數:1.八16X00166也?0X7 0接口:該接口的功能是封裝對嫩0機器人說話功能 的控制。2 86讓冊8皿陰0函數:該函數的功能是設置嫩0機器人說話所支持的語言。133 8#0函數:該函數的功能是使得嫩0機器人說出答案。其中需要注意的地方是嫩00的說話模塊支持的文字編碼方式是機?-8,而 評1仏0*8下卩82010默認的文字編碼方式是X,所以在使用8奶0函數前,需要將 文字的編碼方式進行一次轉換,11忖-8和X的轉換方法是通過皿100如編碼來轉換。嫩0機器人模塊的另一個功能是實現機器人在說話的同時,做出相應的動作, 模擬人類之間交流時的一些肢體動作,使得問答過程顯得更加人性化、更加生動。 X八0機器人的開發平臺提供了一個可視化的動作編輯工具06狀即1卜6,該工具使 得開發者可以更加方便的設計和調試機器人的動作,軟件的界面如下圖所示:01 0*4 6001 切 901*111 鉍成0。1*0“ 8000(1 1.祝.辦 0048 844 140919090091X010*1844丹0# 00110111140600159(4 7*191 VI 了蒙籌飯麯魯圖五:06狀叩化軟件截圖2.2.2訊飛語音云模塊訊飛語音云模塊的主要功能是將獲取到的聲音上傳到云端服務器,進行識別, 并將識別到的文字結果抓取到本地。在訊飛語音云編程平臺中關于語音識別提供如下函數調用:1.以部匕“0:對IX在識別過程中用到的全局配置項參數進行初始化,如服 務器地址、訪問超時設置等。2丨以部868810沛68化0:用來開始一路I部會話,并在參數中指定本路I部會 話用到的語法列表,本次會話所用的參數等。3.011&皿虹八&1社6 0 :本函數用來激活一個指定的語法,語法類型可以 是仍和一種合法的語法。圖六:訊飛語音云平臺網絡結構 4.015狀舊1011*6 0 :寫入本次獲取到的音頻,音頻可以一次性寫入,也可以 多次調用此接口分批寫入。5-以部化找68匕0 :獲取識別到的結果。6丨以部868810沾0:結束一路I部會話。7丨以部化切虹肅0 :查詢IX記錄下來的一些信息如數據上傳或下載的數據量等。8.01部?1=10 :對180的18尺部分進行逆初始化。對于整個機器人問答系統,訊飛語音云初始化和逆初始化操作只需要進行一 次,而每次回答一個問題的時,首先要開始一段會話,獲得會話1么然后就要進 入上傳聲音數據和獲取識別結果的一個循環,循環的內容:當一個聲音緩沖區滿了 就上傳獲取到的語音數據并檢測云端是否有識別結果,如果有就抓取識別結果。直 到檢測到語音后端點(即說完話)時候循環才停止,最后再檢測一下云端是否有未 取下來的識別結果,如果有則抓取下來。2.2.3百度問答服務云模塊百度問答服務云模塊的主要功能是將文字問題在網絡中進行搜索,獲得相應的 答案,并抓取下來。百度問答的搜索包括兩個過程:1.搜索問題:通過搜索得到若干個包含該問題答案的網頁的鏈接,這些鏈接 是按照其頁面所包含的答案的相關性進行排列的,第一個鏈接的相關性最 大,我們獲取該鏈接地址;2抓取答案:打開第一個過程中獲得的鏈接地址,獲取所提問題答案所在的 頁面內容,該頁面會有一個滿意答案,這個答案就是我們要抓取的內容。 下面用一個實例來詳細描述這個模塊的流程,例如我們想要獲取“安徽有哪些 好玩的地方? ”這個問題的答案,系統的運行流程如下所示:第一步、將訊飛語音云模塊識別到的文字問題進行編碼并添加到百度知道的網 址后面,這樣便獲得百度知道搜索該問題的網頁地址。比如“安徽有哪些好玩的 地方”的機1-8編碼是“80828805030004040098030026850485088780”,百度知 道的 搜索網 頁地址 前綴是 “匕七如:2卜1也0.1如.0/863;卜?即二0610如0;和”,因此將“安徽有哪些 好玩的地方”的編碼加在百度搜索地址后面便得到該問題的搜索地址:“匕七七:/?;匕土己80.8土己1000乂86已;0匕?10=0&;打二10凌口打二0凌亡;二86已;0匕&16二呂6垃凌界0;己二80828805030004040098030026850485088780”。為了獲取網頁的源代碼,我們需要調用11=1加七接口。11=1他七是微軟開發的 一個庫,可以完成仏如、如客戶端的工作,讓程序員從復雜的協議中節省大量精 力。獲得上述頁面的源代碼后,對網頁源代碼進行解析,可以獲取該問題相關性最 高的答案所在頁面的網址。第二步、再次調用11=1=61接口抓取第一步獲得的問題答案所在頁面的源代碼, 對該源代碼進行解析,獲取到相應的問題的答案。需要注意的是,有的網頁的源代 碼的編碼格式是機?-8,所以在解析時要先進行編碼的轉換,轉換成#仏0舊下默 認的X編碼方式,然后再進行處理,否則會顯示亂碼。:地 1 過玩 案好 答些 取哪I 1 答安 101蒙度新 搜一步、獲得問題搜索頁面的網頁地址:&0 11511(111-0I1/3651%11?VI01%(1=x5x6x89/5x8x8I)x26x90x89x25x93xx24x8x98227x8249x67x9 只 284乂 25x9(80x26x96x89步得到間題答案所在頁面網址:七0 2 111(10 丨 11611(111 0011/(111631: 100/187424375 丨知七111I靜雛特明渡 得山1;?4 世 I 那山包樂4辦6湖湖8 置!11 11點趣山5第興蓬戈1 辦晶王點址景晶籠洞地I袁神是江I麗表管!|江I特明渡;山崖|;?4 世. 丫山包樂8圖七:百度問答服務模塊的執行過程 用評1=161接口完成一個仏如下載需要以下步驟: 1丨1社6;6丨0口60使用11=16丨的程序進行必要的初始化工作; 2丨1社6;6比0=6巧0關聯目標地址或者域名以及服務1口;3丨價如0口6故6叫68丨0關聯要下載的內容名字;4價如56。服6叫68七0將價如0口6故6叫68丨的返回值發送給目標服務器;5丨價如如6171社0 0查詢返回值,不參與網絡操作,可以查詢服務器的返回信 息,比如目標文件的大小,該文件是否存在等等;6.1=161=6找63證116 0很普通的讀函數,就是下載文件;7.1=161=6比1086他仏16 0釋放資源。對于將百度問答服務云作為語義識別的語料庫,有一點不足在于,針對于機器 人所提的問題,百度問答上沒有相應的答案,比如“你是誰”、“你叫什么名字”等 問題,由于這些問題有限,因此我們可以通過建立小型本地語料庫的方式來解決。 這樣本地語料庫和訊飛語音云結合使用,會得到更好的效果。三、系統性能分析我們測試了系統的性能,主要從訊飛語音識別成功率、獲取到答案的相關率兩 方面。我們隨機找來十個人,每個人隨機提問十個問題,要求盡量使用普通話。實 驗結果如表一所示:表一、系統性能試驗結果性能方面語音識別答案相關成功率0.910.95對于這樣的結果,我們是感到滿意的,當然這是在網絡順暢、提問人普通話較 為標準、以及所提問題比較合理的基礎上的結果,如果提問題的人普通話不標準, 或者語速過快,比如讓小孩來提問題,訊飛語音云的識別效率會大大降低。之前我們使用過趣答網站作為問答服務云的網站,趣答網站是清華大學研發的 在線搜索問題答案的網站,但是其問題覆蓋面不夠廣泛,許多比較偏的問題無法獲 得答案,我們也將趣答網站和百度知道網站進行了對比,隨機獲取一百個問題,分 別在兩個網站上搜索答案,實驗結果是如表二所示:表二、問答云性能比較問答服務云趣答網站百度知道成功率0.700.97相關性0.970.95通過實驗結果我們看出趣答網

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論