多媒體計算機技術-_第1頁
多媒體計算機技術-_第2頁
多媒體計算機技術-_第3頁
多媒體計算機技術-_第4頁
多媒體計算機技術-_第5頁
已閱讀5頁,還剩78頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、多媒體計算機技術魯宏偉第四講 數字語音處置技術 數字音頻緊縮技術三維音效語音識別自然言語了解語音合成 數字音頻緊縮技術音頻緊縮技術指的是對原始數字音頻信號流PCM編碼運用適當的數字信號處置技術,在不損失有用信息量,或所引入損失可忽略的條件下,降低緊縮其碼率,也稱為緊縮編碼。它必需具有相應的逆變換,稱為解緊縮或解碼。音頻信號在經過一個編解碼系統后能夠引入大量的噪聲和一定的失真。 數字音頻緊縮技術音頻緊縮算法的分類時域緊縮算法子帶編碼MP3音頻緊縮編碼音頻緊縮算法的分類普通來講,可以將音頻緊縮技術分為無損lossless緊縮及有損lossy緊縮兩大類,而按照緊縮方案的不同,

2、又可將其劃分為時域緊縮、變換緊縮、子帶緊縮,以及多種技術相互交融的混合緊縮等等。 時域緊縮或稱為波形編碼子帶緊縮技術變換緊縮技術 數字音頻緊縮技術音頻緊縮算法的分類時域緊縮算法子帶編碼MP3音頻緊縮編碼時域緊縮算法時域緊縮技術普通多用于語音緊縮、低碼率運用源信號帶寬小的場所。時域緊縮技術主要包括PCM、ADPCM、LPC、CELP,以及在這些技術上開展起來的塊壓擴技術。 脈沖編碼調制(PCM) 增量調制延續可變斜率增量調制CVSD自順應差分脈沖編碼調制ADPCM 數字電路倍增設備自順應差分脈沖編碼調制 時域緊縮算法嵌入式自順應差分脈沖編碼調制E-ADPCM線性預測編碼LPC 殘差鼓勵線性預測編

3、碼RELP 碼鼓勵線性預測編碼CELP低時延碼鼓勵線性預測編碼LD-CELP矢量和鼓勵線性預測編碼VSELP代數碼本鼓勵線性預測編碼(ACELP) 共扼構造代數碼鼓勵線性預測編碼CS-ACELP 規那么脈沖鼓勵長時預測線性預測編碼RPE-LTP-LPC 脈沖編碼調制 聲音數字化有兩個步驟:第一步是采樣,就是每隔一段時間間隔讀一次聲音的幅度;第二步是量化,就是把采樣得到的聲音信號幅度轉換成數字值。 量化有好幾種方法,但可歸納成兩類:一類稱為均勻量化,另一類稱為非均勻量化。假設采用相等的量化間隔對采樣得到的信號作量化,那么這種量化稱為均勻量化。均勻量化就是采用一樣的“等分尺來度量采樣得到的幅度,也

4、稱為線性量化。這種方法稱為脈沖編碼調制,用PCM表示。 非線性量化非線性量化的根本想法是,對輸入信號進展量化時,大的輸入信號采用大的量化間隔,小的輸入信號采用小的量化間隔。在非線性量化中,采樣輸入信號幅度和量化輸出數據之間定義了兩種對應關系,一種稱為m律壓(縮)擴(展)算法,另一種稱為A律壓(縮)擴(展)算法。 m律壓(縮)擴(展)算法m律壓擴用在北美和日本等地域的數字通訊中,按下面的式子確定量化輸入和輸出的關系:式中:x為輸入信號幅度,規格化成-1 x 1; sgn(x)為x的極性;m為確定緊縮量的參數,它反映最大量化間隔和最小量化間隔之比,取100m500。 A律壓(縮)擴(展)算法A律(

5、A-Law)壓擴用在歐洲和中國大陸等地域的數字通訊中,按下面的式子確定量化輸入和輸出的關系:式中:x為輸入信號幅度,規格化成-1x1,sgn(x)為x的極性;A為確定緊縮量的參數,它反映最大量化間隔和最小量化間隔之比。 增量調制增量調制DM(Delta Modulation)是一種預測編碼技術。 DM是對實踐的采樣信號與預測的采樣信號之差的極性進展編碼,將極性變成“0和“1這兩種能夠的取值之一。假照實踐的采樣信號與預測的采樣信號之差的極性為“正,那么用“1表示;相反那么用“0表示。由于DM編碼只須用1比特對信號進展編碼,所以DM編碼系統又稱為“1比特系統。 DM波形編碼的原理圖其中xi表示在i

6、點的編碼輸出, yi表示輸入信號的實踐值, yi表示輸入信號的預測值。假設采用均勻量化,量化階的大小為,在開場位置的輸入信號y0=0,預測值y0=0,編碼輸出x01 增量調制的缺陷一是會出現斜率過載,即增量調制器的輸出不能堅持跟蹤輸入信號的快速變化 二是會產生粒狀噪聲。反響回路輸出信號的最大變化速率遭到量化階大小的限制,由于量化階的大小是固定的。處理方法:自順應增量調制。根據輸入信號斜率的變化自動調整量化階的大小,以使斜率過載和粒狀噪聲都減到最小。許多研討人員研討了各種各樣的方法,而且幾乎一切的方法根本上都是在檢測到斜率過載時開場增大量化階,而在輸入信號的斜率減小時降低量化階。 自順應差分脈沖

7、編碼調制ADPCM編碼的方法是對輸入樣值進展自順應預測,然后對預測誤差進展量化編碼。它是一種預測編碼的方法。所謂預測編碼,是指編碼的對象不是原始信號的采樣量化值,而是對當前采樣值與預測值根據前假設干個采樣值采用一定的預測方法產生的輸入信號的差值進展編碼。假設采用的預測方法足夠準確差值將接近于零,可以預見,這種編碼方法比直接對樣本值進展編碼可以采用較少的比特數。 CCITT的32kbit/s語音編碼規范G.721采用ADPCM編碼方式,每個語音樣值相當于用4bit進展編碼。自順應差分脈沖編碼調制它的中心想法是:利用自順應的思想改動量化階的大小,即使用小的量化階(step-size)去編碼小的差值

8、,運用大的量化階去編碼大的差值 ;運用過去的樣本值估算下一個輸入樣本的預測值,使實踐樣本值和預測值之間的差值總是最小。 數字電路倍增設備自順應差分脈沖編碼調制 DCME-ADPCM是CCITT G.723語音編碼規范算法這種算法可以在40kbit/s、32kbit/s和24kbit/s三種速率中動態調整,以到達在給定的信道中添加容量的目的 線性預測編碼 LPC(Linear Predictive Coding)語音編碼是最根本的低速率語音編碼方法,LPC語音編碼的根底是語音產生模型,在這個模型中,語音是由鼓勵信號鼓勵一個自順應濾波器即LPC濾波器而產生。LPC濾波器的參數是經過線性預測的方法,

9、即用過去的樣值預測當前樣值提取的。美國聯邦規范FS1015的2.4kbitsLPC-10和LPC-10e就是LPC語音編碼的典型例子,主要用于線上的窄帶語音嚴密通訊。 低時延碼鼓勵線性預測編碼 LD-CELP是CCITT G.728語音編碼規范算法,其輸出速率為16kbit/s。這種方法在CELP算法的根底上,采用后向自順應線性預測、50階合成濾波、短鼓勵矢量5個樣值等改良方法,從而到達高質量和低時延的目的,總的編碼時延小于2ms。 代數碼本鼓勵線性預測編碼極低速率可視規范H.324中語音編碼規范是G.723.1,采用5.27kbits和6.3kbits兩種速率,其中5.27kbits速率就是

10、以ACELP算法為根底。 共扼構造代數碼鼓勵線性預測編碼 CS-ACELP編碼算法被ITU-T的8kbit/s語音編碼規范G.729采用 規那么脈沖鼓勵長時預測線性預測編碼這種算法是歐洲900MHz數字蜂窩挪動的語音編碼規范GSM,也為數字蜂窩系統DCS1800所采用。 RPE-LTP-LPC算法是MPE-LPC的改良算法,除了添加長時預測功能外,鼓勵脈沖的位置具有一定的規律。數字音頻緊縮技術音頻緊縮算法的分類時域緊縮算法子帶編碼MP3音頻緊縮編碼子帶編碼子帶編碼SBC(subband coding)的根本思想是,首先運用一組帶通濾波器BPF(band-pass filter)把輸入音頻信號的

11、頻帶分成假設干個延續的頻段,每個頻段稱為子帶。對每個子帶中的音頻信號采用單獨的編碼方案去編碼。在信道上傳送時,將每個子帶的代碼復合起來。在接納端譯碼時,將每個子帶的代碼單獨譯碼,然后把它們組合起來,復原成原來的音頻信號。采用對每個子帶分別編碼的益處有二個。第一,對每個子帶信號分別進展自順應控制,量化階的大小(quantization step)可以按照每個子帶的能量電平加以調理。具有較高能量電平的子帶用大的量化階去量化,以減少總的量化噪聲。第二,可根據每個子帶信號在覺得上的重要性,對每個子帶分配不同的比特數,用來表示每個樣本值。例如,在低頻子帶中,為了維護音調和共振峰的構造,就要求用較小的量化

12、階、較多的量化級數,即分配較多的比特數來表示樣本值。而話音中的摩擦音和類似噪聲的聲音,通常出如今高頻子帶中,對它分配較少的比特數。 子帶編碼方塊圖子帶編碼對每個子帶分別編碼的益處是: 可以利用人耳或人眼對不同頻率信號的感知靈敏度不同的特性,在人的聽覺或視覺不敏感的頻段采用較粗糙的量化,從而到達數據緊縮的目的。 各個子帶的量化噪聲都束縛在本子帶內,這就可以防止能量較小的頻帶內的信號被其它頻帶中量化噪聲所掩蓋 經過頻帶分裂,各個子帶的取樣頻率可以成倍下降。 數字音頻緊縮技術音頻緊縮算法的分類時域緊縮算法子帶編碼MP3音頻緊縮編碼MP3音頻緊縮編碼 MP3是一種音頻緊縮的國際技術規范。MP3格式開場

13、于二十世紀80年代中期,是在德國夫朗和費研討所Fraunhofer Institute開場的,研討努力于高質量、低數據率的聲音編碼。1989年,夫朗和費研討所在德國被獲準獲得了MP3的專利權,幾年后這項技術被提交到國際規范組織(ISO),整合進入了MPEG-1規范。 MP3格式是一個讓音樂界產生宏大震動的一個聲音格式。MP3的全稱是Moving Picture Experts Group, Audio Layer 3,它所運用的技術是在VCDMPEG-1的音頻緊縮技術上開展出的第三代,而不是MPEG-3。 MP3音頻緊縮編碼MPEG代表的是MPEG活動影音緊縮規范,MPEG音頻文件指的是MPE

14、G規范中的聲音部分即MPEG音頻層。MPEG音頻文件根據緊縮質量和編碼復雜程度的不同可分為三層MPEG AUDIO LAYER 1/2/3分別與MP1、MP2和MP3這三種聲音文件相對應。MPEG音頻編碼具有很高的緊縮率,MP1和MP2的緊縮率分別為4:1和6:1-8:1,而MP3的緊縮率那么高達10:112:1,也就是說一分鐘CD音質的音樂未經緊縮需求10MB存儲空間,而經過MP3緊縮編碼后只需1MB左右,同時其音質根本堅持不失真。MP3音頻緊縮編碼音樂信號中有許多冗余成分,其中包括間隔和一些人耳分辨不出的信息如混雜在較強背景中的弱信號。MP3為降低聲音失真采取了名為“感官編碼技術的編碼算法

15、:編碼時先對音頻文件進展頻譜分析,然后用過濾器濾掉噪音,接著經過量化的方式將剩下的每一位打散陳列,最后構成具有較高緊縮比的MP3文件,并使緊縮后的文件在回放時可以到達比較接近原音源的聲音效果。雖然它是一種有損緊縮,但是它的最大優勢是以極小的聲音失真換來了較高的緊縮比。 音頻編碼規范 G.711 G.722 G.723.1 G.728 G.729 音頻編碼規范比較G.711 1972年CCITT為質量和語音緊縮制定了PCM規范G.711。其速率為64kb/s,運用律或A律的非線性量化技術,主要用于公共網中。 G.7221988年CCITT為調幅廣播質量的音頻信號緊縮制定了G.722規范,它運用子

16、帶編碼(SBC)方案,其濾波器組將輸入信號分成高低兩個子帶信號,然后分別運用ADPCM進展編碼。G.722能將224kb/s的調幅廣播質量的音頻信號緊縮為64kb/s,主要用于視聽多媒體和會議電視等。 G.722的主要目的是堅持64kb/s的數據率,而音頻信號的質量要明顯高于G.711的質量。 G.723.11996年ITU-T經過了G.723規范“用于多媒體傳輸的5.3kb/s或6.3kb/s雙速率話音編碼。它采用多脈沖鼓勵最大似然量化(MP-MLQ)算法,此規范可運用于可視及IP等系統中。 G.728為了進一步降低緊縮的速率,CCITT于1992年制定了G.728規范,運用基于低時延碼本鼓

17、勵線性預測編碼(LD-CELP)算法,其速率為16kb/s,主要用于公共網中。 G.729ITU-T于1996年3月經過了G.729規范,它運用8kb/s的共軛構造代數碼鼓勵線性預測(CS-ACELP)算法,此規范將在無線挪動網、數字多路復用系統和計算機通訊系統中運用。 音頻編碼規范比較 第四講 數字語音處置技術 數字音頻緊縮技術三維音效語音識別自然言語了解語音合成 三維音效人類的聽覺3D音效的分類杜比AC-3DTS 人類的聽覺人耳的根本聲音定位原理是IIDInteraural Intensity Difference,兩側聲音強度差別和ITDInteraural Time Differenc

18、e,兩側聲音時間延遲差別。IID指間隔音源較近的哪一邊耳朵,所收到的聲音強度比另一側高,感到聲音更大一些。ITD指方位的不同,使聲音到達兩耳的時間有差別,人們會覺得聲音位于到達時間早些的那一邊,IID+ITD的結果是把音源定位到以聽者兩耳這間連線為軸線的錐體范圍之內。 人類的聽覺耳廓外耳的作用是濾波器,根據聲音的不同角度,加強/減弱音波能量,過濾之后傳給大腦,讓我們更準確地聲源的位置。耳廓的大小有限,因此可以收到的音波范圍也有限,通常是20Hz到20KHz,即波長16米到1.6厘米的音波。換言之,低于此范圍是次聲波,高于此范圍是超聲波。 由于兩耳機的間隔約為15厘米,當波長大于15厘米時IIT

19、和ITD將會減弱。頻率低的聲音波長大,因此我們很難判別出低音的位置,卻能隨便分辨高音的方位。實踐上,耳廓對于聲音的定位,是至關重要的一環,沒有外耳的人難以判別聲音發出的位置。 人類的聽覺人類依托一種稱為HRTFHead Related Transfer Function,頭部關聯傳輸功能的系統來判別聲音發出的位置。每個人的HRTF都不盡一樣,還可以進展交換。HRTF的檢測非常簡單,先在人的耳道內放置兩個微型麥克風,再在聽者附近放一個音箱,播放確定的信號,同時記錄麥克風收到的信號。比較源信號和麥克風的脈沖特性曲線就可以得到其中一個濾波效果。最后于聽者附近的一切位置反復上述過程,即可獲取完好的HR

20、TF系統。 三維音效人類的聽覺3D音效的分類杜比AC-3DTS 3D音效的分類3D音效的兩個最重要要素是定位和交互。定位即讓人們準確地判別出聲音的來源,可以經過預選錄制聲音,再進展特定的解碼來實現。實時的定位就是交互,聲音并非預選錄制好的,而是按照他的控制來決議聲音的位置。即時生成的交互式聲音對輸入設備的要求,比預選錄制音軌的放音設備如:電影要更強一些。 3D音效的分類擴展式立體聲它運用聲音延遲技術對傳統的立體聲進展額外處置,擴寬了音場的位置,使聲音延展到音箱以外的空間,讓我們覺得的3D世界更寬廣 環繞立體聲它采用音頻緊縮技術(如:杜比AC-3)把多通道音源編碼成一段程序,再以一組多揚聲器系統

21、來進展解碼,實現多區域環繞效果。 交互式3D音效 交互式3D盡量地復制了人耳在真實世界中聽到的聲音,并運用一定的算法來播放出來,讓我們感到整個三維空間的一切地方都能夠產生聲音,并隨聽者的挪動而做出相應改動。 三維音效人類的聽覺 3D音效的分類杜比AC-3DTS 杜比AC-3 為了提高HDTV聲音的質量,防止模擬矩陣編碼的局限性,提出了雙通道的碼率提供多通道的編碼性能的想象,杜比AC-3就是為了實現這一想象而開發的。杜比AC-3可以把五個獨立的全頻帶和一個超低音通道的信號實行一致編碼,成為單一的復合數據流。 AC-3的頻響為20Hz20kHz 0.5dB(-3dB時為3Hz20.3kHz),超低

22、聲道頻率范圍是20Hz120Hz 0.5dB。可支持32kHz、44.1kHz、48kHz三種取樣頻率。數碼率可低至單聲道的32kb/s,高到多聲道640kb/s,以順應不同需求。 杜比AC-3AC-3采用基于改良離散余弦變換MDCT的自順應變換編碼ATC算法。ATC算法的一個重要思索是基于人耳聽覺掩蔽效應的臨界頻帶實際,即在臨界頻帶內一個聲音對另一個聲音信號的掩蔽效應最明顯。因此,劃分頻帶的濾波器組要有足夠銳利的頻率呼應,以保證臨界頻帶外的噪聲衰減足夠大,使時域和頻域內的噪聲限定在掩蔽門限以下。 三維音效人類的聽覺 3D音效的分類杜比AC-3DTS DTSDTS是“Digital Theat

23、re System的縮寫,是“數字化影院系統的意思。從技術上講,DTS與包括Dolby Digital在內的其它聲音處置系統是完全不同的。Dolby Digital是將音效數據存儲在電影膠片的齒孔之間,由于空間的限制而必需采用大量的緊縮的方式,這樣就不得不犧牲部分音質。DTS公司用一種簡單的方法處理了這個問題,即把音效數據存儲到另外的CD-ROM中,使其與影像數據同步。這樣不但空間得到添加,而且數據流量也可以相對變大,更可以將存儲音效數據的CD改換,來播放不同的言語版本。 DTSDTS 系統不僅具有 AC-3 類似功能,更加強了其縱深定位交叉效果。DTS 芯片容量為 1536kbps,緊縮傳輸

24、比為 4:1;而 AC-3 芯片容量為 448kbps,緊縮比為 10:1。正是由于DTS 信息容量的添加,音色更加優美。DTS 家庭影院的中心是 DTS 解碼器,它可對 DVD,CD 的杜比數字解碼,輸出 5.1 聲道信息,也可以選擇DTS方式,輸出6 聲道信息。DTS 和杜比數字在音質上有著明顯的不同,前者聲音力度強勁,聲音的上升和切入都很鋒利,音場的透明感明晰可聞,尤其是豐富的低音效果表現得更加猛烈火爆。后者在低音方面短少豐富的力度 第四講 數字語音處置技術 數字音頻緊縮技術三維音效語音識別自然言語了解語音合成 語音識別技術及運用語音識別的開展歷史 語音識別技術語音識別系統的類型 語音識

25、別的運用 語音識別的開展歷史語音識別技術的研討任務始于20世紀50年代,當時AT&T Bell實驗室實現了第一個可識別十個英文數字的語音識別系統Audry系統。 60年代,計算機的運用推進了語音識別的開展。70年代,語音識別領域獲得了突破。 80年代,語音識別研討進一步走向深化,其顯著特征是HMM模型和人工神經元網絡ANN在語音識別中的勝利運用。 90年代,隨著多媒體時代的降臨,迫切要求語音識別系統從實驗室走向適用。 語音識別技術的開展歷史 如圖表示了從80年代初以來語音識別技術閱歷的從孤立詞、小詞匯量、特定人到大詞匯量、非特定人、自然口語識別的開展歷程。語音識別技術及運用語音識別的開展歷史

26、語音識別技術語音識別系統的類型 語音識別的運用 語音識別技術不同的語音識別系統,雖然詳細實現細節有所不同,但所采用的根本技術類似,它所涉及的領域包括:信號處置、方式識別、概率論和信息論、發聲機理和聽覺機理、人工智能等等。 語音識別技術主要包括特征提取技術、方式匹配準那么及模型訓練技術三個方面。此外,還涉及到語音識別單元的選取。 特征參數提取技術 語音信號中含有豐富的信息,這些信息稱為語音信號的聲學特征 特征提取是對語音信號進展分析處置,去除對語音識別無關緊要的冗余信息,獲得影響語音識別的重要信息 由于語音信號的時變特性,特征提取必需在一小段語音信號上進展,也即進展短時分析 常用的一些聲學特征

27、線性預測系數LPC 倒譜系數CEP Mel倒譜系數MFCC和感知線性預測PLP 方式匹配及模型訓練技術 模型訓練是指按照一定的準那么,從大量知方式中獲取表征該方式本質特征的模型參數,而方式匹配那么是根據一定準那么,使未知方式與模型庫中的某一個模型獲得最正確匹配。 語音識別所運用的方式匹配和模型訓練技術主要有動態時間歸正技術DTW,又稱為動態時間彎折技術、隱馬爾可夫模型HMM和人工神經元網絡ANN。 典型語音識別系統的實現過程 語音識別單元的選取 選擇識別單元是語音識別研討的第一步 語音識別單元有單詞句、音節和音素三種 單詞單元廣泛運用于中小詞匯語音識別系統 音節單元多見于漢語語音識別 音素單元

28、以前多見于英語語音識別的研討中,但目前中、大詞匯量漢語語音識別系統也在越來越多地采用 語音識別技術及運用語音識別的開展歷史 語音識別技術語音識別系統的類型 語音識別的運用 語音識別系統的類型語音識別系統有以下幾種分類方式: 根據對說話人的依賴程度可以分為特定人和非特定人語音識別系統 根據對說話人說話方式的要求,可以分為孤立字詞語音識別系統,銜接詞語音識別系統以及延續語音識別系統根據詞匯量大小,可以分為小詞匯量、中等詞匯量、大詞匯量以及無限詞匯量語音識別系統 特定人語音識別系統 特定人的識別系統精明得足以能了解講話者的語音特點,它從語音簽名上就能知道講話者的身份。 只需在講話者用特定單詞組構成的

29、詞匯表訓練系統后,它才干識別 特定人系統的優點是它是可訓練的,系統很靈敏,可以訓練它來識別新詞 特定人的系統的缺陷是由一個用戶訓練的系統不能被另一用戶運用 例:手機中運用的語音撥號非特定人語音識別系統非持定人識別系統可識別任何用戶的語音。它不需求任何來自用戶的訓練,由于它不依賴于個人的語音簽名。 為生成非特定人識別系統、大量的用戶訓練了大詞匯表的識別器。 在訓練系統時,男聲和女聲、不同的口音和方言,以及帶有背景噪音的環境都計入了思索范圍之內以生成參考模板。例:IBM Via Voice 孤立詞語音識別系統孤立詞(語音)識別系統,一次只提供一個單一詞的識別 識別器的第一個義務是進展幅度和噪聲歸一

30、化,下一步是參數分析 可以經過把對應于一個詞的大量樣本聚集為單一群來獲得非特定人孤立單詞語音識別器。 銜接詞語音識別系統銜接詞的語音由所說的短語組成,而短語又是由詞序列組成 識別銜接詞短語中單詞的一種方法是采用詞定位技術 類似于孤立詞語音識別,銜接詞語音識別用于命令和控制運用 延續語音識別系統延續語音由在聽寫中構成段落的完好句子組成 延續語音識別系統可以分成以下三部分: 第一部分包括數字化、幅度歸一化、時間歸一化和參數表示 另一部分包括分割并把語音段標志成在基于知識或基于規那么系統上的符號串 最后一部分是設計用于識別詞序列而進展語音段匹配 語音識別技術及運用語音識別的開展歷史 語音識別技術語音

31、識別系統的類型 語音識別的運用 語音識別的運用語音郵件集成數據庫輸人和訊問運用 語音命令和控制運用 第四講 數字語音處置技術 數字音頻緊縮技術三維音效語音識別自然言語了解語音合成 自然言語了解 自然言語了解就是研討如何能讓計算機了解并生成人們日常所運用的(如漢語、英語)言語,使得計算機懂得自然言語的含義,并對人給計算機提出的問題,經過對話的方式,用自然言語進展回答。目的在于建立起一種人與機器之間的親密而友好的關系,使之能進展高度的信息傳送與認知活動。 用自然言語與計算機進展通訊,這是人們長期以來所追求的。自然言語了解一個中文文本從方式上看是由漢字包括標點符號等組成的一個字符串。由字可組成詞,由

32、詞可組成詞組,由詞組可組成句子,進而由一些句子組成段、節、章、篇。無論在上述的各種層次:字符、詞、詞組、句子、段,還是在下一層次向上一層次轉變中都存在著歧義和多義景象,即方式上一樣的一段字符串,在不同的場景或不同的語境下,可以了解成不同的詞串、詞組串等,并有不同的意義。自然言語處置的中心技術是言語分析技術,即將句子數量無限變換成由詞語數量可控及其籠統方式數量有限構成的用某種數據構造句法樹、復雜特征集或語義網絡表示的內部方式數量有限。 自然言語了解言語分析技術可以分為基于規那么與基于統計數據兩大類。概率語法經過語料庫統計給每條言語規那么加上概率值,言語規那么便有了“柔性,不再是“說一不二、“非此

33、即彼。概率語法是有機結合這兩類技術的較好實際體系。為了完成這種統計,事先必需按照人給出的言語規那么加工語料庫至少要加工一部分訓練語料,這闡明統計方法也需求規那么的指點。兩者之間的結合和相互利用是必然的趨勢。 自然言語了解言語分析可以劃分為詞法析、句法分析、語義分析、篇章分析等步驟。如今,詞法分析和句法分析相對成熟,語義分析逐漸成為研討重點。對象單元由小到大從句子向篇章開展。實踐上只需在篇章的范圍內分析,省略、指代和句子的固有歧義等問題才能夠處理。 假設說自然言語處置技術尚未獲得艱苦突破,其含義就是完好言語分析技術尚未過關。淺層分析技術或者只提取句子中的名詞短語,或者只識別句子的謂語中心詞及其他組塊同謂語中心詞的依存關系。這樣的技術就是順該

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論