人工智能時代語言學(xué)家面臨的機遇和挑戰(zhàn)_第1頁
人工智能時代語言學(xué)家面臨的機遇和挑戰(zhàn)_第2頁
人工智能時代語言學(xué)家面臨的機遇和挑戰(zhàn)_第3頁
人工智能時代語言學(xué)家面臨的機遇和挑戰(zhàn)_第4頁
人工智能時代語言學(xué)家面臨的機遇和挑戰(zhàn)_第5頁
已閱讀5頁,還剩6頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、    人工智能時代語言學(xué)家面臨的機遇和挑戰(zhàn)    張樂 唐亮摘要:人工智能作為一個新興的、極具發(fā)展前景的研究領(lǐng)域,其與語言學(xué)研究有著深厚的淵源。一方面,語言研究的成果為人工智能的發(fā)展提供了動力,另一方面人工智能對語言學(xué)提出了更高的要求,影響著語言研究的范圍和方向,促進著語言研究的深入發(fā)展。在介紹人工智能及語言智能概念的基礎(chǔ)上,闡述人工智能時代語言研究的新形勢。從語言學(xué)家的視角出發(fā),探究語言學(xué)內(nèi)部的多個子學(xué)科面臨的機遇及挑戰(zhàn)。語言學(xué)家要順應(yīng)智能趨勢,為人工智能的發(fā)展貢獻更大的力量。關(guān)鍵詞: 人工智能; 語言學(xué); 自然語言處理; 機器翻譯; 融合創(chuàng)新:tp

2、18       :a:1009-3044(2020)24-0195-03abstract: as an emerging and promising research field, artificial intelligence has a deep relationship with linguistic research. on the one hand, the results of language research provide the impetus for the development of artificial intelligence; o

3、n the other hand, artificial intelligence puts forward higher requirements for linguistics, affects the scope and direction of language research, and promotes the in-depth development of language research. based on the introduction of the concepts of artificial intelligence and language intelligence

4、, the new situation of language research in the era of artificial intelligence is explained. from the perspective of linguists, explore the opportunities and challenges faced by multiple subdisciplines within linguistics. linguists should follow the trend of intelligence and contribute greater power

5、 to the development of artificial intelligence.key words:artificial intelligence;  linguistics;  natural language processing;  machine translation;  integration and innovation1 引言近年來,隨著計算機的發(fā)展和科學(xué)技術(shù)的進步,人工智能技術(shù)得到迅猛發(fā)展,社會的這一深刻變革給各行各業(yè)都提供了更多的機遇,但隨之而來的是在新形勢下攸關(guān)“生死存亡”的重大挑戰(zhàn),不容忽視。可以說,人工智能是一把“

6、雙刃劍”。這敲響了語言學(xué)家心中的警鐘,以研究自然語言為任務(wù)的語言學(xué)在人工智能時代將走上怎樣的發(fā)展道路?筆者認為語言學(xué)家不必擔心,新形勢下語言研究面臨的機遇是大于挑戰(zhàn)的。語言是人類思維的表現(xiàn)形式,人工智能其根本目的是用計算機來模擬人類思維,要實現(xiàn)這一目標就必須以模擬人類的自然語言作為出發(fā)點。另外,中國計算語言學(xué)先驅(qū),馮志偉先生曾說過一句名言:“人工智能領(lǐng)域,得語言者得天下。”馮先生所言肯定了語言及語言研究的重要地位,為語言學(xué)家們鼓舞了士氣。語言研究是一個永恒的課題,特別是在人工智能、人機對話火熱的今天,語言無疑是影響人工智能突破進展的關(guān)鍵。因此,在人工智能的時代背景下,語言研究如何一方面應(yīng)對科技

7、帶來的挑戰(zhàn),更好地生存和發(fā)展,另一方面抓住機遇拓展新思路和新領(lǐng)域,為人工智能的發(fā)展貢獻力量,是當前語言學(xué)家必須要思考的問題。2 人工智能及語言智能人工智能(artificial intelligence)簡稱ai,旨在用人工的方法和技術(shù),使用各種自動化機器或智能機器(主要指計算機)模仿和擴展人類智能,實現(xiàn)某些機器思維或腦力勞動自動化。自1956年被正式提出以后,從此成為一個新興的研究領(lǐng)域,在之后半個多世紀的發(fā)展歷程中,人工智能潮起潮落,印證了前途的光明和道路的曲折。2016年被譽為人工智能跨越式發(fā)展的一年,這一年有許多標志性的成果出現(xiàn),最為人稱道的就是alphago戰(zhàn)勝了人類圍棋冠軍李世石,時

8、隔不久alphazero又戰(zhàn)勝了alphago。機器智能在某些領(lǐng)域已經(jīng)達到甚至超越人類智能,但是目前的人工智能屬于弱人工智能,即讓機器具有某種智能的行為。真正有知覺、能夠推理和解決問題的強人工智能目前只是出現(xiàn)在好萊塢的科幻電影里或強人工智能者的信仰里。迄今為止,并沒有任何一部真正理解人類語言的機器,因此更不會有像人一樣能夠進行創(chuàng)造性思維的機器和具有人一樣的文化生存方式的機器。語言是人類特有的能力和智能的體現(xiàn),有研究表明,即使是像黑猩猩這樣的人類近親,也不具備這樣的能力。語言對于人類來說有著極為重要的地位,它將人類的思想表達出來,是人類思維的工具,同時承載了人類想要表達的所有信息,是最重要的信息

9、載體。為了模仿人類智能,人工智能的一種高級表現(xiàn)形式就是運用計算機和信息技術(shù)對人類語言進行分析和處理,我們把它稱作“語言智能”。語言智能不僅是人工智能的核心部分,更是人機交互認知的重要基礎(chǔ)和手段,因此被譽為人工智能皇冠上的明珠。人工智能發(fā)展到今天取得了非常多耀眼的成績,這其中數(shù)據(jù)、算法、硬件功不可沒,使得一部分人陶醉于機器學(xué)習、深度學(xué)習和神經(jīng)網(wǎng)絡(luò)的成功之中。事實上,數(shù)據(jù)和算法的優(yōu)勢固然重要,但這些只是表面的因素,最終對人工智能的瓶頸起突破作用的將是語言、認知和其他學(xué)科。人們越來越深刻地認識到,人機之間的交互溝通離不開語言,只有在語言智能上獲得關(guān)鍵性突破,才能推動弱人工智能逐步發(fā)展為強人工智能。3

10、 人工智能時代的語言學(xué)處在科技領(lǐng)域前沿的人工智能并非是一個單一的學(xué)科,其發(fā)展是建立在計算機科學(xué)、心理學(xué)、語言學(xué)等多種學(xué)科相互滲透的基礎(chǔ)之上的。雖然語言學(xué)與人工智能看起來區(qū)別很大,實則有著深厚的淵源,它為人工智能的發(fā)展提供合格的構(gòu)建材料。語言學(xué)是一門研究人類語言即自然語言的學(xué)科,包括了多個分支子學(xué)科。語言學(xué)的歷史追溯起來較為久遠,人類對語言的認識是逐漸深入的,今天的語言學(xué)與60年前也大不相同。縱觀現(xiàn)代語言學(xué)的發(fā)展可以看出,語言學(xué)家們以揭示語言的本質(zhì)為目的,在語言的結(jié)構(gòu)、語義以及語言的社會功能等許多方面都進行了深入的研究。語言學(xué)的傳統(tǒng)方法和理論被從事機器解決智能課題的計算機學(xué)家使用,早期取得了一些

11、成果,但由于在計算機領(lǐng)域?qū)嵺`的實用性不強,并且研究后勁不足,影響其在人工智能方面的應(yīng)用,已不能滿足人工智能時代的需要。人工智能時代的語言學(xué)更加注重能否被計算機理解和使用,語言學(xué)應(yīng)與計算機科學(xué)深度結(jié)合。自然語言處理(natural language processing)簡稱nlp,主要研究如何用計算機來分析處理自然語言,對文本包含理解和生成兩部分,是人工智能學(xué)科研究和應(yīng)用的主要領(lǐng)域。nlp的具體任務(wù)包括自動文摘、機器翻譯、語音識別等。在早期的nlp領(lǐng)域存在著“厚此薄彼”的現(xiàn)象,簡單解釋就是語言學(xué)家遭受到計算機學(xué)家的無視甚至排斥,不僅很多和自然語言相關(guān)的大型項目里面語言學(xué)家的參與度不夠,就連谷歌

12、的諾維格和語言學(xué)家喬姆斯基之間的爭論也是很不友好的。這一現(xiàn)象很快出現(xiàn)了轉(zhuǎn)折,曾經(jīng)大受追捧的統(tǒng)計方法在人工智能時代遇到了發(fā)展瓶頸,由于過度依賴語料,忽視句法、語義等語言學(xué)知識,深層的語言學(xué)知識并未得到探索和利用,造成nlp的發(fā)展受到桎梏。遇到今天的瓶頸,還需要更多更深入的語言學(xué)研究來解決。以nlp的具體任務(wù)為例,機器翻譯從誕生之日起就與語言學(xué)緊密聯(lián)系,語言學(xué)和機器翻譯很多情況下是共同發(fā)展的。最初成功的機器翻譯是基于語言學(xué)規(guī)則,而后來出現(xiàn)的統(tǒng)計機器翻譯和神經(jīng)網(wǎng)絡(luò)機器翻譯中,傳統(tǒng)的語言學(xué)逐漸被移出機器翻譯的核心算法,但是仍然扮演重要的角色,特別是在數(shù)據(jù)不足的情況下。統(tǒng)計機器翻譯中大可以從語言學(xué)角度出

13、發(fā),在基于統(tǒng)計的方法上添加規(guī)則。神經(jīng)網(wǎng)絡(luò)機器翻譯添加語法、語義等信息可能會取得更好的效果,目前來看這些信息還沒有較好的應(yīng)用。除了機器翻譯核心算法,一個完整的機器翻譯系統(tǒng)還包括數(shù)據(jù)獲取,數(shù)據(jù)預(yù)處理,結(jié)果后處理,性能評測等部件,在這些方面語言學(xué)還是大有用武之地的。現(xiàn)階段,機器翻譯的發(fā)展主要由計算機專家主導(dǎo),而語言學(xué)家日漸式微,這難免造成科技界的過分樂觀和語言學(xué)界的擔憂。語言不是輕而易舉就能轉(zhuǎn)譯成功的,即使谷歌等公司宣稱機器翻譯技術(shù)達到了人類專業(yè)水平,翻譯問題仍然存在。中國數(shù)學(xué)家、語言學(xué)家周海中教授曾在論文機器翻譯五十年中指出語言本身才是制約譯文質(zhì)量的瓶頸,不能光靠程序設(shè)計來改良機譯系統(tǒng),只有解決語

14、言本身的問題,才能真正提高機譯的質(zhì)量。機器畢竟不是人,很多人文性、藝術(shù)性、感情性的內(nèi)容最終還是需要由人來完成。馮志偉教授指出,科技界過分強調(diào)語言的符號性,卻忽視了語言是凝結(jié)文化的復(fù)雜系統(tǒng),這不利于機器翻譯解決反諷等多樣化翻譯難題;而語言學(xué)界也不必妄自菲薄,語言學(xué)家們應(yīng)該擁抱技術(shù)革新,同時致力于機器翻譯背后原理的探究,破解尚存的“黑箱”問題。機器翻譯的歷史和現(xiàn)實促使語言學(xué)家必須進行新的探索,繼續(xù)挖掘自然語言 的特點和規(guī)律,完善自然語言的表述模式,進一步加強機器翻譯基礎(chǔ)理論和應(yīng)用技術(shù)的研究。自然語言是人類智能的一種展現(xiàn),既然是智能的展現(xiàn),那么通過研究自然語言,就可以挖掘出智能的一些本質(zhì)。而一旦語言

15、被機器認知理解,那么真正的人工智能就有更多實現(xiàn)的可能。人們越來越意識到,對于自然語言的關(guān)鍵問題,突破的鑰匙其實是掌握在語言學(xué)家或者是通曉語言學(xué)成果的人手里。4 語言學(xué)家的機遇和挑戰(zhàn)現(xiàn)代語音識別和自然語言處理研究的先驅(qū)frederick jelinek 1988年說道:“every time i fire a linguist,the performance of the speech recognizer goes up.”這句話給人們提供了錯誤的信息:在自然語言處理技術(shù)發(fā)展的進程中,語言專家的作用微乎其微。這就引起了語言學(xué)界的大討論:人工智能不需要語言學(xué)家,依靠計算機,依靠物理學(xué)家就可以完成

16、,那語言學(xué)的實用價值在哪里呢?語言學(xué)家存在的意義又在哪里呢?筆者認為其實語言學(xué)家不需擔心,人工智能在語言方面并不會一直如此發(fā)展下去,當遇到瓶頸期時,語言學(xué)的價值就體現(xiàn)出來了。本章將從語言學(xué)的幾個分支學(xué)科的角度來探討語言學(xué)家的機遇和挑戰(zhàn)。4.1 語音學(xué)隨著大數(shù)據(jù)的發(fā)展,很多智能產(chǎn)品已經(jīng)慢慢進入我們的生活,尤其人工智能已經(jīng)能夠與人無障礙的溝通交流,他們甚至可以自創(chuàng)語言。但細細研究,這背后的成果并不來自語言學(xué)家,而是計算機程序,其工作原理是“深度學(xué)習”。計算機程序內(nèi)部有一套處理任務(wù)的系統(tǒng),將語言做成數(shù)據(jù)輸入計算機,計算機自己去識別語言中內(nèi)在的規(guī)則,并應(yīng)用該規(guī)則輸出成語言,與人進行正常溝通。然而仔細觀

17、察就會發(fā)現(xiàn),人工智能輸出的話語與人說出的話并不相同。人在說出話語時是帶有情緒的,說的同時也在表達自己的觀點,一升一降都包含著豐富的意義,而并不是單純的輸出某一句話或某一段話,這就使得交流變得生動活潑。人工智能則不同,比如apple的語音助手siri,它在輸出一句話時其實并沒有任何情緒的表達,只是單純客觀地敘說某一件事。這些話沒有升降的表達,更沒有語氣,這就使得語言的表達是呆板、枯燥的。這就給語言學(xué)的分支語音學(xué)留下一席之地。語音學(xué)是語音識別的理論基礎(chǔ),語音學(xué)特征知識在語音識別中起著十分關(guān)鍵的作用。早期的語音識別由于忽略了聲調(diào)這一最顯著的區(qū)別特征,識別效果并不理想。再加上上文提到的一些ai生成的語

18、音枯燥呆板的現(xiàn)象,都在提醒著語言學(xué)家,加強對語音學(xué)特征知識特別是語調(diào)、語氣的研究是個迫在眉睫的任務(wù),只有充分地綜合利用這些區(qū)別性特征信息,將其有效運用于語音系統(tǒng),才能讓語音識別和生成更上一個臺階。相信在不久的將來,語音學(xué)對語調(diào)、語氣的研究將會對人工智能進一步發(fā)展做出重大貢獻。4.2 語義學(xué)語言一直是智能的核心,語義問題是人工智能前進道路上不可避免且須迎頭面對的困難。如今,在人工智能發(fā)展日新月異的情況下,人工智能語義問題或者比我們所想象的更加具有緊迫性和現(xiàn)實性。越來越多的學(xué)者意識到,單純依靠統(tǒng)計方法無法繼續(xù)取得跨越性的突破,想要真正解決語義理解問題,必須依靠語言學(xué)的理論成果。語言學(xué)家可以在語義知

19、識表示研究以及語義基礎(chǔ)設(shè)施建設(shè),比如大規(guī)模語義知識庫構(gòu)建等方面發(fā)揮應(yīng)有的作用,語言知識庫可以為語義理解任務(wù)提供寶貴的知識資源。在人工智能的背景下,一方面,大規(guī)模知識庫構(gòu)建任務(wù)需要時間和精力,對語言學(xué)家仍是一個不小的挑戰(zhàn),另一方面,知識庫自動構(gòu)建技術(shù)的成果也為語言學(xué)家減輕了很多負擔。4.3 計算語言學(xué)計算語言學(xué)的傳統(tǒng)研究方法及理論已經(jīng)取得了豐碩的成果,可以為自然語言處理提供方法論的指導(dǎo)。智能時代要求語言學(xué)家開辟新的視野,探索新的研究方法。在強大的計算能力和科學(xué)統(tǒng)計模型的雙重輔助下,語言學(xué)家既可以沿用傳統(tǒng)方式從語言樣本中挖掘有理論價值的語言事實,給出詳盡合理的解釋;也能夠使用大數(shù)據(jù)技術(shù),挖掘、整理

20、海量語言數(shù)據(jù)知識,并將這些知識應(yīng)用到自然語言處理等人工智能領(lǐng)域中。當前,大數(shù)據(jù)驅(qū)動的方法已經(jīng)接近天花板,通過大知識驅(qū)動實現(xiàn)nlp的突破,是當前語言智能發(fā)展的新趨勢。人工智能科學(xué)的發(fā)展有可能推進語言的計算研究,從而使語言知識的表示成為計算機可識別的方式。這將會使語言學(xué)成為真正的科學(xué)。4.4 認知語言學(xué)人工智能發(fā)展至今,雖已取得了許多令人矚目的成就,但現(xiàn)有的人工智能還只是弱人工智能。人工智能可能的突破性進展還要依賴于認知科學(xué)的參與。如今人類已經(jīng)基本從神經(jīng)層面了解了大腦的工作方式,這對于研制ai來說是硬件理論,操作系統(tǒng)是實現(xiàn)高級功能的關(guān)鍵。語言也具有指導(dǎo)認知和思維的作用,認知語言學(xué)對于構(gòu)建ai的操作

21、系統(tǒng)來說是一種指導(dǎo)思想,認知語言學(xué)的研究成果對于人工智能的發(fā)展有著強有力的推動作用。人工智能正處于認知智能階段,認知語言學(xué)應(yīng)該與計算機科學(xué)更多地結(jié)合起來,語言學(xué)家需配合計算機學(xué)家,著力解決語言認知的瓶頸。在人工智能時代創(chuàng)造大規(guī)模數(shù)據(jù)的基礎(chǔ)上,語言學(xué)研究不但要有數(shù)據(jù)、模型,還需要結(jié)合人工智能研究熱點,從認知角度入手,把注意視角從語言本身轉(zhuǎn)向語言的實際使用規(guī)律、語言背后的語義及其組合機制等領(lǐng)域。5 語言學(xué)家應(yīng)學(xué)會融合創(chuàng)新人工智能的發(fā)展不僅對語言研究的各個領(lǐng)域提出了要求,而且對語言學(xué)家的研究方法提出了新的要求,促使他們開放思維、探索創(chuàng)新。語言學(xué)家可以從事跨學(xué)科的語言研究,通過研究語言來輔助解決社會問題如種族歧視和性別歧視、生態(tài)問題如物種滅絕、心理問題如抑郁癥等。語言研究是包括語言學(xué)家在內(nèi)的諸多學(xué)科專家和衷共濟的事業(yè),語言學(xué)家需與其他學(xué)科的專家合力攻關(guān)前沿課題如人工智能中的自然語言理解等,實現(xiàn)優(yōu)勢互補、合作共贏。在人工智能的時代背景下,語言研究不應(yīng)再囿于單純的本學(xué)科領(lǐng)域,而是要跨學(xué)科、跨領(lǐng)域,與其他學(xué)科交叉融合,逐步形成眾多的語言學(xué)與其他學(xué)科交叉融合的新的分支學(xué)科,這樣才能將研究不斷引向深入,才能更好地適應(yīng)新形勢,在人工智能事業(yè)中發(fā)揮應(yīng)有的作用。融合創(chuàng)新可以讓現(xiàn)代語言學(xué)研究煥發(fā)新的生機和活力。6 結(jié)束語作為人類最重

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論