07-2-詞義角色標(biāo)注_第1頁
07-2-詞義角色標(biāo)注_第2頁
07-2-詞義角色標(biāo)注_第3頁
07-2-詞義角色標(biāo)注_第4頁
07-2-詞義角色標(biāo)注_第5頁
已閱讀5頁,還剩13頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

語義分析Python自然語言處理第七章CONTENT目錄

01詞義消歧02詞義角色標(biāo)注03深層語義推理課前回顧基于規(guī)則的詞義消歧基于統(tǒng)計的詞義消歧基于實例的詞義消歧基于詞典的詞義消歧詞義角色標(biāo)注02格語法基于統(tǒng)計機(jī)器學(xué)習(xí)技術(shù)的語義角色標(biāo)注詞義角色標(biāo)注定義:淺層語義分析技術(shù),以句子為單位,分析句子的“謂詞-論元”結(jié)構(gòu)。其理論基礎(chǔ)來源于Fillmore(1968)年提出的格語法,不對句子所包含的語義信息進(jìn)行深入分析。任務(wù):是以句子的謂詞為中心,研究句子中各成分與謂詞之間的關(guān)系,并且用語義角色來描述他們之間的關(guān)系。語義角色標(biāo)注就是要針對句子中的(核心)謂詞來確定其他論元以及其他論元的角色。格語法格語法(casegrammar)是美國語言學(xué)家查爾斯·菲爾墨(CharlesJ.Fillmore)于1960年代末對轉(zhuǎn)換語法進(jìn)行修正而提出的一種語法分析理論。

其繼承了轉(zhuǎn)換語法關(guān)于深層結(jié)構(gòu)經(jīng)過轉(zhuǎn)換得到表層結(jié)構(gòu)的基本假設(shè),但在格語法中深層結(jié)構(gòu)表現(xiàn)為中心動詞與一組名詞短語。這些名詞短語與動詞間存在語義關(guān)系,被稱為“深層格”。格語法菲爾墨認(rèn)為深層格與表層格不同:深層格是所有語言共有的,只是轉(zhuǎn)換規(guī)則的不同導(dǎo)致了表層結(jié)構(gòu)中表現(xiàn)的不同。但對語言中有多少格并沒有定論,可根據(jù)需要來確定。菲爾墨建議使用九個格,分別為施事格、感受格、對象格、工具格、來源格、目的格、場所格、時間格、路徑格。格語法例:例如使用格語法分析“Thestudentsolvedproblemswithacalculatorintheclassroomthismorning”(這個學(xué)生今天上午在教室用計算器解決問題)solve(解決)為中心動詞thestudent(學(xué)生)為施事格(選用格)problems(問題)為受事格(必備格)withacalculator(計算器)為工具格(選用格)intheclassroom(教室)為場所格。(選用格)thismorning(上午)為時間格。(選用格)動詞必須具有的格叫作必備格,可有可無的格叫作選用格。選用格可以提供更多的信息,沒有選用格,也不會破壞句子的完整性。格語法格的中心是動詞,動詞可以通過格關(guān)系的基本式和擴(kuò)展式來描述。基本式是必備格組成的框架及其所變換的句式。擴(kuò)展式則是選用格及其格位的描述。例如,動詞“打”的描述為:用手或者器具撞擊物體,其意義格框架為:格框架=施事(任務(wù))+受事(物體)他的必備格有兩個:施事格和受事格。則其基本式、擴(kuò)展式如下所示:詞義角色標(biāo)注02格語法基于統(tǒng)計機(jī)器學(xué)習(xí)技術(shù)的語義角色標(biāo)注基于統(tǒng)計機(jī)器學(xué)習(xí)技術(shù)的語義角色標(biāo)注基于統(tǒng)計機(jī)器學(xué)習(xí)技術(shù)的語義角色標(biāo)注通常情況下可以劃分為剪枝、識別、分類和后處理4個步驟。其中:剪枝:剔除大部分的不可能作為語義角色的標(biāo)注單元,經(jīng)過剪枝之后,可以在很大程度上減少待識別實例的數(shù)目,提高系統(tǒng)的運行效率。識別:對標(biāo)注單元進(jìn)行判斷,如果實例為語義角色則保留該標(biāo)注單元,可以減少進(jìn)入分類判別的實例數(shù)目,加快處理的速度。分類:進(jìn)一步區(qū)分單元是屬于哪一類語義角色。后處理:根據(jù)語義角色之間的一些固有的約束進(jìn)行后處理。固有約束一般是指一個謂語動詞不能有重復(fù)的核心語義角色,而且語義角色也不能存在相互重疊或嵌套等情況。基于統(tǒng)計機(jī)器學(xué)習(xí)技術(shù)的語義角色標(biāo)注在語義角色標(biāo)注的4個步驟中,識別和分類兩個步驟尤為重要。通常可以把角色標(biāo)注看成分類問題。基于規(guī)則的方法來解決分類問題,需要構(gòu)建規(guī)模比較龐大的知識庫,隨著知識庫的擴(kuò)大隨之產(chǎn)生了各種矛盾和沖突的規(guī)則。機(jī)器學(xué)習(xí)的方法適用性較好。比如,Pradhan等人使用支持向量機(jī)進(jìn)行語義角色標(biāo)注、Carreras等人使用感知器方法進(jìn)行語義標(biāo)注,并且比支持向量機(jī)更快。另外AdaBoost算法、最大熵模型、決策樹模型以及隨機(jī)森林算法都先后用于語義角色標(biāo)注。基于統(tǒng)計機(jī)器學(xué)習(xí)技術(shù)的語義角色標(biāo)注影響語義角色標(biāo)注系統(tǒng)性的主要因素是使用的特征,而不是機(jī)器學(xué)習(xí)的模型。所以,想要獲得更好的性能,則需要更加精細(xì)的劃分特征。目前,由Gildea等人使用的語言學(xué)特征被當(dāng)作各個語義角色標(biāo)注系統(tǒng)的基本特征使用,如下3點:1句法成分相關(guān)特征2謂詞相關(guān)特征3謂語動詞-句法成分關(guān)系特征基于統(tǒng)計機(jī)器學(xué)習(xí)技術(shù)的語義角色標(biāo)注1.句法成分相關(guān)特征010203短語類型句法成分核心詞句法成分核心詞的詞性基于統(tǒng)計機(jī)器學(xué)習(xí)技術(shù)的語義角色標(biāo)注2.謂詞相關(guān)特征01020304謂語動詞原型語態(tài)子類框架謂語動詞的詞性基于統(tǒng)計機(jī)器學(xué)習(xí)技術(shù)的語義角色標(biāo)注

3.謂語動詞-句法成分關(guān)系特征(1)句法樹中,從句法成分到謂語動詞之間的句法路徑。(2)句法成分和謂語動詞之間的位置關(guān)系。在Gildea等人的語言學(xué)特征基礎(chǔ)之上,人們又

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論