




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
國(guó)內(nèi)中文樹(shù)庫(kù)需加強(qiáng)
謂詞-論元結(jié)構(gòu)描寫(xiě)黃昌寧清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系cnhuang0908@126.com提綱(第一部分)賓州樹(shù)庫(kù)簡(jiǎn)介X-標(biāo)杠模式謂詞-論元結(jié)構(gòu)的標(biāo)注實(shí)例國(guó)內(nèi)外中文樹(shù)庫(kù)的對(duì)比討論賓州英文樹(shù)庫(kù)(PTB)1989-1992:賓州英文樹(shù)庫(kù)(PTB-I)
支配及約束(GB)理論,X-標(biāo)杠理論
華爾街日?qǐng)?bào)真實(shí)語(yǔ)料:100萬(wàn)詞次1993-1994:賓州英文樹(shù)庫(kù)(PTB-II)(Marcusetal.1994)
增加謂詞-論元結(jié)構(gòu)的標(biāo)注
空語(yǔ)類(lèi)(emptycategory)和同指索引(co-indexing)賓州中文樹(shù)庫(kù)(CTB)1998-2000:賓州中文樹(shù)庫(kù)(CTB-I)
重要目標(biāo):謂詞-論元結(jié)構(gòu)的描寫(xiě)
新華通訊社新聞稿:規(guī)模10萬(wàn)詞次2007:賓州中文樹(shù)庫(kù)(CTB6.0)
增加人民日?qǐng)?bào)、香港新聞電訊和臺(tái)灣期刊等語(yǔ)料,規(guī)模增加到73萬(wàn)詞次
X-標(biāo)杠模式
說(shuō)明語(yǔ)(又稱(chēng)標(biāo)定語(yǔ))、附加語(yǔ)和補(bǔ)足語(yǔ)只是出現(xiàn)在短語(yǔ)某一特定位置上的短語(yǔ)名稱(chēng)。在句法中,通過(guò)詞項(xiàng)投射和填位過(guò)程生成出來(lái)的二階短語(yǔ)必須符合如下X-標(biāo)杠模式:(1)中心語(yǔ)-補(bǔ)足語(yǔ)關(guān)系(complementation)
CTB規(guī)范定義的三種語(yǔ)法關(guān)系(2)中心語(yǔ)-附加語(yǔ)關(guān)系(adjunction)CTB規(guī)范定義的三種語(yǔ)法關(guān)系(3)并列關(guān)系(coordination)依據(jù)X-標(biāo)杠模式,CTB使每個(gè)短語(yǔ)節(jié)點(diǎn)所統(tǒng)轄的括號(hào)對(duì)或子樹(shù)只表示一種抽象的語(yǔ)法關(guān)系。CTB嚴(yán)格區(qū)分述語(yǔ)動(dòng)詞的補(bǔ)足語(yǔ)和附加語(yǔ),使謂詞-論元結(jié)構(gòu)的識(shí)別建立在可靠的句法基礎(chǔ)上。CTB例1:表的表示例1:浦東積極、及時(shí)地制定和推出法規(guī)性文件。
(IP(NP-PN-SBJ(NR浦東)) (VP(DVP(ADVP(AD積極)【ADVP:DEV的補(bǔ)足語(yǔ)】 (PU、)(AD及時(shí)))
(DEV地))【DEV:DVP的中心語(yǔ)】(VP(VP
(VV制定)
【RNR:右節(jié)點(diǎn)爬升】 (NP-OBJ(-NONE-*RNR*-1))) (CC和) (VP(VV推出)
【VV:VP的中心語(yǔ)】
(NP-OBJ-1(NN法規(guī)性)(NN文件))))))
【NP-OBJ-1:VV的補(bǔ)足語(yǔ)】CTB例1:樹(shù)的表示例1:浦東積極、及時(shí)地制定和推出法規(guī)性文件。CTB例1:語(yǔ)義角色標(biāo)注
CTB例2:賓語(yǔ)控制動(dòng)詞“批準(zhǔn)”例2:國(guó)務(wù)院批準(zhǔn)這些城市成立邊境經(jīng)濟(jì)合作區(qū)。CTB例2:語(yǔ)義角色標(biāo)注例2:國(guó)務(wù)院批準(zhǔn)這些城市成立邊境經(jīng)濟(jì)合作區(qū)。
CTB例3:話題句例3:各種收費(fèi)已在一個(gè)月前宣布。CTB例3:語(yǔ)義角色標(biāo)注概率型上下文無(wú)關(guān)語(yǔ)法(PCFG)PCFG是一種表層的樹(shù)庫(kù)語(yǔ)法(TreebankGrammar)它以刪除空語(yǔ)類(lèi)和功能標(biāo)記的樹(shù)庫(kù)作為訓(xùn)練樣本(IP(NP-TPC-2(DP(DT各) (CLP(M種))) (NP(NN收費(fèi)))) (NP-SBJ(-NONE-*pro*)) (VP(ADVP(AD已)) (PP-TMP(P在)(LCP(NP(QP(CD一)(CLP(M
個(gè)))) (NP(NN月))) (LC前))) (VP(VV宣布)(NP-OBJ(-NONE-*T*-2)))))(IP(NP-TPC-2(DP(DT各) (CLP(M種))) (NP(NN收費(fèi))))
(NP-SBJ(-NONE-*pro*)) (VP(ADVP(AD已)) (PP-TMP(P在)(LCP(NP(QP(CD一)(CLP(M
個(gè)))) (NP(NN月))) (LC前))) (VP(VV宣布)
(NP-OBJ(-NONE-*T*-2)))))刪除空語(yǔ)類(lèi)和功能標(biāo)記(IP(NP(DP(DT各) (CLP(M種))) (NP(NN收費(fèi))))
(VP(ADVP(AD已)) (PP(P在)(LCP(NP(QP(CD一)(CLP(M
個(gè)))) (NP(NN月))) (LC前))) (VP(VV宣布))))刪除后的樹(shù)庫(kù)樣本討論:黎錦熙定義的補(bǔ)足語(yǔ)(黎錦熙1924:27)補(bǔ)足語(yǔ)總共有五種,都是用來(lái)補(bǔ)足句中謂語(yǔ)(動(dòng)詞)所沒(méi)有完全表達(dá)出來(lái)的意思的,所以叫補(bǔ)足語(yǔ)。(簡(jiǎn)稱(chēng)足語(yǔ),和后附于動(dòng)詞或形容詞的‘副詞性附加語(yǔ)’即一般所謂補(bǔ)語(yǔ)的性質(zhì)不同,成分不同。) 黎氏句本位思想:要在句子的整體視野下考察句子的語(yǔ)法結(jié)構(gòu),否則句子意思是不完整的。從本質(zhì)上講,詞組本位用上下文無(wú)關(guān)的眼光看待短語(yǔ)和句子的結(jié)構(gòu),因此它不描寫(xiě)跨短語(yǔ)或跨小句的謂詞-論元關(guān)系。
討論:黎著中的補(bǔ)足語(yǔ)例句黎氏把賓語(yǔ)和補(bǔ)足語(yǔ)都定義為動(dòng)詞的連帶成分。如同動(dòng)詞(系詞和動(dòng)詞“有”)后的名詞性成分:○工人是勞動(dòng)者。 ○空氣也有重量。后來(lái)被稱(chēng)為遞系句和兼語(yǔ)句的句型,黎氏當(dāng)時(shí)稱(chēng)之為特定外動(dòng)詞及其連帶成分所形成的句型: ○工人請(qǐng)我報(bào)告。 ○工人推舉張同志作代表。 ○我愛(ài)他們誠(chéng)實(shí)。討論:用“補(bǔ)足語(yǔ)”取代“補(bǔ)語(yǔ)”
國(guó)內(nèi)語(yǔ)法學(xué)界把補(bǔ)語(yǔ)定義為動(dòng)詞后面的副詞性附加語(yǔ),而補(bǔ)語(yǔ)和補(bǔ)足語(yǔ)的英譯名都是complement。“前主后賓,前狀后補(bǔ)”是結(jié)構(gòu)主義留給我們的遺產(chǎn)嗎?呂叔湘在“現(xiàn)代漢語(yǔ)語(yǔ)法(提綱)”(未發(fā)表)中主張完全拋棄“補(bǔ)語(yǔ)”的國(guó)內(nèi)通行含義,重新將“補(bǔ)語(yǔ)”用于類(lèi)似于“補(bǔ)足語(yǔ)”的含義。(《呂叔湘全集》第十三卷:452-475)CTB在大規(guī)模樹(shù)庫(kù)中完全不用“補(bǔ)語(yǔ)”這個(gè)概念,其利弊得失可供我們自由評(píng)說(shuō)。北京大學(xué)中文樹(shù)庫(kù)(詹衛(wèi)東2008)例4:贊揚(yáng)僑胞臺(tái)胞為支援祖國(guó)的社會(huì)主義建設(shè)做出了重要貢獻(xiàn)。(小句兵)北京大學(xué)中文樹(shù)庫(kù)(PKU)詹坦言,北京大學(xué)和清華大學(xué)提出的句法標(biāo)住體系,“主要是以結(jié)構(gòu)主義語(yǔ)法理論為背景”,由于PKU的加工規(guī)范“不假設(shè)深層結(jié)構(gòu),因而也沒(méi)有深層結(jié)構(gòu)成分的標(biāo)記”;并且“從資料的易維護(hù)性和易擴(kuò)展性考慮”,“主張分層分級(jí)標(biāo)注”短語(yǔ)的內(nèi)部結(jié)構(gòu)類(lèi)型、語(yǔ)義角色等信息,“而不實(shí)行賓州樹(shù)庫(kù)那樣將這些信息都以樹(shù)節(jié)點(diǎn)標(biāo)簽的形式來(lái)反映”。(詹衛(wèi)東2008)生成語(yǔ)法后期已放棄深層結(jié)構(gòu)的假設(shè),而且改變了前期把句法和語(yǔ)義割裂開(kāi)來(lái)的錯(cuò)誤做法,這一時(shí)期的重要進(jìn)步是:用空語(yǔ)類(lèi)和同指索引描寫(xiě)句子中的遠(yuǎn)距離依存關(guān)系。國(guó)內(nèi)樹(shù)庫(kù)建設(shè)出現(xiàn)某些疏漏的主要原因是:對(duì)當(dāng)代語(yǔ)言學(xué)理論存有不同認(rèn)識(shí)。例4的CTB格式(兼語(yǔ)句)例4:贊揚(yáng)僑胞臺(tái)胞為支援
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 系統(tǒng)架構(gòu)設(shè)計(jì)師實(shí)戰(zhàn)經(jīng)驗(yàn)分享試題及答案
- 網(wǎng)絡(luò)規(guī)劃中的成本控制策略試題及答案
- 系統(tǒng)架構(gòu)設(shè)計(jì)師考試新手指南試題及答案
- 系統(tǒng)架構(gòu)設(shè)計(jì)師知識(shí)考點(diǎn)梳理試題及答案
- 自我提升西醫(yī)臨床考試試題及答案
- 績(jī)效管理體系構(gòu)建試題及答案
- 科研方法論在臨床的運(yùn)用試題及答案
- 裝修工人面試題及答案
- 激光技術(shù)考試動(dòng)向分析試題及答案
- 營(yíng)養(yǎng)試題選擇題及答案
- 2025科技輔導(dǎo)員培訓(xùn)
- 勞務(wù)聯(lián)合施工協(xié)議書(shū)
- 2025年國(guó)家糧食和物資儲(chǔ)備局垂直管理系事業(yè)單位招聘筆試參考題庫(kù)附帶答案詳解
- 《住院患者身體約束的護(hù)理》團(tuán)體標(biāo)準(zhǔn)解讀課件
- 2023-2024學(xué)年天津市部分區(qū)八年級(jí)(下)期中數(shù)學(xué)試卷(含解析)
- 醫(yī)院侵害未成年人案件強(qiáng)制報(bào)告制度培訓(xùn)課件
- 自卸車(chē)整車(chē)裝配檢驗(yàn)規(guī)范-ok
- 科技企業(yè)孵化器運(yùn)營(yíng)方案
- 火力發(fā)電廠電氣主接線課程設(shè)計(jì)
- 三角廣告牌拆卸方案
- 大皂角(中藥飲片炮制規(guī)范文檔 性狀 鑒別 用法用量功能與主治 )
評(píng)論
0/150
提交評(píng)論