




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、吳語五地詞匯相關度的計量研究 零概念的界定(一)詞段:從話語語流中抽取出來的語言單位,是詞的音段表現形式,包括一個聲母和一個韻母,不包括超音段的聲調。雖然在同一語音系統中不能辨義,但在不同語音系統的比較中,在詞目確定的前提下,語義已經確定。(二)詞的相關度:詞的相關指同一個詞目在不同地區說法異同的程度:所有的詞段都相同則說這個詞在這些地區的說法相同,相關度為1;完全不同的,相關度為0;部分詞段相同或某些詞段在語音上有相關的對應,則說這個詞在這些地區有相關性,相關度可以通過一定的計算方法求出。(三)詞的讀法:指一條詞目在某地的語音表現形式,包括所有語
2、素的語音表現形式。記錄時,用國際音標表示,不用漢字表示。一詞匯相關度計量研究述評對方言間和不同語言間詞匯接近率的計量研究,曾有過下述六種方法:1.1語言年代學(glottochronology)日本學者王育德1960年發表用語言年代學方法研究漢語五大方言接近率及其分化年代的成果。該研究主要對比詞的文字表現形式的異同,不涉及語音的對比。王育德所使用的統計工作包括兩部分。第一部分是比較二百個基本詞匯在各方言中的異同數,所用的方法是算術統計法。第二部分根據M.Swadesh提出的計算公式,計算五大方言分化的年代。1.2相關系數統計法這種方法由鄭錦全于1973年最早提出。他用“皮爾遜相關”和“非加權平
3、均系聯法”計算不同方言的字音和詞匯文字表現形式的親疏程度,同時提供方言分區的方案。參加比較的詞目共905條。在相關系數統計結果的基礎上,再做聚類分析。鄭錦全的相關系數統計法利用計算機處理龐大的方言資料,用樹形圖對18種方言間的親疏程度作出直觀而細密的描寫。顯然,相關系數統計法比算術統計法要精密、合理得多。不過它有兩個主要缺點:一是沒有考慮詞頻這個重要因素;二是比較詞匯異同,只考慮詞形異同,并不顧及詞內部詞根或中心語素的異同。如“太陽”和“日頭”詞形不同,兩者的相同率為0;“太陽”和“太陽佛”詞形不同,兩者的相同率也為0。實際上“太陽佛”的中心語素跟“太陽”完全相同,將兩者的相同率當作0來處理是
4、不合理的。1.1中所述的算術統計法也有這兩個缺點。王士元和沈鐘偉于1992年撰文批評鄭錦全的方法在語言學上和計算上的不合理性,提出在漢語方言分類上,計算的基本單位應該是語素,而不是詞。他們進一步完善了相關系數統計法和聚類分析法,并且對吳語內部三十三個點的方言詞匯的親疏關系進行了計量研究。1.3算術統計法這種方法將不同方言的詞匯的同或異,用加減法進行統計,然后以百分比計算接近率。詹伯慧和張日升曾根據他們所編珠江三角洲方言詞匯對照(1988)的材料,比較北京話和粵語詞匯的接近率。參加比較的詞匯有1001個,兩者相同的只有140多個,僅占10.4%。王育德和詹伯慧等人使用的方法都是算術統計法,但是所
5、得結果相差甚遠。原因顯然是兩者參加比較的詞匯的數量不同,王育德所用是兩百個基本詞匯(結果70.77%),詹伯慧等人所用的詞匯則有一千個至八千個。可見基本詞匯相同率較高,一般詞匯相同率較低。1.4概率法借詞和同源詞向來是比較難區分的。陳保亞在論語言接觸與語言聯盟(1996)中試圖用概率的方法解決這個問題。陳保亞認為,語音對應規律不能作為確定同源關系的充分條件,這是因為語音對應規律本身不能說明最早時間層次的關系詞是同源詞還是借詞。但語音對應規律的另一個重要作用是排除偶然相似。當兩種語言的一系列詞在語音上有對應時,很難用偶然巧合加以解釋。于是,他根據聲母、韻母和聲調的對應規則,用卡方分布和泊松分布,
6、計算出某詞在兩地屬于同源詞的概率。陳保亞采用M.Swadesh1952年從印歐語言中挑選出的人類語言中最穩定的200個詞和1955年從這200個核心詞中篩選出的100個更穩定的核心詞作為分析材料,并把100個最穩定的核心詞稱為第一階詞,把第二個100詞稱為第二階詞。通過概率計算,陳得出結論:侗臺語和南島語的關系詞第100詞高于第200詞,應當承認侗臺語和南島語有同源關系。這種計量法將詞匯和語音的因素結合在一起考慮,從音類的必然變化和音素的偶然變化入手,運用概率將這兩種變化區分開,將同源詞在語音上的變化歸為音類的必然變化;借詞則歸為偶然變化,有一定的創意。但是它把聲調當作和聲韻母同樣重要的因素考
7、慮卻值得探討。我們認為考慮“有共同語義的詞段”這個因素比較合理。1.5矩陣分解(matrix decomposition)這是Sanzheng Qiao和William Shi-Yuan Wang于1998年提出的方法。這種方法是用一對矩陣分解任何的無根雙叉樹。這個方法也可以用矩陣生成樹。作者以歐洲語言基本詞匯的接近率計算為例,闡述了這一研究方法。矩陣分解是應用計算機,在所有的合成可能中尋找一種最佳的樹行合成圖。這與早先的聚類分析不同。1.6加權平均法游汝杰、楊蓓在廣州話、上海話和普通話詞匯接近率的計量研究
8、(1999)一文提出了加權平均法。這種方法改進了上述統計方法,以廣州話、上海話和普通話為例,提出方言間詞匯接近率計量研究的新方法。這個新方法有三個特點:(1)用加權法統計不同方言詞匯的異同,以詞頻作為權數。(2)以中心語素為基準比較詞匯的異同,分級加權統計。(3)多人次測驗方言詞匯的口語可懂度。所用詞頻數據參考北京語言學院語言教學研究所編的現代漢語詞頻詞典(1986)。1.7小結綜上所述,可以歸納出以下幾點:(1)對于語言的計量來說,材料是至關重要的。一般來說,選用詞作為計量的材料比較多,而且也比較妥當。因為詞是語言最基本的載體,聯系著語音和語法,在整個語言系統中占有舉足輕重的地位。但是,選擇
9、什么樣的詞,選用多少數量的詞,這對計量的結果會產生很大影響。目前,用語言年代學的200個基本詞匯作研究的比較多,但問題的關鍵在于這二百個詞是否適合漢語?除了語義上的解釋,還有什么其它證據可以證明這些詞的穩定性?上述各家的研究表明,選擇的詞匯數量和相關度成反比,所以在研究相關度時,詞匯的數量必須適中。(2)如果研究的材料被確定為某些詞后,接下來的問題就是從哪個角度進行計量研究。就一個詞而言,詞段是相當重要的。一般來說,一個詞有文字表現形式和語音表現形式兩種。對印歐語來說,這兩種表現形式的差別并不大,因為它是拼音文字,文字直接聯系語音。但漢語就不同了,漢字和漢語詞的語音沒有直接的關系。一個詞在兩地
10、的文字表現形式相同或相似(這里的相似指的是一個詞中部分字相同),說明語素相同或相似。但這并不表明其在語音上必然相同或相似,兩地如果相差很遠,或其語言已經分化了很長時間,那么在語音上很可能已經截然不同,而這種不同在文字上是無法表現的。同樣,一個詞在兩地的文字表現形式不同,并不能說明語素不同,或許它們在語音上會有聯系。所以,在研究漢語詞匯的相關度時,需同時考慮語素和語音兩個要素。(3)很多人認為,對語言進行量化研究,會忽視許多文化的、歷史的因素。但是,語言本身就包涵了許多歷史的、文化的因素。只要材料確切、詳實,對語言進行量化,其實同時就是對許多文化的、歷史的甚至是現實的因素進行量化。如果我們對杭州
11、話的詞匯進行量化,可以發現其兒化音所占的比重很大,這實際就是一個歷史的因素:南宋末年的遷都臨安,造成今天的杭州話和北方話的相似。二語音相關系數2.1韻母相關系數的確定兩個韻母進行比較,完全相同的,相關系數為1;不同的則在通過計算求出它們的相關系數;聽感上沒有相識點的,其相關系數則為0。首先要確定單元音的相關系數。這里有一條基本原則,就是兩個元音必須在聽感上相似。換言之,只有在聽感上相似的兩個元音,我們才會給它們確定相關系數。附圖Lade foged型聲學元音圖(引自Catford,1981)利用元音舌高點的位置可以繪制元音舌位圖;利用共振峰頻率可以繪制聲學元音圖。這兩種圖
12、會有所差別,但基本相似。聲學元音圖有精確的數據,所以,我們選用聲學元音圖作為確定元音相關系數的基礎。我們選用Ladefoged型聲學元音圖。Ladefoged(1976)主張以F1作縱坐標,線性標度;F2-F1橫坐標,對數標度,如圖。Ladefoged的整個元音圖接近于平行四邊形,像Carmody的舌位圖一樣。但是展唇后元音的排列與傳統的元音圖有不一致的地方。但這不會影響我們的計算,因為除了,基本沒有后圓唇和展唇元音相似。根據此圖,我們可以算出幾個基本單元音的相關系數。具體計算方法如下:首先,將這幅圖中的橫坐標和縱坐標分別平均為10個等份,單位刻度為1;然后計算圖中任何兩個元音的距離。我們將距
13、離的倒數定為這兩個元音的相關系數。如I和i兩個元音,其距離為1.2083,所以它們的相關系數即為82.8%。在計算相關系數中,有一點要注意,這就是當兩個元音的距離在單位刻度以內,也就是說小于1時,我們認為它們的相關系數為1。以下是用此方法算出的幾個基本單元音的相關系數:附圖以這幾個單元音作為基本的相關系數,每增加一項要素,就在這些基本相關系數的基礎上做一次根式計算。這些要素包括:鼻化、復韻母、鼻音、喉塞。如:ie-iE,增加了一個復韻母的要素,也就是增加了一個"i"的介音,由于介音相同,所以這兩個韻母的相關系數就會更大一點。將31.6%開根號,得到的56.2%就是ie和iE
14、的相關系數。又如:增加了介音和喉塞兩個相同的因素,他們的相關系數就是14.1%開三次方根,得到52%。2.2聲母相關系數的確定兩個聲母進行比較,完全相同的,相關系數為1;不同的則通過計算求出它們的相關系數;聽感上沒有相似點的,其相關系數為0。附圖輔音腭位與舌位的調音部位對應示意我們以輔音腭位與舌位的調音部位對應示意圖為基礎,制作聲母的相關系數。圖(A)是口腔中正面仰視的腭位,按上齒的分布來分區的圖解。圖(B)是口腔中正面平視的腭位,這是根據牙科材料脫模而描出的上腭拱形圖。圖(C)是側面的X光照相所得的腭位。這種和工程畫差不多的三面圖,用虛線將各對應的區域連接,可以對舌位作比較準確的測量。并可根
15、據上齒部位來給上顎發音部位分區。如:兩對門齒部分為齒音,側門齒與第一前臼齒之間為齒齦區,第一前臼齒與第二臼齒之間為硬腭區,支持部分為軟腭音區等。在分區上,各家略有出入,但基本上是按上顎的部位來分的。此外,我們知道,舌位和上顎也有一定的對應關系,傳統方言學中的舌尖音和舌葉音對應齒齦音,硬腭音對應舌面音,舌根對應軟腭音。所以,根據此圖,我們將齒齦前定位在3的位置;硬腭和齒齦交界的地方(基本上是舌葉的位置)定位在3.75的位置;硬腭的前部(舌面前)定為4.5;硬腭的后部(舌面中)定為5.25;軟腭(舌根)定位在6的位置。計算兩個聲母的相關系數時,首先要有相似的聽感,然后在圖中找到這兩個聲母中輔音所在
16、的位置,位置靠前,數值小的做分子,數值大的做分母,分子、分母相除的結果即為這兩個聲母的相關系數。由于沒有復輔音,這里不需要進一步的計算。此外,需要補充一點,有兩個韻母的鼻韻尾需要在這里定義相關系數,因為它們是用輔音符號表示的,而且其差別在于舌尖前和舌根,以及舌根與舌面中,它們是:。三方法與步驟3.1語料的采用和收集本文計算了吳語五個代表點:上海、溫州、衢州、金華、臨海的784條詞匯的相關度。現代吳語區分為六片:太湖片、宣州片、甌江片、婺州片、麗衢片和臺州片(中國語言地圖集)。宣州片由于缺少語料,暫不涉及。784條詞目在吳語五地的語音表現形式是通過查尋方言詞典和田野調查得到的。上海話的資料選自上
17、海方言詞典(1997)。詞典上沒有的詞匯,采用作者(上海人)的發音。溫州話的資料選自溫州方言詞典(1998)。詞典上沒有的詞匯,由游汝杰(溫州人)做了增補。金華話的資料選自金華方言詞典(1996)。臨海和衢州兩地的詞匯資料是通過筆者實地調查獲得的。臨海的發音人:張一倫,63歲,退休教師;蔣林壽,60歲左右,退休教師。衢州的發音人:邵永平,24歲,研究生;金錠鈴,57歲,家庭主婦;孔祥枝,60歲左右,退休鞋匠。3.2五地詞匯相關度的計算首先,用加權法算出每條詞目任意兩地間的相關度,方法如下:(1)先將每詞在每地的讀法分解為詞段,兩地分解的結果有可能不同。附圖(2)將該條詞在一地分解的詞段和另一地
18、分解的詞段進行所有可能的排列組合。如:仍以上海話和衢州話“打雷”這個詞目為例。先給詞段編號:附圖(4)在每組組合中,相對應的詞段包括對應的聲母對和韻母對,將該詞段中聲母的相關系數和韻母的相關系數進行算術平均計算,所得結果即為該詞段的相關度。承接上述的例子:sh1-qz1的相關度為(1+0.523)2=0.762;sh2-qz2的相關度為(1+0.607)2=0.804。(5)計算兩地詞段的平均個數。以上海話和衢州話“打雷”這個詞目為例:上海話為ta和le兩個詞段;衢州話為三個詞段,平均詞段數為2.5。(6)在(4)的基礎上,將對應詞段的相關度相加,再除以平均詞段數,可得每組組合的相關度。承接(
19、4)的例子:(7)算出每詞所有組合關系的相關度,選出數值最大的那個作為該詞的相關度。仍以上海話和衢州話“打雷”這個詞目為例:附圖每種的相似度為:1:62.4%;2:30.5%;3:0;4:0;5:0;6:32.2%。所以,“打雷”這個詞目在上海話和衢州話中的相關度為62.4%。按上述方法計算出每詞兩地之間的相關度后,再用算術平均法求出五地的兩兩相關度。四詞匯變化的趨勢4.1相關度與詞頻的分布關系根據每條詞目任意兩地的相關度,我們可以做出每條詞目的相關度與詞頻的分布關系圖,其中所用詞頻數據見北京語言學院語言教學研究所編現代漢語詞頻詞典(1986)。x軸為相關度,y軸為頻次。圖上每一點表示一個詞,
20、可用(x,y)標出(見圖一)。附圖從圖中可以看出,高頻詞都集中在相關度為0.35-0.4這個范圍附近。以這個范圍為基點,詞頻隨著相關度的減少和增大而急速減少。為了進一步看清問題,我們作出以相關度0.05為單位的相關度和詞頻分布的方框圖(見圖二)。從這兩幅圖中可以看出,在共時平面中,常用詞相關的程度并不大。4.2相關度與詞數的分布關系根據每條詞目任意兩地的相關度,我們還可以作出相關度與基本詞匯詞數分布的方框圖。x軸仍以相關度為變量,y軸以詞數為變量。我們以相關度0.05為單位作圖(見圖三)。相關度與詞數分布圖非常有規律。我們可以看出,在相關度為0.3-0.4這個范圍附近,詞匯分布的密集度最高;在
21、0.3-0.4以外的區間,詞匯分布數逐漸減小,在相關度0,1閉區間的兩端,詞匯分布數最小;大部分詞分布在相關度為0.25-0.55這個區間。附圖4.3基本詞匯的變化趨向詞匯的變化受各種因素的影響,其中有語言交流產生的借貸;歷史文化甚至是政治的影響;移民、交通的影響等等。一條詞只要是用于交際,就會受到各種因素影響而發生變化。同一方言區不同地點的詞匯不盡相同就是詞匯受到各種因素的影響發生變化的結果。從上面兩類圖中,我們可以得到這樣的結論:(1)高頻相關、低頻無關性。基本詞匯是根據日常生活中的常見概念定義的,而常見的事物并不一定是常常掛在嘴邊說的。比如“月亮”,我們常常會看見,但這并不表示我們常常會
22、說。所以,我們可以把基本詞匯分為兩部分,常用的和非常用的。常用詞的詞頻高,集中在相關度為0.35,0.45這個區域。非常用詞的詞頻低,相關度比較分散,沒有很大的規律。(2)抗衡的過程。在實際生活中使用的每條詞都會產生變化。但每一條詞不會全部變化或者完全不變。一般情況下,只有一部分發生變化,有的是聲母發生變化、有的是韻母發生變化,有的是從其它方言中借用了完全不同的語素而發生變化;變化的方向可能趨同,也可能趨異。因為每個詞在使用過程中,都會受到兩種相反的力的作用:維持交際的趨同的力和交際過程中因使用個體的不同而使詞產生差異的趨異的力。在基本詞匯中,無論詞頻高低,大約有70%左右的詞的相關度在0.2
23、5,0.55之間,這說明大部分基本詞匯是朝著同一個方向變化的,而這種方向是一個詞內部因素趨同和趨異兩種趨向抗衡后的結果。(3)結果:趨向一個區域。相關度所顯示的只是共時平面上的一個結果,或者說,只是一種平均趨向。我們并不知道相關的部分是趨同的結果還是原來就相同。但大部分基本詞匯變化的結果并不是均勻或隨機分布的,而是趨向一個區域的。如果用相關度來標示這種結果的話,詞頻和詞匯個數的分布,在相關度上就會趨向某個共同的區間。也就是說,無論各地方言如何變化,大部分詞在變化后,雖然在同一方言區內不同方言點的語音表現形式會參差不齊,但每個詞總會有一部分相關的成分,如果將這部分相關的成分量化,就會發現它們趨向
24、一定的區間。如果在不同的共時平面上,這個區間在數值上基本相等的話,我們可以解釋為什么很多年后,同一方言區中不同點的方言仍能保持許多共性;如果在不同的共時平面上,這個區間在數值上不等的話,我們就能看出語言的變化速度。五接近率5.1任意兩地相關度的分析在第四節中,我們利用每條詞的相關度,從橫向的角度對每條詞的變化趨向作了分析。這里,我們從縱向角度對所有基本詞匯每兩地總的接近率作一分析。通過上述計算,我們得到一個上海、臨海、衢州、金華和溫州詞匯相關度的矩陣。吳語五地784詞接近率比較表 上海臨海衢州金華溫州上海0.59270.54460.41620.3531臨海0.48030.
25、39380.3318衢州0.39320.3208金華0.3011溫州 從這張矩陣圖中可以看出:(1)上海和其它地方的接近率最高,其次是臨海、衢州、金華,最低的是溫州;(2)矩陣從左到右,從上到下的排列順序十分整齊,都是由大到小排列的;(3)五地兩兩相關度的平均值為0.4132,和上海、金華的接近率最為相近。而矩陣的中心臨海與金華的接近率與平均接近率的相近程度則僅次于上海和金華的相關度。基于上述分析,我們可以得到以下結論:(1)因為上海是經濟中心,在各地方言中,上海話處于優勢方言的地位,各地方言不知不覺地會受到上海話的影響。所以表現在這個矩陣中,上海話和其他地方的接近率最高。(2)由上述結論可以推出:優勢方言的詞匯擴散比較容易。(3)以臨海、金華的接近率為矩陣的中心接近率,中心接近率左面和上面的接近率與中心接近率的比值要比右面和下面的大得多
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 充電樁建設助力綠色出行發展方案
- 加強內部培訓提升團隊能力計劃
- 現代保安行業的競爭策略與挑戰計劃
- 學期教研安排指導規劃計劃
- 理財師考試知識點提升技巧試題及答案
- 前臺工作的創新思維訓練計劃
- 2025年國際金融理財師考試戰略調整試題及答案
- 倡導職場正能量增強團隊活力計劃
- 2025年特許金融分析師外匯市場分析試題及答案
- 學術研究2025年特許金融分析師考試試題及答案
- 石膏灌注的方法課件
- 動物醫學畢業論文
- 2023年河南測繪職業學院單招職業適應性測試筆試模擬試題及答案解析
- 甘肅省甘南藏族自治州各縣區鄉鎮行政村村莊村名明細及行政區劃代碼
- (完整word版)高考英語作文練習紙(標準答題卡)
- 二年級科學下冊教案 -《3 可伸縮的橡皮筋》 冀人版
- 結核病防治知識培訓試題帶答案
- 心血管疾病醫療質量控制指標(2020年版)
- 培訓(微機保護基礎)課件
- 《生物冶金》課程教學大綱
- DB22-T 5118-2022 建筑工程資料管理標準
評論
0/150
提交評論