潘悟云(澎湃新聞 蔣立冬 繪)
4月25日,復(fù)旦大學(xué)金力院士團(tuán)隊(duì)在《自然》雜志發(fā)表了以《語(yǔ)言譜系證據(jù)支持漢藏語(yǔ)系在新石器時(shí)代晚期起源于中國(guó)北方》為題的論文,揭示了世界第二大語(yǔ)系漢藏語(yǔ)系分化成現(xiàn)代語(yǔ)言的最早年代和地點(diǎn),這是中國(guó)語(yǔ)言學(xué)的研究成果首次在《自然》發(fā)表,引發(fā)了廣泛的關(guān)注和討論。對(duì)此,《上海書(shū)評(píng)》采訪了論文團(tuán)隊(duì)重要成員、復(fù)旦大學(xué)人文社會(huì)科學(xué)數(shù)據(jù)研究所東亞語(yǔ)言數(shù)據(jù)中心負(fù)責(zé)人潘悟云教授,請(qǐng)他介紹這一研究的相關(guān)情況。
《自然》官方網(wǎng)站頁(yè)面
《語(yǔ)言譜系證據(jù)支持漢藏語(yǔ)系在新石器時(shí)代晚期起源于中國(guó)北方》一文在《自然》發(fā)表之后,引起很多人好奇:為什么語(yǔ)言學(xué)這種“文科”的研究成果,能夠在頂級(jí)的理工科學(xué)術(shù)雜志發(fā)表?
潘悟云:我們這篇論文看上去是語(yǔ)言學(xué)研究,其實(shí)是人類學(xué)研究,關(guān)注人類早期語(yǔ)言的形成,特別是東亞語(yǔ)言當(dāng)中漢藏語(yǔ)尤其是漢語(yǔ)的形成。
我們都知道,人類學(xué)分為好多種,既有你說(shuō)到的“文科”——文化人類學(xué),也有體質(zhì)人類學(xué)、分子人類學(xué)。我所在的復(fù)旦研究團(tuán)隊(duì)主要做的是分子人類學(xué),關(guān)注的是基因的構(gòu)成,這次研究成果發(fā)表之后,可能會(huì)進(jìn)一步關(guān)注體質(zhì)人類學(xué),就是人的外貌、身高、膚色、發(fā)色,等等,這些實(shí)際上都屬于自然科學(xué)的范疇。
至于語(yǔ)言屬于什么學(xué)科范疇,其實(shí)很難說(shuō)——它是跨類的,一頭伸進(jìn)自然科學(xué),如語(yǔ)音合成、語(yǔ)音識(shí)別,都是計(jì)算機(jī)學(xué)科在做;一頭伸進(jìn)人文社科,涉及人的社會(huì)特性。正因如此,語(yǔ)言學(xué)就有很特殊的意義,它是溝通文科理科的橋梁。另外,它也的確是一個(gè)很值得研究的對(duì)象。人類一產(chǎn)生,就同語(yǔ)言掛鉤。我一直說(shuō),人類同動(dòng)物的區(qū)別,就在于語(yǔ)言。以前都說(shuō)區(qū)別在于人類會(huì)制造工具,現(xiàn)在發(fā)現(xiàn)很多動(dòng)物不僅會(huì)利用工具,也會(huì)制造工具。而人類的語(yǔ)言和動(dòng)物有本質(zhì)不同。動(dòng)物也有傳遞信息的工具,比如猿猴發(fā)出各種聲響、蜜蜂跳出各種舞蹈,它們用各種方式傳遞信息。人類語(yǔ)言具有模式二重性。動(dòng)物用一種聲音來(lái)代表一種事物、一種現(xiàn)象,聲音和事物、現(xiàn)象是一對(duì)一的關(guān)系。人類語(yǔ)言則有雙層結(jié)構(gòu),語(yǔ)音先構(gòu)成具有某種意義的語(yǔ)素,語(yǔ)素再與具體的事物、現(xiàn)象關(guān)聯(lián)。這樣,通過(guò)這種意義組合,可以表達(dá)大千世界的諸多概念。
我曾經(jīng)猜想,人類產(chǎn)生之初,有各種的人,考古發(fā)掘已經(jīng)發(fā)現(xiàn)了很多古人類,這些古人類與現(xiàn)代智人相比有許多優(yōu)勢(shì),例如尼安德特人的力氣比智人要大,但是前者在與后者的競(jìng)爭(zhēng)之中逐漸消亡,最重要的原因就是語(yǔ)言。智人通過(guò)語(yǔ)言,能夠有效地交流、溝通,將發(fā)明創(chuàng)造保存和傳遞下去。有了語(yǔ)言,才有文字,才有文獻(xiàn),進(jìn)而才有文化和文明——所謂文化,本質(zhì)就是一代代能傳下去的、大家形成的知識(shí)。所以,很多學(xué)者關(guān)心語(yǔ)言的起源問(wèn)題。關(guān)心語(yǔ)言起源,就意味著關(guān)注人類的起源、文明的起源。這些問(wèn)題,不管什么學(xué)科,都會(huì)共同關(guān)注。
既然如此,想請(qǐng)您簡(jiǎn)單介紹一下,學(xué)者是如何針對(duì)語(yǔ)言起源問(wèn)題展開(kāi)研究的。
潘悟云:關(guān)于這個(gè)問(wèn)題,最開(kāi)始大家都是猜測(cè),提出各種假說(shuō)。有人說(shuō)是游戲產(chǎn)生的,有人說(shuō)是勞動(dòng)產(chǎn)生的。以至于巴黎的語(yǔ)言學(xué)會(huì)一度禁止這方面的討論,因?yàn)檫^(guò)于主觀,與近代科學(xué)思潮不相符。好在隨著科學(xué)的發(fā)展,產(chǎn)生了現(xiàn)代語(yǔ)言學(xué),也就有了許多科學(xué)方法來(lái)推測(cè)語(yǔ)言從何時(shí)起源、最初的形式如何。這里面尤其值得一提的,是十九世紀(jì)的歷史比較法。這種研究方法的基本思路,是對(duì)眾多現(xiàn)代語(yǔ)言的共同特征加以比較。學(xué)者猜測(cè),現(xiàn)代語(yǔ)言的共同特征不是偶然產(chǎn)生的,而是來(lái)源于早期的共同語(yǔ)。這方面的代表性學(xué)者是威廉·瓊斯(William Jones),他在東印度公司工作時(shí),看到梵文與拉丁文、古希臘文有相似之處,猜測(cè)它們一定有共同祖先。后來(lái),有許多語(yǔ)言學(xué)家通過(guò)大量比較,參之于古代文獻(xiàn),將古代的共同語(yǔ)構(gòu)擬出來(lái)。這是很科學(xué)的做法。迄今為止,我們進(jìn)行語(yǔ)言歷史研究的時(shí)候,歷史比較法還是最重要的一種方法。
但是,歷史比較法也有局限性,它只能解決語(yǔ)言的譜系問(wèn)題。它根據(jù)不同的現(xiàn)代語(yǔ)言的同源詞多少,來(lái)推斷這些語(yǔ)言之間的親疏遠(yuǎn)近關(guān)系,然后畫(huà)出譜系樹(shù)。這里面的道理很簡(jiǎn)單:如果一群親屬語(yǔ)最早來(lái)自同一種語(yǔ)言,后來(lái)才分化,那么這些語(yǔ)言最初的詞匯肯定是相同的。分化以后,由于語(yǔ)言是不斷變化的,過(guò)去相同的詞匯不斷地流失。分化早的,流失的就多,分化晚的,流失的就少。所以,憑語(yǔ)言中同源詞的多少,大體上可以斷定語(yǔ)言分化的早晚。
但是這種方法解決不了分化的年代問(wèn)題。例如,印歐語(yǔ)分化成十個(gè)語(yǔ)族,是什么時(shí)候開(kāi)始的,斯拉夫語(yǔ)族分化為俄語(yǔ)、波蘭語(yǔ)、捷克語(yǔ),是什么時(shí)候開(kāi)始的?分化的地點(diǎn)問(wèn)題也很難解決。例如,印歐語(yǔ)誕生地的確定,靠的還是這些語(yǔ)言所共有的生物,其中最重要的是山毛櫸與鮭魚(yú),語(yǔ)言學(xué)家根據(jù)這些動(dòng)植物的分布,把印歐語(yǔ)的起源地鎖定在維斯杜拉河與易北河之間的地域。地點(diǎn)確定以后,根據(jù)考古學(xué)的證據(jù),這些地區(qū)在公元前3000年以前才出現(xiàn)印歐語(yǔ)中普遍出現(xiàn)的馬與羊。于是語(yǔ)言學(xué)家認(rèn)為,印歐語(yǔ)在公元前4000年晚期開(kāi)始在德國(guó)波羅的海沿岸使用。但是,這些方法都不是語(yǔ)言學(xué)本身的。
那么,這個(gè)問(wèn)題是如何得到解決的呢?
潘悟云:一直到二十世紀(jì),美國(guó)的斯瓦迪士(Morris Swadesh)提出一個(gè)新的方法——語(yǔ)言年代學(xué),語(yǔ)言的發(fā)生年代才能夠得到確定。要理解這個(gè)方法,可以參照地質(zhì)學(xué)用放射性物質(zhì)碳14對(duì)年代的測(cè)定?;钌矬w內(nèi)的碳14的含量是固定的,死了之后,體內(nèi)碳14衰減的速度是恒定的。打個(gè)比方來(lái)說(shuō),如果考古隊(duì)從地下挖出一頭鹿,根據(jù)碳14的現(xiàn)存含量與衰減速率,就能算出這頭鹿的死亡時(shí)間。那么,語(yǔ)言學(xué)變化的速度,是不是也像碳14那樣,是恒定的呢?如果是的話,那么,根據(jù)兩種語(yǔ)言中現(xiàn)存同源詞的多少,就可以知道它們分化的時(shí)間。
斯瓦迪士給語(yǔ)言學(xué)找到的碳14,就是“核心詞”,或者“核心語(yǔ)義”。人類認(rèn)知的共同性,決定了有些詞大家都會(huì)常說(shuō)。比如太陽(yáng)、月亮、身體部位名稱,還有人稱代詞、數(shù)詞,這些都是核心語(yǔ)義,而且變化比較慢,原因在于人的交際需要。比如,小孩今天晚上叫“媽媽”,明天上午叫“嬤嬤”,媽媽就聽(tīng)不懂了,最核心的語(yǔ)義一定是變得比較慢的。斯瓦迪士經(jīng)過(guò)統(tǒng)計(jì),認(rèn)為核心語(yǔ)義的變化速率也是恒定的,于是提出一個(gè)語(yǔ)言年代學(xué)的公式,利用這個(gè)公式,通過(guò)計(jì)算兩種親屬語(yǔ)言中現(xiàn)存的同源詞多少,來(lái)計(jì)算分化的年代。
但是,這種方法遭到了很多質(zhì)疑。第一個(gè)原因是,語(yǔ)言的變化速度肯定是不一樣的。戰(zhàn)爭(zhēng)頻繁的地方,語(yǔ)言變化的速度就快,一打仗人死光了,其他地方的人遷移過(guò)來(lái),語(yǔ)言就發(fā)生變化了。中國(guó)歷史上大的動(dòng)亂,例如唐朝的安史之亂、黃巢起義,北宋的靖康之難,都導(dǎo)致了北方移民大量南下,一旦與當(dāng)?shù)厝私佑|,就會(huì)引起語(yǔ)言的借用。第二個(gè)原因是,詞匯的變化速度也不一樣,核心詞變得慢一點(diǎn),文化詞就變得很快。甚至有些印歐歷史比較語(yǔ)言學(xué)認(rèn)為很穩(wěn)定的詞,實(shí)際上并不穩(wěn)定,比如說(shuō)人稱代詞。漢語(yǔ)里的第三人稱先秦還沒(méi)有,出現(xiàn)時(shí)已經(jīng)很晚了。上海人喜歡說(shuō)的“儂”最早是第一人稱,古吳語(yǔ)以“儂”或“阿儂”表示“我”,現(xiàn)代上海話“儂”則變成了第二人稱“你”。所以印歐語(yǔ)中一些最穩(wěn)定的語(yǔ)義,在漢語(yǔ)中就不一定如此。
盡管如此,我們還是采用了斯瓦迪士的理論。不少中國(guó)學(xué)者,如孫宏開(kāi)、黃布凡、鄭張尚芳等,都認(rèn)識(shí)到斯瓦迪士的理論對(duì)東方語(yǔ)言不完全適用,進(jìn)而提出了東亞語(yǔ)言的核心詞。但是我們認(rèn)為,絕大部分核心詞全世界都是一樣的,如太陽(yáng)、月亮,大家都常用,例外只是少數(shù)。中國(guó)學(xué)者提出的核心詞同斯瓦迪士相比,絕大部分也還是一樣的。
具體計(jì)算年代的方法,我們采用的是貝葉斯統(tǒng)計(jì)方法。我在網(wǎng)上看到了不少評(píng)論,很有意思。比如有一位學(xué)者,他看到我們用了貝葉斯統(tǒng)計(jì)方法,大約在網(wǎng)上檢索了一番,發(fā)現(xiàn)貝葉斯學(xué)派是“主觀概率學(xué)派”,就認(rèn)定我們是在“主觀”臆測(cè)。實(shí)際上,主觀概率學(xué)派相對(duì)于頻率學(xué)派而言,是對(duì)概率論的一大發(fā)展,在無(wú)法通過(guò)重復(fù)試驗(yàn)得出概率的情況下,根據(jù)有限的觀察提出一個(gè)主觀假設(shè),通過(guò)大量的材料不斷作出修正,逐漸逼近事實(shí)。這更接近經(jīng)驗(yàn)科學(xué)的普遍做法。就算相對(duì)論也是一種假設(shè),還在不斷接受經(jīng)驗(yàn)世界的檢驗(yàn)。這個(gè)方法首先用在物種分化,后來(lái)語(yǔ)言學(xué)也采用了,并且產(chǎn)生較大的影響。
有了這種語(yǔ)言譜系樹(shù),還可以用譜系地理學(xué)(phylogeography)的方法推斷分化的地理位置。譜系樹(shù)上最接近的語(yǔ)言,通常地理距離也比較接近。例如,上海與蘇州地理上比較接近,語(yǔ)言也比較接近。上海與廣州,距離比較遠(yuǎn),語(yǔ)言的關(guān)系也比較遠(yuǎn)。當(dāng)然,也會(huì)有不同的情況,武漢與昆明的距離比較遠(yuǎn),語(yǔ)言卻比較接近。但是大多數(shù)的情況下,語(yǔ)言的距離與地理的距離是相關(guān)的。同時(shí),這種方法還假定,原始人從一個(gè)地方開(kāi)始向四處分化的時(shí)候,他們的遷移是隨機(jī)性的。根據(jù)這些假設(shè),我們算出原始漢藏語(yǔ)的發(fā)源地在四川一帶。但是,漢藏人向四處遷移并不是很隨機(jī)的,更多的是從北向南遷移。所以,漢藏人的發(fā)源地一定在四川以北,即陜甘寧一帶,就是仰韶與馬家窯文化的分布區(qū)域。
漢藏語(yǔ)系語(yǔ)言的分化與中國(guó)西北、西南地區(qū)的人口擴(kuò)張相關(guān)
關(guān)于研究團(tuán)隊(duì)的構(gòu)成、不同成員的分工,能麻煩您介紹一下嗎?
金力團(tuán)隊(duì)合照,左起:嚴(yán)實(shí)博士、金力院士、潘悟云教授、張夢(mèng)翰博士
潘悟云:金力教授統(tǒng)領(lǐng)整個(gè)研究團(tuán)隊(duì)。他一直關(guān)注人群的遺傳結(jié)構(gòu)、人群的遷徙和自然選擇這些問(wèn)題。斯坦福大學(xué)的卡瓦利·斯福扎(Cavalli-Sforza)是以分子人類學(xué)解構(gòu)語(yǔ)言、從基因角度研究人類演化的鼻祖,金力教授做博士后研究就在斯福扎的實(shí)驗(yàn)室。上世紀(jì)九十年代,金力教授采集了十萬(wàn)例東亞人基因,研究之后得出結(jié)論:整個(gè)東亞地區(qū)的各個(gè)人種都是從非洲遷移過(guò)來(lái)的,一下子推翻了中國(guó)人由“北京猿人”演化而來(lái)的假說(shuō)。
1996年,金力教授回國(guó)之后,在《文匯報(bào)》發(fā)表了一篇關(guān)于東亞人來(lái)自非洲的文章,我讀到之后,很振奮,因?yàn)樗龅难芯颗c我的研究是互相印證的。亞洲大陸的幾個(gè)語(yǔ)系,阿爾泰語(yǔ)系、漢藏語(yǔ)系、南亞語(yǔ)系和南島語(yǔ)系,傳統(tǒng)觀點(diǎn)認(rèn)為,說(shuō)這些語(yǔ)言的人種沒(méi)有什么發(fā)生學(xué)上的聯(lián)系,因而這些語(yǔ)系當(dāng)然是毫無(wú)關(guān)聯(lián)的。比如,過(guò)去大家都認(rèn)為,爪哇猿人和北京猿人是兩個(gè)人種,那么南島人和中國(guó)人作為他們的后裔,也應(yīng)該說(shuō)兩種不同的語(yǔ)言。但是后來(lái)我們發(fā)現(xiàn),南島語(yǔ)系和漢語(yǔ)的一些核心詞很接近,這一點(diǎn)是法國(guó)語(yǔ)言學(xué)家沙加爾(Laurent Sagart)最早提出來(lái)的。舉兩個(gè)例子,女性生殖器涉及人類的繁衍,是很重要的詞,國(guó)內(nèi)說(shuō)的最多的發(fā)音就是pi,現(xiàn)在的南島語(yǔ)也說(shuō)pi;女性的乳房涉及哺育后代,也是很重要的詞,上古漢語(yǔ)的發(fā)音是njo,南島語(yǔ)是nu。
漢語(yǔ)和南島語(yǔ)有這么多核心詞相似,過(guò)去一直讓我很困惑。讀到金力教授的文章以后,我就明白了,原來(lái)他們都是從同一祖先演化來(lái)的。后來(lái)金力教授很快就和我見(jiàn)面了。要探索文明起源,文獻(xiàn)、考古這些傳統(tǒng)手段都存在局限性,只有兩樣?xùn)|西是既便宜又無(wú)處不在的:語(yǔ)言和基因。通過(guò)語(yǔ)言學(xué)和遺傳學(xué)方法,我們可以往上追溯,探討東亞人群、語(yǔ)言、文明的起源和演化。從此,我們就展開(kāi)了合作。
論文第一作者張夢(mèng)翰是我的碩士和博士,他本科就讀于上海師范大學(xué)數(shù)學(xué)系,曾在中美大學(xué)生建模競(jìng)賽中獲獎(jiǎng),有很高的數(shù)學(xué)才能。博士生階段我讓他去金力教授處和中科院上海生物研究所旁聽(tīng),借著這些機(jī)會(huì),他熟練掌握了生物和遺傳方面的各種數(shù)學(xué)模型。而且他對(duì)相關(guān)文獻(xiàn)很熟悉,最近幾年,《自然》《科學(xué)》和《美國(guó)科學(xué)院院報(bào)》上連續(xù)發(fā)了好幾篇用貝葉斯方法來(lái)研究語(yǔ)言起源,解釋印歐語(yǔ)、南島語(yǔ)分化的論文,這給了張夢(mèng)翰很大啟發(fā),他認(rèn)為漢藏語(yǔ)也可以使用這個(gè)方法來(lái)研究,于是才有了這個(gè)題目。
嚴(yán)實(shí)是復(fù)旦生命科學(xué)院的博士后,他主要負(fù)責(zé)處理材料。我們這個(gè)研究,光有合適的方法還不夠,還需要大量的材料,樣本越多,統(tǒng)計(jì)越精確,當(dāng)然,工作量相應(yīng)地也就大了。我們用了美國(guó)著名漢藏語(yǔ)專家馬提索夫(James A. Matisoff)教授的STEDT數(shù)據(jù)庫(kù)。馬提索夫用了三十年的時(shí)間建設(shè)這個(gè)數(shù)據(jù)庫(kù),收錄了全世界漢藏語(yǔ)研究者認(rèn)定的同源詞,共有六百種語(yǔ)言。我們這篇論文選取了斯瓦迪士前一百個(gè)核心語(yǔ)義中的九十八個(gè),從馬提索夫的STEDT數(shù)據(jù)庫(kù)中選取了一百零九種語(yǔ)言。不算前期的材料處理,光是最后的運(yùn)算,在四核八線程的電腦上就連續(xù)運(yùn)行了四天,工作量的確很大。
事實(shí)上,我們本來(lái)打算和國(guó)際學(xué)者展開(kāi)合作的。首先聯(lián)系的就是馬提索夫,經(jīng)得他的同意之后,使用了他的數(shù)據(jù)庫(kù)。
對(duì)這一百零九種漢藏語(yǔ)材料的處理,最后呈現(xiàn)出的成果是一棵譜系樹(shù),這是怎么畫(huà)出來(lái)的?
漢藏語(yǔ)系中一百零九種語(yǔ)言的譜系樹(shù)
潘悟云:譜系樹(shù)是根據(jù)同源詞畫(huà)的,但是要辨認(rèn)同源詞是一件很麻煩的事情。例如,太陽(yáng)這個(gè)詞,漢語(yǔ)最早是“日”,上古音讀njit,藏語(yǔ)的太陽(yáng)是nima,ma是后綴,ni是詞根。上古漢語(yǔ)的nit與藏語(yǔ)的ni,一眼就能看出它們之間的同源關(guān)系。這是比較容易辨認(rèn)的同源詞。但是有的同源詞就很難辨認(rèn),比如數(shù)字“七”,漢語(yǔ)讀t?hi,羌族讀?in,景頗語(yǔ)讀?anit,彝語(yǔ)讀s?,這幾種語(yǔ)言之間的同源關(guān)系就需要我們深入、系統(tǒng)地加以比較,才能得出正確結(jié)論。如果僅憑看上去是否相似,來(lái)斷定不同語(yǔ)言之間是否存在同源關(guān)系,這顯然是不行的。
畫(huà)譜系樹(shù)采用的貝葉斯統(tǒng)計(jì)方法,不單是對(duì)計(jì)算年代有其長(zhǎng)處,對(duì)畫(huà)譜系樹(shù)也有其特殊的長(zhǎng)處。關(guān)于同源詞的比較,傳統(tǒng)的歷史比較方法只考慮數(shù)量,打個(gè)比方,語(yǔ)言A和B有二十個(gè)同源詞,A和C有十個(gè),二十個(gè)比十個(gè)多,可見(jiàn)A和B更有親緣關(guān)系。但是詞與詞的重要性是不一樣的,比如身體部位名稱就比人稱代詞重要,馬提索夫曾說(shuō)過(guò),身體部位名稱是核心詞中的核心詞。這很對(duì),因?yàn)槿祟愓J(rèn)識(shí)世界總是從認(rèn)識(shí)自己開(kāi)始。因此,身體部位名稱變化的速度比人稱代詞要慢。貝葉斯方法把語(yǔ)言變化速度納入考量,給每一個(gè)同源詞加權(quán),速度變化快的,次要一點(diǎn),變化慢的,重要一點(diǎn)。所以,我們現(xiàn)在是計(jì)算加權(quán)以后的同源詞。這樣畫(huà)出來(lái)的譜系樹(shù),會(huì)更精確一些。
這次的研究成果對(duì)語(yǔ)言學(xué)有什么樣的意義和價(jià)值?能請(qǐng)您談?wù)剢幔?/p>
潘悟云:首先是對(duì)有關(guān)漢藏語(yǔ)系起源假說(shuō)的證實(shí)。主要就是兩種假說(shuō),主流意見(jiàn)是“北方說(shuō)”,認(rèn)為黃河中上游——也就是陜西甘肅寧夏一帶——是漢藏語(yǔ)系的起源地,馬提索夫,國(guó)內(nèi)的許多學(xué)者都持這種觀點(diǎn);另外一種“南方說(shuō)”,以歐洲的范德利姆(George van Driem)教授為代表,認(rèn)為漢藏語(yǔ)系的起源地是中國(guó)西南到印度東北這一帶地區(qū)。這兩大派針?shù)h相對(duì),其實(shí)都還是用傳統(tǒng)的歷史比較做出的猜想,誰(shuí)都不能解決時(shí)間和地點(diǎn)的互動(dòng)問(wèn)題。我們的文章支持了“北方說(shuō)”。
這次的研究成果,更有利于歷史語(yǔ)言學(xué)的發(fā)展。最早的語(yǔ)言是怎么樣的?年代一久,誰(shuí)都說(shuō)不清楚。現(xiàn)在的學(xué)者就像盲人摸象一樣,有些人摸到鼻子,有些人摸到耳朵,有些人摸到尾巴,其實(shí)把各個(gè)方面的研究拼起來(lái),才能還原古代語(yǔ)言的面貌。前面說(shuō)過(guò),我們目前采用的貝葉斯方法,能夠解決年代跟地點(diǎn)的問(wèn)題,這兩點(diǎn)恰巧是歷史比較法的軟肋。但是貝葉斯方法不能解決語(yǔ)音構(gòu)擬問(wèn)題,例如中古、上古漢語(yǔ)和原始藏語(yǔ)的讀音怎么樣,這是歷史比較法的強(qiáng)項(xiàng)。
把原始語(yǔ)言每一個(gè)階段怎么發(fā)音弄清楚,這有什么意義呢?它不只是解決古人怎么說(shuō)話的問(wèn)題,最終會(huì)使得整個(gè)歷史語(yǔ)言學(xué)的面貌煥然一新。十九世紀(jì),整個(gè)歐洲的語(yǔ)言學(xué)家都投身歷史語(yǔ)言學(xué)研究,到了二十世紀(jì)初,研究者漸漸減少。其中很大一個(gè)原因,就是傳統(tǒng)的歷史比較法存在一個(gè)很大的缺陷——不確定性,這與現(xiàn)代科學(xué)思潮是相抵觸的。歷史比較法無(wú)法做到定量化、形式化,因而逐漸退出語(yǔ)言學(xué)家的視野。大概是從上世紀(jì)六七十年代開(kāi)始,美國(guó)的一些語(yǔ)言學(xué)家開(kāi)始用新的方法去做歷史語(yǔ)言學(xué)研究。最核心的內(nèi)容是音變。這更符合現(xiàn)代科學(xué)的思路:人的語(yǔ)音為什么會(huì)變化?
人的語(yǔ)音變化。最重要受制于兩個(gè)因素:一個(gè)是發(fā)音器官,一個(gè)是聽(tīng)覺(jué)器官。這兩種器官,古今中外是一樣的,所以由這兩個(gè)器官引起的音變現(xiàn)象,古今中外也是一樣的。于是,音變規(guī)律就有其普適性,就可以把演繹、推理的方法引入歷史語(yǔ)音研究。
現(xiàn)在大家都在研究,全世界的語(yǔ)言到底有哪些音變規(guī)律?其中最重要的就是自然音變(nature process),它是漸變的,而且可以從發(fā)音、感知上加以解釋。如果我們通過(guò)歷史語(yǔ)言學(xué)研究,把這些音變規(guī)律一條條研究出來(lái),將來(lái)的歷史語(yǔ)言學(xué)就是另外一種面貌。確定了漢語(yǔ)與藏語(yǔ)、緬甸語(yǔ)是同一個(gè)祖先,即從同一種語(yǔ)言變化而來(lái),就可以通過(guò)歷史比較,把這些語(yǔ)音的演變規(guī)則找出來(lái)。
另外,這次研究還有一個(gè)重大意義,有利于我們回答一個(gè)問(wèn)題:中華五千年文明的根據(jù)是什么?甲骨文記載也只有三千多年。而我們通過(guò)研究漢藏語(yǔ)的起源、漢語(yǔ)和藏緬語(yǔ)的分化時(shí)間,可以確定漢語(yǔ)有五千九百年的歷史。這與中華文明探源工程定下來(lái)的五千八百年是相當(dāng)接近的。中華文明探源工程的依據(jù)是考古,我們的依據(jù)是語(yǔ)言比較,大家從各自獨(dú)立的研究,得出了接近的結(jié)論。
這個(gè)研究還要繼續(xù)推進(jìn)。漢語(yǔ)和藏緬語(yǔ)分化以后,漢語(yǔ)如何走向東南演化為各種漢語(yǔ)方言?藏緬語(yǔ)往西南怎么演化為藏語(yǔ)支和彝緬語(yǔ)支?彝緬語(yǔ)支又怎么分化為緬甸語(yǔ)和彝語(yǔ)?發(fā)生在什么時(shí)候,什么地點(diǎn)?整個(gè)中國(guó)版圖上這么多民族的來(lái)源和演變,都要弄清楚。
您覺(jué)得這次研究當(dāng)中體現(xiàn)出來(lái)的這種跨學(xué)科研究方法,對(duì)我們來(lái)說(shuō)有什么啟發(fā)?
潘悟云:現(xiàn)在的語(yǔ)言學(xué)研究,有幾個(gè)學(xué)科要合在一起做。
一個(gè)是古文字研究。我是做上古音研究的,最近幾年我才意識(shí)到,古文字研究、考古發(fā)掘,對(duì)上古音研究的意義有多大。去年5月份北大文研論壇請(qǐng)我去做了一次講座,那次以后我就認(rèn)識(shí)了好多年輕的古文字學(xué)家。后來(lái)又到香港去開(kāi)了一次會(huì),又認(rèn)識(shí)了一批古文字學(xué)家。我覺(jué)得很欣慰,這批年輕的古文字學(xué)家可了不得,不僅懂古文字,而且懂上古音。
一個(gè)是前面提到的分子人類學(xué)。復(fù)旦有金力教授和他的科研團(tuán)隊(duì),將來(lái)肯定會(huì)形成一個(gè)古代人類學(xué)、古代語(yǔ)言學(xué)研究的國(guó)際學(xué)術(shù)中心。
另一個(gè)是民族語(yǔ)研究。我現(xiàn)在很關(guān)注民族語(yǔ)的搜集和整理。我?guī)ьI(lǐng)的團(tuán)隊(duì)經(jīng)常去少數(shù)民族地區(qū)進(jìn)行語(yǔ)言調(diào)查,這些搜集到的語(yǔ)言樣本,是很寶貴的進(jìn)行歷史語(yǔ)言比較的資料。