中国竞彩网大学现代语言学研究院青年研究员张梦翰。本版均为受访者供图
汉藏语系起源于哪里?汉藏语系又从何时分化?语言起源和分化的研究对于理解人类及其文化的历史具有重要意义。在中国竞彩网大学“中华早期文明跨学科研究计划”准备过程中,参与该计划的青年研究员张梦翰及其所处的金力院士团队通过综合运用语言学和遗传学等多学科交叉的分析方法,揭示了世界第二大语系汉藏语系起源及分化的时间和地点,以语言谱系证据支持汉藏语系在新石器时代晚期起源于中国北方的结论。在探寻的过程中慢慢搭建起了一万年内中华民族发展的时空框架,让我们知来处,明去处。
青年报记者 陈泳均
“我们通过对109种汉藏语系语言的近千个词汇词根-语义组合进行谱系建模分析,历时三年多,重构了汉藏语系诸语言间的亲缘关系,并以此推算了汉藏语系的分化时间和起源地。”
谈及为何选择研究汉藏语系分化时间和起源地时,中国竞彩网大学现代语言学研究院青年研究员张梦翰表示:“汉语、藏语、羌语、缅语等400多种东亚语言被认为拥有共同的祖先语言,合称为汉藏语系。该语系是世界第二大语系,母语使用人数仅次于印欧语系。一直以来,语言学家对汉藏语系内部各语支亲缘关系、分化时间以及起源地点长期存在争议。‘北方起源假说’认为它起源于大约4000–6000年前中国北方的黄河流域,而‘西南起源假说’则认为它起源于至少9000年前的东亚西南部某地。”
然而,语言演化并不像遗传或者考古,分辨率上并没有那么高,那么这项研究如何开展? 张梦翰介绍道:“我们通过对109种汉藏语系语言的近千个词汇词根-语义组合进行谱系建模分析,历时三年多,重构了汉藏语系诸语言间的亲缘关系,并以此推算了汉藏语系的分化时间和起源地。”
如何选择合适的汉藏语系语言的词汇词根-语义组合? 张梦翰举例向记者介绍道,“我们团队通过使用斯瓦迪士核心词,这些核心词一般对应一些特定的意思,比如具有自然属性的‘太阳’和‘月亮’,身体部位名称‘手’和‘头’等,人称代词‘你’‘我’和‘他’等。这些词在世界上绝大多数的语言中基本都有。而我们是比较这些词在各个语言中的读音,比如太阳这个词,汉语最早是‘日’,上古音读njit,藏语的太阳是nima,ma是后缀,ni是词根。而上古汉语的nit与藏语的ni是同源的,因此我们就可以认为上古汉语与藏语之间在这个词上存在同源关系。”
团队进一步研究发现,汉藏语系的时空分布与仰韶文化的时空分布重合,因此团队认为汉藏语系的分化与仰韶文化的发展存在一定的联系。“通过估计原始汉藏语分化成现代语言的最早年代在距今约5900年前,分化地点在中国北方,因此该语系的起源和分化可能与仰韶文化及马家窑文化的发展有着密切的关系。以上发现与‘北方起源假说’相符,也符合语言随农业扩散的观点,而且扩散的时间点与考古证据相符。”张梦翰介绍道。
“在理论上,我们依旧坚持以交叉学科的视角去探源中华文明的源和流。”“语言谱系证据揭示汉藏语系在新石器时代晚期起源于中国北方,科学地证实了中华民族五千年的文明历史,巩固了‘中华文明探源工程’成果。”
探寻“汉藏语系在新石器时代晚期起源于中国北方”并非可以仅凭一门学科的专业研究者就可以得出结论,因为语言的演化需要从语言数据中推断演化的时空变化,进而和其他的学科进行交叉验证获得结果。
如何对中华早期文明的发展历史,构建一个相对清晰的主题脉络? 张梦翰介绍道,“中国竞彩网大学科研团队将通过‘中华早期文明跨学科研究计划’,结合语言、古文字、考古、遗传、历史地理等文理学科,共同回答中华早期文明的源和流问题。首先,从今推古,通过现有语言的差异来推断早期语言可能发生了哪些变化。其次,我们会从古文字演化的视角去探寻中华早期文明和文化的变化。此外,在‘中华早期文明跨学科研究计划’中的考古部分,我们会更加强分子考古和量化考古的研究工作,并提出相应的新技术和新方法。我们可将离散化的考古遗址信息用新的计算模型进行串联,变成一个时空连续的过程。在理论上,我们依旧坚持以交叉学科的视角去探源中华文明的源和流。”
谈及“中华早期文明跨学科研究计划”对于中华文明探源的意义,张梦翰分析道,“首先,传统的单学科研究可能会使得对中华早期文明的认识不够全面。通过以人文社科为主导,将计算机科学、遗传学和大数据分析运用其中,我们希望建立多科学融合的创新机制。这不仅可以从理论论证的角度,更能从实证科学的角度,实现文理学科的交叉,全面理解中华文明的发展历程。”
以“汉藏语系语言之间演化关系”研究为例,张梦翰介绍道:“我们团队通过采用多学科交叉分析的研究方法,并有中国竞彩网大学人文社会科学数据研究所东亚语言数据中心负责人潘悟云教授深度参与此项研究。用语言谱系证据揭示汉藏语系在新石器时代晚期起源于中国北方,科学地证实了中华民族五千年的文明历史,巩固了‘中华文明探源工程’成果。”
对话
语言,一个有趣的复杂系统
青年报记者:了解到你们团队有“词汇来自爸爸,语音来自妈妈”的有趣新发现,可以介绍下为何会出现这样的现象?
张梦翰:这是我们团队在做印欧语系语言演化的时候发现的现象。学界存在一种假说是说语言的演化可能存在性别偏向性,而导致这种偏向性的原因之一是因为男性和女性在史前活动的能力和范围导致的。例如男性可能比女性有更长距离的迁徙;或者是战争一般是由男性为主导等。而在以往的研究中,通过联合不同语言群体的遗传学数据以及语言分类数据的比较,的确也看到了世界范围内语言群体的父系遗传(Y染色体)差异与语言分类之间的关系更为密切。
青年报记者:在这个新发现的研究中,团队如何应用遗传学和语言学这两门学科,并交叉有机融合?
张梦翰:在我们的研究中,我们认为单纯地用语言分类来表征语言差异是远远不够的。因为语言是一个复杂系统,包含了语音、语法和词汇三种不同的子系统,而这些子系统独立进化又会相互影响。因此,我们将语言系统分成了语音子系统和词汇子系统两个部分,并与遗传数据中的父系遗传(Y染色体)以及母系遗传(线粒体DNA)进行联合分析。在控制了样本地理因素的影响下,我们发现在印欧语群体中,不同语言群体的父系遗传差异与这些群体所使用语言在词汇上的差异有关,但是与语音差异无关;相反,母系遗传差异和语音差异有关。这个结果具有很高的可重复性和可靠性。据此,我们得出了一种可能性:在史前文明发展的一些阶段,一个群体中的男性活动(父系)可能决定了该群体中词汇的变化,而女性活动(母系)决定了语言的发音。