ydna吧 关注:470贴子:3,068
  • 7回复贴,共1

易刀卜:南方大语系(Austriclanguages)与O系的早期迁徙扩散

只看楼主收藏回复

(2021年8月2日下午2时许,易刀卜在新浪博客发表了《南方大语系(Austriclanguages)与O系的早期迁徙扩散》一文。当天下午4时许,易刀卜将该文摘要转载至本吧,链接地址:https://tieba.baidu.com/p/7475399031。考虑到新浪博客已将该文设为私密博文,今将全文转载至本吧。)
传统的语言分类法将世界上主要的语系分为九大语系:汉藏语系、印欧语系、阿尔泰语系、闪米特-含米特语系、乌拉尔语系、高加索语系、南岛语系(马来-波利尼西亚语系)、南亚语系、达罗毗荼语系。如果从语言的“从父居”现象出发,寻找这些语系与父系单倍群之间的对应关系,我们会发现这一分类法存在诸多问题。其中问题最大的语系是高加索语系,它的各分支相互间没有明显的亲缘关系,而被错误地称为一个语系。统计使用这些语系的各民族高频父系单倍群,不难发现,这九大语系中,汉藏语系、南岛语系、南亚语系对应的民族都是O系高频民族。然而,为什么不将这三大语系合并为一个大语系呢?其中的缘由自然是多数语言学家并不认为这三种语系并存在明显的亲缘关系。郑张尚芳先生提出了汉语与南岛语同源的论证,并认为汉语、藏缅语、侗台语、苗瑶语、南亚语和南岛语可以组成了一个超级语系——华澳语系。虽然华澳语系假说相当于将汉藏语系、南岛语系和南亚语系三者合并为一,但这一假说招致的反对声音也异常激烈。上世纪八十年代以来,随着一批卓越的语言学家的不懈研究,汉藏语系被发现与叶尼塞语、纳-德内语、北高加索语等语言存在显著的同源关系。华澳语系假说在这一发现面前难以自圆其说,那些坚持汉藏语系属于德内-高加索大语系的语言学家们往往将南岛语系、苗瑶语系、壮侗语系和南亚语系归并为南方大语系(Austric languages)。显而易见,南方大语系或华澳语系对应的应是O系父系单倍群,这与复旦大学以金力院士为首的遗传学家们从Y染色体多样性的研究中得出的O系起源于南方的结论是一致的。

图1 全球语言的谱系
南方大语系的提出对我们研究O系的起源和扩散是否具有启示作用?答案是肯定的。将父系O系的基因分化树与南方大语系的语言分化树做一个对应,可以大致地反演出O系一些大分支早期的迁徙扩散模型。


IP属地:江苏1楼2024-02-01 09:20回复

    图2 壮族的父系单倍群构成

    图3 侗族的父系单倍群构成
    源基因在其官网公布过白族、回族、侗族、满族、蒙古族、苗族、畲族、土家族、维吾尔族、瑶族十个少数民族的父系单倍群构成比例饼图。壮族的第一大父系为O1b1a,占比62.9%。侗族的第一大父系也是O1b1a,占比40%。因此,合理推测,壮侗语系在父系单倍群上对应的应是O1b1a。更具体地说,壮族和侗族的O1b1a应主要是PK4,Page59应该很少。YFull树上F789支系有31例现代样本,标识国籍的19例样本中,中国7例(2例云南、1例海南、1例甘肃、1例辽宁、2例未标识省份),越南3例,柬埔寨2例,印度2例(均是B426),孟加拉国2例(均是B426),印度尼西亚2例,沙特1例。说南亚语系蒙达语族的印度蒙达人的父系为PK4中一支重要分支F789下游的B426/Y9033,4例印度和孟加拉国B426样本应与蒙达人有关。越南语属南亚语系越芒语族,柬埔寨语属南亚语系孟-高棉语族,而印度尼西亚苏门答腊岛西南部的居民说的语言属南亚语系尼科巴语族。我国境内如佤族、布朗族、德昂族、京族、克木人、莽人、俫人等很多少数民族的语言也都属于南亚语系,除了京族和俫人主要分布于广西省境内外,其它各族均分布于云南省境内。不难看出,父系O1b1-F789对应的应是南亚语系。最典型的壮族父系单倍群是F789的平行支系F1252下游的F4229,我们不妨将壮侗语系对应的父系单倍群具体到F1252。


    IP属地:江苏2楼2024-02-01 09:40
    回复

      图4 苗族的父系单倍群构成
      苗族的第一大父系也是O1b1a,占比34%,作为位于PK4高频区内的一支少数民族,是不足为怪的。然而,众所周知,真正的苗族特色单倍群却是其第二大父系O2a2a1b-M7,占比19.4%。瑶族的第一大父系是O2a1b,占比18%,第二大父系也是O2a2a1b-M7,占比16.4%。瑶族的前两大父系单倍群和苗族的特色单倍群都是O2a,说明苗瑶语系与O2a很强的相关性。其中,苗族和瑶族的第二大父系O2a2a1b-M7可能是建立起苗语和瑶语之间同源性的关键单倍群。M7作为M134所在的P164支系的平行兄弟支系M188下游的一支古老而有苗族特色的单倍群,或许暗示苗族是M134父系的母族之一。M134下游的Oα-F8与姜姓和羌人有很大关系,《后汉书 · 西羌传》云:“西羌之本,出自三苗,姜姓之别也”,不仅印证了父系Oα出自三苗,也表明了姜姓炎帝部族与苗瑶族群存在渊源关系。瑶族在两汉时期被称为“武陵蛮”,武陵是湖南常德的古称,始于汉高祖时取“止戈为武,高平为陵”之意而设的武陵郡。武陵郡由秦朝时的黔中郡改名而来,其管辖范围正是当今苗族的主要聚居区,而广西是瑶族人口最多省份的现状是宋朝以后的南迁造成的。畲族的他称和部分自称中都有“畲瑶”、“瑶”、“瑶家”、“山瑶”、“瑶人”,有人主张畲瑶同源,源于汉晋时代的“武陵蛮”。畲语属苗瑶语系苗语支,语言学的分类也暗示畲族源自苗瑶族群。源基因公布的十个少数民族中,M7最高频的民族正是畲族,占比50%。这不仅从而父系基因角度证实了畲瑶同源说,也说明M7是苗瑶族群的代表父系。另外,畲族还是这十个民族中O2a2a*最高频的民族,占比2.6%。综上所述,以苗族、瑶族、畲族为代表的苗瑶族群应是Oα、Oβ和Oγ的祖先族群。2016年9月26日,李辉在青岛海洋国际高峰论坛上,发表了题为《苗族上古起源基因与文化综合解析》的演讲,也认为“北方是苗族的流,但不是源。山东人是从湖南迁徙而来的”,并指出“苗族起源于7800年前的高庙文化”。
      常德地区密集分布着数量众多的新石器时代遗址,如彭头山遗址、城头山遗址、汤家岗遗址、丁家岗遗址、三元宫遗址、皂市遗址、孙家岗遗址、鸡叫城遗址等等,其中多个遗址存在大溪文化层。重庆的大溪遗址测得的7例父系古DNA中,5例是苗族特色单倍群M7,1例未获下游分型的O2-M122,1例O1b1-M95,这说明大溪文化可能是苗瑶族群的祖先文化,而常德地区这些新石器时代遗址应与O2(旧O3)父系有关。这些新石器时代遗址位于古云梦泽西岸的澧阳平原,此地土地肥沃,河流密布,非常适合发展稻作农业,极有可能是O2父系诞生后第一次人口成功爆发的地方。高庙遗址位于湖南洪江市安江镇的沅水中游,李辉提到的高庙文化的生业方式以狩猎采集为主,与常德地区彭头山等文化发达的稻作农业不同,对常德地区的新石器文化的影响有限。高庙文化主要向岭南地区传播,可能与O1b1单倍群和壮侗语系或南亚语系有关。


      IP属地:江苏3楼2024-02-01 10:30
      回复
        台湾省宜兰县的汉本遗址是一处新石器时代中期遗址,年代在公元150年至870之间,相当于汉晋至隋唐时期。该遗址成功提取了20例父系古DNA,其中13例O1a-M119,占比65%,7例O2a2(即M134和M7的共同祖先旧O3-P201),占比35%。台湾是南岛语系的发源地,汉本遗址作为台湾原住民(高山族)的祖先遗址,它的古DNA检测结果为我们研究南岛语族的父系构成提供了参考。汉本遗址13例O1a-M119古DNA中,8例为O1a1-F140(其中5例为F78),2例为O1a2-M110,3例为未获下游分型的M119。这说明M119/F140/F78是南岛语族的重要父系,我们不妨认为南岛语系对应的是父系O1a-M119。并非所有O2(旧O3)系都与苗瑶语系有关,南岛语族人群除了高频的O1a-M119,也存在比例不低的O2a2-P201。一支众所周知的南岛语族特色单倍群B451正位于O2a2-P201下游,它主要分布于大洋洲的波利尼西亚人和新西兰的毛利人中。汉本遗址的古DNA检测结果也证实了这一点,该遗址的父系古DNA超过三分之一是P201,达到7例。其中,4例N6/AM01822下游的B451,1例未获下游分型的N6/AM01822,1例苗瑶特色单倍群M7下游的Y26403,1例未获下游分型的O2a2-P201。汉本遗址的7例O2(旧O3)全部都是O2a2,未测得一例O2a1(002611上游),也未测得一例O2b。这说明南岛语族或台湾原住民(高山族)父系O2(旧O3)的多样性不高,他们不太可能是O2(旧O3)系的起源民族。新西兰土著说的毛利语和非洲马达加斯加岛民说的马达加斯加语都属于南岛语系,他们的父系基因也证实了这一语言学的分类法,毛利人中存在O2a2-B451,而马达加斯加岛是O1a-M119的高频地区。对于善于航海的南岛语族人群来说,洋流的方向对于他们的迁徙至关重要。为什么位于新西兰岛和马达加斯加岛之间的澳洲大陆基本不存在O系而是C1系?这可能与澳洲周边的洋流方向有关。加里曼丹岛和爪哇岛与澳洲大陆之间不存在自北向南的洋流,澳洲大陆以东的太平洋洋流也只是从波利尼西亚群岛掠过澳洲东海岸流向新西兰岛。然而,不管是冬季还是夏季,北印度洋的洋流都能将印度尼西亚的南岛语族人群送到非洲的马达加斯加岛。

        图5 世界表层洋流分布图


        IP属地:江苏4楼2024-02-01 10:33
        回复
          O系最高频民族之一的台湾南岛语系原住民以稻作农耕经济为主,印度南亚语系的蒙达人也是从事水稻种植农业的民族。汉语和苗瑶语中关于“稻子”的词汇有很多是相同的,而苗族被认为是最早的稻作民族。《说文解字》对“苗”字的释义为“草生于田者。从草从田”,说明苗族是以种田为生的。也有观点认为,汉语的“稻”出自原始壮侗语khau,而壮侗语民族以种植水稻闻名于世,被誉为“水稻民族”。测得全部是O1a-M119古DNA的良渚文化,稻作农业非常发达。裴李岗文化是我国中原地区最早的新石器时代文化,河南省舞阳县的贾湖遗址为著名的裴李岗文化早期遗址,该遗址出现的人工栽培稻遗存说明贾湖先民主要从事稻作农业。不难看出,南方大语系与稻作农业存在密切关系,稻米之路很可能就是O系的迁徙之路。日本古代的弥生文化以稻作农业为其主要特征,该文化人群很可能与稻作农人O系有关。弥生文化的起始时间可追溯至公元前1000年,这可能揭示了O系进入日本列岛的时间。有关弥生文化传入日本列岛的具体路线,学术界存在三种观点:一、中国东部沿海地带传播到朝鲜半岛南部,进而传播至日本列岛,形成弥生文化;二、长江下游及东南沿海地区的稻作文明跨越东海直接传播至日本列岛内;三、日本的西南列岛传入。研究这条与弥生文化有关的稻米之路,有助于我们勾画出日本人的O系尤其是其特征父系O1b2-P49的祖先迁徙之路。

          图6 南方大语系与O系的对应关系


          IP属地:江苏5楼2024-02-01 10:56
          回复
            台湾汉本遗址不仅O1a-M119的频率很高(65%),多样性也高,可以推断O1a-M119早期是说南岛语的。弥生文化传入日本列岛的路线不管是哪一条,其起源地都超不出我国的华东地区,而这一地区早期应是说南岛语的。山东是Oγ的高频地区,根据李辉提出的山东人的源是湖南苗族的结论,可以将Oγ的上游F117的原始语言定位为苗瑶语。F449下游的F1273可能与古帝少昊有关,考虑到大汶口文化和岳石文化与少昊部族之间存在的渊源,不排除F449早期说南岛语。汉本遗址及台湾现代样本都测得的M7下游的Y26403应是说南岛语的,而它的平行支系F1276指向的应是苗瑶族群,代表操苗瑶语系的典型父系。源基因公布的十个少数民族中,瑶族是O2a1*最高频的民族(8.2%),推测O2a1a-F1876早期说的是苗瑶语。O2a的平行支系O2b最高频(3.3%)的民族也是瑶族,这是图中将O2b也对应为苗瑶语的原因。这些数据同时说明,瑶族父系中的O2-M122单倍群多样性很高,它们可能位于O2-M122父系的源头位置。关于O2(旧O3)的起源研究中,瑶族的父系单倍群构成值得高度重视。某种程度上,古老的瑶族可能不仅仅是我国汉族中002611/F11/Oγ父系的母族,甚至是整个O2-M122(旧O3)的母族。

            图7 瑶族的父系单倍群构成


            IP属地:江苏6楼2024-02-01 13:45
            回复
              综合南方大语系下南岛语系、苗瑶语系、壮侗语系和南亚语系四大语系对应的父系单倍群,不难反演出O系的早期分化和迁徙路线。根据广西高栏人、云南白仡佬、海南杞黎人、云南标人和广西南部壮族五个O*频率最高族群的地理分布以及23魔方统计的汉族男性中O*最高频的省份是广西,O系应是起源于我国广西省。由于稻作农业在澧阳平原和湘江中下游的逐步成熟,确立了人口繁衍的优势,O系中的一些重要支系的早期成功爆发和南方大语系分支语言的形成应主要发生在湖南省境内。其中,澧阳平原应与M134和002611的初期爆发和苗瑶语系的形成有关,湘江中下游应与O1a-M119、部分O2系(如N6/AM01822)的初期爆发和南岛语系的形成有关。由此推测,汉族中O2系下三大超级祖先Oα、Oβ、Oγ在刚刚渡过淮河时,说的语言应接近苗瑶语,他们可能是裴李岗文化的主体人群。青春期拔牙的习俗建立起了南岛语族与大汶口文化人群之间的联系,大汶口文化古人骨的体质特征也接近南岛人。代表南岛语族人群的汉本遗址高频出现的O1a-M119和O2-B451,他们的相关支系如O1a-F78、N6/AM01822(×B451)支系也出现于汉族人群中。F78主要高频分布于我国南方地区,N6/AM01822(×B451)主要分布于我国华北地区。合理推测,O1a-F78和N6/AM01822(×B451)早期应该说南岛语。汉族人群中以O1a-F78和N6/AM01822为代表的一些非M134的O系分支很可能是华东地区河姆渡文化、凌家滩文化、良渚文化、北辛文化和大汶口文化的创造者,这些新石器时代文化的先民当时说的语言可能都接近南岛语。值得注意的是,湖南境内主要河流的流向在O系一些重大支系的迁徙方向上起到了决定作用。湖南有四大水系:湘、资、沅、澧,它们都是自南向北流的,这为如今华北和华东地区O系人群祖先的迁徙指引了方向。沅水可能是部分O2-M122(旧O3)系自广西桂林向湖南常德的早期迁徙通道,湘江可能是O1a-M119和O2-N6/AM01822等支系自广西贺州向湘江中下游的早期迁徙通道,而位于罗霄山脉中部的醴陵-宜春夹道可能打开了O1a-M119向华东地区迁徙的大门。

              图8 南方大语系与O系的早期迁徙路线


              IP属地:江苏7楼2024-02-01 14:26
              回复
                一些国内语言学家和分子人类学研究者总是倾向从汉族本位主义出发,将汉藏语系与汉族中最高频的O系单倍群联系,并将O系同样高频的苗瑶语系和壮侗语系也纳入到汉藏语系中。这种语言分类法在分子人类学研究上造成了很多困扰,使得这几种语系与父系单倍群的对应关系变得模糊不清,掩盖了汉藏语系起源的一些重要信息,国外的语言学家也普遍不认同苗瑶语系和壮侗语系属于汉藏语系。如果将汉藏语系、苗瑶语系、壮侗语系属和南岛语系建构为南方大语系或华澳语系,则汉语应起源于华南地区,这与汉族(华夏族)起源于我国黄河流域中上游在地理方位上不符,更无法解释为何汉语与叶尼塞语、北高加索语和纳-德内语等语言存在同源关系。如果我们不是急于将汉藏语系与O系关联,而是遵照斯塔罗斯金和格林伯格等语言学家的建议,将汉藏语系划入与Q系相关的德内-高加索大语系,将苗瑶语系、壮侗语系、南岛语系和南亚语系划入南方大语系并与O系联系,不仅前述汉族黄河流域起源传说的地理方位矛盾迎刃而解,而且根据南方大语系下各分支对应的父系单倍群,可以较为清晰地反演出O系的早期迁徙扩散模型。


                IP属地:江苏8楼2024-02-01 14:27
                回复