体质人类学吧 关注:2,768贴子:27,452

2019年研究:各大河流流域汉族的母系遗传景观

只看楼主收藏回复

2019年研究:各大河流流域汉族的母系遗传景观


IP属地:上海来自Android客户端1楼2024-08-03 03:03回复
    摘要
    之前的研究已经观察到汉族人之间存在普遍的南北遗传差异。然而这些研究,特别是关于 [[线粒体DNA(mtDNA)]] 的研究,要么基于部分 mtDNA 序列,要么基于有限的样本。鉴于汉族是世界上人口最多的群体,并且居住在整个中国,考虑到所有地区人口后是否可以观察到南北分化仍然是一个未知数。此外,影响汉族遗传景观的因素需要进一步研究。在这项研究中,通过研究来自中国几乎所有省份的 21,668 个汉族样本中的 4,004 个 mtDNA 单倍群,剖析了汉族的母系景观。
    结果证实了南方和北方汉族人群之间的遗传差异。然而,长江、黄河和珠江(珠江)三大水系的人群之间存在显着的遗传差异,这在很大程度上归因于单倍群 D4、B4和 M7。
    基于4,986 个线粒体基因组(包括 218 个新生成的序列)的进一步分析表明,这种分歧在[[全新世(Holocene epoch)]]早期就已经存在,可能是由于这些河流沿岸的古代农业促进了人口扩张。这些结果表明,当代汉族人群的母系基因库保留了来自不同流域的新石器时代早期农民的遗传印记,或者说河谷代表了迁移障碍。三种古代农业在塑造中国的汉族的母系遗传结构方面发挥了重要作用。


    IP属地:上海来自Android客户端2楼2024-08-03 03:04
    回复
      背景介绍
      汉族人口占中国人口的91.6% [^1]。mtDNA 和 Y 染色体揭示了汉族群体内部存在巨大的遗传多样性[^2] [^3] [^4]。在汉族人中观察到普遍的南北遗传差异,被解释为由北向南的扩张[^5] [^6]。之前的研究存在采样地点局限、测序区域局限等问题。与此同时,汉族更精细的遗传结构使得揭示影响遗传景观的因素成为可能。定居、迁徙都会影响遗传结构改变。南亚群体的研究证明了河流流域影响遗传结构改变的重要性[^7] [^8]。


      IP属地:上海来自Android客户端3楼2024-08-03 03:08
      回复
        科学问题
        目前尚不清楚是否可以通过广泛地理覆盖的大规模采样观察到南北汉族人群之间的遗传差异。尚不清楚其他因素,例如地理景观,是否在塑造中国汉族群体母系遗传结构过程中发挥重要作用。


        IP属地:上海来自Android客户端4楼2024-08-03 03:08
        回复
          研究方法
          对来自中国几乎所有省份(和省级行政区)的21,668 名汉族个体进行了mtDNA 的 4,004 个变异进行基因分型。对当代汉族的母系遗传结构以及影响因素进行进一步的了解和剖析。
          • MitoTool 被用于单倍群的分配[^16]。
          •利用 SPSS 计算 PCA
          •利用 Arlequin 计算 AMOVA 与 Fst
          •利用 MEGA 绘制 NJ 树
          •利用多种方法计算单倍群最近共同祖先的时间[^17] [^18]。


          IP属地:上海来自Android客户端5楼2024-08-03 03:09
          回复
            研究结果
            单倍群D4是中国汉族人群中最常见的单倍群(16.46%),其次是B4(11.19%)、F1(9.46%)、M7(8.13%)、A(7.12%)、D5(6.49%)、B5( 4.95%)和N9(4.29%)。
            •具体来看,D4在华北和东北地区出现频率最高,包括内蒙古(22.73%)、辽宁(21.83%)和黑龙江(21.51%)。
            •单倍群B4主要分布在南方地区,特别是香港(22.22%)、云南(16.38%)和上海(14.38%)。
            •F1多见于中国南部和西南部地区,例如广西(33.33%)、贵州(15.09%)、湖南(15.32%)以及北部的青海(20.00%)等。
            •单倍群M7主要见于南方汉族,M7b 主要分布在广西(13.96%)和广东(11.08%),而M7c 在台湾出现频率较高(9.57%)。
            •单倍群 A 在中国北部和西北地区出现频率最高,包括天津(11.99%)、宁夏(10.26%)和陕西(9.96%),以及一些南方地区,例如安徽(9.35%)和江苏(8.01%)。


            IP属地:上海来自Android客户端6楼2024-08-03 03:09
            回复
              一些北部高频的单倍群的下游单倍群却在南方高频,反之亦然;可能反映了南方和北方之间的遗传混合。相对稀有的单倍群呈现地域分布,例如:
              •M8、Z 和 Y 在宁夏出现频率较高,而F4主要分布在江苏和云南省。
              •欧亚西部单倍群,包括 N2、R1、R0和 U,主要分布在中国西北部,特别是新疆和青海。
              •未能发现语言方言和 mtDNA 单倍群之间的任何相关性,大多数单倍群由不同方言群体共享。方言和 Y 染色体之间可能观察到更强的关联


              IP属地:上海来自Android客户端7楼2024-08-03 03:11
              回复
                [[主成分分析(Principal Component Analysis,PCA)]]在 PC2 方向上展示了南北汉族群体的差异,这与之前的研究结果一致 [^9]。这与常染色体的模式不同(PC1 的差异),可能归因于女性特定的迁徙历史[^10] [^11]。Fisher 精确检验显示单倍群M7、D4、R9、A 和 B4(P < 0.05)在中国南北地区的分布差异最为显着。汉族群体存在潜在的东西分化差异,但是当删除100人以下的群体时,关系减弱。中部地区的南方汉族与长江流域的北方汉族有更近的亲缘关系。相反,珠江沿岸的广东、广西、海南等地的南方汉族聚集在一起,分布距离其他汉族人口相对较远。统一流域的群体倾向于聚集在一起。
                [[分子方差分析(AMOVA ,Analysis of Molecular Variance)]] 分析显示,群体内部的变异很高。按照河流进行分类能够获得更大的组间差异。


                IP属地:上海来自Android客户端8楼2024-08-03 03:12
                回复
                  热点分析发现,D4 (D4) 单倍型及根类型在中国北方也很普遍,暗示该单倍群可能起源于中国北方*。相比之下,单倍群B4、M7 和 F1 在中国南方出现的频率要高得多(图 2c-e),其根类型主要发现于南方,从而表明它们起源于南方地区。D4、B4和 M7分别与黄河、长江和珠江流域的地理位置非常吻合。基于不同方法和不同突变率的计算表明,这三个单倍群的年龄分别为20.16-41.76 千年前(D4)、29.79-61.49 千年前(B4)和37.56-54.11 千年前(M7)。从之前发表的数据以及产生的新数据中获得了519个线粒体的13个蛋白编码序列进行 BSP 分析,自从一万八千年前以来,人口发生增长,可能归因于 [[末次盛冰期 (LGM)]] 结束的气温上升。更快的一次人口增长发生在9000年前,反映了[[全新世(Holocene epoch)]]以来的人口扩张。这次扩张在南方和北方的三大流域的汉族中都观察到了。黄河(粟)、长江(稻)、珠江(热带农业)流域被认为是中国古代三种农业的起源地。这三种农业早在一万年前就起源于(或出现)于河谷地区[^12] [^13] [^14] [^15]。有趣的是,根据我们的估计,这一时期与不同河谷的人口增长最快非常吻合。因此,河谷之间的遗传差异可归因于全新世早期沿每个流域的古代农业扩张。因此,在我们的分析中观察到的黄河流域和其他河流(例如海河和松辽河流域)种群之间的密切遗传亲缘关系可以用黄河农业向北扩张来解释。


                  IP属地:上海来自Android客户端9楼2024-08-03 03:12
                  回复
                    总之,汉族群体间存在显著的遗传差异。在中国三大水系(即黄河、长江和珠江)的种群之间观察到最显着的遗传差异。在[[全新世(Holocene epoch)]],这种遗传差异就已经存在,可能时由于古代农业的促进。局限性


                    IP属地:上海来自Android客户端10楼2024-08-03 03:13
                    回复
                      局限性
                      然而,本次研究只关注汉族的线粒体 DNA 数据,Y 染色体数据的洞察将有助于进一步探讨新石器时代跨越河谷的扩张是否是一个性别偏见的过程。


                      IP属地:上海来自Android客户端11楼2024-08-03 03:13
                      回复
                        图表
                        图1. 本研究中汉族样本的地理位置。


                        IP属地:上海来自Android客户端12楼2024-08-03 03:14
                        回复
                          图2. 中国线粒体 DNA 单倍群的区域分布。


                          IP属地:上海来自Android客户端13楼2024-08-03 03:15
                          回复
                            图 3.基于单倍群频率的汉族人群 PC 图。


                            IP属地:上海来自Android客户端14楼2024-08-03 03:15
                            回复
                              表 1. 基于不同组的 AMOVA 结果。


                              IP属地:上海来自Android客户端15楼2024-08-03 03:16
                              回复