(图片来源网络,侵删)
编译:微科盟-向阳而生,编辑:微科盟悄咪咪、江舜尧微科盟原创微文,欢迎转发转载,本文来源《基因组Genome》公众号导读龙脑香亚科物种形成了亚洲雨林的露生层,是濒危的亚洲雨林分布的指示物种为了解其适应热带雨林和种群数量下降的原因,研究人员收集了包括2个同源四倍体在内的7种龙脑香亚科物种的高质量基因组,估计了龙脑香亚科和锦葵科之间以及龙脑香亚科内部的分化时间,分别为108.2百万年(97.8-118.2)和88.4百万年(77.7-1.029亿年),还确定了龙脑香谱系多样化前的全基因组复制事件研究人员发现了几个表现出选择特征的基因,这可能与适应亚洲热带雨林有关此外,两种濒危物种的重测序数据表明,在末次冰川期之后其有效种群规模有所扩大,而最近的急剧下降与当地人类活动的历史相吻合本文研究结果有助于了解龙脑香科植物的多样性和适应性,且人为干扰是其濒危的主要因素论文ID原名:Dipterocarpoidae genomics reveal their demography and adaptations to Asian rainforests译名:龙脑香亚科基因组学揭示其种群特征和对亚洲雨林的适应期刊:Nature CommunicationsIF:16.6发表时间:2024.2通讯作者:王嵘、陈小勇、张原野通讯作者单位:华东师范大学,厦门大学DOI:10.1038/s41467-024-45836-5实验设计结果1 基因组从头组装和注释为获得高质量的参考基因组以供进化和群体基因组学分析,研究人员利用PacBio测序、Illumina测序和高通量染色质构象捕获(Hi-C)技术组装了7个龙脑香亚科物种的基因组(见方法)k-mer分析显示,本研究除了坡垒H. hainanensis和无翼坡垒H. reticulata (附图1a)外,所有测序物种均为二倍体,核型分析同样支持坡垒是同源四倍体(附图1b)此外,以番茄(2C= 2.12)为参照,流式细胞术结果显示,狭叶坡垒H. chinensis、坡垒和无翼坡垒的C值分别为2C= 0.81、1.60和1.64(补充图1c和补充表1)当坡垒或无翼坡垒与二倍体狭叶坡垒一同实验时,二倍体峰右侧的清晰峰证实被测物种为四倍体(附图1c)研究人员还检测到这两个物种的同源染色体都具有高度保守的共线染色体块(图1b, c),这进一步证明它们是同源四倍体除了用于从头组装的样品,研究人员还对所有(30)棵坡垒和4棵无翼坡垒进行了重测序与k-mer分析,发现了四倍体的证据(附图1d)图1 | 龙脑香亚科物种的基因组特征龙脑香亚科物种在冠层占主导地位的亚洲雨林(a),以及7个物种的基因组组装统计(b-h)a:冠层以上的龙脑香亚科树木高度大多在50米以上,其中塔高80米(照片由中国西双版纳的陈辉拍摄)b-h:共线性分析表明,大多数保守的共线性片段仅存在于每组4条同源染色体中A: 基因密度,B: GC含量,C:重复序列密度坡垒和无翼坡垒两种同源四倍体物种的全基因组大小预估为1.56 Gb和1.50 Gb,五种二倍体物种的单倍型基因组大小在313.14 ~ 452.80 Mb之间(表1);(补充图1和补充表2)本研究为狭叶坡垒、望天树Parashorea chinensis和两个同源四倍体(补充表2)生成了42.63 - 124.88 Gb (52.81-398.80 X)的 Pacbio CLR(连续长读)序列,最终组装的两个同源四倍体物种的基因组大小分别为1.10 Gb和1.24 Gb两种同源四倍体物种的预估与组装基因组大小之间的差异主要是由于在4个单倍体基因组中存在高度同源的区域(坡垒361.86Mb,无翼坡垒245.66Mb)(补充表3)坡垒和无翼坡垒的基因组大小以及重叠同源区域分别占估算基因组大小的93.6%和99.1%基于6.64-20.72Gb Pacbio HiFi数据, 娑罗双Shorea robusta、羯布罗香Dipterocarpus turbinatus和青梅Vatica mangachapoi的单倍型基因组大小为327.27-447.80Mb(表1和补充表2)表1 |龙脑香亚科7个基因组组装汇总及注释统计7个龙脑香亚科物种共获得47.11-100.29 Gb (49.45-153.88 X)的Hi-C数据(补充表2)研究人员生成了每个同源四倍体物种的基于Hi-C的物理图谱,组装了28条假染色体组装结果如下:坡垒的锚定率为95.77% (1.05 Gb),无翼坡垒的锚定率为99.36% (1.23 Gb)(图1b, c,表1,补充图2a, b和补充表4),scaffold N50分别达到44.28Mb和48.13Mb(表1)此外,其他5个物种中95.29-99.84%的单倍型基因组锚定在7或11条假染色体上(图1d-h,表1, 补充图2c-g和补充表4)CEGMA和BUSCO评估在组装的基因组中检测到92.3-98.8%的核心真核基因和95.0-99.0%的保守胚植物蛋白的完整结构,Illumina短读数据的比对率都在94.45%以上,覆盖基因组的92.38-99.99%(补充表5)研究人员在坡垒和无翼坡垒的基因组中共注释了88,703和85,031个蛋白质编码基因(包括等位基因,见补充表6),5个二倍体物种的基因组中有29,104 ~ 31,744个蛋白质编码基因(表1和补充表7),重复序列占组装基因组的43.6 ~ 51.5%(补充表8)2 系统基因组学和基因组进化为研究龙脑香亚科物种间的系统发育关系及其与最近的锦葵科的分化时间,研究人员对19种龙脑香亚科物种(本研究收集的7种龙脑香亚科物种加上来自Tian等人的12种龙脑香亚科物种)和其他6种植物物种进行了系统发育分析(见补充表9),并用304个单拷贝同源基因(21,109-48,040个聚类的基因家族)基于最大似然法构建了系统发育树(补充图3和补充表9)利用基于化石和二次校准的MCMCTree,时间校准的系统发育结果表明龙脑香亚科和锦葵科的分化时间为108.2 (95% HPD: 97.8-118.2) MYA,而龙脑香亚科内部的分化约为88.4 (95% HPD: 77.7-102.9) MYA(图2a)为了检验这一结果的可靠性,研究人员使用了不同的校准子集进行分析基于Bansal或Ng等人校准的树显示了相似的龙脑香亚科和锦葵科的分歧时间(106.8 (95% HPD: 93.8-116.8) MYA和102.5 (95% HPD: 83.6-122.2) MYA)尽管Bansal等人(89.3 MYA)校准的龙脑香亚科分歧时间早于Ng等人(65.8 MYA),两种分析结果存在95% HPD重叠(76.4-99.7和48.1 - 109.8 MYA)(补充图4a)同义替代率(Ks)分布和四重简并位点(4DTv)分析显示,所有龙脑香亚科物种中都存在全基因组重复(WGD-1)事件(图2b和补充图4)Quota测试表明,本文基因组与只经历了祖先的全基因组三倍复制的葡萄基因组存在2:1的共线性关系,这表明WGD-1是一个古四倍体事件(补充图5和补充表10)这些物种旁系同源物的遗传距离大于物种对间的直系同源物的遗传距离,表明WGD-1发生在龙脑香亚科物种多样化之前(图2b和附图4b),这一发现与之前的基因组研究一致,表明WGD事件促进了龙脑香亚科物种的多样化Ks和4DTV分布表明,两种四倍体物种(无翼坡垒和坡垒)内旁系同源物的遗传距离小于三个坡垒属植物(狭叶坡垒,无翼坡垒和坡垒)中任意两两物种间的直系同源物之间的距离(图2b和附图4b)这一结果表明四倍体物种中的全基因组复制事件(WGD-2)比这些坡垒属物种的分化发生得更晚,且具有谱系特异性图2 | 系统基因组学和基因组进化系统基因组(a)和全基因组复制(WGD) (b)分析结果a系统发育树是用19种龙脑香亚科物种和2种锦葵科物种的基因组构建的(龙脑香亚科物种以红色突出显示,其翅果用于区分不同的物种)(补充图4b)黑点分别代表Bansal等人、Nget等人、Bell等人和Vega等人估算的分歧时间WGD事件用橙色圆圈(WGD-1)和橙色三角形(WGD-2)表示b 7种龙脑香亚科物种的Ks分布用不同颜色表示,物种缩写见补充表23 与适应相关的基因组特征为探索龙脑香亚科适应性相关的分子足迹,研究人员对五种二倍体龙脑香亚科物种与五种温带树木(即:补充表9)进行了比较基因组学分析,旨在确定适应热带环境胁迫的正选择基因比较基因组学分析确定了192个正选择基因(图3a)由于基因数量有限,相应的KEGG和GO富集分析没有显著结果,研究人员给出了这些基因的GO和KEGG的功能注释(补充表11和补充数据1),发现20个正选择基因与植物响应环境胁迫有关(补充图6和7;这些基因参与DNA修复、异常mRNA降解、抗氧化、无氧呼吸、内质网相关降解、病原体抗性和细胞能量稳态(补充数据2)其中7个与紫外线适应有关,如DNA修复蛋白RAD51D和染色体结构维持蛋白5 (SMC5);9个基因,如类胡萝卜素ε羟化酶(LUT1)和核黄素激酶(RFK)和5个基因,如分子伴侣蛋白GRPE (GRPE)与耐旱性和耐热性有关;研究人员还发现分别有3个和2个基因参与响应盐胁迫和耐淹因此这些结果揭示了亚洲热带雨林中龙脑香科植物适应环境胁迫的分子足迹所有这些基因在5个二倍体龙脑香亚科物种中均有表达(附图8)此外,为验证正选择基因的功能及功能注释结果,研究人员选择了UDP-糖焦磷酸化酶(USP)和吡哆醇4-脱氢酶(PLR1)基因,利用狭叶坡垒基因组中这两个基因的序列,合成重组体(补充表12)用于酶活性测定(见方法)LC-MS鉴定的体外反应最终产物符合标准(图3b),验证了这两个基因分别合成UDP葡萄糖和吡哆醇的酶活性通过比较发现了3个扩张基因家族和53个收缩基因家族(图3a;补充表13)在扩张的基因家族中,研究人员发现了一个抗病蛋白家族(补充表14和15),该家族在温带树种中不存在,而是龙脑香科物种所特有的(图3c)在植物与病原体相互作用途径中发现了10个收缩家族,包括7个LRR-RLKs家族和两个CC-NBS-LRR家族和一个TIR-NBS-LRR家族(图3c,补充表14和15)这些基因家族是植物识别病原体的主要蛋白质受体考虑到基因家族的收缩通常与生物相互作用的特化有关,因此观察到的与植物-病原体相互作用有关的基因家族的收缩很可能是适应亚洲热带雨林特有病原体的分子足迹图3 | 比较基因组学结果 5个龙脑香亚科物种和5个温带树种的比较基因组学(a),两个抗氧化相关基因的体外功能表征结果(b),显著扩展和收缩的基因家族的基因数量(见补充表15,c) a具有显著正向选择信号的基因数量和显著扩增/收缩的基因家族数量分别用黄色、蓝色和红色表示,MRCA是最近的共同祖先 b每个基因的合成标准品(浓度为10ng/ml)和反应产物(加酶处理3个重复)(补充表12)使用LC-MS进行鉴定物种的缩写见补充表24 坡垒和无翼坡垒的群体动态和遗传负荷为了揭示龙脑香物种的种群动态和遗传负荷,研究人员在中国海南岛分别采集了30和32棵坡垒和无翼坡垒(见方法)重测序数据(平均深度>37 X;补充表16)显示,坡垒和无翼坡垒共有4,386,932和9,623,768个变异,其中双等位基因占99.35%和98.13%,包括2,922,653和4,477,756个单核苷酸多态性位点(SNPs)(补充表17)研究人员发现这两个物种的遗传多样性较为相似(坡垒:π=3.31 ×10−3,无翼坡垒:π=3.97 ×10−3,补充图9)利用PSMC进行的群体统计学分析显示,坡垒和无翼坡垒的有效种群规模Ne从10万年前开始呈轻微下降趋势,并持续到末次盛冰期(LGM,约19000年前)(补充图10)基于三个不同的世代(15、20和30年)的SMC++分析;补充表18)最近群体统计显示,两个物种的Ne在LGM之后都有所增加,坡垒的Ne在6千~1万年前达到最大值,无翼坡垒的Ne在3~9千年前达到最大值(图4a)然而,坡垒近期的急剧下降始于大约1500-2400年前,无翼坡垒始于1200-2400年前在此期间,有效种群数量从最大值(坡垒为5000,000,无翼坡垒为400,000-600,000)下降到不足1000个(图4a)由于人类在海南岛的活动可以追溯到3000年前,上述证据表明,人类干预可能破坏了冰川期后其种群的维持为探究小种群的影响,研究人员估计了坡垒和无翼坡垒的遗传负荷和近交,共在坡垒的647个基因中鉴定出678个衍生有害突变(DDMs),在无翼坡垒的581个基因中鉴定出617个衍生有害突变(DDMs) (附图11;补充表19)研究人员还鉴定了衍生主效应突变(DMEMs),包括坡垒407个基因的416个DMEMs和无翼坡垒300个基因的304个DMEMs(补充表19)在这些有害突变中,坡垒中有200个DDMs(195个基因)和180个DMEMs(175个基因),无翼坡垒中有197个DDMs(195个基因)和152个DMEMs(150个基因)在至少一个个体中是纯合的,相应的基因主要富集在淀粉和蔗糖代谢等途径中(map00500)(补充表20)分析显示,这两个物种的个体携带的纯合有害突变数量非常低,坡垒的平均数量为85±1.5 DDMs和73±1.3 DMEMs,无翼坡垒的平均数量为66±1.0 DDMs和56±0.9 DMEMs(图4b, c)与另一种濒危植物天目铁木Ostrya rehderiana相比,这两种植物的遗传负荷相对较低天目铁木具有相似的单倍型基因组大小(366.2Mb),个体平均有5350个纯合DDMs种群遗传结构分析结果表明,所有无翼坡垒的遗传结构为1个类群(K=1, 附图12),而坡垒的遗传结构为2个类群(K= 2,附图13)有趣的是,研究人员发现从孤立的地点(BW和WZ)收集的样本被分配到同一组(补充图13)纯合性(ROH)分析显示,在所有样本树中很少有长纯合片段(大于30kb),表明两个物种的近交水平较低(图4d)与有效种群规模的动态一致,这些发现表明这些种群规模最近经历呈下降趋势图4 | 坡垒和无翼坡垒的群体动态历史和遗传负荷坡垒和无翼坡垒的种群历史(a),遗传负荷指标(b, c); 以及基因组中不同长度类别纯合子片段的频率分布和总长度的箱形图(d)a:采用SMC++软件,在15年、20年和30年三种不同的世代时间值下,推测了坡垒和无翼坡垒的种群动态末次冰期(LGP)和末次盛冰期(LGM)分别以浅青色和青色突出b, c箱形图显示了坡垒和无翼坡垒种群中衍生有害突变(DDMs)和衍生主要效应突变(MEMs)的累积情况坡垒和无翼坡垒的箱形图(b-d)显示了生物学上独立的样本(n = 30和32)作为数据点中线、框边和虚线表示中位数、25%和75%四分位数,以及四分位数范围1.5倍的上下分布讨论探索适应性多样化和群体统计学背后的过程可以为濒危物种的保护提供重要的见解在本研究中,研究人员组装了7个龙脑香亚科物种的高质量基因组,确定了龙脑香亚科与锦葵科之间以及龙脑香亚科内部的分化时间分别为108.2 MYA和88.4 MYA(图2a)这一全面的系统基因组分析表明,双翅香亚科和龙脑香亚科都起源于热带非洲,然后是非洲与印度的植物区系互换在龙脑香亚科对热带环境的适应中发现了一些可能与之相关的正向选择基因值得注意的是,两个坡垒属的同源四倍体物种显示出间冰期后有效种群规模增加的证据,很有可能是人类在过去几千年的干扰导致了这些物种的数量下降尽管它们的种群规模较小,但两个同源四倍体的坡垒属种群积累了低水平的有害突变,可能是因为最近发生了瓶颈效应(不到170代)因此,本文研究结果为龙脑香亚科物种如何适应亚洲雨林而最终濒临灭绝提供了新的见解本研究估计的龙脑香亚科和锦葵科的分化时间似乎早于Ng和Wang等人,晚于Tian等人的研究龙脑香亚科的树冠年龄与Bansal等人的估计(~94.6 MYA)有重叠,虽然这项研究的估计与真双子叶植物的冠龄(c.132MYA)并不矛盾,但它表明了更早的锦葵目起源,并且似乎支持了龙脑香亚科的古代起源(c. 120MYA)在冈瓦纳西部这一起源比东冈瓦纳和西冈瓦纳分离更晚,龙脑香科植物向印度的扩散可能是在侏罗纪晚期与印度板块相撞的Kohistan-Ladakh Island Arc发生的,扩散到东南亚可能与始新世晚期印度板块和亚洲板块的碰撞有关其中,坡垒属主要分布在东南亚地区,本研究估计该属的冠龄(35.7 MYA)表明其在印度-亚洲板块碰撞后发生了多样化分化因此,通过整合更多的基因组,本文研究结果支持龙脑香亚科的热带-非洲起源,以及非洲-印度区系交换在形成龙脑香亚科当前分布中的作用龙脑香亚科与锦葵科之间的分化时间似乎不受龙脑香科内部标定的强烈影响,而龙脑香亚科的中位冠龄似乎对亚科内部标定敏感使用Ng等人的校准,95% HPD的范围更广,可能是由于在该亚科中只包含一个校准结果有趣的是,来自晚白垩纪、古新世和中新世的龙脑香科新化石记录的出现,支持了一个更早的系统基因组测年时间框架,从而导致了更早的冠龄估计结果这一现象反映了被子植物历史的延伸,更多古代化石的发现为检验生物地理学假说提供了新的机会此外,本文研究结果仅基于龙脑香亚科的基因组,其他两个亚科(柄蕊香亚科和Pakaraimaeoideae)的高质量基因组可能会提供与龙脑香亚科起源相关的新见解WGDs和多倍化事件被认为与环境胁迫有关,如温度的剧烈变化WGD-1和WGD-2事件可能从基因组水平反映了植物对古代气候/环境变化的适应研究人员发现WGD-1先于龙脑香亚科物种的多样化,这与之前研究一致这一事件之前被认为与白垩纪-古近纪灭绝事件(c.66MYA)同时发生,但本文系统基因组学结果显示发生在中白垩纪的时间要早得多虽然目前仍难以确定与这次WGD事件相关的具体气候/地质事件,但这很可能发生在龙脑香亚科起源的热带非洲核型分析表明,坡垒属的多个物种存在多倍体种群,包括香坡垒Hopea odorata(3X),Hopea subalata (3X)和府垂坡垒Hopea nutans (4X)多倍体似乎在以气候和地形波动为特征的生境中普遍存在,迄今为止大多数记录的多倍体事件与环境变化密切相关该属在龙脑香亚科的分化相当晚,树冠年龄为35.7 (95% HPD: 18.4-48.2) MYA(图2a),对应于始新世晚期上新世温度的下降和波动,以及该地区不规律的干旱事件可能促成了该谱系的基因组复制或多倍体化事件先前的研究表明坡垒存在二倍体群体,但k-mer分析显示,本研究从海南岛取样的坡垒个体均为四倍体(附图1d)坡垒和无翼坡垒分布于亚洲热带地区的北部边界,与亚洲热带雨林中部地区相比,那里的气候波动较大(例如,冬季较冷,降水变化很大),这些环境胁迫可能与这两种坡垒属植物的多倍体化有关功能基因的快速进化通常发生在对环境胁迫的反应中龙脑香亚科的成树高度益处颇多,如抢占光照资源,促进花粉和翅果的传播,但这些优势是有代价的,如成树直接暴露在强烈的干旱和高度的干旱中由于这些正选择基因在功能上与这些胁迫相关,本文研究结果为进一步探索亚洲热带雨林龙脑香亚科对环境胁迫的适应提供了分子基础植物-病原体相互作用中的收缩基因家族表明,这些物种可能存在专门针对亚洲热带雨林的地方性病原体互作机制,未来的研究应该探索龙脑香亚科这些基因家族的功能及其与病原体的特殊相互作用与末次冰期许多温带和亚热带物种相对较小的有效种群规模一致,末次盛冰期后两个同源四倍体坡垒物种的种群扩张表明它们更喜欢潮湿和炎热的气候重要的是研究结果表明,与多数物种一致,人类干扰在种群数量下降中起到主要作用龙脑香科植物由于自古以来就以芳香的油树脂和高质量的木材而闻名,长期遭受过度开发和非法砍伐此外,人类的殖民和开发和土地利用的变化造成了亚洲热带雨林的严重砍伐所有这些干扰都可能加速了最近龙脑香科植物种群规模急剧下降值得注意的是,这两种坡垒的SMC++曲线在时间上略有变化,这可能反映了它们之间的杂合性差异,而不是真正的人口/地质事件差异较小的有效种群规模预计会威胁到濒危物种的长期生存研究人员发现其遗传多样性相对较低,并与其他一些濒危物种相当(附图9),却没有观察到有害突变的积累由于四倍体对有害突变的掩蔽作用,随着时间的推移,预计四倍体比二倍体积累更多的有害突变一种可能的解释是,坡垒和无翼坡垒的种群数量下降只是最近才发生的,在过去的2000年里,有害的突变尚未积累起来此外,龙脑香科植物主要由小型昆虫传粉,如小型蓟马,所有基因流动预计发生在几百米内这表明地理上孤立但遗传相似的坡垒种群在历史上是有联系的,进一步证明分化和种群规模下降是最近才发生的因此,尽管小种群规模的影响尚未表现出来,但随着时间的推移,有害突变的积累,它们将对未来的保护构成重大挑战持续的全球变化正在导致物种长期进化的栖息地迅速恶化本文研究结果揭示了龙脑香亚科的系统发育历史和其适应性多样化的基因组特征,并表明人为干扰而不是冰川气候波动导致了种群的减少因此,这些发现为世界上最有魅力的树木群体之一提供了历史背景,同时强调了减少与栖息地丧失相关的人类活动的重要性,这将有助于保护亚洲热带雨林的生物多样性
0 评论