(图片来源网络,侵删)
文丨无名灏编辑丨无名灏蛋白编码序列的DNA,除蛋氨酸和色氨酸两个为唯一编码外,其余氨基酸均由两种及以上的密码子共同编码,在编码过程中,各同义密码子的使用频率也是不均等的,这种不均等现象称为密码子偏好性密码子偏好性在不同物种、不同基因中具有丰富的多样性,这是物种或基因在长期的演化过程中受自然选择、遗传漂移等多种因素综合影响的结果密码子偏爱性是物种演化的标志性特征,分析密码子的使用模式和影响因素,有助于对物种间的亲缘类群研究提供参考依据叶绿体是植物特有的细胞器,通过光合作用为植物提供必要的能量,其本身含有一套母系遗传物质,它有自己的环状基因组,大小在107~218kb之间与核基因组所蕴含的庞大遗传信息不同,叶绿体基因组相对较小,结构、基因含量和排列顺序相对稳定目前,关于叶绿体基因组的重复序列特征和密码子偏好性,已在肖蒲桃、黄芩、蒙古韭等植物中有了研究报道黄梅秤锤树叶绿体基因组基本特征叶绿体基因组特征和密码子偏好性特征,可应用于DNA条形码分子标记、系统进化和叶绿体基因工程,利用叶绿体基因工程的研究方法,可避免花粉逃逸等生物安全问题,又可快速大量的得到转基因纯合后代安息香科秤锤树属是中国特有属,黄梅秤锤树,落叶灌木或者小乔木,多呈3~4m的灌木,叶纸质呈椭圆形或倒卵椭圆形,花两性洁白可爱,果实下垂,宛如秤锤,极具观赏价值是园林庭院栽种的优美树种,已列为中国120种极小种群野生植物(PSESP)物种之一目前仅在湖北省黄梅县下新镇钱林村龙感湖国家级自然保护区的天然次生林中有一个野生种群,分布范围极其狭窄现存的黄梅秤锤树数量极少,生境地处于龙感湖湖岸带,不仅受雨季旱季湖岸带的影响,而且岸边易受农田、池塘人为干扰,生存状况极受关注因此对该种的有效保护,除了就地保护外,还需要恰当的近地保护和迁地保护目前关于黄梅秤锤树的研究报道,集中在野生群体的形态繁殖特征、群落结构和遗传结构等方面阮咏梅等本文以黄梅秤锤树为对象,对其叶绿体基因组特征及密码子偏好性进行研究,探讨该物种密码子偏好性的影响因素,可为该种的适应性、系统演化和叶绿体基因工程研发提供参考依据组装完成的黄梅秤锤树叶绿体基因组长度为158758bp,总GC含量为37.7%,呈典型的四体结构,包括一对反向重复区,一小单拷贝区和一大单拷贝区注释结果显示,该物种叶绿体基因组共有130个基因,其中蛋白编码基因(PCGs)84个,转运RNA基因(tRNA)37个和核糖体基因(rRNA)8个叶绿体基因组基因组整体、IRs区、LSC区和SSC区的GC含量分别为37.2%、43.0%、35.2%和30.5%,其中IRs区GC含量最高,与大多数叶绿体基因组序列一致,这可能跟该区域相对保守有关黄梅秤锤树叶绿体基因组中共有43个SSR位点,所发现的SSR中各类型SSR的重复数目差异较大密码子组成分析单核苷酸重复共有40个,大部分为A/T,占该类型的97.5%,二核苷酸重复有2个,AT和TA各一个,三核苷酸重复有1个,为AAT,这些SSR位点可作为研究该物种甚至该属的备选分子标记所有SSR中,A、T、AT和TA占了大部分(95.35%),这与前述叶绿体基因组的碱基组成A/T含量大于G/C含量是相符的叶绿体基因组中共有49个重复结构序列,所含重复类型有四种,以F、P和R为主,而C占较少数,它们分别占26.53%、24.49%、42.86%、6.12%重复序列全部位于LSC区,这可能与光系统Ⅰ(psa)和光系统Ⅱ(psb)有关的基因主要分布于LSC区有关,由此可见,重复序列在四区分布极不均衡注释出的84条蛋白编码序列(PCGs),剔除长度小于300bp的序列,获得53条序列用于后续的数据分析对该53条序列的基本特征进行统计,结果显示黄梅秤锤树叶绿体基因组中基因密码子的平均GC含量为37.59%,密码子第一位、第二位和第三位的平均GC含量依次减少不同基因的密码子不同位置的碱基组成不均匀,且大部分基因显示出GC1值最高,而GC3值最低,表明密码子三个碱基位置上的GC含量很不均匀,其中第三位碱基也就是密码子偏好以A/T结尾衡量某基因的密码子偏好程度的是有效密码子数,理论取值范围在21~60之间,当某一基因无偏好性的使用各个密码子,则其ENC为61认为密码子使用无偏性,而当某一基因仅偏好性地使用同义密码子中的某一个,那么ENC为20,表现出较强的偏性,已发表的研究多以ENCexp值35为参考来判断偏性强弱本研究结果显示,黄梅秤锤树叶绿体基因组实测有效密码子数(ENCobs)的取值均在35.19以上,表明基因密码子显示较弱的偏性对碱基组成和实测有效密码子数(ENCobs)的相关性进行分析,结果显示,GCall与GC1、GCall与GC2、GCall与GC3以及GC1与GC2都呈极显著的相关性,但GC1与GC3以及GC2与GC3之间没有明显的相关性这表明该物种叶绿体PCGs的密码子第一位和第二位碱基组成较相似,但与第三位碱基组成存在显著差异而进一步的,ENCobs与密码子第三位的GC3极显著相关,这说明密码子第三位上的碱基组成对该物种叶绿体PCGs的密码子偏好性贡献最大黄梅秤锤树的各个PCGs的密码子GC12值为0.3212~0.5504,GC3的值处于0.2014~0.4173之间,对GC12与GC3的相关性进行分析实验的猜想和设计结果显示,二者的决定系数为0.0231(P>0.05),变化仅仅由GC3很少部分(2.31%)的变化贡献,且检验为不显著,GC12与GC3两者的变化无明显的相关性基于中性突变理论,GC1、GC2、GC3之间应该有较一致的相关性,但结果显示不一致,这说明随机突变对密码子的偏性形成的作用不大,而选择、漂变等其他因素可能对该物种密码子的偏性影响更大由于前述分析表明该物种叶绿体基因组中基因编码子第三位的使用偏性较强,进一步利用PR2-plot绘图分析,以探讨密码子第三位碱基A(A3)与T(T3)、C(C3)与G(G3)之间的关系,结果显示大部分基因的散点分布在图的下半部且偏向多在右下部,这说明4种碱基在密码子第三位中分布不均,同样的,基于中性突变理论,如果密码子偏好性只受基因突变的影响说明黄梅秤锤树叶绿体密码子的使用除了受到自然突变的影响,本研究中的黄梅秤锤树叶绿体基因组长158758bp,与已发表的安息香科叶绿体基因组大小一致,在158~160kb之间结构同样也呈环状典型的四体型(两个反向重复区将大小单拷贝区隔离开),如西藏山茉莉、秤锤树和肉果秤锤树等该物种叶绿体基因组中的重复序列类型以A/T为主,这一方面表明叶绿体基因组的相对保守性,一方面也表现出LSC区域相比IR区域的更多样性密码子三个碱基所受到选择压不同,第一、二位上的碱基比第三位上的碱基变异性更大,这是因为密码子第三位碱基突变受到的选择压更大,所以分析密码子的碱基组成尤其是第三位碱基的组成对研究密码子的偏好性具有指导性作用叶绿体基因组编码基因的密码子三个碱基组成比较分析,实测有效密码子数(ENCobs)的取值均在35.19以上,表明黄梅秤锤树叶绿体基因组整体密码子偏性较弱中性绘图分析和ENC-plot绘图分析表明,大部分基因的偏性是长期选择的结果,PR2-plot分析显示,有少部分基因密码子的偏性也受突变的影响因此,黄梅秤锤树叶绿体基因组目前整体的密码子的偏性是受选择和突变的共同作用的产物,但具体的影响机制还需进一步的深入研究来揭示本研究也统计了该物种叶绿体基因组中同义密码子使用度,筛选出了各氨基酸偏好性使用的密码子,这也为改良该物种提供一定的参考黄梅秤锤树为极小种群野生植物物种之一,目前仅分布于黄梅县龙感湖国家级湿地自然保护区内的黄梅县下新镇钱林村原始次生林中在此处采集该物种的叶片送至华大基因股份有限公司进行二代测序,组装注释所得的完整叶绿体基因组数据已提交至美国国立生物技术中心为进一步分析密码子偏好性,对该叶绿体基因组的蛋白编码序列进行筛选,剔除序列长度小于300bp的基因,最终有53个基因序列用于本研究中后续的数据分析叶绿体基因组物理图谱使用OGDraw在线工具进行绘制,该物种的叶绿体基因组重复结构使用REPuter在线软件进行定位对筛选出的53个基因序列,使用CodonW1.4.2统计各项值,包括各项GC值、ENC值、RSCU值等对于RSCU值,根据算法,若同一氨基酸各密码子的RSCU都为1,表示密码子使用无偏好性,而当某一密码子的RSCU>1时表示该氨基酸的这一密码子偏性比其他同义密码子高,为了探讨密码子偏好性的影响因素,使用CUSP在线软件统计第一、第二和第三位密码子的GC含量、同义密码子第三位的GC含量和第一位和第二位密码子的平均值GC含量
0 评论