Nature Communications|郭立团队与何航团队合作解析辣椒完整基因组和辣椒素合成通路进化机制
2024-05-22
辣椒(Capsicum)是茄科辣椒属的一年生或有限多年生植物,以其特有的辣味(来自于辣椒素)而闻名。辣椒素(capsaicin,反式-8-甲基-N-香草基-6-壬烯酰胺)是辣椒中独特的一种生物碱,是辣椒为阻止食草动物的啃食或病原入侵而产生的一类天然产物。辣椒如何演化出合成辣椒素的能力,以及为何只在果实中合成辣椒素,是长久以来困扰进化生物学家的两个关键问题。辣椒的高质量完整基因组序列对解析辣椒素生物合成通路、进化历史和组织特异性机制、辣椒分子设计育种等问题至关重要。
2024年5月20日,北京大学现代农业研究院郭立研究员团队与何航研究员团队合作在国际著名期刊《Nature Communications》上在线发表了题为“Two telomere-to-telomere gapless genomes reveal insights into Capsicum evolution and capsaicinoid biosynthesis”的研究论文。该论文通过组装两个端粒到端粒(T2T)无缺口辣椒基因组:一年生栽培辣椒(C. annuum)和不产辣椒素的野生辣椒(C. rhomboideum),深入解析了辣椒着丝粒序列特征,发现独特的重复序列元件;基于分子钟估计了茄科中辣椒素合成通路的进化时间节点,并揭示了茄科植物中辣味形成和丧失的遗传基础。此外,研究还发现了辣椒素合成基因附近的染色质可及性区域导致辣椒素积累的组织特异性。该研究丰富了我们对辣椒素生物合成通路的认识,完整的基因组资源也将加速辣椒精准分子育种、辣椒素合成生物学等核心技术研发,促进辣椒食用、观赏、药用价值的开发利用。 图1 一年生辣椒和野生辣椒的形态特征 该研究采用最新的单分子测序技术(HiFi 和超长ONT)和 Hi-C等多种测序技术相结合策略,组装了C. annuum (3.10 Gb)和C. rhomboideum (1.71 Gb)两个T2T水平的辣椒基因组,实现所有染色体无缺口组装,显著改进了基因组注释。基因组质量评估表明两个基因组具有很高的碱基准确性和组装完整性。利用七碱基端粒重复序列鉴定到了一年生辣椒的24个端粒和野生辣椒的17个端粒。研究基于T2T基因组和借助CENH3 ChIP-seq数据完整鉴定了辣椒基因组的着丝粒位置和序列,发现其着丝粒缺少其他植物和人类基因组中广泛报道的卫星DNA序列,而被大量的Gypsy家族(特别是CRM亚家族)的反转录转座子LTR序列入侵。尽管功能保守,辣椒的着丝粒序列在染色体间和种间具有较低的序列相似性,表明其着丝粒的快速进化。着丝粒是基因组中的暗物质,通常被认为是转录不活跃的异染色质区域。该研究惊讶地发现,辣椒着丝粒序列具有显著的转录活性,也存在TAD和loop等三维基因组结构,表明着丝粒区域的基因表达可能发挥着重要功能。 图2 两个辣椒的T2T基因组组装和比较 其次,为了研究辣椒素生物合成通路的进化历史,该研究重建了辣椒属系统发育进化树,发现辣椒素合成途径可能在大约13.4个百万年(C. rhomboideum和C. annuum/C. baccatum分化)和五百万年(C. baccatum和C. annuum分化)之间出现。该研究分析了辣椒素生物合成通路基因(CBG)在辣椒属植物的进化,发现在所有辣椒属植物中,无论是否产辣椒素,都含有不同数量的CBG基因。辣椒素合成酶(CS)是辣椒素生物合成的关键基因,仅在茄科作物中以串联重复的形式出现,一年生辣椒含有7个串联重复拷贝,而在野生辣椒中仅存在4个拷贝。CBG基因在辣椒果实中高度表达,而在不辣的植物如番茄、马铃薯、酸浆和野生辣椒中CS基因几乎不表达。序列比对显示,辣椒的CS基因(CS-1/CS-2)具有保守的编码序列和上下游调控区,而在不辣的辣椒和近缘茄科物种中编码区和调控区发生了明显的结构变异。 图3 辣椒素生物合成基因的进化及其组织特异性 最后,研究利用多组学数据分析表明了辣椒中辣椒素生物合成基因组织特异性共调控的表观遗传学机制。研究发现在CS-2、转录因子MYB31和MYB48上游2kb内均检测到甲基化水平较低的胎座特异性开放染色质区域(OCR),这表明CS-2可能是实现胎座特异性合成辣椒素的主要基因。CBG在辣椒基因组中并没有成簇,而是分散在不同染色体上。那么CBG基因是如何实现组织特异的协同表达呢?该研究结合胎座特异性的OCR和CBG上游序列的转录因子结合位点分析,鉴定到在多个CBG基因周围的OCR中发现了MYB等转录因子结合位点,表明转录因子(如MYB31)可能特异识别这些OCR区域内的顺式元件,实现在果实组织中协同调控CBG表达。 图4 辣椒素合成酶(CS)基因在“辣”和“不辣”茄科作物中的进化模型
综上,该研究首次公布了两个辣椒的T2T无缺口基因组。系统发育基因组学和多组学研究揭示了辣椒果实中辣椒属特有的和胎座组织特异性积累的辣椒素的进化机制。新的T2T基因组资源代表了作物基因组研究的一个里程碑,将加快提升辣椒功能基因组学研究和精确改良。
北京大学现代农业研究院陈为凯助理研究员、科研助理王祥锋、孙杰、王欣蕊与华南农业大学园艺学院朱张生副教授为论文共同第一作者,北京大学现代农业研究院郭立研究员和何航研究员为论文共同通讯作者。北京大学现代农业研究院、 清华-北大生命科学联合中心邓兴旺教授、北京大学现代农业研究院张兴平研究员和李博生研究员参与了该项工作。该研究得到了山东省泰山学者、山东省重点研发计划、山东省自然科学基金和西藏自治区拉萨科技局重点项目的支持。 原文链接:https://www.nature.com/articles/s41467-024-48643-0