∷ 

北京大学现代农业研究院何航团队与合作者在《Nature Genetics》发表高质量黑麦基因组

       2021年3月18日,国际顶级期刊Nature Genetics发表了由河南农业大学农学院植物基因组学和分子育种中心王道文课题组、杨建平课题组、河南农业大学农学院杨青华课题组、北京大学现代农业研究院邓兴旺院士与何航团队、四川农业大学任正隆课题组和百迈客生物科技公司共同完成的研究成果“A high-quality genome assembly highlights rye genomic characteristics and agronomically important genes”,解决了长期以来悬而未决的黑麦基因组精细物理图谱组装难题,并系统解析了黑麦的演化,淀粉合成、储存蛋白、抽穗期及驯化等相关基因的详细机制,对黑麦和小麦遗传改良具有重要的参考价值,同时也为麦类作物育种改良的源头创新提供了重要的信息资源。河南农业大学李广伟博士、王立建博士、杨建平研究员、北京大学现代农业研究院何航研究员、河南农业大学靳怀冰博士、百迈客生物科技公司李绪明、四川农业大学任天恒副教授为本论文共同第一作者,河南农业大学王道文研究员、张坤普研究员、杨青华教授和杨建平研究员为本文章的共同通讯作者。北京大学现代农业研究院邓兴旺院士、研究生韩雪也参与了本项研究。
       黑麦(Secale cereale)是禾本科小麦族黑麦属的二倍体植物,是小麦、大麦和燕麦等其他麦类作物的近缘物种。黑麦英文单词rye来源于古英语ryge,是裸麦的意思,它的中文名字可能源于其浅蓝黑色的面粉颜色。和小麦、大麦类似,中东地区是黑麦的起源中心和野生遗传资源分布中心。黑麦具有更好的抗寒、抗病、抗逆和耐旱能力,在贫瘠土地条件下也有很强的适应能力,可耐受其他谷物无法耐受的极端气候条件,对肥料及农药需求较少,可给自然条件恶劣地区带来显著的生态和经济效益。黑麦在欧洲至少已有7000年栽培历史,至今依然是北欧地区主要的粮食和饲料作物之一,其在我国西北、东北和西南山区也有种植(图1)。
图1,全球黑麦产量分布图。
       相对于其他麦类二倍体基因组,黑麦基因组更加复杂(2n = 2x = 14, RR),基因组大小估计为8G,远大于水稻(25倍)、谷子(20倍),高粱(11倍)、玉米(4倍)、大麦(1.5倍)等其他谷物基因组,其基因组中有超过90%的序列由高度重复的转座子序列组成。自然情况下黑麦具有自交不亲和性,是异交作物,具有很高的杂合性,这是基因组组装的又一道艰难障碍。以上这些复杂性是黑麦基因组组装的主要障碍,严重限制了麦类重要农艺性状遗传机制解析、作物基因学理论研究,以及黑麦、小麦等重要作物的遗传育种改良。
       为了解决上述科学问题,研究团队开拓性的利用中国栽培品种威宁黑麦强迫自交可部分结实的特性,让其强制自交18代,获得了高度纯合的自交系材料,为基因组组装扫除了部分障碍。研究团队使用高通量二代测序、PacBio单分子测序、染色质三维构象捕获 (Hi-C)、 单分子光学图谱(Bionano)和高密度遗传图谱等技术,联合优化多种组装策略,成功的构建了威宁黑麦的高质量精细基因组物理图谱(图2)。
图2,威宁黑麦基因组特征分布。(A)染色体与着丝粒,(B)TE密度,(C)基因密度, (D)Gypsy和(E)Copia 反转录转座子密度, (F) GC含量,(G)基因组内同源区段。
       威宁黑麦基因组组装大小为7.84G,其中7.25G(93.67%)序列可以锚定到7条染色体上,其中5条染色体大小超过了1G,最大的染色体长度(2R,1.15G)可达水稻基因组的3.6倍。组装得到的物理图谱与已有的欧洲黑麦(Lo7 x Lo225 RILs群体)构建的遗传图谱的相关性可达0.99。威宁黑麦中一共注释到45596个高可信度基因,这些基因中有1989个抗病基因,抗病基因的数量高于大麦、水稻和其他麦类二倍体物种。分析发现,黑麦中有6.99Gb的转座子(transposon elements, TE),可以分为537个TE家族,占基因组比例的90.31%,显著高于其他麦类作物。相对于大麦,黑麦多出2.52G的LTR-RTs,贡献了基因组扩张的85.42%(图3a)。黑麦基因组的扩张主要集中在几个重要的TE家族上,比如前15个TE家族约占基因组比例的56.5%,其中Daniela, Sumaya和 Sumana三个家族在黑麦中具有明显的特异性扩张(图3b)。
v
图3,黑麦转座子分析。(a)黑麦与其他物种基因组特征;前15个TE家族占基因组比例(b)和LTR-RTs插入时间(c)比较,乌拉尔图小麦(Tu)、粗山羊(Aet)、大麦(Hv);(d)Gypsy 和 Copia两个LTR-RTs超级家族在黑麦基因组中的插入时间分布。
       庞大的基因组往往伴随着各种基因复制现象,本研究在威宁黑麦基因组中鉴定到了23753个分散复制基因(DDGs),6659个近距复制基因(PDGs),7077个串联复制基因(TDGs)和1866个片段复制基因(图4a)。利用和黑麦演化距离最近的大麦基因组为参照,从分散复制基因中鉴定出来10357个基因复制是由转座子引起的(TrDGs)。有意思的是,在黑麦淀粉通路合成相关基因(SBRGs)中,分别发生了5次转座复制,1次串联复制,1次分散复制和两次近距复制事件(图4d)。尤其是ScSuSy2的两个复制基因之间的表达谱发生了明显的差异,预示着它们可能产生了新的功能分化。这一发现,说明基因复制能为基因新功能分化的产生提供新的资源,从而为物种在不同条件下的适应性演化,提供必要基础。这也在一定程度上解释了,黑麦在极端条件下突出的抗性和独特适应能力的遗传基础。
图4,黑麦的基因复制与它们对SBRGs的多样性影响。a,黑麦近距复制基因和串联复制基因与其他物种比较;b,以大麦为参照,转座相关基因的比较;c,黑麦淀粉合成通路模式图,标红的为发生复制的基因;d,威宁黑麦中SBRGs表达谱。
       种子储存蛋白(SSP)对麦类作物食用和加工品质具有决定性的影响。黑麦中一共有四个储存蛋白基因位点(Sec1-Sec4)。SSP位点,尤其是醇溶蛋白位点一般包含多个(最多可达几十个)高度相似的串联重复基因,导致其难以组装出完整序列,这对研究造成很大困难。本研究利用三代长片段读长的组装策略,结合三代全长转录组CCS数据辅助组装方法,成功实现了对这些复杂位点的组装,解析了这些基因的详细组成和结构特点(图5a),成功的解析了黑麦高度复杂的种子储存蛋白位点的基因组组成,并以此为基础阐释了这些位点的演化历程,为黑麦、小麦的品质改良和产量提高提供了详实的理论基础。
图5,黑麦储存蛋白位点特征(a)与共线性分析(b)。
       在本研究中我们也发现,威宁黑麦相对于荆州黑麦在长日照条件下抽穗期提前10-12天,与此相应的威宁黑麦中ScFT基因也会提前表达(图6a,b和c),检测ScFT蛋白发现其分子量大小(29kDa)大于其预测大小(19kDa),推测其可能有翻译后磷酸化修饰现象,磷酸化蛋白实验证实了这一假设(图6d和g)。研究者更进一步的对两个保守的磷酸化位点进行突变(S76D, T132D),转化烟草发现这两个位点的磷酸化消除会引起烟草植株的开花延迟,植株生物量变大(图6e,f和g)。
图6,黑麦抽穗期相关基因ScFT分析。威宁黑麦相对于荆州黑麦提前抽穗且ScFT1和ScFT2基因提前表达(c和d),ScFT能产生磷酸化且烟草转化实验表明它的磷酸化是诱导开花必须的条件(e,g和h)。
       本研究综合利用多种方法和策略,克服复杂基因组组装的多重障碍,成功构建了威宁黑麦的高质量精细基因组物理图谱,并解析了其基因组的基本特征和重要农艺性状的相关分子机制。填补了作物基因组一个重要的缺失环节,为黑麦驯化、麦类基因组演化和比较基因组研究提供了重要资源。同时也将促进黑麦、小麦等相关麦类作物的遗传育种改良。
 
       原文链接:https://www.nature.com/articles/s41588-021-00808-z