植物|多年生禾本科芒属南荻基因组序列草图绘制完成

【植物|多年生禾本科芒属南荻基因组序列草图绘制完成】4月28日 , 中国科学院分子植物科学卓越创新中心研究员韩斌课题组与中科院植物研究所北方资源植物重点实验室及系统与进化植物学国家重点实验室研究员桑涛课题组长期合作 , 完成了多年生禾本科芒属南荻基因组序列草图的绘制 。 相关研究成果以Chromosome-scale assembly and analysis of biomass crop Miscanthus lutarioriparius genome为题 , 在线发表在Nature Communications上 。
南荻(Miscanthus lutarioriparius)是我国特有的一类芒属(Miscanthus)植物 , 是一种具有应用价值的木质纤维素生物乙醇原料和生物质材料 。 南荻的年均干生物质产量高于芒(M. sinensis)、荻(M. sacchariflorus)和五节芒(M. floridulus) 。 基因组较大且重复序列含量高 , 南荻基因组一直被视为较难测序组装的复杂植物基因组 。
韩斌课题组利用纳米孔技术(Oxford Nanopore Technologies)和高通量染色体构象捕获技术(High-throughput chromosome conformation capture , Hi-C) , 对我国特有的多年生禾本科芒属物种——南荻基因组进行测序组装和分析 , 构建了第一个染色体级别的高质量南荻基因组序列 , 序列总长为2.07 Gb , 覆盖了南荻全基因组的96.64% , 包含919个scaffolds , contig N50为1.71 Mb 。 约94.30%的序列通过Hi-C数据锚定到了19条染色体上 , 且鉴定到19条染色体的着丝粒序列和第10号染色体的端粒序列 。 通过对19条染色体的着丝粒区微卫星重复序列的分析 , 证实了南荻的异源四倍化起源假说 , 且进一步将19条染色体分配到了两个亚基因组 。 南荻基因组注释包含68,328个蛋白编码基因 , 其中94.75%的基因位于19条染色体上 。 南荻基因组中重复序列约占基因组的69.27% 。 通过南荻与其他禾本科植物的比较基因组分析 , 确证了南荻基因组内近期的全基因组加倍事件(Whole Genome Duplication , WGD) , 同时鉴定到一系列的染色体结构变异 , 这些染色体结构变异(包括染色体融合事件)加速了南荻在全基因组加倍之后的二倍化进程 。 此外 , 该研究还组装了一个南荻叶绿体基因组序列 , 通过与公开的芒属植物叶绿体基因组序列的系统发育分析 , 确定了该研究的基因组测序材料与已发表的南荻叶绿体基因组具有最近的亲缘关系 。 基于叶绿体基因组序列的系统发育分析为芒属物种的进化和分类关系提供了新证据 。
该研究还对南荻重要性状相关的基因家族(包括细胞壁生物合成、重金属离子转运、抗病和C4光合途径相关基因)进行了鉴定分析 。 除了最近的全基因组复制外 , 串联复制在这些基因家族的规模扩大中也发挥了重要作用 。 转录组数据显示 , 大部分重复基因在所有转录组样本或预期样本中表达水平极低 。 这些相关基因为解析南荻重要性状的遗传基础和开展分子辅助育种奠定了基础 , 也为更好地开展水稻等植物的环境适应性研究和探索植物多年生的遗传机制提供了参考 。
分子植物卓越中心韩斌研究组博士研究生缪家顺和正高级工程师、博士冯旗是论文的共同第一作者 。 韩斌和桑涛为论文的共同通讯作者 。 研究工作得到中科院和国家自然科学基金委项目的资助 。

植物|多年生禾本科芒属南荻基因组序列草图绘制完成
文章图片

图1.南荻基因组特征分析

植物|多年生禾本科芒属南荻基因组序列草图绘制完成
文章图片

图2.南荻基因组着丝粒卫星重复序列分析
来源:中国科学院分子植物科学卓越创新中心、中国科学院植物研究所
[责任编辑: ]

    推荐阅读