“彼泽之陂,有蒲与荷”(先秦·诗经《国风·陈风·泽陂》)。莲为水生植物,俗称荷花(莲科莲属),为我国十大传统名花之一。莲起源较早,对研究被子植物(有花植物)的起源与演化具有重要指导意义。实际生产中,莲花色、花型丰富多样,且赋予了特殊的文化内涵,在园林景观中广泛应用;同时兼具食用、药用等重要价值,引起国际学者的广泛关注和研究。基于此,中国科学院武汉植物园水生植物生物地理学学科组联合武汉市园林科学研究院科研人员构建了莲的基因组遗传变异与表达数据库Nelumbo Genome Database(NGD)。
NGD部署了中国古代莲最新基于HI-C技术的染色体水平基因组组装序列,收录了注释到的150,589个mRNA转录本异构体和34,481 个具有完整开放阅读框的基因,为破解莲分子遗传机理提供“关键钥匙”。同时,该数据库整合了公共数据库中莲的11个组织不同时期的共63个转录组基因表达数据,并构建了加权基因共表达网络,涵盖了不同器官(组织)类型发育调控以及同一组织不同发育调控过程中的协同表达的基因模块(module),为了解莲的基因表达调控规律提供重要的公共分析平台。此外,该数据库对荷花中具有代表性的88个栽培种表型性状进行了数字化,并基于实验室内部以及先前发表的基因组重测序数据相应鉴定了26,939,834个高质量单核苷酸多态性变异位点和4,177,974个插入缺失变异位点,丰富了莲的遗传变异信息。该数据库部署了包含Blast、Gbrowse、Primer Design和Expression Visualization在内的多个生物信息学工具,使得莲的基因序列、功能及表达的相关信息更易获取,该公共数据平台为展开莲的基因组进化、分子遗传以及分子育种等领域的研究及实验设计提供了有价值的参考信息。
该数据库以及相关研究成果以“Nelumbo genome database, an integrative resource for gene expression and variants of Nelumbo nucifera”为题在Nature出版集团旗下学术期刊《Scientific Data》(IF2020=5.541)上在线发表。中科院武汉植物园水生植物生物地理学学科组李会博士和武汉市园林科学研究院杨星宇博士为论文并列第一作者,中国科学院水生植物与流域生态重点实验室石涛副研究员和陈进明研究员为论文共同通讯作者,该研究成果得到了中国科学院战略重点研究计划(XDB31000000)、国家自然科学基金(31570220、31870208和31700197)、中国科学院青年创新促进会(2019335)、武汉市园林和林业局(WHGF2019A10)、湖北省自然科学基金(2019CFB275)和湖北省青年科技晨光计划的项目资助。
数据库连接:http://nelumbo.biocloud.net/home
论文连接:https://www.nature.com/articles/s41597-021-00828-8
图1. 莲基因组遗传变异与表达数据库的布局构架