2月5日,中国农业科学院深圳基因组研究所合作研究成果在线发表于《细胞(Cell)》。该研究揭示了脊椎动物从水生到陆生进化历程呈现三步式演化特征,并分析表明新基因的起源、新调控原件的出现、基因编码氨基酸的改变这三类遗传创新在脊椎动物从水生到陆生的演化过程中发挥了作用。基因组所阮珏研究员为并列第一作者,主要参与完成了非洲肺鱼的基因组组装工作。
脊椎动物从水生到陆生的转变是脊椎动物演化史上的一次飞跃,这一过程需要在呼吸系统、运动系统、神经系统等方面进行各种生理和形态的革新才能实现。从硬骨鱼祖先到肉鳍鱼祖先、再到陆生脊椎动物各种进化改变的遗传创新基础是什么,一直是科学界悬而未决的重大科学问题。经过长期的古生物学和脊椎动物学研究,已知现在还存活的四足动物的最近鱼类近亲是肺鱼。因此,解析肺鱼和早期辐鳍鱼类这些“活化石”鱼类的基因组是解决这一重大问题的关键。肺鱼拥有已知脊椎动物中最为庞大的基因组40Gb,是人类基因组3Gb的10多倍。肺鱼基因组充斥着大量的重复序列,对研究人员解析其完整序列提出了极大挑战。
阮珏带领团队参与研究优化wtdbg算法,高质量解析了迄今为止组装难度最大的非洲肺鱼基因组。团队在原开发组装方法wtdbg-1.2.8的基础上,一方面大幅扩展了算法支持的数据容量,使其理论组装最大基因组高达1000Gb,满足所有已知生物的基因组组装需求;另一方面进一步提高了算法的组装速度,最终开发出组装算法的新版本wtdbg2。使用wtdbg2算法,仅在3天内(192CPU)就完成了1.5TB的三代校正数据的分析,得到了39.1Gb的基因组序列(contigs),基于脊椎动物核心基因的BUSCO评估显示其完整度高达95%。这一结果显示出wtdbg2在攻克最大脊椎动物基因组解析研究中的巨大优势。此次研究的非洲肺鱼基因组不仅是目前最大的基因组,而且是首个完整且高质量的超大基因组,标志着我国科技人员在超大基因组解析方面已经达到国际顶尖水平。