地球上生活着大约800到1000万种微生物,然而,人类分离培养的微生物不足2万种。这些未被人类发现或培养的微生物类群主要来自于各种生境的低丰度(低细胞数)物种,它们被类比为微生物“暗物质”。
当前,从二代和三代宏基因组测序数据中恢复宏基因组组装的基因组(Metagenome-assembled genomes, MAGs),特别是对于低丰度微生物基因组的恢复效率仍然很低。
近日,北京大学深圳研究生院助理教授余珂团队《自然—通讯》上发表研究成果,该研究中开发的软件BASALT(Binning Across a Series of AssembLies Toolkit)可对二代和三代宏基因组序列进行高效分箱和优化,并最终实现了对宏基因组测序数据的高效利用,大量获取了低丰度微生物的基因组。该研究将为深入了解微生物世界的奥秘、挖掘其应用潜力提供重要的方法学基础。
BASALT软件运用并整合了多个主流的分箱软件,利用基于深度学习开发的核心序列识别算法找出组装后基因组的核心序列,进行去冗余、去污染、片段找回等一系列基因组优化步骤,可以显著提高MAGs质量和菌株水平的分辨率。此外,BASALT还大大提高了三代测序数据的利用效率。结果表明,BASALT可获得较其他同类软件高2倍以上的高质量基因组。
更重要的是,在对盐碱湖表层沉积物的实际样品数据进行解析的结果显示,BASALT对低丰度基因组的识别灵敏度较前述三个软件提高了一个数量级,为人类发掘存在于特定环境中的低丰度物种、利用微生物“暗物质”资源提供了新的技术方法。
此外,余珂团队还将BASALT技术应用于多种样品,包括垃圾渗滤液处理场、可高效除氮的藻菌共生体、厌氧氨氧化反应体系、中国西北部盐碱湖泊的微生物组的解析之中,团队不仅发现了5000余种新型的微生物物种,还解析了细菌与古菌之间、藻类与细菌之间的多种物质交换关系。
同时,研究团队也发现了大量的生物合成和降解基因簇,印证了BASALT技术强大的宏基因组分箱能力,将为未来进一步发掘这些体系中的微生物“暗物质”提供技术支撑。
相关论文信息:https://doi.org/10.1038/s41467-024-46539-7
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。