近日,一项题为《利用自适应强化动力学对高维自由能面进行高效采样》的研究登上《自然-计算科学》。该研究使用了超过100个集合变量加速采样进程——此前的采样方法从未处理过如此高维的集合变量,使得科学家们得以在神经网络加持下,对蛋白结构的“精雕细琢”再进一步。
该文章作者目前均在深势科技团队,该团队核心成员曾凭借“物理建模+机器学习+高性能计算”新范式应用,获得2020年全球计算机高性能计算领域的最高奖项“戈登贝尔奖”。
蛋白质是生命的基石,它的功能与其独特的三维结构及动力学性质息息相关。解析蛋白质的结构、了解蛋白质的动力学性质,不仅能让我们解读生命密码,更有助于加速药物研发。深势科技团队介绍,将基于神经网络的强化动力学方法(Reinforced Dynamics, RiD)应用于拥有更高维集合变量的体系中,将有力地推进蛋白质结构采样、结构精修或环区优化等工作的进行,从而使研究人员能够通过计算方法向蛋白质的天然状态更近一步。
几十年来,科学家们通过各种实验手段解析了十几万个蛋白质结构,但实验方法成本高、周期长,这相较于已经测序的数十亿计蛋白质来说还远远不够。因此,能否用计算方法还原蛋白质生理状态并加速研究工作,已成为计算生物学中最具挑战性的问题之一。尽管在2020年的国际蛋白质结构预测顶级竞赛CASP中,来自DeepMind的AI算法AlphaFold2的表现引发生物界巨大轰动。但相比于蛋白质真实的生理状态,AlphaFold2的预测结果仍需要进一步的蛋白结构精修。
目前在蛋白质结构优化中,基于经典分子动力学(MD)的优化方案在近两期的CASP上都取得了优异的结果。但经典分子动力学模拟方法在蛋白质体系中采样效率低,而传统增强采样算法又面临着计算量大、难以选取集合变量以及维数灾难的问题。强化动力学(RiD)方法则可以借助神经网络,处理几十甚至上百维的集合变量,使其能够应用在复杂体系中。在本研究中,研究人员利用RiD方法在蛋白质结构优化问题上处理了超过100个集合变量,让经典分子动力学方法无法得到的蛋白质天然结构在强化动力学方案下成为现实。
为了方便学术开发与应用,深势科技团队已将RiD方法重构为开源软件供用户使用(https://github.com/deepmodeling/rid-kit)。同时研究团队也针对药物设计场景,对RiD进行了进一步的开发和优化,集成于旗下一站式计算辅助药物设计平台Hermite中。用户可通过Hermite-ProteinRefine对输入的蛋白质进行结构优化,获得更接近天然状态的蛋白结构。
相关论文信息:https://doi.org/10.1038/s43588-021-00173-1
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。