|
|
AI 蛋白质预测工具 AlphaFold3 现已开源 |
|
六个月前,位于英国伦敦的谷歌DeepMind曾因争议而隐瞒了一篇描述蛋白质结构预测模型的论文代码。然而,11月11日,该公司宣布,科学家现在可以免费下载该软件代码,并将该人工智能(AI)工具——AlphaFold3,用于非商业应用。
上个月,瑞典皇家科学院宣布将2024年诺贝尔化学奖的一半授予DeepMind AlphaFold团队的John Jumper和Demis Hassabis,以表彰他们开发的预测蛋白质结构的AI工具——AlphaFold。这是AI推动的科学突破首次获得诺贝尔奖。
AlphaFold目前有3个主要版本,AlphaFold3是该系列工具的最新版本。与前代版本不同,AlphaFold3功能更强大,能够将蛋白质与其他分子一起建模,不仅能够预测蛋白质复合物的结构,还可以预测蛋白质与其他类型的分子(包括DNA和RNA)相互作用的时间。
然而,DeepMind起初并未直接公布AlphaFold3的底层代码,而是通过网络服务器提供访问权限,并表示这种做法旨在在促进研究访问和保护商业利益之间找到正确平衡。但访问权限限制了科学家可以进行预测的数量和类型,尤其是阻止科学家预测蛋白质在潜在药物存在下的表现。
与此同时,AlphaFold3 的发布也未包含源代码和模型权重,即通过对蛋白质结构和其他数据进行训练得到的参数。这一做法引发了科学家的批评,认为它破坏了模型的可重复性。对此,DeepMind 迅速改变了方针,并表示将在半年内推出该工具的开源版本。
现在,DeepMind决定公开源代码,任何人都可以下载AlphaFold3软件代码并将其用于非商业用途。但目前只有具有学术背景的科学家可以根据要求访问训练权重。
“我们非常期待看到这个工具的未来应用。”Jumper说。AlphaFold2的开源特性促进了其他科学家的大量创新。例如,最近蛋白质设计大赛的获胜者就使用AI工具设计了能够结合癌症靶标的新蛋白质。Jumper也提到了他最喜欢的AlphaFold2使用案例之一——一个团队通过该工具找到了一个帮助精子附着在卵细胞上的关键蛋白质。
然而,尽管AlphaFold3的开源发布未来可能为科研界提供新的机会,但它面临着日益激烈的行业竞争。在过去几个月里,多家公司推出了基于AlphaFold3的开源蛋白质结构预测工具,例如百度、字节跳动以及美国初创公司Chai Discovery都推出了自己的AlphaFold3灵感模型。但是,美国哥伦比亚大学计算生物学家Mohammed AlQuraishi指出,与AlphaFold3一样,这些模型都未获得商业使用许可,例如药物研发领域。
另一家美国公司Ligo Biosciences发布了AlphaFold3的无限制版本。然而,其模型尚未具备完整功能,包括模拟药物-蛋白质相互作用的能力。
与此同时,AlQuraishi希望在今年年底前推出一个名为OpenFold3的完全开源模型。这将使制药公司能够重新训练自己的模型版本使用专有数据(例如与不同药物结合的蛋白质结构),从而潜在地提高性能。
此外,在过去一年里,许多公司发布了新的生物学AI模型,并且在开放性方面采取了不同做法。美国威斯康星大学麦迪逊分校的计算生物学家Anthony Gitter表示,他并不反对盈利性公司进入其研究领域,只要他们在期刊或预印本服务器上分享研究成果时,遵守与其他科学家相同的规则。
DeepMind 科学人工智能主管 Pushmeet Kohli 表示,多个AlphaFold3的复制版本已经出现,表明该模型即使没有开源代码也是可复制的。他补充说,未来他希望在学术和企业研究人员日益增多的领域,看到更多有关出版规范的讨论。
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。