|
|
美国公司FutureHouse推出AI科学“推理模型” |
|
随着人工智能(AI)工具重组科学工作流程,梦想着进行更系统转型的Sam Rodriques,于2023年在美国旧金山建立了他的初创公司FutureHouse。
该公司作为一家非营利机构,得到了前谷歌首席执行官Eric Schmidt的支持,其使命是利用AI技术加快科学进程,“培养”能够指挥从假设生成到论文制作整个研究流程的“AI科学家”。
现在,Rodriques团队朝着这个方向迈出了一步。近日,他们发布了第一个专门为科学任务设计的真正的“推理模型”——ether0。
ether0是一个专门为化学领域构建的大语言模型(LLM),它通过完成约50万个问题的测试进行学习。ether0可以根据简单的英文说明,给出满足一系列标准的类药物分子的配方。
ether0已开源,可公开使用。它加入了其他公司旨实现科学过程自动化的成果,比如谷歌和日本公司Sakana AI的成果。
与之前的专业模型不同,ether0通过自然语言跟踪“思路”,为AI的“黑匣子”提供了一个窗口,使它能够回答通常需要复杂推理解答的问题。尽管一些通用推理模型,如OpenAI o1,在标准化科学测试方面有进步,但在没有针对性训练的情况下,它们很难产生深入的见解。
德国耶拿大学的数字化学家Kevin Jablonka在试用ether0的预览版时发现该模型可以对未训练过的化学性质做出有意义的推断,“以前的模型无法做到”。
ether0是FutureHouse的最新成果。在过去一年里,该公司发布了“高级科学文献评论家”和“AI代理平台”。后者是基于LLM的工具,专为特定任务而设计。基于上述模型,5月,FutureHouse团队提出了一种治疗年龄相关性黄斑变性的心方法。
FutureHouse的研究人员从法国初创公司Mistral AI获得了相对较小的LLM,足够紧凑,可以在笔记本电脑上运行。他们发现,与其在化学教科书和论文的基础上训练模型,不如让它从考试中学习。为此,FutureHouse的化学工程师Andrew White汇编了45篇学术论文的实验室生成的化学结果,跟踪了分子溶解度和气味等特性,并将其转换为577790个可验证的问题。
研究人员训练了7个版本的模型,每个都试图解决一个子集的上述化学问题,回到正确可获得强化奖励。然后,研究人员将这些专业模型中的推理链合并为一个通才模型。在再次浏览完上述化学问题集后,他们得到了ether0。
该团队使用另一组问题对ether0的性能进行了评估,其中一些问题与训练集中的问题无关。ether0几乎在所有方面的表现都优其他前沿模型。对于某些问题类型,ether0的准确性是竞争对手的两倍多。
对于ether0其他科学家表示喜忧参半,它有自己的优势,当然存在问题。不过,Rodriques认为,将推理能力嵌入到专门的模型中,将使团队获得端到端的自动化科学方法,而不仅仅是化学方法。
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。