|
|
加速迈进科学智能2.0,“星河启智”帮助科学家当主角 |
|
“如果说科学智能1.0时代,少数AI科学家掌握相当的AI工程能力来获得阶段性成果,那么在科学智能2.0时代,要以领域科学家为中心,基于功能更强大、使用更便捷的AI基础设施和协作平台,让专注具体科学问题的领域科学家成为主角。”复旦大学特聘教授、上海科学智能研究院(以下简称上智院)院长、无限光年创始人漆远说道。
然而,当前这样的平台是欠缺的。为此,上海科学智能研究院联合复旦大学和无限光年,共同打造了星河启智(NovaInspire)科学智能开放平台(以下简称星河启智平台)。平台以科学家为中心,主打方便易上手,同时倡导开放合作,以社区模式链接各领域科学家与AI工程师。
7月26日,在2025世界人工智能大会星河启智·科学智能开放合作论坛上,星河启智平台正式发布,并响亮喊出了“加速科学新发现”的口号。
星河启智科学智能开放平台发布仪式。图片由复旦大学提供
?
科学家当主角
在采访时,漆远反复提到“让科学家当主角”,而这也是星河启智平台的使命所在。研发团队结合前期调研结果,赋予了这一平台诸多能力,旨在为科学家提供覆盖高价值科学数据、开源科学智能模型、面向科研领域的高效智算、干湿实验闭环、多智能体推理规划及多学科众研的全栈基础设施。
星河启智平台初期建成4万多个共12PB的科学数据,支持稳定训练,目前已吸引120多个实验团队入驻——文理医工几乎均涉及。
“数据来源包括两方面。”复旦大学人工智能创新与产业研究院副院长、上智院副院长程远介绍,“一部分是散布于不同数据库、论文中的公开数据,我们将这些数据总结归类进不同数据集中;另一部分是上智院、复旦大学及合作伙伴在研究中产生的特色数据,也会在平台上开源。”
以上智院与合作团队开展的小干扰RNA(siRNA)项目为例。在全球范围内,siRNA相关数据严重缺失,尤其是包含化学修饰的复杂结构数据,已成为制约核酸药物研发的关键瓶颈。通过融合大型语言模型和多智能体系统,辅以多智能体融合,研究团队实现从海量专利中自动化挖掘高质量siRNA数据的目标。而这些挖掘到的数据,也纳入了星河启智平台,供更多人使用。
同时,星河启智平台也在构建基于区块链的科学数据生态,通过设置合理的激励机制,鼓励更多科研人员分享科学数据,实现稀缺数据资产的可信采集、智能质控、协同共享,为科学智能提供大规模、高质量、权属明晰的数据。
多学科交叉众研社区则是团队针对交叉学科发展大趋势下的新尝试。“现在AI for Science的科研突破,往往出现在学科领域交叉的边界,这也可能是新的、重大科学发现可能发生的地方。”程远表示。
如果说传统的科学研究以一人一生一蛋白、一人一生一材料为特征,众研社区的目的则是把这些“一”所代表的长板汇总起来,组成互补协调的团队。
“如何让更多年轻科研人员有效组织起来,形成多学科交叉团队,进而完成一个重大的科研任务,是众研社区想解决的问题。”程远畅想未来,科学家在星河启智平台发布一个重大科学问题后,大模型可以迅速拆解该问题所囊括的子任务集合,进而将这些子任务发布在众研广场上,让对应领域的科学家、工程师“接单”。
此外,星河启智平台汇聚了多模态、多学科融合的科学智能模型,即便完全不懂AI的科研人员,可能快速“淘”到所需,“开箱即用”最新前沿模型。若科研人员想在平台基础上搭建新的大模型,高稳定、高效率的科学智能特色算力服务平台也可满足他们的需求。
“核心就是让科学家成为科学探索的主角,协作推进科学问题的解决。同时,用户也可以帮助我们进一步完善星河启智平台,使得垂直领域的大模型做得更好。”漆远表示,“目前我们在气象、材料、能源、医药等领域取得了系列成果,下一步将继续探索经济、金融等领域的合作攻关模式。”
已服务于多个场景
论坛现场,作为使用星河启智平台的首批用户,中国科学院院士、复旦大学附属中山医院心内科主任、上海心血管病研究所所长葛均波进行了分享。
在AI赋能医疗的浪潮中,如何打开“黑箱”,让诊断过程透明化,一直是核心挑战。复旦大学附属中山医院联合上智院共同研发的国内首个深耕心血管专科的医疗大模型“观心大模型”给出了答案。
在星河启智平台的支撑下,医疗AI不仅是识别工具,也是临床思维的“决策伙伴”。一旦临床医生定义了诊断任务,“观心大模型”系统后台的“大脑”便会立即接管,将复杂的医学问题无缝转化为一系列精密的自动化动作。例如,它会指派“病史分析智能体”梳理文本病历,同时调度“ECG智能体”精析心电波形,最终系统会将所有智能体的发现连同证据链进行整合,生成一份具备完整溯源路径的综合诊断报告。
值得一提的是,每一个结论都能清晰地追溯到其背后的数据来源和分析智能体,从而将传统AI的“黑箱”转变为一个逻辑清晰、过程透明的“玻璃盒”。这不仅极大地提升了诊断的自动化水平,更通过机制上的设计,解决了AI在医疗领域最关键的信任问题。
在临床诊断中崭露头角的同时,星河启智平台也吸引来了有些“抽象”的研究项目。
西湖大学吴泰霖团队使用小波变换和扩散模型开发了新型AI算法,星河启智平台部署该技术后,用户可以高效、准确地进行环境变化预测、超分辨率模拟以及主动干预控制,如高精度气象预报或污染治理方案设计。同时,通过平台上的统一接口,科研机构和企业能更便捷地获取该模型,加速实际问题解决进程,提升平台生态整体吸引力。
此外,组合生成式逆向设计、催化材料预测及设计大模型、基于肠道的抗衰老靶标发现、MolPilot AI计算化学家等创新项目,都已部署至星河启智平台的不同板块,进而让更多用户受益。
“迄今已经有12个科学领域、40多家科研机构、200多个多模态科学智能模型加入星河启智平台,它们一起构成了科学智能模型万能仓。”漆远说道,“其他研究人员也可以根据需要,对这些智能体进行组合,用于科研中。”
从加速科学发现到推动新突破
当前,AI毫无疑问可以加速科学发现。漆远列举了团队与北京大学合作开展的面向科学智能的大规模组合优化高效求解系统的研究。
大规模组合优化问题是推动科学前沿突破的核心共性挑战之一,普遍存在于新材料研发、药物发现、集成电路设计等领域。这类问题通常需要在大规模组合空间中进行高效搜索,计算复杂度呈指数级增长。依托星河启智平台高稳定、高效率的科学智能特色算力服务,北京大学杨耀东领衔的RL4Math研究组在“面向科学智能的大规模组合优化高效求解系统”课题中最终提升了2-3倍的搜索效率,累计节省超10万GPU卡时,为跨学科智能计算提供了可推广的高效范式。
在漆远看来,步入科学智能2.0时代,AI不仅可以加速科学发现,也有可能产生全新的“想法”,再由人来推理验证。“我与合作者正在开展的一项研究,猜想就是来源于AI。我们其实都不是这个领域的,在AI的帮助下有了新突破,从这个角度来说,是AI在推着我们往前走。”
漆远同时强调,从以预训练为特点的科学智能1.0时代迈向注重推理的2.0时代,核心在于将推理本身和大模型相结合。“除了进一步提升数据质量及已有的减少幻觉的方法,将大模型技术和人类专家的知识相联系,以专业知识‘纠错’提升推理水平十分重要。”
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。