作者:陈正 来源: 中国科学报 发布时间:2025-4-18
选择字号:
AI科学家与后 AI 时代科研

 

■陈正

科学家和“co学家”的思想碰撞

去年《自然-生物技术》有一篇小文章很有意思,题目是“It takes two to think”。这篇文章的意思简单直白,即一个人的苦思容易走进死胡同,而太多人的讨论又容易人云亦云,最合适的就是两个人的思想碰撞,从而引爆科学突破。

在科学界竞争多于合作的今天,找到一位能和自己随意讨论的科学家同伴并不容易。如果找不到合适的同伴,那么是否可以寻求“无所不能”的AI呢?当然可以,思想碰撞,也可能是发生于一位科学家和另一个“co学家”之间。

这一个“co学家”全名“coscientist”。这个AI科学家智能体的概念于2023年被提出,近期谷歌团队又将其进一步完善,让它模仿科学家的思考方式,分析已发表的论文和数据库,综合结果,形成假设,并提出下一步的实验设计。

更重要的是,科学家可以和“co学家”互动,提出初始想法,或者对“co学家”的建议进行反馈,最后形成之前所没有考虑到的假设。试用过的科学家对其能力感到震惊,一度怀疑“co学家”是不是作弊偷考题了。

训练AI科学家最缺语料

一个好用的AI智能体需要四个要素——算力、算法、语料和决策。算力的发展带来了ChatGPT,算法的突破带来了DeepSeek,而决策的百花齐放则带来了Manus等智能体。

训练AI科学家智能体最缺语料。训练一个研究生从读文献开始,训练AI科学家智能体也差不多。AI科学家需要的语料不仅仅是课本上的老知识,更重要的是科学论文中的新知识。科研论文具体统一的格式、严格的论证、全方位的覆盖、专业人士的评估、持续不断的更新……毫无疑问是非常好的AI训练语料。

理论上,新的论文不断产生,训练AI科学家智能体的语料永不枯竭。但是随着我们越来越认识到语料对于训练AI的重要性,开始出现了一个奇怪的局面,就是越来越多的知识、数据被各种机构“圈养”,从而不能被使用。于是,一方面,公有语料因为高度重复而价值下降;另一方面,私有数据被各自的“护城河”保护而束之高阁。

有人认为阻碍科学论文成为AI训练语料的主要因素是付费墙,这观点也对,也不对。当科学家把论文提交给期刊,并通过同行评议得以发表之后,期刊会组织人员对论文进行编辑,从而拥有了编辑后的论文版权。其他人如果要阅读这篇论文,需要支付给出版社相当高的费用。

我认为,Perplexity是目前最好用的、AI幻觉最少的科学问答AI,当它回答科学问题时,会列出真实科学文献作为佐证。然而,为了绕过付费墙,这些论文基本上都是开放获取的,即作者付费、读者免费使用的论文。

具有讽刺意义的是,这里面有大量MDPI和Frontiers旗下的期刊论文。被认为是掠夺性期刊大本营的两家杂志社,居然成为AI时代的香饽饽。而当年为了毕业不得不在这些期刊中“灌水”的学生们,也没有想到自己的论文真真切切地推动了科学发展吧?

事实上,出版社垄断的并不是论文,确切说,出版社垄断的只是编辑后的论文。这就好比科学工作者们辛苦炒好了菜后,出版社拿到菜,挑了最好吃的一批,撒上葱花,从而拥有了版权。没有葱花的论文可以自由分发,但撒了葱花的论文就不行了。

2022年,我们就成为了世界第一论文发表大国,与此同时,我们却是一个论文版权小国。我们贡献了大量论文,却读不起科研论文,更不要说用科学家发表的论文训练AI科学家。因为这些语料的限制,像诞生DeepSeek这样的“超车时刻”,在很长一段时间可能会很难发生在中国的AI科学家智能体上。

这也不是我们独家的问题,全世界的科学家都苦期刊久矣,甚至开始有组织地拒绝为某些期刊审稿。

重塑科学交流体系

为了解决付费墙的问题,出版社提倡开放获取,但让作者付费的开放获取加重了发表者的负担,也使得缺少经费的课题组更难发表成果。科学家们则搭建了各种类型的预印本平台,这些预印本平台接收未经同行评议的论文,上传即公开,可以第一时间分享科研成果;但缺少了同行评议,使得其部分论文粗制滥造。

显然,不管是开放获取还是预印本都不够完美。

现在基于期刊的论文发表模式是百年前的产物,近20年来,我们的信息交流方式早已从单纯纸媒快速转变成基于文字、图片、影像等的交流方式。在技术浪潮下,期刊终将消亡,现在的问题是:未来的知识,将以什么方式沉淀,又由什么方式流通?

AI的发展或许是重塑现有论文发表和交流方式的机遇。

论文发表最重要的节点是同行评议,审稿人一般需要通过四个维度评估论文:方法可靠性、内容可读性、结果创新性和影响力。前两个维度,代表了一篇科学论文的最低标准,如果没有达到即不能发表,在这两个维度上,AI的表现已经和人类相当,甚至超出了人类,完全可以替代部分审稿人的工作。

后两个维度,代表了不同期刊的标准,顶级期刊往往要求非常高的创新性和影响力。也有期刊反其道而行之,不要求评审人对创新性和影响力进行评估,比如Scientific Reports和Peer J。这些新型期刊有自己的理由:一项工作的创新性和影响力很难由少数几个评审人准确判断,应当交给时间和广大的科学共同体评判。

由于长时间形成的惯例,出版社和期刊主导了科研成果传播的同行评议。或许是时候成立一个国际性的科学组织重塑整个科学交流体系了,给没有“撒葱花”的论文搭建一个可以发光发热的平台。而作为世界论文发表大国、在新媒体领域蓬勃发展的国家,也是迫切希望建立新的科学评估体系的国家,中国必然在其中扮演重要角色。

(作者系西交利物浦大学副教授)

《中国科学报》 (2025-04-18 第4版 文化)
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
科学家发现植物新种:成都卫矛 另一颗行星存在生命的最有力证据
世界最快闪存在中国“破晓” 迄今最完整植物单细胞图谱问世
>>更多
 
一周新闻排行
 
编辑部推荐博文