作者:田瑞颖 来源:科学网微信公众号 发布时间:2025/5/3 20:12:09
选择字号:
Nature揭秘21世纪最高引论文Top25,结果出人意料

 

编译|田瑞颖

《自然》近日揭晓了21世纪被引用次数最多的25篇论文。令人意外的是,mRNA疫苗、CRISPR基因编辑、希格斯玻色子的发现等重大突破性成果均未进入榜单。

真正入榜的,反而是涉及人工智能(AI)、提升研究质量的系统性方法、癌症统计以及科研软件等研究的论文。不过,2010年诺贝尔物理学奖得主关于石墨烯实验的开创性论文也跻身榜单。

美国密歇根大学社会学家Misha Teplitskiy指出:“科学家虽重视理论及实证发现,但在实践中,方法类论文会被更频繁地引用。”

此项排名中,位于榜首的是微软2016年发表的关于残差网络(ResNet)的研究。值得注意的是,引用榜单前10名中,有6篇论文都与AI相关。

  ?

21世纪被引用最多的十篇论文图源:《自然》

AI的崛起

《自然》选择了涵盖21世纪上千万篇论文的五个数据库,并依据它们的中位数排名进行分析。

结果显示,被引用次数最高的论文,是微软2016年发表的关于ResNet的研究。该技术解决了深层神经网络信号衰减问题,为AlphaGo、AlphaFold和ChatGPT等AI突破奠定基础。

“在此之前,深度学习并没有那么深刻。”该论文的作者之一、麻省理工学院副教授何恺明说。

但对于微软的这篇论文是否为最高引用,目前尚存不同看法。谷歌学术显示其引用25.4万次,排名第二;而Web of Science记录为10万次,排名第三。

微软的这篇论文不仅仅是21世纪所发论文中的热门。根据《自然》另一项分析,它也位列历史上被引用次数最多的前十篇论文之中。

值得注意的是,21世纪高引用论文前十名中,AI相关研究就有6篇。除ResNet外,还包括:2012年引发深度学习革命的AlexNet论文;2017年提出Transformer架构的“Attention Is All You Need”,该技术成为大语言模型的核心;2001年提出的机器学习算法“随机森林”,因其开源、易用性被广泛引用。

2023年图灵奖得主、多伦多大学计算机学家Geoff Hinton指出,AI论文在引用竞争中具有天然优势。他表示,AI领域的论文与大量领域有关,并在21世纪取得了极快的进步和大量的论文。

就在去年,Hinton因其在AI方面的工作获得了诺贝尔物理学奖。许多人将深度学习革命归功于Hinton合著的这篇AlexNet论文。

实际上,关于AI相关论文的引用量可能比统计的更多。这是因为许多AI论文在正式同行评审之前会作为预印本发布,这使它们的引用次数统计变得复杂化。大多数商业数据库要么不跟踪预印本,要么不尝试将其引用与最终同行评审文章的引用合并。

荷兰莱顿大学退休的科学计量学家Paul Wouters表示,随着引用预印本变得越来越普遍,数据库可能需要采用新的惯例来汇总这些引用。

受欢迎的科研工具

排名第二的论文也并非偶然上榜,因为它明确地给研究人员提供了一些有价值的内容。

这篇论文是制药科学家Thomas Schmittgen在2001年提出的qPCR数据分析方法,它解决了技术手册无法被引用的问题,累计引用超16万次。

这篇论文的诞生有些趣味性。起初,Schmittgen提交了一篇论文,包括来自定量PCR技术的数据,该技术允许研究人员量化样品中的DNA量。为了分析数据,他使用了技术手册中的计算公式。

但一位审稿人表示:“你不能在论文中引用用户手册。”因此,Schmittgen联系了公式的创建者,共同发表了一篇可以引用的论文。

这篇论文的确很受欢迎,因为其公式为生物学家提供了一种简单的方法来计算基因活性在不同条件下的变化,例如在药物治疗前后。

榜单中其他高被引科研工具,还有晶体结构分析软件SHELX,排名第5;基因表达分析工具DESeq2,排名第18;Python机器学习库scikit-learn,排名第15。

SHELX的论文由已故的英国化学家George Sheldrick所写,主要用于分析X射线穿过分子晶体后的散射模式,以揭示分子的原子结构。

“我的工作是教化学,写这些程序是我业余时间的爱好。”Sheldrick曾经如此表示。根据所查询的数据库,该论文目前被引次数在7万至9万次。

需要注意的是,科学家使用和引用最具影响力的程序之一——R编码软件本身,却未出现在榜单上。OpenAlex显示,已有超过30万次引用指向R编码软件,但其他数据库均未记录。

这可能是因为R的开发者建议用户引用一个网站,该网站是软件所在的存储库,但开发者从未写过一篇关于它的正式论文。

这个例子显示了引用文化和记录有多么反复无常。德国马克斯·普朗克固体研究所的科学计量学家Robin Haunschild建议:“如果你写了一个有影响力的程序,一定要发表正式的论文,这是提高学术可见性的第一课。”

癌症与健康研究

21世纪最高引用论文中,包含三篇癌症论文,它们常出现在癌症研究论文的引言部分。

其中两篇是GLOBOCAN 2018年和2020年的报告,这是世界卫生组织每一两年跟踪全球癌症统计数据的项目,这两篇论文引用排名分别是第九、第十。

这些论文的主要作者、法国里昂国际癌症研究机构的癌症流行病学家Freddie Bray说,GLOBOCAN数据被需要提供特定癌症类型发病率或死亡率的研究人员、倡导者和决策者使用。

第三篇癌症论文试图将癌症的复杂性提炼为肿瘤中常见的关键特征。论文作者、瑞士洛桑路德维希癌症研究所研究员Douglas Hanahan表示,这些“癌症特征”帮助界定了整个研究领域。

Hanahan说,很多学生告诉他,自己因为这篇综述而学习癌症研究,“我感觉自己像个摇滚明星。”

位列榜单第四的论文被誉为“精神病学圣经”,是2013年发布的《精神障碍诊断与统计手册》第五版(DSM-5)。它描述了包括成瘾症和抑郁症在内的精神障碍分类和诊断的标准,被世界各地的研究人员和卫生专业人员广泛使用。

提升研究质量的指南

榜单中排名第三的,是关于“主题分析法”的论文,这是一篇意外成为现象级文献的论文。作者原本旨在为学生提供定性研究方法指南,却因清晰的操作框架被全球学者采用。

多年来,心理学家Virginia Braun和Victoria Clarke一直试图教学生“主题分析”,这是一种定性研究方法。她们发现,这种方法的定义和描述都很差。为此,她们写了一篇面向学生的可读性强的论文,不仅解释了“主题分析”,还包括一份做好主题分析的标准清单。

论文发表后,研究人员开始引用这篇论文中的主题分析方法,这使其引用次数飙升。这篇论文也改变了作者们的生活,她们的大部分工作转向了主题分析,并收到来自世界各地的会议邀请。

榜单中类似该案例的论文还有几个,比如系统评价报告规范PRISMA、元分析异质性统计量。

综述的兴起

21世纪高引用论文榜单还反映了一个趋势,就是系统综述和元分析的兴起。

在系统综述中,研究人员会综合所有能回答特定问题的严谨研究,例如通过整合多项临床试验数据来判断某种药物的疗效。这类研究通常包括元分析,即对数值结果进行整合的统计技术。

加拿大渥太华医院研究所临床流行病学家David Moher和其他科学家发现,许多系统评价“报告质量低劣”。这些研究往往缺乏关键细节,例如临床试验受试者的具体特征或所使用的药物剂量。

2009年,Moher等人发表PRISMA声明来解决这些问题。该论文提供了一份包含27项报告标准的清单,为相关研究确立了规范框架。

PRISMA迅速成为报告清单的标配,目前位于引用榜单的第11位。随着系统综述数量的激增,研究人员开始普遍引用该论文,以证明他们遵循了严谨方法。

研究表明,使用PRISMA标准确实提高了系统评价报告的质量。但Moher也承认,一些作者存在“钻制度空子”的行为,他们虽然引用了标准清单,但实际上并未遵循其规范要求。

另一种方法随着元分析的发展而跻身高引用榜单。大约2000年,统计学家Julian Higgins和他的同事,开始开发一种能量化元分析中各研究结果一致性的方法。例如,验证某种研究药在不同人群中的效果是否一致。这种统计方法能预示药物或其他干预措施在不同情境应用时的可能疗效。

该团队设计的改进统计量的论文被高度引用。部分原因是它被纳入了《Cochrane干预措施系统综述手册》——此类研究的权威指南。

但现任英国布里斯托大学证据合成专家的Higgins表示,他看到作者引用了该论文,但错误解读了这个统计量。“这在很多方面都令人遗憾。被引用非常欣慰,但当他们误解你的研究初衷时,却令人尴尬。”

相关参考信息:

https://doi.org/10.1038/d41586-025-01125-9

 
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
研究者为蔷薇属物种演化机制提供了新见解 科学家在AI模型中内置“防火墙”
探秘繁殖密码:铺就葡萄育种“黄金路线” 地球“极客”勇探火星
>>更多
 
一周新闻排行
 
编辑部推荐博文