2016年6月23日,国家自然科学基金委员会主任杨卫在Nature(《自然》)发表评论文章“Boost basic research in China(推进基础研究在中国发展)”(Nature 534, 467-469(2016))。现在此发布文章中文译文,同时转载英文原文。
杨卫在本评述中指出,提高科学研究质量,加强科研诚信建设,提升成果转化水平,将奠定中国经济长期增长的基础。
中国经济增长有赖于创新。开发新技术、提升效率、创造并践行新的知识,均有助于提振经济,服务社会。然而,中国近期的经济减速对国家创新方式提出了换挡的新要求。
过去几十年来,中国的科学研究主体多为短期或凝练技术的研发(R&D)。公共资金支持的大型项目投向有应用前景的或急需的领域,如研制飞机发动机、高速列车、太阳能电池以及新药设计,并期待其成果可在5-10年投入实用。如今,中国应以更长期和更宽广的视野,培育研发及其应用的基础科学根基。
基础研究是指创造科学知识与新技术的研究,这些知识与技术随后能够得以开发、转化和应用。在中国,对基础研究众说纷纭。一方面,基础研究取得了巨大的进步(见Nature 481, 420; 2012)。据Elsevier的Scopus数据库的统计,中国在全球研究论文中所占份额从1997年的2.5%跃增至2015年的18.8%;另一方面,对基础研究现况也存在批评性意见(见引文1及Nature 463, 142-143; 2010)。例如,有评论指出,在重数量轻质量的评价体系诱导下,中国的大学已经沦为论文工厂。中国科学研究的影响力仍然较低,以中国目前发表论文数领先于各国的化学领域为例,鲜有以中国学者名字命名的化学反应或工艺过程。另外,BioMed Central、Elsevier和Springer旗下的一些期刊在过去两年撤销了中国大陆学者的一批论文,这表明科研不端行为(包括代写论文和虚假评审)在中国依然多发。
与此同时,产业界人士和一些政府官员抱怨,许多基础学术研究(如纯数学或基础物理领域)与国家经济社会发展的需求缺少关联。2015年,科技进步对经济增长的贡献率在中国为55%,而美国在同一时期则高达88%。中国对基础研究的投入在其全部研发投入(包括公共部门、工业界和私人的投资)中占比较低,中国只有4.7%,而与之相比法国是24.1%,美国是17.6%,日本是12.6%。
提高基础研究的质量和诚信应成为中国推进国家创新步伐行动的重点。科研质量必须重于数量,而科研诚信是确保质量的最佳途径。技术开发的成功应用将证明对基础研究值得投入更多资源。作为国家支持基础科学研究的重要政府资助机构——中国国家自然科学基金委员会(以下简称基金委)的主任,我呼吁:今后要持续加强上述三个方面的努力,争取到2020年能有较大改观。
崛起中的科技大国
从各项指标来看,中国在全球科学排名榜中的位置都在迅速上升,无论是产出数量与质量、研发支出还是国际合作(见第452页)均为如此。例如,中国在高影响力科研工作(Scopus中按引文排名进入前0.1%的论文)方面的占比大幅急升,从1997年的不到1%增长到现在的20%(图1a)。
基金委成立于1986年,其预算从仅8000万人民币起步,到2016年预算规模已经扩大了300倍以上,国家财政拨款达到248亿人民币。2015年,科学基金参与资助了全部中国研究论文的62.1%或全球学术产出的11.5%。基金委的使命是成为科学家之“友”(FRIEND),即建设评审制度公正、绩效回报丰富、全球视野开阔、管理服务高效、资源总量宏大、资助谱系多样的卓越科学基金管理机构。
然而,抛开这些乐观的统计数字,中国的基础研究发展仍然不尽如人意。例如,迄今为止,从中国大陆仅诞生了一位诺贝尔科学奖获得者。以引文指标计算,中国的研究还滞后于许多其他国家——中国各学科归一化引文影响力指标(FWCI值)在2015年刚达到0.86,低于世界平均值(1.0)。
应该将提高中国科研质量的横杆置于最优先的地位 — 即达到引用率更高,突破性更大。换言之,中国需要整体性地提高基础研究的水平,并在全球科学地貌图上形成若干隆起的高地。
需要用科学界认可的度规来监测科研进展。目前的评价方法各式各样,适用范围各异,任何一种都难以兼顾中国广泛而多样化的学术领域与不同机构的评价要求。中国有一千多家具备基础研究能力的机构,各自有不同的侧重点;有一千多所大学,每所大学有着不同的研究与教学的混合配置。譬如,清华大学每年获得的研究资助总量近50亿元人民币,而一些地方院校每年拿到的研究经费仅有几百万元。以论文发表数量进行评价的方法,对于一个刚起步的每年在国际期刊仅发表10篇论文的研究机构可能很有效,但对于一个每年在各种期刊发表上万篇论文的巨型大学而言,则可能最终扭曲其学科配置。
因此,在实践中,机构必须自行决定其最重要的监测指标:是某个项目或个人发表了许多论文?是某项研究工作具有高影响力或得到高被引频次?是某个项目具有全球性重要意义?还是产生了重大科学突破?每个机构必须绘制与其历史、现状和未来目标相适应的评价方式演进。随着科研项目的水平提升或科研机构的发展升级,要不断重新衡量其评价需求。在研究机构管理健康的多数情况下,这种“软性”方式就能管用。但对于远离研究主流的机构而言,可能也需要暂时采取诸如奖励高质量论文等干预行为。
大学需要明智地开展评价,并明确评价目标(见D. Hicks等,Nature 520, 429-431; 2015)。中国科学院在这方面做出了表率。例如,十五年前,中国科学院首次在国内将引文指标引入评价体系,导致其高影响力研究工作呈现指数增长。三年前,中国科学院又要求其所属的104家研究所明确各自的前瞻布局,即一个研发定位、三个近期重大突破和五个重点培育方向。
然而,过于刚性的目标设计可能会妨碍研究的开展,或使研究偏离正轨。更多的机构认识到,在强调论文数量的压力下,研究人员不得不写大量进展有限的文章而非数量较少的精品论文。基于学术质量的评价可以避免这种情况,这种评价方法所注重的是国际认可、代表性工作和对本领域产生的影响。科学的长期发展必须与短期效益区别开来,前者可能缓慢却稳定,而后者缺乏可持续性。许多大学和研究机构目前正在降低短期绩效奖励的比例,对极端的例子,可从原来的70%降低到30%或更少。
另一个问题是如何合理分配基础研究资助经费。研究是应当解决社会的“重大挑战”问题,还是验证大胆的科学概念与假设?研究资源是应当集中使用,还是给许多研究人员合用或分享?答案之一是各方兼顾。例如,基金委将其70%的资金用于自由探索的基础研究,10%用于人才项目,20%用于应对科学挑战的重大研究项目和新的研究仪器设施。
今年晚些时候,教育部将谱写“双一流计划”的蓝图,旨在通过凝聚高水平团队等措施,推动中国大学和学科建设向国际一流标准看齐。尽管有关细节尚在研讨中,但对大学的评价标准可能会转向鼓励高质量科研与教学,例如,不是对许多达到平均水平的学科而是对少数顶尖学科进行支持,在目标上类似于英国的研究卓越框架。许多大学正在满怀期待地调整学科结构,重新配置顶尖研究队伍。
科研诚信建设
中国正走在通往科研诚信的漫漫征途2。由于其科学论文巨大体量等原因,美国被撤稿的论文数量仍然位居全球榜首(见retractionwatch网站)。随着中国论文数量快速攀升,被撤稿论文的数量亦在增加。中美两国在强化诚信方面的教育方式略有不同3。在中国,对科研不端行为的教育倾向于“非黑即白”模式——科学家要么成为道德楷模,要么被描绘为进入伦理深渊;而在美国,则是教师在课堂上同处于早期学术生涯的研究者讨论相关案例,重点分析处于学术不端与学术诚信之间的灰色地带。两国可以互相学习,取长补短。
以下因素加剧了在中国可能发生的科研不端行为2,3:研究队伍快速扩充而带来的竞争压力,科研评价标准的失当。以评价标准的影响为例:科研人员在国际期刊发表论文的需求,促使有人寻求语言写作服务或论文代写;量化评估还催生了对研究成果化整为零(称为萨拉米细分)的发表策略。其他因素还有动物权利等科研伦理要求的逐步严格,以及对诸如基因伦理和大数据伦理等伦理规范研究的不充分,等等。
过去十年,中国科学技术协会、教育部和基金委在科学界展开了一场声势浩大的反对学术不端运动,这场运动正在产生成效(见图:学术不端指控率下降)。大多数研究机构如今都有了相应的程序,用以处理疑似的或经证实的违反学术道德的行为;有的地方(如浙江大学,见Nature 481,134-136, 2012)开始推行了学术不端的“零容忍”政策。尽管采取了主动核查的措施,对不端行为的指控比例呈现下降趋势。项目申报和学位论文答辩等环节的文本相似度检查中发现的检出率也在减少。新一代研究人员的文化正在发生转变,对待学术不端的看法开始从“为何不骗”转向“不值得骗”。