作者:丁佳 来源: 中国科学报 发布时间:2020/8/4 9:05:27
选择字号:
“计算”未来
——走进计算机体系结构国家重点实验室

中国工程院院士、计算机体系结构国家重点实验室主任孙凝晖  杨天鹏摄


计算机体系结构国家重点实验室常务副主任李晓维(右)在检查硬件安全设计。


中国开放指令生态联盟成立。


“寒武纪”芯片

 

■本报记者 丁佳

最近几年,中国工程院院士、中国科学院计算技术研究所所长孙凝晖觉得自己的脾气明显变急了。“计算所历史上做得很不错,我站在巨人的肩膀上,本来也能舒舒服服过日子。可现在,经常走廊那头的同事都能听到我发火。”

嘴上的急源于心里的急。除了所长,孙凝晖还兼任计算机体系结构国家重点实验室的主任。他很清楚,中国计算机产业很大,但要真正变强,是路漫且艰的。而作为我国在计算机体系结构方向的首个“国字号”实验室,计算机体系结构国家重点实验室从诞生之初,就承担着将中国计算机产业做强的历史重任。

“我们不会做那种只有一两个用户的技术,也不会去做改良式的创新,这些都不是国家重点实验室的使命。要做,我们就要做对产业有深远影响的工作,国家重点实验室要成为技术创新的源头。”孙凝晖说。

如何续写“高光时刻”

计算机体系结构可以说是中国科学院计算技术研究所(以下简称计算所)的立所之本。从参与成立我国第一个计算机体系结构小组,先后研制成功我国首台通用数字电子计算机、“两弹一星”功勋机109丙机至今,计算所在体系结构前沿基础研究、高端计算和微体系结构核心技术攻关、高性能计算机和微处理器产业化中发挥了重要作用,也逐步培养起一支产学研全链条贯通的创新团队。

“从计算所的发展历史看,刚建所的30年是我们的‘高光时刻’,体系结构是我们立所的一个学科方向,但在长达半个世纪的时间里,我们都没有重点实验室。这说明我们做的工作里,原创的东西是不够的。”孙凝晖坦言,“如果我们缺乏原创的东西,就会掉入‘科技山寨’‘科技克隆’的陷阱。”

“当你跑到一定程度,想再往前跑,想学别人已经没得可学了,怎么办?”计算所人扪心自问。

随着摩尔定律的放缓,计算机和处理器的发展在可靠设计、性能优化、低功耗设计等方面面临越来越严峻的挑战,世界各国都在争取原理上的创新。而我国这方面的研究分散在通信、物理、生物等各个学科,而且大多是从器件层次上着手,缺乏从体系结构层次的整体考虑。另一方面,核心芯片研制能力弱也是我国信息产业的短板,处理器、系统软件等核心技术被个别发达国家控制,导致我国企业在国际产业链中核心竞争力弱、缺乏话语权。

无论是自身前进的动力,还是国家发展的需要,都意味着计算所这支信息技术领域的“国家队”不能再躺在功劳簿上睡大觉。

他们必须向改革要明天!

2006年,中科院计算机系统结构重点实验室成立;2011年,该实验室获批“升格”。至此,带着计算所在体系结构领域近50年深厚的科研积累,我国计算机系统结构领域的首个国家重点实验室——计算机体系结构国家重点实验室应运而生。

“计算机体系结构属于计算机学科的‘重工业’,成果不仅停留在发表论文,更应高度重视技术发明和原型系统,通过技术转移和技术应用,服务于国家重大需求,引领产业技术发展。”孙凝晖说。

所以,这支既年轻又资深的队伍,面临的头等大事,就是如何用好国家重点实验室这块“金字招牌”,将中国计算机系统的研发水平再推上一个新的高度。

系统思维铸就“团魂”

计算机体系结构国家重点实验室成立之初,设立了高端计算体系结构、微体系结构、编译与编程、超大规模集成电路与容错计算,以及非传统体系结构等5个研究方向。

“这5个研究方向的确定有一定的机缘,源于我们有一段时间的反思。”计算机体系结构国家重点实验室常务副主任、计算所研究员李晓维说,“这几个方向,前四个方向涵盖了计算所60年的历史积累,第五个方向则是对领域未来发展的一种把握。我们想通过这种设置,开展基础性、前沿性的研究,为学科可持续发展更好地贡献力量。”

以李晓维所从事的测试与容错计算为例,芯片的研制很难一次成功,出现问题时就要进行故障诊断,其中最关键的就是定位精度。而一个动辄几十亿个晶体管的芯片出了故障,究竟是定位到10万个晶体管的范围,还是定位到50个晶体管的范围,后续的工作量有数量级的差距,直接决定着芯片的研发速度。

此前,精确的芯片故障诊断技术主要由三家国外公司掌握,前段时间,这些公司先后宣布对中国某企业实施封锁,导致该企业遇到了难题,该企业找到了计算机体系结构国家重点实验室寻求帮助。

幸运的是,他们找对了人。李晓维团队在故障诊断领域有着长期的积累,技术虽然没有商业化,但在实验室的支持下,他们一直在不断地精进,目前定位精度已经达到国际公开报道的最高水平,一举让企业突破了瓶颈。

这个“备胎一夜转正”的故事让李晓维深刻地感受到国家重点实验室体制的优势。“如果是遇到了问题再从零开始,那我们肯定做不到现在这样。但实验室始终面向世界科技前沿、面向国家战略需求做事,所以才能持续支持我们这个团队。”

在计算机体系结构国家重点实验室副主任、计算所研究员冯晓兵看来,有了国家重点实验室,原先不同的课题组“各人自扫门前雪”的问题就不存在了,大家可以真正把目光放长远,从顶层设计入手,成体系地去做一些科研上的合作。“原来主要是你跟谁比较熟,就合作多,现在都在一个实验室,大家平时的交流多了,能够在更高层面上发现科学问题,一些工作就能够更早地开展合作。”

在计算机体系结构国家重点实验室工作,这样的系统思维是必不可少的。实际上,这也正是孙凝晖作为实验室主任所期望看到的。在他的构想中,国家重点实验室理应为国家构建一个完整的技术体系。

“原来我们是‘1+1’模式,一项技术或者一个设备,加上一个公司,就成了,过去计算所已经把这个模式做透了。可是有了国家重点实验室,我们的使命就不一样了,我们要去探索‘n+m’模式,也就是用实验室成系列的n个技术,去联合m家高科技企业,共同构建中国未来信息基础设施的技术体系。只有这样,我们才能真正把技术演进的主导权掌握在自己手里,才能在国际竞争中立于不败之地。”他说。

青年才俊“分兵把守”

在计算机体系结构国家重点实验室,除了“大牛”,还有不少“网红”,计算所研究员陈云霁就是一个。他与弟弟陈天石研制了国际上首个深度学习处理器芯片——“寒武纪”,被《科学》杂志评价为该方向的“先驱”和“领导者”。

退回几年前,陈云霁只是一个初出茅庐的“毛头小子”,这个“80后”当时想做人工智能与芯片设计的交叉研究,但他也没想清楚,这个交叉研究到底能“叉”出些什么东西来。

“当时这还是一个全新的方向,在国际学术界是不太受到认可的,也基本上没有相关的论文,申请科研经费更是不容易。”陈云霁说。

他非常理解,如果仅仅从KPI(关键绩效指标)的角度考虑,没有一个实验室会支持他做这样的事,毕竟他在做的事“既不能产钱,也不能产论文”。

但计算机体系结构国家重点实验室偏偏支持了。在“种子”阶段,年轻人申请不到课题,实验室就从运行经费里拿出钱来,支持他们开展探索性的研究;孙凝晖还带着陈云霁去各个相关单位争取相关资源,就这样一步步帮着他发展起来。国家重点实验室的研究还吸引了Olivier Temam等国外学者的参与,拓展了陈云霁等人的国际视野。

在开始的五六年里,陈云霁的成果的确不多,可是,厚积终于迎来了薄发——2020年6月2日,陈天石创立的寒武纪公司在科创板上市的申请得到批准,成为中国人工智能芯片的第一股。如今的“寒武纪”,已经从昔日的“非主流”,成长为全球智能芯片领域的先行者。

“我们实验室选择支持什么样的课题,一是看科研人员发自内心的驱动,再由实验室领导去判断它的长远价值,而并不是看国家有没有立项,或者是不是国际热点,不是跟着这样任何一个指挥棒。”陈云霁感慨,“只有在这种宽松的土壤里,才可能有‘寒武纪’的诞生。”

“计算机科学本身就是一个年轻的学科,所以我们也派年轻人去分兵把守,每人把守一个重要的路口。”孙凝晖坦言,计算机体系结构国家重点实验室自成立之日,就把“宝”押在年轻人身上,先后重用了一批像陈云霁这样的年轻人,也先后冒出了寒武纪芯片、开源芯片、高通量芯片、工业互联网芯片等有前景的新方向。

2017年,刚刚成立数年的计算机体系结构国家重点实验室参加了首次评估,就获得了“优秀”的好成绩,更成为近20年来信息领域唯一一家首次评估就获得优秀的实验室。

“做科研有时候就像打仗,讲究体系化作战。国家重点实验室不是一个步兵连,而是一个‘混成旅’,既要有坦克营,又要有步兵连,更要有直升机团,这样我们才能集中力量办成大事。这就是我们国家重点实验室也是中科院最大的优势。”

正如孙凝晖所说的那样,未来,计算机体系结构国家重点实验室还将谱写新篇,不断点燃科技创新的星星之火,形成产业革命的燎原之势。

想要改变世界的年轻人

对于“一个国际顶尖实验室应该长什么样”这个问题,中科院计算所研究员、计算机体系结构国家重点实验室先进计算机系统研究中心主任包云岗曾经很认真地思考过。

最后,他得到的结论是“人”。

在国外做博士后的时候,包云岗接触过一些在一流实验室工作的人。在交流中他发现,这些人“上来就跟你讲,他们要做的是改变世界的东西。不管他们最后能不能做成,普遍都是有这种心气的”。

反观国内,“敢”去宣告自己要改变世界的科研人员并不多,大家相对来说还是比较保守。除了文化差异和自信心的问题外,包云岗觉得,来自组织的支持非常重要。

最近,包云岗就在做一件可能会改变世界的事——他想改变芯片研发领域的游戏规则。

“现在做芯片的门槛非常高,只有少数几家公司能做。未来物联网发展起来以后,每个领域都需要芯片,但并不是每个领域都需要那种非常尖端的芯片。所以我们需要把芯片设计的门槛降低几个数量级,让大量从业人员可以参与进来,这样才能够形成一个繁荣的生态系统。”

包云岗所说的,就是“开源芯片”的概念。

比如设计一个脑机接口的芯片,主要功能就是捕捉一些人的神经信号,然后进行一些处理。这种芯片规模很小,而且定制化程度很高,如果还用原来芯片开发的模式去做,既费时又费钱。如果用开源芯片去做,再加上敏捷开发的方式,一个很小的创业团队就能很快把原型芯片开发出来。

包云岗感到,正如开源软件支撑了整个互联网一样,开源芯片可能就是下一个重大机遇。“这个趋势可能会对芯片产业带来很大的冲击和影响,而且相信在未来的5~10年就会发生。”

最开始,包云岗带领一个小团队,做了一些开源芯片相关的工作。随着工作的深入,他对开源模式有可能改变现有芯片研发模式的预感愈加强烈。于是他向计算机体系结构国家重点实验室主任孙凝晖汇报这些想法。

孙凝晖很重视,让包云岗在国家重点实验室例会上给大家再讲一次,让实验室的科研人员都提提建议。例会上,大家提出了很多宝贵的建议,比如实验室常务副主任李晓维就建议充分发挥国家重点实验室的号召力,通过成立联盟的方式去推动开源芯片的发展。

“可以看到,我们国家重点实验室在战略方向的把握上,是有一套很好的决策机制的。对于新生事物,实验室领导层面能够接受,然后通过群策群力,把大家的观点、认识汇聚起来。”包云岗说。

经过几轮讨论,包云岗更加坚定了这个方向是值得去做的。于是他的整个团队都转而全身心地投入到开源芯片的研究中。

2018年11月,中国开放指令生态联盟在浙江乌镇召开的世界互联网大会上宣告成立,旨在推动建立世界共享的开源芯片生态。联盟吸引了几十家科研机构、大学、高科技企业及投资机构加盟,包云岗任联盟秘书长。

“目前在开源芯片这个领域,全世界范围内尚未形成定局,大家都有机会。”包云岗说,“对中国来说,这是一个机遇。面对这个机遇,我们国家重点实验室责无旁贷,要扛起这面旗帜。”

他盼望着,在不久的未来,越来越多的人可以通过开源模式做芯片,用开源芯片去改变世界。

丁佳

计算机体系结构国家重点实验室简介

计算机体系结构国家重点实验室于2011年10月13日经科技部批准建设,于2013年5月22日通过验收,在2017年国家重点实验室评估中获得“优秀”。实验室的依托单位是中国科学院计算技术研究所。

计算机体系结构国家重点实验室定位于计算机体系结构领域的应用基础研究,目标是立足于国际学科发展前沿,围绕国家信息领域对高端计算装备的重大需求,在高端计算体系结构、微体系结构、测试与容错计算、编译与编程研究方向保持国内领先水平,在非传统体系结构的某些关键领域取得国际引领性成果,在超并行计算机系统、高性能高可靠处理器相关领域服务于国家战略目标,为未来计算机系统的发展提供科学技术依据。

计算机体系结构国家重点实验室是国内计算机系统结构二级学科首家国家重点实验室,整体水平已进入体系结构学术研究世界一流之列。近年来,实验室围绕以数据为中心的新型体系结构和系统设计,在国际上率先开展了深度学习处理器、高通量计算的新方向研究,得到国际计算机体系结构界的广泛认同和跟随。

《中国科学报》 (2020-08-04 第4版 聚焦)
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
问答之间 | 如何开展科研之路 研究生学位论文如何顺利通过外审和答辩
“超级显微镜”,深度探索微观世界 《自然》一周论文导读
>>更多
 
一周新闻排行 一周新闻评论排行
 
编辑部推荐博文