作者:宗华 来源:中国科学报 发布时间:2016/5/18 9:38:52
选择字号:
新材料基本靠“算”
机器学习技术或将彻底改变材料科学发展方式

 

我们已从计算材料科学的手工时代进入工业化阶段。图片来源:NIK Spencer/Nature

这是迄今最令人讨厌视频的强劲竞争者:对一部一排排数字和符号不断向屏幕下方滚动的智能手机的特写。不过,当到访者在Nicola Marzari俯瞰日内瓦湖的办公室驻足时,他总是会迫不及待地炫耀这部手机。“它来自2010年。”Marzari介绍说,“这是一部可实时计算硅电子结构的手机。”

身为瑞士洛桑联邦理工学院(EPFL)物理学家的Marzari表示,即便回到当时,这部如今已经落伍的手机仅需要40秒,便能执行完在超级计算机上曾花费好多个小时的量子力学计算。这一壮举不仅证实了过去十多年间此类计算方法走了有远,还表明未来其在改变材料科学发展方式上拥有的潜力。

Marzari和志趣相投的研究人员并未采用老式方法研发新材料——凭借运气偶然发现它们,然后在实验室里不辞劳苦地测量其属性。相反,他们正利用计算机建模和机器学习技术产生数以万计的候选材料库。即便是来自失败试验的数据,也能提供有用的输入。很多候选材料完全是假设出来的,但工程师已开始列出因某种特定应用而值得合成和测试的候选名单。这是通过搜寻材料的预期性质实现的,比如它们作为导体或绝缘体将会表现如何、是否能起到磁体的作用以及能承受多少热量和压力。

美国加州大学伯克利分校材料学家、该领域先锋人物Gerbrand Ceder表示,希望在于这种方法将在发现材料的速度和效率上产生巨大飞跃。“我们可能只理解了现有材料1%的性质。”Ceder以磷酸铁锂为例介绍说,这是一种于上世纪30年代首次合成的化合物,但直到1996年才被公认为代替当代锂离子电池的颇有前景的材料。“此前,没有人想到要测量它的电压。”Ceder说。

遗传学的灵感

Ceder最早想到利用这种高通量、数据驱动的方法发现材料是在本世纪初。当时,他在麻省理工学院(MIT)工作,并且发现自己受到近乎完成的人类基因组计划的启发。“就其本身而言,人类基因组并非发现新疗法的秘方。”Ceder说,“但它为药物研发提供了数量惊人的基本定量信息。”于是,他在想,材料学家能否从遗传学家那里借鉴一些经验。他们能否鉴别出一个与生物学信息被编码在DNA碱基对中的方式相同的编码各种化合物属性的“材料基因组”?

如果是这样,Ceder推断,编码肯定存在于构成一种既有材料的原子和电子及其晶体结构中,即它们的空间排列方式。2003年,Ceder和团队首次证实了量子力学计算数据库如何帮助预测一种金属合金最有可能的晶体结构。对于任何从事新材料发明工作的人来说,这都是关键一步。

过去,这些计算冗长且困难。即便对于超级计算机来说也是如此。机器不得不完成大量的反复试验以发现“基态”:能量在最低限度上并且所有力处于平衡状态时的晶体结构和电子组态。不过,在2003年发表的论文中,Ceder团队描述了一种捷径。研究人员计算了一个小型二元合金(两种不同金属的混合物)库中普通晶体结构的能量,然后设计出一种机器学习算法。该算法能从库中提取模式,并推测一种新合金最有可能的基态。它运行得不错,使计算所需的时间大幅缩短。

“这篇论文引入了材料属性公共库以及利用数据挖掘填充缺失部分的想法。”同一年离开Ceder团队并在杜克大学开创了自己的实验室的Stefano Curtarolo表示。随后,该想法促成了两个独立项目的诞生。2006年,Ceder在MIT开启材料基因组计划,利用该算法的改进版本预测用于电动汽车电池的锂基材料。2010年,该计划发展到囊括了约两万种预测的化合物。

与此同时,Curtarolo在杜克大学成立材料基因组学中心,聚焦金属合金研究。和来自犹他州杨百翰大学以及以色列内盖夫核子研究中心的研究人员一道,他逐渐将2003年的算法和数据库扩展成AFLOW—— 一个能对已知晶体结构开展计算并自动预测新结构的系统。

材料基因组学

不过,直到2011年6月,计算材料科学才成为主流。当时,白宫宣布了投资数百万美元的“材料基因组计划”(MGI)。“当白宫里的人们熟悉了Ceder的工作时,他们非常兴奋。”美国国家标准与技术研究院材料学家、MGI执行秘书James Warren表示,“当时,大家普遍意识到,计算机模拟已经到了能对创新和制造业产生实际影响的时刻。更不用说‘基因组学’这个名字了。它会让人联想到一些宏伟的事情。”

自2011年起,该计划投资超过2.5亿美元,用于软件工具、旨在收集并报告实验数据的标准化方法、在重点高校建立的计算材料科学中心以及高校和商业界就特定应用研究开展的合作。不过,目前尚不明确这种慷慨真正对科学起到了多大的促进作用。“该计划促成了很多好事,但也产生了各种名头。”Ceder说,“一些团队开始将它们的研究冠上各种基因组学的名头,尽管两者几乎没有任何关联。”

不过,MGI明确做到的一件事情是,帮助Ceder和其他人意识到建立材料属性在线数据库的愿景。2011年年底,Ceder及其团队前成员Kristin Persson(在Persson于2008年搬到加州劳伦斯伯克利国家实验室后,两人继续就该项目进行合作)将他们的“材料基因组学计划”更名为“材料计划”。白宫要求他们放弃“基因组”的标签,以避免同国家计划混淆。第二年,Curtarolo公布了自己的数据库。它被称为AFLOWlib,基于Curtarolo在杜克大学研发的软件。2013年,西北大学材料研究人员Chris Wolverton启动“开放量子材料数据库”(OQMD)。“我们从‘材料计划’和AFLOWlib中借鉴了一些通用的概念。”Wolverton介绍说,“但软件和数据是自己的。”

在欧洲的扩张

与此同时,材料基因组学进入欧洲,尽管通常是以其他的名字出现。比如,瑞士创建了MARVEL。这是一个由研究机构组成、针对计算材料科学的网络,其中EPFL 为主导、Marzari为负责人。利用一个新的计算平台,Marzari正在创建一个名为“材料云”的数据库。他正利用该数据库搜寻二维材料,比如仅由单层原子或分子构成的石墨烯。此类材料可被用于从纳米级电子产品到生物医学设备的一切应用。为找到好的候选材料,Marzari正在让15余万种已知材料经历一个被他成为“计算剥离”的过程:计算出将一个单层从普通晶体表面分离需要多少能量。等到今年晚些时候该数据库准备公开发布时,他希望初步的运行将收获约1500种潜在二维材料。

而在几公里之外的锡永镇,计算化学家Berend Smit成立了另一个EPFL中心。该中心致力于研发用于预测上万种纳米多孔沸石和金属有机骨架材料的算法。随后,其他算法会挑出从化石燃料发电厂的烟道中吸收二氧化碳的最佳候选材料。

Smit的工作还证实,材料基因组学会带来坏消息。很多研究人员曾希望利用纳米多孔材料建立能在更小空间内储存更多甲烷的汽车油箱。不过,在筛选了65万余种通过计算得出的材料后,Smit团队认为,大多数最佳材料已被制造出来。新材料只能带来轻微的改善,而美国相关部门(打赌甲烷储备会出现重大技术改进)目前设置的能量目标可能并不现实。

无论如何,Marzari认为,“我们已从计算材料科学的手工时代进入工业化阶段”。“如今,我们能创建仿真装配链,让它们发挥作用,并且以全新的方法探究问题。”Marzari说。然而,目前还未有通过计算预测出来的材料出现在市场上。“让我们10年后再谈论这个问题。”芝加哥大学计算材料学家Giulia Galli表示,“我认为,到时会出现很多这种材料。”(宗华)

《中国科学报》 (2016-05-18 第3版 国际)
 
 打印  发E-mail给: 
    
 
以下评论只代表网友个人观点,不代表科学网观点。 
SSI ļʱ
相关新闻 相关论文

图片新闻
中国超重元素研究加速器装置刷新纪录 彩色油菜花又添7色!总花色达70种
考研复试,导师心仪这样的学生! 地球刚刚经历最热2月
>>更多
 
一周新闻排行 一周新闻评论排行
 
编辑部推荐博文
 
论坛推荐