|
迈向下一代数据驱动的科学 |
国际数据委员会2019年学术大会在京召开 |
|
在联合国公布的17项可持续发展目标的169个具体指标中,39%的指标虽有方法论和路线图,但缺少数据依据帮助落实;16%的指标既缺少方法又缺少数据。中国科学院院士郭华东在国际数据委员会(CODATA)2019年学术大会上,分享了这样一组数据。
“大数据对实现可持续发展目标至关重要,而良好的数据共享机制可以把全世界的科研人员凝聚在一起”。郭华东说。
9月19日至20日,国际数据委员会(CODATA)2019年学术大会在京召开。本次大会围绕“迈向下一代数据驱动的科学:政策、实践与平台”这一主题,学者们针对数据基础设施能力建设,数据开放的政策和实践、数据驱动科学发现的案例等,展开了研讨交流。
“随着科学研究进入大数据时代,世界各国对科学数据的重视达到了前所未有的高度。”CODATA中国委员会副主席、中国科学院计算机网络信息中心主任廖方宇说。2018年3月国务院办公厅发布了《科学数据管理办法》。2019年6月,科技部、财政部在前期科学数据工作的基础上,在高能物理、基因组、气象、地震海洋等领域组建了20个国家科学数据中心,其中11个国家科学数据中心是依托中国科学院高水平研究所建立的,中科院计算机网络信息中心承担了国家基础学科公共科学数据中心和中国科学院科学数据总中心的建设、运行和服务职责。
中国科学院副院长、中国科学院院士李树深指出,科学数据的丰富度、关联性与开放性,将成为21世纪驱动科技创新的核心要素。继“观察实验”、“理论分析”、“计算模拟”之后,“大数据驱动科学发现”已成为科学研究的第四范式。
中国科学院作为国家自然科学最高学术机构,历来重视科学数据的管理与应用。上世纪80年代中科院启动了科学数据库建设项目,并从“十五”开始通过中科院信息化发展专项全面提升科学数据资源高效汇聚、集成管理和深度应用服务。发展至今,已形成了以国家重大科技基础设施、野外台站监测网络、大型观测实验平台等为代表的空天地海立体化科学数据生产网络。打造出的以“中国科技云”为代表的新一代科学数据基础设施平台,可为EB级科学数据提供传输、存储、分析、处理的一体化云服务,可开放共享的数据量已达到数十PB;部署的物质科学、天文学、空间科学、海洋科学、生态系统、地球环境等领域的学科数据应用平台,在重大科学发现及决策支持中发挥了重要的作用。
CODATA主席Barend Mons在讲话中提到,科学数据的发展机遇与挑战并存。随着海量且多样化的科学数据不断产生,机器智能化处理和使用数据的能力亟待提升,机器学习和人工智能等新技术将发挥越来越重要的作用。除了技术问题,人为因素也起关键作用。欧洲建立“欧洲开放科学云”过程中遇到了数十个瓶颈问题,大部分涉及到人与人之间的协作和制度建设。其中最重要的是通过建立协议来突破地域限制、促进数据融合。
CODATA执行委员、英国公共卫生机构研究院教授Virginia Murray说:“我们希望促进国家和地区各个层面上有关数据和实际的资料的收集、分析、管理、使用,并确保它能够考虑到不同用户的不同需求。”
科技部国家科技基础条件平台中心主任苏靖表示,期望通过中外科学家的不懈努力,进一步推动全球范围内更加广泛的科学数据开放与合作交流,助力更多具有世界领先水平的重大科学发现和原创性的技术突破,推动全世界科技创新能力和经济社会的发展。
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。