作者:阎保平 孙九林 来源:中国科学报 发布时间:2014-3-10 11:13:05
选择字号:
第445次香山科学会议主题评述报告
阎保平 孙九林:数据密集时代的科研信息化

 
■中国科学院计算机网络信息中心 阎保平 中国科学院地理科学与资源研究所 孙九林
 

第445次香山科学会议会场
 
人类社会在经历了漫长的数千年农业社会以及数百余年的工业社会进程之后,开始迈入信息化社会,信息化在世界范围内得到迅猛发展,正在引发当今世界的深刻变革,重塑着世界政治、经济、社会、科技、文化和军事发展的新格局。在人类社会开始迈入信息化社会的同时,人类的科技活动也进入了前所未有的大发展时期,信息化的科学研究(e-Science),即“科研信息化”就是这一社会发展使然。科研信息化正在引发科学研究与工程技术的革命,改变和拓展了传统研究方法,催生了新的学科领域产生,提升了人类科技创新能力达到前所未有的水平,所产生的影响将超过人类史上的任何发明。今天,e-Science越来越被科技界所接受,欧美等发达国家将其立为国策,正在积极部署并实施自己的e-Science行动计划,以此作为下一轮全球科技实力竞争的“杀手锏”,提升国家的综合创新能力,应对信息社会的挑战。本文通过介绍科研信息化的提出背景、理念特点、发展趋势、国内外进展及技术与应用等,对某些问题展开讨论,以期引起科技界、科技管理部门和政府高层对“科研信息化”的关注。
 
“科研信息化”是推动信息社会发展的动力,也是现代科学技术发展的必由之路。从信息化和信息生产力的视角分析,科研信息化是当代科技发展的必然趋势。人类在经历了漫长的数千年农业社会以及数百余年的工业社会进程之后迈入信息化社会。纵观这一社会发展进程,“生产力”始终是推进人类社会发展的原动力。信息化社会的生产力是推动信息社会的知识/信息经济的建立与发展的“信息生产力”。科学技术是第一生产力,科学技术革命在推动了信息社会经济迅猛发展的同时,自身也开启了科学研究与技术信息化(e-Science)的历程,并将伴随整个信息社会时代。
 
“e-Science”自 2000年时任英国科学技术部(OST)研究理事会主任约翰·泰勒(John Tayler)提出以来,已有12年,其定义是:“e-Science是重要科学领域的全球性合作,以及支持这种合作的下一代基础设施”;美国国家自然科学基金会(NSF)提出“e-Science是一种新的科学研究环境,在这种新的研究环境中研究人员能够通过高性能的网络进行先进计算、协同工作、实现数据获取和管理的服务”(2003);中国科学院提出:“e-Science就是科研信息化,是在科学研究与工程设计活动中系统地应用信息技术成果,发展新的科研工具、新的科研方法、新的科研环境和新的科研合作模式的过程,是信息时代科学研究环境和科学研究活动发展的体现”(2004)。e-Science及其基本理念已被广泛认可,即信息化基础设施和信息化的科学与技术研究开发。发达国家已将其纳入信息化社会时代提升其国家科技创新能力的重大国策之一,并积极加以部署。
 
“数据密集型计算的科学研究”第四范式是e-Science的深化和拓展。2007年图灵奖获得者、微软高级工程师Jim Gary提出了“科学第四范式”——“数据密集型科学”。因为实验科学、理论科学、计算模拟无法应对现代科学研究中的“数据爆炸”,面对超大量的数据,科学家们不知道如何使用这些数据,更不知道用这些Big Data还可以做什么?而泛在的科研信息化定义还不能对此给予满意回答。第四范式是聚焦于数据密集型科学的科学方法,它的核心是以数据为中心,通过数据采集传输、数据保存与管理、数据分析与展示等三个基本活动流程实现数据密集型的科学发现。这个科学研究过程被冠为“科学数据生命周期”,当然,其每一阶段都需要新技术和新软件的支持。
 
“第四范式”的提出具有重要的意义:1.揭示了科研信息化的本质——数据驱动+数据为中心的科研信息化;2.信息化科研活动过程呈现的是“数据生命周期过程”;3.科学家们越来越多地通过“看数据”进行科学发现;4.将理论、实验和计算仿真“归一”在第四范式下,新的学科分支——“数据科学”,或则“数据密集型科学”派生而出。
 
“e-Science→第四范式→大数据”。2003年英国启动“超大级国家研究数据中心、国家级学科领域研究中心、数据服务中心”,2007年的《发展英国科研与创新信息化基础设施》报告是专门针对数据和信息的产生、数据的保存和管理、数据的查询和导航、虚研究团体、网络、计算和数据存储设施、AAA(认证authentication、授权authorization和核算accounting)、中间件(middleware)和数字版权管理等;同年,美国NSF发布了《21世纪的科研信息化基础设施》,提出了建立《国家数字化数据框架》;2008年英国《自然》专题:“Big Data”; 2010年下半年,“Big Data”开始被商界、政界、学术界、教育界、产业界等接受认可。2012年3月29日,奥巴马政府发布“Big Data Big Deal”。科研信息化中的“大数据”长期保存、数据管理、数据安全、数据服务、数据分析处理、数据发布访问和展示等问题的解决方案和技术开始被推广到“大数据时代”的相关行业。
 
我国的科研信息化正在起步阶段。近年来,我国相关科研部门已在科研的基础设施、共享服务、科研应用、技术研发等方面部署了若干重大项目和计划,如科技部“国家科技基础条件平台建设”项目、中科院“科研信息化项目(“105”“115”“125”)”、中国国家自然科学基金委(NSFC)“以网络为基础的科学活动环境研究”重大研究计划等,并取得了显著成效,为推动我国的科研信息化奠定了基础。但相比欧美等发达国家,我国科技界与科技管理部门对科研信息化理念的认知度、观念转变、基础设施、应用推动、技术研发、人才培养、资金投入、组织管理以及总体规划等方面差距甚大,这将会直接影响到在信息化社会时期我国科技创新能力的提升。面对信息社会中“科研信息化”和“科技大数据”带来的巨大挑战和重大机遇,我国的科技工作者和科技管理者需要深刻思考、积极实践、认认真真做些事情。
 
《中国科学报》 (2014-03-10 第8版 专题)
 
 打印  发E-mail给: 
    
 
以下评论只代表网友个人观点,不代表科学网观点。 
SSI ļʱ
相关新闻 相关论文

图片新闻
银河系发现巨大黑洞 史上最亮伽马射线暴来自一颗坍缩的恒星
中国天眼揭秘宇宙“随机烟花” 导师:年年审毕业论文,总有这些问题!
>>更多
 
一周新闻排行 一周新闻评论排行
 
编辑部推荐博文
 
论坛推荐