百度大脑语言与知识技术峰会举行—新闻

作者：赵广立来源：中国科学报发布时间：2020/8/25 16:40:16

选择字号：小中大

百度大脑语言与知识技术峰会举行

10年积累、11项发布，百度语言与知识技术剑指产业化

自然语言理解（NLP）素有“人工智能皇冠上的明珠”之誉，语言与知识等认知层面的技术突破将进一步促进AI深入发展。8月25日，以“掌握知识、理解语言、拥有智能”为主题的百度大脑语言与知识技术峰会在线举行。在主旨演讲中，百度CTO王海峰首次发布了百度大脑语言与知识产品全景图，涵盖11项语言与知识技术新品，剑指产业智能化。

“在百度语言与知识技术的布局和发展中，我们始终在注意把握两个趋势，即技术发展趋势和产业发展趋势。”王海峰表示，百度语言与知识技术的发展历程，从研究方法、研究对象、研究方向、产业应用等层面，始终与应用的发展趋势、需求一脉相承，与产业接轨。

百度CTO王海峰.jpg

百度CTO王海峰在现场发布百度大脑与知识技术新品

据了解，百度大脑语言与知识技术历经10年发展可观，曾获得包括国家科技进步奖在内的20多个奖项，30多项国际竞赛冠军，发表学术论文超过300篇，申请专利2000多项。同时，百度还打造了业界最大规模的知识图谱，拥有超过50亿实体和5500亿事实，每天在各行各业的应用中被调用次数超过400亿次；去年3月，百度推出知识增强的语义理解框架ERNIE，曾一举登顶全球权威数据集GLUE榜单。

会上，百度集团副总裁吴甜发布了语义理解技术与平台“文心”（基于深度学习平台“飞桨”打造）、智能文档分析平台TextMind和AI同传会议解决方案3款新品，同时发布了6项升级，包括智能创作平台的3个场景方案以及智能对话定制与服务平台UNIT的3项升级。

数据匮乏、算力难济是语言与知识技术研发中面临的瓶颈。为突破瓶颈，百度联合中国计算机学会、中国中文信息学会发起中文自然语言处理数据共建计划“千言”，希图解决数据稀缺问题。据介绍，“千言”一期由来自国内11家高校和企业的数据资源研发者共同建设，已涵盖开放域对话、阅读理解等7大任务，20余个中文开源数据集。

“我们希望有更多的数据集作者能够参与共建‘千言’，共同推动中文信息处理技术的进步，建设世界范围的中文信息处理影响力。”百度技术委员会主席吴华表示：“我们计划在未来3年，面向20多个任务，收集和建设不少于100个中文自然语言处理数据集，覆盖语言与知识技术全部领域。”

吴华还发布了百度“语言与知识技术算力共享计划”，通过百度AI STUDIO平台提供算力支持，让广大开发者破除算力桎梏，专注于技术创新。