10月15日,由中国电子信息行业联合会主办的第27届中国国际软件博览会在郑州举办。百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜分享了大模型时代AI基础平台驱动软件生态带来的新变化。
在开幕式暨主题峰会环节,吴甜表示,大模型具有效果好、泛化性强、研发流程标准化等特点,正引领人工智能的发展。在这一阶段,AI研发范式带来了开发、计算、部署的新挑战,尤其是大模型的高效训练和推理部署,需要软硬件协同发力。
吴甜在第27届软博会上。百度 供图
?
具体而言,大模型高效训练的关键要素包括训练吞吐、训练有效时间和收敛效率,这背后涉及框架、芯片、集群、算法等软硬件不同组合的协同优化。对大模型的推理部署来说,效果无损、低时延高吞吐、成本效益等要素极为关键,需要模型压缩与量化、并行推理、软硬件协同优化等技术的支持。
吴甜表示,要解决大模型研发所带来的一系列挑战,深度学习平台关键需要具备大规模并行计算、高性能推理部署、全流程工程化三方面能力。以百度飞桨为例,作为百度自研的产业级深度学习开源开放平台,飞桨从核心框架、基础模型库到端到端开发套件、工具与组件,以及星河社区等,全方位支持了文心大模型的演进过程。飞桨在核心框架和芯片之间构建了硬件适配层,打造多硬件统一适配方案,已适配60多款系列芯片,相比PyTorch,芯片基础适配的接口数减少56%,代码量减少80%。在深度学习平台与大模型联合优化下,文心大模型的能力得到了拓展、效率得到了提升。
此外她还谈到,大模型在各行各业的落地,应用生态建设至关重要。为此,百度进行了模型及相应配套工具的开源。目前,文心大模型4.5系列已开源11款模型,涵盖47B、3B激活参数的混合专家(MoE)模型与0.3B参数的稠密型模型,并配套开源了文心大模型开发套件ERNIEKit、大模型高效部署套件FastDeploy等,方便开发者在此基础上实现高效的模型开发和部署,进而在更广泛的行业加速AI的落地应用。
为方便开发者,目前星河社区已上线700万个实践项目、600多门公开课以及400多场AI竞赛。开发者也在应用中反过来推动AI基础技术平台的完善。目前,飞桨框架贡献者俱乐部成员达到195位,飞桨开发者技术专家411位,全球各地开发者自主建立运营的飞桨领航团超过400个。
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。