作者:赵广立 来源:中国科学报 发布时间:2024/4/26 18:04:56
选择字号:
讯飞星火升级:上新长文本、长图文、长语音功能

 

4月26日,讯飞星火大模型V3.5(以下简称“讯飞星火”)春季上新。面向用户高效准确知识获取的痛点,讯飞星火升级为业界首个长文本、长图文、长语音大模型,不仅能够把各种信息来源的海量文本、图文资料、会议录音等进行快速学习,还能够在多种行业场景给出专业、准确回答。

长文本功能的落地需要解决信息高效处理的问题:面对上百万甚至上千万文字,长文本大模型消耗的运算资源非常大。为了解决大模型应用效率和准确率问题,科大讯飞董事长刘庆峰谈道,基于讯飞星火V3.5对长文本的理解、学习、回答能力,科大讯飞进行了模型剪枝和蒸馏,从而推出业界性能最优的130亿参数的大模型,在效果损失仅3%以内的情况下,使得星火在文档上传解析处理、知识问答的首次响应时间以及文字生成方面都获得了效率提升。

刘庆峰介绍,相比传统小模型逐行文字识别的限制,星火图文识别大模型具有三大优势:第一,能够直接处理非常复杂的版面分析,目前已经覆盖31个典型场景,如书刊、学术论文、专利、报纸、海报、PPT等,同时能自动识别标注出18类不同的版面要素,比如页眉、页脚、标题、段落、表格、公式、印章、手写等;第二,融合篇章上下文语义进行文字识别,识别更精准;第三,面向教育、金融、医疗、科研等专业领域深度优化,能自动实现更多领域的专业符号识别。

据介绍,本次讯飞星火长文本功能全新升级后,具备长文档信息抽取、长文档知识问答、长文档归纳总结、长文档文本生成等能力,总体已经达到GPT-4 Turbo 4月最新长文本版本的97%水平,而在银行、保险、汽车、电力等多个垂直领域的知识问答任务上,讯飞星火长文本总体水平已经超过GPT-4 Turbo。

讯飞星火长文本、长图文、长语音等能力的升级,进一步推动大模型在各个场景的落地。刘庆峰重点介绍了讯飞星火在招投标、合同、教育等场景下的应用。

此外,讯飞星火此次春季上新还首发“多情感超拟人合成”功能,进一步提升了大模型对情绪表达的可感知度,并推出“一句话声音复刻”功能,让科技更有温度。同时,面向企业应用场景,科大讯飞推出星火智能体平台,帮助企业解决大模型落地的最后一公里难题。

用技术进步解决刚需,讯飞星火也在获得越来越多用户的认可。据七麦数据显示,讯飞星火APP在安卓端的下载量已经超过9600万次,在国内工具类通用大模型APP中排名第一。据刘庆峰透露,科大讯飞将在6月27日发布讯飞星火大模型V4.0。

 
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
研究或摆脱光子时间晶体对高功率调制依赖 利用量子精密测量技术开展暗物质搜寻
天文学家找到最小恒星了吗 问答之间 | 如何开展科研之路
>>更多
 
一周新闻排行
 
编辑部推荐博文