作者:赵广立 来源:科学网微信公众号 发布时间:2023/3/16 20:56:19
选择字号:
百度文心一言今开启邀测!1小时涌入3万家企业申请

 

文|《中国科学报》记者 赵广立

3月16日下午,来自全国各地的一百多家媒体涌入百度位于西北旺东路10号院的熊掌报告厅,来一睹“文心一言”的真容。

文心一言是百度基于其新一代大语言模型的生成式AI产品,早已是人们心中对标ChatGPT的存在。然而,从2月7日官宣预告到邀请测试,中间隔了37天。承载着国人用上生成式AI产品的期待,文心一言可谓是千呼万唤始出来。

百度显然也不想让人失望。在新闻发布会上,百度创始人、董事长兼CEO李彦宏坦言:“文心一言对标ChatGPT、甚至是GPT-4,门槛是很高的。我自己测试感觉还是有很多不完美的地方。”但他表示,考虑到人们“希望早点用上最新最先进的大语言模型”的市场需求,百度还是决定站出来。

既然无法在AI的赛道上“抢跑”,那就耐心“长跑”。“百度希望和大家一起,推动人工智能技术进步。”李彦宏说:“(希望通过文心一言)让所有人都能使用最先进的生产力工具,让所有人都能从中受益。”

图片

李彦宏

文心一言,“奋起直追”

“十月怀胎,一朝分娩。”文心一言到底长什么样?

李彦宏现场分享了5个演示案例,展示了文心一言在文学创作、商业文案写作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。

起名字、写新闻稿、写标语,作诗、作画、写作文,无论是文本生成还是文学创作,这些都在文心一言的能力覆盖范围内。再加上根植中国文化,文心一言在中文语言处理方面有独特优势,这意味着用户用中文与其“对话”,会显得更加自然。

图片

与文心一言对话(中文理解)

图片
与文心一言对话(商业文案写作)
图片
与文心一言对话(数理推算)

就现场展示来看,文心一言某种程度上具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性都接近人类水平。

有用户测试发现,在数理推算方面,文心一言的表现超过了ChatGPT和Inspo。

图片

文心一言

图片

ChatGPT

图片

Inspo

“基于搜索业务积累,百度有世界上最大的知识图谱,这让文心一言回答准确性及生成结果的可信度得到提升。”李彦宏介绍说,文心一言大模型的训练数据包括万亿级网页数据、数十亿搜索数据和图片数据、百亿级语音日均调用数据及5500亿事实的知识图谱,“因此百度在中文语言的处理上,处于独一无二的位置”。

不过,李彦宏也提及,这类大语言模型还远未到发展完善的阶段,进步空间很大。他表示,相信在文心一言发布之后,将建立起真实用户反馈、开发者调用和模型迭代之间的“飞轮”,效果会迅速提升,给人“士别三日,当刮目相看”的惊喜。

值得一提的是,在现场,文心一言还展现了它拥有多模态生成能力。与GPT-4的“输入图片—理解图像内容”不同的是,它支持“输入文字—生成图像、音视频”,也即“文生图”“文生音视频”能力。

李彦宏认为,多模态是生成式AI一个明确的发展趋势。未来随着百度多模态统一大模型的能力增强,文心一言的多模态生成能力也会不断提升。

在李彦宏演示了文心一言的各项能力之后,百度首席技术官王海峰上台分享了背后的技术与百度多年的技术积累。

王海峰介绍说,文心一言是在百度ERNIE及PLATO系列模型的基础上研发的新一代知识增强大语言模型,集成了监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强等技术。其中,前3项是这类大语言模型都会采用的技术(如ChatGPT),而在ERNIE和PLATO中也已有应用和积累,在文心一言中又进行了进一步强化和打磨;后3项则是百度已有技术积累,“也是文心一言未来越来越强大的基础”。

百度的机会,“由彼及此”

新闻发布会上,百度公布了文心一言的邀请测试方案。

3月16日起,首批用户即可通过邀请测试码,在文心一言官网体验产品,后续将陆续开放给更多用户。同时,百度智能云也面向企业客户开放文心一言API接口调用服务。即日起已开放预约,企业用户通过搜索“百度智能云”进入官网,可申请加入文心一言云服务测试。

据悉,新闻发布会后一小时内,排队申请文心一言企业版API调用服务测试的企业用户已达3万多家,申请产品测试网页多次被挤爆,百度智能云官网流量飙升百倍。

从百度的推广策略来看,百度最快有望面向消费者实现“人人可用”。据了解,下一步,文心一言将接入百度搜索、小度音箱、爱奇艺等百度“所有业务”,成为百度提供社会服务的基石。

“我们对文心一言的定位,是一个通用的赋能平台,金融、能源、媒体、政务等千行百业,都可以基于这个平台来实现智能化变革,实现效率提升,创造巨大的商业价值。”李彦宏说道。

王海峰也曾多次在多个场合讲到,具有算力、算法和数据综合优势的企业,可以将模型生产的复杂过程封装起来,通过低门槛、高效率的生产平台,为千行百业提供大模型服务。

数据显示,自2月份百度官宣“文心一言”以来,已有超过650家企业宣布接入文心一言生态。

在百度看来,文心一言和生成式AI,代表了一个新的技术范式,“是一个每家企业都不可以错过的巨大的机会”。

李彦宏说,文心一言不仅会影响搜索或者互联网公司,还会影响到每一家公司——由于它超强的自然语言理解和表达能力,它让任何公司都有机会离自己的客户更近、创建更好的用户体验,从而获得更强的竞争优势;同时,有机构预测,到2030年,人工智能可以将知识工作者的生产力提高4倍以上,很多人的工作性质会发生不可逆转的改变,因此文心一言“对个人的改变也会是巨大的”。

“赠人玫瑰手有余香”。这恐怕也是多年坚持投入人工智能的百度,终于等来的机会。

从十多年前开始,百度就锚定人工智能,坚持压强式、马拉松式的研发投入。统计显示,百度近十年累计研发投入超过1000亿元。2022年百度核心研发费用更是高达214.16亿元,占百度核心收入比例达到 22.4%。

如此高的研发投入,在“大厂”中凤毛麟角。

高研发投入让百度的技术储备拥有了一定的先发优势,即便面对大模型惊人的算力需求,仍能做到游刃有余。资料显示,跑通一次100亿以上参数量的模型,算力至少需要1000张GPU卡。显然,对大多数企业来说,从头开始做ChatGPT、文心一言这样的大模型,既不现实,也不经济。未来,势必有大量有需求的实体和个人,涌向类似百度文心大模型这样的“AI基座”。

“AI的长期价值才刚刚开始”

在新闻发布会后,百度安排了简短的答记者问环节。在回答《中国科学报》提问时,王海峰谈到了他关于“通用人工智能”的思考。

王海峰说,今天的人工智能已经在很多方面逐渐超越人类,但是这些超越并不代表就实现了所谓的通用人工智能——即便在深度学习平台+大模型的作用下,人工智能技术的“通用性”的确越来越好。

“当你发现AI在很多领域都达到了、甚至超越人类水平的时候,你可以认为一定程度上已经实现了‘强人工智能’或‘通用人工智能’,但是,我们也可以不关心这个概念本身,而是去关心它为人类带来的价值。”王海峰说,回顾前几次工业革命,可以发现那些通用性强的技术,会在工业大生产阶段真正发挥其广泛价值。人工智能也一样,目前它技术在不断进步、应用越来越广泛,接下来如何在工业大生产阶段发挥价值,“这是我们追求的目标”。

这个回答,正对应了王海峰关于百度发布文心一言的态度:“这不是头脑发热,而是十余年技术积累和产业实践的水到渠成”。

李彦宏在演讲的最后也谈到,文心一言不是中美科技对抗的工具,而是一代代百度技术人员追逐科技改变世界的梦想的产物。

“未来,将会有更多的杀手级应用、现象级产品出现,将会有更多的里程碑事件发生。”李彦宏说:“我们相信,人工智能会彻底改变我们今天的每一个行业。AI的长期价值、对各行各业的颠覆性改变,才刚刚开始。”

 
 
 
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
冰表面长啥样?原子级分辨图像揭晓答案 北方中纬高频雷达网发布首批科学探测结果
“双星计划”:开启中国空间科学新纪元 河西走廊内陆河出山径流研究揭示新趋势
>>更多
 
一周新闻排行
 
编辑部推荐博文