作者:赵广立 来源:中国科学报 发布时间:2024/4/1 12:59:55
选择字号:
提供“百亿补贴”!无问芯穹发布大模型服务平台

 

3月31日,源自清华的创新企业无问芯穹在上海举办“多元计算·泛在链接”AI算力优化论坛暨产品发布会,清华大学电子工程系长聘教授、无问芯穹发起人汪玉携联合创始人团队首次集体公开亮相,并发布“无穹Infini-AI”大模型开发与服务平台。

清华大学电子工程系教授、无问芯穹发起人汪玉。 无问芯穹供图   ?


无穹Infini-AI大模型开发与服务平台基于多芯片算力底座开发,旨在有效整合和优化算力资源、设计出好的利用方式和工具,缓解大模型企业面临的算力紧缺状况。会上,无问芯穹宣布,该开发服务平台自3月31日起正式开放全量注册,并给所有实名注册的个人和企业用户提供百亿tokens免费配额。

无问芯穹联合创始人兼CEO夏立雪介绍说,开发者可以在这个平台上体验、对比各种模型能力和芯片效果,通过简单拖拽各种参数按钮的动作,就能精调出更贴合业务的大模型并部署在无穹Infini-AI上,再以非常优惠的千token单价向用户提供服务。

谈起发布这一平台的初衷,汪玉介绍说,大模型引发社会广泛关注后,他们认为,国内整体算力水平距离国际先进还有明显差距,仅靠芯片工艺提升或多元芯片的迭代已远远不够,需要建立一个大模型生态系统,让不同模型能自动部署到不同硬件上,让各种算力得到有效利用。

据介绍,无穹Infini-AI已支持Baichuan2、ChatGLM2、ChatGLM3、ChatGLM3闭源模型、Llama2、Qwen、Qwen1.5系列等共20多个模型,以及AMD、壁仞、寒武纪、燧原、天数智芯、沐曦、摩尔线程、NVIDIA等10余种计算卡,支持多模型与多芯片之间的软硬件联合优化和统一部署。第三方平台或自定义训练、微调而来的模型也可以无缝迁移托管到无穹Infini-AI,并获得细粒度定制化的按token计费方案。

“我们对模型品牌和芯片品牌的覆盖率还会持续提升,随着时间的推移,无穹Infini-AI的性价比优势会越来越突出。”夏立雪表示,未来无穹Infini-AI还将支持更多模型与算力生态伙伴的产品上架,让更多大模型开发者能够‘花小钱、用大池’,持续降低AI应用的落地成本。

 
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
“双星计划”:开启中国空间科学新纪元 河西走廊内陆河出山径流研究揭示新趋势
金星缺水的原因,找到了? 科学家描绘低质量系外行星大气逃逸新图象
>>更多
 
一周新闻排行
 
编辑部推荐博文