|
2025中关村论坛年会通用人工智能论坛发布 |
全球首个通用智能人“通通”,长大了 |
|
在3月29日召开的2025中关村论坛年会通用人工智能论坛上,北京通用人工智能研究院重磅发布了全球首个通用智能人“通通”的2.0版本,从去年“三四岁的小女孩”变成了“五六岁”的水平。
据北京通用人工智能研究院先进技术中心执行主任陈浩介绍,相较于“通通”1.0版本,“通通”2.0在语言、认知、动作、学习、情绪、交互方面实现了多种核心能力的升级。
通通2.0的人物形象。北京通用人工智能研究院供图,下同
“通通”2.0,“一个有价值观、世界观的小女孩”
“通通”2.0版本实现了一个有自身价值观、世界观的小女孩虚拟形象,在理解对话目标意图的基础上,遵循自身价值和人格(如好奇、勤快、爱干净等),利用对话策略来引导对话的走向,从而达到自身的目的。陈浩介绍,“通通”2.0在价值调控对话生成、消除模型幻觉、保持对话前后连贯性以及“言行一致”等方面取得突破。
例如,当妈妈要求“通通”睡觉,或者吃她不喜欢的食物时,“通通”可以向妈妈耍赖,找理由磨蹭,并试图要求妈妈给予奖励,在多轮协商达成一致后才会实施对应任务。
通通2.0在家庭场景中与“妈妈”交互。
除了在“价值与心智驱动的多轮对话”方面的进步之外,“通通”2.0还在“基于交互反馈的推理和学习”方面有新的突破。
作为“生活”在高度仿真的复杂、动态三维虚拟场景中的智能体,“通通”1.0会因周围环境时刻变化导致无法顺利完成规划任务,而“通通”2.0可以实时响应外界场景的变化,进行反思和重新规划,对已有任务进行挂起、恢复、修改或取消等处理,同时动态生成新的任务规划,从而以更灵活、智能、多变的方式完成指令。
在论坛上,工作人员现场演示了当“通通”想打开空调时,工作人员利用VR手多次改变遥控器位置“刁难”她,“通通”进行了一系列尝试,靠脱鞋上沙发、利用沙发上的靠垫增加高度最终拿到放在墙架上的遥控器。
与此同时,研究人员还为“通通”打造了幼儿园、六口之家等多智能体场景,并在场景中设置了各自独立,具备自身价值、能力、人设、状态的多个智能体,使“通通”拥有了自己的家人和朋友。陈浩介绍说,在多智能体场景中,“通通”不仅需要理解周围环境,还需要理解环境中其他智能体,并在此基础之上进行自身的任务规划,包括发起和响应对话,实施帮助、捣乱等复杂行为交互等。
挖掘“水面以下”的人工智能创新
在主题为《时代之变:中国通用人工智能战略前瞻》的大会报告中,北京通用人工智能研究院院长,北京大学人工智能研究院、智能学院院长朱松纯谈到,人工智能领域的科技创新如冰山结构般分为五个层次,其中“水面以上部分”包括执行层、算法层和模型层,这些是容易理解与实践的部分,相对而言也比较容易通过算法创新来改变和发展,比如DeepSeek和OpenAI;而“水面以下部分”包括理论层和哲学层,是智能内在的、难以测量的部分。
朱松纯在2025中关村论坛年会通用人工智能论坛上作报告。
?
他介绍,北京通用人工智能研究院的研究,主要围绕模型、梳理框架(理论层)和哲学层展开。
“(水面以下部分)它们不太容易通过表层的影响而得到改变,但却对智能的发展起着关键性的作用。”朱松纯表示,理论层是人工智能的数理框架,哲学层则关乎智能的本质。“通通”正是一个由价值、因果驱动的通用人工智能(AGI)系统原型,其突破性就在于“实现了由底层哲学层与理论层到顶层的全栈式创新架构”。
据介绍,随着“通通”的持续迭代,她的能力也在稳步提升,目前研究人员正利用认知心理学定义的5~6岁儿童应掌握的经典任务对她进行测试,“通通”也已经通过了多项综合性强、复杂度高的任务考核。
从“小女孩”到“大社会”
“通通”现在还缺少一些社会认知和交互。不过,研究人员表示,“通通”下一步就会与社会知识和规则“接轨”,通过多智能交互,产生一些社会关系和契约,进化成为“社会智能体”。
北京通用人工智能研究院多智能体实验室负责人陈烁表示:“未来它将成为通用底座支撑各类垂直应用场景,进一步学习行业特定的知识和技能,形成千万个‘通用智能人’赋能千行百业,同时与具身智能机器人相结合,为智能制造、智慧城市、养老陪护、数字助理、家用机器人等领域带来革命性的变化,更好地服务居民日常生活。”
陈烁认为,人工智能技术正加速从单体智能向群体智能和社会级智能演进。在这一趋势下,社会级智能体的研究正成为人工智能领域的前沿方向。
“社会级智能体基于对社会结构和社会运行规律的深度理解,建模政府、企事业单位等各层级主体,实现对社会复杂关系网络的精准分析与协同处理,能够广泛应用于城市管理、公共资源调配、应急响应等社会治理场景。”他表示,通过社会级智能体的赋能,我们有望构建更加高效、有序与可持续发展的智慧社会,从而用技术的方法回答如何构建中国式现代化道路。
论坛现场发布的“大型社会模拟器”,就是一个社会级智能体学习和实践的仿真模拟平台。该模拟器由北京大学武汉人工智能研究院(简称北武院)和北京通用人工智能研究院共同研发,其借助分布式计算、高并发调度技术,在高度拟真的3D仿真环境中模拟个体智能体与社会级智能体的交互和演化过程。
陈烁介绍称,研究团队通过多维度数据融合与动态交互建模,构建了一个包含上百万人的虚拟社会系统,利用多智能体价值观建模和数字孪生技术来推演社会运行规律,并模拟不同社会决策的长远影响,提供前瞻性决策支持。
他还表示,大型社会模拟器对于社会发展的动态推演,还能为社会学研究提供强大支撑,解决“文科无法做实验”的难题。
据了解,大型社会模拟器目前已在武汉东湖高新区国家智能社会治理实验综合基地推出V1.0版本。为提供高度拟真的城市仿真空间,北武院研发团队已完成518平方公里的L1至L5级数据建模,并支持全场景实时天气与光照的动态仿真。
陈烁介绍说,为了精准对个体级智能体和社会级智能体进行建模,团队采集了大量脱敏的社会运行数据,汇聚人口、企业、经济发展、交通运行和基础服务设施等5大主题,囊括企业特征、人口结构、消费行为、社会经济状况等10余类核心领域以及170余项指标。
“基于这些数据,大型社会模拟器V1.0全面建模了个体、组织、市场、政府、交通、公共资源这六大社会要素及其交互演化。”陈烁说,未来,希望通过“通用智能体+行业智能体+社会智能体”矩阵建设,以“原创技术—产业赋能—社会智能”三级联动模式,推动人工智能从单一智能向社会智能转变。
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。