|
|
|
|
|
FCS 文章精要 | 国防科技大学王东紫等,RDHNet:解决连续多代理系统中的旋转和排列对称问题 |
|
|
论文标题:RDHNet: addressing rotational and permutational symmetries in continuous multi-agent systems
期刊:Frontiers of Computer Science
作者:Dongzi WANG, Lilan HUANG, Muning WEN, Yuanxi PENG, Minglong LI, Teng LI
发表时间:27 Feb 2025
DOI: 10.1007/s11704-025-41250-2
微信链接:点击此处阅读微信文章

引用格式:
Dongzi WANG, Lilan HUANG, Muning WEN, Yuanxi PENG, Minglong LI, Teng LI. RDHNet: addressing rotational and permutational symmetries in continuous multi-agent systems. Front. Comput. Sci., 2025, 19(11): 1911365
阅读原文:

文章概述
这项研究针对多智能体系统中一个长期存在的问题:旋转对称性导致的状态表示冗余。在多个智能体——如机器人或自动驾驶车辆——交互的环境中,同一个场景可能因旋转而显得不同,这让传统算法感到困惑。人类能轻松识别这种等价性,但机器往往做不到,导致效率低下。RDHNet的出现改变了这一局面。
RDHNet的核心在于消除这些冗余,同时不降低网络的表达能力。它通过将智能体的观测信息分解为方向相关和方向无关两部分来实现这一目标。利用创新的相对方向层(RDL),系统将位置数据转换为相对距离和角度,确保无论环境如何旋转,表示方式始终一致。想象一群智能体在捕猎猎物或在拥挤空间导航,无论场景如何转动,RDHNet都能让它们保持统一的认知,大幅提升学习和协作能力。
论文深入剖析了技术细节,展示了RDHNet如何与现有MARL框架(如QMIX)融合。它采用多层感知机和径向基函数编码信息,并通过超网络生成权重,实现去中心化的决策过程。结果是一个不仅能识别旋转对称性,还能高效扩展的系统,通过智能选择参考实体,将计算复杂度控制在O(n²)以内。
为了验证效果,团队在两个经典任务——捕食者-猎物和合作导航——中对比了RDHNet与顶级MARL算法的表现。结果令人瞩目。在3个、5个甚至9个智能体的场景中,RDHNet始终超越COMIX、COVDN和MADDPG等对手,获得更高回报且方差更小。消融实验进一步证明,结合旋转不变性和排列不变性有效压缩了表示空间,这一结论通过t-SNE聚类可视化得以呈现。这不仅是理论突破,更是实践上的飞跃。

中国学术前沿期刊网
http://journal.hep.com.cn
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。