|
|
|
|
|
FCS 文章精要 | 东南大学&微软亚洲研究院,CCA:用于图像编辑的协同竞争智能体 |
|
|
论文标题:CCA: collaborative competitive agents for image editing
期刊:Frontiers of Computer Science
作者:Tiankai HANG, Shuyang GU, Dong CHEN, Xin GENG, Baining GUO
发表时间:13 Feb 2025
DOI: 10.1007/s11704-025-41244-0
微信链接:点击此处阅读微信文章

引用格式:
Tiankai HANG, Shuyang GU, Dong CHEN, Xin GENG, Baining GUO. CCA: collaborative competitive agents for image editing. Front. Comput. Sci., 2025, 19(11): 1911367
阅读原文:

问题概述
当前图像编辑技术面临两大核心挑战:复杂指令的多模态解析与编辑过程的持续优化。尽管生成对抗网络(GANs)和扩散模型在单步生成任务中表现优异,但其在多步骤迭代编辑中的泛化能力受限,且缺乏对历史编辑经验的有效复用。本文提出协同竞争智能体框架(Collaborative-Competitive Agents, CCA),通过构建基于大语言模型(LLMs)的多智能体协同系统,开创性地实现了复杂语义指令的渐进式图像编辑。

技术步骤
CCA的灵感来自生成对抗网络(GAN)。它具有两个“生成器”智能体,它们独立处理编辑指令并创建结果。然后,“判别器”智能体会评估这些结果,向两个生成器提供反馈。生成器使用此反馈以及对彼此工作的观察来改进。这创造了一个协作和竞争的环境。关键是透明度——我们可以看到中间步骤,不同于传统的“黑盒”模型,从而允许迭代优化。

实验结果
CCA擅长处理复杂的图像编辑指令,而传统方法难以应对。该系统的主要贡献是:1)一种具有可控步骤的新型多智能体生成模型。2)分析智能体关系(反思、合作、竞争)如何改善结果。3)全面的实验证明了CCA能够稳健地处理复杂的图像编辑。




中国学术前沿期刊网
http://journal.hep.com.cn
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。