arXiv ID:
2603.28088
arXiv 提交日期: 2026-03-30
GEMS:具备记忆与技能的、以智能体为核心的多模态生成框架 / GEMS: Agent-Native Multimodal Generation with Memory and Skills
1️⃣ 一句话总结
这篇论文提出了一个名为GEMS的智能体框架,它通过引入多智能体协作循环、长期记忆存储和可扩展的专业技能库,显著提升了多模态生成模型在复杂指令和特定任务上的表现,甚至能让轻量级模型超越更强大的模型。