arXiv ID:
2606.23221
arXiv 提交日期: 2026-06-22
RS-Gen:一种用于推理与搜索增强图像生成的多阶段智能体框架 / RS-Gen: A Multi-Stage Agentic Framework for Reasoning and Search-Augmented Image Generation
1️⃣ 一句话总结
本文提出了一种无需额外训练、即插即用的多阶段智能体框架RS-Gen,通过模拟“提问-解决”的闭环机制,让图像生成模型在遇到模糊指令、复杂逻辑或缺乏常识时能主动查找外部信息并进行深度推理,从而显著提升生成效果,并达到了开源模型的领先水平。