arXiv ID:
2512.16864
arXiv 提交日期: 2025-12-18
RePlan:基于推理引导的区域规划用于复杂指令图像编辑 / RePlan: Reasoning-guided Region Planning for Complex Instruction-based Image Editing
1️⃣ 一句话总结
这篇论文提出了一个名为RePlan的新框架,它通过一个‘先规划后执行’的方法,利用视觉语言模型进行逐步推理来分解复杂指令并定位到图像的具体区域,然后结合扩散模型实现精准、并行的多区域编辑,有效解决了现有模型在处理复杂指令和杂乱场景时面临的困难。