arXiv ID:
2602.22624
arXiv 提交日期: 2026-02-26
基于指令的图像编辑:规划、推理与生成 / Instruction-based Image Editing with Planning, Reasoning, and Generation
1️⃣ 一句话总结
这篇论文提出了一种新的多模态智能方法,通过‘思维链’式的规划、区域推理和生成三步走,让AI能更准确地理解复杂指令并编辑真实世界图像,效果优于以往方法。