arXiv ID:
2605.15181
arXiv 提交日期: 2026-05-14
从规划到像素:学习规划与编排以实现开放式图像编辑 / From Plans to Pixels: Learning to Plan and Orchestrate for Open-Ended Image Editing
1️⃣ 一句话总结
本文提出了一种让AI通过先制定分步计划、再逐步执行工具操作来应对复杂、模糊的长期图像编辑任务(如“让广告更素食友好”)的新方法,并通过视觉语言模型对每一步的结果进行奖励反馈,从而自我改进规划与执行能力,最终生成比单步或固定流程方法更连贯、可靠的编辑效果。