arXiv ID:
2603.28367
arXiv 提交日期: 2026-03-30
基于视觉自回归模型重新思考文本引导图像编辑中的结构保持 / Rethinking Structure Preservation in Text-Guided Image Editing with Visual Autoregressive Models
1️⃣ 一句话总结
这篇论文提出了一种基于视觉自回归模型的新框架,通过从粗到细的标记定位、结构特征注入和自适应强化学习策略,在文本引导的图像编辑中更好地保持了原始图像的结构一致性和背景,同时提升了编辑质量。