arXiv ID:
2509.01984
arXiv 提交日期: 2025-09-02
基于离散噪声反演的下一代自回归文本图像编辑方法 / Discrete Noise Inversion for Next-scale Autoregressive Text-based Image Editing
1️⃣ 一句话总结
本文提出了一种名为VARIN的创新图像编辑技术,它通过逆向生成特定噪声,让自回归视觉模型能够仅根据文字提示精确修改图片内容,同时完美保留原始背景和结构细节,无需额外训练即可实现高效编辑。