arXiv ID:
2605.06137
arXiv 提交日期: 2026-05-07
自回归视觉生成需要一个“序言” / Autoregressive Visual Generation Needs a Prologue
1️⃣ 一句话总结
本文提出了一种名为Prologue的方法,通过在图像序列前添加一组专门用于生成的小“序言”标记,将重建和生成任务解耦,在不影响图像重建质量的前提下,大幅提升了自回归图像生成的性能,并意外发现这些标记能自动学会高层的语义结构。