arXiv ID:
2603.25249
arXiv 提交日期: 2026-03-26
面向语义感知的前缀学习:实现高效令牌的图像生成 / Semantic-Aware Prefix Learning for Token-Efficient Image Generation
1️⃣ 一句话总结
这篇论文提出了一种名为SMAP的新型视觉令牌化方法,通过将类别语义信息强制注入到图像表示学习中,并结合一种创新的尾部令牌丢弃策略,使得生成的图像潜在空间不仅重建质量高,而且语义信息更丰富,从而在少量令牌预算下也能实现高质量的图像生成。