arXiv ID:
2606.11096
arXiv 提交日期: 2026-06-09
IDEAL:深度对齐使离散表示自编码器更优 / IDEAL: In-DEpth ALignment Makes A Discrete Representation AutoEncoder
1️⃣ 一句话总结
本文提出了一种名为IDEAL的新方法,通过同时对齐离散视觉编码与预训练视觉模型的浅层和深层特征,解决了现有自编码器在图像重建中细节丢失的问题,在图像重建和自回归生成任务上均取得了当前最优性能。