arXiv ID:
2604.13432
arXiv 提交日期: 2026-04-15
MaMe与MaRe:基于矩阵的令牌合并与恢复,用于高效视觉感知与合成 / MaMe & MaRe: Matrix-Based Token Merging and Restoration for Efficient Visual Perception and Synthesis
1️⃣ 一句话总结
这篇论文提出了一种名为MaMe的全新、无需训练且完全基于矩阵运算的令牌合并方法,以及其逆向恢复方法MaRe,它们能高效加速视觉Transformer模型,在图像分类、视频理解和图像生成等多种任务中实现显著的速度提升,同时保持甚至提升模型性能。