arXiv ID:
2604.23950
arXiv 提交日期: 2026-04-27
LearnPruner:重新思考视觉语言模型中基于注意力的令牌剪枝方法 / LearnPruner: Rethinking Attention-based Token Pruning in Vision Language Models
1️⃣ 一句话总结
本文提出了一种名为LearnPruner的两阶段视觉令牌剪枝框架,通过分析视觉编码器和语言模型中注意力机制的缺陷,先由可学习剪枝模块剔除冗余视觉信息,再在语言模型中间层保留关键任务令牌,从而在仅使用5.5%视觉令牌的情况下保持约95%的原始性能,并实现3.2倍的推理加速。