arXiv ID:
2603.14549
arXiv 提交日期: 2026-03-15
ASAP:面向高效大视觉语言模型推理的注意力偏移感知剪枝方法 / ASAP: Attention-Shift-Aware Pruning for Efficient LVLM Inference
1️⃣ 一句话总结
这篇论文提出了一种名为ASAP的新方法,它通过动态调整注意力并合并相似信息块,在不需额外训练的情况下,大幅减少了大型视觉语言模型处理图像时的计算量(约80%),同时几乎不损失模型性能。