arXiv ID:
2603.16001
arXiv 提交日期: 2026-03-16
以文本为主,视觉为辅:面向大型视觉语言模型的不对称文本-视觉剪枝方法 / Mostly Text, Smart Visuals: Asymmetric Text-Visual Pruning for Large Vision-Language Models
1️⃣ 一句话总结
这篇论文提出了一种名为ATV-Pruning的新方法,通过发现并利用文本和视觉信息在大型视觉语言模型中不同的重要性,对文本部分进行精细保护、对冗余的视觉部分进行大幅压缩,从而更高效、更准确地实现模型轻量化。