arXiv ID:
2511.02650
arXiv 提交日期: 2025-11-04
视觉输入能否被压缩?面向大型多模态模型的视觉令牌压缩基准 / Can Visual Input Be Compressed? A Visual Token Compression Benchmark for Large Multimodal Models
1️⃣ 一句话总结
这篇论文提出了一个名为UniPruneBench的统一基准测试平台,用于系统评估大型多模态模型中视觉令牌压缩方法的性能,发现随机剪枝是一个意外强大的基线方法,且压缩比例是影响模型性能的主要因素。