📄 论文总结
环形巴士:一个用于评估视觉语言模型理解画谜能力的大型多样化多模态基准 / $\left|\,\circlearrowright\,\boxed{\text{BUS}}\,\right|$: A Large and Diverse Multimodal Benchmark for evaluating the ability of Vision-Language Models to understand Rebus Puzzles
1️⃣ 一句话总结
这篇论文提出了一个包含1333个英文画谜的大型多样化评测基准,并设计了一种结合描述与代码推理的新方法,显著提升了各类视觉语言模型在理解这类需要综合认知能力的谜题上的表现。