arXiv ID:
2603.12266
MM-CondChain:一个用于视觉基础深度组合推理的、可通过程序验证的基准 / MM-CondChain: A Programmatically Verified Benchmark for Visually Grounded Deep Compositional Reasoning
1️⃣ 一句话总结
这篇论文提出了一个名为MM-CondChain的新基准测试,专门用来评估多模态大语言模型在理解复杂视觉场景后,进行多步骤、有条件分支的深度逻辑推理的能力,结果发现当前最先进的模型在这项任务上仍有很大挑战。