arXiv ID:
2512.11995
V-REX:通过问题链对探索性视觉推理进行基准测试 / V-REX: Benchmarking Exploratory Visual Reasoning via Chain-of-Questions
1️⃣ 一句话总结
这篇论文提出了一个名为V-REX的新评估体系,用于测试AI模型在需要多步骤探索的复杂视觉推理任务上的能力,它通过将推理过程分解为‘规划问题链’和‘跟随问题链’两个关键环节,来对现有先进模型进行精细化的评估,并发现它们在多步骤探索推理方面仍有很大提升空间。