arXiv ID:
2602.08346
arXiv 提交日期: 2026-02-09
揭示什么、是否以及如何?为图像推理思维构建过程奖励模型 / What, Whether and How? Unveiling Process Reward Models for Thinking with Images Reasoning
1️⃣ 一句话总结
这篇论文针对大型视觉语言模型在‘图像思维’推理中容易出错的问题,首次创建了一个专门的评估基准,揭示了现有模型难以准确评判推理过程,并指出了未来改进方向。