arXiv ID:
2601.15224
arXiv 提交日期: 2026-01-21
ProgressLM:迈向视觉语言模型中的进度推理 / PROGRESSLM: Towards Progress Reasoning in Vision-Language Models
1️⃣ 一句话总结
这篇论文提出了一个名为Progress-Bench的基准测试来评估视觉语言模型在判断任务进度方面的能力,发现现有模型普遍表现不佳,并通过一种新的训练方法ProgressLM显著提升了模型在未见任务上的进度推理性能。