arXiv ID:
2510.10518
VR-Thinker:通过图像思维推理提升视频奖励模型 / VR-Thinker: Boosting Video Reward Models through Thinking-with-Image Reasoning
1️⃣ 一句话总结
这篇论文提出了一种名为VR-Thinker的新方法,通过让奖励模型主动选择和更新视频中的关键画面来进行视觉推理,从而显著提高了对长视频内容评估的准确性和可靠性。