arXiv ID:
2512.14273
arXiv 提交日期: 2025-12-16
Zoom-Zero:通过时序放大进行从粗到细的强化视频理解 / Zoom-Zero: Reinforced Coarse-to-Fine Video Understanding via Temporal Zoom-in
1️⃣ 一句话总结
这篇论文提出了一个名为Zoom-Zero的新方法,它通过‘先粗略定位、再放大细节’的两步策略,并结合创新的强化学习奖励机制,有效提升了视频问答系统在定位关键片段和生成准确答案方面的能力。