arXiv ID:
2511.11113
arXiv 提交日期: 2025-11-14
VIDEOP2R:从感知到推理的视频理解 / VIDEOP2R: Video Understanding from Perception to Reasoning
1️⃣ 一句话总结
本文提出VideoP2R框架,通过将视频理解分为感知和推理两个独立过程进行建模与优化,在多个视频推理基准测试中取得了领先性能。