arXiv ID:
2601.06943
观看、推理与搜索:面向开放网络的智能体视频推理深度研究基准 / Watching, Reasoning, and Searching: A Video Deep Research Benchmark on Open Web for Agentic Video Reasoning
1️⃣ 一句话总结
这篇论文提出了首个视频深度研究基准VideoDR,用于评估AI模型如何结合视频线索与网络检索进行多步推理来回答问题,并发现智能体模式并非总是优于流程模式,其成功关键在于能否在长链条检索中保持对初始视频线索的准确追踪。