arXiv ID:
2603.16870
arXiv 提交日期: 2026-03-17
揭秘视频推理:探索扩散模型中的推理机制 / Demystifing Video Reasoning
1️⃣ 一句话总结
这篇论文通过研究发现,视频生成模型的核心推理能力并非如先前认为的那样在视频帧之间顺序展开,而是在扩散去噪的步骤中逐步形成,并揭示了模型在这一过程中展现出的多种智能行为,为利用视频模型进行更复杂的推理任务提供了新思路。