arXiv ID:
2601.17067
arXiv 提交日期: 2026-01-22
作为世界模型的视频生成:一种关于状态与动态的机制性视角 / A Mechanistic View on Video Generation as World Models: State and Dynamics
1️⃣ 一句话总结
这篇论文提出了一种新的分类框架,将视频生成模型视为潜在的世界模型,并主张通过关注模型如何构建内部“状态”以及如何模拟动态变化来提升其物理连贯性和因果推理能力,从而推动该领域从生成逼真视频迈向构建通用的世界模拟器。