arXiv ID:
2602.09022
arXiv 提交日期: 2026-02-09
WorldCompass:面向长视野世界模型的强化学习框架 / WorldCompass: Reinforcement Learning for Long-Horizon World Models
1️⃣ 一句话总结
这篇论文提出了一个名为WorldCompass的强化学习框架,它通过创新的采样策略、奖励函数和优化算法,显著提升了视频生成类世界模型在长序列任务中遵循指令的准确性和生成画面的质量。