arXiv ID:
2512.16924
arXiv 提交日期: 2025-12-18
世界是你的画布:用参考图像、轨迹和文本描绘可提示的事件 / The World is Your Canvas: Painting Promptable Events with Reference Images, Trajectories, and Text
1️⃣ 一句话总结
这篇论文提出了一个名为WorldCanvas的多模态框架,它允许用户通过结合文本、运动轨迹和参考图像来生成可控、连贯且包含复杂交互的模拟视频,从而将世界模型从被动预测工具转变为用户可交互塑造的模拟器。