arXiv ID:
2601.10781
arXiv 提交日期: 2026-01-15
未来光流预测改进机器人控制与视频生成 / Future Optical Flow Prediction Improves Robot Control & Video Generation
1️⃣ 一句话总结
这篇论文提出了一个名为FOFPred的新模型,它结合了视觉语言模型和扩散模型,能够根据语言指令预测未来的物体运动趋势(光流),并成功应用于机器人操控和视频生成两个不同领域,展示了从海量网络视频数据中学习通用运动预测的潜力。