arXiv ID:
2511.20633
arXiv 提交日期: 2025-11-25
通过预测强化行动策略 / Reinforcing Action Policies by Prophesying
1️⃣ 一句话总结
这篇论文提出了一种名为ProphRL的新方法,通过构建一个能够预测动作结果的视频模型和专门的强化学习技术,有效提升了视觉-语言-动作策略的适应性和成功率,无需依赖昂贵的真实机器人实验。