arXiv ID:
2605.25477
arXiv 提交日期: 2026-05-25
EXPO-FT:面向视觉-语言-动作模型的样本高效强化学习微调 / EXPO-FT: Sample-Efficient Reinforcement Learning Finetuning for Vision-Language-Action Models
1️⃣ 一句话总结
本文提出了一种名为EXPO-FT的系统,能够利用强化学习对预训练的视觉-语言-动作模型进行高效微调,使机器人在极短时间(平均约19分钟)内学会高精度、动态的复杂操作任务,并达到100%的成功率,远超现有方法。