arXiv ID:
2604.27667
表格基础模型能否指导机器人策略学习中的探索? / Can Tabular Foundation Models Guide Exploration in Robot Policy Learning?
1️⃣ 一句话总结
本文提出了一种名为TFM-S3的混合搜索方法,通过间歇性全局搜索与局部更新结合,并利用预训练的表格基础模型预测策略表现,从而在有限的试错次数下大幅提升机器人连续控制策略学习的探索效率和最终性能。