arXiv ID:
2602.09580
arXiv 提交日期: 2026-02-10
通过动作分块评估器与标准化流实现样本高效的真实世界灵巧策略微调 / Sample-Efficient Real-World Dexterous Policy Fine-Tuning via Action-Chunked Critics and Normalizing Flows
1️⃣ 一句话总结
这篇论文提出了一个名为SOFT-FLOW的样本高效微调框架,它结合了能处理多模态动作的标准化流策略和评估整个动作序列的评估器,成功在真实机器人上实现了对灵巧、长时程操作任务(如用剪刀剪胶带、转动手中方块)的稳定且高效的策略调整。