arXiv ID:
2602.22474
arXiv 提交日期: 2026-02-25
何时行动、询问或学习:基于不确定性的策略引导 / When to Act, Ask, or Learn: Uncertainty-Aware Policy Steering
1️⃣ 一句话总结
这篇论文提出了一个名为UPS的智能机器人决策框架,它能够识别任务指令的模糊性和自身执行能力的不确定性,从而自主选择是执行动作、向人类询问澄清,还是请求干预学习,以此减少对人工反馈的依赖并提升执行可靠性。