arXiv ID:
2603.02196
arXiv 提交日期: 2026-03-02
保形策略控制 / Conformal Policy Control
1️⃣ 一句话总结
这篇论文提出了一种名为‘保形策略控制’的新方法,它能让AI智能体在探索新行为以提升性能时,通过数学保证始终将安全风险控制在用户设定的可接受范围内,从而解决了高风险场景下安全与探索难以兼顾的难题。