arXiv ID:
2604.20728
arXiv 提交日期: 2026-04-22
面向不完美感知智能体的区间POMDP防护机制 / Interval POMDP Shielding for Imperfect-Perception Agents
1️⃣ 一句话总结
本文提出了一种基于区间部分可观测马尔可夫决策过程的运行时安全防护方法,通过从有限标注数据中估计感知不确定性的置信区间,为感知系统提供有概率保证的安全决策屏障,实验表明该方法能有效降低不安全动作的发生概率。