arXiv ID:
2606.29681
arXiv 提交日期: 2026-06-29
马尔可夫决策过程中可达性概率原因的高效学习与概率保证 / Sample-Efficient Learning of Probabilistic Causes for Reachability in Markov Decision Processes with Probabilistic Guarantees
1️⃣ 一句话总结
本文提出了一种新方法,能够在未知转移概率的马尔可夫决策过程中,通过采样高效地识别那些会显著增加特定状态出现概率的“原因状态”,并给识别结果提供概率上的可靠性保证,从而帮助人们理解复杂系统中的异常结果是如何产生的。