arXiv ID:
2605.12831
arXiv 提交日期: 2026-05-12
逆强化学习中潜在观测缺失的量化方法 / Quantifying Potential Observation Missingness in Inverse Reinforcement Learning
1️⃣ 一句话总结
本文提出了一种新方法,用于检测和量化行为数据中可能存在的观测缺失问题,帮助逆强化学习模型在医疗等实际场景中更准确地还原决策者的真实意图,避免因数据不完整而得出误导性结论。