arXiv ID:
2604.15201
arXiv 提交日期: 2026-04-16
RL-STPA:面向安全关键强化学习的系统理论危险分析适配方法 / RL-STPA: Adapting System-Theoretic Hazard Analysis for Safety-Critical Reinforcement Learning
1️⃣ 一句话总结
这篇论文提出了一种名为RL-STPA的新框架,它通过结合分层任务分解、覆盖引导的扰动测试和迭代检查点等方法,系统性地识别和应对安全关键领域(如自主无人机导航)中强化学习模型因‘黑箱’特性和数据分布变化可能引发的潜在危险,为实际应用提供了一套实用的安全评估与改进工具。