arXiv ID:
2602.04518
arXiv 提交日期: 2026-02-04
基于偏好学习和逆强化学习的智能体价值系统学习 / Learning the Value Systems of Agents with Preference-based and Inverse Reinforcement Learning
1️⃣ 一句话总结
这篇论文提出了一种新方法,通过观察和人类演示来自动学习智能体的价值系统,从而帮助它们在互动中做出符合伦理和道德原则的决策。