arXiv ID:
2603.16651
arXiv 提交日期: 2026-03-17
如果匹诺曹是一个强化学习智能体:一种规范化的端到端流程 / What if Pinocchio Were a Reinforcement Learning Agent: A Normative End-to-End Pipeline
1️⃣ 一句话总结
这篇论文借鉴匹诺曹的故事,提出了一种让强化学习智能体理解和遵守社会规范的监督框架,通过论证式顾问来指导智能体行为,并研究了如何防止它们钻规则空子。