arXiv ID:
2603.16152
arXiv 提交日期: 2026-03-17
HIPO:通过约束强化学习实现指令层级化 / HIPO: Instruction Hierarchy via Constrained Reinforcement Learning
1️⃣ 一句话总结
这篇论文提出了一种名为HIPO的新方法,它通过约束强化学习让大语言模型能更好地遵循一组有优先级的复杂指令,确保核心系统指令得到严格遵守,同时提升对用户指令的响应效果。