arXiv ID:
2512.09756
arXiv 提交日期: 2025-12-10
MOA:面向角色扮演智能体的多目标对齐框架 / MOA: Multi-Objective Alignment for Role-Playing Agents
1️⃣ 一句话总结
这篇论文提出了一个名为MOA的强化学习框架,它通过同时优化多个细粒度的评估标准,有效解决了角色扮演智能体在遵循指令、展现知识、保持语言风格一致性等多方面难以兼顾的难题,使得一个较小的模型在多项任务上能媲美甚至超越GPT-4o等强大基线模型。