arXiv ID:
2601.13572
强化智能体模型中的行为知识融合 / Behavior Knowledge Merge in Reinforced Agentic Models
1️⃣ 一句话总结
这篇论文针对强化学习训练的智能体模型,提出了一种名为RAM的分布感知融合框架,它通过区分并分别处理共享和任务特有的参数更新,有效解决了传统模型融合方法在整合多个任务专家时性能下降的问题,从而创造出一个性能优于单个专家的通用智能体。