arXiv ID:
2604.14877
arXiv 提交日期: 2026-04-16
强化学习真的扩展了大语言模型智能体的能力边界吗?一项基于PASS@(k,T)的分析 / Does RL Expand the Capability Boundary of LLM Agents? A PASS@(k,T) Analysis
1️⃣ 一句话总结
这篇论文通过引入一个新的评估指标PASS@(k,T)发现,在需要多轮交互和组合策略的复杂工具使用任务中,强化学习能真正扩展大语言模型智能体的能力边界,而不仅仅是提高其可靠性,其关键在于强化学习促进了智能体的自主探索和信息整合能力。