arXiv ID:
2605.18703
arXiv 提交日期: 2026-05-18
EnvFactory:通过可执行环境合成与稳健强化学习规模化工具使用智能体 / EnvFactory: Scaling Tool-Use Agents via Executable Environments Synthesis and Robust RL
1️⃣ 一句话总结
本文提出EnvFactory,一个全自动框架,能够从真实资源中自主构建可执行的工具环境,并合成自然的、含隐式意图的多轮对话轨迹,从而在无需昂贵人工标注或易出错的模拟器的情况下,高效训练具备工具使用能力的强化学习智能体,在多个基准测试上显著提升模型性能。