arXiv ID:
2601.16443
arXiv 提交日期: 2026-01-23
无尽终端:为终端智能体扩展强化学习环境 / Endless Terminals: Scaling RL Environments for Terminal Agents
1️⃣ 一句话总结
这篇论文提出了一个名为‘无尽终端’的自动化系统,能够大规模生成用于训练终端操作智能体的多样化任务环境,使得即使采用简单的强化学习方法,也能显著提升模型在终端任务上的表现。