arXiv ID:
2605.05724
arXiv 提交日期: 2026-05-07
基于专家智能体的自动研究:开发有效且非平凡的训练方案 / Auto Research with Specialist Agents Develops Effective and Non-Trivial Training Recipes
1️⃣ 一句话总结
本文提出一种由外部评估驱动的自动研究循环系统,通过多个专家智能体分工协作,在无人干预的情况下自主生成、测试并改进训练方案,成功在多个任务上取得显著性能提升,并展示了智能体能够从失败反馈中学习并执行程序级修改的能力。