arXiv ID:
2604.17931
arXiv 提交日期: 2026-04-20
轻量研究者:面向深度研究智能体的可扩展强化学习训练框架 / LiteResearcher: A Scalable Agentic RL Training Framework for Deep Research Agent
1️⃣ 一句话总结
本文提出LiteResearcher框架,通过构建一个模拟真实搜索环境的轻量虚拟世界,解决了强化学习训练深度研究智能体时数据不真实、成本高和不稳定的问题,使得仅4B参数的模型在多个基准上超越了大型开源和商业模型。