🤖 系统
11-30 17:38
📄 论文总结
超越轮次限制:利用动态上下文窗口训练深度搜索智能体 / Beyond Turn Limits: Training Deep Search Agents with Dynamic Context Window
1️⃣ 一句话总结
这篇论文提出了名为DeepMiner的新框架,通过生成高难度训练任务和动态管理上下文窗口,有效提升了多轮对话智能体在长序列交互中的深度推理能力,并在多个搜索任务基准测试中取得了显著性能突破。