深度研究:一项系统性综述 / Deep Research: A Systematic Survey
1️⃣ 一句话总结
这篇论文系统性地综述了如何将大语言模型与外部工具(如搜索引擎)结合,使其成为能完成复杂、开放式任务的‘研究智能体’,并梳理了其技术路线、核心组件、优化方法以及面临的挑战。
请先 登录 后再提交论文
深度研究:一项系统性综述 / Deep Research: A Systematic Survey
这篇论文系统性地综述了如何将大语言模型与外部工具(如搜索引擎)结合,使其成为能完成复杂、开放式任务的‘研究智能体’,并梳理了其技术路线、核心组件、优化方法以及面临的挑战。
MiroThinker:通过模型、上下文和交互扩展提升开源研究智能体性能边界 / MiroThinker: Pushing the Performance Boundaries of Open-Source Research Agents via Model, Context, and Interactive Scaling
这篇论文提出了一个名为MiroThinker的开源研究智能体,它通过增加模型与环境交互的深度和频率来提升性能,在多项测试中表现优异,接近商业系统的水平,并证明交互扩展是提升智能体能力的第三个关键维度,与模型规模和上下文长度同样重要。
WebWeaver:通过动态大纲构建网络规模证据以支持开放式深度研究 / WebWeaver: Structuring Web-Scale Evidence with Dynamic Outlines for Open-Ended Deep Research
这篇论文提出了一个名为WebWeaver的双智能体框架,通过模拟人类研究过程,动态规划与证据收集相结合,有效解决了开放式深度研究中信息冗余、引用不准确和幻觉问题,从而生成结构清晰、可信赖的研究报告。
深度研究竞技场:基于学术研讨会的任务首次检验大语言模型的研究能力 / DeepResearch Arena: The First Exam of LLMs' Research Abilities via Seminar-Grounded Tasks
这篇论文提出了一个名为DeepResearch Arena的新基准测试,它利用真实学术研讨会内容自动生成高质量研究任务,有效评估大语言模型在多学科研究中的综合能力,并发现当前先进模型仍面临显著挑战。