arXiv最新AI论文速览速学

🔍

标签: #research agents ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 50 72小时内新更新论文 72h更新 50 最新: SynPlanResearch-R1: Encouraging Tool Exploration for Deep Research with Synthetic Plans 03-16

arXiv ID: 2603.07853

arXiv 提交日期: 2026-03-09

llm agents model training research agents tool usage exploration reinforcement learning synthetic data

SynPlanResearch-R1：通过合成规划鼓励深度研究中的工具探索 / SynPlanResearch-R1: Encouraging Tool Exploration for Deep Research with Synthetic Plans

1️⃣ 一句话总结

这篇论文提出了一个名为SynPlanResearch-R1的框架，它通过合成工具使用轨迹来引导研究型AI代理进行更深入、更全面的探索，从而显著提升了其在多项复杂网络搜索任务中的表现。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.04577

arXiv 提交日期: 2026-01-08

llm data model evaluation scientific reasoning dataset innovation patterns research agents knowledge synthesis

Sci-Reasoning：一个解码人工智能创新模式的数据集 / Sci-Reasoning: A Dataset Decoding AI Innovation Patterns

1️⃣ 一句话总结

这篇论文构建了一个名为Sci-Reasoning的数据集，通过追踪顶级AI会议论文与其关键前作之间的推理联系，首次系统地揭示了AI研究背后的核心思维模式，并发现其中三种主要策略（如填补空白和跨领域融合）主导了超过一半的创新。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.02038

arXiv 提交日期: 2025-11-24

llm agents systems survey research agents reasoning retrieval-augmented generation evaluation

深度研究：一项系统性综述 / Deep Research: A Systematic Survey

1️⃣ 一句话总结

这篇论文系统性地综述了如何将大语言模型与外部工具（如搜索引擎）结合，使其成为能完成复杂、开放式任务的‘研究智能体’，并梳理了其技术路线、核心组件、优化方法以及面临的挑战。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2511.11793

arXiv 提交日期: 2025-11-14

agents llm model training research agents tool-augmented reasoning interaction scaling reinforcement learning benchmark evaluation

MiroThinker：通过模型、上下文和交互扩展提升开源研究智能体性能边界 / MiroThinker: Pushing the Performance Boundaries of Open-Source Research Agents via Model, Context, and Interactive Scaling

1️⃣ 一句话总结

这篇论文提出了一个名为MiroThinker的开源研究智能体，它通过增加模型与环境交互的深度和频率来提升性能，在多项测试中表现优异，接近商业系统的水平，并证明交互扩展是提升智能体能力的第三个关键维度，与模型规模和上下文长度同样重要。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2509.13312

arXiv 提交日期: 2025-09-16

agents natural language processing systems research agents evidence synthesis citation grounding iterative planning hierarchical retrieval

WebWeaver：通过动态大纲构建网络规模证据以支持开放式深度研究 / WebWeaver: Structuring Web-Scale Evidence with Dynamic Outlines for Open-Ended Deep Research

1️⃣ 一句话总结

这篇论文提出了一个名为WebWeaver的双智能体框架，通过模拟人类研究过程，动态规划与证据收集相结合，有效解决了开放式深度研究中信息冗余、引用不准确和幻觉问题，从而生成结构清晰、可信赖的研究报告。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2509.01396

arXiv 提交日期: 2025-09-01

llm agents benchmark research agents evaluation benchmark multi-agent systems task generation academic seminars

深度研究竞技场：基于学术研讨会的任务首次检验大语言模型的研究能力 / DeepResearch Arena: The First Exam of LLMs' Research Abilities via Seminar-Grounded Tasks

1️⃣ 一句话总结

这篇论文提出了一个名为DeepResearch Arena的新基准测试，它利用真实学术研讨会内容自动生成高质量研究任务，有效评估大语言模型在多学科研究中的综合能力，并发现当前先进模型仍面临显著挑战。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2603.07853

1️⃣ 一句话总结

arXiv ID: 2601.04577

1️⃣ 一句话总结

arXiv ID: 2512.02038

1️⃣ 一句话总结

arXiv ID: 2511.11793

1️⃣ 一句话总结

arXiv ID: 2509.13312

1️⃣ 一句话总结

arXiv ID: 2509.01396

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2603.07853 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.04577 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.02038 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2511.11793 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2509.13312 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2509.01396 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2603.07853

arXiv ID: 2601.04577

arXiv ID: 2512.02038

arXiv ID: 2511.11793

arXiv ID: 2509.13312

arXiv ID: 2509.01396