arXiv最新AI论文速览速学

🔍

标签: #multi-agent systems ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 39 72小时内新更新论文 72h更新 139 最新: GSAR: Typed Grounding for Hallucination Detection and Recovery in Multi-Agent LLMs 05-02

arXiv ID: 2601.12538

arXiv 提交日期: 2026-01-18

llm agents theory autonomous agents reasoning multi-agent systems planning tool use

大语言模型的智能体推理 / Agentic Reasoning for Large Language Models

1️⃣ 一句话总结

这篇论文提出了一种将大语言模型转变为能够自主规划、行动和学习的智能体的新范式，以解决其在开放动态环境中的推理难题，并系统梳理了从单智能体基础能力到多智能体协作的完整技术路线图。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.09667

arXiv 提交日期: 2026-01-14

llm agents model evaluation multi-agent systems test-time reinforcement learning reasoning credit assignment deliberation

用于推理的协作式多智能体测试时强化学习 / Collaborative Multi-Agent Test-Time Reinforcement Learning for Reasoning

1️⃣ 一句话总结

这篇论文提出了一种名为MATTRL的新方法，它让多个AI专家在测试时通过讨论和分享经验来共同解决问题，从而显著提升了在医疗、数学等复杂任务上的推理准确率，且无需进行耗时的模型训练。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.09113

arXiv 提交日期: 2026-01-14

llm agents multi-modal memory mechanisms large language models survey continual learning multi-agent systems

AI海马体：我们距离人类记忆还有多远？ / The AI Hippocampus: How Far are We From Human Memory?

1️⃣ 一句话总结

这篇综述论文系统地梳理了大型语言模型和多模态大模型中的记忆机制，将其分为内隐、外显和智能体记忆三大类，并探讨了这些机制如何提升模型的推理、适应和交互能力，以及当前面临的主要挑战。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.03315

arXiv 提交日期: 2026-01-06

llm agents model evaluation autonomous research scientific workflow agent failure modes ai scientist multi-agent systems

为何大语言模型尚非科学家：来自四次自主研究尝试的启示 / Why LLMs Aren't Scientists Yet: Lessons from Four Autonomous Research Attempts

1️⃣ 一句话总结

这篇论文通过四次让大语言模型自主生成机器学习研究论文的尝试，发现其中三次失败，揭示了AI在自主科研中存在的六大常见缺陷，并提出了构建更可靠AI科学家系统的设计原则。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.08296

arXiv 提交日期: 2025-12-09

agents systems model evaluation multi-agent systems scaling principles coordination trade-offs task characterization benchmark design

智能体系统的定量扩展原理 / Towards a Science of Scaling Agent Systems

1️⃣ 一句话总结

本文提出了一个量化框架，揭示了智能体系统性能并非简单地随智能体数量增加而提升，而是由任务特性、协调机制与模型能力之间的复杂权衡所主导，并建立了基于任务可测量属性的架构选择预测模型。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.08870

arXiv 提交日期: 2025-12-09

llm agents model training federated learning self-evolution privacy multi-agent systems parameter-efficient fine-tuning

Fed-SE：面向隐私受限多环境大语言模型智能体的联邦自进化框架 / Fed-SE: Federated Self-Evolution for Privacy-Constrained Multi-Environment LLM Agents

1️⃣ 一句话总结

这篇论文提出了一个名为Fed-SE的新框架，它能让部署在不同环境中的大语言模型智能体在不共享原始数据、保护隐私的前提下，通过本地自我进化和全局知识聚合的方式协同学习，有效解决了传统联邦学习方法在动态、多样化任务中遇到的性能冲突问题，从而显著提升了智能体的任务成功率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.07921

arXiv 提交日期: 2025-12-08

llm agents systems code generation multi-agent systems retrieval-augmented generation information flow benchmark

DeepCode：一个基于信息流管理的文档到代码库合成框架 / DeepCode: Open Agentic Coding

1️⃣ 一句话总结

DeepCode是一个全新的、完全自主的智能编码框架，它将复杂的文档（如科学论文）到可执行代码库的合成过程，重新构想为一个信息流管理问题，通过协调多种信息操作（如蓝图蒸馏、结构化记忆、检索增强生成和闭环纠错），在有限的上文预算下最大化任务相关信号，从而在基准测试中超越了领先的商业代理和人类专家。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.06749

arXiv 提交日期: 2025-12-07

llm agents systems debugging multi-agent systems failure analysis intervention evaluation

DoVer：面向大语言模型多智能体系统的干预驱动式自动调试方法 / DoVer: Intervention-Driven Auto Debugging for LLM Multi-Agent Systems

1️⃣ 一句话总结

这篇论文提出了一个名为DoVer的自动调试框架，它通过主动干预和验证来定位并修复大语言模型多智能体系统中的故障，显著提升了任务成功率，为复杂AI系统的可靠性调试提供了新思路。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.01078

arXiv 提交日期: 2025-11-30

agents systems multi-modal simulation embodied ai autonomous agents evaluation multi-agent systems

SimWorld：一个面向物理与社交世界中自主智能体的开放式真实模拟器 / SimWorld: An Open-ended Realistic Simulator for Autonomous Agents in Physical and Social Worlds

1️⃣ 一句话总结

这篇论文介绍了一个名为SimWorld的新型高仿真模拟器，它基于虚幻引擎5构建，旨在为大型语言模型和视觉语言模型驱动的智能体提供一个开放、真实且可定制的物理与社交环境，以训练和评估它们在复杂现实任务（如多智能体协作与竞争）中的表现，并揭示了不同前沿模型的推理模式与局限。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2511.20639

arXiv 提交日期: 2025-11-25

multi-agents llm systems latent collaboration multi-agent systems hidden embeddings latent working memory efficiency optimization

多智能体系统中的潜在协作 / Latent Collaboration in Multi-Agent Systems

1️⃣ 一句话总结

这篇论文提出了一个名为LatentMAS的无训练框架，让多个AI智能体直接在内部表示空间中进行协作，相比传统基于文本交互的方法，不仅显著提升了推理准确率和效率，还大幅降低了计算和通信开销。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2601.12538

1️⃣ 一句话总结

arXiv ID: 2601.09667

1️⃣ 一句话总结

arXiv ID: 2601.09113

1️⃣ 一句话总结

arXiv ID: 2601.03315

1️⃣ 一句话总结

arXiv ID: 2512.08296

1️⃣ 一句话总结

arXiv ID: 2512.08870

1️⃣ 一句话总结

arXiv ID: 2512.07921

1️⃣ 一句话总结

arXiv ID: 2512.06749

1️⃣ 一句话总结

arXiv ID: 2512.01078

1️⃣ 一句话总结

arXiv ID: 2511.20639

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2601.12538 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.09667 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.09113 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.03315 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.08296 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.08870 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.07921 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.06749 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.01078 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2511.20639 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2601.12538

arXiv ID: 2601.09667

arXiv ID: 2601.09113

arXiv ID: 2601.03315

arXiv ID: 2512.08296

arXiv ID: 2512.08870

arXiv ID: 2512.07921

arXiv ID: 2512.06749

arXiv ID: 2512.01078

arXiv ID: 2511.20639