arXiv最新AI论文速览速学

🔍

标签: #multi-agent ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 99 72小时内新更新论文 72h更新 100 最新: EARS: Explanatory Abstention for Reliable Sub-Agent Modeling in Large-scale Multi-Agent Systems 06-18

arXiv ID: 2606.18668

arXiv 提交日期: 2026-06-17

agents multi-agent abstention reliability hallucination llm-as-judge inter-agent communication

EARS：面向大规模多智能体系统中可靠子智能体建模的解释性弃权机制 / EARS: Explanatory Abstention for Reliable Sub-Agent Modeling in Large-scale Multi-Agent Systems

1️⃣ 一句话总结

本文提出了一种名为EARS的生产级框架，通过让子智能体在无法准确回答时，不仅主动弃权，还能向协调智能体提供结构化的错误原因和解释，从而显著提升大规模多智能体系统的可靠性和响应通过率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.19308

arXiv 提交日期: 2026-06-17

llm agents multi-agent decision-making game theory fictitious play stance entanglement multi-agent systems

通过多智能体虚构博弈增强大语言模型的决策能力 / Enhancing Decision-Making with Large Language Models through Multi-Agent Fictitious Play

1️⃣ 一句话总结

本文提出一种名为“多智能体虚构博弈”的新方法，让多个代表不同利益方的AI智能体通过反复模拟对手历史决策来相互博弈，从而解决传统分工方式无法处理的复杂决策问题，显著提升了竞争场景下的策略质量和鲁棒性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.18902

arXiv 提交日期: 2026-06-17

llm agents prompt optimization stochastic search multi-agent task-oriented dialogue black-box optimization

SAGE：基于智能体引导探索的随机提示优化方法 / SAGE: Stochastic Prompt Optimization via Agent-Guided Exploration

1️⃣ 一句话总结

本文提出了一种名为SAGE的多智能体提示优化框架，通过将人工诊断与定量验证相结合，在多个任务中有效提升了AI系统的表现，尤其是在心理健康聊天机器人场景中，经过多次A/B测试累积实现了显著的次日留存率增长。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.13604

arXiv 提交日期: 2026-06-11

reinforcement learning systems machine learning multi-agent offline rl dispatch optimization marketplace deployment

基于延迟市场反馈的多智能体强化学习：面向三方配送的权重自适应方法 / Multi-Agent Reinforcement Learning from Delayed Marketplace Feedback for Objective-Weight Adaptation in Three-Sided Dispatch

1️⃣ 一句话总结

本文提出了一种在DoorDash外卖平台上实际部署的强化学习系统，它利用延迟的运营数据（如配送速度和骑手利用率）来动态调整配送决策中的目标权重，在不影响用户体验的前提下，提升批次配送效率并降低骑手的时间成本。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.04484

arXiv 提交日期: 2026-06-03

llm agents systems reinforcement learning multi-agent distributed training fault tolerance automated research

AgentJet：一种灵活的强化学习智能体群训练框架 / AgentJet: A Flexible Swarm Training Framework for Agentic Reinforcement Learning

1️⃣ 一句话总结

AgentJet是一种创新的分布式训练框架，通过将模型优化与智能体执行解耦，支持异构多模型协作、多任务混合训练、容错运行和实时代码修改，同时引入上下文追踪模块加速训练，并能够自动完成长达数天的复杂强化学习研究实验。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.27850

arXiv 提交日期: 2026-05-27

agents multi-agent co-evolution prompt optimization communication topology benchmark cost-aware

TCP-MCP：面向多智能体系统的提示与通信拓扑景观引导协同进化 / TCP-MCP: Landscape-Guided Co-Evolution of Prompts and Communication Topologies for Multi-Agent Systems

1️⃣ 一句话总结

该论文提出一种名为TCP-MCP的协同进化框架，通过将智能体的提示词和它们之间的通信网络结构视为一个整体基因，并利用初始时对问题“地形”的探测和帕累托最优诊断，同时优化任务表现、计算成本和系统复杂度，从而在多个基准测试中实现更高效、更省钱的多智能体协作系统设计。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.20618

arXiv 提交日期: 2026-05-20

agents machine learning reinforcement learning vehicle routing multi-agent search graph combinatorial optimization heuristics

COAgents：用于学习和导航路径规划问题搜索空间的多智能体框架 / COAgents: Multi-Agent Framework to Learn and Navigate Routing Problems Search Space

1️⃣ 一句话总结

本文提出了一种名为COAgents的多智能体协作框架，通过将搜索过程建模为图，并训练多个智能体分别负责局部改进、跳跃探索和节点选择，从而更高效地解决车辆路径规划问题，在多个基准测试上取得了领先性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.18078

arXiv 提交日期: 2026-05-18

reinforcement learning multi-agent theory equilibrium selection policy gradient nash equilibrium basin entry coordination

多智能体策略梯度中的均衡选择：基于对手感知的盆地区域进入机制 / Equilibrium Selection in Multi-Agent Policy Gradients via Opponent-Aware Basin Entry

1️⃣ 一句话总结

本文提出了一种通过对手感知的更新机制，帮助多智能体系统在策略梯度训练中更大概率进入合作性更优的均衡状态，并在进入后恢复标准算法以保留局部收敛保证。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.18572

arXiv 提交日期: 2026-05-18

llm agents multi-agent persuasive dialogue mental state inference meta-cognition strategy selection autonomous agents

MA²P：一种用于复杂说服任务的元认知自主智能体框架 / MA$^{2}$P: A Meta-Cognitive Autonomous Intelligent Agents Framework for Complex Persuasion

1️⃣ 一句话总结

该论文提出了一种名为MA²P的元认知自主智能体框架，通过多智能体协作和元策略配置器，解决了复杂对话中说服成功率低、跨领域性能不稳定等问题，在说服任务上显著优于现有方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.14537

arXiv 提交日期: 2026-05-14

llm agents benchmark multi-agent strategic reasoning bargaining bluffing economic game

牛商战：用于评估大语言模型虚张声势、竞价与谈判能力的多智能体基准 / Cattle Trade: A Multi-Agent Benchmark for LLM Bluffing, Bidding, and Bargaining

1️⃣ 一句话总结

本文提出了一个名为“牛商战”的多智能体游戏基准，通过结合拍卖、秘密交易、谈判与虚张声势等复杂经济互动，全面测试大语言模型在信息不完全、资源有限且利益冲突的环境中的综合策略推理能力，并揭示了当前模型在预算控制、避免自我竞价和适应对手行为等方面的常见缺陷。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2606.18668

1️⃣ 一句话总结

arXiv ID: 2606.19308

1️⃣ 一句话总结

arXiv ID: 2606.18902

1️⃣ 一句话总结

arXiv ID: 2606.13604

1️⃣ 一句话总结

arXiv ID: 2606.04484

1️⃣ 一句话总结

arXiv ID: 2605.27850

1️⃣ 一句话总结

arXiv ID: 2605.20618

1️⃣ 一句话总结

arXiv ID: 2605.18078

1️⃣ 一句话总结

arXiv ID: 2605.18572

1️⃣ 一句话总结

arXiv ID: 2605.14537

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2606.18668 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.19308 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.18902 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.13604 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.04484 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.27850 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.20618 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.18078 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.18572 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.14537 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2606.18668

arXiv ID: 2606.19308

arXiv ID: 2606.18902

arXiv ID: 2606.13604

arXiv ID: 2606.04484

arXiv ID: 2605.27850

arXiv ID: 2605.20618

arXiv ID: 2605.18078

arXiv ID: 2605.18572

arXiv ID: 2605.14537