arXiv最新AI论文速览速学

🔍

标签: #agents ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 39 72小时内新更新论文 72h更新 139 最新: Optimally Auditing Adversarial Agents 05-02

arXiv ID: 2604.27895

arXiv 提交日期: 2026-04-30

machine learning agents model training world models graph neural networks relational inductive bias taxonomy environment modeling

图世界模型：概念、分类与未来方向 / Graph World Models: Concepts, Taxonomy, and Future Directions

1️⃣ 一句话总结

本文首次系统定义了“图世界模型”这一统一研究范式，通过将环境分解为实体节点和交互边，解决了传统世界模型对噪声敏感、错误累积及推理能力弱的问题，并依据关系归纳偏置将其分为空间拓扑抽象、物理动态模拟及逻辑因果推理三类，为构建更鲁棒和可解释的智能体预测与规划系统提供了新思路。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.27859

arXiv 提交日期: 2026-04-30

reinforcement learning llm agents agentic rl meta-reasoning self-reflection long-term planning goal-setting

重新思考大型语言模型中的智能体强化学习 / Rethinking Agentic Reinforcement Learning In Large Language Models

1️⃣ 一句话总结

本文探讨了如何将强化学习与大型语言模型结合，使AI不仅能完成预设任务，还能像智能体一样自主设定目标、进行长期规划和动态决策，从而在复杂、不确定的真实环境中更灵活地学习和行动。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.27906

arXiv 提交日期: 2026-04-30

agents systems model evaluation memory systems knowledge extraction benchmark stateful agents schema grounding

从非结构化回忆到基于模式的记忆：通过迭代、模式感知提取实现可靠的AI记忆 / From Unstructured Recall to Schema-Grounded Memory: Reliable AI Memory via Iterative, Schema-Aware Extraction

1️⃣ 一句话总结

本文提出了一种让AI记忆系统更可靠的新方法：通过预先定义好需要记住的信息格式（即“模式”），并让AI在写入记忆时反复核对这些信息，从而将原本依赖“搜索和推测”的记忆方式，转变为“精准记录和查询”，大幅提升了AI在需要精确事实和状态更新场景下的表现。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.27819

arXiv 提交日期: 2026-04-30

agents systems evaluation multi-server mcp credential propagation taint tracking benchmark information flow

MCPHunt：多服务器MCP代理中跨边界数据传播的评估框架 / MCPHunt: An Evaluation Framework for Cross-Boundary Data Propagation in Multi-Server MCP Agents

1️⃣ 一句话总结

本文提出了MCPHunt，一个专门用于检测多服务器MCP代理系统中非恶意的、由工作流结构导致的凭证跨边界传播的基准测试框架，通过金丝雀污点追踪、环境控制和层次化策略分类，揭示了即使非恶意模型也会存在11.5%至41.3%的违规数据传播，并发现基于提示的防护虽可减少传播但效果因模型而异。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.27445

arXiv 提交日期: 2026-04-30

machine learning agents multi-modal intent inference bayesian methods non-speaking agents product-of-experts context prior

上下文作为先验：针对非语言智能体基于贝叶斯启发的意图推断——以家猫测试平台为例 / Context as Prior: Bayesian-Inspired Intent Inference for Non-Speaking Agents with a Household Cat Testbed

1️⃣ 一句话总结

本文提出了一种受贝叶斯思想启发的概率模型CatSignal，通过将环境上下文视为先验知识、行为观测视为证据，来推断无法用语言交流的智能体（如家猫）的意图，实验证明该方法比传统融合方式更准确，并能有效减少因过度依赖上下文而导致的错误预测。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.27586

arXiv 提交日期: 2026-04-30

agents system evaluation multi-agent information contamination trace analysis workflow robustness uncertainty injection

多智能体系统中信息污染的痕迹级分析 / Trace-Level Analysis of Information Contamination in Multi-Agent Systems

1️⃣ 一句话总结

本文通过向多智能体工作流中的人工制品（如PDF、表格）注入可控不确定性，系统研究了信息如何“污染”智能体的决策轨迹，发现即使工作流路径严重偏离也能得到正确答案，反之亦然，并据此提出了三种污染类型、一套痕迹测量框架及其对验证防御设计的启示。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.27699

arXiv 提交日期: 2026-04-30

agents llm value-driven planning hierarchical architecture embodied agents autonomy evaluation cognitive architecture

连接价值观与行为：面向主动型具身智能体的层次化框架 / Bridging Values and Behavior: A Hierarchical Framework for Proactive Embodied Agents

1️⃣ 一句话总结

本文提出一个名为 ValuePlanner 的智能体架构，通过将高层价值观决策与低层动作执行分离，让机器人能像人类一样根据内在价值权衡来主动规划长期行为，解决了现有智能体只能被动执行指令或单纯满足需求的局限。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.27392

arXiv 提交日期: 2026-04-30

systems agents general human-ai collaboration leadership framework heterogeneous teams decision making co-adaptability

跨越人机关系光谱的领导力：面向日益异构化团队的领导力概念框架 / Leading Across the Spectrum of Human-AI Relationships: A Conceptual Framework for Increasingly Heterogeneous Teams

1️⃣ 一句话总结

该论文提出一个包含五种人机协作模式（纯人类、半人马、平等共生、米诺陶、纯AI）的框架，帮助领导者识别和反思在重要决策中，究竟是谁在真正主导问题的定义、方向调整和最终责任，从而避免因误判人机关系而导致的权力、责任和信任错位。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.27578

arXiv 提交日期: 2026-04-30

computer vision agents data embodied ai 3d occupancy prediction scene reconstruction simulation environment dataset generation

世界到我的世界：基于占据预测的模拟场景构建 / World2Minecraft: Occupancy-Driven Simulated Scenes Construction

1️⃣ 一句话总结

本文提出了一种名为World2Minecraft的方法，能够将真实世界的场景自动转换为《我的世界》中的结构化三维环境，从而为具身智能研究（如视觉语言导航）提供一个低成本、可定制且易于编辑的高保真模拟平台，并为此构建了一个大规模三维占据预测数据集MinecraftOcc来提升场景重建的准确性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.27366

arXiv 提交日期: 2026-04-30

machine learning model training agents vision language action critic framework autonomous driving trajectory refinement bench2drive

先判断，再驾驶：一种以评判者为核心的视觉语言动作自动驾驶框架 / Judge, Then Drive: A Critic-Centric Vision Language Action Framework for Autonomous Driving

1️⃣ 一句话总结

该论文提出了一种名为CriticVLA的自动驾驶新方法，它让AI先像评判者一样评估自己生成的初步驾驶轨迹，再根据评估结果进行优化，从而在复杂场景下显著提升驾驶成功率，实验显示其总成功率高达73.33%，在困难场景中比现有技术提升了约30%。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2604.27895

1️⃣ 一句话总结

arXiv ID: 2604.27859

1️⃣ 一句话总结

arXiv ID: 2604.27906

1️⃣ 一句话总结

arXiv ID: 2604.27819

1️⃣ 一句话总结

arXiv ID: 2604.27445

1️⃣ 一句话总结

arXiv ID: 2604.27586

1️⃣ 一句话总结

arXiv ID: 2604.27699

1️⃣ 一句话总结

arXiv ID: 2604.27392

1️⃣ 一句话总结

arXiv ID: 2604.27578

1️⃣ 一句话总结

arXiv ID: 2604.27366

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2604.27895 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.27859 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.27906 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.27819 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.27445 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.27586 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.27699 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.27392 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.27578 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.27366 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2604.27895

arXiv ID: 2604.27859

arXiv ID: 2604.27906

arXiv ID: 2604.27819

arXiv ID: 2604.27445

arXiv ID: 2604.27586

arXiv ID: 2604.27699

arXiv ID: 2604.27392

arXiv ID: 2604.27578

arXiv ID: 2604.27366