arXiv最新AI论文速览速学

🔍

agents ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 39 72小时内新更新论文 72h更新 139 最新: Optimally Auditing Adversarial Agents 05-02

arXiv ID: 2604.24826

arXiv 提交日期: 2026-04-27

llm agents model evaluation security guardrails benchmark risk detection comparative evaluation

AI智能体安全防护栏的对比评估 / A Comparative Evaluation of AI Agent Security Guardrails

1️⃣ 一句话总结

本文通过对比评测DKnownAI Guard与AWS、Azure、Lakera三款主流AI安全防护产品，发现DKnownAI Guard在识别针对智能体自身的攻击和有害内容请求时，达到了96.5%的最高召回率和90.4%的最高真负率，综合表现最佳。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.23993

arXiv 提交日期: 2026-04-27

reinforcement learning natural language processing agents e-commerce product mapping model distillation parameter-efficient fine-tuning reasoning

EPM-RL：面向电商内部部署的产品映射强化学习方法 / EPM-RL: Reinforcement Learning for On-Premise Product Mapping in E-Commerce

1️⃣ 一句话总结

本文提出EPM-RL框架，通过强化学习将昂贵的大模型推理能力蒸馏到小型本地模型中，在保证产品映射准确性的同时大幅降低部署成本和延迟，使得电商平台可以安全、高效地在内部服务器上运行产品匹配系统。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.24338

arXiv 提交日期: 2026-04-27

reinforcement learning agents aircraft maneuvers pilot training simulation jet trainer

用强化学习完善飞机机动动作 / Perfecting Aircraft Maneuvers with Reinforcement Learning

1️⃣ 一句话总结

本研究通过训练强化学习智能体模拟多种飞行特技动作，旨在开发一套AI辅助的飞行员训练模块，帮助未来飞行员更高效地掌握特定机型的机动操作。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.24461

arXiv 提交日期: 2026-04-27

agents human-ai interaction evaluation cooperation teamwork scale development perceived cooperativity teaming perception

衡量人机协作中的成功合作：感知协作性与团队感知量表的开发与验证 / Measuring Successful Cooperation in Human-AI Teamwork: Development and Validation of the Perceived Cooperativity and Teaming Perception Scales

1️⃣ 一句话总结

本研究开发并验证了两套问卷工具，分别用于衡量人机互动中单次交互的协作质量和长期形成的团队感，帮助跨学科研究者快速评估AI系统是否真正像可靠的队友一样工作。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.24697

arXiv 提交日期: 2026-04-27

agents benchmark general causal reasoning discovery-to-application minecraft evaluation diagnostic

当前智能体能否弥合从发现到应用的鸿沟？以《我的世界》为案例的研究 / Can Current Agents Close the Discovery-to-Application Gap? A Case Study in Minecraft

1️⃣ 一句话总结

本文通过在《我的世界》游戏中设计一系列需要自主发现规律并应用来点亮指定红石灯的任务，评测了GPT-5.2等前沿AI模型，发现它们仅能达到约26%的成功率，且模型的主要瓶颈正从“如何正确解决问题”转向“如何提出正确的问题”，即识别知识缺口的能力成为新的关键挑战。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.24117

arXiv 提交日期: 2026-04-27

reinforcement learning agents systems multi-agent reinforcement learning job shop scheduling transportation resources coordination gap modular training

联合学习与模块化学习在含运输资源的作业车间调度中的协调差距分析 / An Analysis of the Coordination Gap between Joint and Modular Learning for Job Shop Scheduling with Transportation Resources

1️⃣ 一句话总结

本文系统比较了联合训练（同时优化生产与运输调度）和模块化训练（分别优化后组合）在作业车间调度问题中的效果，发现联合训练整体上优于模块化训练，但在资源瓶颈严重的环境中优势减弱，从而为根据实际环境选择最佳训练方式提供了实用指导。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.24039

arXiv 提交日期: 2026-04-27

agents llm systems embodied ai planning cache efficiency multi-agent

AgenticCache：面向具身AI智能体的缓存驱动异步规划框架 / AgenticCache: Cache-Driven Asynchronous Planning for Embodied AI Agents

1️⃣ 一句话总结

为解决具身AI智能体每次行动都需要调用大语言模型导致的高延迟和高成本问题，本文提出了一种名为AgenticCache的规划框架，它利用缓存已生成的行动序列来替代频繁的模型调用，并通过后台异步更新保证缓存内容的准确性，在多个标准测试中将任务成功率提升22%，同时将延迟和计算成本分别降低65%和50%。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.24020

arXiv 提交日期: 2026-04-27

agents security llm autonomous agents security awareness training prompt injection self-play training memory accumulation

ClawdGo：面向自主人工智能智能体的内生安全意识训练 / Poster: ClawdGo: Endogenous Security Awareness Training for Autonomous AI Agents

1️⃣ 一句话总结

本文提出ClawdGo框架，通过让AI智能体在推理时自主扮演攻击者、防御者和评估者进行自对弈训练，在不修改模型的情况下，大幅提升其识别和应对提示注入、记忆投毒等内部安全威胁的能力，并发现了过度训练可能导致误报正常请求的新问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.23646

arXiv 提交日期: 2026-04-26

agents systems llm agent safety separation of powers goal integrity formal verification architecture

基于分权架构的AI智能体目标完整性结构性保障 / Structural Enforcement of Goal Integrity in AI Agents via Separation-of-Powers Architecture

1️⃣ 一句话总结

该论文提出一种名为PEA的“三权分立”系统架构，通过将意图生成、授权和执行相互隔离并利用加密令牌进行约束，从根本上解决了AI智能体在缺乏用户明确指令时仍可能自行构建并执行有害行为的安全隐患，从而将智能体的安全性从概率性的行为控制提升为系统层面的结构性保障。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.23366

arXiv 提交日期: 2026-04-25

llm agents model evaluation hallucination detection groundedness multi-agent systems replanning factual consistency

GSAR：面向多智能体大语言模型幻觉检测与恢复的带类型依据评分框架 / GSAR: Typed Grounding for Hallucination Detection and Recovery in Multi-Agent LLMs

1️⃣ 一句话总结

本文提出GSAR框架，通过将模型陈述分为四类依据（有据、无据、矛盾、补充），并引入加权评分与三级决策（继续、重生成、重规划）机制，有效检测和修复多智能体大语言模型生成内容中的幻觉问题，在多种独立评估模型上均验证了其稳定性和有效性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2604.24826

1️⃣ 一句话总结

arXiv ID: 2604.23993

1️⃣ 一句话总结

arXiv ID: 2604.24338

1️⃣ 一句话总结

arXiv ID: 2604.24461

1️⃣ 一句话总结

arXiv ID: 2604.24697

1️⃣ 一句话总结

arXiv ID: 2604.24117

1️⃣ 一句话总结

arXiv ID: 2604.24039

1️⃣ 一句话总结

arXiv ID: 2604.24020

1️⃣ 一句话总结

arXiv ID: 2604.23646

1️⃣ 一句话总结

arXiv ID: 2604.23366

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2604.24826 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.23993 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.24338 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.24461 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.24697 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.24117 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.24039 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.24020 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.23646 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.23366 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2604.24826

arXiv ID: 2604.23993

arXiv ID: 2604.24338

arXiv ID: 2604.24461

arXiv ID: 2604.24697

arXiv ID: 2604.24117

arXiv ID: 2604.24039

arXiv ID: 2604.24020

arXiv ID: 2604.23646

arXiv ID: 2604.23366