arXiv最新AI论文速览速学

🔍

agents ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 98 72小时内新更新论文 72h更新 100 最新: AOHP: An Open-Source OS-Level Agent Harness for Personalized, Efficient and Secure Interaction 06-23

arXiv ID: 2606.19476

arXiv 提交日期: 2026-06-17

reinforcement learning machine learning agents intrinsic curiosity in-context learning exploration learning progress active learning

上下文学习能否支持内在好奇心？ / Can In-Context Learning Support Intrinsic Curiosity?

1️⃣ 一句话总结

本文探讨了能否利用大语言模型的上下文学习能力，在不进行昂贵梯度更新的情况下，高效计算“学习进步”奖励信号，从而驱动智能体自主探索数据，理论证明在一般强化学习环境中该方法存在偏差，但在非时序场景（如主动学习）中可以收敛到正确结果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.18788

arXiv 提交日期: 2026-06-17

llm agents multi-modal handwriting synthesis svg generation language-driven style imitation multi-lingual

手写智能体：在可缩放矢量空间中基于语言驱动的手写合成 / HandwritingAgent: Language-Driven Handwriting Synthesis in Scalable Vector Space

1️⃣ 一句话总结

本文提出了一种名为HandwritingAgent的智能系统，它无需针对特定风格进行训练，仅通过自然语言指令和参考手写样例，就能在矢量图形格式中自动生成逼真、多变的手写笔画序列，并且效果优于现有方法，可广泛应用于模仿、识别、多语言乃至复杂数学公式的手写生成。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.19632

arXiv 提交日期: 2026-06-17

reinforcement learning agents systems formal verification decision tree distillation multi-agent communication safety verification probabilistic model checking

基于决策树蒸馏的多智能体通信策略形式化验证 / Formal Verification of Learned Multi-Agent Communication Policies via Decision Tree Distillation

1️⃣ 一句话总结

本文提出首个端到端框架，通过将多智能体强化学习中的神经网络通信策略蒸馏为可解释的决策树，再对其进行形式化验证，从而在保证安全性的前提下，将验证结果可靠地迁移回原始神经策略，最终实现了无人机集群等场景下低碰撞概率等安全属性的严格证明。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.19286

arXiv 提交日期: 2026-06-17

llm agents behavior social chatbot self-correction credibility user study error recovery

自我纠错，保持信任：社交聊天机器人中自我纠错与社会连接如何影响可信度 / Correct Yourself, Keep My Trust: How Self-Correction and Social Connection Shape Credibility in Social Chatbots

1️⃣ 一句话总结

研究发现，当社交聊天机器人犯错时，由自己主动纠错比交给外部来源（如网页或专家机器人）更正更能维持用户对机器人的信任和专业感，并且用户与机器人的社会联系越强，自我纠错的说服效果越好。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.18661

arXiv 提交日期: 2026-06-17

computer vision agents multi-modal landslide identification domain rule augmentation vision-language model benchmark fine-grained classification

滑坡智能体与多模态滑坡基准：一种基于领域规则增强的自主滑坡识别与分析智能体 / LandslideAgent with Multimodal LandslideBench: A Domain-Rule-Augmented Agent for Autonomous Landslide Identification and Analysis

1️⃣ 一句话总结

本文提出了一种结合多模态数据集、专用视觉语言模型和领域规则控制器的智能体系统，能够像专家一样自主识别和分析滑坡灾害，显著提升了复杂地质场景下识别准确率和分析完整性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.19116

arXiv 提交日期: 2026-06-17

agents systems data web redesign ai agents access control economic model content quality

面向AI代理的Web重设计：原则与机制 / Towards an Agent-First Web: Redesigning the Web for AI Agents

1️⃣ 一句话总结

该论文系统性地提出了一个重构互联网的框架，通过访问层、经济层和内容层的协同重设计，将AI代理视为与人并列的一等网络公民，以解决现有网络在AI代理交互中出现的访问封锁、经济错位和知识退化问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.19152

arXiv 提交日期: 2026-06-17

agents machine learning chemistry multi-agent system catalysis adsorption configuration force field self-correction

AdsMind：一个基于物理的多智能体系统，用于异质催化剂表面吸附构型的自我修正发现 / AdsMind: A Physics-Grounded Multi-Agent System for Self-Correcting Discovery of Adsorption Configurations on Heterogeneous Catalyst Surfaces

1️⃣ 一句话总结

AdsMind提出了一种结合机器学习力场和多个智能体协作的闭环框架，能自动修正初始猜想中的错误，从而高效、可靠地找到催化剂表面最稳定的吸附结构，其成功率接近100%，且计算量仅为传统方法的十四分之一。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.18668

arXiv 提交日期: 2026-06-17

agents multi-agent abstention reliability hallucination llm-as-judge inter-agent communication

EARS：面向大规模多智能体系统中可靠子智能体建模的解释性弃权机制 / EARS: Explanatory Abstention for Reliable Sub-Agent Modeling in Large-scale Multi-Agent Systems

1️⃣ 一句话总结

本文提出了一种名为EARS的生产级框架，通过让子智能体在无法准确回答时，不仅主动弃权，还能向协调智能体提供结构化的错误原因和解释，从而显著提升大规模多智能体系统的可靠性和响应通过率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.19308

arXiv 提交日期: 2026-06-17

llm agents multi-agent decision-making game theory fictitious play stance entanglement multi-agent systems

通过多智能体虚构博弈增强大语言模型的决策能力 / Enhancing Decision-Making with Large Language Models through Multi-Agent Fictitious Play

1️⃣ 一句话总结

本文提出一种名为“多智能体虚构博弈”的新方法，让多个代表不同利益方的AI智能体通过反复模拟对手历史决策来相互博弈，从而解决传统分工方式无法处理的复杂决策问题，显著提升了竞争场景下的策略质量和鲁棒性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.18902

arXiv 提交日期: 2026-06-17

llm agents prompt optimization stochastic search multi-agent task-oriented dialogue black-box optimization

SAGE：基于智能体引导探索的随机提示优化方法 / SAGE: Stochastic Prompt Optimization via Agent-Guided Exploration

1️⃣ 一句话总结

本文提出了一种名为SAGE的多智能体提示优化框架，通过将人工诊断与定量验证相结合，在多个任务中有效提升了AI系统的表现，尤其是在心理健康聊天机器人场景中，经过多次A/B测试累积实现了显著的次日留存率增长。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2606.19476

1️⃣ 一句话总结

arXiv ID: 2606.18788

1️⃣ 一句话总结

arXiv ID: 2606.19632

1️⃣ 一句话总结

arXiv ID: 2606.19286

1️⃣ 一句话总结

arXiv ID: 2606.18661

1️⃣ 一句话总结

arXiv ID: 2606.19116

1️⃣ 一句话总结

arXiv ID: 2606.19152

1️⃣ 一句话总结

arXiv ID: 2606.18668

1️⃣ 一句话总结

arXiv ID: 2606.19308

1️⃣ 一句话总结

arXiv ID: 2606.18902

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2606.19476 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.18788 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.19632 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.19286 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.18661 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.19116 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.19152 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.18668 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.19308 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.18902 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2606.19476

arXiv ID: 2606.18788

arXiv ID: 2606.19632

arXiv ID: 2606.19286

arXiv ID: 2606.18661

arXiv ID: 2606.19116

arXiv ID: 2606.19152

arXiv ID: 2606.18668

arXiv ID: 2606.19308

arXiv ID: 2606.18902