arXiv最新AI论文速览速学

🔍

标签: #agents ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 35 72小时内新更新论文 72h更新 162 最新: Evasive Intelligence: Lessons from Malware Analysis for Evaluating AI Agents 03-23

arXiv ID: 2601.18226

arXiv 提交日期: 2026-01-26

agents systems model training self-evolving agents tool synthesis open-ended tasks zero-start learning evolutionary efficiency

云珏智能体技术报告：一个完全可复现、零起点、原位自进化的智能体系统，用于开放任务 / Yunjue Agent Tech Report: A Fully Reproducible, Zero-Start In-Situ Self-Evolving Agent System for Open-Ended Tasks

1️⃣ 一句话总结

这篇论文提出了一个名为‘原位自进化’的新方法，让智能体系统能够在没有预先设定工具和外部监督的开放环境中，通过与任务互动来自我学习、创造并优化新工具，从而持续提升其解决问题的能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.18631

arXiv 提交日期: 2026-01-26

multi-modal agents model training visual reasoning tool orchestration reinforcement learning multimodal llm generalization

AdaReasoner：面向迭代式视觉推理的动态工具编排 / AdaReasoner: Dynamic Tool Orchestration for Iterative Visual Reasoning

1️⃣ 一句话总结

这篇论文提出了一个名为AdaReasoner的多模态模型家族，它通过强化学习和自适应机制，让AI能够像人一样在复杂视觉推理任务中自主选择、组合和使用各种工具，并在多个基准测试中取得了领先的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.18491

arXiv 提交日期: 2026-01-26

agents model evaluation systems agent safety risk diagnosis guardrail framework benchmark transparency

AgentDoG：一个用于AI智能体安全与安全的诊断性护栏框架 / AgentDoG: A Diagnostic Guardrail Framework for AI Agent Safety and Security

1️⃣ 一句话总结

这篇论文提出了一个名为AgentDoG的智能诊断框架，它不仅能像‘交通护栏’一样防止AI智能体在执行任务时做出危险行为，还能像‘汽车诊断仪’一样深入分析危险行为的具体根源和原因，从而更有效地提升AI智能体的安全性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.18081

arXiv 提交日期: 2026-01-26

llm agents natural language processing academic rebuttal agentic framework retrieval-augmented generation planning scientific communication

DRPG（分解、检索、规划、生成）：一个用于学术反驳的智能体框架 / DRPG (Decompose, Retrieve, Plan, Generate): An Agentic Framework for Academic Rebuttal

1️⃣ 一句话总结

这篇论文提出了一个名为DRPG的四步智能体框架，它通过分解审稿意见、检索论文证据、规划反驳策略并生成回答，能够自动生成高质量且有针对性的学术论文反驳意见，其性能甚至超过了平均水平的人类作者。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.18202

arXiv 提交日期: 2026-01-26

agents data llm synthetic data generation question answering agent evaluation search agents execution feedback

SAGE：一种基于执行反馈的可控智能数据生成方法，用于深度搜索 / SAGE: Steerable Agentic Data Generation for Deep Search with Execution Feedback

1️⃣ 一句话总结

这篇论文提出了一种名为SAGE的自动化数据生成方法，它通过让数据生成器和搜索智能体进行多轮交互与反馈，能够自动为深度搜索任务生成高质量、难度可控的问答对，从而显著提升搜索智能体的性能，并降低对昂贵人工标注数据的依赖。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.18130

arXiv 提交日期: 2026-01-26

llm agents systems mixture-of-agents dynamic routing efficient inference model selection cost reduction

RouteMoA：无需预推理的动态路由提升高效混合智能体性能 / RouteMoA: Dynamic Routing without Pre-Inference Boosts Efficient Mixture-of-Agents

1️⃣ 一句话总结

这篇论文提出了一种名为RouteMoA的高效混合智能体框架，它通过一个轻量级评分器预先筛选模型，并结合评估与排名机制动态选择模型，从而在保持性能的同时大幅降低了计算成本和延迟。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.18157

arXiv 提交日期: 2026-01-26

agents multi-modal video egocentric video long-horizon reasoning entity scene graphs agentic framework video understanding

智能体驱动的超长视频理解 / Agentic Very Long Video Understanding

1️⃣ 一句话总结

这项研究提出了一种名为EGAgent的新框架，它利用实体场景图来帮助AI助手理解和推理持续数天甚至数周的个人穿戴设备拍摄的超长视频，从而在复杂的长时视频理解任务上取得了领先的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.18731

arXiv 提交日期: 2026-01-26

llm model training agents personalized alignment meta-learning reward modeling preference adaptation few-shot learning

一适应万：用于个性化大语言模型对齐的元奖励建模 / One Adapts to Any: Meta Reward Modeling for Personalized LLM Alignment

1️⃣ 一句话总结

这篇论文提出了一种名为‘元奖励建模’的新方法，通过元学习让奖励模型能够仅用少量用户反馈就快速学习并适应新用户的个性化偏好，从而更高效地实现大语言模型的个性化对齐。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.18418

arXiv 提交日期: 2026-01-26

llm agents model training software engineering agents mid-training agentic workflows data synthesis swe-bench

达芬奇-开发：面向软件工程的智能体原生中期训练 / daVinci-Dev: Agent-native Mid-training for Software Engineering

1️⃣ 一句话总结

这篇论文提出了一种名为‘智能体原生中期训练’的新方法，通过生成和利用模拟真实软件开发流程的训练数据，让大型语言模型能像人类程序员一样自主地理解、修改和测试复杂代码库，从而显著提升其在软件工程任务中的表现。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.18027

arXiv 提交日期: 2026-01-25

llm agents multi-modal social simulation emotion modeling agent memory pad representation long-horizon continuity

Sentipolis：用于社会模拟的情感感知智能体 / Sentipolis: Emotion-Aware Agents for Social Simulations

1️⃣ 一句话总结

这项研究提出了一个名为Sentipolis的新框架，它通过让AI智能体拥有持续的情感状态和记忆，解决了现有社会模拟中情感短暂、缺乏长期一致性的问题，从而能更真实地模拟人际关系的变化和形成。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2601.18226

1️⃣ 一句话总结

arXiv ID: 2601.18631

1️⃣ 一句话总结

arXiv ID: 2601.18491

1️⃣ 一句话总结

arXiv ID: 2601.18081

1️⃣ 一句话总结

arXiv ID: 2601.18202

1️⃣ 一句话总结

arXiv ID: 2601.18130

1️⃣ 一句话总结

arXiv ID: 2601.18157

1️⃣ 一句话总结

arXiv ID: 2601.18731

1️⃣ 一句话总结

arXiv ID: 2601.18418

1️⃣ 一句话总结

arXiv ID: 2601.18027

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2601.18226 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.18631 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.18491 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.18081 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.18202 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.18130 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.18157 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.18731 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.18418 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.18027 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2601.18226

arXiv ID: 2601.18631

arXiv ID: 2601.18491

arXiv ID: 2601.18081

arXiv ID: 2601.18202

arXiv ID: 2601.18130

arXiv ID: 2601.18157

arXiv ID: 2601.18731

arXiv ID: 2601.18418

arXiv ID: 2601.18027