arXiv最新AI论文速览速学

🔍

标签: #agentic reasoning ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 50 72小时内新更新论文 72h更新 50 最新: ATLAS: Agentic or Latent Visual Reasoning? One Word is Enough for Both 05-15

arXiv ID: 2605.15198

arXiv 提交日期: 2026-05-14

multi-modal visual reasoning model training functional token latent reasoning agentic reasoning reinforcement learning visual reasoning benchmark

ATLAS：代理型还是潜在视觉推理？一个词足矣 / ATLAS: Agentic or Latent Visual Reasoning? One Word is Enough for Both

1️⃣ 一句话总结

本文提出ATLAS框架，通过引入一种称为“功能词”的特殊离散词元，将代理型推理（通过代码或工具调用）与潜在推理（通过隐式嵌入）的优势结合，无需生成中间图像或修改模型结构，从而高效、可解释地完成复杂视觉推理任务，并配合一种稳定强化学习训练的新方法LA-GRPO，在多个基准测试中取得了领先性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.24198

arXiv 提交日期: 2026-04-27

agents llm model evaluation process reward model data analysis silent error detection agentic reasoning reinforcement learning

奖励科学过程：面向智能体数据分析的过程级奖励建模 / Rewarding the Scientific Process: Process-Level Reward Modeling for Agentic Data Analysis

1️⃣ 一句话总结

本文提出了一种名为DataPRM的智能奖励模型，它能像经验丰富的导师一样，在数据分析任务中逐步识别AI助手的潜在错误（比如逻辑漏洞而非语法错误），同时学会区分“合理的探索尝试”和“真正的失误”，从而显著提升AI在复杂科学数据任务中的表现。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.14930

arXiv 提交日期: 2026-04-16

llm agents natural language processing information extraction agentic reasoning cognitive cache multi-step inference query-driven extraction

信息抽取作为缓存：信息抽取增强的智能体推理 / IE as Cache: Information Extraction Enhanced Agentic Reasoning

1️⃣ 一句话总结

这篇论文提出了一个名为“IE-as-Cache”的新框架，它不再把信息抽取仅仅当作最终目标，而是将其视为一个可重复利用的“思维缓存”，通过动态管理和复用抽取出的关键信息，来显著提升大语言模型在多步推理任务中的准确性和效率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.10063

arXiv 提交日期: 2026-02-10

llm agents theory reasoning framework cognitive modes adaptive orchestration agentic reasoning step-level reasoning

思维链：基于自适应认知模式的推理 / Chain of Mindset: Reasoning with Adaptive Cognitive Modes

1️⃣ 一句话总结

这篇论文提出了一个名为‘思维链’的新框架，它模仿人类解决问题的灵活思维，让大语言模型在推理的不同步骤中动态切换并使用最适合的思考模式，从而在多项复杂任务上取得了更好的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.16725

arXiv 提交日期: 2026-01-23

llm agents model training mixture of experts agentic reasoning reinforcement learning tool use robustness

LongCat-Flash-Thinking-2601 技术报告 / LongCat-Flash-Thinking-2601 Technical Report

1️⃣ 一句话总结

这篇论文介绍了一个名为LongCat-Flash-Thinking-2601的先进开源大模型，它通过创新的混合专家架构和统一的训练框架，在理解和执行复杂任务、使用多种工具方面表现出色，并且特别擅长处理现实世界中混乱、多步骤的交互场景。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.24330

arXiv 提交日期: 2025-12-30

multi-modal agents reinforcement learning vision-language models tool usage agentic reasoning benchmark policy optimization

SenseNova-MARS：通过强化学习赋能多模态智能体推理与搜索 / SenseNova-MARS: Empowering Multimodal Agentic Reasoning and Search via Reinforcement Learning

1️⃣ 一句话总结

这篇论文提出了一个名为SenseNova-MARS的新框架，它通过强化学习教会视觉语言模型像人一样，在解决复杂的视觉问题时，能动态、连贯地交替使用图像搜索、文本搜索和图像裁剪等多种外部工具，从而在知识密集型任务上超越了GPT-5等顶尖模型。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.23647

arXiv 提交日期: 2025-12-29

agents systems natural language processing information seeking browser agents web interaction tool use agentic reasoning

用于智能信息搜索的嵌套浏览器使用学习 / Nested Browser-Use Learning for Agentic Information Seeking

1️⃣ 一句话总结

这篇论文提出了一种名为NestBrowse的新方法，通过设计一个嵌套的浏览器操作框架，让AI智能体能够像人一样直接、高效地操作真实浏览器来获取深层网络信息，从而解决了现有信息搜索工具功能受限、难以处理复杂网页内容的问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.20848

arXiv 提交日期: 2025-12-23

llm model training agents mixture-of-experts mamba-transformer agentic reasoning large language model efficient inference

Nemotron 3 Nano：用于智能体推理的开放、高效的混合专家型Mamba-Transformer模型 / Nemotron 3 Nano: Open, Efficient Mixture-of-Experts Hybrid Mamba-Transformer Model for Agentic Reasoning

1️⃣ 一句话总结

这篇论文介绍了一个名为Nemotron 3 Nano的新型高效语言模型，它通过结合Mamba和Transformer架构以及混合专家技术，在保持高精度的同时大幅提升了推理速度，并增强了智能体交互和长文本理解能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.05774

arXiv 提交日期: 2025-12-05

agents video model evaluation active perception long video understanding multimodal llm evidence seeking agentic reasoning

主动视频感知：面向智能体长视频理解的迭代式证据搜寻 / Active Video Perception: Iterative Evidence Seeking for Agentic Long Video Understanding

1️⃣ 一句话总结

这篇论文提出了一个名为‘主动视频感知’的新框架，它让AI像侦探一样，在观看长视频时能主动、有选择地寻找与问题相关的关键视觉证据，从而用更少的计算量实现更准确的长视频理解。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2510.11701

arXiv 提交日期: 2025-10-13

reinforcement learning agents llm agentic reasoning tool usage training efficiency dataset quality exploration techniques

揭秘强化学习在智能体推理中的应用 / Demystifying Reinforcement Learning in Agentic Reasoning

1️⃣ 一句话总结

这项研究通过数据、算法和推理模式三个关键角度，揭示了提升大型语言模型智能体推理能力的有效方法，包括使用真实工具使用轨迹数据、探索友好的训练技巧以及减少工具调用的审慎策略，使得小模型也能达到甚至超越大模型的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2605.15198

1️⃣ 一句话总结

arXiv ID: 2604.24198

1️⃣ 一句话总结

arXiv ID: 2604.14930

1️⃣ 一句话总结

arXiv ID: 2602.10063

1️⃣ 一句话总结

arXiv ID: 2601.16725

1️⃣ 一句话总结

arXiv ID: 2512.24330

1️⃣ 一句话总结

arXiv ID: 2512.23647

1️⃣ 一句话总结

arXiv ID: 2512.20848

1️⃣ 一句话总结

arXiv ID: 2512.05774

1️⃣ 一句话总结

arXiv ID: 2510.11701

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2605.15198 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.24198 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.14930 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.10063 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.16725 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.24330 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.23647 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.20848 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.05774 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2510.11701 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2605.15198

arXiv ID: 2604.24198

arXiv ID: 2604.14930

arXiv ID: 2602.10063

arXiv ID: 2601.16725

arXiv ID: 2512.24330

arXiv ID: 2512.23647

arXiv ID: 2512.20848

arXiv ID: 2512.05774

arXiv ID: 2510.11701