arXiv最新AI论文速览速学

🔍

agents ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 170 72小时内新更新论文 72h更新 265 最新: A proof-of-concept for automated AI-driven stellarator coil optimization with in-the-loop finite-element calculations 03-18

arXiv ID: 2602.19930

arXiv 提交日期: 2026-02-23

agents machine learning theory imitation learning compositional generalization lifelong adaptation behavioral primitives hybrid architectures

超越模仿：迈向具有终身适应能力的模仿学习 / Beyond Mimicry: Toward Lifelong Adaptability in Imitation Learning

1️⃣ 一句话总结

这篇论文认为当前模仿学习系统只是擅长死记硬背的‘回放机器’，无法适应环境变化，因此提出一个将成功标准从‘完美复现’转向‘组合式适应能力’的研究新方向，旨在让智能体学会基本行为单元后，无需重新训练就能在新环境中灵活重组它们，从而具备在开放世界中长期运作的核心能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.19502

arXiv 提交日期: 2026-02-23

agents medical benchmark agentic ai clinical prediction multimodal data human-in-the-loop healthcare benchmark

人机协作的智能体AI用于多模态临床预测：来自AgentDS医疗基准测试的经验 / Human-Guided Agentic AI for Multimodal Clinical Prediction: Lessons from the AgentDS Healthcare Benchmark

1️⃣ 一句话总结

这篇论文通过一项医疗AI基准测试发现，在临床预测任务的关键环节引入人类专家的指导，尤其是在多模态数据处理和模型选择方面，能显著提升AI系统的性能，其效果优于完全自动化的方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.19225

arXiv 提交日期: 2026-02-22

llm agents model training credit assignment multi-turn optimization policy gradient agent training proximity weighting

基于邻近性的多轮优化：面向大语言模型智能体训练的实用信用分配方法 / Proximity-Based Multi-Turn Optimization: Practical Credit Assignment for LLM Agent Training

1️⃣ 一句话总结

这篇论文提出了一种名为ProxMO的新方法，它通过动态评估任务难度和步骤间的语义关联，更精准地识别并奖励大语言模型智能体在复杂多轮对话中的关键成功步骤，从而用更少的训练样本实现更高效的性能提升，并能轻松集成到现有的工业级训练流程中。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.19317

arXiv 提交日期: 2026-02-22

llm natural language processing agents personalized qa retrieval-augmented generation reinforcement learning reasoning retrieval policy

学习推理以实现个性化问答中个人上下文的多步骤检索 / Learning to Reason for Multi-Step Retrieval of Personal Context in Personalized Question Answering

1️⃣ 一句话总结

这篇论文提出了一个名为PR2的强化学习框架，它通过让AI学习在回答个性化问题时，智能地决定何时、如何从用户个人资料中检索信息并融入推理过程，从而生成更符合用户背景和偏好的答案，显著提升了问答系统的个性化效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.19193

arXiv 提交日期: 2026-02-22

robotics agents computer vision pushing policy visual prompting flow matching non-prehensile manipulation table-cleaning

视觉提示引导的统一推动策略 / Visual Prompt Guided Unified Pushing Policy

1️⃣ 一句话总结

这项研究提出了一种新型的机器人推动策略，它通过引入简单的视觉提示来指导机器人进行灵活、多模式的推动操作，从而能够高效地适应各种不同的任务场景，比如桌面整理。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.18757

arXiv 提交日期: 2026-02-21

benchmark agents systems autonomous driving personalization end-to-end learning driving style evaluation metrics

千人千面驾驶：一个闭环个性化端到端自动驾驶的基准平台 / Driving with A Thousand Faces: A Benchmark for Closed-Loop Personalized End-to-End Autonomous Driving

1️⃣ 一句话总结

这篇论文提出了一个名为Person2Drive的基准平台，旨在解决当前端到端自动驾驶系统缺乏个性化驾驶风格的问题，它通过提供数据收集工具、量化评估指标和个性化算法框架，让自动驾驶系统能像不同的人一样拥有独特的驾驶习惯。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.18832

arXiv 提交日期: 2026-02-21

agents systems natural language processing autonomous agents informal learning social network analysis community dynamics human-ai interaction

OpenClaw AI智能体在Moltbook上作为非正式学习者：大规模新兴学习社群的特性研究 / OpenClaw AI Agents as Informal Learners at Moltbook: Characterizing an Emergent Learning Community at Scale

1️⃣ 一句话总结

这篇论文首次研究了一个完全由AI智能体组成的大型非正式学习社群，发现其参与度极不平等、互动模式呈现‘平行独白’而非人类常见的问答驱动，并经历了爆发、混乱到衰退的典型生命周期，这对未来人机混合学习平台的设计有重要启示。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.18891

arXiv 提交日期: 2026-02-21

llm agents model evaluation multi-agent systems workflow orchestration question generation automated evaluation scientific research

为科学研究编排大型语言模型智能体：一项关于多项选择题生成与评估的试点研究 / Orchestrating LLM Agents for Scientific Research: A Pilot Study of Multiple Choice Question (MCQ) Generation and Evaluation

1️⃣ 一句话总结

这项试点研究表明，通过人类研究者协调多个大型语言模型智能体，可以构建一个自动化生成和评估多项选择题的AI研究流程，虽然生成的题目在表面质量上表现优异，但在深度技能和认知参与度等方面仍与专家题目存在差距，同时研究者的角色也从直接创作转向了对整个AI工作流程的规范、编排与监督。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.17605

arXiv 提交日期: 2026-02-19

agents machine learning systems active learning meta-learning geospatial discovery online learning concept relevance

动态主动适应：面向地理空间发现、基于潜在概念与相关性引导的在线元学习 / Adapting Actively on the Fly: Relevance-Guided Online Meta-Learning with Latent Concepts for Geospatial Discovery

1️⃣ 一句话总结

本文提出了一种融合主动学习、在线元学习和概念推理的地理空间发现框架，通过引入‘概念相关性’来动态调整采样策略，能够在数据稀缺且环境多变的条件下（如污染物监测）更高效、可靠地发现隐藏目标。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.17315

arXiv 提交日期: 2026-02-19

theory reinforcement learning agents multi-armed bandits graph processes regret analysis exploration-exploitation random walk

闪烁多臂老虎机 / Flickering Multi-Armed Bandits

1️⃣ 一句话总结

这篇论文提出了一个名为‘闪烁多臂老虎机’的新框架，用于解决在每一轮决策中可选‘手臂’（或行动）会动态变化且受先前选择限制的强化学习问题，并通过结合随机游走探索和导航利用的两阶段算法，在多种随机图模型下实现了接近最优的后悔上界。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2602.19930

1️⃣ 一句话总结

arXiv ID: 2602.19502

1️⃣ 一句话总结

arXiv ID: 2602.19225

1️⃣ 一句话总结

arXiv ID: 2602.19317

1️⃣ 一句话总结

arXiv ID: 2602.19193

1️⃣ 一句话总结

arXiv ID: 2602.18757

1️⃣ 一句话总结

arXiv ID: 2602.18832

1️⃣ 一句话总结

arXiv ID: 2602.18891

1️⃣ 一句话总结

arXiv ID: 2602.17605

1️⃣ 一句话总结

arXiv ID: 2602.17315

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2602.19930 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.19502 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.19225 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.19317 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.19193 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.18757 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.18832 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.18891 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.17605 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.17315 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2602.19930

arXiv ID: 2602.19502

arXiv ID: 2602.19225

arXiv ID: 2602.19317

arXiv ID: 2602.19193

arXiv ID: 2602.18757

arXiv ID: 2602.18832

arXiv ID: 2602.18891

arXiv ID: 2602.17605

arXiv ID: 2602.17315