arXiv最新AI论文速览速学

🔍

agents ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 220 72小时内新更新论文 72h更新 315 最新: What if Pinocchio Were a Reinforcement Learning Agent: A Normative End-to-End Pipeline 03-18

arXiv ID: 2602.19317

arXiv 提交日期: 2026-02-22

llm natural language processing agents personalized qa retrieval-augmented generation reinforcement learning reasoning retrieval policy

学习推理以实现个性化问答中个人上下文的多步骤检索 / Learning to Reason for Multi-Step Retrieval of Personal Context in Personalized Question Answering

1️⃣ 一句话总结

这篇论文提出了一个名为PR2的强化学习框架，它通过让AI学习在回答个性化问题时，智能地决定何时、如何从用户个人资料中检索信息并融入推理过程，从而生成更符合用户背景和偏好的答案，显著提升了问答系统的个性化效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.19193

arXiv 提交日期: 2026-02-22

robotics agents computer vision pushing policy visual prompting flow matching non-prehensile manipulation table-cleaning

视觉提示引导的统一推动策略 / Visual Prompt Guided Unified Pushing Policy

1️⃣ 一句话总结

这项研究提出了一种新型的机器人推动策略，它通过引入简单的视觉提示来指导机器人进行灵活、多模式的推动操作，从而能够高效地适应各种不同的任务场景，比如桌面整理。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.18757

arXiv 提交日期: 2026-02-21

benchmark agents systems autonomous driving personalization end-to-end learning driving style evaluation metrics

千人千面驾驶：一个闭环个性化端到端自动驾驶的基准平台 / Driving with A Thousand Faces: A Benchmark for Closed-Loop Personalized End-to-End Autonomous Driving

1️⃣ 一句话总结

这篇论文提出了一个名为Person2Drive的基准平台，旨在解决当前端到端自动驾驶系统缺乏个性化驾驶风格的问题，它通过提供数据收集工具、量化评估指标和个性化算法框架，让自动驾驶系统能像不同的人一样拥有独特的驾驶习惯。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.18832

arXiv 提交日期: 2026-02-21

agents systems natural language processing autonomous agents informal learning social network analysis community dynamics human-ai interaction

OpenClaw AI智能体在Moltbook上作为非正式学习者：大规模新兴学习社群的特性研究 / OpenClaw AI Agents as Informal Learners at Moltbook: Characterizing an Emergent Learning Community at Scale

1️⃣ 一句话总结

这篇论文首次研究了一个完全由AI智能体组成的大型非正式学习社群，发现其参与度极不平等、互动模式呈现‘平行独白’而非人类常见的问答驱动，并经历了爆发、混乱到衰退的典型生命周期，这对未来人机混合学习平台的设计有重要启示。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.18891

arXiv 提交日期: 2026-02-21

llm agents model evaluation multi-agent systems workflow orchestration question generation automated evaluation scientific research

为科学研究编排大型语言模型智能体：一项关于多项选择题生成与评估的试点研究 / Orchestrating LLM Agents for Scientific Research: A Pilot Study of Multiple Choice Question (MCQ) Generation and Evaluation

1️⃣ 一句话总结

这项试点研究表明，通过人类研究者协调多个大型语言模型智能体，可以构建一个自动化生成和评估多项选择题的AI研究流程，虽然生成的题目在表面质量上表现优异，但在深度技能和认知参与度等方面仍与专家题目存在差距，同时研究者的角色也从直接创作转向了对整个AI工作流程的规范、编排与监督。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.17605

arXiv 提交日期: 2026-02-19

agents machine learning systems active learning meta-learning geospatial discovery online learning concept relevance

动态主动适应：面向地理空间发现、基于潜在概念与相关性引导的在线元学习 / Adapting Actively on the Fly: Relevance-Guided Online Meta-Learning with Latent Concepts for Geospatial Discovery

1️⃣ 一句话总结

本文提出了一种融合主动学习、在线元学习和概念推理的地理空间发现框架，通过引入‘概念相关性’来动态调整采样策略，能够在数据稀缺且环境多变的条件下（如污染物监测）更高效、可靠地发现隐藏目标。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.17315

arXiv 提交日期: 2026-02-19

theory reinforcement learning agents multi-armed bandits graph processes regret analysis exploration-exploitation random walk

闪烁多臂老虎机 / Flickering Multi-Armed Bandits

1️⃣ 一句话总结

这篇论文提出了一个名为‘闪烁多臂老虎机’的新框架，用于解决在每一轮决策中可选‘手臂’（或行动）会动态变化且受先前选择限制的强化学习问题，并通过结合随机游走探索和导航利用的两阶段算法，在多种随机图模型下实现了接近最优的后悔上界。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.17084

arXiv 提交日期: 2026-02-19

llm agents systems ai coding agents pull request analysis human-ai collaboration software development empirical study

AI编码代理如何沟通：关于其Pull Request描述特征与人类评审响应的研究 / How AI Coding Agents Communicate: A Study of Pull Request Description Characteristics and Human Review Responses

1️⃣ 一句话总结

这项研究发现，不同AI编程助手在提交代码修改请求时，其描述风格存在明显差异，而这些差异会显著影响人类评审员的参与度、响应速度以及最终是否接受该修改。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.17665

arXiv 提交日期: 2026-02-19

agents multi-modal systems geospatial agents remote sensing tool augmentation satellite imagery multimodal reasoning

OpenEarthAgent：一个用于工具增强地理空间智能体的统一框架 / OpenEarthAgent: A Unified Framework for Tool-Augmented Geospatial Agents

1️⃣ 一句话总结

这篇论文提出了一个名为OpenEarthAgent的统一框架，通过训练模型结合卫星图像、自然语言查询和多步骤推理，使AI能够像专家一样理解和分析复杂的地理空间问题，比如城市发展、环境监测和灾害评估。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.17641

arXiv 提交日期: 2026-02-19

llm agents machine learning feature engineering react paradigm tabular data automated feature discovery agent architecture

FAMOSE：一种基于ReAct范式的自动化特征发现方法 / FAMOSE: A ReAct Approach to Automated Feature Discovery

1️⃣ 一句话总结

这篇论文提出了一个名为FAMOSE的智能体框架，它利用ReAct范式自动探索、生成和优化机器学习中的特征，在回归和分类任务上达到了先进水平，证明了AI智能体在需要创造性解决方案的问题（如特征工程）上非常有效。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2602.19317

1️⃣ 一句话总结

arXiv ID: 2602.19193

1️⃣ 一句话总结

arXiv ID: 2602.18757

1️⃣ 一句话总结

arXiv ID: 2602.18832

1️⃣ 一句话总结

arXiv ID: 2602.18891

1️⃣ 一句话总结

arXiv ID: 2602.17605

1️⃣ 一句话总结

arXiv ID: 2602.17315

1️⃣ 一句话总结

arXiv ID: 2602.17084

1️⃣ 一句话总结

arXiv ID: 2602.17665

1️⃣ 一句话总结

arXiv ID: 2602.17641

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2602.19317 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.19193 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.18757 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.18832 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.18891 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.17605 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.17315 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.17084 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.17665 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.17641 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2602.19317

arXiv ID: 2602.19193

arXiv ID: 2602.18757

arXiv ID: 2602.18832

arXiv ID: 2602.18891

arXiv ID: 2602.17605

arXiv ID: 2602.17315

arXiv ID: 2602.17084

arXiv ID: 2602.17665

arXiv ID: 2602.17641