arXiv最新AI论文速览速学

🔍

标签: #imitation learning ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 59 72小时内新更新论文 72h更新 139 最新: Failure Identification in Imitation Learning Via Statistical and Semantic Filtering 04-20

arXiv ID: 2604.13788

arXiv 提交日期: 2026-04-15

robotics model evaluation machine learning imitation learning anomaly detection failure identification vision-language model conformal prediction

通过统计与语义过滤实现模仿学习中的故障识别 / Failure Identification in Imitation Learning Via Statistical and Semantic Filtering

1️⃣ 一句话总结

这篇论文提出了一个名为FIDeL的通用故障检测模块，它通过结合统计异常检测与大型视觉语言模型的语义理解，能够有效区分机器人模仿学习中的真正故障与无害的异常情况，从而显著提升了故障识别的准确性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.11948

arXiv 提交日期: 2026-04-13

systems model training machine learning imitation learning thermal management cache architecture scheduling foundation model inference

面向3D S-NUCA众核系统热感知与内核感知大模型推理的主动模仿学习 / Active Imitation Learning for Thermal- and Kernel-Aware LFM Inference on 3D S-NUCA Many-Cores

1️⃣ 一句话总结

本文提出了一种名为AILFM的智能调度框架，它利用主动模仿学习技术，在新型3D堆叠CPU上自动学习如何高效调度大模型的计算任务，既能有效控制芯片发热、防止过热，又能充分利用硬件性能，从而替代昂贵的GPU进行大模型推理。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.15185

arXiv 提交日期: 2026-03-16

robotics systems model evaluation autonomous driving end-to-end learning architecture analysis imitation learning closed-loop evaluation

端到端驾驶规划器中，哪些因素对可扩展且鲁棒的学习至关重要？ / What Matters for Scalable and Robust Learning in End-to-End Driving Planners?

1️⃣ 一句话总结

这篇论文通过系统分析发现，高分辨率感知、解耦的轨迹表示和生成式规划等常见架构模式在闭环驾驶中的效果与预期不同，并基于此提出了一种名为BevAD的新型轻量级端到端驾驶架构，该架构在Bench2Drive基准测试中取得了72.7%的成功率，并展现出强大的数据扩展能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.08706

arXiv 提交日期: 2026-03-09

llm agents model training reinforcement learning self-reflection agent training reasoning imitation learning

自主批判性训练 / Agentic Critical Training

1️⃣ 一句话总结

这篇论文提出了一种名为‘自主批判性训练’的新方法，它通过让大型语言模型学习自主判断不同行动方案的优劣，而不是简单模仿专家行为，从而显著提升了AI代理的决策能力和泛化性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.05504

arXiv 提交日期: 2026-03-05

robotics model training agents imitation learning policy iteration augmented reality data collection interactive learning

RoboPocket：用你的手机即时改进机器人策略 / RoboPocket: Improve Robot Policies Instantly with Your Phone

1️⃣ 一句话总结

这篇论文提出了一个名为RoboPocket的创新系统，它利用普通智能手机和增强现实技术，让操作员无需物理机器人就能直观地看到机器人策略的预测轨迹，从而能高效地针对策略弱点收集数据并进行即时在线微调，将数据收集效率提升了一倍。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02511

arXiv 提交日期: 2026-03-03

robotics systems model training object-centric reasoning sequential manipulation cluttered environments spatial relationship encoder imitation learning

面向杂乱环境中序列化操作的物体中心空间推理学习 / Learning Object-Centric Spatial Reasoning for Sequential Manipulation in Cluttered Environments

1️⃣ 一句话总结

这篇论文提出了一个名为Unveiler的机器人操作框架，它将复杂的空间推理与具体动作执行分离开来，通过一个轻量级的决策模块智能地识别并移除遮挡物，从而让机器人能更高效、更成功地从极度杂乱的环境中取出目标物体。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.03278

arXiv 提交日期: 2026-03-03

robotics agents model training autonomous play trajectory warping keypoint correspondences imitation learning vision-language models

Tether：基于对应关系驱动轨迹扭曲的自主功能化交互学习 / Tether: Autonomous Functional Play with Correspondence-Driven Trajectory Warping

1️⃣ 一句话总结

这篇论文提出了一种名为Tether的新方法，它能让机器人像玩游戏一样自主探索和学习新任务：只需少量演示，机器人就能通过视觉关键点匹配来调整动作，并在现实环境中持续执行、评估和改进任务，从而自动生成大量高质量的训练数据来提升自身技能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02783

arXiv 提交日期: 2026-03-03

robotics agents model training imitation learning swarm robotics generative adversarial networks human demonstrations reinforcement learning

面向机器人集群的生成对抗模仿学习：从人类演示与训练策略中学习 / Generative adversarial imitation learning for robot swarms: Learning from human demonstrations and trained policies

1️⃣ 一句话总结

这篇论文提出了一个基于生成对抗模仿学习的框架，让机器人集群能够通过观察人类演示或已有策略的演示来学习集体行为，并在仿真和真实机器人实验中成功复现了与演示性能相当、视觉上可识别的群体行为。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.22862

arXiv 提交日期: 2026-02-26

robotics model training multi-modal grasping policy latent diffusion imitation learning robotic manipulation self-supervised learning

GraspLDP：通过潜在扩散实现可泛化的抓取策略 / GraspLDP: Towards Generalizable Grasping Policy via Latent Diffusion

1️⃣ 一句话总结

这篇论文提出了一种结合抓取先验知识的潜在扩散策略，通过引导机器人动作生成和融入视觉重建目标，显著提升了模仿学习抓取策略的精确度和对不同物体、不同场景的泛化能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.21684

arXiv 提交日期: 2026-02-25

robotics model training agents imitation learning action generation multi-modal distribution two-stage framework dexterous manipulation

用于机器人模仿动作生成的主-细解耦方法 / Primary-Fine Decoupling for Action Generation in Robotic Imitation

1️⃣ 一句话总结

这篇论文提出了一种名为PF-DAG的两阶段新方法，它通过先将机器人动作分解为粗略模式和精细变化来生成动作，从而在模仿学习中更稳定、更准确地复现复杂的多模态操作任务，并在多个基准测试和真实任务中表现出色。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2604.13788

1️⃣ 一句话总结

arXiv ID: 2604.11948

1️⃣ 一句话总结

arXiv ID: 2603.15185

1️⃣ 一句话总结

arXiv ID: 2603.08706

1️⃣ 一句话总结

arXiv ID: 2603.05504

1️⃣ 一句话总结

arXiv ID: 2603.02511

1️⃣ 一句话总结

arXiv ID: 2603.03278

1️⃣ 一句话总结

arXiv ID: 2603.02783

1️⃣ 一句话总结

arXiv ID: 2602.22862

1️⃣ 一句话总结

arXiv ID: 2602.21684

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2604.13788 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.11948 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.15185 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.08706 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.05504 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02511 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.03278 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02783 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.22862 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.21684 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2604.13788

arXiv ID: 2604.11948

arXiv ID: 2603.15185

arXiv ID: 2603.08706

arXiv ID: 2603.05504

arXiv ID: 2603.02511

arXiv ID: 2603.03278

arXiv ID: 2603.02783

arXiv ID: 2602.22862

arXiv ID: 2602.21684