arXiv最新AI论文速览速学

🔍

robotics ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 119 72小时内新更新论文 72h更新 124 最新: From Passive Observer to Active Critic: Reinforcement Learning Elicits Process Reasoning for Robotic Manipulation 03-17

arXiv ID: 2603.04913

arXiv 提交日期: 2026-03-05

robotics computer vision model evaluation adversarial attack visuomotor policy 3d object differentiable rendering robotic manipulation

超越平面贴片：通过视角一致的3D对抗物体探索视觉运动策略的脆弱性 / Beyond the Patch: Exploring Vulnerabilities of Visuomotor Policies via Viewpoint-Consistent 3D Adversarial Object

1️⃣ 一句话总结

这篇论文提出了一种为3D物体生成视角一致性对抗纹理的方法，能有效欺骗机器人视觉控制系统，使其在动态视角和真实环境中持续做出错误决策，揭示了现有机器人策略在三维感知上的安全漏洞。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.05504

arXiv 提交日期: 2026-03-05

robotics model training agents imitation learning policy iteration augmented reality data collection interactive learning

RoboPocket：用你的手机即时改进机器人策略 / RoboPocket: Improve Robot Policies Instantly with Your Phone

1️⃣ 一句话总结

这篇论文提出了一个名为RoboPocket的创新系统，它利用普通智能手机和增强现实技术，让操作员无需物理机器人就能直观地看到机器人策略的预测轨迹，从而能高效地针对策略弱点收集数据并进行即时在线微调，将数据收集效率提升了一倍。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.04659

arXiv 提交日期: 2026-03-04

robotics multi-agents systems multi-robot navigation collision avoidance graph neural networks path planning reinforcement learning

GIANT：用于多智能体轨迹规划的全局路径集成与注意力图网络 / GIANT - Global Path Integration and Attentive Graph Networks for Multi-Agent Trajectory Planning

1️⃣ 一句话总结

这篇论文提出了一种结合全局路径规划和局部导航的新方法，利用注意力图神经网络让多个机器人在复杂动态环境中更安全、高效地避障和移动，其性能优于现有主流技术。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.03879

arXiv 提交日期: 2026-03-04

computer vision robotics 6d pose estimation monocular vision keypoint detection real-time systems yolo architecture

Yolo-Key-6D：一种通过关键点增强的单阶段单目6D姿态估计算法 / Yolo-Key-6D: Single Stage Monocular 6D Pose Estimation with Keypoint Enhancements

1️⃣ 一句话总结

这篇论文提出了一种名为Yolo-Key-6D的快速且准确的单阶段算法，它通过增强关键点检测来从单张彩色图片中估算物体的三维位置和朝向，在保证实时运行的同时达到了很高的精度，为机器人和增强现实等应用提供了实用的解决方案。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.03904

arXiv 提交日期: 2026-03-04

computer vision robotics systems visual object tracking unmanned aerial vehicles transformer evaluation protocol real-time embedded

用于无人机应用的基于Transformer的视觉目标跟踪架构与评估协议 / Architecture and evaluation protocol for transformer-based visual object tracking in UAV applications

1️⃣ 一句话总结

这篇论文为无人机视觉目标跟踪提出了一套新方案，它结合了Transformer模型和运动补偿技术来提升跟踪的鲁棒性，同时还设计了一个更贴近嵌入式设备真实性能的评估标准来验证其有效性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.04356

arXiv 提交日期: 2026-03-04

robotics benchmark systems simulation framework household manipulation generalist robots multi-task learning robot foundation models

RoboCasa365：用于训练和评估通用机器人的大规模仿真框架 / RoboCasa365: A Large-Scale Simulation Framework for Training and Benchmarking Generalist Robots

1️⃣ 一句话总结

这篇论文提出了一个名为RoboCasa365的大规模机器人仿真基准，它包含365种日常家务任务和数千个多样化厨房场景，旨在系统性地评估和训练能在家庭环境中完成多种任务的通用型机器人，并通过实验揭示了影响其性能的关键因素。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.03577

arXiv 提交日期: 2026-03-03

computer vision robotics systems instance segmentation open-world detection patch matching segment anything model novel object detection

从局部匹配到全局掩码：开放世界场景中的新实例检测 / From Local Matches to Global Masks: Novel Instance Detection in Open-World Scenes

1️⃣ 一句话总结

这篇论文提出了一种名为L2G-Det的新方法，它通过密集的局部图像块匹配来检测和分割开放世界中的新物体，无需依赖传统的物体候选框，从而在物体被遮挡或背景杂乱时表现更优。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02613

arXiv 提交日期: 2026-03-03

reinforcement learning agents robotics autonomous driving generative policy flow matching real-time inference diffusion rl

基于朗之万引导流匹配的自动驾驶实时生成策略 / Real-Time Generative Policy via Langevin-Guided Flow Matching for Autonomous Driving

1️⃣ 一句话总结

这篇论文提出了一种名为DACER-F的新强化学习算法，它通过结合流匹配技术和朗之万动力学，让自动驾驶系统在保持强大探索能力的同时，只需一步就能生成决策动作，从而实现了高性能与超低延迟的平衡。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02910

arXiv 提交日期: 2026-03-03

computer vision robotics systems articulated objects 3d reconstruction part segmentation motion analysis gaussian splatting

运动中的关节：通过动态-静态解耦实现无需先验知识的关节物体部件运动性分析 / Articulation in Motion: Prior-free Part Mobility Analysis for Articulated Objects By Dynamic-Static Disentanglement

1️⃣ 一句话总结

这篇论文提出了一种名为AiM的新方法，能够仅通过一段物体被操作的视频和一个初始3D扫描，就自动识别出物体由哪些可独立活动的部件组成、它们如何连接运动，并重建出高质量的交互式3D数字模型，整个过程完全不需要预先知道物体有多少个活动部件。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02854

arXiv 提交日期: 2026-03-03

robotics natural language processing multi-modal language-conditioned navigation continuous flow fields bird's-eye view end-to-end policy trajectory generation

CoFL：用于语言条件导航的连续流场 / CoFL: Continuous Flow Fields for Language-Conditioned Navigation

1️⃣ 一句话总结

这篇论文提出了一个名为CoFL的端到端导航模型，它能够根据鸟瞰图观察和语言指令直接生成一个连续的流场，从而规划出平滑、反应灵敏的机器人运动轨迹，并在模拟和真实世界的实验中取得了优于现有方法的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2603.04913

1️⃣ 一句话总结

arXiv ID: 2603.05504

1️⃣ 一句话总结

arXiv ID: 2603.04659

1️⃣ 一句话总结

arXiv ID: 2603.03879

1️⃣ 一句话总结

arXiv ID: 2603.03904

1️⃣ 一句话总结

arXiv ID: 2603.04356

1️⃣ 一句话总结

arXiv ID: 2603.03577

1️⃣ 一句话总结

arXiv ID: 2603.02613

1️⃣ 一句话总结

arXiv ID: 2603.02910

1️⃣ 一句话总结

arXiv ID: 2603.02854

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2603.04913 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.05504 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.04659 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.03879 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.03904 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.04356 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.03577 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02613 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02910 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02854 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2603.04913

arXiv ID: 2603.05504

arXiv ID: 2603.04659

arXiv ID: 2603.03879

arXiv ID: 2603.03904

arXiv ID: 2603.04356

arXiv ID: 2603.03577

arXiv ID: 2603.02613

arXiv ID: 2603.02910

arXiv ID: 2603.02854