arXiv最新AI论文速览速学

🔍

标签: #robotics ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 50 72小时内新更新论文 72h更新 50 最新: HumanScale: Egocentric Human Video Can Outperform Real-Robot Data for Embodied Pretraining 06-22

arXiv ID: 2606.20521

arXiv 提交日期: 2026-06-18

robotics computer vision machine learning egocentric video embodied pretraining real-robot data transfer learning data efficiency

人类尺度：以自我为中心的人类视频在具身预训练中可超越真实机器人数据 / HumanScale: Egocentric Human Video Can Outperform Real-Robot Data for Embodied Pretraining

1️⃣ 一句话总结

研究发现，经过精心筛选和标注的以自我为中心的人类视频数据，在训练具身智能基础模型时，不仅成本更低、规模更大，还能比昂贵的真实机器人遥操作数据带来更好的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.20045

arXiv 提交日期: 2026-06-18

vision-language navigation robotics uav uav-vln target-reaching fine-grained grounding 3d waypoint prediction benchmark

看见即到达：面向无人机的视场内的精准视觉语言导航 / See-and-Reach: Precise Vision-Language Navigation for UAVs within the Field of View

1️⃣ 一句话总结

本文提出了一种针对无人机的视觉语言导航新任务和框架，专门解决无人机在目标进入视野后如何精准识别并飞抵目标的问题，通过结合动态3D方向线索和高分辨率图像，使导航成功率和精准度大幅提升。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.18687

arXiv 提交日期: 2026-06-17

computer vision robotics place recognition radar knowledge distillation heterogeneous sensors spatial alignment

空间分层蒸馏：异构雷达地点识别的新方法 / Spatially Stratified Distillation for Heterogeneous Radar Place Recognition

1️⃣ 一句话总结

本文提出了一种名为空间分层蒸馏（SSD）的新策略，通过根据雷达回波的物理空间分布动态调整蒸馏强度，有效解决了低成本的4D汽车雷达与高精度旋转雷达之间因数据稀疏性差异导致的地点识别性能下降问题，在动态场景下取得了最先进成果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.19297

arXiv 提交日期: 2026-06-17

robotics multi-modal model evaluation vision-language-action models commonsense knowledge world knowledge benchmark knowledge retention

VLA模型真的知道基础知识吗？——衡量视觉-语言-动作模型中的常识与世界知识保持能力 / Does VLA Even Know the Basics? Measuring Commonsense and World Knowledge Retention in Vision-Language-Action Models

1️⃣ 一句话总结

这篇论文提出了一种名为Act2Answer的轻量化评估方法，通过让机器人用真实的物体放置动作来回答问题，从而测试视觉-语言-动作（VLA）模型在微调后是否还保留了常识和事实知识，结果发现VLA模型在简单概念上表现良好，但在复杂语义上知识有所衰减，且知识主要存储在模型的中间层。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.18664

arXiv 提交日期: 2026-06-17

robotics audio machine learning sound source localization subspace estimation self-supervised learning robot audition doa estimation

NeuralMUSIC：一种用于机器人声源定位的混合神经子空间框架 / NeuralMUSIC: A Hybrid Neural-Subspace Framework for Robot Sound Source Localization

1️⃣ 一句话总结

本文提出了一种结合深度学习和经典MUSIC算法的混合框架，通过神经网络预测空间协方差矩阵并融合频率注意力机制，显著提升了机器人在噪声环境下声源定位的准确性和跨场景泛化能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.19067

arXiv 提交日期: 2026-06-17

robotics systems model evaluation slam quadruped robots sensor configuration legged locomotion multimodal

传感器配置至关重要：四足机器人多模态SLAM的系统性评估 / Sensor Configuration Matters: A Systematic Evaluation of Multimodal SLAM on Quadruped Robots

1️⃣ 一句话总结

本文系统评估了不同相机类型、快门技术以及惯性传感器配置对四足机器人SLAM定位精度和鲁棒性的影响，发现立体相机和全局快门能显著提升性能，而标准惯性传感器在剧烈运动下反而会拖累视觉SLAM效果，为设计可靠的机器人感知系统提供了实用指南。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.18043

arXiv 提交日期: 2026-06-16

robotics multi-modal model evaluation uncertainty quantification flow matching vision-language-action models failure detection active fine-tuning

基于流的视觉-语言-动作模型的不确定性量化 / Uncertainty Quantification for Flow-Based Vision-Language-Action Models

1️⃣ 一句话总结

该论文提出了一种通过小群体模型间的速度场差异来量化预测不确定性的方法，并基于此开发了SAVE框架，能够有效检测机器人操作中的失败风险，同时将新任务所需的昂贵专家演示样本减少至少22%。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.13677

arXiv 提交日期: 2026-06-11

robotics reinforcement learning systems dexterous manipulation articulated tools sim-to-real motion planning grasping

Mana：灵巧操纵铰接工具 / Mana: Dexterous Manipulation of Articulated Tools

1️⃣ 一句话总结

本文提出了一个名为Mana的通用仿真到现实框架，通过将灵巧操作问题转化为动画生成问题，实现了对剪刀、钳子等各类铰接工具的零样本灵活抓取和操作。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.13605

arXiv 提交日期: 2026-06-11

reinforcement learning robotics systems trajectory optimization chance constraints robust control spacecraft trajectory distribution-agnostic

基于机会约束强化学习的分布无关鲁棒轨迹优化 / Distribution-Agnostic Robust Trajectory Optimization via Chance-Constrained Reinforcement Learning

1️⃣ 一句话总结

本文提出了一种不依赖于特定不确定性分布类型的鲁棒轨迹优化方法，通过先离线计算标称轨迹，再利用强化学习对该轨迹进行鲁棒化修正（包括前馈控制和时变反馈增益），从而在保证任务可行性的同时有效降低燃料成本，并在多种不同航天任务（如地火转移和火箭着陆）中验证了其通用性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.12774

arXiv 提交日期: 2026-06-11

agents llm robotics model predictive control semantic control autonomous driving context-aware control synthesis

面向语义控制系统重构的智能体模型预测控制 / Agentic MPC for Semantic Control System Resynthesis

1️⃣ 一句话总结

本文提出一种将大型语言模型智能体与传统模型预测控制相结合的框架，使自动驾驶等系统能够理解自然语言指令或社会规范等高层语义信息，并自动调整控制策略，以在紧急避让等场景下更灵活地适应人的偏好和复杂环境。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2606.20521

1️⃣ 一句话总结

arXiv ID: 2606.20045

1️⃣ 一句话总结

arXiv ID: 2606.18687

1️⃣ 一句话总结

arXiv ID: 2606.19297

1️⃣ 一句话总结

arXiv ID: 2606.18664

1️⃣ 一句话总结

arXiv ID: 2606.19067

1️⃣ 一句话总结

arXiv ID: 2606.18043

1️⃣ 一句话总结

arXiv ID: 2606.13677

1️⃣ 一句话总结

arXiv ID: 2606.13605

1️⃣ 一句话总结

arXiv ID: 2606.12774

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2606.20521 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.20045 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.18687 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.19297 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.18664 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.19067 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.18043 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.13677 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.13605 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.12774 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2606.20521

arXiv ID: 2606.20045

arXiv ID: 2606.18687

arXiv ID: 2606.19297

arXiv ID: 2606.18664

arXiv ID: 2606.19067

arXiv ID: 2606.18043

arXiv ID: 2606.13677

arXiv ID: 2606.13605

arXiv ID: 2606.12774