arXiv最新AI论文速览速学

🔍

robotics ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 98 72小时内新更新论文 72h更新 100 最新: CoorDex: Coordinating Body and Hand Priors for Continuous Dexterous Humanoid Loco-Manipulation 06-23

arXiv ID: 2605.29565

arXiv 提交日期: 2026-05-28

computer vision robotics model training traversability estimation vision foundation models adaptation uncertainty estimation off-road

从通用视觉到可靠的可通行性估计：为无结构户外环境调整视觉基础模型 / From General Vision to Reliable Traversability Estimation: Adapting Vision Foundation Models for Unstructured Outdoor Environments

1️⃣ 一句话总结

针对视觉基础模型在户外无结构环境中进行可通行性估计时存在的任务通用性差、标注模糊以及语义与物理安全脱节等问题，本文提出了一种名为ViTA的框架，通过在模型中注入可学习提示和几何知识蒸馏，并引入视角多样化训练来处理不确定性，最终实现更可靠、泛化性更强的可通行性评估。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.28812

arXiv 提交日期: 2026-05-27

reinforcement learning robotics sim-to-real dexterous manipulation tactile representation contact-rich manipulation policy transfer center-of-pressure

超越二值化：基于物理接地接触表示的仿真到现实灵巧操作 / Beyond Binary: Sim-to-Real Dexterous Manipulation with Physics-Grounded Contact Representation

1️⃣ 一句话总结

本文提出一种基于物理原理的触觉表征——压力中心（CoP），它能在仿真到现实迁移中保留丰富的接触信息，通过可微动力学校准传感器，使多指机械手在零样本迁移下完成高难度操作任务（如插孔和球平衡），并优于传统二值触觉或原始触觉信号方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.28548

arXiv 提交日期: 2026-05-27

multi-modal robotics model training embodied intelligence vision-language-action depth map generation benchmark pre-training

GEM：生成式监督助力具身智能 / GEM: Generative Supervision Helps Embodied Intelligence

1️⃣ 一句话总结

这篇论文提出了一种名为GEM的具身视觉语言模型，通过在预训练阶段引入深度图生成任务，弥补了高层语义理解与低层空间物理知识之间的鸿沟，显著提升了机器人在仿真和真实环境中的任务执行能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.26944

arXiv 提交日期: 2026-05-26

robotics computer vision agents grasping object pose estimation shape estimation modular methods evaluation

面向抓取的目标位姿与形状估计：它真的有效吗？ / Object Pose and Shape Estimation for Grasping: Does it Work?

1️⃣ 一句话总结

本文系统比较了先估计物体位姿和形状再采样抓取点的模块化方法与直接端到端生成抓取的方法，发现模块化方法在所有测试中表现更好，尤其能抓取小物体，但其性能依赖于位姿与形状估计的精度，并且在杂乱场景中会有所下降。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.25477

arXiv 提交日期: 2026-05-25

reinforcement learning robotics multi-modal vision-language-action models sample efficient finetuning manipulation tasks

EXPO-FT：面向视觉-语言-动作模型的样本高效强化学习微调 / EXPO-FT: Sample-Efficient Reinforcement Learning Finetuning for Vision-Language-Action Models

1️⃣ 一句话总结

本文提出了一种名为EXPO-FT的系统，能够利用强化学习对预训练的视觉-语言-动作模型进行高效微调，使机器人在极短时间（平均约19分钟）内学会高精度、动态的复杂操作任务，并达到100%的成功率，远超现有方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.21258

arXiv 提交日期: 2026-05-20

robotics machine learning computer vision 3d representation latent variable model pretraining manipulation point cloud

学习结构化潜变量点以提升机器人操作中的高效视觉表征 / Learning Structural Latent Points for Efficient Visual Representations in Robotic Manipulation

1️⃣ 一句话总结

该论文提出了一种混合视觉表征方法，通过将点云潜变量与点状变分自编码器结合，学习既能保留粗糙形状与语义信息、又具有结构化先验的紧凑潜变量点，同时设计了一个轻量渲染管线，在机器人操作任务中显著提升了成功率、样本效率和鲁棒性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.19386

arXiv 提交日期: 2026-05-19

computer vision machine learning robotics deformable objects physics parameters video reconstruction material learning spring-mass model

MatPhys：从视频中学习可变形物体模拟的材料感知物理参数 / MatPhys: Learning Material-Aware Physics Parameters for Deformable Object Simulation from Videos

1️⃣ 一句话总结

本文提出了一种名为MatPhys的新方法，能从单视角视频中自动预测可变形物体的物理参数，通过将物体分解为不同材料区域并使用共享材料代码库，实现了跨场景一致的物理仿真，无需针对每个场景单独优化。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.19587

arXiv 提交日期: 2026-05-19

computer vision robotics aigc indoor scene synthesis articulated objects programmatic generation blender python simulation

SceneCode：用于可编辑室内场景及可活动物体的可执行世界程序 / SceneCode: Executable World Programs for Editable Indoor Scenes with Articulated Objects

1️⃣ 一句话总结

本文提出SceneCode框架，通过将自然语言描述转化为可执行的代码程序，而非静态三维模型，自动生成带有可活动部件（如抽屉、门）的室内场景，使得场景不仅更逼真，还支持后续编辑和机器人模拟交互。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.19435

arXiv 提交日期: 2026-05-19

computer vision robotics visual place recognition uncertainty estimation von mises-fisher prototype-anchored calibration

KappaPlace：通过原型锚定监督学习用于视觉位置识别的超球面不确定性 / KappaPlace: Learning Hyperspherical Uncertainty for Visual Place Recognition via Prototype-Anchored Supervision

1️⃣ 一句话总结

本文提出了KappaPlace方法，通过原型锚定监督策略和概率建模，在视觉位置识别中为每个查询-参考匹配对提供更准确的不确定性估计，从而让机器人能更可靠地判断定位是否可信，比现有方法将校准误差降低了最多50%。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.19503

arXiv 提交日期: 2026-05-19

reinforcement learning robotics continuous control hexapod quadruped reward function locomotion

ARC-RL：受《ARC Raiders》启发的强化学习试验场 / ARC-RL: A Reinforcement Learning Playground Inspired by ARC Raiders

1️⃣ 一句话总结

本文提出了ARC-RL，一个基于《ARC Raiders》游戏生物设计的强化学习测试平台，包含四种独特形态的机器人及其统一奖励函数，并用多种算法验证了该平台在应对多样化形态和动画风格约束时的有效性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2605.29565

1️⃣ 一句话总结

arXiv ID: 2605.28812

1️⃣ 一句话总结

arXiv ID: 2605.28548

1️⃣ 一句话总结

arXiv ID: 2605.26944

1️⃣ 一句话总结

arXiv ID: 2605.25477

1️⃣ 一句话总结

arXiv ID: 2605.21258

1️⃣ 一句话总结

arXiv ID: 2605.19386

1️⃣ 一句话总结

arXiv ID: 2605.19587

1️⃣ 一句话总结

arXiv ID: 2605.19435

1️⃣ 一句话总结

arXiv ID: 2605.19503

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2605.29565 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.28812 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.28548 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.26944 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.25477 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.21258 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.19386 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.19587 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.19435 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.19503 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2605.29565

arXiv ID: 2605.28812

arXiv ID: 2605.28548

arXiv ID: 2605.26944

arXiv ID: 2605.25477

arXiv ID: 2605.21258

arXiv ID: 2605.19386

arXiv ID: 2605.19587

arXiv ID: 2605.19435

arXiv ID: 2605.19503