📄 论文总结
R2RGEN:面向空间泛化操作的真实到真实三维数据生成 / R2RGEN: Real-to-Real 3D Data Generation for Spatially Generalized Manipulation
1️⃣ 一句话总结
本文提出了一种无需模拟器和渲染的R2RGEN框架,能够直接从少量真实演示中高效生成多样化的三维点云数据,显著提升机器人操作策略在复杂空间环境下的泛化能力。
请先 登录 后再提交论文
R2RGEN:面向空间泛化操作的真实到真实三维数据生成 / R2RGEN: Real-to-Real 3D Data Generation for Spatially Generalized Manipulation
本文提出了一种无需模拟器和渲染的R2RGEN框架,能够直接从少量真实演示中高效生成多样化的三维点云数据,显著提升机器人操作策略在复杂空间环境下的泛化能力。
ELMUR:用于长视野强化学习的具有更新/重写功能的外部层记忆 / ELMUR: External Layer Memory with Update/Rewrite for Long-Horizon RL
这项研究提出了一种名为ELMUR的新型Transformer架构,它通过在每个网络层引入可更新和重写的外部记忆模块,有效解决了机器人等智能体在部分可观测环境和长序列决策中难以利用长期历史信息的问题,显著提升了任务性能。
面向机器人学习的视觉专家变换器:基于基础模型蒸馏与动态路由 / VER: Vision Expert Transformer for Robot Learning via Foundation Distillation and Dynamic Routing
这项研究提出了一种名为VER的视觉专家变换器,它通过将多个预训练视觉基础模型的优势整合到一个专家库中,并仅需微调极少量参数来动态选择任务相关专家,从而在17种不同的机器人任务中实现了顶尖性能,同时大幅提升了模型的灵活性和适应性。
组合你的策略!通过测试时分布级组合改进基于扩散或流的机器人策略 / Compose Your Policies! Improving Diffusion-based or Flow-based Robot Policies via Test-time Distribution-level Composition
这项研究提出了一种无需额外训练即可提升机器人策略性能的新方法,通过组合多个预训练策略的分布得分,实现了超越单个策略的适应性和任务表现。
用于自动驾驶中反射式视觉-语言-动作模型的离散扩散方法 / Discrete Diffusion for Reflective Vision-Language-Action Models in Autonomous Driving
这篇论文提出了一种名为ReflectDrive的新型自动驾驶框架,它通过离散扩散和无需梯度计算的安全反射机制,实现了更安全、可扩展的轨迹生成,克服了现有方法依赖复杂规则或模拟环境的局限性。
用于微调行为克隆策略的残差离线策略强化学习 / Residual Off-Policy RL for Finetuning Behavior Cloning Policies
这项研究提出了一种结合行为克隆和强化学习优势的新方法,通过让智能体在预训练的行为策略基础上学习轻量级残差修正,仅需稀疏的奖励信号就能有效提升复杂机器人系统的操作性能,并首次在真实世界的类人机器人上成功实现了强化学习训练。
ROOM:基于物理的连续体机器人模拟器,用于生成逼真医学数据集 / ROOM: A Physics-Based Continuum Robot Simulator for Photorealistic Medical Datasets Generation
这篇论文提出了一个名为ROOM的模拟器,它利用患者CT扫描生成高度逼真的支气管镜训练数据,解决了医学机器人开发中真实数据难以获取的难题,并通过实验验证了生成数据在姿态估计和深度估计等任务中的实用性。
RAPTOR:一种用于四旋翼控制的基座策略 / RAPTOR: A Foundation Policy for Quadrotor Control
这篇论文提出了一种名为RAPTOR的方法,能够训练出一个高度自适应的通用四旋翼控制策略,该策略无需额外训练即可直接应用于各种不同类型的真实四旋翼飞行器,实现即时零样本适应。
Nav-R1:具身场景中的推理与导航 / Nav-R1: Reasoning and Navigation in Embodied Scenes
这篇论文提出了一个名为Nav-R1的智能体模型,它通过结合思维链数据集和强化学习奖励机制,解决了机器人在复杂环境中实时导航时推理不稳定和控制延迟的难题,显著提升了导航和推理性能。
InternScenes:一个具有真实布局的大规模可模拟室内场景数据集 / InternScenes: A Large-scale Simulatable Indoor Scene Dataset with Realistic Layouts
这篇论文提出了一个名为InternScenes的大规模可模拟室内场景数据集,它通过整合多种来源的场景数据并保留大量小物品,解决了现有数据集在规模、多样性和布局真实性方面的不足,为具身AI任务如场景生成和导航提供了更复杂和真实的训练环境。