arXiv ID:
2606.13677
Mana:灵巧操纵铰接工具 / Mana: Dexterous Manipulation of Articulated Tools
1️⃣ 一句话总结
本文提出了一个名为Mana的通用仿真到现实框架,通过将灵巧操作问题转化为动画生成问题,实现了对剪刀、钳子等各类铰接工具的零样本灵活抓取和操作。
Mana:灵巧操纵铰接工具 / Mana: Dexterous Manipulation of Articulated Tools
本文提出了一个名为Mana的通用仿真到现实框架,通过将灵巧操作问题转化为动画生成问题,实现了对剪刀、钳子等各类铰接工具的零样本灵活抓取和操作。
扩散驱动规划器:基于时序退火历史信息与依赖时间引导的自动驾驶规划方法 / Diffusion Forcing Planner: History-Annealed Planning with Time-Dependent Guidance for Autonomous Driving
本文提出了一种名为“扩散驱动规划器”的自动驾驶运动规划新方法,通过将完整轨迹分为历史、当前和未来三部分并分别施加不同程度的噪声,再利用可控的历史信息退火引导生成连续、稳定且安全的未来行驶轨迹,有效解决了传统规划器因帧间微小差异累积导致的不稳定问题。
MISTY:基于混频器单步漂移的高通量运动规划方法 / MISTY: High-Throughput Motion Planning via Mixer-based Single-step Drifting
本文提出了一种名为MISTY的高效自动驾驶运动规划方法,通过单步推理替代传统扩散模型的多次迭代,利用轻量级网络和潜在空间漂移损失实现了极低延迟(10.1毫秒)下的高质量轨迹生成,在nuPlan基准测试中达到了领先性能,并具备主动超车等灵活决策能力。
桥接场景生成与规划:通过统一视觉与运动表征实现基于世界模型的驾驶 / Bridging Scene Generation and Planning: Driving with World Model via Unifying Vision and Motion Representation
这篇论文提出了一个名为WorldDrive的自动驾驶框架,它通过统一视觉和运动表征,将预测未来场景的生成模型与实时运动规划紧密结合,从而在保证高质量视频生成的同时,实现了领先的纯视觉规划性能。
用于高维机器人运动规划的多图搜索算法 / Multi Graph Search for High-Dimensional Robot Motion Planning
这篇论文提出了一种名为多图搜索的新型运动规划算法,它通过同时维护和扩展多个搜索图来高效地为高维机器人系统(如机械臂)规划出可靠且质量可控的运动轨迹,解决了现有方法在实时性和运动一致性上的不足。
PhyRPR:无需训练的物理约束视频生成 / PhyRPR: Training-Free Physics-Constrained Video Generation
这篇论文提出了一种无需额外训练的三阶段视频生成方法,通过将物理推理与视觉合成分离开来,先理解物理状态、再规划运动骨架、最后生成细节,从而让AI生成的视频更符合物理规律且运动可控。
矢量棱镜:通过分层语义结构为矢量图形制作动画 / Vector Prism: Animating Vector Graphics by Stratifying Semantic Structure
这篇论文提出了一个通过聚合多个弱预测来恢复矢量图形语义结构的新框架,从而解决了当前视觉语言模型在自动动画制作中因图形元素碎片化而难以协调运动的难题,显著提升了动画的连贯性和可解释性。
基于草图引导验证的物理感知视频生成规划方法 / Planning with Sketch-Guided Verification for Physics-Aware Video Generation
本文提出了一种名为SketchVerify的高效视频生成方法,它通过草图验证循环在生成完整视频前筛选出物理合理且符合指令的动态轨迹,从而在提升运动质量和物理真实感的同时大幅降低计算成本。
请先 登录 后再提交论文