arXiv ID:
2604.19734
arXiv 提交日期: 2026-04-21
UniT:面向人至人形机器人策略学习与世界建模的统一物理语言 / UniT: Toward a Unified Physical Language for Human-to-Humanoid Policy Learning and World Modeling
1️⃣ 一句话总结
UniT框架通过一种基于视觉锚定的统一潜在动作分词器,将人类动作数据转化为不依赖具体身体结构的物理意图编码,从而让人形机器人能高效从海量人类视频中学习,并在策略控制与视频生成任务上实现零样本跨形态迁移。