arXiv ID:
2512.16793
arXiv 提交日期: 2025-12-18
PhysBrain:以人类第一视角数据为桥梁,连接视觉语言模型与物理智能 / PhysBrain: Human Egocentric Data as a Bridge from Vision Language Models to Physical Intelligence
1️⃣ 一句话总结
这篇论文提出了一种新方法,通过大规模处理人类第一视角视频,将其转化为机器人能学习的结构化训练数据,从而有效提升了机器人对物理世界的理解和任务规划能力。