arXiv ID:
2512.11362
arXiv 提交日期: 2025-12-12
视觉-语言-动作模型剖析:从模块、里程碑到挑战 / An Anatomy of Vision-Language-Action Models: From Modules to Milestones and Challenges
1️⃣ 一句话总结
这篇综述论文系统性地梳理了推动机器人发展的视觉-语言-动作模型,通过剖析其核心模块、发展里程碑,并重点聚焦于表征、执行、泛化、安全及数据评估五大核心挑战,为研究者提供了一份从入门到前沿的清晰路线图。