arXiv ID:
2606.12105
DAM-VLA:解耦异步多模态视觉语言动作模型 / DAM-VLA: Decoupled Asynchronous Multimodal Vision Language Action model
1️⃣ 一句话总结
本文提出DAM-VLA模型,通过让触觉、视觉和语言等不同模态按各自传感器频率独立更新并融合,解决了传统同步模型处理速度不匹配的问题,在七项高难度机器人操作任务中将平均成功率从约41%提升至95%以上,并实现了流畅的100赫兹实时控制。