arXiv ID:
2511.05936
arXiv 提交日期: 2025-11-08
引导视觉-语言-动作模型未来发展的十大开放挑战 / 10 Open Challenges Steering the Future of Vision-Language-Action Models
1️⃣ 一句话总结
这篇论文指出了视觉-语言-动作模型在迈向广泛应用过程中需要解决的十大关键挑战,包括多模态理解、推理能力、数据获取和安全性等,并探讨了推动其发展的新兴技术趋势。