🤖 系统
11-30 17:48
📄 论文总结
统一扩散VLA:通过联合离散去噪扩散过程的视觉-语言-动作模型 / Unified Diffusion VLA: Vision-Language-Action Model via Joint Discrete Denoising Diffusion Process
1️⃣ 一句话总结
这篇论文提出了一种新型的视觉-语言-动作模型,通过一个联合的扩散过程同步生成未来图像和预测机器人动作,实现了多任务协同优化,在多个基准测试中取得了领先性能且推理速度更快。