← 返回列表

菜单

🤖 系统
📄 Abstract
正在获取摘要...
顶级标签: robotics
详细标签: discrete diffusion vision-language-action robot control parallel decoding adaptive re-masking 或 搜索:

📄 论文总结

离散扩散视觉-语言-动作模型

Discrete Diffusion Vision-Language-Action Model


1️⃣ 一句话总结

该论文提出了一种基于离散扩散模型的视觉-语言-动作统一框架,通过将连续动作维度离散化为token,在单一Transformer架构中实现并行解码和自适应重掩码,在多个机器人任务基准上取得了最佳性能。


2️⃣ 论文创新点

1. 离散扩散动作解码

2. 自适应解码策略

3. 统一Transformer架构


3️⃣ 主要结果与价值

实验结果亮点

实际应用价值


4️⃣ 术语表

📄 打开原文 PDF