📄 论文总结
iFlyBot-VLA 技术报告 / iFlyBot-VLA Technical Report
1️⃣ 一句话总结
这篇论文提出了一个名为iFlyBot-VLA的新型视觉-语言-动作大模型,它通过结合隐式高层意图和显式低层动态的双重动作表示框架,有效提升了机器人在复杂操作任务中的感知、推理和执行能力。
请先 登录 后再提交论文
iFlyBot-VLA 技术报告 / iFlyBot-VLA Technical Report
这篇论文提出了一个名为iFlyBot-VLA的新型视觉-语言-动作大模型,它通过结合隐式高层意图和显式低层动态的双重动作表示框架,有效提升了机器人在复杂操作任务中的感知、推理和执行能力。
Vlaser:具备协同具身推理能力的视觉-语言-动作模型 / Vlaser: Vision-Language-Action Model with Synergistic Embodied Reasoning
这项研究提出了一个名为Vlaser的智能体基础模型,它通过整合高级推理与低级控制能力,有效解决了视觉语言模型推理与机器人动作策略学习之间的衔接问题,并在多个具身推理任务和机器人控制基准测试中取得了领先性能。
组合你的策略!通过测试时分布级组合改进基于扩散或流的机器人策略 / Compose Your Policies! Improving Diffusion-based or Flow-based Robot Policies via Test-time Distribution-level Composition
这项研究提出了一种无需额外训练即可提升机器人策略性能的新方法,通过组合多个预训练策略的分布得分,实现了超越单个策略的适应性和任务表现。
EO-1:用于通用机器人控制的交错式视觉-文本-动作预训练 / EO-1: Interleaved Vision-Text-Action Pretraining for General Robot Control
这篇论文提出了一个名为EO-1的通用机器人基础模型,它通过交错学习视觉、文本和动作数据,显著提升了机器人在复杂任务中的多模态推理和动作执行能力。