arXiv最新AI论文速览速学

📄

2511.01914

🤖 系统

11-30 17:49

robotics multi-modal model training

vision-language-action manipulation latent actions action representation robot control

📄 论文总结

iFlyBot-VLA 技术报告 / iFlyBot-VLA Technical Report

1️⃣ 一句话总结

这篇论文提出了一个名为iFlyBot-VLA的新型视觉-语言-动作大模型，它通过结合隐式高层意图和显式低层动态的双重动作表示框架，有效提升了机器人在复杂操作任务中的感知、推理和执行能力。

👋 没兴趣 ☆ 感兴趣 📌 待读

📄 打开原文 PDF

📄

2510.11027

🤖 系统

11-30 17:40

robotics agents model training

embodied reasoning vision-language-action policy learning domain shift robot control

📄 论文总结

Vlaser：具备协同具身推理能力的视觉-语言-动作模型 / Vlaser: Vision-Language-Action Model with Synergistic Embodied Reasoning

1️⃣ 一句话总结

这项研究提出了一个名为Vlaser的智能体基础模型，它通过整合高级推理与低级控制能力，有效解决了视觉语言模型推理与机器人动作策略学习之间的衔接问题，并在多个具身推理任务和机器人控制基准测试中取得了领先性能。

👋 没兴趣 ☆ 感兴趣 📌 待读

📄 打开原文 PDF

📄

2510.01068

🤖 系统

11-30 17:35

robotics model training agents

policy composition diffusion models robot control test-time optimization multi-modal policies

📄 论文总结

组合你的策略！通过测试时分布级组合改进基于扩散或流的机器人策略 / Compose Your Policies! Improving Diffusion-based or Flow-based Robot Policies via Test-time Distribution-level Composition

1️⃣ 一句话总结

这项研究提出了一种无需额外训练即可提升机器人策略性能的新方法，通过组合多个预训练策略的分布得分，实现了超越单个策略的适应性和任务表现。

👋 没兴趣 ☆ 感兴趣 📌 待读

📄 打开原文 PDF

📄

2508.21112

🤖 系统

11-30 17:26

robotics multi-modal model training

vision-language-action embodied ai robot control multimodal reasoning foundation model

📄 论文总结

EO-1：用于通用机器人控制的交错式视觉-文本-动作预训练 / EO-1: Interleaved Vision-Text-Action Pretraining for General Robot Control

1️⃣ 一句话总结

这篇论文提出了一个名为EO-1的通用机器人基础模型，它通过交错学习视觉、文本和动作数据，显著提升了机器人在复杂任务中的多模态推理和动作执行能力。

👋 没兴趣 ☆ 感兴趣 📌 待读

📄 打开原文 PDF

📚 arXiv最新AI论文速览速学

菜单

提交新论文

2511.01914

📄 论文总结

1️⃣ 一句话总结

2510.11027

📄 论文总结

1️⃣ 一句话总结

2510.01068

📄 论文总结

1️⃣ 一句话总结

2508.21112

📄 论文总结

1️⃣ 一句话总结

密码管理

设置密码

修改密码

移除密码

菜单

提交新论文

需要登录

2511.01914 📝

📄 论文总结

1️⃣ 一句话总结

2510.11027 📝

📄 论文总结

1️⃣ 一句话总结

2510.01068 📝

📄 论文总结

1️⃣ 一句话总结

2508.21112 📝

📄 论文总结

1️⃣ 一句话总结

获取最新论文摘要

2511.01914

2510.11027

2510.01068

2508.21112