arXiv最新AI论文速览速学

📄

2512.04987

🤖 系统

12-05 14:51

agents llm systems

agentic ai environment generation infrastructure policy learning sim-to-real

Nex-N1：通过统一生态系统构建大规模环境以训练智能体模型 / Nex-N1: Agentic Models Trained via a Unified Ecosystem for Large-Scale Environment Construction

1️⃣ 一句话总结

这篇论文提出了一个名为Nex的统一生态系统，通过自动生成多样且复杂的交互环境来训练大语言模型成为自主智能体，其训练的Nex-N1模型在复杂任务上表现优异，媲美顶尖商业模型。

👋 没兴趣 ☆ 感兴趣 📌 待读

📄 打开原文 PDF

📄

2510.27545

🤖 系统

11-30 17:47

robotics model training agents

energy-based models policy learning robust inference physical reasoning vision-language-action

📄 论文总结

EBT-策略：能量模型解锁涌现的物理推理能力 / EBT-Policy: Energy Unlocks Emergent Physical Reasoning Capabilities

1️⃣ 一句话总结

这篇论文提出了一种名为EBT-Policy的新型能量模型架构，它在机器人任务中比当前主流的扩散策略表现更好、计算效率更高，并且展现出无需额外训练就能从错误中自主恢复等智能行为。

👋 没兴趣 ☆ 感兴趣 📌 待读

📄 打开原文 PDF

📄

2510.11027

🤖 系统

11-30 17:40

robotics agents model training

embodied reasoning vision-language-action policy learning domain shift robot control

📄 论文总结

Vlaser：具备协同具身推理能力的视觉-语言-动作模型 / Vlaser: Vision-Language-Action Model with Synergistic Embodied Reasoning

1️⃣ 一句话总结

这项研究提出了一个名为Vlaser的智能体基础模型，它通过整合高级推理与低级控制能力，有效解决了视觉语言模型推理与机器人动作策略学习之间的衔接问题，并在多个具身推理任务和机器人控制基准测试中取得了领先性能。

👋 没兴趣 ☆ 感兴趣 📌 待读

📄 打开原文 PDF

📄

2509.09674

🤖 系统

11-30 17:31

robotics model training reinforcement learning

vision-language-action robotic manipulation rl framework generalization policy learning

📄 论文总结

SimpleVLA-RL：通过强化学习扩展视觉语言动作模型训练 / SimpleVLA-RL: Scaling VLA Training via Reinforcement Learning

1️⃣ 一句话总结

这篇论文提出了一种名为SimpleVLA-RL的高效强化学习框架，通过减少对大规模人工操作数据的依赖并增强模型在复杂任务中的泛化能力，显著提升了视觉语言动作模型在机器人操作任务中的性能，甚至在某些真实场景中超越了传统的监督学习方法。

👋 没兴趣 ☆ 感兴趣 📌 待读

📄 打开原文 PDF

📚 arXiv最新AI论文速览速学

菜单

提交新论文

2512.04987

1️⃣ 一句话总结

2510.27545

📄 论文总结

1️⃣ 一句话总结

2510.11027

📄 论文总结

1️⃣ 一句话总结

2509.09674

📄 论文总结

1️⃣ 一句话总结

密码管理

设置密码

修改密码

移除密码

菜单

提交新论文

需要登录

2512.04987 📝

1️⃣ 一句话总结

2510.27545 📝

📄 论文总结

1️⃣ 一句话总结

2510.11027 📝

📄 论文总结

1️⃣ 一句话总结

2509.09674 📝

📄 论文总结

1️⃣ 一句话总结

获取最新论文摘要

2512.04987

2510.27545

2510.11027

2509.09674