Nex-N1:通过统一生态系统构建大规模环境以训练智能体模型 / Nex-N1: Agentic Models Trained via a Unified Ecosystem for Large-Scale Environment Construction
1️⃣ 一句话总结
这篇论文提出了一个名为Nex的统一生态系统,通过自动生成多样且复杂的交互环境来训练大语言模型成为自主智能体,其训练的Nex-N1模型在复杂任务上表现优异,媲美顶尖商业模型。
请先 登录 后再提交论文
Nex-N1:通过统一生态系统构建大规模环境以训练智能体模型 / Nex-N1: Agentic Models Trained via a Unified Ecosystem for Large-Scale Environment Construction
这篇论文提出了一个名为Nex的统一生态系统,通过自动生成多样且复杂的交互环境来训练大语言模型成为自主智能体,其训练的Nex-N1模型在复杂任务上表现优异,媲美顶尖商业模型。
EBT-策略:能量模型解锁涌现的物理推理能力 / EBT-Policy: Energy Unlocks Emergent Physical Reasoning Capabilities
这篇论文提出了一种名为EBT-Policy的新型能量模型架构,它在机器人任务中比当前主流的扩散策略表现更好、计算效率更高,并且展现出无需额外训练就能从错误中自主恢复等智能行为。
Vlaser:具备协同具身推理能力的视觉-语言-动作模型 / Vlaser: Vision-Language-Action Model with Synergistic Embodied Reasoning
这项研究提出了一个名为Vlaser的智能体基础模型,它通过整合高级推理与低级控制能力,有效解决了视觉语言模型推理与机器人动作策略学习之间的衔接问题,并在多个具身推理任务和机器人控制基准测试中取得了领先性能。
SimpleVLA-RL:通过强化学习扩展视觉语言动作模型训练 / SimpleVLA-RL: Scaling VLA Training via Reinforcement Learning
这篇论文提出了一种名为SimpleVLA-RL的高效强化学习框架,通过减少对大规模人工操作数据的依赖并增强模型在复杂任务中的泛化能力,显著提升了视觉语言动作模型在机器人操作任务中的性能,甚至在某些真实场景中超越了传统的监督学习方法。