arXiv最新AI论文速览速学

🔍

标签: #behavior cloning ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 100 72小时内新更新论文 72h更新 100 最新: Value-Guidance MeanFlow for Offline Multi-Agent Reinforcement Learning 04-10

arXiv ID: 2604.08174

arXiv 提交日期: 2026-04-09

multi-agents reinforcement learning model training offline rl flow-based models multi-agent collaboration value guidance behavior cloning

用于离线多智能体强化学习的价值引导均值流方法 / Value-Guidance MeanFlow for Offline Multi-Agent Reinforcement Learning

1️⃣ 一句话总结

这篇论文提出了一种名为VGM²P的新方法，它通过结合全局价值引导和高效的均值流生成模型，让多个AI智能体能够直接从离线数据中快速学习协作策略，同时避免了传统方法对参数敏感和计算效率低的问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.04575

arXiv 提交日期: 2026-01-08

agents model training benchmark behavior cloning scaling laws video game playing causal reasoning foundation model

扩展行为克隆提升因果推理：一个用于实时电子游戏游玩的开源模型 / Scaling Behavior Cloning Improves Causal Reasoning: An Open Model for Real-Time Video Game Playing

1️⃣ 一句话总结

这篇论文通过开源大量游戏数据和模型，证明了在行为克隆任务中，同时扩大模型规模和训练数据量不仅能提升模型玩3D游戏的水平，还能使其学会更具因果推理能力的策略。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.02427

arXiv 提交日期: 2026-01-04

agents computer vision model training gaming agents behavior cloning cross-game generalization vision-action model video dataset

NitroGen：一个面向通用游戏智能体的开放基础模型 / NitroGen: An Open Foundation Model for Generalist Gaming Agents

1️⃣ 一句话总结

这篇论文提出了一个名为NitroGen的通用游戏AI基础模型，它通过从海量游戏视频中学习玩家操作，能够直接理解和执行多种不同类型游戏中的复杂任务，并在未见过的新游戏上表现出强大的适应能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2509.19301

arXiv 提交日期: 2025-09-23

robotics reinforcement learning agents residual learning behavior cloning off-policy rl visuomotor control manipulation policies

用于微调行为克隆策略的残差离线策略强化学习 / Residual Off-Policy RL for Finetuning Behavior Cloning Policies

1️⃣ 一句话总结

这项研究提出了一种结合行为克隆和强化学习优势的新方法，通过让智能体在预训练的行为策略基础上学习轻量级残差修正，仅需稀疏的奖励信号就能有效提升复杂机器人系统的操作性能，并首次在真实世界的类人机器人上成功实现了强化学习训练。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2604.08174

1️⃣ 一句话总结

arXiv ID: 2601.04575

1️⃣ 一句话总结

arXiv ID: 2601.02427

1️⃣ 一句话总结

arXiv ID: 2509.19301

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2604.08174 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.04575 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.02427 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2509.19301 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2604.08174

arXiv ID: 2601.04575

arXiv ID: 2601.02427

arXiv ID: 2509.19301