arXiv ID:
2606.24369
arXiv 提交日期: 2026-06-23
加速面向视觉生成大模型的解耦强化学习:基于扩散并行与训练器辅助生成 / Accelerating Disaggregated RL for Visual Generative LLMs with Diffusion-Based Parallelism and Trainer-Assisted Generation
1️⃣ 一句话总结
本文提出DigenRL框架,通过将强化学习中的生成与训练过程解耦,并设计扩散架构下的流水线并行与训练器柔性辅助机制,有效提升了视觉生成大模型在强化学习阶段的计算效率,实现1.56-2.10倍的吞吐量提升。