arXiv ID:
2603.28718
arXiv 提交日期: 2026-03-30
流匹配模型上GRPO的逐步信用分配 / Stepwise Credit Assignment for GRPO on Flow-Matching Models
1️⃣ 一句话总结
这篇论文提出了一种名为Stepwise-Flow-GRPO的新方法,它通过分析图像生成过程中不同步骤(如早期构图和后期细节处理)对最终结果的不同贡献,为每一步分配合适的“功劳”,从而解决了原有方法对所有步骤一视同仁导致的效率低下问题,使得AI模型能更快、更高效地学习如何生成高质量的图像。