🤖 系统
11-30 17:46
📄 论文总结
分步采样,分块优化:面向文本到图像生成的分块级GRPO方法 / Sample By Step, Optimize By Chunk: Chunk-Level GRPO For Text-to-Image Generation
1️⃣ 一句话总结
这项研究提出了一种名为Chunk-GRPO的新方法,通过将文本生成图像的连续步骤组合成‘块’进行优化,有效提升了图像质量和与人类偏好的对齐程度,克服了传统方法在优势分配和时间动态建模上的不足。