arXiv ID:
2512.04784
arXiv 提交日期: 2025-12-02
PaCo-RL:通过成对奖励建模推进强化学习在一致性图像生成中的应用 / PaCo-RL: Advancing Reinforcement Learning for Consistent Image Generation with Pairwise Reward Modeling
1️⃣ 一句话总结
这篇论文提出了一个名为PaCo-RL的新框架,它通过一个专门评估图像一致性的奖励模型和一个高效的强化学习算法,让AI模型能够更稳定、更高效地生成在角色、风格和逻辑上保持连贯的多张图像,比如用于故事叙述或角色设计。