arXiv ID:
2604.19234
arXiv 提交日期: 2026-04-21
学习为正确的步骤分配功劳:面向目标的视觉生成过程优化 / Learning to Credit the Right Steps: Objective-aware Process Optimization for Visual Generation
1️⃣ 一句话总结
本文提出了一种名为OTCA的框架,通过将多个奖励信号(如图像质量、运动一致性)按去噪步骤的重要性进行分解和自适应分配,从而让强化学习训练更精准地指导视觉生成模型,显著提升图像和视频的生成质量。