arXiv ID:
2511.21541
arXiv 提交日期: 2025-11-26
视频生成模型是优秀的潜在奖励模型 / Video Generation Models Are Good Latent Reward Models
1️⃣ 一句话总结
这项研究提出了一种名为PRFL的新方法,直接在视频生成的潜在空间中进行偏好优化,从而在显著降低计算成本和内存消耗的同时,更好地让生成的视频内容符合人类偏好。