arXiv ID:
2604.24953
ViPO:大规模视觉偏好优化 / ViPO: Visual Preference Optimization at Scale
1️⃣ 一句话总结
本文提出了一套系统方案来提升视觉生成模型的偏好优化效果:一方面设计了一种自适应算法(Poly-DPO),能在存在噪声和偏好冲突的现有数据集上稳健学习;另一方面构建了一个高质量、大规模的新数据集(ViPO),包含百万级高分辨率图像和视频对,从而验证了数据质量才是扩展视觉偏好优化的关键,而复杂优化算法仅在数据不完美时才显现优势。