arXiv ID:
2512.15715
arXiv 提交日期: 2025-12-17
追求基于像素监督的视觉预训练 / In Pursuit of Pixel Supervision for Visual Pre-training
1️⃣ 一句话总结
这篇论文提出了一种名为Pixio的增强型掩码自编码器模型,通过使用更具挑战性的预训练任务和更强大的架构,在数十亿网络图像上进行训练,证明了基于像素的自监督学习方法依然高效且具有竞争力,能够在多种下游视觉任务中取得与当前先进模型相当或更优的性能。