arXiv ID:
2602.16249
arXiv 提交日期: 2026-02-18
AFFMAE:面向桌面显卡的可扩展高效视觉预训练框架 / AFFMAE: Scalable and Efficient Vision Pretraining for Desktop Graphics Cards
1️⃣ 一句话总结
这篇论文提出了一种名为AFFMAE的新型自监督视觉预训练方法,它通过创新的动态合并可见图像块技术,在保持高性能的同时,大幅降低了计算和内存需求,使得在单张桌面级显卡上也能高效训练高分辨率视觉模型。