arXiv ID:
2605.03456
arXiv 提交日期: 2026-05-05
VL-SAM-v3:基于记忆引导的视觉先验实现开放世界目标检测 / VL-SAM-v3: Memory-Guided Visual Priors for Open-World Object Detection
1️⃣ 一句话总结
本文提出了VL-SAM-v3框架,通过从外部记忆中检索视觉范例生成稀疏和稠密两类视觉先验,并与原检测提示融合,从而让模型在开放世界环境下(包括已知类别列表和未知类别)更好地识别罕见、纹理模糊或背景杂乱的目标,在LVIS数据集上取得了显著提升。