arXiv ID:
2512.10945
arXiv 提交日期: 2025-12-11
MeViS:一个用于指代运动表达视频分割的多模态数据集 / MeViS: A Multi-Modal Dataset for Referring Motion Expression Video Segmentation
1️⃣ 一句话总结
这篇论文提出了一个名为MeViS的大规模多模态数据集,专门用于研究如何根据语言描述的运动来分割和追踪视频中的目标物体,它弥补了现有数据集对运动信息关注不足的缺陷,并通过实验展示了现有方法的局限性,同时提供了一个促进相关算法发展的平台。