arXiv ID:
2603.02363
arXiv 提交日期: 2026-03-02
超越基于字幕查询的视频片段检索 / Beyond Caption-Based Queries for Video Moment Retrieval
1️⃣ 一句话总结
这篇论文发现,现有基于字幕训练的视频片段检索模型在处理更简洁的搜索查询或多片段查询时性能会显著下降,并通过分析问题根源和修改模型结构,有效提升了模型在这些实际场景下的检索准确率。