🤖 系统
11-30 17:47
📄 论文总结
迈向通用视频检索:通过合成的多模态金字塔课程泛化视频嵌入 / Towards Universal Video Retrieval: Generalizing Video Embedding via Synthesized Multimodal Pyramid Curriculum
1️⃣ 一句话总结
本研究提出了一个集评估、数据和模型于一体的通用视频检索框架,通过构建综合评测基准、生成大规模合成数据以及设计多模态学习课程,显著提升了视频检索模型在零样本场景下的跨任务和跨领域泛化能力。