arXiv ID:
2603.14426
arXiv 提交日期: 2026-03-15
GenState-AI:面向AI生成视频的文本-视频检索的状态感知数据集 / GenState-AI: State-Aware Dataset for Text-to-Video Retrieval on AI-Generated Videos
1️⃣ 一句话总结
这篇论文提出了一个名为GenState-AI的AI生成视频数据集,专门用于测试和诊断文本-视频检索模型是否真正理解视频中物体状态(如位置、数量)的精确变化,而不仅仅是匹配画面内容。