arXiv ID:
2606.04588
arXiv 提交日期: 2026-06-03
VCIFBench:评估视频理解中的复杂指令遵循能力 / VCIFBench: Evaluating Complex Instruction Following for Video Understanding
1️⃣ 一句话总结
该论文提出了VCIFBench基准测试,专门用来评估多模态大模型在视频理解任务中,是否能够准确遵循包含内容、格式、风格和结构等多重约束的复杂指令,并通过实验发现现有模型在这方面的表现仍有不足,而使用该基准数据微调可以提升模型性能。