arXiv ID:
2602.02043
arXiv 提交日期: 2026-02-02
Auto-Comp:一种用于可扩展组合性探测对比式视觉-语言模型的自动化流程 / Auto-Comp: An Automated Pipeline for Scalable Compositional Probing of Contrastive Vision-Language Models
1️⃣ 一句话总结
这篇论文提出了一个名为Auto-Comp的自动化工具,它能大规模生成可控的测试数据,用于精准诊断当前主流视觉-语言模型在组合推理(比如正确绑定物体的颜色、位置等属性)上的普遍缺陷,并发现模型在复杂场景中会顾此失彼的深层矛盾。