arXiv ID:
2606.04326
衡量关键要素:概念瓶颈模型的合成基准测试 / Measuring What Matters: Synthetic Benchmarks for Concept Bottleneck Models
1️⃣ 一句话总结
本文针对概念瓶颈模型缺乏真实概念标签数据集的问题,设计了一套可控制数据模态、概念选择、标注质量等关键因素的合成基准测试,用于评估模型在辅助决策和自动化任务中的表现,并帮助诊断其失败模式。