arXiv ID:
2512.24160
迈向开放词汇工业缺陷理解:基于大规模多模态数据集 / Towards Open-Vocabulary Industrial Defect Understanding with a Large-Scale Multimodal Dataset
1️⃣ 一句话总结
这篇论文构建了一个包含百万级图像-文本对的大型工业缺陷数据集IMDD-1M,并基于此训练了一个通用的视觉-语言基础模型,该模型只需少量数据微调就能在多种工业检测任务上达到专家模型水平,为实现高效、可扩展的智能制造质检提供了新方案。