arXiv ID:
2604.07413
arXiv 提交日期: 2026-04-08
FORGE:面向制造场景的细粒度多模态评估 / FORGE:Fine-grained Multimodal Evaluation for Manufacturing Scenarios
1️⃣ 一句话总结
这篇论文提出了一个名为FORGE的评估框架,通过构建包含真实2D图像和3D点云的细粒度标注数据集,评估了多模态大模型在制造业任务中的表现,发现其核心瓶颈并非视觉理解能力,而是缺乏领域专业知识,并证明了利用该数据集进行微调能显著提升模型在制造业场景下的准确性。