arXiv ID:
2606.30124
arXiv 提交日期: 2026-06-29
SciIR:面向科学图像推理生成的大规模训练数据集与基准 / SciIR: A Large-scale Training Dataset and Benchmark for Scientific Image Reasoning Generation
1️⃣ 一句话总结
该论文针对当前文本生成图像模型在科学图像中缺乏逻辑推理能力的问题,构建了一个包含八万多个高质量科学图像-文本对的大规模数据集SciIR-82k,并提出了一套基于符号学三要素(实体结构、科学过程、科学定律)的评估基准SciIR-Bench,通过微调实验使模型的科学图像生成准确率从35%提升至43%。