arXiv ID:
2512.14620
JMMMU-Pro:通过氛围基准构建方法建立的基于图像的日本多学科多模态理解基准 / JMMMU-Pro: Image-based Japanese Multi-discipline Multimodal Understanding Benchmark via Vibe Benchmark Construction
1️⃣ 一句话总结
这篇论文提出了一个名为JMMMU-Pro的日本多学科图像理解测试集,以及一个高效构建此类测试集的“氛围基准构建”方法,该方法利用先进图像生成模型自动生成题目图像并由人工校验,旨在更严格地评估大型多模态模型在日语环境下的综合图文理解能力。