arXiv ID:
2510.11026
arXiv 提交日期: 2025-10-13
GIR-Bench:用于推理图像生成的通用基准 / GIR-Bench: Versatile Benchmark for Generating Images with Reasoning
1️⃣ 一句话总结
这篇论文提出了一个名为GIR-Bench的基准测试,用于系统评估多模态模型在图像理解与生成之间的一致性、逻辑推理驱动的图像生成以及多步骤图像编辑能力,揭示了当前模型在理解与生成之间仍存在差距。