arXiv ID:
2603.16944
arXiv 提交日期: 2026-03-16
Omni IIE Bench:评估图像编辑模型的实际能力基准 / Omni IIE Bench: Benchmarking the Practical Capabilities of Image Editing Models
1️⃣ 一句话总结
这篇论文提出了一个名为Omni IIE Bench的新基准测试,专门用于诊断指令式图像编辑模型在不同语义复杂度任务中的表现一致性,发现几乎所有主流模型在处理高语义复杂度任务时性能都会显著下降。