arXiv ID:
2511.01163
ROVER:面向全模态生成的互惠跨模态推理基准评测 / ROVER: Benchmarking Reciprocal Cross-Modal Reasoning for Omnimodal Generation
1️⃣ 一句话总结
这篇论文提出了一个名为ROVER的基准测试,用于评估统一多模态模型在图像和文本之间进行双向推理的能力,发现跨模态推理对生成质量至关重要,并揭示了模型在物理和符号推理上的表现差异。