arXiv ID:
2603.02663
arXiv 提交日期: 2026-03-03
利用多模态项目反应理论评估跨模态推理能力与问题特性 / Evaluating Cross-Modal Reasoning Ability and Problem Characteristics with Multimodal Item Response Theory
1️⃣ 一句话总结
本文提出了一种名为M3IRT的多模态项目反应理论框架,它能有效区分并筛选出真正需要跨模态推理的高质量测试问题,从而以更低的评估成本更可靠地衡量多模态大模型的综合理解能力。