← 返回列表

菜单

🤖 系统
📄 Abstract - MIRA: Multimodal Imagination for Reasoning Assessment
正在获取摘要...
详细标签: visual reasoning multimodal imagination evaluation benchmark visual chain-of-thought intermediate visual representation 或 搜索:

📄 论文总结

多模态想象力推理评估基准 / MIRA: Multimodal Imagination for Reasoning Assessment


1️⃣ 一句话总结

本文提出了MIRA基准,用于评估多模态大语言模型在需要生成中间视觉图像进行推理的任务中的能力,发现现有模型在此类任务上表现不佳,但通过视觉思维链方法可显著提升性能。


2️⃣ 论文创新点

1. MIRA基准设计

2. 三级评估协议

3. 视觉思维链方法


3️⃣ 主要结果与价值

结果亮点

实际价值


4️⃣ 术语表

📄 打开原文 PDF