← 返回列表

菜单

🤖 系统
📄 Abstract - BEAR: Benchmarking and Enhancing Multimodal Language Models for Atomic Embodied Capabilities
正在获取摘要...
顶级标签: agents
详细标签: embodied ai multimodal evaluation visual reasoning agent systems spatial understanding 或 搜索:

📄 论文总结

BEAR:多模态大语言模型具身能力评估与增强基准 / BEAR: Benchmarking and Enhancing Multimodal Language Models for Atomic Embodied Capabilities


1️⃣ 一句话总结

本研究提出了首个系统评估多模态大语言模型具身能力的综合基准BEAR,并开发了BEAR-Agent代理系统,通过集成视觉工具显著提升了模型在具身任务中的表现。


2️⃣ 论文创新点

1. BEAR基准框架

2. 长视野类别设计

3. BEAR-Agent系统


3️⃣ 主要结果与价值

结果亮点

实际价值


4️⃣ 术语表

📄 打开原文 PDF