📄 论文总结
MiMo-Embodied:跨具身基础模型技术报告 / MiMo-Embodied: X-Embodied Foundation Model Technical Report
1️⃣ 一句话总结
这篇论文开源了首个跨具身基础模型MiMo-Embodied,它通过多阶段学习和优化训练方法,在自动驾驶和具身AI两大领域同时实现了顶尖性能,并证明了这两个领域能够相互促进和提升。
请先 登录 后再提交论文
MiMo-Embodied:跨具身基础模型技术报告 / MiMo-Embodied: X-Embodied Foundation Model Technical Report
这篇论文开源了首个跨具身基础模型MiMo-Embodied,它通过多阶段学习和优化训练方法,在自动驾驶和具身AI两大领域同时实现了顶尖性能,并证明了这两个领域能够相互促进和提升。
OlmoEarth:面向多模态地球观测的稳定潜在图像建模 / OlmoEarth: Stable Latent Image Modeling for Multimodal Earth Observation
这篇论文提出了一个名为OlmoEarth的多模态时空基础模型,它通过创新的自监督学习方法在地球观测领域实现了领先性能,并部署为一个端到端平台,帮助非营利组织利用先进技术解决全球性问题。
Medal S:用于医学分割的时空文本提示模型 / Medal S: Spatio-Textual Prompt Model for Medical Segmentation
这篇论文提出了一个名为Medal S的医学图像分割基础模型,它能够同时利用空间位置和文本描述作为输入提示,在保持高分辨率3D图像上下文的同时,显著提升了多类别分割的精度和效率,并在多种医学影像模态上验证了其优越性能。
SciReasoner:跨学科科学推理基础模型 / SciReasoner: Laying the Scientific Reasoning Ground Across Disciplines
这篇论文提出了一个跨学科的科学推理基础模型,能够将自然语言与多种科学数据格式对齐,并通过大规模预训练和强化学习技术,在科学翻译、知识提取、性质预测等上百个任务中实现比专业系统更广泛的覆盖和更强的泛化能力。
EO-1:用于通用机器人控制的交错式视觉-文本-动作预训练 / EO-1: Interleaved Vision-Text-Action Pretraining for General Robot Control
这篇论文提出了一个名为EO-1的通用机器人基础模型,它通过交错学习视觉、文本和动作数据,显著提升了机器人在复杂任务中的多模态推理和动作执行能力。