arXiv ID:
2601.08584
arXiv 提交日期: 2026-01-13
Ministral 3 / Ministral 3
1️⃣ 一句话总结
这篇论文介绍了一个名为Ministral 3的高效语言模型系列,它包含三种不同大小的模型,通过一种创新的‘级联蒸馏’技术训练而成,不仅支持文本和图像理解,还提供了基础版、指令微调版和推理版三种变体,旨在为计算和内存资源有限的应用场景提供强大且开源(Apache 2.0许可)的AI解决方案。