🤖 系统
12-03 15:55
LFM2技术报告 / LFM2 Technical Report
1️⃣ 一句话总结
这篇论文提出了一个名为LFM2的系列模型,它专门为在手机等边缘设备上高效运行而设计,通过创新的架构和训练方法,在保持强大任务处理能力的同时,实现了比同类模型更快的推理速度和更低的内存占用。
请先 登录 后再提交论文
LFM2技术报告 / LFM2 Technical Report
这篇论文提出了一个名为LFM2的系列模型,它专门为在手机等边缘设备上高效运行而设计,通过创新的架构和训练方法,在保持强大任务处理能力的同时,实现了比同类模型更快的推理速度和更低的内存占用。
SwiftVLA:以最小开销为轻量级视觉-语言-动作模型解锁时空动态理解能力 / SwiftVLA: Unlocking Spatiotemporal Dynamics for Lightweight VLA Models at Minimal Overhead
这篇论文提出了一种名为SwiftVLA的新型架构,它通过创新的融合令牌和掩码重建训练方法,让轻量级的视觉-语言-动作模型在保持高效率的同时,也能像大模型一样理解视频中的时空动态信息,从而在边缘设备上实现高性能、低延迟的机器人控制。
Xmodel-2.5:一个13亿参数的数据高效推理小语言模型 / Xmodel-2.5: 1.3B Data-Efficient Reasoning SLM
这篇论文提出了一个名为Xmodel-2.5的13亿参数小语言模型,它通过创新的训练方法(如最大更新参数化、分阶段训练课程和优化器切换)实现了高效推理能力,旨在以较低的计算成本替代大型模型,适用于边缘或成本敏感的场景。