🤖 系统
11-30 17:25
📄 论文总结
UltraMemV2:扩展到1200亿参数并具备卓越长上下文学习能力的内存网络 / UltraMemV2: Memory Networks Scaling to 120B Parameters with Superior Long-Context Learning
1️⃣ 一句话总结
这项研究提出了名为UltraMemV2的新型内存网络架构,通过五项关键技术改进,在保持低内存访问成本的同时,首次实现了与顶尖8专家混合模型相当的性能,并在长文本记忆等任务上表现更优。