🤖 系统
11-30 17:36
📄 论文总结
MemMamba:重新思考状态空间模型中的记忆模式 / MemMamba: Rethinking Memory Patterns in State Space Model
1️⃣ 一句话总结
本文提出了一种名为MemMamba的新型神经网络架构,通过引入状态总结机制和跨层跨令牌注意力,有效解决了现有模型在长序列处理中的记忆衰退问题,在保持线性计算复杂度的同时显著提升了长程记忆能力和推理效率。