arXiv ID:
2603.16413
arXiv 提交日期: 2026-03-17
为冻结编码器-解码器大语言模型训练持久性记忆:六种架构方法 / Trained Persistent Memory for Frozen Encoder--Decoder LLMs: Six Architectural Methods
1️⃣ 一句话总结
这篇论文通过一个概念验证研究,证明了在参数被冻结的大语言模型中植入一个可训练的、在连续向量空间中进行读写操作的持久记忆模块是可行的,并提出了六种实现这一目标的架构方法。