arXiv ID:
2603.09576
无遗忘路由 / Routing without Forgetting
1️⃣ 一句话总结
这篇论文提出了一种名为‘无遗忘路由’的新方法,通过在Transformer模型中引入基于能量的联想检索层,让模型能够在只看到一次数据的情况下,动态地为每个输入选择最合适的处理路径,从而有效解决了在线持续学习中的灾难性遗忘问题。