arXiv ID:
2605.26099
arXiv 提交日期: 2026-05-25
语言模型需要“睡眠” / Language Models Need Sleep
1️⃣ 一句话总结
本论文提出一种类似动物睡眠的机制,让大型语言模型在处理长序列任务时,能通过离线“睡眠”阶段将已积累的信息转化为持久化的快速权重,从而在不增加推理延迟的情况下显著提升模型在需要深度推理任务上的表现。