arXiv ID:
2605.18226
arXiv 提交日期: 2026-05-18
上下文记忆化:实现高效的长文本生成 / Context Memorization for Efficient Long Context Generation
1️⃣ 一句话总结
本文提出一种无需额外训练的记忆化方法,通过预先计算并存储前缀与查询之间的注意力状态,用轻量级的查找表替代传统注意力计算,从而在长文本生成时既减少计算延迟,又避免了前缀信息随生成过程衰退的问题。