arXiv ID:
2602.21204
arXiv 提交日期: 2026-02-24
基于KV绑定的测试时训练本质上是线性注意力机制 / Test-Time Training with KV Binding Is Secretly Linear Attention
1️⃣ 一句话总结
这篇论文通过分析发现,基于键值对绑定的测试时训练并非传统认为的在线记忆学习,而本质上是一种学习到的线性注意力算子,这一新视角不仅解释了模型行为,还带来了架构简化和效率提升。