arXiv ID:
2512.12602
arXiv 提交日期: 2025-12-14
无误差线性注意力是免费午餐:来自连续时间动力学的精确解 / Error-Free Linear Attention is a Free Lunch: Exact Solution from Continuous-Time Dynamics
1️⃣ 一句话总结
这篇论文提出了一种名为EFLA的新型线性注意力机制,它通过将在线学习过程建模为连续时间动态系统,并巧妙地利用其矩阵结构,首次实现了在保持线性计算复杂度的同时,获得了完全精确、无误差积累的解,从而在理论上和实验上都显著提升了长文本建模的性能。