arXiv ID:
2512.23675
arXiv 提交日期: 2025-12-29
面向长上下文的端到端测试时训练 / End-to-End Test-Time Training for Long Context
1️⃣ 一句话总结
这篇论文提出了一种新方法,将长文本建模视为一个持续学习问题,通过让模型在测试时根据当前文本内容自我学习,并利用训练时的元学习进行优化,从而在保持推理速度的同时,实现了与标准全注意力模型相当的性能扩展能力。