arXiv ID:
2602.16704
arXiv 提交日期: 2026-02-18
基于下一序列预测的强化快速权重 / Reinforced Fast Weights with Next-Sequence Prediction
1️⃣ 一句话总结
这篇论文提出了一个名为REFINE的强化学习框架,通过训练模型预测整个后续序列而非单个词,有效解决了现有快速权重模型在长文本理解中语义连贯性不足的问题,从而显著提升了其在多种长上下文任务上的性能。