arXiv ID:
2605.28053
arXiv 提交日期: 2026-05-27
RW-TTT:面向请求专属测试时训练状态的批量服务 / RW-TTT: Batched Serving for Request-Owned Test-Time Training State
1️⃣ 一句话总结
本文提出了一种名为RW-TTT的批量服务方法,它允许大语言模型在生成回答时,为每个用户请求维护独立的“测试时训练”状态(如快速权重或低秩增量),通过智能地组合兼容的解码步骤并仅在安全时更新状态,实现了相比传统顺序执行近10倍的速度提升,且不改变模型行为。