arXiv ID:
2512.12967
QwenLong-L1.5:通过系统性后训练创新实现卓越的长上下文推理能力 / QwenLong-L1.5: Post-Training Recipe for Long-Context Reasoning and Memory Management
1️⃣ 一句话总结
本文提出了QwenLong-L1.5模型,通过一套整合了高质量数据合成、稳定强化学习训练和超长上下文记忆增强架构的系统性后训练方案,显著提升了模型在长上下文推理任务上的性能,使其在多个基准测试中达到与顶尖模型相当的水平。