arXiv ID:
2512.22234
DiRL:一种用于扩散语言模型的高效后训练框架 / DiRL: An Efficient Post-Training Framework for Diffusion Language Models
1️⃣ 一句话总结
本文提出了一种名为DiRL的高效后训练框架,通过整合优化的训练与推理技术,显著提升了扩散语言模型在复杂数学推理任务上的性能,使其超越了同类模型。