arXiv ID:
2603.10793
多语言推理训练场:程序化推理环境的多语言扩展 / Multilingual Reasoning Gym: Multilingual Scaling of Procedural Reasoning Environments
1️⃣ 一句话总结
这篇论文提出了一个名为‘多语言推理训练场’的新平台,它在原有基础上将程序化生成的可验证推理问题扩展到了14种语言,通过精心翻译和适配确保了问题的自然性,从而能够大规模生成跨语言平行的训练数据,以支持多语言推理模型的研究。