arXiv ID:
2606.02465
arXiv 提交日期: 2026-06-01
何时翻译:面向多语言推理的选择性翻译学习 / Learning When to Translate for Multilingual Reasoning
1️⃣ 一句话总结
本文提出了一种名为Luar的强化学习框架,让推理语言模型在面对非英语输入时,能够自动判断自己的理解是否可靠,仅在必要时使用英语翻译辅助推理,从而在不影响准确性的前提下大幅提升低资源语言的推理性能。