arXiv ID:
2604.04720
arXiv 提交日期: 2026-04-06
是什么造就了良好的多语言推理?用可度量特征解构推理轨迹 / What Makes Good Multilingual Reasoning? Disentangling Reasoning Traces with Measurable Features
1️⃣ 一句话总结
这篇论文挑战了“让所有语言的推理都模仿英语推理就能提升多语言模型性能”的假设,通过定义一套可度量的推理特征并进行分析,发现不同语言的有效推理模式存在显著差异,因此需要设计适应语言特定模式的评估标准和奖励机制。