arXiv ID:
2601.13262
arXiv 提交日期: 2026-01-19
CURE-Med:基于课程学习的强化学习框架用于多语言医学推理 / CURE-Med: Curriculum-Informed Reinforcement Learning for Multilingual Medical Reasoning
1️⃣ 一句话总结
该论文提出了一个结合课程学习思想的强化学习框架,通过构建多语言医学推理数据集并优化模型训练方法,显著提升了大型语言模型在多种语言(包括资源匮乏语言)下进行医学推理的逻辑准确性和语言一致性。