arXiv ID:
2603.08182
TildeOpen LLM:利用课程学习实现公平的语言表征 / TildeOpen LLM: Leveraging Curriculum Learning to Achieve Equitable Language Representation
1️⃣ 一句话总结
这篇论文提出了一个名为TildeOpen LLM的300亿参数开源大语言模型,它通过巧妙的数据增广和课程学习训练策略,显著提升了34种欧洲语言(尤其是低资源语言)的处理能力,在减少计算资源消耗的同时实现了更公平的多语言性能。