arXiv ID:
2603.02041
arXiv 提交日期: 2026-03-02
EstLLM:通过持续预训练与后训练增强多语言大语言模型的爱沙尼亚语能力 / EstLLM: Enhancing Estonian Capabilities in Multilingual LLMs via Continued Pretraining and Post-Training
1️⃣ 一句话总结
这项研究通过为多语言大模型‘加练’爱沙尼亚语数据,并巧妙平衡其他语言和技能的训练,成功大幅提升了模型对这门小语种的理解和生成能力,同时保持了原有的英语和通用推理水平。