← 返回列表

菜单

🤖 系统
📄 Abstract - Llama-GENBA-10B: A Balanced Multilingual Foundation Model for English, German, and Bavarian
正在获取摘要...
顶级标签: llm
详细标签: multilingual language model low-resource languages bavarian dialect block expansion continuous pretraining 或 搜索:

📄 论文总结

Llama-GENBA-10B:一个平衡英语、德语和巴伐利亚方言的多语言基础模型

Llama-GENBA-10B: A Balanced Multilingual Foundation Model for English, German, and Bavarian


1️⃣ 一句话总结

Llama-GENBA-10B是一个基于Llama 3.1-8B构建的10B参数三语(英语、德语、巴伐利亚语)基础模型,通过平衡的多语言预训练和创新的块扩展方法,有效解决了大语言模型中的英语中心偏差问题,特别促进了低资源语言巴伐利亚语的发展。


2️⃣ 论文创新点

1. 三语平衡预训练策略

2. 块扩展持续预训练方法

3. 巴伐利亚语评估套件

4. 单机高效预训练方法


3️⃣ 主要结果与价值

实验结果亮点

实际应用价值


4️⃣ 术语表

📄 打开原文 PDF