arXiv ID:
2605.26935
arXiv 提交日期: 2026-05-26
DunbaaBERT:从牺牲到语义 / DunbaaBERT: From Sacrifice to Semantics
1️⃣ 一句话总结
本文提出了一种名为DunbaaBERT的乌尔都语专用预训练模型系列,通过在17GB语料上训练不同词汇量大小的模型,证明了即使使用较小词汇量和资源,针对特定语言精心设计的模型也能在多项任务上达到与强大多语言模型相当的性能,且效率更优。