arXiv ID:
2604.11575
arXiv 提交日期: 2026-04-13
MIXAR:将基于像素的自回归语言模型扩展到多种语言和文字体系 / MIXAR: Scaling Autoregressive Pixel-based Language Models to Multiple Languages and Scripts
1️⃣ 一句话总结
这篇论文提出了首个在八种不同文字体系语言上训练的生成式像素语言模型MIXAR,它在多语言任务上性能显著优于以往模型,对未见过的语言也表现出很强的鲁棒性,并且模型规模扩大后能力进一步增强。