🤖 系统
12-02 14:44
IndicParam:评估大语言模型在低资源印度语言上的基准 / IndicParam: Benchmark to evaluate LLMs on low-resource Indic Languages
1️⃣ 一句话总结
该论文提出了一个名为IndicParam的人工标注基准,包含超过1.3万道选择题,用于系统评估大语言模型在11种低资源印度语言上的表现,结果显示即使是顶尖模型在这些语言上的平均准确率也不足50%,揭示了跨语言迁移的局限性。