arXiv ID:
2602.01714
arXiv 提交日期: 2026-02-02
MedAraBench:大规模阿拉伯语医学问答数据集与基准 / MedAraBench: Large-Scale Arabic Medical Question Answering Dataset and Benchmark
1️⃣ 一句话总结
这篇论文创建了一个名为MedAraBench的大规模、高质量的阿拉伯语医学选择题数据集,并以此评估了多个先进大语言模型,旨在推动阿拉伯语医疗AI研究和提升模型的多语言临床能力。