arXiv ID:
2603.23750
arXiv 提交日期: 2026-03-24
IslamicMMLU:评估大语言模型伊斯兰知识能力的基准 / IslamicMMLU: A Benchmark for Evaluating LLMs on Islamic Knowledge
1️⃣ 一句话总结
这篇论文提出了一个名为IslamicMMLU的综合性基准测试,包含超过一万道选择题,用于评估大语言模型在《古兰经》、圣训和伊斯兰法学等核心领域的知识水平,并发现不同模型的表现差异巨大,其中法学部分还能检测出模型对特定学派的偏好。