arXiv ID:
2604.19098
arXiv 提交日期: 2026-04-21
SAHM:一个面向阿拉伯语金融及伊斯兰教法合规推理的基准数据集 / SAHM: A Benchmark for Arabic Financial and Shari'ah-Compliant Reasoning
1️⃣ 一句话总结
该论文构建了首个针对阿拉伯语金融和伊斯兰教法合规推理的多任务基准数据集SAHM,包含1.4万条经专家验证的样本,并测试了19个大型语言模型,发现模型虽擅长候选识别,但在生成和因果推理任务上表现薄弱,尤其在事件因果推理方面差距最大。