arXiv ID:
2604.12176
arXiv 提交日期: 2026-04-14
使用REL评估大语言模型的关系推理能力 / Evaluating Relational Reasoning in LLMs with REL
1️⃣ 一句话总结
这篇论文提出了一个名为REL的评估框架,通过控制“关系复杂度”来测试大语言模型,发现当前模型在处理需要同时关联多个实体的复杂推理任务时存在明显局限。