arXiv ID:
2606.09338
arXiv 提交日期: 2026-06-08
多跳知识组合受限于预训练中的暴露程度 / Multi-Hop Knowledge Composition is Bound by Pretraining Exposure
1️⃣ 一句话总结
研究发现,大型语言模型在执行隐式多跳推理时(例如,结合“出生时间”和“好友关系”回答“好友的出生时间”)会失败,即使它能准确回答每个单跳问题,原因在于预训练期间模型必须直接接触过组合多个事实的上下文,否则即使单跳知识完整,也无法自主组合出新答案。