arXiv ID:
2605.02819
arXiv 提交日期: 2026-05-04
SCPRM:一种用于知识图谱问答的架构感知累积过程奖励模型 / SCPRM: A Schema-aware Cumulative Process Reward Model for Knowledge Graph Question Answering
1️⃣ 一句话总结
本文提出了一种名为SCPRM的新模型,它在知识图谱问答中通过结合当前推理步骤与目标之间的架构距离来评估推理路径的正确性,从而解决了传统过程奖励模型因容错效应而误判有缺陷推理路径的问题,并在医学、法律等高风险领域取得了更准确和稳健的推理效果。