arXiv ID:
2602.21044
arXiv 提交日期: 2026-02-24
LogicGraph:通过神经符号生成与验证对多路径逻辑推理进行基准测试 / LogicGraph : Benchmarking Multi-Path Logical Reasoning via Neuro-Symbolic Generation and Verification
1️⃣ 一句话总结
这篇论文提出了首个名为LogicGraph的基准测试,用于系统评估大语言模型探索多种有效推理路径的能力,揭示了当前模型倾向于过早锁定单一思路而忽略其他可能性的普遍缺陷。