arXiv ID:
2601.21210
arXiv 提交日期: 2026-01-29
通过符号验证揭示大语言模型因果推理中的隐藏正确性 / Uncovering Hidden Correctness in LLM Causal Reasoning via Symbolic Verification
1️⃣ 一句话总结
这篇论文提出了一个名为DoVerifier的符号验证工具,它能够通过严格的因果逻辑规则来检查大语言模型的推理过程,从而发现那些表面看起来错误、但实际上语义正确的答案,为评估模型的因果推理能力提供了更精准的方法。