arXiv ID:
2606.19588
arXiv 提交日期: 2026-06-17
大语言模型-求解器循环中的叙事鸿沟分析 / Analyzing the Narration Gap in LLM-Solver Loops
1️⃣ 一句话总结
这篇论文揭示了在AI系统中,当逻辑求解器给出正确结论后,语言模型在向用户解释结果时可能被恶意提示攻击,导致最终呈现给用户的答案被篡改,从而破坏了整个推理流程的可靠性。