arXiv ID:
2604.19245
arXiv 提交日期: 2026-04-21
与全知GPT或犹豫Claude对话:修复机制如何揭示大语言模型在多轮对话中的不可靠行为 / Talking to a Know-It-All GPT or a Second-Guesser Claude? How Repair reveals unreliable Multi-Turn Behavior in LLMs
1️⃣ 一句话总结
本文通过让多种大语言模型(如GPT和Claude)在数学问答的多轮对话中应对正确或错误的问题,发现不同模型在察觉自身错误、接受用户纠正或坚持错误方面表现出截然不同的行为模式,且对话轮次越多,模型的行为越不可预测,各有其独特的不可靠性特征。