arXiv ID:
2601.07226
arXiv 提交日期: 2026-01-12
迷失于噪声之中:推理模型如何在上下文干扰项中失效 / Lost in the Noise: How Reasoning Models Fail with Contextual Distractors
1️⃣ 一句话总结
这篇论文发现,当前先进的AI推理模型在面对真实场景中的无关信息干扰时,性能会急剧下降,并提出了一个名为NoisyBench的基准测试来评估模型抗干扰能力,同时揭示了一种能通过奖励模型识别有用信息来提升鲁棒性的新方法。