arXiv ID:
2604.28031
arXiv 提交日期: 2026-04-30
模型回忆它们所违反的:多轮LLM构思中的约束遵循 / Models Recall What They Violate: Constraint Adherence in Multi-Turn LLM Ideation
1️⃣ 一句话总结
本文通过构建DriftBench基准测试,发现大型语言模型在多轮科学构思迭代中会逐渐偏离原始约束,并揭示了一个关键矛盾:模型能准确回忆约束条件,却在实际生成中频繁违反它们,这种“知而犯之”的现象在不同模型和条件下普遍存在。