arXiv ID:
2603.16244
arXiv 提交日期: 2026-03-17
更多轮次,更多噪音:为何多轮审阅无法改进跨上下文验证 / More Rounds, More Noise: Why Multi-Turn Review Fails to Improve Cross-Context Verification
1️⃣ 一句话总结
这项研究发现,在大语言模型进行内容验证时,让审阅者与作者进行多轮问答互动反而会降低整体准确性,因为额外的审阅轮次会引入大量误报,导致审阅重点从检查原始内容偏移到评判对话本身。