arXiv ID:
2606.13104
arXiv 提交日期: 2026-06-11
权威、真相与引用偏见:一个用于研究大型语言模型认知易感性的多领域大规模基准测试 / Authority, Truth, and Citation Bias: A Large-Scale Multi-Domain Benchmark for Studying Epistemic Susceptibility in Large Language Models
1️⃣ 一句话总结
这篇论文创建了一个包含22万多个提示的大规模基准测试,通过严格控制的实验发现,大型语言模型在回答问题时,只要看到“引用”存在(无论引用是否真实),其产生错误信息的概率都会显著增加,甚至高达77%,其中虚假引用搭配真实信息的影响最大,而引用的来源高低或作者背景则几乎没有影响。