arXiv ID:
2602.17445
arXiv 提交日期: 2026-02-19
ABCD:所有偏见皆伪装而来 / ABCD: All Biases Come Disguised
1️⃣ 一句话总结
这篇论文发现大型语言模型在回答选择题时,会受到答案位置、选项标签和示例分布等表面线索的干扰,并提出了一种通过统一标签和答案整体匹配来减少评估偏差的简单方法,从而更真实地衡量模型的实际能力。