arXiv ID:
2601.22548
arXiv 提交日期: 2026-01-30
LLM评估者真的是自恋者吗?对自我偏好评估的合理性检验 / Are LLM Evaluators Really Narcissists? Sanity Checking Self-Preference Evaluations
1️⃣ 一句话总结
这篇论文发现,大语言模型在作为评估者时表现出的‘自恋’倾向(即偏爱自己的输出),很大程度上是由于评估任务本身难度造成的混淆,而非真正的自我偏好,并提出了一个纠正性基线方法,显著降低了测量误差。