arXiv ID:
2512.13077
arXiv 提交日期: 2025-12-15
LikeBench:评估大语言模型主观喜好度以实现个性化 / LikeBench: Evaluating Subjective Likability in LLMs for Personalization
1️⃣ 一句话总结
这篇论文提出了一个名为LikeBench的新评估框架,它首次将大语言模型个性化能力的核心——‘用户喜好度’分解为七个可测量的维度,并发现模型记忆事实的准确性与生成讨喜回复的能力并不直接相关。