arXiv ID:
2603.16557
arXiv 提交日期: 2026-03-17
BenchPreS:一个用于评估持久记忆大语言模型上下文感知个性化偏好选择性的基准 / BenchPreS: A Benchmark for Context-Aware Personalized Preference Selectivity of Persistent-Memory LLMs
1️⃣ 一句话总结
这篇论文提出了一个名为BenchPreS的新基准,用于测试大语言模型能否根据不同的社交和制度情境,智能地选择应用或抑制存储在记忆中的用户个性化偏好,结果发现即使是顶尖模型也常常错误地将偏好当作普适规则来使用。