arXiv ID:
2604.12479
arXiv 提交日期: 2026-04-14
满足动态个人偏好:通过配对微调解决冲突的人类价值观 / Meet Dynamic Individual Preferences: Resolving Conflicting Human Value with Paired Fine-Tuning
1️⃣ 一句话总结
这篇论文提出了一个名为‘偏好配对微调’的新方法,让大型语言模型不仅能理解大众的普遍偏好,还能学习和适应每个用户独特且可能相互矛盾、不断变化的个人偏好,从而提供更个性化的服务。