arXiv ID:
2605.25342
arXiv 提交日期: 2026-05-25
MATO:基于测试时优化的多目标个性化大语言模型对齐方法 / MATO: Multi-objective Personalized Alignment with Test-time Optimization for Large Language Models
1️⃣ 一句话总结
本文提出MATO框架,无需额外训练或奖励模型,通过在解码阶段动态调整多个偏好目标的权重,并在生成过程中实时优化词概率分布,从而在不修改模型参数的前提下,灵活且可控地让大语言模型更好地匹配用户多样化的个性化需求。