arXiv ID:
2605.20408
arXiv 提交日期: 2026-05-19
光谱混合:一种用于在线偏好对齐的统一框架 / Spectral Souping: A Unified Framework for Online Preference Alignment
1️⃣ 一句话总结
本文提出了一种名为“光谱混合”的新方法,通过发现大语言模型内部存在一种易于合并的通用光谱结构,先离线训练多个专注于不同偏好的专用模型,再在推理时快速将它们组合,从而高效、动态地让同一个模型适应不同用户的个性化需求,无需重新训练。