arXiv ID:
2601.08441
arXiv 提交日期: 2026-01-13
YaPO:用于领域自适应的可学习稀疏激活导向向量 / YaPO: Learnable Sparse Activation Steering Vectors for Domain Adaptation
1️⃣ 一句话总结
这篇论文提出了一种名为YaPO的新方法,它通过在大语言模型的稀疏编码空间中学习稀疏的“导向向量”,来实现对模型行为的精细、稳定且高效的控制,适用于文化对齐、减少幻觉等多种场景,且不损害模型的通用知识。