arXiv ID:
2604.14090
arXiv 提交日期: 2026-04-15
从权重到激活:操控是模型适应的下一个前沿吗? / From Weights to Activations: Is Steering the Next Frontier of Adaptation?
1️⃣ 一句话总结
这篇论文提出,通过在模型推理时直接修改其内部激活值来引导模型行为(即“操控”方法),应被视为一种独特且有效的模型适应范式,它无需更新参数就能实现局部、可逆的行为调整,为模型适应研究提供了新的统一视角。