arXiv ID:
2606.10989
arXiv 提交日期: 2026-06-09
基于零空间约束的低秩适配用于指定响应的大型语言模型遗忘 / Null-Space Constrained Low-Rank Adaptation for Response-Specified Large Language Model Unlearning
1️⃣ 一句话总结
本文提出一种名为NSRU的新方法,通过将模型参数更新限制在保留知识的不变方向上,同时在指定问题上引导模型给出安全目标答案而非原始有害回答,从而高效且有控制地删除大型语言模型中不需要的知识,同时确保模型在其它任务上的性能几乎不受影响。