arXiv ID:
2605.30640
arXiv 提交日期: 2026-05-28
CSULoRA:通过最近安全更新实现低秩适配 / CSULoRA: Closest Safe Update Low-Rank Adaptation
1️⃣ 一句话总结
本文提出了一种名为CSULoRA的方法,能在不牺牲有用信息的前提下,通过平滑地减弱低秩适配(LoRA)更新中可能有害的方向,有效修复模型在微调后丢失的安全行为,同时保持任务性能。