🤖 系统
11-30 17:38
📄 论文总结
如何教大型多模态模型新技能 / How to Teach Large Multimodal Models New Skills
1️⃣ 一句话总结
这篇论文发现,在教大型多模态模型新技能时,看似遗忘的旧能力其实可以部分恢复,并通过限制模型特定层的更新,提出了两种简单有效的训练方法,使模型既能学会新技能又不会大幅丢失原有能力。
请先 登录 后再提交论文
如何教大型多模态模型新技能 / How to Teach Large Multimodal Models New Skills
这篇论文发现,在教大型多模态模型新技能时,看似遗忘的旧能力其实可以部分恢复,并通过限制模型特定层的更新,提出了两种简单有效的训练方法,使模型既能学会新技能又不会大幅丢失原有能力。