arXiv ID:
2605.17774
arXiv 提交日期: 2026-05-18
通过QLoRA微调将工具知识内化到小型语言模型中 / Internalizing Tool Knowledge in Small Language Models via QLoRA Fine-Tuning
1️⃣ 一句话总结
本研究通过QLoRA微调方法,让小型语言模型在无需输入完整工具描述的情况下,自主记住并运用工具知识,不仅将提示长度缩短82.6%,还提升了规划任务的表现,证明了将工具知识从提示文本转移到模型参数中的可行性。