2508.20755 – Summary

📄 论文总结

语言模型从权重学习到工具增强学习的理论分析与实验验证

Theoretical Analysis and Experimental Validation of Language Models Transitioning from In-Weight to Tool-Augmented Learning

本文通过理论证明和实验验证，系统分析了大型语言模型从依赖参数内部记忆（in-weight learning）转向利用外部工具进行检索增强（in-tool learning）的必要性和优势，揭示了工具增强方法在知识扩展性、参数效率和模型稳定性方面的显著改进。

创新点是什么：提出了工具增强模型在配备正确检索系统时能够学习任何数据集并完美解决值召回任务的形式化定义，并证明了存在参数复杂度为O(|A|²)的Transformer能够解决值召回任务。
与已有方法的区别/改进：相比传统方法需要线性增长的参数，工具增强模型参数需求有理论上界。
为什么有意义：为工具增强模型的效率优势提供了理论保证，证明了其在大规模事实检索中的可扩展性优势。

Retrieval-Augmented Generation (RAG)：一种使模型能够实时访问外部知识以增强响应相关性的技术，由Lewis等人于2020年提出。
In-tool learning：模型学习与外部资源（如数据库或API）交互以检索所需信息的工具增强学习方法。
In-weight learning：仅依靠模型内部参数来学习和记忆信息的方式。
Query-based Learnability：工具增强模型通过查询检索系统完美解决值召回任务的能力。
Total Variation (TV) distance：量化微调后模型输出分布与基础模型输出分布之间差异的度量指标，通过计算token级别的L1距离来估计。
Behavioral drift：行为漂移，指模型在训练过程中行为特性的变化，工具方法能最小化这种变化。