arXiv ID:
2602.10388
arXiv 提交日期: 2026-02-11
少即是够:在大型语言模型特征空间中合成多样化数据 / Less is Enough: Synthesizing Diverse Data in Feature Space of LLMs
1️⃣ 一句话总结
这篇论文提出了一种通过分析模型内部特征来合成多样化训练数据的新方法,能有效提升大语言模型在多种任务上的性能,并且发现不同模型家族之间存在可共享的通用特征空间。