arXiv ID:
2601.13697
arXiv 提交日期: 2026-01-20
基于不确定性感知梯度信噪比的数据选择方法用于指令调优 / Uncertainty-Aware Gradient Signal-to-Noise Data Selection for Instruction Tuning
1️⃣ 一句话总结
这篇论文提出了一种名为GRADFILTERING的新方法,它通过计算数据样本的梯度信噪比来智能筛选高质量指令数据,从而在减少训练成本的同时,让大语言模型学得更快、效果更好。