arXiv ID:
2512.12072
arXiv 提交日期: 2025-12-12
VOYAGER:一种利用大语言模型生成多样化数据集的无训练方法 / VOYAGER: A Training Free Approach for Generating Diverse Datasets using LLMs
1️⃣ 一句话总结
本文提出了一种名为VOYAGER的新方法,它无需额外训练,就能利用大语言模型自动生成高度多样化的合成数据集,其核心是通过一种数学优化机制来主动提升数据多样性,实验表明其效果比现有方法提升了1.5到3倍。