arXiv ID:
2602.09448
arXiv 提交日期: 2026-02-10
多查询的智慧:稠密检索器训练的复杂度-多样性原则 / The Wisdom of Many Queries: Complexity-Diversity Principle for Dense Retriever Training
1️⃣ 一句话总结
这篇论文发现,在训练稠密检索模型时,使用多样化的合成查询是否有益,取决于查询本身的复杂程度:对于复杂查询(如多步推理问题),多样性至关重要;而对于简单查询,多样性反而有害,并据此提出了一个可操作的指导原则和新的数据合成方法,在多步推理任务上取得了领先效果。