arXiv ID:
2604.25142
arXiv 提交日期: 2026-04-28
基于不确定性的迭代文档采样:面向信息检索的领域自适应 / UnIte: Uncertainty-based Iterative Document Sampling for Domain Adaptation in Information Retrieval
1️⃣ 一句话总结
本文提出了一种新的文档采样方法UnIte,通过区分两种不确定性(数据噪声引起的高偶然不确定性和模型知识不足引起的高认知不确定性)来智能选择最有价值的文档生成伪查询,从而在更少的训练样本下显著提升信息检索模型在新领域的适应效果。