arXiv ID:
2604.19047
arXiv 提交日期: 2026-04-21
RARE:面向高相似度语料库的冗余感知检索评估框架 / RARE: Redundancy-Aware Retrieval Evaluation Framework for High-Similarity Corpora
1️⃣ 一句话总结
该论文提出了RARE评估框架,通过将文档拆解为原子事实来精确追踪信息冗余,并利用改进的LLM数据生成方法,解决了现有问答基准在金融、法律等高重复性语料中无法真实评估检索器性能的问题。