arXiv ID:
2604.20199
arXiv 提交日期: 2026-04-22
所有语言都重要:理解并缓解多语言RAG中的语言偏见 / All Languages Matter: Understanding and Mitigating Language Bias in Multilingual RAG
1️⃣ 一句话总结
本文揭示了多语言检索增强生成(mRAG)系统中,重排序阶段存在偏向英语和查询语言的系统性偏见,导致跨语言的有用证据被压制,并提出了一种名为LAURA的新方法,通过让重排序器直接对齐下游生成效果,有效消除了这种语言偏见,显著提升了多语言问答的准确性。