arXiv ID:
2602.03645
arXiv 提交日期: 2026-02-03
面向历史感知密集检索器的强化微调在RAG中的应用 / Reinforcement Fine-Tuning for History-Aware Dense Retriever in RAG
1️⃣ 一句话总结
这篇论文提出了一种用强化学习来优化检索增强生成系统中检索器的新方法,通过引入随机采样和历史信息,解决了传统方法中目标不匹配和状态混淆的问题,从而显著提升了整个系统的回答质量。