arXiv ID:
2510.07958
arXiv 提交日期: 2025-10-09
A²Search:基于强化学习的歧义感知问答系统 / A$^2$Search: Ambiguity-Aware Question Answering with Reinforcement Learning
1️⃣ 一句话总结
这篇论文提出了一个无需人工标注的智能问答系统A²Search,它能自动识别并处理有多种正确答案的模糊问题,通过强化学习优化模型,在多个问答基准测试中取得了领先性能。