arXiv ID:
2605.12313
arXiv 提交日期: 2026-05-12
BioCreative IX MedHopQA任务概述:多跳医学问答的赛道说明、参与情况及系统评估 / Overview of the MedHopQA track at BioCreative IX: track description, participation and evaluation of systems for multi-hop medical question answering
1️⃣ 一句话总结
本文介绍了BioCreative IX竞赛中设立的 MedHopQA 任务,通过构建一个包含1000个需要结合两段维基百科信息才能回答的医学问答数据集,评估了13个团队提交的48个系统,发现检索增强生成(RAG)策略是提升大语言模型在多跳医学问答中表现的关键技术。