arXiv ID:
2604.27724
迭代式多模态检索增强生成用于医疗问答 / Iterative Multimodal Retrieval-Augmented Generation for Medical Question Answering
1️⃣ 一句话总结
本文提出了一种名为MED-VRAG的新框架,它通过直接检索医学文献中的整页图像(而非仅提取文本),并利用视觉语言模型进行多轮推理和记忆累积,在多个医疗问答基准测试上显著提升了准确率,证明了图像信息对医疗知识问答的重要价值。