arXiv ID:
2606.25246
arXiv 提交日期: 2026-06-24
多语言血液学视觉问答数据集 / Multilingual Hematology Visual Question Answering Dataset
1️⃣ 一句话总结
为了解决血液学领域视觉语言模型在非英语环境下(尤其是巴基斯坦的乌尔都语使用者)难以应用的问题,本研究通过调查医疗需求、构建双语标注词典和形态学知识库,创建了一个包含11万对英语-乌尔都语问答的血液细胞图像基准数据集,并测试了多个开源模型的表现,旨在推动多语言医疗AI系统的开发。