arXiv ID:
2605.21861
arXiv 提交日期: 2026-05-21
多模态医学视觉基础模型中的涌现模块化表征学习 / Learning Emergent Modular Representations in Multi-modality Medical Vision Foundation Models
1️⃣ 一句话总结
本文提出一种名为Director-Experts(DEX)的新型模块化网络,通过让不同专家模块自动学习各自擅长处理一种医学影像模态的特征,再用一个“导演”模块将各专家知识融合到共享空间中,从而有效解决了多模态医学图像预训练中不同模态数据差异巨大导致的模型性能下降问题,并在涵盖10种模态、400万图像的数据集上验证了其优越性。