arXiv ID:
2606.23243
arXiv 提交日期: 2026-06-22
从分散的医疗音频中解锁音频语言模型的上下文学习能力 / Unlocking In-Context Learning in Audio-Language Models from Decentralized Medical Audio
1️⃣ 一句话总结
本文提出了一种名为联邦自上下文化(FSC)的多模态语言模型框架,能够在无需大规模标注数据的情况下,利用分散在不同医院的少量音频样本(如呼吸音和心音)进行临床诊断,通过无监督聚类和联邦学习实现上下文学习,在少样本场景下准确率超过71%,比现有方法高9%以上。