arXiv ID:
2603.16781
arXiv 提交日期: 2026-03-17
IOSVLM:一种基于口腔内扫描的统一牙科诊断三维视觉-语言模型 / IOSVLM: A 3D Vision-Language Model for Unified Dental Diagnosis from Intraoral Scans
1️⃣ 一句话总结
这篇论文提出了一个名为IOSVLM的三维视觉-语言模型,它直接利用口腔三维扫描的几何数据,实现了对多种牙科疾病的统一诊断和视觉问答,并通过创新的训练策略解决了数据稀缺和几何特征利用的难题。