arXiv ID:
2603.01625
arXiv 提交日期: 2026-03-02
衡量视觉语言模型未言之事:验证指标掩盖了放射学报告生成中的临床术语擦除 / Measuring What VLMs Don't Say: Validation Metrics Hide Clinical Terminology Erasure in Radiology Report Generation
1️⃣ 一句话总结
这篇论文指出,当前评估放射学报告生成模型的方法存在盲点,即模型可能为了获得高分而生成重复、安全的通用文本,从而丢失关键的临床术语,为此作者提出了新的词汇多样性衡量框架来量化这种临床信息损失和潜在的偏见风险。