arXiv ID:
2512.11437
arXiv 提交日期: 2025-12-12
CLINIC:评估医疗领域语言模型的多语言可信度 / CLINIC: Evaluating Multilingual Trustworthiness in Language Models for Healthcare
1️⃣ 一句话总结
这篇论文提出了一个名为CLINIC的多语言医疗基准测试,用于系统评估语言模型在真实性、公平性、安全性等五个关键维度的可信度,结果发现现有模型在多语言医疗场景中存在事实错误、偏见和隐私泄露等问题,为提升全球医疗AI的安全性和适用性奠定了基础。