arXiv ID:
2604.14829
arXiv 提交日期: 2026-04-16
超越字面总结:重新定义医学SOAP笔记评估中的幻觉 / Beyond Literal Summarization: Redefining Hallucination for Medical SOAP Note Evaluation
1️⃣ 一句话总结
这篇论文指出,当前基于字面忠实度的评估方法会错误地将临床推理(如医学术语规范化、诊断推断)判定为“幻觉”,从而高估了大型语言模型在生成医学SOAP笔记时的错误率,并提出了一个更符合临床实践的评估框架,将幻觉率从35%显著降低至9%。