arXiv ID:
2602.17431
arXiv 提交日期: 2026-02-19
长文本语言模型输出的细粒度不确定性量化:一项比较研究 / Fine-Grained Uncertainty Quantification for Long-Form Language Model Outputs: A Comparative Study
1️⃣ 一句话总结
这篇论文提出了一个专门用于评估长文本AI生成内容可信度的新框架,通过比较不同方法发现,基于简单“主张-回应”逻辑关系的一致性检验效果最好,并且这种不确定性评估能有效提升AI生成长文本的事实准确性。