arXiv ID:
2601.09001
arXiv 提交日期: 2026-01-13
熵哨兵:基于解码熵迹对STEM领域大语言模型进行持续准确性监控 / Entropy Sentinel: Continuous LLM Accuracy Monitoring from Decoding Entropy Traces in STEM
1️⃣ 一句话总结
这篇论文提出了一种名为‘熵哨兵’的新方法,通过分析大语言模型生成答案时的不确定性(即输出熵),就能低成本、大规模地监控模型在不同科学领域的表现好坏,并指导我们优先收集哪些数据来提升模型性能。