arXiv ID:
2605.05953
幻觉作为一种异常:通过概率电路进行动态干预 / Hallucination as an Anomaly: Dynamic Intervention via Probabilistic Circuits
1️⃣ 一句话总结
本文提出一种新方法,通过训练一个概率电路来检测大语言模型内部状态中的异常(即幻觉),并仅在检测到幻觉时进行动态纠正,从而避免对已正确生成的文本造成破坏,在多个评测中实现了接近完美的幻觉检测和更低的文本破坏率。