arXiv ID:
2605.25893
arXiv 提交日期: 2026-05-25
D²-Monitor:通过犹豫感知路由对扩散型大语言模型进行动态安全监控 / $D^2$-Monitor: Dynamic Safety Monitoring for Diffusion LLMs via Hesitation-Aware Routing
1️⃣ 一句话总结
本文提出了一种针对扩散型大语言模型的安全监控方法D²-Monitor,它利用模型生成过程中隐藏状态在决策边界附近反复“犹豫”的信号来动态切换轻量或重型监测器,从而以极小的计算开销实现高效、准确的安全检测。