arXiv ID:
2603.14843
arXiv 提交日期: 2026-03-16
ContiGuard:一个针对不断演化的规避性扰动的持续毒性检测框架 / ContiGuard: A Framework for Continual Toxicity Detection Against Evolving Evasive Perturbations
1️⃣ 一句话总结
这篇论文提出了一个名为ContiGuard的新框架,它利用大语言模型增强语义理解并优化特征学习,使在线毒性检测系统能够持续学习、动态更新,从而有效应对恶意用户不断变化的新型文本规避手段。