arXiv ID:
2603.02588
arXiv 提交日期: 2026-03-03
ExpGuard:专业领域的大型语言模型内容审核 / ExpGuard: LLM Content Moderation in Specialized Domains
1️⃣ 一句话总结
这篇论文提出了一个名为ExpGuard的专业领域内容审核模型,它通过一个精心构建的数据集,专门保护金融、医疗和法律等专业领域的AI对话免受有害内容攻击,并在对抗性测试中显著优于现有通用审核模型。