arXiv ID:
2603.01724
arXiv 提交日期: 2026-03-02
GMP:一个针对规则共存违规与动态规则下的内容审核基准 / GMP: A Benchmark for Content Moderation under Co-occurring Violations and Dynamic Rules
1️⃣ 一句话总结
这篇论文提出了一个名为GMP的新基准,用于测试AI在内容审核中处理‘一条内容同时违反多条规则’和‘审核规则动态变化’这两个现实难题的能力,揭示了当前大语言模型在复杂、动态的真实场景下判断力会下降的问题。