arXiv ID:
2605.02374
arXiv 提交日期: 2026-05-04
以毒攻毒:利用对抗训练增强少样本机器生成文本检测的鲁棒性 / Fight Poison with Poison: Enhancing Robustness in Few-shot Machine-Generated Text Detection with Adversarial Training
1️⃣ 一句话总结
本文提出一种名为REACT的对抗训练框架,通过让一个攻击者使用检索增强生成技术制造逼真的机器文本陷阱,并让检测器在与这些陷阱对抗中学习,从而在仅有少量训练样本的情况下,大幅提升检测器识别机器生成文本的准确性和抗攻击能力。