arXiv ID:
2603.10091
多流扰动攻击:通过并发任务干扰打破思维型大语言模型的安全对齐 / Multi-Stream Perturbation Attack: Breaking Safety Alignment of Thinking LLMs Through Concurrent Task Interference
1️⃣ 一句话总结
这篇论文发现,让大语言模型同时处理多个交织的任务(比如把不同问题混在一起问)可以干扰其逐步推理过程,从而成功绕过安全防护,使其生成有害内容或导致思维崩溃。