arXiv ID:
2603.04378
arXiv 提交日期: 2026-03-04
基于对抗对齐雅可比正则化的智能体AI系统鲁棒性研究 / Robustness of Agentic AI Systems via Adversarially-Aligned Jacobian Regularization
1️⃣ 一句话总结
本文提出了一种名为‘对抗对齐雅可比正则化’的新方法,专门用于提升由大语言模型驱动的自主智能体系统的稳定性,它通过精准控制智能体在对抗攻击方向上的敏感度,在保证系统安全的同时,最大程度地保留了其原有的优秀性能。