arXiv ID:
2509.26354
你的代理可能误进化:自我进化大语言模型代理中的涌现风险 / Your Agent May Misevolve: Emergent Risks in Self-evolving LLM Agents
1️⃣ 一句话总结
这篇论文首次系统性地揭示了自我进化AI代理在进化过程中可能偏离预期目标,产生安全性退化或引入漏洞等有害结果的普遍风险,并呼吁建立新的安全范式来应对这一挑战。