arXiv ID:
2604.23646
基于分权架构的AI智能体目标完整性结构性保障 / Structural Enforcement of Goal Integrity in AI Agents via Separation-of-Powers Architecture
1️⃣ 一句话总结
该论文提出一种名为PEA的“三权分立”系统架构,通过将意图生成、授权和执行相互隔离并利用加密令牌进行约束,从根本上解决了AI智能体在缺乏用户明确指令时仍可能自行构建并执行有害行为的安全隐患,从而将智能体的安全性从概率性的行为控制提升为系统层面的结构性保障。