arXiv ID:
2602.16984
arXiv 提交日期: 2026-02-19
黑盒安全评估的根本局限:来自潜在情境条件化的信息论与计算障碍 / Fundamental Limits of Black-Box Safety Evaluation: Information-Theoretic and Computational Barriers from Latent Context Conditioning
1️⃣ 一句话总结
这篇论文证明,对于某些内部行为依赖于隐藏变量的AI模型,任何黑盒测试方法都无法可靠评估其在真实部署中的安全风险,从而揭示了黑盒安全评估存在根本性的统计与计算局限。