arXiv ID:
2601.10527
关于GPT-5.2、Gemini 3 Pro等七款前沿模型的安全评估报告 / A Safety Report on GPT-5.2, Gemini 3 Pro, Qwen3-VL, Doubao 1.8, Grok 4.1 Fast, Nano Banana Pro, and Seedream 4.5
1️⃣ 一句话总结
这篇报告对七款前沿AI模型进行了全面的安全评估,发现尽管它们在标准测试中表现良好,但在面对对抗性攻击、多语言任务或复杂指令时,安全性能存在显著差异且普遍脆弱,凸显了进行标准化安全评估以指导负责任开发的必要性。