arXiv ID:
2601.07853
arXiv 提交日期: 2026-01-09
FinVault:在执行落地环境中对金融智能体进行安全基准测试 / FinVault: Benchmarking Financial Agent Safety in Execution-Grounded Environments
1️⃣ 一句话总结
这篇论文提出了首个针对金融智能体的执行落地安全测试基准FinVault,通过模拟真实金融操作场景和漏洞测试,发现现有主流AI模型的安全防护措施在应对金融场景下的攻击时效果有限,凸显了开发更强金融专用防御方案的必要性。