arXiv ID:
2605.27879
arXiv 提交日期: 2026-05-27
迈向可信的智能体可解释人工智能:一种验证方法与面向模型忠实性的开放世界基准 / Towards Faithful Agentic XAI: A Verification Method and an Open-World Benchmark for Better Model Faithfulness
1️⃣ 一句话总结
本文提出了一种名为FAX的框架,通过将解释拆解为多个主张并用可靠工具逐一核实,来防止AI生成的解释误导用户,同时构建了CRAFTER-XAI-Bench这一开放世界基准测试,实验表明该验证方法能大幅提升解释的忠实度。