arXiv ID:
2602.17530
可证明解释神经加法模型 / Provably Explaining Neural Additive Models
1️⃣ 一句话总结
这篇论文提出了一种高效的新算法,能够为‘神经加法模型’这种更易理解的神经网络,快速找到并证明一个最小、最关键的输入特征子集,从而可靠地解释模型的预测结果。
可证明解释神经加法模型 / Provably Explaining Neural Additive Models
这篇论文提出了一种高效的新算法,能够为‘神经加法模型’这种更易理解的神经网络,快速找到并证明一个最小、最关键的输入特征子集,从而可靠地解释模型的预测结果。
因果与组合抽象 / Causal and Compositional Abstraction
这篇论文提出了一种基于范畴论的通用框架,用于形式化描述从复杂底层模型到更简洁、更具解释性的高层模型之间的抽象过程,特别聚焦于如何在这种抽象中保持因果结构,并将其应用从经典因果模型拓展到了量子电路等更广泛的组合模型。
可解释AI:用于解释Transformer模型的上下文感知分层集成梯度方法 / Explainable AI: Context-Aware Layer-Wise Integrated Gradients for Explaining Transformer Models
本文提出了一种名为CA-LIG的新方法,它通过结合分层梯度计算和注意力机制,为Transformer模型(如BERT)的决策过程提供了更全面、更贴合上下文且易于理解的可视化解释。
STAR:融合统计与智能体推理的大模型性能预测 / STAR : Bridging Statistical and Agentic Reasoning for Large Model Performance Prediction
本文提出了一种名为STAR的新框架,它巧妙地将数据驱动的统计预测与知识驱动的智能推理相结合,即使在仅有极少量测试数据的情况下,也能更准确、更可靠地预测大型人工智能模型的性能,并给出可解释的预测依据。
SHAP(沙普利加性解释)的统计推断与学习方法 / Statistical Inference and Learning for Shapley Additive Explanations (SHAP)
这篇论文提出了一种新的统计方法,能够为广泛使用的AI模型解释工具SHAP提供可靠的置信区间和假设检验,从而让研究人员能够量化特征重要性估计的不确定性,并基于此进行更稳健的特征选择。
LLMAC:一种基于大语言模型的全局可解释访问控制框架 / LLMAC: A Global and Explainable Access Control Framework with Large Language Model
这篇论文提出了一种名为LLMAC的新型访问控制框架,它利用大语言模型将多种传统访问控制方法统一起来,不仅能以极高的准确率(98.5%)处理复杂动态的权限请求,还能为每个决策提供清晰易懂的解释。
MEVER:基于图证据检索的多模态可解释声明验证 / MEVER: Multi-Modal and Explainable Claim Verification with Graph-based Evidence Retrieval
这篇论文提出了一种名为MEVER的新模型,它能够同时从文本和图像中检索证据、验证声明的真伪,并生成解释性的文字说明,从而让AI的验证过程更准确、更透明,特别是在处理科学图表等复杂信息时效果显著。
迈向可解释的联邦学习:理解差分隐私的影响 / Towards Explainable Federated Learning: Understanding the Impact of Differential Privacy
这篇论文提出了一种结合差分隐私与决策树的联邦学习方法,在增强数据隐私保护的同时,也探讨了隐私保护措施对模型可解释性产生的负面影响。
生成式医学扩散模型的可解释性:基于忠实度的MRI合成分析 / Explainability in Generative Medical Diffusion Models: A Faithfulness-Based Analysis on MRI Synthesis
本研究通过一种基于忠实度的可解释性框架,分析了扩散模型在生成医学影像(如MRI)时的内部决策过程,发现增强型原型网络能提供最可靠的解释,从而提升了生成式AI在医疗应用中的透明度和可信度。
探索SAIG方法以实现对可解释人工智能的客观评估 / Exploring SAIG Methods for an Objective Evaluation of XAI
这篇论文首次系统性地回顾和分析了用于评估可解释人工智能方法的‘合成人工智能基准’技术,通过提出一个新的分类体系揭示了该领域缺乏共识的现状,并强调了未来进行标准化研究的必要性。
请先 登录 后再提交论文