arXiv ID:
2603.27414
多重预测驱动的统计推断 / Multiple-Prediction-Powered Inference
1️⃣ 一句话总结
这篇论文提出了一个名为MultiPPI的新框架,它能够智能地组合昂贵但准确的数据和廉价但粗糙的预测模型,在给定预算下实现更精确的统计估计,并在大语言模型评估等实际场景中证明了其优越性。
多重预测驱动的统计推断 / Multiple-Prediction-Powered Inference
这篇论文提出了一个名为MultiPPI的新框架,它能够智能地组合昂贵但准确的数据和廉价但粗糙的预测模型,在给定预算下实现更精确的统计估计,并在大语言模型评估等实际场景中证明了其优越性。
xplainfi:R语言中机器学习特征重要性与统计推断工具包 / xplainfi: Feature Importance and Statistical Inference for Machine Learning in R
这篇论文介绍了一个名为xplainfi的R软件包,它为机器学习模型提供了一套全面的、基于损失的特征重要性分析工具,特别填补了条件重要性方法和统计推断方面的空白,帮助研究者和实践者更好地理解和解释模型。
Transformer中的隐式统计推断:在上下文中逼近似然比检验 / Implicit Statistical Inference in Transformers: Approximating Likelihood-Ratio Tests In-Context
这篇论文通过统计决策理论视角研究发现,Transformer模型在上下文学习时,并非简单地匹配相似性,而是能够自适应地构建接近最优统计推断的算法,以解决线性和非线性任务。
利用生成式人工智能的合成数据进行统计推断 / Harnessing Synthetic Data from Generative AI for Statistical Inference
这篇论文从统计学角度系统梳理了生成式AI模型产生的合成数据在支持科学发现与统计推断时的有效使用条件、潜在风险及实践原则,旨在为研究者提供可靠的应用指南。
SHAP(沙普利加性解释)的统计推断与学习方法 / Statistical Inference and Learning for Shapley Additive Explanations (SHAP)
这篇论文提出了一种新的统计方法,能够为广泛使用的AI模型解释工具SHAP提供可靠的置信区间和假设检验,从而让研究人员能够量化特征重要性估计的不确定性,并基于此进行更稳健的特征选择。
单人与多人表演性预测的统一推断框架:方法及渐近最优性 / Unified Inference Framework for Single and Multi-Player Performative Prediction: Method and Asymptotic Optimality
这篇论文提出了一个统一的统计推断框架,将单人和多人的‘表演性预测’(即预测模型会改变其试图预测的数据分布)问题整合起来,并提供了两种渐近最优且稳健的估计方法,为动态反馈环境中的可靠估计与决策提供了理论工具。
请先 登录 后再提交论文