arXiv ID:
2602.04364
任意时间有效的共形风险控制 / Anytime-Valid Conformal Risk Control
1️⃣ 一句话总结
这篇论文提出了一种新的统计方法,能够确保在数据随时间累积增长的任何时刻,机器学习模型的预测不确定性(以预测集形式呈现)都能以高概率满足预设的误差控制要求,即使在数据分布发生变化时也有效。
任意时间有效的共形风险控制 / Anytime-Valid Conformal Risk Control
这篇论文提出了一种新的统计方法,能够确保在数据随时间累积增长的任何时刻,机器学习模型的预测不确定性(以预测集形式呈现)都能以高概率满足预设的误差控制要求,即使在数据分布发生变化时也有效。
保形思维:计算预算下推理的风险控制 / Conformal Thinking: Risk Control for Reasoning on a Compute Budget
这篇论文提出了一种新方法,让大语言模型在回答问题时能自动决定何时停止思考,从而在保证错误率不超限的前提下,最大限度地节省计算资源。
量化共形预测中的认知预测不确定性 / Quantifying Epistemic Predictive Uncertainty in Conformal Prediction
这篇论文提出了一种在共形预测框架下,高效量化因存在多个合理预测模型而产生的认知不确定性的新方法,该方法比单纯依赖预测区间大小能提供更精细、更有信息量的不确定性评估,有助于在模型不确定时做出更可靠的决策。
从被动度量到主动信号:不确定性量化在大语言模型中的角色演变 / From Passive Metric to Active Signal: The Evolving Role of Uncertainty Quantification in Large Language Models
这篇综述论文指出,将大语言模型输出的不确定性从一种被动的诊断指标,转变为一种能实时指导模型行为的主动控制信号,是提升其在高风险领域可靠性和可信度的关键趋势。
LYNX:用于置信度控制推理的动态出口学习 / LYNX: Learning Dynamic Exits for Confidence-Controlled Reasoning
这篇论文提出了一种名为LYNX的新方法,它能让大型推理模型在生成答案时‘聪明地提前停止’,即通过分析模型内部的隐藏状态来判断何时已有足够信心得出正确结论,从而在保持甚至提高准确率的同时,大幅减少计算开销和生成时间。
请先 登录 后再提交论文