arXiv最新AI论文速览速学

🔍

标签: #confidence calibration ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 100 72小时内新更新论文 72h更新 100 最新: Evidence-Gated LLM Priors for Multi-Objective Bayesian Optimization 06-02

arXiv ID: 2606.01730

arXiv 提交日期: 2026-06-01

llm machine learning bayesian optimization multi-objective expert priors confidence calibration robustness

证据门控的大语言模型先验用于多目标贝叶斯优化 / Evidence-Gated LLM Priors for Multi-Objective Bayesian Optimization

1️⃣ 一句话总结

这篇论文提出一种动态校准方法，在多目标贝叶斯优化中根据实际目标反馈来评估大语言模型每项建议的可靠性，避免盲目信任其专家先验，从而提升优化鲁棒性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.21781

arXiv 提交日期: 2026-05-20

llm prompt optimization model training prompt tuning function calling failure diagnosis confidence calibration reasoning tasks

通过语言模型函数调用实现反思性提示调优 / Reflective Prompt Tuning through Language Model Function-Calling

1️⃣ 一句话总结

本文提出了一种名为反思性提示调优（RPT）的新框架，它让语言模型像人类工程师一样，通过自动调用诊断函数分析模型在整体数据集上的错误模式，并积累历史报告来迭代优化提示词，从而显著提升模型在复杂推理任务上的准确性和置信度校准。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.01796

arXiv 提交日期: 2026-05-03

machine learning model evaluation confidence calibration overconfidence risk expected calibration error classification metrics auc

超越ECE：校准尺寸比、风险评估与置信加权指标 / Beyond ECE: Calibrated Size Ratio, Risk Assessment, and Confidence-Weighted Metrics

1️⃣ 一句话总结

本文指出传统校准评估指标ECE无法有效捕捉过度置信风险，提出新的校准尺寸比（CSR）来量化风险，并引入置信加权准确率（cwA）等指标以同时衡量模型是否具备区分正确与错误预测的能力，实验表明新方法能更好识别有风险的置信输出。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.12491

arXiv 提交日期: 2026-04-14

llm model evaluation natural language processing confidence calibration tabular question answering uncertainty estimation model reliability structured data

面向表格问答的校准置信度估计 / Calibrated Confidence Estimation for Tabular Question Answering

1️⃣ 一句话总结

这篇论文首次系统性地研究了大型语言模型在表格问答任务中的置信度校准问题，发现模型普遍过于自信，并提出了一种名为‘多格式一致性’的新方法，该方法能利用表格数据的不同序列化格式来更准确、更低成本地估计模型答案的可靠性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.12245

arXiv 提交日期: 2026-04-14

model training model evaluation machine learning confidence calibration loss function uncertainty neural networks classification

苏格拉底损失函数：通过利用未知类别统一置信度校准与分类 / Socrates Loss: Unifying Confidence Calibration and Classification by Leveraging the Unknown

1️⃣ 一句话总结

这篇论文提出了一种名为‘苏格拉底损失’的新方法，它通过引入一个‘未知’类别来同时优化神经网络的分类准确性和预测置信度的可靠性，从而解决了现有方法在稳定性和性能之间难以兼顾的问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.11867

arXiv 提交日期: 2026-04-13

llm model training model evaluation behavioral distillation negative result small language models attention intervention confidence calibration

小规模模型的行为特质蒸馏：一个包含三个研究路径的负面结果 / Disposition Distillation at Small Scale: A Three-Arc Negative Result

1️⃣ 一句话总结

这篇论文通过一系列严谨的实验发现，试图将‘自我验证’、‘承认不确定性’等行为特质‘蒸馏’到小型语言模型中的多种方法均告失败，这些方法要么损害模型内容质量，要么只是让模型学会了模仿风格，无法真正提升其内在的行为特质。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.05952

arXiv 提交日期: 2026-04-07

agents llm model evaluation report generation confidence calibration trustworthiness evidence grounding deliberative search

迈向可信的报告生成：一种具备渐进式置信度估计与校准的深度研究智能体 / Towards Trustworthy Report Generation: A Deep Research Agent with Progressive Confidence Estimation and Calibration

1️⃣ 一句话总结

这篇论文提出了一种新的深度研究智能体，它通过在生成报告的每个步骤中评估和校准其陈述的置信度，来解决现有AI系统可能产生不可靠或虚假信息的问题，从而生成更透明、更值得用户信赖的研究报告。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.05397

arXiv 提交日期: 2026-04-07

llm model evaluation agents confidence calibration multi-turn interaction trustworthy ai expected calibration error decoding strategy

置信度校准应不止于单轮对话 / Confidence Should Be Calibrated More Than One Turn Deep

1️⃣ 一句话总结

这篇论文指出，为了确保大语言模型在多轮对话中的安全可靠应用，必须对其置信度进行动态的、基于对话历史的校准，并提出了一种新方法和解码策略来提升多轮对话中的事实准确性和一致性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.01457

arXiv 提交日期: 2026-04-01

llm model evaluation theory mechanistic interpretability confidence calibration circuit analysis uncertainty quantification mlp attention

过度自信的根源：从机制视角看大语言模型中夸大的言语化自信 / Wired for Overconfidence: A Mechanistic Perspective on Inflated Verbalized Confidence in LLMs

1️⃣ 一句话总结

这篇论文通过分析大语言模型内部的工作机制，发现了一小部分特定的“电路”是导致模型在回答错误问题时仍然表现出过度自信的根源，并证明通过针对性地干预这些电路，可以有效改善模型对自己回答的可靠程度评估。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.29693

arXiv 提交日期: 2026-03-31

llm model evaluation theory metacognition uncertainty quantification signal detection theory confidence calibration risk sensitivity

衡量人工智能的元认知能力 / Measuring the metacognition of AI

1️⃣ 一句话总结

这篇论文提出了一套基于心理学测量框架（如meta-d'和信号检测理论）的方法，用于评估AI系统（特别是大语言模型）是否具备像人类一样的‘自知之明’——即能否准确评估自己决策的可靠性，并在高风险情境下自发调整决策策略。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2606.01730

1️⃣ 一句话总结

arXiv ID: 2605.21781

1️⃣ 一句话总结

arXiv ID: 2605.01796

1️⃣ 一句话总结

arXiv ID: 2604.12491

1️⃣ 一句话总结

arXiv ID: 2604.12245

1️⃣ 一句话总结

arXiv ID: 2604.11867

1️⃣ 一句话总结

arXiv ID: 2604.05952

1️⃣ 一句话总结

arXiv ID: 2604.05397

1️⃣ 一句话总结

arXiv ID: 2604.01457

1️⃣ 一句话总结

arXiv ID: 2603.29693

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2606.01730 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.21781 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.01796 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.12491 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.12245 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.11867 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.05952 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.05397 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.01457 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.29693 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2606.01730

arXiv ID: 2605.21781

arXiv ID: 2605.01796

arXiv ID: 2604.12491

arXiv ID: 2604.12245

arXiv ID: 2604.11867

arXiv ID: 2604.05952

arXiv ID: 2604.05397

arXiv ID: 2604.01457

arXiv ID: 2603.29693