arXiv最新AI论文速览速学

🔍

标签: #reliability ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 89 72小时内新更新论文 72h更新 189 最新: Knowledge Distillation Must Account for What It Loses 05-02

arXiv ID: 2604.27807

arXiv 提交日期: 2026-04-30

systems machine learning model evaluation autonomous systems safety-critical dependability certification reliability

焦点会议：AI时代的自主系统可靠性——安全性、可靠性、安全保证与认证的设计挑战 / Focus Session: Autonomous Systems Dependability in the era of AI: Design Challenges in Safety, Security, Reliability and Certification

1️⃣ 一句话总结

本文探讨了在AI和机器学习组件日益融入嵌入式安全关键系统（如自动驾驶平台）的背景下，如何应对由此带来的非确定性、数据依赖性和缺乏形式化保证等新挑战，并综述了在可靠性建模、安全系统设计和认证方法上的最新进展，旨在弥合AI创新与系统级可认证可靠性之间的鸿沟。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.25110

arXiv 提交日期: 2026-04-28

machine learning model training knowledge distillation model evaluation reliability safety accountability

知识蒸馏必须考虑其损失了什么 / Knowledge Distillation Must Account for What It Loses

1️⃣ 一句话总结

本论文指出，在知识蒸馏过程中，不仅要关注学生模型在主要任务上的表现，还必须系统评估其是否保留了教师模型的可靠性关键能力（如不确定性判断、边界行为、过程可靠性等），并提出通过“蒸馏损失报告”机制，让蒸馏过程变得可问责、可评估。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.29231

arXiv 提交日期: 2026-03-31

llm agents model evaluation reliability long-horizon agents benchmark evaluation metrics agent performance

超越单次成功率：面向长周期大语言模型智能体的可靠性科学框架 / Beyond pass@1: A Reliability Science Framework for Long-Horizon LLM Agents

1️⃣ 一句话总结

这篇论文指出，衡量AI模型在单次任务中的成功率（能力）不足以评估其在长期、重复任务中的实际表现（可靠性），并提出了一个包含四个新指标的可靠性科学框架，通过大规模实验发现，模型的‘能力’排名与‘可靠性’排名在长周期任务中会显著不同，且最先进的模型反而更容易因尝试复杂策略而失败。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.10731

arXiv 提交日期: 2026-03-11

model evaluation machine learning theory uncertainty quantification model calibration conformal prediction monte carlo dropout reliability

超越准确率：卷积神经网络中的可靠性与不确定性估计 / Beyond Accuracy: Reliability and Uncertainty Estimation in Convolutional Neural Networks

1️⃣ 一句话总结

这篇论文通过比较两种不确定性估计方法，指出在评估深度学习模型时，除了关注预测准确率，还必须重视模型预测的可靠性和校准程度，这对于高风险决策至关重要。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02200

arXiv 提交日期: 2026-03-02

multi-modal model evaluation machine learning failure detection confidence calibration outlier synthesis multimodal fusion reliability

用于多模态故障检测的自适应置信度正则化 / Adaptive Confidence Regularization for Multimodal Failure Detection

1️⃣ 一句话总结

这篇论文提出了一种名为自适应置信度正则化的新方法，通过惩罚多模态预测时出现的信心下降现象，并结合一种生成模拟故障样本的技术，有效提升了自动驾驶、医疗诊断等高风险应用中多模态模型的故障检测可靠性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.19844

arXiv 提交日期: 2026-02-23

llm systems model evaluation security monitoring threat detection reliability incident response system safety

基于大语言模型的应用需要系统级的威胁监控 / LLM-enabled Applications Require System-Level Threat Monitoring

1️⃣ 一句话总结

这篇论文认为，由于大语言模型行为的不确定性和难以验证性，基于大模型的应用面临新的安全风险，因此必须建立系统级的威胁监控机制，将其作为可靠部署的前提，而不是仅仅依赖测试或防护栏式的防御。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.14849

arXiv 提交日期: 2026-02-16

llm agents systems transactional semantics agent workflows tool use reliability rollback compensation

Atomix：为可靠智能体工作流提供的及时、事务性工具调用 / Atomix: Timely, Transactional Tool Use for Reliable Agentic Workflows

1️⃣ 一句话总结

这篇论文提出了一个名为Atomix的系统，它通过为AI智能体的工具调用提供类似数据库事务的保障，确保在发生故障、冲突或推测执行时，未完成的操作可以被安全地撤销或补偿，从而提高了智能体工作流的可靠性和隔离性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.14189

arXiv 提交日期: 2026-02-15

llm natural language processing model evaluation scientific reasoning abstention verification natural language inference reliability

知道何时不回答：具备弃答意识的科学推理 / Knowing When Not to Answer: Abstention-Aware Scientific Reasoning

1️⃣ 一句话总结

这篇论文提出了一种让AI模型在科学推理任务中学会‘弃答’的框架，通过将科学论断分解并对照证据进行审核，模型可以选择支持、反驳或放弃回答，从而在证据不足时主动避免错误，有效控制风险，提升了科学验证的可靠性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.18753

arXiv 提交日期: 2026-01-26

llm model evaluation theory hallucination detection neural tangent kernel risk bound benchmark reliability

HalluGuard：揭秘大语言模型中数据驱动与推理驱动的幻觉 / HalluGuard: Demystifying Data-Driven and Reasoning-Driven Hallucinations in LLMs

1️⃣ 一句话总结

这篇论文提出了一个统一的理论框架来分解大语言模型的幻觉风险，并基于此开发了一个名为HalluGuard的检测工具，能够同时识别由数据问题和推理过程导致的幻觉，在多种测试中表现优异。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.11037

arXiv 提交日期: 2026-01-16

llm agents reinforcement learning agentic search policy optimization reliability boundary awareness idk response

BAPO：面向可靠智能搜索的边界感知策略优化 / BAPO: Boundary-Aware Policy Optimization for Reliable Agentic Search

1️⃣ 一句话总结

这篇论文提出了一个名为BAPO的新强化学习框架，旨在让基于大语言模型的智能搜索系统学会在遇到证据不足或推理能力达到极限时，主动承认‘我不知道’，从而在保持高准确率的同时，显著提升其回答的可靠性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2604.27807

1️⃣ 一句话总结

arXiv ID: 2604.25110

1️⃣ 一句话总结

arXiv ID: 2603.29231

1️⃣ 一句话总结

arXiv ID: 2603.10731

1️⃣ 一句话总结

arXiv ID: 2603.02200

1️⃣ 一句话总结

arXiv ID: 2602.19844

1️⃣ 一句话总结

arXiv ID: 2602.14849

1️⃣ 一句话总结

arXiv ID: 2602.14189

1️⃣ 一句话总结

arXiv ID: 2601.18753

1️⃣ 一句话总结

arXiv ID: 2601.11037

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2604.27807 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.25110 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.29231 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.10731 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02200 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.19844 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.14849 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.14189 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.18753 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.11037 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2604.27807

arXiv ID: 2604.25110

arXiv ID: 2603.29231

arXiv ID: 2603.10731

arXiv ID: 2603.02200

arXiv ID: 2602.19844

arXiv ID: 2602.14849

arXiv ID: 2602.14189

arXiv ID: 2601.18753

arXiv ID: 2601.11037