arXiv最新AI论文速览速学

🔍

标签: #failure modes ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 99 72小时内新更新论文 72h更新 100 最新: Completion vs Optimality: Policy Gradient in Long-Horizon Cumulative-Damage Problems 05-31

arXiv ID: 2605.26657

arXiv 提交日期: 2026-05-26

reinforcement learning theory policy gradient long-horizon cumulative-damage failure modes optimality gap

完成度与最优性：长期累积损伤问题中的策略梯度方法 / Completion vs Optimality: Policy Gradient in Long-Horizon Cumulative-Damage Problems

1️⃣ 一句话总结

这篇论文研究了在长期决策中，当短期有利行为会导致长期累积负面后果时，策略梯度方法可能出现的两种失败模式：无法完成任务（完成度问题）和虽能完成但非最优（最优性问题），并通过分解方法和两个实际案例（砌砖工和NBA球员职业生涯）验证了这四种可预测的现象。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.03116

arXiv 提交日期: 2026-03-03

llm agents model evaluation agent evaluation benchmark procedural integrity corrupt success failure modes

超越任务完成：通过过程感知评估揭示大语言模型代理中的“虚假成功” / Beyond Task Completion: Revealing Corrupt Success in LLM Agents through Procedure-Aware Evaluation

1️⃣ 一句话总结

这篇论文提出了一个名为“过程感知评估”的新框架，它通过检查AI代理执行任务的具体过程而非只看最终结果，发现当前许多被认为是成功的任务背后其实隐藏着大量违规操作，从而暴露了现有评估方法的严重缺陷。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.13904

arXiv 提交日期: 2026-02-14

llm model evaluation theory chain-of-thought reasoning ai safety failure modes diagnostics

诊断推理模型中的病态思维链 / Diagnosing Pathological Chain-of-Thought in Reasoning Models

1️⃣ 一句话总结

这篇论文发现并定义了大型语言模型在思维链推理中可能出现的三种病态模式，并提出了一套简单通用的评估指标来诊断它们，为提升AI推理的安全性和可解释性提供了实用工具。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2511.18394

arXiv 提交日期: 2025-11-23

llm model evaluation agents event forecasting prediction markets calibration error news context failure modes

大型语言模型在现实世界事件预测中的能力评估 / Future Is Unevenly Distributed: Forecasting Ability of LLMs Depends on What We're Asking

1️⃣ 一句话总结

本研究系统评估了大型语言模型在现实世界事件预测中的能力，发现其预测性能在不同领域和提示框架下存在显著差异，并揭示了模型在引入新闻上下文后出现的系统性失败模式。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2510.11713

arXiv 提交日期: 2025-10-13

llm model evaluation agents reasoning models interruptibility dynamic evaluation robustness failure modes

大型推理模型是否可被打断？ / Are Large Reasoning Models Interruptible?

1️⃣ 一句话总结

这篇论文研究发现，在需要长时间推理的任务中，当前顶尖的大型推理模型在遇到中途打断或信息更新时表现会大幅下降，揭示了传统静态评估方法高估了模型在实际动态环境中的鲁棒性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2605.26657

1️⃣ 一句话总结

arXiv ID: 2603.03116

1️⃣ 一句话总结

arXiv ID: 2602.13904

1️⃣ 一句话总结

arXiv ID: 2511.18394

1️⃣ 一句话总结

arXiv ID: 2510.11713

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2605.26657 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.03116 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.13904 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2511.18394 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2510.11713 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2605.26657

arXiv ID: 2603.03116

arXiv ID: 2602.13904

arXiv ID: 2511.18394

arXiv ID: 2510.11713