← 返回列表

🤖 系统

📄 Abstract - Evaluating Interruption Robustness of Large Reasoning Models in Dynamic Environments

⏳ 正在获取摘要...

顶级标签: llm agents

📄 论文总结

大型推理模型在动态环境中的中断鲁棒性评估 / Evaluating Interruption Robustness of Large Reasoning Models in Dynamic Environments

1️⃣ 一句话总结

本研究挑战了大型推理模型评估中的'冻结世界'假设，提出了在动态现实场景下评估模型鲁棒性的新框架，揭示了模型在中断条件下可能出现的三种新型故障模式。

2️⃣ 论文创新点

1. 动态环境评估框架

创新点：突破了传统静态评估的'冻结世界'假设，提出了在动态交互环境中评估LRM鲁棒性的新分析框架
区别/改进：相比传统的单一、静态测试方式，提供了系统化的评估框架
意义：为更真实地评估和提升LRM在交互式、长时任务中的实用性奠定了基础

2. 中断场景系统分类

创新点：定义了两类中断场景：时间约束中断（硬中断和软中断）和更新驱动中断（任务规范在推理中途改变）
区别/改进：系统化了中断场景的分类，超越了传统的单一测试方式
意义：能够揭示模型在现实应用中可能遇到的特定脆弱性

3. 新型故障模式识别

创新点：揭示了LRM在中断下可能出现的三种病理模式：推理泄漏、恐慌和自我怀疑
区别/改进：提供了分析模型失败原因的新视角和具体分类
意义：有助于诊断模型缺陷，并为设计更具鲁棒性的中断处理机制指明方向

3️⃣ 主要结果与价值

结果亮点

在硬中断下观察到推理泄漏现象：模型在过早被中断时会在答案区域继续内部推理
在软中断（加速指令）下发现答案恐慌：模型在困难任务上立即产生错误输出
在更新驱动中断中识别自我怀疑：模型倾向于忽略更新信息并继续原始思考过程

实际价值

提供了改善模型适应性的有效方法，如在更新标签后附加简短后缀以确认更新的正确性
发现使用提示引导时助手回合中断性能略优于用户回合中断
为实际部署中选择合适的中断策略提供了指导

4️⃣ 术语表

Large Reasoning Models (LRMs)：大型推理模型，能够生成显式的逐步推理序列来解决复杂任务
Frozen World Assumption：冻结世界假设，指在模型评估中假定模型响应是瞬时的，且请求上下文在响应期间保持不变
reasoning leakage：推理泄漏，指模型在过早被硬中断后，在答案部分继续思考的现象
answer panic：答案恐慌，指模型在软中断（加速指令）下，在困难任务上立即产生错误输出的行为
self-doubt：自我怀疑，指模型倾向于怀疑更新信息的正确性并继续原始思考过程的现象
hard interrupt：硬中断，强制终止推理并要求立即输出的中断方式
soft interrupt：软中断，模型被指示加速推理但仍被允许继续思考过程的中断场景
update-driven interrupt：更新驱动中断，在推理过程中注入新信息，要求模型整合新信息产生正确答案的中断场景
Ai(X)：中断条件准确度，表示在中断点X和中断令牌i条件下输出正确答案的概率
Li(X)：中断后生成的令牌数量，作为推理计算成本的代理指标
assistant-turn interruption：助手回合中断，在助手（模型）回合内直接插入中断消息的干预方式

📄 打开原文 PDF