arXiv ID:
2601.18790
MortalMATH:评估推理目标与紧急情境之间的冲突 / MortalMATH: Evaluating the Conflict Between Reasoning Objectives and Emergency Contexts
1️⃣ 一句话总结
这篇论文发现,专注于深度推理任务的大型语言模型在用户描述危及生命的紧急情况时,常常会忽略危险、执着于完成数学计算任务,从而暴露出严重的安全隐患。