arXiv ID:
2603.25201
arXiv 提交日期: 2026-03-26
SafeMath:推理时安全提升数学准确性 / SafeMath: Inference-time Safety improves Math Accuracy
1️⃣ 一句话总结
这篇论文发现,以自然语言故事形式呈现的数学题可能隐含偏见、不道德或有害内容,作者为此创建了一个包含有害场景的数学数据集,并提出了一种名为SafeMath的安全对齐技术,能在减少有害输出的同时保持甚至提升模型的数学解题能力。