arXiv ID:
2605.28142
arXiv 提交日期: 2026-05-27
通过边际锐化实现自一致性 / Self-Consistency via Marginal Sharpening
1️⃣ 一句话总结
本文提出一种新的推理方法,通过直接优化答案的边际概率(即考虑多条推理路径最终都支持同一答案),而非仅优化完整输出序列本身,从而更高效地提升大语言模型在数学和编程任务上的推理准确性,并且计算速度比现有方法快数个数量级。