arXiv ID:
2604.05868
arXiv 提交日期: 2026-04-07
理解大型推理模型中并行采样与顺序采样的性能差距 / Understanding Performance Gap Between Parallel and Sequential Sampling in Large Reasoning Models
1️⃣ 一句话总结
这篇论文研究发现,在大型推理模型中,并行采样策略通常比理论上表达能力更强的顺序采样表现更好,主要原因在于顺序采样会因过度依赖前序答案而限制了探索多样性,导致性能差距。