arXiv ID:
2606.12935
arXiv 提交日期: 2026-06-11
MARS:用于并行大语言模型测试时扩展的对抗性边界风险控制停止策略 / MARS: Margin-Adversarial Risk-controlled Stopping for Parallel LLM Test-time Scaling
1️⃣ 一句话总结
针对并行生成多条推理链并投票答案的LLM测试时扩展方法计算开销大的问题,本文提出了MARS策略,通过在生成过程中实时探测部分链的中间结果、对尚未完成链的投票变化做保守估计,并引入一个对抗性边界来量化不确定性,从而在保证最终投票结果与完整生成几乎一致的前提下,提前停止大部分冗余推理,节省25%到47%的计算资源。