arXiv ID:
2603.08999
学习何时采样:用于高效大语言模型思维链推理的置信度感知自一致性方法 / Learning When to Sample: Confidence-Aware Self-Consistency for Efficient LLM Chain-of-Thought Reasoning
1️⃣ 一句话总结
这篇论文提出了一种智能决策框架,通过分析大语言模型单次推理过程中的内部信号,自动判断何时需要额外采样多条推理路径来保证准确性,从而在基本不损失精度的前提下,大幅减少了计算开销。