arXiv ID:
2512.07843
ThreadWeaver:面向语言模型高效并行推理的自适应线程技术 / ThreadWeaver: Adaptive Threading for Efficient Parallel Reasoning in Language Models
1️⃣ 一句话总结
这篇论文提出了一种名为ThreadWeaver的新方法,它能让大语言模型在解决复杂问题时像多线程处理任务一样并行思考,从而在保持与顶尖顺序推理模型相同准确率的同时,显著提升了推理速度,且无需修改现有推理引擎。