arXiv ID:
2601.10712
MatchTIR:通过二分图匹配实现工具集成推理的细粒度监督 / MatchTIR: Fine-Grained Supervision for Tool-Integrated Reasoning via Bipartite Matching
1️⃣ 一句话总结
这篇论文提出了一个名为MatchTIR的新框架,它通过巧妙的二分图匹配方法,为大型语言模型使用外部工具的过程提供了更精细的监督,从而显著提升了模型在复杂、多步骤任务中的表现,让小模型也能达到甚至超过更大模型的性能。