arXiv ID:
2606.05704
arXiv 提交日期: 2026-06-04
基于批判引导的异构多智能体推理:实现可靠的数学问题求解 / Critic-Guided Heterogeneous Multi-Agent Reasoning for Reliable Mathematical Problem Solving
1️⃣ 一句话总结
本文提出一种融合多个不同专长的大语言模型(LLM)智能体的方法,通过一个“生成器-验证器”框架,让验证器不仅能判断答案对错,还能给出具体改进建议,从而在数学推理中自适应纠错、防止错误累积,并在GSM8K数据集上显著提升了13%的准确率,且允许用小模型达到与大模型相当的效果。