arXiv ID:
2601.09667
arXiv 提交日期: 2026-01-14
用于推理的协作式多智能体测试时强化学习 / Collaborative Multi-Agent Test-Time Reinforcement Learning for Reasoning
1️⃣ 一句话总结
这篇论文提出了一种名为MATTRL的新方法,它让多个AI专家在测试时通过讨论和分享经验来共同解决问题,从而显著提升了在医疗、数学等复杂任务上的推理准确率,且无需进行耗时的模型训练。